CN1166018A - 利用语音指令来控制电装置的语音处理器 - Google Patents

利用语音指令来控制电装置的语音处理器 Download PDF

Info

Publication number
CN1166018A
CN1166018A CN96105853A CN96105853A CN1166018A CN 1166018 A CN1166018 A CN 1166018A CN 96105853 A CN96105853 A CN 96105853A CN 96105853 A CN96105853 A CN 96105853A CN 1166018 A CN1166018 A CN 1166018A
Authority
CN
China
Prior art keywords
speech
voice signal
speech processor
order
phonetic order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN96105853A
Other languages
English (en)
Other versions
CN1117345C (zh
Inventor
陈维德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BenQ Corp
Original Assignee
Acer Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Acer Computer Co Ltd filed Critical Acer Computer Co Ltd
Priority to CN96105853A priority Critical patent/CN1117345C/zh
Publication of CN1166018A publication Critical patent/CN1166018A/zh
Application granted granted Critical
Publication of CN1117345C publication Critical patent/CN1117345C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

一种利用语音指令来控制电子装置的语音处理器,包括:一接收声音的麦克风,一将语音信号数字化的模拟/数字转换器,一记录第一个数字化语音信号以作为启动电子装置的某一特定电子功能的语音指令的指令记录器,一利用语音指令分析第二个数字化语音信号的指令分析器,若该数字化语音信号被认定为语音指令则启动特定电子功能。

Description

利用语音指令来控制电子 装置的语音处理器
本发明涉及利用语音指令来控制电子装置的语音处理器。
许多电子装置,例如录像机、电视、电话答录机、音响等等都设有许多开关以控制其操作。当电子装置的体积变得越来越小的时候,这些开关便成为缩小体积与减低机器复杂性的一大障碍。
在许多先进的电子装置中,语音辨识技术常被用来代替这些开关以控制电子装置的各种功能。虽然语音辨识技术的语音指令辨识功能非常强大而且具有很强的适应性,但是它仍然具有某些缺点。使用者必需正确地说出一个由制造厂商所提供并且可为其电子装置辨认的语音指令才能控制该电子装置,而许多使用者未必能够轻易达到这种要求。此外,基于保密与方便的原因,许多使用者希望能用自己定义的而不是由制造厂商提供的语音指令。
本发明的主要目的在于提供一种可由使用者自己定义语音指令的语音处理器,以使使用者能用自己的语音指令来控制电子装置的各种功能。
本发明是一种利用语音指令来控制电子装置的语音处理器,其包含有:
(1)一麦克风,用来接收语音信号;
(2)一模拟/数字转换器,用来将所述语音信号数字化;
(3)一指令记录器,用来记录第一个数字化语音信号以作为启动该电子装置的某一特定电子功能的语音指令;以及
(4)一指令分析器,用来将第二个数字化语音信号与所述语音指令作比较,若所述第二个数字化语音信号被认定为与所述语音指令相同则启动所述特定电子功能。
为使本发明的结构、特征及所达到的功效能被更进一步的了解与认识,本文配合较佳实施例和附图详细说明如后:
附图简要说明
图1为本发明的被控制的电子装置的方块图。
图2为图1的噪声分析器所使用的噪声准位产生程序。
图3为本发明的语音处理器与电子装置的方块图。
请参考图1,图1为电子装置10的方块图,包含有一内置的语音处理器11,它利用语音指令来控制电子装置10。该语音处理器11包含有:
(1)一麦克风101,用来接收语音信号;
(2)一模拟/数字转换器102,用来将语音信号数字化;
(3)一指令记录器103,用来记录第一个数字化语音信号,以作为启动电子装置10的某一特定电子功能12的语音指令;以及
(4)一指令分析器104,用来将第二个数字化语音信号与语音指令做比较,若第二个数字化语音信号被认定为与语音指令相同则启动电子功能12。
语音处理器11另包含有一语音合成器105,用来在指令记录器103记录第一个数字化语音信号之前产生一导引信息以指导使用者录制他自己定义的语音指令,以及一用来启动指令记录器103的开关106,该开关需要用一特定的钥匙107才能被开启。
语音处理器11还包含有一噪声分析器108以及一比较器109。噪声分析器108是用来分析输入的数字化语音信号以产生一环境噪声准位,而后再将环境噪声准位加上一个预定的音量差以产生一临界值。比较器109则是用来为指令记录器103以及指令分析器104滤除比临界值低的数字化语音信号以滤除噪声的干扰。
电子装置10另包含有一用来启动电子功能12的开关13。开关13在指令记录器103记录语音指令时会被指令记录器103暂时关闭以防止电子功能12被启动。在记录语音指令的一个选择过程中若开关13被使用者按下时,指令记录器103所记录的第一个数字化语音信号会被认定为启动由开关13所控制的电子功能12的语音指令,而在开关13被按下之后,语音指令就会被记录在指令记录器103之中。
电子装置10可以是一台电视机,而开关13则可能是一个按钮,用来启动一个例如是打开电视电源开关的电子功能12。指令记录器103在记录语音指令时会利用与门14将开关13关掉,以防止其产生误动作。与门14只有在指令记录过程中会被关掉。
因为语音处理器11是内置在电子装置10中,使用者因为不方便将麦克风101拿到靠近嘴的地方而需要在距离麦克风101有一段距离的地方说出语音指令。这种情形会使环境中的噪声导入语音指令记录或是分析的过程,因而可能会使指令分析器14产生难于辨识指令的问题。解决这个问题的方法为先设法测量出一个环境噪声准位,然后再利用这个准位来产生一个比该准位高的临界值以用来滤除比该临界值低的环境噪声。噪声分析器108以及比较器109就是为这个目的而设计的,图2示出了噪声分析器108的噪声准位产生过程。
在启动指令记录器103的指令记录程序时,使用者可利用钥匙107来开启开关106。这种设计可以避免语音指令被其他人擅自更改。当指令记录器103的指令记录程序被启动之后,它会使语音合成器105去将预先存贮在只读存贮器110中的导引信息例如“请选择一开关并说出一个代表该开关的语音指令”传送至数字/模拟转换器111和喇叭112以播出该导引信息。若使用者欲选择开关13,他只要按下开关13并且说出一个自己定义的语音指令如“宾果”,则该语音信号就会经由麦克风101以及模拟/数字转换器102而被转换成数字化语音信号。指令记录器103会将该数字化语音信号当成是用来控制开关13的语音指令并将其存贮在存贮器113中。
当使用者记录完所有语音指令后,他需要将钥匙107从开关106中拔出来以关闭指令记录器103。如果这个语音记录程序没有保密的必要,则钥匙107和开关106可以用一个按键开关取代。在完成语音指令的记录后,使用者就可以用语音指令来控制各个开关。使用者所产生的语音信号依然经过麦克风101以及模拟/数字转换器102而被数字化。指令分析器104将根据存贮在存贮器113之中的语音指令来分析该数字化语音信号。如果该数字化语音信号被判定为电子功能12的语音指令,则该电子功能12就会被启动。这种语音分析程序是一种已知的工业技术,其通常是先将一个语音指令以及语音信号正规化,然后再比较两者间的差距。如果计算所得的差距是在某一个预定的范围之内,则该数字化语音信号就会被认定为是该语音指令,其后指令分析器104就会启动该语音指令所代表的电子功能12。
图2为图1所示的噪声分析器108所使用的噪声准位产生程序20,其利用模拟/数字转换器102所产生的数字化语音信号计算出一个环境噪声准位,然后再将该准位加上一个预定的音量差而得到一个临界值。在得到这个临界值之后,比较器109就会将模拟/数字转换器102所产生的比该临界值低的数字化语音信号当成噪声来滤除。在程序20中常数K代表数字样本总数,常数D代表预定的音量差。程序20包含以下步骤:
步骤201设定i=0;sum=0
步骤202设定i=i+1
步骤203取得一个数字样本s
步骤204设定sum=sum+s
步骤205若i<K则至步骤202
步骤206设定thd=(sum/K)+D
步骤207设定i=0:j=0;sum=0
步骤208设定i=i+1
步骤209取得一个数字样本s
步骤210若s>thd则至步骤208
步骤211设定j=j+1
步骤212设定sum=sum+s
步骤213若j<K则至步骤208
步骤214若(K/i)<0.8则至步骤201
步骤215设定thd=(sum/K)+D
步骤201至206将(sum/K)视为一个暂时噪声准位并将其加上音量差D而产生一暂时的临界值thd。而在步骤207至213之中,这个暂时的临界值thd则被用来选择K个比它小的数字样本以供产生环境噪声准位。任何比暂时临界值thd高的数字样本将被视为是异常信号而被去除掉。如果所取得的数字样本总数(K)和总取样数(i)的比率小于一个预定的比值例如0.8(80%),则表示在这一群检测过的数字化语音信号中含有太多异常信号,因此整个程序必须重复一直到数字样本总数(K)能够超过80%的总取样数(i)为止。
图3为语音处理器31与电子装置32的方块图,其与图1的设计类似但是语音处理器31和电子装置32是两个分开的装置。语音处理器31包含有一按键式开关301,当其被按下时来自模拟/数字转换器305的数字化语音信号才能被传给指令记录器308和指令分析器306。语音处理器31另包含有一个用来将指令分析器306的启动信号转换成无线电控制信号的无线电发射器302,而电子装置32也包含有一个相对应的无线电接收器303用来接收无线电控制信号并启动电子功能12。指令分析器306是根据语音处理器31的无线电发射器302来将无线电控制信号传送给电子装置32的无线电接收器303以启动电子功能12。
无线电发射器302和接收器303也可以换成红外线发射器和红外线接收器以利用红外线来传递指令分析器306的启动信号。由于遥控器的体积非常小,因此设于其上的麦克风307就可以被移到非常靠近使用者嘴部的位置。用这种方式来录制或是发出语音指令可以大幅减低环境噪声的影响,因此图1所使用的噪声分析器108和比较器109就可以用按键式开关301来取代,当开关301被按下时由模拟/数字转换器305所产生的数字化语音信号就会被传到指令记录器308与指令分析器306。
以上所述仅为本发明的较佳实施例,凡依本发明的权利要求书所作的等效变化与修饰,都应属于本发明的保护范围中。

Claims (8)

1、一种利用语音指令来控制电子装置的语音处理器,其包含有:
(1)一麦克风,用来接收语音信号;
(2)一模拟/数字转换器,用来将所述语音信号数字化;
(3)一指令记录器,用来记录第一个数字化语音信号,以作为启动该电子装置的某一特定电子功能的语音指令;以及
(4)一指令分析器,用来将第二个数字化语音信号与所述语音指令作比较,若所述第二个数字化语音信号被认定为与所述语音指令相同,则启动所述特定电子功能。
2、如权利要求1所述的语音处理器,还包含有一语音合成器,用来在所述指令记录器记录第一个数字化语音信号之前产生一导引信息。
3、如权利要求1所述的语音处理器,还包含有一用来启动所述指令记录器的开关。
4、如权利要求3所述的语音处理器,所述开关需用某一特定的钥匙才能被开启。
5、如权利要求1所述的语音处理器,所述电子装置另包含有一用来启动所述特定电子功能的开关,所述开关于指令记录器记录语音指令时会被所述指令记录器暂时关闭以防止所述电子功能被启动,而在该开关被按下之后所述语音指令即被记录至所述指令记录器。
6、如权利要求1所述的语音处理器,其另包含有:
一噪声分析器,用来分析输入的数字化语音信号以产生一环境噪声准位,而后再将该环境噪声准位加上一预定的音量差以产生一临界值;
一比较器,用来为指令记录器以及指令分析器滤除比所述临界值低的数字化语音信号。
7、如权利要求1所述的语音处理器,还包含有一按键开关,当该按键开关被按下时,来自模拟/数字转换器的数字化语音信号将会被传至所述的指令记录器与指令分析器。
8、如权利要求1所述的语音处理器,还包含有一无线电发射器,用来为该指令分析器传送无线电控制信号,而所述电子装置还包含有一相对应的无线电接收器,用来接收所述无线电控制信号以启动所述特定电子功能。
CN96105853A 1996-05-20 1996-05-20 利用语音指令来控制电子装置的语音处理器 Expired - Fee Related CN1117345C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN96105853A CN1117345C (zh) 1996-05-20 1996-05-20 利用语音指令来控制电子装置的语音处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN96105853A CN1117345C (zh) 1996-05-20 1996-05-20 利用语音指令来控制电子装置的语音处理器

Publications (2)

Publication Number Publication Date
CN1166018A true CN1166018A (zh) 1997-11-26
CN1117345C CN1117345C (zh) 2003-08-06

Family

ID=5118995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96105853A Expired - Fee Related CN1117345C (zh) 1996-05-20 1996-05-20 利用语音指令来控制电子装置的语音处理器

Country Status (1)

Country Link
CN (1) CN1117345C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100337268C (zh) * 2004-02-23 2007-09-12 宏碁股份有限公司 语音互动的方法及其系统
CN104167213A (zh) * 2014-08-26 2014-11-26 深圳市中兴移动通信有限公司 音频处理方法和装置
CN108632673A (zh) * 2018-05-15 2018-10-09 苏州妙文信息科技有限公司 一种智能机顶盒待机省电方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100337268C (zh) * 2004-02-23 2007-09-12 宏碁股份有限公司 语音互动的方法及其系统
CN104167213A (zh) * 2014-08-26 2014-11-26 深圳市中兴移动通信有限公司 音频处理方法和装置
CN104167213B (zh) * 2014-08-26 2019-07-30 努比亚技术有限公司 音频处理方法和装置
CN108632673A (zh) * 2018-05-15 2018-10-09 苏州妙文信息科技有限公司 一种智能机顶盒待机省电方法

Also Published As

Publication number Publication date
CN1117345C (zh) 2003-08-06

Similar Documents

Publication Publication Date Title
US5583965A (en) Methods and apparatus for training and operating voice recognition systems
EP0077194B1 (en) Speech recognition system
US5852804A (en) Method and apparatus for speech recognition
KR100856358B1 (ko) 음성 인에이블 장치용 구두 사용자 인터페이스
CN100504952C (zh) 使用数字媒体适配器进行语音控制操作的方法
CN1205600C (zh) 语音识别控制系统和语音识别控制方法
CN1288223A (zh) 用于语音控制的适应方向性特征的装置
JP2009021764A (ja) 音声通信装置及び音声通信方法並びにプログラム
EP2383963B1 (en) Processing of telephone numbers in audio streams
EP0847003A2 (en) An audio memo system and method of operation thereof
CN101370084A (zh) 声控摄像头
WO2020250016A1 (en) Apparatus for processing an audio signal for the generation of a multimedia file with speech transcription
CN1117345C (zh) 利用语音指令来控制电子装置的语音处理器
EP1640845A2 (en) User identification method, user identification device and corresponding electronic system
US7020292B1 (en) Apparatuses and methods for recognizing an audio input and muting an audio device
EP1185976B1 (en) Speech recognition device with reference transformation means
WO1995006309A1 (en) Voice operated remote control system
JPS6126079B2 (zh)
JPS6226480B2 (zh)
CN100337268C (zh) 语音互动的方法及其系统
JP3592415B2 (ja) 話者認識システム
JP3034872B2 (ja) 音声命令認識装置及び音声命令認識方法
CN1288224A (zh) 语音识别装置和方法
JP3506293B2 (ja) 話者識別システム
KR100365271B1 (ko) 자동차의전화기를이용한음성인식장치및그제어방법

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: BENQ MOTOR CO., LTD.

Free format text: FORMER NAME OR ADDRESS: BENQ ELECTRONS STOCK CO., LTD.

Owner name: BENQ ELECTRONS STOCK CO., LTD.

Free format text: FORMER NAME OR ADDRESS: MINGHONG STOCK CO., LTD.

CP03 Change of name, title or address

Patentee after: BENQ Corp.

Patentee before: BenQ Corporation

Patentee after: BenQ Corporation

Patentee before: MINGQI COMPUTER Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20030806

Termination date: 20150520

EXPY Termination of patent right or utility model