CN1420708A - 遥控对象设备、遥控系统以及图像处理装置 - Google Patents
遥控对象设备、遥控系统以及图像处理装置 Download PDFInfo
- Publication number
- CN1420708A CN1420708A CN02152286A CN02152286A CN1420708A CN 1420708 A CN1420708 A CN 1420708A CN 02152286 A CN02152286 A CN 02152286A CN 02152286 A CN02152286 A CN 02152286A CN 1420708 A CN1420708 A CN 1420708A
- Authority
- CN
- China
- Prior art keywords
- control
- remote control
- remote
- code
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 22
- 238000003860 storage Methods 0.000 claims description 44
- 238000012546 transfer Methods 0.000 claims description 44
- 238000013500 data storage Methods 0.000 claims description 34
- 238000004321 preservation Methods 0.000 claims description 17
- 230000008676 import Effects 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 14
- 230000033228 biological regulation Effects 0.000 claims description 12
- 230000009471 action Effects 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 241001269238 Data Species 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 description 35
- 230000006870 function Effects 0.000 description 27
- 238000001514 detection method Methods 0.000 description 21
- 238000005457 optimization Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000003825 pressing Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C23/00—Non-electrical signal transmission systems, e.g. optical systems
- G08C23/04—Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q9/00—Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C2201/00—Transmission systems of control signals via wireless link
- G08C2201/30—User interface
- G08C2201/31—Voice input
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Selective Calling Equipment (AREA)
- Details Of Television Systems (AREA)
Abstract
本发明涉及遥控对象设备、遥控系统以及图像处理装置。声音信号/遥控脉冲变换部(30)以红外线(RV)从遥控发送器输入声音信号进行声音识别。用经识别的单词(W)表示的控制信息被变换成与用遥控信号(RK)表示的控制码相同格式的控制码(C)。各控制码作为共同格式的第一遥控脉冲(P1)与第二遥控脉冲(P2)输入到遥控脉冲选择部(23)。遥控脉冲选择部(23)根据遥控脉冲转换信号(N)将第一遥控脉冲(P1)与第二遥控脉冲(P2)中的某一个排他性地输入遥控脉冲解码部(24)。
Description
技术领域
本发明涉及以在遥控发送器中的键操作与声音遥控家电设备的系统,特别是该系统内的控制对象设备,还涉及搭载按照该系统的GUI(图形用户接口)的图像处理装置。
背景技术
由于技术的高度发展,近年来家电设备获得非常多的功能。例如电视(TV)接收机具有选台、电源通断、音量调节以及声音多重模式转换等标准功能。近年来更进一步利用随着数字广播对应的功能的数字化及多频道化,装备了各种扩展功能,例如,通过EPG(电子节目表)的节目检索、通过连接i-Link(IEEE1394)的外围设备的控制,或者是与因特网的连接等。
作为便利的反面,功能的增多使设备的操作变复杂。以用户的操作简单化作为目的,许多家电设备搭载了通过遥控发送器进行的遥控系统。特别是,电视(TV)接收机或录像机(VTR)等发挥画面显示功能的机器(以下称为“图像处理装置”)通过其遥控系统实现下面所示的GUI:用户通过遥控使操作菜单显示在画面上。用户进而通过对遥控发送器的键操作使画面上显示的光标移动,以此选择一个菜单内的类目。在所选类目还含有子目时,在画面上显示这些子目的菜单。用户通过同样的光标操作从该菜单中选择一个子目。这样,图像处理装置实行与所选操作对应的功能。
上述那样的采单的阶层结构,随着功能的进一步增多而深层化且复杂化。这时在类目的选择中,菜单的各阶层间的移动一般要进行多次。因而遥控发送器的键操作必须长时间反复进行。这样的键操作的长时间反复进行特别对中高年龄的用户来说未必容易。因此,开发了利用声音补充遥控发送器的键操作的遥控系统。在由这种系统形成的GUI中,例如用声音指示菜单的各阶层间的移动,用遥控发送器的键操作指示画面上的光标移动。这样,发挥了利用声音控制与利用遥控发送器的键操作控制各自的优点,实现了操作性的提高。
已有的遥控系统中已知有电子技术出版社发行的《电视技术》1991年5月号第38-44页揭示的VTR用声音遥控技术。该遥控系统以VTR作为遥控对象设备,通过附带声音识别装置的遥控发送器,用键操作与声音实现对该VTR的遥控。
图13是表示已有的遥控系统所含的遥控发送器100的结构框图。当用户按压键盘101的一个键时,遥控脉冲变换部102就按照该键选择控制码。再将该控制码变换成电信号(以下称“第一遥控脉冲P1”)并输出。当用户向遥控发送器100的话筒106发声时,该声音通过话筒106与低频放大器107,变换成声音信号S,输入到声音识别部108。声音识别部108将声音信号S与字典109中登录的声音识别对象数据作比较。通常按每个单词登录声音识别对象数据。声音识别部108从字典109中选择与声音信号S对应的单词W,并通知输出控制部110。输出控制部110对控制码存储部111进行访问,读出与所通知的单词W对应的控制码C。这里,控制码存储部111存储着与字典109所登录的单词分别对应的控制码。输出控制部110将读出的控制码C变换成电信号(以下称“第二遥控脉冲P2”)并输出。遥控脉冲选择部103选择第一遥控脉冲P1或第2遥控脉冲P2中的一个,输出到LED驱动部。LED驱动部104根据输入的遥控脉冲P使红外线发光二极管(LED)105发光。作为基于遥控脉冲的红外线的调制方式,使用例如脉冲位置调制(PPM)。这样,根据遥控脉冲P调制的红外线(以下称为“遥控信号”)R被发送到VTR200。
图14是表示与上述已有的遥控系统的遥控对象设备、即VTR200内的遥控有关的部分的框图。受光部201包含光电二极管等受光元件,从外部输入红外线R。遥控信号检波部202从受光部210接收的红外线中检测遥控发信器100的遥控信号R,并将其变换成遥控脉冲P。遥控脉冲解码部203根据该遥控脉冲P将控制码C解码。设备控制部204对控制数据存储部205进行访问,读出与该控制码C对应的命令或控制数据D。而且根据该命令或控制数据D进行规定的操作。这样,上述遥控系统对VTR200实现了由遥控发送器100的键操作及声音完成的遥控。
对VTR200的每一操作或应该对VTR200提供的每一控制数据,预先设定控制码。例如对于表示电源通断、录像、重放、停止、快进或倒带等各操作的命令,或对录像频道或录像开始/结束时刻等控制数据的每一数据,分配不同的控制码。控制码与命令之间或控制码与控制数据之间的对应由控制数据存储部205加以存储。
在上述遥控系统中,对VTR200指定一个操作或一个控制数据时,遥控发送器100与键操作或声音的任一个的指示无关地选择共同的控制码,并变换成共同的遥控信号R。借助于此,VTR200对于遥控,可以与遥控发送器中的键操作或声音的任一个的指示无关地使用图14所示的共同结构。
在用红外线发送遥控信号时必须防止与由其它遥控系统产生的同样的遥控信号之间的误识别。因此不同的遥控系统间避免使用同一的控制码。结果,对用红外线的遥控系统的每一个系统分配的控制码数目受到限制。因而每一类产品只能分配例如1字节(=256个)左右。相反,遥控的对象设备的功能如上所述正在持续增加。例如卫星数字广播的频道理论上是101-999个,即使限于现行的也已经包含200-300种。因此即使只单纯地对应频道数的增加,控制码数目也不够。如上述的遥控系统那样,在遥控发送器将共同的控制码分配给用键操作的指示与用声音的指示两方面时,控制码数更是不足。实际上,用声音指示选台时,当前的声音识别技术至少需要与选台对象频道组相同数量的单词。另外,例如在用声音直接指示利用EPG进行节目检索时,应该识别的单词数必须要有100个左右。
这样,对于一个操作,对用声音的指示应该分配的控制码数目大幅度超过对用键操作的指示应该分配的控制码数。因此,在键操作与声音两方面的指示能够共同的控制码的数目仅限于极少量。结果上述的遥控系统缺乏功能的扩展性。
已有的遥控系统中除了上面所述以外,已知有特开平7-30982号公报揭示的系统。该遥控系统以VTR作为遥控对象设备,通过带话筒的遥控发送器用键操作与声音实现对该VTR的遥控。但与上述遥控系统不同,遥控发送器根据用户的声音本身对红外线施加频率调制后发送。另一方面,在VTR、即遥控信号的接收侧实行声音识别。从而,如下所述,其功能的扩展性比上述遥控系统来得高。
图15是表示该已有的遥控系统所包含的遥控发送器300的结构框图。这里,对于与图13所示的已有的遥控发送器100相同的结构,加注与图13相同的符号。而且对于这些相同的结构的详情,援用上述说明。
当用户向遥控发送器300的话筒106发声时,该声音通过话筒106与低频放大器107,变换成声音信号S,输入到频率调制部301。频率调制部301根据该声音信号S对规定的载波施行频率调制。遥控脉冲选择部103选择第一遥控脉冲P1或经频率调制产生的声音信号PS中的任意一个,输出到LED驱动部104。LED驱动部104根据第一遥控脉冲P1或经频率调制产生的声音信号PS中的任意一个使32红外线LED105发光。以此把遥控信号R送到VTR400。
图16是表示上述已有的遥控系统中遥控对象设备即VTR400内的与遥控及声音识别有关的部分的框图。在这里,对与图14所示的已有的VTR200相同的结构加注与图14相同的符号。
遥控脉冲/声音信号选择部401通常选择第一遥控信号检测部202A作为输出目的地。这时,受光部201接受的遥控信号R输往第一遥控信号检测部202A。第一遥控信号检测部202A从遥控信号R中检测第一遥控脉冲P1。遥控脉冲解码部20根据第一遥控脉冲P1对控制码C进行解码。第一设备控制部204访问第一控制数据存储部205,读出与该控制码对应的命令或控制数据D1。并且根据该命令或控制码D1进行规定的操作。这样,实现了由遥控发送器300的键操作完成的遥控。
另一方面,通过声音遥控如下所述进行。第二遥控信号检波部202B监视从受光部201向控制脉冲/声音信号选择部401送出的遥控信号R,从中检测指示声音识别开始用的特定的遥控脉冲PT。该特定的遥控脉冲PT利用例如遥控发送器300中的操作键由遥控发送器300发送。当第二遥控信号检测部202B检测出特定的遥控脉冲PT时,声音识别起动控制部402将遥控脉冲/声音信号选择部401的输出目的地切换到FM检波部403。这时,受光部201接收到的遥控信号R输入到FM检波部403。以此使FM检测部403起动。所述特定的遥控脉冲PT也用第一遥控信号检波部202A检测。这时,遥控脉冲解码部203向声音识别部404输出规定的触发脉冲T。以此使其声音识别部404起动。FM检波部403从遥控信号R中检测出通过频率调制的声音信号PS,解调成原来的声音信号S。声音识别部404将解调得到的声音信号S与字典405中登录的声音识别对象数据作比较。声音识别对象数据通常按单词登录。声音识别部404从字典405中选择与声音信号S对应的单词W,通知第二设备控制部406。第二设备控制部406对第二控制数据存储部407进行访问,读出与所通知的单词W对应的命令或控制数据D2。在这里,第二控制数据存储部407存储与登录于字典405中的各单词对应的命令及控制数据。第二设备控制部406进而根据读得的命令或控制数据D2进行规定的操作。
在该遥控系统中,不是遥控发送器300,而是作为遥控对象设备的VTR400包含声音识别部404与字典405。因而随着例如字典405的词汇的扩充或算法的高级化带来的电路规模的增大,不受遥控发送器300的尺寸以及耗电的限制。另一方面,遥控发送器300用红外线发送声音信号本身。从而,对用声音的指示也可不分配控制码,故不受控制码数目限制。这样,上述的遥控系统可容易地扩展可用声音指示的功能,甚至声音识别功能自身。
上述的遥控系统特别对用声音的指示能提供例如下述的GUI。当VTR400连接于TV接收机时,第二设备控制部406根据用声音的指示控制画面显示部408,使该TV接收机的画面(以下称“TV画面”)显示规定的画像。利用这样的图像处理功能,在画面上显示与声音识别有关的信息,反馈给用户。这种信息包括例如对用户的适当发声的定时的通知、经识别的单词或其候补的一览表、或者经识别的操作内容等。而且,在发生与声音识别有关的错误时,也可在画面上显示该出错信息。通过由这样的画面显示进行的信息反馈,用户容易注意易于识别的发音、速度、音调、或音量。
图13、14所示的已有的遥控系统中,遥控发送器使利用键操作的指示与利用声音的指示两者与共同的控制码对应。但是,在不同的遥控系统间避免使用相同的控制码,因此分配给一个遥控系统的控制码的数目受到限制。因而在图13、14所示那样的遥控系统中控制码数目不够,功能扩展有困难。
图15、16所示的已有的遥控系统中,不是遥控发送器而是遥控对象设备进行声音识别。从而随着声音识别功能的扩展引起的电路规模的增大不受遥控发送器的大小以及耗电的限制。另一方面,遥控发送器用红外线发送声音信号本身。因而用声音指示的种类不受控制码数目的限制。这样,图15、16所示的遥控系统中功能的扩展比图13、图14所示的系统更容易。
但是,图15、16所示的已有的遥控系统存在如下问题。这种遥控系统中,VTR400那样的遥控对象设备以遥控脉冲与声音信号两种数据形态利用控制信息。这样,如图16所示VTR400对遥控脉冲与声音信号的每一个分别具有不同的控制系统。即具有根据利用遥控脉冲表示的控制码C的第一设备控制部204与根据以声音输入的单词W的第二设备控制部406的两个设备控制部。这两个设备控制部整体的电路规模受到底板(chassis)尺寸的限制。因而最好是将这些设备控制部用共用的CPU设计在同一基板上。但是控制信息的数据形态(即控制码C与单词W)的差异使两设备控制部的统一复杂化。底板设计中特别是必须较大地变更仅用遥控脉冲的已有的遥控系统的结构。这在技术上是困难的,而且由于涉及成本的升高,故不理想。
发明内容
本发明的目的在于提供以最低限定的变更,利用已有的结构,且具有高度的功能扩展性的,通过在遥控发送器的键操作与声音两方面实现的遥控系统。本发明的目的还在于,提供搭载该遥控系统且利用画面显示与声音识别有关的信息,实现对用户反馈的GUI,从而具有合适的操作性的图像处理装置。
本发明的遥控对象设备,具有
(A)遥控接收部,用于接收遥控信号,并将该遥控信号转换为第一遥控脉冲;
(B)声音信号/遥控脉冲变换部,用于输入声音信号,选择对应于该声音信号的控制码,并将该控制码变换为第二遥控脉冲;
(C)遥控脉冲选择部,用于根据规定的转换信号,选择第一遥控脉冲与第二遥控脉冲中的某一个;以及
(D)遥控脉冲处理部,用于从利用遥控脉冲选择部所选的遥控脉冲中将控制码解码,并根据该控制码进行动作控制。
这里,遥控信号由例如外部的遥控发送器发送。即遥控发送器包含键盘,用户按压的键盘的每个键所对应的控制码作为遥控信号被发送。上述的遥控对象设备与这样的遥控发送器一起构成一个遥控系统。
上述遥控对象设备进行声音识别。这时,将由经识别的声音信号所表示的控制信息变换为遥控脉冲,并送至遥控脉冲处理部。这样,应由遥控脉冲处理部处理的控制信息以与已有的控制信息共同的数据形态即遥控脉冲表示。从而,即使用户的控制信息以遥控发送器来的遥控信号或声音信号中的任一种数据形态输入时,作为遥控脉冲处理部也可共用与以往相同的电路结构。即遥控脉冲处理部容易被统一为与以往相同的一个系统。结果,底板设计方便了。
遥控脉冲选择部根据由上述的切换信号产生的启动控制,在声音信号/遥控脉冲变换部输出第二遥控脉冲时,向遥控脉冲处理部输入该第二遥控脉冲,阻断来自遥控接收部的第一遥控脉冲。这样,遥控脉冲处理部排他地处理第一遥控脉冲与第二遥控脉冲。从而也可对各不相同的功能在第一遥控脉冲与第二遥控脉冲之间分配共同的控制码。而且也可以例如以共同的机壳或电缆等连接声音信号/遥控脉冲变换部与遥控脉冲选择部,使第二遥控脉冲不泄漏到遥控对象设备之外。这样可以使第二遥控脉冲表示的控制码与其他遥控系统的控制码重复。结果可以分配任意种类的代码或数据码作为由第二遥控脉冲表示的控制码。也就是说,利用第二遥控脉冲表示的控制码数目不受像利用第一遥控脉冲表示的控制码数目那样的限制。这样,上述的遥控对象设备容易扩展能用声音指示的功能。
上述的遥控对象设备中,最好是
(1)声音/信号/遥控脉冲变换部具有
(a)含有声音识别对象数据的字典;
(b)声音识别部,用于计算各所述声音信号与所述声音识别对象数据的相似度,根据这些相似度选择能够对应于所述声音信号的声音识别对象数据的候补或误码;
(c)控制码存储部,用于存储分别对应于声音识别对象数据与所述误码的控制码;以及
(d)输出控制部,用于从控制码存储部读出与声音识别对象数据的候补或所述误码对应的控制码,将该控制码变换为第二遥控脉冲,并与所述切换信号一起输出到遥控脉冲选择部;
(B)遥控脉冲处理部具有
(a)遥控脉冲解码部,用于对由遥控脉冲选择部选择的遥控脉冲进行解码,将其变换为与该遥控脉冲对应的控制码;
(b)控制数据存储部,用于存储与各控制码分别对应的控制数据与命令;以及
(c)设备控制部,用于从控制数据存储部读出与由遥控脉冲解码部解码的控制码对应的控制数据或命令,并基于这些控制数据和命令进行规定的动作控制。
该遥控对象设备也可以具有含非易失性记录媒体的参数保存部。这时,也可以
(A)声音识别部向输出控制部输出声音识别参数;
(B)控制码存储部存储与该声音识别参数对应的控制码;
(C)输出控制部从控制码存储部读出该控制码,并将其变换成所述第二遥控脉冲,输出到遥控脉冲选择部;
(D)控制数据存储部存储与所述控制码对应的声音识别参数,
(E)设备控制部从控制数据存储部读出与由遥控脉冲解码部解码的所述控制码对应的声音识别参数,并将这些声音识别参数写入参数保存部。在这里,非易失性记录媒体最好是快速(flash)存储器,即汇总消去型EEPROM。
声音识别参数包含例如音质等级(将声首长度引起的频率对功率谱偏移经过标准化后的等级)等音响分析参数或似然阈值。由于利用第二遥控脉冲表示的控制码数目十分多,因此也可以对声音识别参数分配这些控制码的一部分。这样,可对参数保存部通知声音识别部设定的声音识别参数。这样,通过用非易失记录媒体存储声音识别参数,则不论电源的通断都能保持有关声音识别的学习履历。结果,在电源再接入时可迅速实现声音识别参数的最佳化。
在上述的遥控对象设备中,
声音信号/遥控脉冲变换部也可包含
(A)声音输入部,用于输入用户的声音并变换为所述的声音信号,
(B)起动控制部,用于按照所述声音信号的振幅起动声音信号/遥控脉冲变换部。所述遥控对象设备直接或用有线方式输入用户的声音信号。从而,在包含该遥控对象设备的遥控系统中,遥控发送器也可与已有的遥控发送器相同。而且,由于声音信号/遥控脉冲变换部通过检测出声音信号的振幅并自动起动,因此用户只向遥控对象设备发声,就可由声音执行遥控。
本发明的遥控系统具有
(A)遥控发送器,用于发送遥控信号,而且包含
(a)声音输入部,用于输入用户的声音并变换为声音信号;
(b)无线发送部,用于以所述声音信号调制由超声波、红外线或电波形成的载波并向外部发送;
(B)上述遥控对象设备,声音信号/遥控脉冲变换部包含
(a)无线接收部,用于接收所述载波;
(b)起动控制部,用于根据所述载波的振幅起动所述声音信号/遥控脉冲变换部。
该遥控系统中,利用无线方式将声音信号从遥控发送器输入遥控对象设备。这样,声音输入部不受电缆等的制约,可置于用户近旁。从而可抑制周围的噪声混入声音信号。而且由于声音信号/遥控脉冲变换部通过检测出载波自动起动,故用户只向遥控发送器输入声音,可由声音执行遥控。
本发明的图像处理装置,具有按照设备控制部的控制显示规定的图像用的画面显示部,而且是上述遥控对象设备,
(A)控制数据存储部使对于画面显示部的控制数据与命令以及画面显示部显示用的显示数据分别对应规定的控制码加以存储;
(B)设备控制部从控制数据存储部读出与由遥控脉冲解码部从第二遥控脉冲解码的控制码对应的显示数据,由画面显示部显示该显示数据。在这里,所述显示数据也可包含文本数据。该文本数据中包含例如声音识别对象数据的候补、表示声音识别错误的文字、或声音识别参数。此外,该显示数据也可包含图像数据。该图像数据中包含例如表示声音识别错误的图像、表示发声时刻的图像、或者表示声音识别参数用的图像(例如音质等级指示器)。
所述的图像处理装置特别对用声音的指示可提供例如下述的GUI。设备控制部根据用声音的指示控制画面显示部,并将所述显示数据显示在画面上。这样,有关声音识别的信息对用户进行视觉上的反馈。该信息包含例如对用户的适当发声定时的通知、经识别的单词或其候补的一览表、或经识别的操作内容。而且,在发生与声音识别相关的错误时,也可在画面上显示该出错信息。通过由这样的画面显示产生的信息的反馈,用户容易注意易识别的发音、速度、音调、或音量。
本发明的新颖特征虽都在所附的权利要求所述的范围内,但本发明与结构、内容两方面有关,从联系附图并理解下述的详细说明中可更好地理解并评价其他的目的与特征。
附图说明
图1是表示本发明的实施例1的DTV20的遥控系统的外观示意图。
图2是表示本发明的实施例1的遥控系统所含有的遥控发送器10的结构框图。
图3是表示本发明的实施例1的DTV20内的有关遥控系统的一部分的框图。
图4是表示本发明的实施例1的声音/遥控脉冲变换部30的动作细节的流程图。
图5是表示对于本发明的实施例1的遥控脉冲选择部23,第1遥控脉冲P1与第二遥控脉冲P2的切换的详细流程图。
图6是表示对于本发明的实施例1的DTV20,有关用声音的遥控的设备控制部25的动作细节的流程图。
图7是表示对于本发明的实施例1的声音信号/遥控脉冲变换部30,声音识别参数的送出的细节的流程图。
图8是表示对于本发明的实施例1的设备控制部25,声音识别参数的接收及保存的细节的流程图。
图9是表示对于本发明的实施例1的DVT20中的GUI,根据各控制码,TV画面28A显示的图像数据的例图。
图10是表示本发明的实施例2的DTV20A的遥控系统的外观示意图。
图11是表示本发明的实施例2的遥控系统所含有的遥控发送器10A的结构框图。
图12是表示本发明的实施例2的DTV20A内的有关遥控系统部分的框图。
图13是表示已有的遥控系统的一例中所含的遥控发送器100的结构框图。
图14是表示已有的遥控系统的一例中的遥控对象设备即VTR200内与遥控有关部分的框图。
图15是表示已有的遥控系统的另一例中所含的遥控发送器400的结构框图。
图16是表示已有的遥控系统的另一例中的遥控对象设备即VTR400内的与遥控及声音识别有关部分的框图。
附图的一部分或全部以图示为目的示意表达描绘,不一定真实地描出这里表示的主要部件的实际的相对尺寸和位置。
具体实施例
以下对于本发明的最佳实施形态列举较好的实施例并参照图面进行说明。
实施例1
本发明的实施例1的图像处理装置是数字电视接收机(以下简称DTV)。该DTV中搭载用通过装话筒的遥控发送器的键操作与声音实现的遥控系统。
图1是表示本发明的实施例1的DTV20的遥控系统外观示意图。用户按压遥控发送器10的键盘中的一键。这时,与该键对应的控制信息(例如目标频道号等)从第一红外线LED 4K发送到DTV20作为例如用红外线的遥控信号RK。该信号RK由DTV20的第一受光部20接收并解码出对应的控制信息。由此执行该控制信息的指示操作。例如在TV画面28A映出与键盘1的每个键对应的频道的节目。这样,实现通过用遥控发送器10的键操作的遥控。
用户一边按压遥控发送器的发声钮8,一边对话筒5输入表示对于DTV20的控制信息(例如目标频道号等)的声音V。这时,该声音V被变换为例如用红外线表示的声音信号RV并由第二红外线LED 4V发送到DTV20。RV由声音信号/遥控脉冲变换部30的第二受光部31接收并解码出对应的控制信息。经解码的控制信息通过例如电缆38传送至DTV20主体,执行与该控制信息对应的操作。例如在TV画面28A映出声音V指出的目标频道的节目。这样,实现以使用遥控发送器10的按-讲(press-to-talk)方式的、通过声音的遥控。
实施例1的遥控系统,由于遥控发送器10内装话筒5,故用户与话筒5之间距离近。从而容易避免周围噪声等对话筒5的侵入。可以高精度地实现声音识别。
图2是表示上述遥控系统所包含的遥控发送器10的结构框图。键盘1如图1所示,包含与各频道号对应的选台钮、在TV画面上使作为GUI显示的光标移动用的上下左右钮1a、以及执行决定操作用的决定钮。各个键盘1对应不同的控制信息。控制信息包括例如频道号等的控制数据、以及用于指示电源通断、音量调节、声音多模式切换、双画面显示等画面显示模式的切换等的命令。控制信息以规定的格式码(以下称作“控制码”)表示,例如用1比特的码来识别。遥控脉冲变换部2识别用户所按的键1的一键。选择该键对应的控制码,作为电信号输出(以下称为“第一遥控脉冲P1”)。第一LED驱动部3K根据第一遥控脉冲P1,使第一红外线LED 4K点亮、熄灭。这时载波利用PPM调制。这样经调制的红外线即遥控信号RK被送往DTV20。
与键盘1的每一个对应的控制码以红外线的遥控信号RK被发往DTV20。这时作为与键盘1的每一个对应的控制码,采用例如向财团法人家电制品协会预先登录的控制码,使DTV20不致将从其他同样的遥控系统发出的遥控信号误认为其遥控信号RK。财团法人家电制品协会规定的控制码格式(以下称为“家制协格式”)包含1比特的类别码与1比特的数据码。类别码表示例如TV或VTR等的制品类别,分配给每一生产商。因此在家制协格式中利用类别识别遥控系统。即不同的遥控系统间由于类别码不同,故避免使用同一控制码。数据码表示实际的控制信息。因此在家电制格式中每类制品即每个遥控系统可使用最多256种码作为控制码。即是说,能作为利用一个遥控系统的遥控信号RK使用的控制码数目限制在最多256个。
话筒5将用户的声音V输入并变换为电信号。低频放大器6从利用话筒5变换的电信号中提取与声音V对应的频率成分并作为声音信号S输出。频率调制部7根据声音信号5的振幅变动对规定的高频载波实行频率调制,作为频率调制波PS输出。第二LED驱动部3V根据声音信号形成的调频波PS使第二红外线LED 4V的电流量变动。由此,第二红外线LED 4V按照调频波PS改变发光输出。这样,由经调制的红外线形成的声音信号RV被送往DTV20。
第一红外线LED 4K与第二红外线LED 4V最好发不同波长的红外线。这样,DTV20能容易地识别遥控信号RK与由红外线形成的声音信号RV。此外,也可以第一红外线LED 4K与第2红外线LED 4V采用共同的红外线LED,第一LED驱动部3K与第二LED驱动部3V采用共用的LED驱动部。但这时有必要使例如遥控信号PK与红外线形成的声音信号RV每一个包含不同的识别码。
发声钮8是驱动电力供给部9用的开关。电力供给部9被驱动时,就对低频放大器6、调频部7、以及第二LED驱动部3V供电。只有用户按下发声钮8期间,才将用户的声音V作为红外线形成的声音信号RV送往DTV20。这样遥控发送器10实现通过按讲方式的声音V的发送。
图3是表示DTV20内的遥控系统有关部分的框图。第一受光部21含有光电二极管等受光元件,检测来自外部的红外线。这里,检测对象的红外线的波长与遥控发送器10的第一红外线LED 4K的波长相等。遥控信号检测部22从第一受光部21检测出的红外线中识别来自遥控发送器10识别的遥控信号RK,并变换为第一遥控脉冲P1。遥控脉冲选择部23一般选择遥控信号检波部22作为输入源。即,第一遥控脉冲P1通常被输往遥控脉冲解码部24。遥控脉冲解码部24根据第一遥控脉冲P1将其控制码C解码,并通知设备控制部25。设备控制部25接收该控制码C时,对控制数据存储部26进行访问。控制数据存储部26存储着与每个控制码对应的命令或控制数据。设备控制部25从控制数据存储部26读出与输入的控制码C对应的命令或数据D。进而根据该命令或控制数据D控制例如画面显示部28等功能部,执行规定的操作。
声音信号/遥控脉冲变换部30利用以下的结构接收来自遥控发送器10的由红外线形成的声音信号RV,并对此进行声音识别。用与利用第1遥控脉冲P1所示的控制码以共同的格式对利用经识别的声音表示的控制信息进行编码。经编码的控制信息(即控制码)作为与第一遥控脉冲P1共同格式的电信号(以下称“第二遥控脉冲P2”)输出。第二受光部31含有发电二极管受光元件,检测来自外部的红外线。这里,检测对象的红外线的波长等于遥控发送器10的第二红外线LED 4V的波长。FM检波部32从第二受光部31相测出的红外线中提取由遥控发送器10的第二红外线LED 4V形成的载波并通知载波检测部33。而且从该载波的频率变动检测出的声音信号形成的频率调制波,解码成原来的声音信号S。载波检测部33将FM检波部提取的载波的振幅与规定的电平作比较,当载波振幅超过该规定电平增大时,载波检测部33使声音识别开始信号T转移的逻辑上的真状态(以下称作“认定”)。另一方面,当载波振幅比规定电平更低时,载波检测部33使声音识别开始信号T转移为逻辑上的伪状态(以下称“取消”)。这里,逻辑上的真/伪状态在正逻辑中对应于高/低电压状态,在负逻辑对应于低/高电压状态。
来自载波检测部33的声音识别开始信号T进行认定期间,声音识别部34起动。声音识别部34将来自FM检测部32的声音信号S与登录于字典35的声音识别对象数据加以比较。声音识别对象数据通常登录成一个个单词。声音识别部34从字典35中选择与声音信号S对应的单词W并通知输出控制部36。输出控制部36在接收到来自声音识别部34的单词W的通知时对控制码存储部37进行访问。控制码存储部37存储着与登录于字典的每个单词分别对应的控制码。输出控制部36从控制码存储部37读出与由声音识别部34通知的单词W对应的控制码C。这里,控制码存储部37存储的控制码C由与第一遥控脉冲P1所表示的控制码共用的格式、例如家制协格式定义。即用2比特的码识别。输出控制部36将从控制码存储部37读出的控制码变换为第二遥控脉冲P2并输往遥控脉冲选择部23。
输出控制部36在送出第二遥控脉冲P2时,先对遥控脉冲切换信号N进行认定。在该认定以后仅待机规定时间(例如100毫秒)后通过例如电缆38将第二遥控脉冲P2送往遥控脉冲选择部23。在遥控脉冲切换信号N的认定时遥控脉冲选择部23选择输出控制部26作为输入源。由此,第二遥控脉冲P2被输入遥控脉冲解码部24。遥控脉冲解码部24根据第二遥控脉冲P2解码出控制码C。这里,第二遥控脉冲P2与第一遥控脉冲P1是共同格式的,所以遥控脉冲解码部23对第二遥控脉冲P2不与第一遥控脉冲P1区别地进行同样的解码。
向遥控脉冲解码部24输入第二遥控脉冲P2的开始,仅从遥控脉冲选择部23进行的输入切换后起滞后上述规定时间。遥控脉冲解码部24将滞后判断为遥控脉冲无输入状态(无操作:NOP)。这样,遥控脉冲解码部24能将接着输入的第二遥控脉冲P2跟此前输入的第一遥控脉冲P1明确地区别开来。遥控脉冲解码部24将解码后的控制码C通知设备控制部25。这时检测出遥控脉冲切换信号N的认定,将该控制码C是由声音信号/遥控脉冲变换部30产生的事实通知设备控制部25。
利用第二遥控脉冲P2所表示的控制码与利用第一遥控脉冲P1所表示的控制码是共同的格式。因此设备控制部25并不特别区别这两者的遥控脉冲而可同样地处理。即设备控制部25在接收利用第二遥控脉冲P2所表示的控制码C时,对控制数据存储部26进行访问。控制数据存储部26存储着与各控制码对应的命令或控制数据。设备控制部25从控制数据26读出与输入的控制码C对应的命令或控制数据D。并根据该命令或控制数据D控制例如画面显示部28等功能部,执行规定的操作。这样,在实施例1的遥控系统中,对第一遥控脉冲P1与第二遥控脉冲P2中任一个都共同地使用遥控脉冲解码部24与设备控制部25。特别是它们被构成为与已有的电路相同的一个系统的控制电路。结果底板设计容易。
第二遥控脉冲P2通过例如电缆38,仅在从声音信号/遥控脉冲变换部30至遥控脉冲选择部23之间传送。即是说,第二遥控脉冲P2不泄漏到DTV20的外部。因而与第一遥控脉冲P1不同,不为与DTV20同样的其他遥控对象设备所接收。因此,利用第二遥控脉冲P2所表示的控制码与利用第一遥控脉冲P1表示的控制码不同,与其他遥控系统中的控制码重复也无妨。例如在家制协格式中,利用第一遥控脉冲P1所表示的控制码的总数被限于数据码的数据量(最大1比特=256个),而利用第二遥控脉冲P2所表示的控制码的总数允许达到类别码与数据码的全部数据量(2比特=4096个)。这样,在实施例1的遥控系统中,作为通过声音的控制信息可能分配的控制码数目是丰富的。结果容易扩展可利用声音指示的功能。
实施例1的DTV20利用上述结构,根据以下的流程实现特别是通过声音的遥控。图4为表示声音信号/遥控脉冲变换部30的动作细节的流程。
(步骤S1)
用户一边按下遥控发送器10的发声钮,一边将表示控制信息的声音V输入到话筒5。这时,第二红外线LED 4V发光,并将红外线形成的载波发送到DTV20。用户的声音V作为该载波的频率调制被传送。FM检波部32从第二受光部31检测出的红外线中提取由遥控发送器10的第二红外线LED 4V形成的载波,并通知载波检测部33。当该载波的振幅超过规定电平增大时,载波检测部33对声音识别开始信号T进行认定。声音识别部34检测该声音识别开始信号T的上升沿。
(步骤S2)
声音识别部34将声音识别开始检测信号T的认定通知输出控制部36。由此,示出控制部36将表示音识别开始的控制码(以下称作“识别开始码”)变换为第二遥控脉冲P2并送出。
(步骤S3)
FM检波部32从上述载波中检测由声音信号形成的频率调制波,并解调成原来的声音信号S。声音识别部34对该声音信号进行识别处理。具体地说,首先将声音信号S与登录于字典的每个单词作比较,计算双方的似然性。接着,根据该似然性,按规定条件决定第一候补单词W。
(步骤S4)
判断识别处理是否正常地进行,即第一候补单词是否正确地决定。例如利用所计算的似然性对登录于字典35的单词的任一个都不满足规定条件,就在第一候被单词未决定时判断为有识别错误。在无识别错误时,处理进到步骤S5。有识别错误时处理向步骤S7分支。
在以下的情况下也判断为有识别错误。用户按下遥控发送器10的发声钮在发声途中误中断时,遥控发送器10中第二红外线1ED 4V的发光突然停止。这时,声音信号/遥控脉冲变换部30中利用FM检波部32取出的载波振幅突然下降到载波检测部33设定定规定电平之下。遥控发送器10的第二红外线LED 4V出射的红外线PV在发声途中被障碍物遮住时,或由于遥控发送器10内装的电池的消耗使第二红外线LED 4V的输出在发声涂中显著衰减时,载波的振幅也同样急剧减小。根据载波振幅的减小,载波检测部33对声音识别开始信号取消。声音识别部34在检测出声音识别信号T的下降沿时中断识别处理,对于该中断前的一定时间测量声音的平均功率。如该平均功率大于规定的平均功率,则判断为有所谓“发声途中的载波遗失”的识别错误。
(步骤S5)
输出控制部36从声音识别部取出第一候补的单词W。
(步骤S6)
输出控制部36控制码存储部37进行取数取,从后者读出第一候补单词W对应的控制码C。并将读出的控制码C变换成第二遥控脉冲P2并送出。
(步骤S7)
声音识别部34中断识别处理。而且对每个原因将识别错误有关的信息通知输出控制部36。输出控制部36从控制码存储部37读出该通知的信息对应的控制码(以下称作错误码)。将该错误码变换为第二遥控脉冲P2并送出。
(步骤S8)
用户停止按压遥控发送器10的发声钮8。由此在遥控发送器10中停止第二红外线LED 4V中停止第二红外线LED 4V的发光。在声音信号/遥控脉冲变换部30中,FM检波部32取出的载波的振幅下降至载波检测部33设定的规定电平之下。这时,载波检测部33取消声音识别开始信号T。声音识别部34检测该声音识别开始信号T的下降沿。
(步骤S9)
声音识别部34将声音识别开始检测信号T的取消通知输出控制部36。由此,输出控制部36将表示声音识别结束的控制码(以下称识别结束码)变换为第二遥控脉冲P2,并送出之。
图5表示遥控脉冲选择部23的进行的第一遥控脉冲P1与第二遥控脉冲P2之间的切换的细节的流程图。
(步骤S11)
声音信号/遥控脉冲变换部3C中,输出控制部36在第2遥控脉冲P2的送出之前对遥控脉冲切换信号N进行认定。遥控脉冲选择部23检测遥控脉冲切换信号N的认定,选择输出控制部36作为输入源。由此对遥控脉冲选择部23的输入从第一遥控脉冲P1切换到第二遥控脉冲P2。
(步骤S12)
输出控制部36从遥控脉冲切换信号N的认定起待机约100msce。在待机期间,不向遥控脉冲解码部24输入遥控脉冲。由此,遥控脉冲解码部24判断NOP。
(步骤S13)
从遥控脉冲切换信号N的认定起约经过10msec后,输出控制部36向控制脉冲选择部23送出第二遥控脉冲dP2。遥控脉冲解码部24从第二遥控脉冲P2中解码出控制码C,并通知设备控制部25。
(步骤S14)
输出控制部36在第二遥控脉冲P2送出结束时仅待机约100msec。在待机期间不向遥控脉冲解码部24输入遥控脉冲。由此,遥控脉冲解码部判断NOP。
(步骤S15)
输出控制部36在从第二遥控脉冲P2送出结束后经过约100msec,对遥控脉冲切换信号N进行认定。遥控脉冲选择部23检测遥控脉冲切换信号N的认定,再次选择遥控信号检波部22作为输入源。由此,对遥控脉冲选择部23的输入从第二遥控脉冲P2向第一遥控脉冲P1切换。
遥控脉冲选择部23如上述那样互相排他性地向遥控脉冲解码部24输入第一遥控脉冲P1与第二遥控脉冲P2,从而避免了两个脉冲的冲突。从而在遥控发送器10中通过键操作的遥控与通过声音的遥控之间良好地实现了遥控脉冲解码部24与设备控制部25的共用。而且,声音信号/遥控脉冲变换部30中的控制码也可以与遥控发送器10吕的控制码重复。
通过遥控脉冲选择部23的遥控脉冲切换时对遥控脉冲解码部24的输入实际上是经过一定时间的停止期间后切换的。遥控脉冲解码部24将该停止期间判断为NOP,从而能正确地区别在该停止期前分别输入的不同的遥控脉冲。也就是说,防止了将在遥控脉冲切换前后分别输入的第一遥控脉冲P1与第二遥控脉冲P2误认为相连的遥控脉冲。因而即使频繁地切换第一遥控脉冲P1与第二遥控脉冲P2时,遥控脉冲解码部24也能从各自的遥控脉冲中正确地解码出控制码。
图6表示与用声音的遥控有关的DTV20的设备控制部25的动作细节的流程图。
(步骤S21)
设备控制部25从声音信号/遥控脉冲变换部30接收识别开始码。这时,设备控制部25对控制数据存储部26进行访问。读出识别开始码对应的控制数据。这里,该控制数据包含例如,表示声音识别开始的文本数据或图像数据和用于指示画面显示部的命令,使这些数据显示在画面上。
(步骤S22)
设备控制部25按照中述命令控制画面显示部28,由此将上述文本数据或图像数据显示在TV画面上。
(步骤S23)
设备控制部25接收由第二遥控脉冲P2表示的控制码。这时,设备控制部25对控制数据存储部26进行访问,读出该控制码对应的控制数据。这里,在声音信号/遥控脉冲变换部30正常地决定了第一候补单词W时,从控制数据存储部26读出该单词W对应的数据或命令。另一方面,在设备控制部25接收的控制码是错误时,就从控制数据存储部26读出该错码表示的识别错误有关的信息。
(步骤S24)
判断从控制数据存储部26读出的控制数据是否与识别错误有关的信息。在控制数据不是与识别错误有关的信息时,处理进入步骤S25,否则处理向步骤S27分支。
(步骤S25)
根据声音信号/遥控脉冲变换部30决定的第一候补单元W对应的控制数据,设备控制部25控制DTV20内的功能部。例如该控制数据含有表示频道切换的命令和目标频道编号时,设备控制部25控制画面显示部28,在TV画面上显示该目标频道的节目。
(步骤S26)
设备控制部25从控制数据存储部26读出表示第一候补单词W的文本数据,利用画面显示部显示于TV画面上。而且也可以从控制数据存储部26读出表示声音识别成功的图像数据,利用画面显示部28显示于TV画面上。这样,按照通过声音的指示,DTV20执行的动作内容通知给用户。
(步骤S27)
设备控制部25从控制数据存储部26读出表示识别错误的因素的文本数据并利用画面显示部显示在TV画面上。而且也可以从控制数据存储部26读出表示识别错误的图像数据并利用画面显示部显示在TV画面上。这样,通过声音的指示未被DTV20识别的事实与其原因一起通知给用户。
(步骤S28)
设备控制部接收识别结束码。这时,设备控制部25进行暂停处理,仅在规定时间内维持步骤S26或步骤S27中的文本数据或图像数据的显示。
(步骤S29)
设备控制部25控制画面显示部28,消去在步骤S26或步骤S27中显示的文本数据或图像数据。在步骤S26或S27中TV画面上以文本数据或图像数据显示由DTV20声音识别结果有关的信息。由此,用户可视觉地判断通过声音的指示是否被正确地识别。而且在厚在误识别的情况下,用户可视觉地掌握其内容。此外,通过调节步骤S28中文本数据或图像数据的显示时间,用户能视觉地判断应该发声下一次声音指示的时间。
利用第二遥控脉冲P2表示的控制码数目与利用第一遥控脉冲P1表示的控制码数目不同,不受限制。因此利用第二遥控脉冲P2表示的控制码数目是丰富的。例如也可对利用声音识别部34设定的声音识别参数分配这些控制码中的一部分。声音识别参数例如包含音质级别等音响分析参数或似然性阈值。
声音识别参数也可作为控制码由声音识别部34通知设备控制部25。设备控制部25按类别将所通知的声音识别参数写入参数保存部27(参照图3)。由此可保持经声音识别部34优化的声音识别参数。参数保存部27含有非易失性存储媒体,较好的是闪存。此外也可包含硬盘。由此可与DTV20的电源通断无关地保存经优化的声音识别参数。当电源再接通时,声音识别部34基于基数保存部27保持的声音识别参数,能迅速地实现新参数的优化。
经声音识别部34优化后的声音识别参数按以下的流程通知设备控制部,并由参数保存部27存储。图7表示由声音信号/遥控脉冲变换部30产生的声音识别参数的送出的详细流程图。
(步骤S31)
声音识别部34对输出控制部36指示取出声音识别参数。这时输出控制部36从控制码存储部37读出表示声音识别参数转送开始的控制码(以下称参数转送开始码),并变换为第二遥控脉冲P2,送出之。
(步骤S32)
输出控制部36从声音识别部34取出声音识别参数。
(步骤S33)
输出控制部36从控制码存储部37读出表示的声音识别部34取出的声音识别参数第一个的类别与值的控制码。将这些控制码依次变换成第二遥控脉冲P2,送出之。
(步骤S34)
输出控制部36向声音识别部34进行访问并判断是否剩下应取出的声音识别参数。在剩下来送出的声音识别参数时,处理返回步骤S32。在全部转送完声音识别参数时,处理进入步骤S35。
(步骤S35)
输出控制部36从控制码存储部37读出表示声音识别参数转送结束的控制码(以下称参数转送结束码),变换成第二遥控脉冲P2,送出之。
图8表示由设备控制部25接收与保存声音识别参数的细节的流程图。
(步骤S41)
遥控脉冲解码部24对来自第二遥控脉冲P2的参数转送开始码进行解码,并通知设备控制部25。由此,设备控制部25掌握接着输入的控制码表示声音识别参数的情况。
(步骤S42)
遥控脉冲解码部24对来自第二遥控脉冲的控制码进行解码,并通知设备控制部25。后者从控制数据存储部26读出该控制码对应的声音识别参数。读出的声音识别参数依次暂存于缓冲器。
(步骤S43)
遥控脉冲解码部24对来自第二遥控脉冲的参数转送结束码进行解码,并通知设备控制部25。后者从控制数据存储部26读出暂存于缓冲器的声音识别参数对应的文字数据或图像数据。
(步骤S44)
设备控制部25利用画面显示部在TV画面上显示步骤S43中读出的文本数据或图像数据。由此向用户反馈这些参数的类别与值。基于这些参数,用户可容易地达到识别容易的发音、速度、音调、或音量。
(步骤S45)
设备控制部25再将缓冲器中暂存的声音参数值按类别写入参数保存部27。
这样,利用参数保存部存储声音识别参数,能与DTV20的电源通断无关地保持与声音识别有关的学习履历。结果当电源再接入时,利用保存部27保存的履历,能迅速实现声音识别参数的优化。
实施例1的DTV20利用上述的遥控系统实现下述的GUI。用户按下遥控发送器10的发声钮8(参照图1)。由此第二红外线LED 4V发光(参照图2)。DTV20的声音信号/遥控脉冲变换部30中,通过第二受光部31,FM检波部32检测来自第二红外线LED 4V的载波(参照图3)。载波检测部33检测出该载波的振幅超过一定电平增大的情况,对声音识别开始信号进行确认。由此,声音识别部34起动,开始声音识别。
声音识别部34对输出控制部36通知声音识别的开始。输出控制部36这时对控制码存储部37进行访问,读出用于通知声音识别开始的命令对应的控制码即识别开始码。表1为声音识别有关的命令或声音识别参数与控制码之间的对应表,以及根据这些控制码执行的DTV20的操作与TV画面28A上显示的文本数据或图像数据之间的对应表的一例。
表1
命令/参数 | 控制码类别/数据 | DTV的操作 | 图像 | 文本 |
声音识别开始 | OF/FE | 显示声音识别画板 | 图形1 | 文本1 |
声音识别结束 | OF/FO | 消除声音识别画板 | -- | -- |
话筒测试结果通知(OK) | 08/52 | 显示话筒测试OK | 图形5 | 文本16 |
话筒测试结果通知(NG) | 08/53 | 显示话筒测试NG | 图形4 | 文本17 |
参数转送开始 | OE/10 | 参数取入开始 | -- | -- |
参数转送结束 | OE/11 | 参数取入结束/保存 | 图形5 | -- |
音质等级α的通知(-3) | 08/60 | 画面上显示α值 | 图形5 | -- |
音质等级α的通知(-2) | 08/61 | 画面上显示α值 | 图形5 | -- |
音质等级α的通知(-1) | 08/62 | 画面上显示α值 | 图形5 | -- |
音质等级α的通知(±0) | 08/63 | 画面上显示α值 | 图形5 | -- |
音质等级α的通知(+1) | 08/64 | 画面上显示α值 | 图形5 | -- |
音质等级α的通知(+2) | 08/65 | 画面上显示α值 | 图形5 | -- |
音质等级α的通知(+3) | 08/66 | 画面上显示α值 | 图形5 | -- |
… | … | … | … | … |
这里,第一列与第二列之间的对应由声音信号/遥控脉冲变换部30内的控制码存储部37(参照图3)保存。另一方面,第二列与第三~五列之间的对应由控制数据存储部26保持。输出控制部36对控制码存储部37进行访问,参照表1的第一列与第二列相当的对应表。由此,读出识别开妈码“OF/FE”。并将该码变换为第二遥控脉冲P2送至设备控制部25。
设备控制部25接收遥控脉冲解码部24从第二遥控脉冲解码得到的识别开始码“OF/FE”。这时,对控制数据存储部26进行访问,参照表1的第三~五列相当的对应表。由此,读出识别开始码“OF、FE”对应的命令、文本数据、以及图像数据。在表1表示的例中,读出用于指示称作“声音识别画板”的图像A1向TV画面的显示的命令、作为显示于“声音识别画板”A1内的图像数据1M的“图形1”、以及作为显于于“声音识别画板”内的文本数据TX的“文本1”。图9为根据每个控制码例示了于TV画面28A的图像数据。这里,图像数据既有图形4与图形5那样单一的静止画,也有图形1-3那样的运动画。表2为例表示根据每个控制码显示在TV画面28A的文本数据的表。
表2
文本 | 内容 |
文本1 | “请说话” |
文本2 | “选台‘~’”→“已选了‘~’” |
文本3 | “执行‘~’”→“已执行‘~’” |
文本4 | “显示‘~’画面”→“显示了‘~’画面” |
文本5 | “检索‘~’”→“检索了‘~’” |
文本6 | “移向‘~’”→“用‘决定’钮执行” |
文本7 | “不能识别” |
文本8 | “请稍大点声说” |
文本9 | “请稍小点声说” |
文本10 | “请说得短些” |
文本11 | “请说得清楚些” |
文本12 | “请再说一次” |
文本13 | “请持续按钮键至说话结束” |
文本14 | “请按下键后说话” |
文本15 | “检查音质,请稍等” |
文本16 | “调整结束” |
文本17 | “请再说一次” |
设备控制部25根据从控制数据存储部26读出的命令控制画面显示部28,如图1所示那样向TV画面28A显示声音识别画板A1。图1的例中在声音识别画板A1中特别显示了图9的“图形1”和表2的“文本1”。这样,向用户通知DTV20的声音识别的开始准备就绪。由此,用户能准确掌握按下遥控发送器10的发声钮8之后的发声开始的时刻。
用户一边按下遥控发送器10的发声钮一边发声例如表示选台目标的频道编号的单词“1频道”(参照图1)。这一连串的声音V通过遥控发送器10内的话筒5与低频放大器6作为声音信号输入。通过频率调制,将该声音信号S变换为由来自第二红外线LED 4V的红外线形成声音信号RV,并送出之(参照图2)。在DTV20的声音信号/遥控脉冲变换部30中通过第二受光部31,FM检波部32检测来自第二红外线LED 4V的声音信号RV,解调成原来的声音信号S(参照图3)。声音识别部34将解调的声音信号S与登录在字典35中的单词中的每一个作比较,并计算似然性。基于该似然性,按照规定条件决定第1候补的单词W。正常进行识别处理时,对于例如上述的声音“1频道”,正确地决定登录在字典35中的叫做“1频道”的单词作为第一候补单词W。
输出控制部36从声音识别部34取出第一候补单词W。而且对控制码存储部37进行访问。表3为登录于字典35中的单词与控制码之间的对应表以及根据这些控制码执行的DTV20的操作与TV画面显示的文本数据或画像数据之间的对应表的一例。
表3
单词 | 控制码类别/数据 | DTV的操作 | 图像 | 文本 |
1频道 | 00/00 | 选位置1 | 图形2 | 文本2 |
2频道 | 00/01 | 选位置2 | 图形2 | 文本2 |
BS181 | 00/13 | 选BS181 | 图形2 | 文本2 |
BS富士 | 00/13 | 选BS181 | 图形2 | 文本2 |
天气消息 | 03/35 | 选BS910 | 图形2 | 文本2 |
音量增大 | 03/93 | 增大音量 | 图形2 | 文本3 |
音量减小 | 03/94 | 减小音量 | 图形2 | 文本3 |
像质的调整 | 06/30 | 显示音质的调整画面 | 图形2 | 文本4 |
足球 | 03/F3 | 用EPG检索“足球” | 图形2 | 文本5 |
录像 | 05/1F | 向录像按钮移动光标 | 图形2 | 文本6 |
话筒测试 | OF/9F | 显示话筒测试画面 | 图形4 | 文本15 |
… | … | … | … | … |
这里,第一列与第二列之间的对应利用声音信号/遥控脉冲变换部30内的控制码存储部37(图3参照)来保持。另一方面,第二列与第三~五列之间的对应利用控制数据存储部26来保持。输出控制部36对控制码存储部37进行取数,参照表3的第一列与第二列相当的对应。由此,读出与单词“1频道”对应的控制码“00/00”。而且将该控制码变换为第二遥控脉冲P2,送至设备控制部。设备控制部25接收利用遥控脉冲解码部24从第二遥控脉冲P2解码得到的控制码“00/00″。这时,对控制数据存储部26进行取数,参照表3的第二列与第三~五列相当的对应表。由此,读出控制码”00/00对应的命令、文本数据以及图像数据。在表3所示的例中,读出用于对TV调谐器指示与频道“1”相当的位置1的选台的命令、作为显示在声音识别画板A1(参照图1)内的图像数据1M的“图形2”(参照图9)、以及作为显示于声音识别画板A1内的文本数据TX的“图形2”(参照图2)。这里,表2的文本2的内容中,“~”中插入表示选台目标的频道编号的文本数据例如“1CH”。设备控制部25首先控制画面显示部28,使TV画面28A显示“图形2”与“文本2”的第一句“选台1CH”。接着控制TV调谐器(未图示)使选台位置1。再控制画面显示部,使TV画面28A显示“文本2”的第二句“已选台1CH”。这样将通过经识别的声音搪行的选台与其选台目标通知用户。由此,用户可明确地掌握DTV20如何识别由声音产生的指示。
对于用声音的指示可分配的控制码数目与对遥控发送器10中的键操作可分配的控制码不同,不受限制。如表3中所例示的那样,用声音可指示的功能包含选台,多种多样。例如当用户发送“足球”时,TV画面上首先将“检索足球”的“文本5”的第一句作为文本数据TX加以显示。再由EPG对“足球”作种类检索,并将其检索结果一览表与“已检索足球”的“文本5”的第二句一起显示于TV画面28A。这里,在指示选台或利用EPG的检索等需要较长处理时间的操作时,如“文本2”或“文本5”那样在DTV20的操作前后使文本数据TX改变。由此用户能明确掌握DTV20正在执行用声音指示的操作中。结果使用户能感觉等待时间较短。
声音识别部34在不能决定第一候补单词时,或检测出“发声途中的载波遗失”时,便判断有识别错误,并中断识别处理。对其每个主要原因向输出控制部36通知识别错误有关的信息。输出控制部36从控制码存储部37读出该通知的信息对应的控制码即误骊。表4为识别错误的内容与误码之间的对应表,以及与按照这些误码显示于TV画面28A的文本数据或图像数据之间的对应表的一例。
表4
识别错误的内容 | 误码类别/数据 | 图像 | 文本 |
不能识别(除下述外) | OF/00 | 图像3 | 文本7 |
声音过小或S/N小 | OF/01 | 图像3 | 文本8 |
声音太大 | OF/02 | 图像3 | 文本9 |
话过长 | OF/03 | 图像3 | 文本10 |
说话不明了(似然性不足) | OF/04 | 图像3 | 文本11 |
不是可发声状态 | OF/05 | 图像3 | 文本12 |
中途松开发声按钮 | OF/06 | 图像3 | 文本13 |
按发声按钮前说过 | OF/07 | 图像3 | 文本14 |
这里,由控制码存储部37(参照图3)保持第一列与第二列之间的对应。另一方面,由控制数据存储部26保持第二列与第三、四列之间的对应。输出控制部36对控制码存储部37进行取数,参照表3的第一列与第二列相当的对应表。例如当所通知的识别错误存在“发声途中的载波遗失”时,读出误码“OF/06”。再将该误码变换为第二遥控脉冲P2,送向设备控制部。设备控制部25接收由遥控脉冲解码部24从第二遥控脉冲P2解码得到的误码“OF/06”。这时,对控制数据存储部26取数,参照表4的第二与第三、四列相当的对应表。由此读出误码“OF/06”对应的文本数据与图像数据。表4表示的例子中,读出“图形3”作为显示于“声音识别画板A内的图像数据1M”,读出“文本13”作为文本数据TX。设备控制部25控制画面显示部28使在画面28A上显示“图形3”与“文本13”。结果,用户可理解在发声途中由于松开发声钮引起红外线中断因而产生识别错误。
识别错误如表4所例示的那样有多种原因。例如:用户的声音、音质、或发声时间不合适;周围噪声过大,S/N过小;或发声的单词错误等原因,有时候声音识别部34不能识别声音信号所表示的单词。此外,有时候对识别的单词得到的似然性,对登录于字典35中的任一个单词都不满足规定条件。例如,当声音识别部34判断为遥控发送器10的话筒5捕捉的声音等级过大时,输出控制部36就送出所谓“声音过大”的识别错误的内容对应的误码“OF/02”。设备控制部25使在画面28A上显示误码“OF/02”对应的“文本9”(参照表2)与“图形3”(参照图9)。由此,用户容易掌握识别错误的发生及其原因是过大的音量引起的。结果在重新进行用声音指示时,用户可注意抑低音量等的错误回避方法。如上所述,由DTV20引起的识别错误与其错误内容一起通知用户。从而用户在重新进行用声音指示时可恰当地回避识别错误的再发生。
用户也可执行下述的“话筒测试”,即执行使声音识别部34产生的声音识别参数最佳化。用户发声“话筒测试”。当声音识别部34正确地识别该声音为所谓“话筒测试”的单词时,输出控制部36就向设备控制部25送出该单词对应的控制码“OF/9F”(参照表3)。设备控制部25从控制数据存储部26读出该控制码对应的命令、文本数据、以及图像数据。在表3所示的例中,读出:指示“话筒测试”的图像A2(参照图1)在TV画面28A上显示用的命令、作为显示于“声音识别画板”A1内的文本数据TX的“文本25”(参照表2)、以及作为显示于“话筒测试”A2内的图像数据的“图像4”(参照图9)。设备控制部25利用该命令控制画面显示部28,在TV画面28A上显示“话筒测试”A2与“文本15”。声音识别部34基于“话筒测试”那样的声音,从用户的声音固定的特征频率区中使声音识别参数最佳化。特别是,将声道长度引起的频率对功率谱偏移作为音质等级进行指标记,分析最高似然性对应的音质等级的最佳值α。声音识别部34对声音识别参数的最佳化作成功时,输出控制部36向设备控制部25送出通知声音识别参数的最佳化成功用的命令“话筒测试结果通知(OF)”所对应的控制码“08/52”(参照表1)。由此,设备控制部25使“文本1b”(参照表2)与“图形5”(参照图9)显示于TV画面28A。输出控制部接着从声音识别部取出含有音质等级的最佳值α的经优化的声音识别参数。例如音质等级的最佳值α为-2时,输出控制部36向设备控制部25送出通知音质等级α=-2用的命令所对应的控制为“08/61”(参照表1)。由此,设备控制部25将“图形5”的音质等级的显示调合到所通知的最佳值α。这里,图9中描出“图形5”作为表示“音质等级α=-2”的图像。当音质等级的最佳值为其他值时,就按照该值改变描于“图形5”的指示器G的位置以及音质等级的值H。通过这些显示,用户能明确地掌握声音识别部34能实现声音识别参数的最佳值。
声音识别部34在成功实现声音识别参数最佳化时,该最佳化的声音识别参数也可如下述地利用参数保存部27(参照图3)加以存储。输出控制部36将参数转送开始码“OE/10”(参照表1)送往设备控制部25。而且向设备控制部25依次送出经最佳化的声音识别参数的每一个对应的控制码。这些参数全被送出结束时,输出控制部36向设备控制部25送出参数转送结束码“OE/11”(参照表1)。设备控制部25在接收参数转送开始码后,将从输出控制部接收的一连串的控制码的第一个对应的声音识别参数依次从控制数据存储部26转送到缓冲器。而在接收到参数转送结束码时,将转存于缓存器的一连串的声音识别参数存储到参数保存部27。这样,经最佳化的声音识别参数利用参数保存部27内的非易失存储媒体加以存储。由此,可与DTV20的电源通断无关地保持声音识别有关的学习履历。结果当电源再次接通时,利用所保持的声音识别参数的履历,可迅速实现声音识别参数的最佳化。
声音识别部34在对用户的声音“话筒测试”的识别失败,或对声音识别参数的最佳化失败时,输出控制部36对设备控制部25送出通知声音识别参数的最佳化失败用的命令“话筒测试结果通知(NG)”对应的控制码“08/53”(参照表1)。由此,设备控制部25使在画面28A显示“文本17”(参照表2)与“图形4”(参照图9)。通过这些显示,用户可明显地掌握声识别部34处于未能实现声音参数的最佳化的状态。由此,用户设法采用抑制周围噪声等的对策。
实施例1的遥控系统利用红外线作为通信媒体。此外也可利用电波作为通信媒体。这时作为遥控发送器10可利用携带电话、PHS、或PDA。特别是PHS、W-CDMA方式采用的第三代移动体通信终端或根据蓝牙(注册商标)规格的通信终端等有可能高品位地传送声音信号。从而将它们用于实施例1的遥控系统中的声音信号的传送时,能实现可靠性高的声音识别。
实施例2
本发明实施例2的图像处理装置与实施例1同样是DTV,搭载有通过在遥控发送器的键操作与声音实现的遥控系统。但是与实施例1不同,遥控发送器不含声音输入端,作为遥控对象设备的DTV通过话筒直接输入用户的声音。对于其他的结构及动作,实施例2与实施例1相同。
图10表示本发明实施例2的DTV20A的遥控系统的外观示意图。用户按压遥控发送器10A的键盘1的一个键。这时,该键对应的控制信息(例如目标频道编号)作为例如红外线形成的遥控信号RK从红外线LED 4K发送至DTV20A。利用DTV20的受光部21接收该遥控信号RK,解码对应的控制信息。由此执行该控制信息所表示的操作。例如在TV画面28A显示键盘1的每个键对应的频道编号。这样实现通过遥控发送器10A的键操作的遥控。
用户对DTV20A的话筒5A输入表示的DTV20A的控制信息(例如目标频道编号)的声音V。这里,话筒5A与DTV20的声音信号/遥控脉冲变换部30A连接。用户的声音V通过话筒5A直接输入声音信号/遥控脉冲变换部30A,解码对应的控制信息。经解码的控制信息例如通过电缆38传送到DTV20A本体,执行该控制信息对应的操作。例如在TV画面28A显示声音V所表示的目标频道的节目。这样,实现了通过声音的遥控。
以下对实施例2说明其也实施例1不同的部分,对共同部分则援用对实施例1中的说明。图11表示包含在上述实施例2的遥控系统中的遥控发送器10A结构的框图。这里,对与实施例1的遥控发送器10相同的结合附注与图2相同的符号,其说明援用实施例1的说明。比较图2与图11可见,实施例2的遥控发送器10A除了来自实施例1的遥控发送器10的声音输入有关的结构之外,实质上是相同的。
图12表示实施例2的DTV20内的遥控系统有关部分的框图。这里,对与实施例1的DTV20相的结构附注与图3相同的符号,其说明援用实施例1的说明。
声音信号/遥控脉冲变换部30A由以下构成,直接输入用户的声音V,变换成声音信号S,对其进行声音识别,由经识别的声音所表示的控制信息与实施例1同样地在与第一遥控脉冲P1所表示的控制码共用的格式进行编码,作为与第一遥控脉冲P1共用的格式即第二遥控脉冲P2输出。话筒5A输入用户的声音V并变换为电信号。低频放器6A从话筒5A所变换的电信号中提取声音V对应的频率成分,作为声音信号S送到声音识别部34。电平检测部33A将低频放大器6A所提取的声音信号S的振幅与规定的电平作比较。当声音信号S的振幅超过该规定电平、增大时,电平检测部33A仅在规定时间对声音识别开始信号T进行认定。另一方面,当声音信号S的振幅低于该规定电平维持一定时间时,电平检测部33A就取消声音识别开始信号T。
实施例2的DTV20A中与实施例1的DTV20不同,用户的声音直接输入。从而对于与按讲方式有关的识别错误例如在发声途中由中止发声钮的按压等引起的识别错误,其处理并不需要。因此减轻了声音识别部34等的处理负担。
一旦对实施例2的声音信号/遥控脉冲变换部30A输入了声音信号,就与实施例1相同地进行处理。因此除了声音输入不同之外,实施例2实现与实施例1同样地遥控系统,故实施例2能发挥与实施例1同样的以下的效果。首先,由于第一遥控脉冲P1与第二遥控脉冲P2按照共同的格式,故遥控脉冲解码部24与控制控制部25对这些遥控脉冲的任一个也都共用。它们用与已有的电路同样的一个系统的控制电路来构成。结果底板设计容易。而且,第二遥控脉冲P2不向外泄漏地仅在从声音信号/遥控脉冲变换部30A至遥控脉冲选择部23之间传送。因此,利用第二遥控脉冲P2表示的控制码与利用第一遥控脉冲P1表示的控制码不同,即使与其他遥控系统的控制码重复地无妨。这样,实施例2的遥控系统中,可分配作为用声音的控制信息的控制码数目是丰富的。结果可容易地扩展可用声音指示的功能。
本发明的遥控对象设备进行声音识别。这时,经识别的声音信号所表示的控制信息被变换为遥控脉冲送至设备控制部。这样,用与已有的共用的数据形态即遥控脉冲表示应由设备控制部处理的控制信息。因此,即使用来自遥控发送器的遥控信号或声音信号中的任一种的数据形态输入来自用户的控制信息,设备控制部也可共用与以往同样的电路构成。即是说,设备控制部容易被统合成与以往相同的一个系统。结果,底板设计容易。
遥控脉冲选择部在声音信号/遥控脉冲变换部输出第二遥控脉冲时,将该第二遥控脉冲输向遥控脉冲解码部,阻断来自遥控接收部的第一遥控脉冲。这样,遥控脉冲解码部排他性地处理第一遥控脉冲与第二遥控脉冲。因此也可对其他功能分别分配在第一遥控脉冲与第二遥控之间共同的控制码。而且也可将声音信号/遥控脉冲变换部与遥控脉冲选择部之间做在例如共同的壳体内或用电缆连接,使第二遥控脉冲不泄漏到遥控对象设备之外。由此能使第二遥控脉冲所表示的控制码与其他遥控系统的控制码重复。结果,作为第二遥控脉冲中所表示的控制码可分配任意的类别码或数据码。特别是第二遥控脉冲所表示的控制码数目与第一遥控脉冲不同,不受利用遥控信号表示的遥控码数目的制约。这样,本发明的遥控对象设备能容易扩展可用声音指示的功能。
本发明的图像处理处理是上述本发明的遥控对象设备,特别对用声音的指示能提供例如下述的GUI。设备控制部根据用声音的指示控制画面显示部,显示有关声音识别的信息。由此,将该信息视觉性地反馈给用户。该信息包含例如:对用户的适当的发音时刻的通知、经识别的单词或其它候补一览表、或者经认别的操作内容。而且在有关声音识别产生错误时,也可在画面上显示该错误信息。通过这种画面显示的信息的反馈,用户能注意识别容易的发音、速度、音调或音量。这样,本发明的图像处理装置特别对于用声音的遥控能提高操作性。
关于以上所述的本发明的最佳实施例形态的揭示不应作为有意限定的形态来解释。本发明所属领域内的技术人员阅读该揭示后,当能无误地明确理解各种变更及改良。作为理所当然的归结,这些变更及改良分明不背离本发明的精神及范围。应该理解所附的权利要求范围涵盖这些变更及改良。
Claims (8)
1.一种遥控对象设备(20、20A),其特征在于,具有
(A)遥控接收部(21+22),用于接收遥控信号(RK),并将该遥控信号(RK)转换为第一遥控脉冲(P1);
(B)声音信号/遥控脉冲变换部(30、30A),用于输入声音信号(S),选择对应于该声音信号(S)的控制码(C),并将该控制码(C)变换为第二遥控脉冲(P2);
(C)遥控脉冲选择部(23),用于根据规定的转换信号(N),选择第一遥控脉冲(P1)与第二遥控脉冲(P2)中的某一个;以及
(D)遥控脉冲处理部(24+25+26),用于根据利用所述遥控脉冲选择部(23)选择的遥控脉冲(P)将控制码(C)解码,并根据该控制码(C)进行动作控制。
2.如权利要求1所述的遥控对象设备(20、20A),其特征在于,
(A)所述声音信号/遥控脉冲变换部(30、30A)具有
(a)含有声音识别对象数据(W)的字典;
(b)声音识别部(34),用于计算所述声音信号(S)与各所述声音识别对象数据(W)的相似度,根据它们的相似度选择应该与所述声音信号(S)对应的声音识别对象数据(W)的候补或误码;
(c)控制码存储部(37),用于存储所述声音识别对象数据(W)与所述误码之间分别对应的控制码(C);以及
(d)输出控制部(36),用于从所述控制码存储部(37)读出与所述声音识别对象数据(W)的候补或所述误码对应的控制码(C),变换该控制码(C)为所述第二遥控脉冲(P2),并与所述切换信号(N)一起输出到所述遥控脉冲选择部(23);
(B)所述遥控脉冲处理部,具有
(a)遥控脉冲解码部(24),用于解码由所述遥控脉冲选择部(23)选择的遥控脉冲(P),变换为与该遥控脉冲(P)对应的控制码(C);
(b)控制数据存储部(26),用于存储与各所述控制码(C)对应的控制数据与命令(D);以及
(c)设备控制部(25),用于从所述控制数据存储部(26)读出与由所述遥控脉冲解码部(24)解码的控制码(C)对应的控制数据或命令(D),并基于这些控制数据或命令(D)进行规定的动作控制。
3.如权利要求2所述的遥控对象设备(20、20A),其特征在于,
(A)所述遥控对象设备具有含有非易失性记录媒体的参数保存部(27);
(B)所述声音识别部(34)向输出控制部(36)输出声音识别参数;
(C)所述控制码存储部(37)存储与所述声音参数对应的控制码(C);
(D)所述输出控制部(36)从控制码存储部(37)读出所述控制码(C),并将该控制码(C)变换成所述第二遥控脉冲(P2),输出到所述遥控脉冲选择部(23);
(E)所述控制数据存储部(26)存储与所述控制码(C)对应的所述声音识别参数,
(F)所述设备控制部(25)从所述控制数据存储部(26)读出与由所述遥控脉冲解码部(24)解码的所述控制码对应的所述声音识别参数,并将这些声音识别参数写入所述参数保存部(27)。
4.如权利要求1所述的遥控对象设备(20A),其特征在于,所述声音信号/遥控脉冲变换部(30A)包含
(A)声音输入部(5A+6A),用于输入用户的声音(V)并变换为所述的声音信号(S),
(B)起动控制部(33A),用于按照所述声音信号(S)的振幅起动所述声音信号/遥控脉冲变换部(30A)。
5.一种遥控系统,其特征在于,具有
(A)遥控发送器,包含
(a)声音输入部(5+6),用于输入用户的声音(V)并变换为声音信号(S);
(b)无线发送部(7+3V+4V),用于以所述声音信号(S)调制由超声波、红外线或电波形成的载波并向外部发送;
并发送所述遥控信号(RK);
(B)权利要求1所述的遥控对象设备(20),所述声音信号/遥控脉冲变换部(30)包含
(a)无线接收部(31+32),用于接收所述载波(RV);
(b)起动控制部(33),用于根据所述载波(RV)的振幅起动声音信号/遥控脉冲变换部(30)。
6.一种图像处理装置,具有根据所述设备控制部(25)显示规定的图像用的画面显示部(28),且是权利要求2所述的遥控对象设备,其特征在于,
(A)所述控制数据存储部(26)使对于所述画面显示部(28)的控制数据、命令(D)以及由所述画面显示部(28)显示用的显示数据(图9、表1~4)分别对应规定的控制码(C)加以存储;
(B)所述设备控制部(25)从所述控制数据存储部(26)读出与用所述遥控脉冲解码部(24)根据第二遥控脉冲(P2)解码的控制码(C)对应的显示数据(图9、表1~4),用所述画面显示部(28)显示该显示数据(图9、表1~4)。
7.如权利要求6所述的图像处理装置,其特征在于,所述显示数据包含文本数据。
8.如权利要求6所述的图像处理装置,其特征在于,所述显示数据包含图像数据。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001352753 | 2001-11-19 | ||
JP2001352753 | 2001-11-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1420708A true CN1420708A (zh) | 2003-05-28 |
CN100490559C CN100490559C (zh) | 2009-05-20 |
Family
ID=19164885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB021522863A Expired - Fee Related CN100490559C (zh) | 2001-11-19 | 2002-11-19 | 遥控对象设备、遥控系统以及图像处理装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7023498B2 (zh) |
EP (1) | EP1313077A3 (zh) |
KR (1) | KR100486368B1 (zh) |
CN (1) | CN100490559C (zh) |
MY (1) | MY134302A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104076705A (zh) * | 2014-06-26 | 2014-10-01 | 美的集团股份有限公司 | 基于中转终端的终端控制方法和系统 |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040203387A1 (en) * | 2003-03-31 | 2004-10-14 | Sbc Knowledge Ventures, L.P. | System and method for controlling appliances with a wireless data enabled remote control |
US7685341B2 (en) * | 2005-05-06 | 2010-03-23 | Fotonation Vision Limited | Remote control apparatus for consumer electronic appliances |
US7792970B2 (en) | 2005-06-17 | 2010-09-07 | Fotonation Vision Limited | Method for establishing a paired connection between media devices |
US20060041926A1 (en) * | 2004-04-30 | 2006-02-23 | Vulcan Inc. | Voice control of multimedia content |
US20060075429A1 (en) * | 2004-04-30 | 2006-04-06 | Vulcan Inc. | Voice control of television-related information |
JP2006094125A (ja) * | 2004-09-24 | 2006-04-06 | Fuji Photo Film Co Ltd | 画像表示リモート・コントロール・システムならびに画像表示システムおよびその制御方法 |
US20060114120A1 (en) * | 2004-11-04 | 2006-06-01 | Goldstone Marc B | System and method for the unpredictable remote control of devices |
JP2006203333A (ja) * | 2005-01-18 | 2006-08-03 | Canon Inc | 双方向リモートコントロールユニット |
KR100703696B1 (ko) * | 2005-02-07 | 2007-04-05 | 삼성전자주식회사 | 제어 명령 인식 방법 및 이를 이용한 제어 장치 |
US7694048B2 (en) * | 2005-05-06 | 2010-04-06 | Fotonation Vision Limited | Remote control apparatus for printer appliances |
JP2007028086A (ja) * | 2005-07-14 | 2007-02-01 | Funai Electric Co Ltd | リモコン装置 |
JP4781368B2 (ja) | 2006-01-06 | 2011-09-28 | パイオニア株式会社 | 音声認識装置、表示方法及び表示処理プログラム |
US8531275B2 (en) * | 2006-02-02 | 2013-09-10 | The Directv Group, Inc. | Remote control mode on-screen displays and methods for producing the same |
JP2007324734A (ja) * | 2006-05-30 | 2007-12-13 | Funai Electric Co Ltd | リモコン装置、制御装置、および制御システム |
CN100547522C (zh) * | 2006-07-18 | 2009-10-07 | 三洋电机株式会社 | 数据输入处理电路 |
US20090115915A1 (en) * | 2006-08-09 | 2009-05-07 | Fotonation Vision Limited | Camera Based Feedback Loop Calibration of a Projection Device |
US7940338B2 (en) * | 2006-10-31 | 2011-05-10 | Inventec Corporation | Voice-controlled TV set |
TW200832215A (en) * | 2007-01-24 | 2008-08-01 | Quanta Comp Inc | Voice-controlled media adaptor apparatus |
US20100050270A1 (en) * | 2008-08-20 | 2010-02-25 | AT&T InteIlectual Property I, L.P. | Control of Access to Content Received from a Multimedia Content Distribution Network |
US8134649B2 (en) * | 2008-09-02 | 2012-03-13 | Mitsubishi Electric Visual Solutions America, Inc. | IR signal cross-talk elimination |
US8213809B2 (en) * | 2009-01-23 | 2012-07-03 | Conexant Systems, Inc. | Universal systems and methods for determining an incoming carrier frequency and decoding an incoming signal |
TW201104495A (en) * | 2009-07-22 | 2011-02-01 | Novatek Microelectronics Corp | Remote control device for a multimedia device and related multimedia system |
TW201106701A (en) * | 2009-08-14 | 2011-02-16 | Novatek Microelectronics Corp | Device and method of voice control and related display device |
US8467685B2 (en) * | 2009-12-21 | 2013-06-18 | Echostar Technologies L.L.C. | Apparatus, systems and methods for compensating infrared noise in an electronic system |
US8522283B2 (en) * | 2010-05-20 | 2013-08-27 | Google Inc. | Television remote control data transfer |
US20120059655A1 (en) * | 2010-09-08 | 2012-03-08 | Nuance Communications, Inc. | Methods and apparatus for providing input to a speech-enabled application program |
JP5771002B2 (ja) * | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
JP5039214B2 (ja) * | 2011-02-17 | 2012-10-03 | 株式会社東芝 | 音声認識操作装置及び音声認識操作方法 |
JP5695447B2 (ja) * | 2011-03-01 | 2015-04-08 | 株式会社東芝 | テレビジョン装置及び遠隔操作装置 |
JP2013106315A (ja) * | 2011-11-16 | 2013-05-30 | Toshiba Corp | 情報端末、家電機器、情報処理方法および情報処理プログラム |
US8543397B1 (en) * | 2012-10-11 | 2013-09-24 | Google Inc. | Mobile device voice activation |
JP6114915B2 (ja) | 2013-03-25 | 2017-04-19 | パナソニックIpマネジメント株式会社 | 音声入力選択装置及び音声入力選択方法 |
US9530410B1 (en) | 2013-04-09 | 2016-12-27 | Google Inc. | Multi-mode guard for voice commands |
US9092974B2 (en) * | 2013-05-01 | 2015-07-28 | Microsoft Technology Licensing, Llc | Mixing data and control codes on a wireless link |
CN103646587B (zh) * | 2013-12-05 | 2017-02-22 | 北京京东方光电科技有限公司 | 一种智能眼镜及其控制方法 |
KR102210433B1 (ko) * | 2014-01-21 | 2021-02-01 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
CN107148614B (zh) * | 2014-12-02 | 2020-09-08 | 索尼公司 | 信息处理设备、信息处理方法和程序 |
CN105788596A (zh) * | 2014-12-16 | 2016-07-20 | 上海天脉聚源文化传媒有限公司 | 一种语音识别电视控制方法及系统 |
JP6556473B2 (ja) * | 2015-03-12 | 2019-08-07 | 株式会社東芝 | 送信装置、音声認識システム、送信方法、およびプログラム |
US10880009B2 (en) * | 2019-05-24 | 2020-12-29 | Sonos, Inc. | Control signal repeater system |
JP7177803B2 (ja) * | 2020-07-08 | 2022-11-24 | シャープ株式会社 | 表示装置 |
CN112489413B (zh) * | 2020-11-27 | 2022-01-11 | 京东方科技集团股份有限公司 | 遥控器的控制方法及系统、存储介质、电子设备 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2773386B2 (ja) * | 1990-05-16 | 1998-07-09 | ソニー株式会社 | モニタ・テレビジョン装置 |
JPH0730982A (ja) | 1993-07-14 | 1995-01-31 | Sanyo Electric Co Ltd | リモートコントロール装置 |
DE69425198T2 (de) * | 1993-08-13 | 2001-03-15 | Toshiba Ave Kk | Zweiwegkabelfernsehsystem |
EP0740827B1 (en) * | 1994-11-17 | 2003-01-15 | Koninklijke Philips Electronics N.V. | Apparatus comprising a display screen which is active in the operating mode and in the standby mode |
KR960028659A (ko) | 1994-12-28 | 1996-07-22 | 배순훈 | 음성출력 기능을 갖춘 리모트 콘트롤 시스템 |
US6075575A (en) * | 1995-10-02 | 2000-06-13 | Starsight Telecast, Inc. | Remote control device and method for using television schedule information |
JPH10133849A (ja) | 1996-10-28 | 1998-05-22 | Toshiba Corp | パーソナルコンピュータおよびエラー通知方法 |
KR19980077985A (ko) | 1997-04-24 | 1998-11-16 | 윤종용 | 키 입력에 따른 음성메세지 송출기능을 갖는 리모콘 |
JPH11249687A (ja) | 1998-02-27 | 1999-09-17 | Mitsumi Electric Co Ltd | リモートコントローラ |
JP3951158B2 (ja) | 1998-07-27 | 2007-08-01 | ソニー株式会社 | 遠隔制御装置 |
JP2000112489A (ja) * | 1998-09-30 | 2000-04-21 | Toshiba Corp | 音声入力リモートコントロールシステム |
KR20000027981A (ko) | 1998-10-30 | 2000-05-15 | 전주범 | 음성인식 기능을 갖는 리모콘 송신기 |
US6812881B1 (en) * | 1999-06-30 | 2004-11-02 | International Business Machines Corp. | System for remote communication with an addressable target using a generalized pointing device |
US6567032B1 (en) * | 1999-06-30 | 2003-05-20 | International Business Machines Corp. | Method of directing communication between addressable targets using a generalized pointing device |
FR2802690A1 (fr) * | 1999-12-17 | 2001-06-22 | Thomson Multimedia Sa | Procede et dispositif de reconnaissance vocale, dispositif de telecommande associe |
JP3604982B2 (ja) | 1999-12-21 | 2004-12-22 | Necマイクロシステム株式会社 | リモートコントロール制御方法および装置 |
CN1307231A (zh) | 2000-02-02 | 2001-08-08 | 邦毅科技股份有限公司 | 用以操控设备的集中式语音识别遥控方法及系统 |
US6717528B1 (en) * | 2000-02-17 | 2004-04-06 | International Business Machines Corporation | System and method for dynamic feedback projection from a hand-held pointing device |
KR100370024B1 (ko) * | 2000-08-31 | 2003-01-30 | 엘지전자 주식회사 | 리모트 콘트롤러를 갖는 영상기기 및 이 영상기기를 통해주변 기기들을 조작하는 방법 |
US6529233B1 (en) * | 2000-09-29 | 2003-03-04 | Digeo, Inc. | Systems and methods for remote video and audio capture and communication |
US6775386B1 (en) * | 2000-10-05 | 2004-08-10 | Shin Jiuh Corp. | Microphone attached remote controller |
US20020149705A1 (en) * | 2001-04-12 | 2002-10-17 | Allen Paul G. | Contact list for a hybrid communicator/remote control |
US20050005288A1 (en) * | 2001-04-13 | 2005-01-06 | Digeo, Inc. | System and method for personalized remote control of an interactive television system |
US7690017B2 (en) * | 2001-05-03 | 2010-03-30 | Mitsubishi Digital Electronics America, Inc. | Control system and user interface for network of input devices |
-
2002
- 2002-11-08 US US10/290,709 patent/US7023498B2/en not_active Expired - Fee Related
- 2002-11-18 MY MYPI20024309A patent/MY134302A/en unknown
- 2002-11-18 EP EP02257940A patent/EP1313077A3/en not_active Withdrawn
- 2002-11-19 KR KR10-2002-0071889A patent/KR100486368B1/ko not_active IP Right Cessation
- 2002-11-19 CN CNB021522863A patent/CN100490559C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104076705A (zh) * | 2014-06-26 | 2014-10-01 | 美的集团股份有限公司 | 基于中转终端的终端控制方法和系统 |
CN104076705B (zh) * | 2014-06-26 | 2017-06-06 | 美的集团股份有限公司 | 基于中转终端的终端控制方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
US7023498B2 (en) | 2006-04-04 |
EP1313077A2 (en) | 2003-05-21 |
KR20030041803A (ko) | 2003-05-27 |
EP1313077A3 (en) | 2008-12-03 |
KR100486368B1 (ko) | 2005-04-29 |
MY134302A (en) | 2007-12-31 |
CN100490559C (zh) | 2009-05-20 |
US20030095212A1 (en) | 2003-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1420708A (zh) | 遥控对象设备、遥控系统以及图像处理装置 | |
CN1228762C (zh) | 用于语音识别的方法、组件、设备及服务器 | |
CN1774899A (zh) | 发送机、接收机、无线系统、控制方法、控制程序以及记录该程序的计算机可读取介质 | |
CN1040494C (zh) | 用压缩码排定电视节目录制的装置及方法 | |
CN1287622C (zh) | 信息处理装置和方法、信息处理系统和介质 | |
CN1152544C (zh) | 便携式电话机 | |
CN1071977C (zh) | 使用压缩码作电视节目录像时间排定的装置与方法 | |
CN1208529A (zh) | 多功能便携式电话 | |
CN1947410A (zh) | 遥控系统、远程命令器及遥控服务器 | |
CN1211357A (zh) | I*玩偶 | |
CN1533163A (zh) | 电子节目指南数据的自由文本和属性搜索 | |
CN1679062A (zh) | 个人可编程通用遥控装置 | |
CN1542736A (zh) | 在自然语言理解系统中用于位置的基于规则的语法和用于前终端的统计模型 | |
CN1825994A (zh) | 移动无线终端 | |
CN100343836C (zh) | 信息获取装置和信息提供装置 | |
CN1232075C (zh) | 信息处理设备和信息处理方法 | |
CN1620121A (zh) | 显示装置、双向通信系统和显示信息使用方法 | |
CN1825249A (zh) | 信息处理设备、信息处理方法以及与之一起使用的程序 | |
CN1429019A (zh) | 装有声音识别功能的电视机及其控制方法 | |
CN1364263A (zh) | 文件自动发送系统 | |
CN1894676A (zh) | 数据存储装置、信息发送装置、数据存储系统及信息处理系统 | |
CN1617115A (zh) | 用于将内容送到便携式终端的存储器扩充组件 | |
CN1774951A (zh) | 无线控制系统、控制设备、受控设备、设备的控制方法、控制程序以及记录了该程序的计算机可读取的记录媒体 | |
CN1898914A (zh) | 无线通信方法以及无线通信装置 | |
CN1711751A (zh) | 遥控装置和节目接收系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090520 Termination date: 20091221 |