CN1153128C - 具有语音手动用户接口的设备和辅助学习语音指令的方法 - Google Patents

具有语音手动用户接口的设备和辅助学习语音指令的方法 Download PDF

Info

Publication number
CN1153128C
CN1153128C CNB001002155A CN00100215A CN1153128C CN 1153128 C CN1153128 C CN 1153128C CN B001002155 A CNB001002155 A CN B001002155A CN 00100215 A CN00100215 A CN 00100215A CN 1153128 C CN1153128 C CN 1153128C
Authority
CN
China
Prior art keywords
voice shortcut
order
user
reciprocation
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB001002155A
Other languages
English (en)
Other versions
CN1261178A (zh
Inventor
�ˡ����˶�������˹
埃里克·迪尔
邵江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
COLOR PRINTING TECHNOLOGY Co.
Thomson Licensing SAS
International Digital Madison Patent Holding SAS
Original Assignee
Thomson Consumer Electronics SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Consumer Electronics SA filed Critical Thomson Consumer Electronics SA
Publication of CN1261178A publication Critical patent/CN1261178A/zh
Application granted granted Critical
Publication of CN1153128C publication Critical patent/CN1153128C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Digital Computer Display Output (AREA)
  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)

Abstract

一种设备具有用于访问其功能的语音和/或手动用户接口。该功能可以通过菜单体系访问,其中分支可以通过称为语音快捷方式的语音指令来短路。根据本发明,提供语音存储由用户所执行的交互作用次序和用于检测可以使用语音快捷方式取代交互作用次序的情况。在这种情况下,一个消息被发送给用户以通知所检测语音快捷方式存在的情况。本发明还涉及一种用于利用上述装置辅助学习该语音指令的方法。

Description

具有语音手动用户接口的设备和辅助学习语音指令的方法
本发明涉及一种具有语音和/或手动用户接口的设备,以及一种用于辅助学习这种设备的语音指令的方法。其特别涉及被设计为由可以用语音或用按键操作的遥控装置所控制的设备的领域。
通常,设备的各种功能被通过菜单体系来访问,通过菜单,用户利用在其遥控装置上的按键,利用语音指令或者安装在该设备本身的可选的按键来导航。
对于用户来说所产生的一个问题是知道该语音指令,也就是说,需要说出以使用它们的关键字。这是因为即使这些关键字经过挑选以便于记忆,但是如果用户不经常使用,则容易忘记,从而不会使用该语音指令。
辅助用户了解该语音指令的第一种方法包含在实现“WYSIWYCS”(表示“所见即所可说”)原则的过程中。也就是说,当菜单包含被显示在屏幕上的标题(子菜单或功能的标题)时,用户可以通过说出显示在屏幕上对应于标题的关键字而到达或激活该标题中的一个。
但是,该设备的语音指令优于手动指令的主要优点是快捷方式的使用:
-通过说出对应于所述菜单或所述功能的关键字可以直接访问特定菜单或特定功能,而不需要执行多个通过菜单的导航操作,在这种情况下,使用术语“导航语音快捷方式”;
-或者通过说出对应于所述功能的关键字也可以直接激活特定功能,而不必进入任何菜单,在这种情况下,使用术语“激活语音快捷方式”;
这两种可能性可以与语音快捷方式相结合,使得可以访问特定功能并激活它。
在这种情况下,由于用户不一定在屏幕上看到他可以说出的关键字以到达菜单或激活给定的功能,因此不能够应用“WYSIWYCS”方法。
本发明的一个目的是通过使用户更加容易地学习和了解该语音指令而解决上述问题。
为此目的,本发明提供一种具有用于访问其功能的语音和/或手动用户接口的设备,该功能可被通过菜单体系访问,其中可以被特定语音指令所短路的分支被称为语音快捷方式。根据本发明,该设备具有:
-用于存储由用户作出的交互作用次序的装置;
-用于检测对应于所存储的交互作用次序的语音快捷方式的装置;以及
-用于在检测到语音快捷方式的存在时把一个消息传送到用户以把所述语音快捷方式存在的情况通知用户的装置。
本发明还涉及一种用于辅助学习上述设备的语音指令的方法。该方法包括如下步骤:
a)存储由用户作出的存储交互作用的次序;
b)测试是否存在对应于所述交互作用次序的语音快捷方式;以及
c)在检测到存在语音快捷方式的情况下,提供用于把所述语音快捷方式存在的情况通知用户的方式。
因此,尽管用户可以使用语音快捷方式到达一菜单或功能,一旦用户通过复杂的交互作用次序来到达该菜单或功能时,则将提醒他使用语音快捷方式。利用本发明的优点,用户将发现非常容易记忆对应于他所经常访问的菜单或功能的语音快捷方式。
根据本发明的一个具体实施例,步骤a)包括:
i)存储用户接口的初始状态;
ii)检测由用户执行的行为;
iii)存储在该行为之后的用户接口的当前状态;
步骤ii)和iii)被重复执行,直到满足用于交互作用次序的结束的如下条件中的一个:
-所检测的行为对应于一个功能的激活;或者
-在比预定限制时间段更长的时间段内没有检测到行为。
因此可以检测导致功能的激活和构成对一个菜单或功能的访问而不激活该菜单或功能的两个交互作用次序。
根据本发明的一个特定实施例,在步骤ii)检测的行为属于如下情况:
-在用户接口的遥控装置上的一个按键被按下;以及
-用户接口的话筒拾取对应于一个语音指令的关键字。
优选地,本发明的方法还包括如下步骤:
iv)测试在步骤ii)中所检测的行为是否是一个对应于一个语音快捷方式的语音指令;以及
v)当对上述测试的回答为肯定时,增加与上述语音指令相关联的使用计数器。
根据本发明的一个优选方面,该设备的存储装置包括交互作用寄存器,其中包括:
-“初始状态”字段,其中在步骤i)过程中存储用户接口的初始状态;
-“当前状态”字段,其中在步骤iii)过程中存储用户接口的当前状态。
根据一个具体实施例,步骤a)还包括:
vi)存储在步骤iv)中检测的每个语音快捷方式的使用。
并且步骤c)还包括:
vii)检查对应于所存储的交互作用次序的语音快捷方式还没有在所述交互作用次序的过程中使用。
根据本发明的一个优选方面,如果在步骤vii)检测的对应于所存储的交互作用次序的语音快捷方式还没有在所述交互作用次序的过程中使用,则执行如下步骤:
viii)把对应于所述语音快捷方式的语音指令的使用计数器与一预定阈值相比较,并且
-如果该使用计数器大于或等于所述阈值,则
ix)减小所述使用计数器;
-或者,
x)把一个消息发送到用户,通知他在步骤b)中检测的语音快捷方式的存在。
因此如果用户习惯使用语音快捷方式,但是有时忘记使用它时,该系统“智能地”作出反应,不把该语音快捷方式存在的情况通知用户。
根据本发明的另一个方面,提供一种方法,用于在用户通常不愿意被提醒他关于语音指令的消息所打扰时,使该处理过程无效。
从下文参照附图给出的本发明的非限制性具体实施例的描述中,本发明的其它特点和优点将变得更加清楚,其中:
图1a和1b表示根据本发明第一方面具有语音和/或手动用户接口的设备的一个实例;
图2以方框图的形式表示在图1a中所示的设备所具备的电路;
图3表示用于通过图1a中所示的设备的用户接口的菜单导航的菜单体系的一个实例;
图4a至4e表示象属于图3中所示的体系那样的菜单的实例,其显示在图1a中的设备的屏幕上;
图5a和5b表示说明在根据本发明第二方面的过程中的各种步骤的流程图。
图1a表示一电视接收设备或电视机1,其具有可以显示对应于由电视机1的调谐器所接收的信号或来自于象盒式录像机这样的连接到电视机上的外部来源的信号的视频图像。屏幕3还被用于显示电视机的用户接口的导航菜单。
其它描述将参照电视接收设备1给出,其用户接口包括图1b中所示类型的多模式遥控装置,也就是说可以通过语音或按键进行操作,其配备有用于电视机的功能的手动操作的按键5-11,并且包括用于所述功能的语音指令的话筒(未示出),但是,在本质上,本发明更加普遍地应用于其功能可以通过语音和/或手动指令激活的任何设备,例如用于从人造卫星或通过电缆接收的信号的盒式录像机或解码器。
为了手动地激活电视机的功能,用户可以利用在遥控装置上的常规按键(按键7用于调节音量“Vol.+”和“Vol.-”,按键8用于切换频道“PR+”和“PR-”,或按键6用于选择特定频道),或者利用按键5来访问主菜单,利用导航按键9c、9d移动该菜单,并且利用激活按键10选择菜单或激活特定功能,或者利用按键“+”9b和“-”9a进行调节。按键11还被提供用于退出菜单。这种菜单的例子将参照图3在下文中描述。
遥控装置4还包括用于使用户通过语音实现或激活电视机的功能的话筒(未示出)。还提供高频信号(HF)的发射器(未示出),一方面,用于接收由编码电路所调整的对应于按键的操作的信号,另一方面,该音频信号由话筒所拾取,并把这些指令信号发送到电视机。
图2表示用于处理由遥控装置4所传送的信号的电视机1的部件。
高频(HF)接收器12接收由遥控装置的发射器所发送的信号。它一方面把来自遥控装置按键的信号传送到按键解码器电路14,另一方面,把来自话筒的信号传送到语音识别电路16。电路14和16被连接到微处理器,在图1中仅示出一个功能单元18,其是用于管理用户接口的系统。该单元18包括通过菜单体系管理进程的导航管理模块22,作为从电路14和16接收的指令信号的一个功能。
导航管理模块22连接到第一电视管理模块22,其管理电视机的各种功能,例如音量、改变频道、亮度、对比度等等,并且连接到电视机的电路19。模块22还连接到根据本发明的第二语音辅助模块24,其连续核对并存储由用户所执行的交互作用,以检测用户利用语音快捷方式取代一系列较长的交互作用来实现电视机的一个功能的情况。
模块22最后连接到第三图形管理模块28,其控制用于在屏幕上显示数据的电路20,通常称为OSD电路,OSD表示“屏幕显示”。OSD电路20是可以在屏幕上显示菜单和象形图的文本和图像产生器,根据本发明的一个优选方面,其用于显示针对用户的消息,以在用户不使用语音快捷方式时,把语音快捷方式存在的情况通知用户。
另外,易失性存储器15和非易失性存储器17连接到微处理器,并由语音辅助模块24所使用,以分别存储非持久和持久的数据,如下文中所述。
语音辅助24、电视管理26和图形管理28模块形成用户接口的管理系统18的组成部分。导航管理模块22和电视管理26与语音辅助24模块之间的链路是双向型的,模块26与电视机19的电路之间的链路以及模块24与存储器15和17之间的链路也是双向性型的。类似地,语音识别电路16通过双向链路连接到模块22。
图3表示用于访问电视机的各种功能的菜单体系。该树形结构包括标识“电视屏幕”在初始节点30,其对应于电视节目被显示在电视机屏幕上的状态。由黑点表示在图3中的所有该树内部的节点35-45是导航节点,而由下划线文字所表示的对应于该树的“子叶”的节点是功能节点。导航节点或者对应于覆盖几个功能的菜单,例如位于节点37处的“图像”菜单,或者对应于覆盖几个选项的功能字段,例如位于“图像”菜单中的节点39处的“格式”字段。
在图3中所示的菜单体系是通过示例给出的,并且完全可以考虑把本发明应用于包含其它功能的菜单。
当用户按下遥控装置的按键5(图1b)或者当他向遥控装置的话筒说出“主菜单”关键字时,位于节点35处的“主菜单”菜单被选择。“主菜单”菜单提供对显示在与当前视频图像相重叠的窗口内的四个菜单的访问:节目指南40、可用频道的列表38以及图像37和声音36的特定参数的设置。这些菜单36、37、38、40中的每一个都可以访问在图3中以导航节点39、41-45的形式出现的覆盖几个选项的功能字段,或者直接访问电视机的功能(带下划线的文字)。
为了访问该体系的各标题,用户可以采取使用遥控装置的导航按键9c、9d和激活按键10的常规过程,或者通过说出对应于该标题的题目的一个关键字使用语音指令。
图4a-4e说明当用户通过图3中所示的体系导航时在电视机的屏幕上显示的各种窗口的形式。
假设用户正在观看电视节目,也就是说他在该体系的节点30处(图3),并且它希望调节电视机的对比度。
如果他仅使用手动接口,也就是说在遥控装置上的按键,他采用如下过程:首先按下按键5,使“主菜单”窗口50显示在屏幕上(图4a)。该窗口具有对应于可从“主菜单”访问的4个菜单36-40的四个标题51-54。当显示窗口50时,首先默认选择第一标题“节目指南”,这就是标题51在图4a中被加亮显示的原因。为了到达“对比度”功能所在的“图像”菜单,用户需要两次按下导航按键9d,第一次选择标题52(图4b)并且第二次选择标题53(图4c)。然后需要按下激活按键10以显示包含“图像”菜单的各种功能的窗口60(图4d)。
该窗口60包含对应于可从节点37(图3)访问的功能的标题62-65。当被激活时,它还可以包含“返回”标题61,使得可以返回“主菜单”。该“返回”标题尽管没有在图3的体系中示出,但是它实际上存在于该体系中除了“主菜单”之外的所有菜单和子菜单中。
为了达到“对比度”功能,用户还需要一次按下按键9d,其改变图4e中所示的窗口60的显示。在该阶段,用户可以通过按键9a、9b调节对比度,其移动显示在对应于窗口60的标题62的方框中的光标70。
为了执行相同的操作,即从菜单体系的初始节点30调节电视机的对比度,用户还可以利用语音接口。由于它允许用户采用快捷方式通过该体系,因此该方案具有更多的优点。
因此,用户所需要做的是说出“对比度”关键字,这时窗口60立即显示在屏幕上,并具有图4e中所示的状态,也就是说“对比度”功能被选择。因此,“对比度”语音指令构成该环境中的语音快捷方式,因为它可以直接访问相应的功能,而不需要执行手动指令情况中的5个操作。
应当指出,还可以参照图4a-4e通过使用根据“WYSIYCS”原则的语音指令执行上述操作。这与手动指令相比略微缩短交互作用的次序,因为用户通过说出“图像”关键字就可以从图4a中所示的窗口直接到达图4d中所示的窗口。但是,即使在这种情况下,该交互作用的次序也比当用户从开始就使用“对比度”语音快捷方式的情况更长。
根据本发明,在所有情况下当用户使用长的交互作用次序(使用手动和/或语音指令)到达一个菜单或功能、或者激活一个功能时,将检测用户何时可以利用语音快捷方式更快地执行相同操作。在该检测之后,把该快捷方式存在的情况通知用户,使得他可以习惯使用该语音快捷方式。
为了检测语音快捷方式的存在,其原理是存储由用户作出的交互作用次序,并看该交互作用的次序的开始节点和结束结点是否由至少一个导航节点所分隔。
由用户所作的交互作用次序由多个交互作用所构成,包括:用户的行为以及该行为之后的用户接口的状态,也就是说在该行为之后在该体系中当前存在的节点。
由用户作出的一个行为对应于:
-在遥控装置上按下按键;
-或者说出对应于一个语音指令的关键字。
一个行为导致运动通过该导航树,或者一个功能的激活。
-交互作用的次序结束:
-伴随着一个功能的激活;
-或者伴随着用户在比限制时间长度更强的时间段内不采取任何动作,例如该限制时间段固定在5到10秒。
在实践中,根据一个优选实施例,在交互作用的次序开始之前,用户接口的状态被存储,并且当用户执行交互作用时,用户接口的当前状态被存储。当一个交互作用次序结束时,然后比较用户接口的初始状态和最终的当前状态,如下文中所示,从这可以推导出是否可以用语音快捷方式执行相同的交互作用次序。
为此,最好使用交互作用寄存器IR。其包括两个字段:“初始状态”字段和“当前状态”字段。该交互作用寄存器IR例如是通过在连接到包含功能单元18的微处理器(图2)的易失性存储器15中保存两个存储位置而产生的。
如下表1示出在对应于上文参照图4a至4e描述的实例的情况中交互作用存储器的内容中的改变:
    图         交互作用寄存器
    初始状态     当前状态
    /     电视屏幕     电视屏幕
    4a     电视屏幕     主菜单(节目指南)
    4b     电视屏幕     主菜单(频道列表)
    4c     电视屏幕     主菜单(图像)
    4d     电视屏幕     图像(返回)
    4e     电视屏幕     图像(对比度)
                          表1
在上述实例中,当交互作用次序结束时,该交互作用寄存器IR在其“初始状态”字段和“当前状态”字段中包含“电视屏幕”,该状态对应于从“图像”菜单选择“对比度”功能。在实践中,该接口的每个状态具有相应代码,并且存储在存储位置中的这些代码形成交互作用寄存器IR。
为了检测对应于所存储的交互作用次序的语音快捷方式的存在,使用一个称为“语音功能表”的表格,其对于每个用户接口的“开始状态”包含一个可以由语音指令从该“开始状态”访问的所有“结束状态”的列表,以及需要说出的相应关键字。
该语音功能表VFT取决于在开始对该用户接口定义的菜单体系。其由用户接口的管理系统存储在非易失性存储器17中(图2)。该表格VFT包括四列:“开始状态”列、“结束状态”列、包含相应关键字的“语音指令”列、以及对应于本发明的优选实施例的“语音快捷方式指示符”列,其表示当从“开始状态”运动到“结束状态”时是否构成一个语音快捷方式。当“语音快捷方式指示符”等于“1”时,这意味着“语音指令”构成一个语音快捷方式。相反,当“语音快捷方式指示符”等于“0”时,这意味着它不是语音快捷方式。
例如,对应于图3中的菜单体系的语音功能表VFT表示如下(表2):
                        语音功能表
开始状态   结束状态   语音指令   语音快捷方式指示符
电视屏幕   主菜单(节目指南)   “主菜单”   0
电视屏幕   节目指南(频道)   “节目指南”   1
电视屏幕   频道列表(频道1)   “频道列表”   1
电视屏幕   图像(返回)   “图像”   1
...   ...   ...   ...
电视屏幕   图像(对比度)   “对比度”   1
电视屏幕   图像(亮度)   “亮度”   1
电视屏幕   图像(颜色)   “颜色”   1
电视屏幕   图像(格式=16/9)   “十六比九”   1
...   ...   ...   ...
图像(返回)   图像(对比度)   “对比度”   0
图像(返回)   图像(亮度)   “亮度”   0
...   ...   ...   ...
图像(返回)   节目指南(频道)   “节目指南”   1
                         表2
为了检测是否已经存储在交互作用寄存器IR中的交互作用次序可以由一个语音快捷方式所代替,所需要作的是查看VFT表,以判断:
-对于“开始状态”等于交互作用寄存器IR的初始状态,是否可以找到:
-“结束状态”等于交互作用寄存器IR的“当前状态”,使得:
-“语音快捷方式指示符”等于“1”。
如果所有这些条件都相结合,则可以从此推导出相应的“语音指令”构成被存储在交互作用寄存器IR中的交互作用次序的一个语音快捷方式。
因此,在由表1示出的过程的情况中,在VFT表中对于“开始状态”等于“电视屏幕”进行搜索,看是否可以找到“结束状态”等于“图像(对比度)”(也就是说“对比度”功能被从“图像”菜单中选择的状态),使得相应的“语音快捷方式指示符”等于“1”。这些条件在与表2(行6)相结合中找到,这意味着存在用于到达与所存储的交互作用次序相同的结束状态的语音快捷方式。进一步可以从表2中看出,对应于该语音快捷方式的“语音指令”是“对比度”。
根据本发明,因此通过适当的信息把可以通过说出词语“对比度”而使用该语音快捷方式的情况提醒用户。该信息可以方便地通过出现在电视机的屏幕上的窗口中的文本信息而进行传递。它还可以通过利用语音合成器以听觉形式传递,或者以视觉和听觉两种形式传递。
图5a和5b中所示的流程图表示用于辅助学习根据本发明的电视机的语音指令的过程中的各种步骤,该过程通过参照图2描述的语音辅助模块24实现。
在执行系统的各种初始化过程的开始步骤100之后,该过程从设置交互作用寄存器IR的第一步骤101开始。该步骤包括对于用户接口的当前状态初始化交互作用寄存器IR的“初始状态”字段和“当前状态”字段。
在该步骤101过程中,称为“已用快捷方式列表”USL的列表也被复位。该列表USL最好存储在还存储有交互作用寄存器IR的易失性存储器15(图2)中。如下文对该过程的描述中可以看出,它用于存储在交互作用次序中已用的语音快捷方式。
该过程继续进行第一测试102,以检查用户是否已经执行一个行为。如果回答为是,则执行第二测试103,以检查由用户所执行的行为是否是一个语音快捷方式。在每次检查到由用户所做的一个新行为时,该测试按如下方式执行。
首先,检查是否在测试102中检测的行为是一个语音指令。如果答案为否,则对该测试103的回答也是否定的。但是,如果所检测的行为是一个语音指令,则调查该语音指令是否包含一个语音快捷方式。为此,使用语音功能表VFT,并且调查:
-对于“开始状态”等于交互作用寄存器IR的“当前状态”,是否可以找到:
-一个“语音指令”等于在步骤102中检测的行为中识别的语音指令,使得:
-“语音快捷方式指示符”等于“1”。
如果对该测试的回答是肯定的,则转到步骤104,其中包括在表USL中存储语音快捷方式的使用,并且为该快捷方式增加“使用计数器”。
实际上,使用计数器与除了不能构成语音快捷方式的语音指令之外的每个语音指令相关。例如,在“节目指南”菜单中,“概述”功能仅可以从“节目指南”菜单中激活。因此,该“概述”语音指令不能构成一个语音快捷方式。在实践中,包括一个“语音指令”列以及一个“使用计数器”列的“语音快捷方式表”VST被存储。该表通过把具有至少一次“语音快捷方式指示器”等于“1”的所有语音指令复制到语音指令表VFT的“语音指令”列中而构成。
在每次一个语音快捷方式的使用被在步骤103中检测时,相关语音指令的使用计数器被增加(步骤104)。相反地,在每次语音快捷方式可以被用于访问一个功能但是用户使用较长的交互作用次序时,相关语音指令的使用计数器被减小(在下文中所述的步骤113)。
如下文中所示,当用户习惯使用语音快捷方式(在这种情况下,其使用计数器的数值将会较高)但是偶尔忘记使用它时,则不通知用户该语音快捷方式的存在。
当语音快捷方式的使用计数器在步骤104中增加时,对应于该快捷方式的语音指令也被存储在所用的快捷方式的列表USL中。该列表USL将随后被在步骤111中使用。
如果对步骤103中的测试的回答是否定时,则转到另一个测试(步骤108)以检查是否执行在步骤102中检测的对应于一个功能的激活的最后行为。实际上,如果对该测试的回答是否定的,则认为该交互作用的次序没有结束,并且在这种情况下,转到更新交互作用计数器的步骤106,然后返回到步骤102。上述的步骤104也总是跟随着步骤108。
步骤106包括在交互作用寄存器IR的“当前状态”字段中存储用户接口的当前状态,也就是说,在步骤102中检测的行为之后的接口的状态。
如果对测试108的回答是肯定的,测转到步骤110。
当检测由用户所作用行为的第一测试102是否定时,则在步骤105执行另一测试,以检查是否经过限制时间段,例如固定为5或10秒。如果为否,则返回到步骤102,以测试用户是否执行一个行为。但是,如果已经经过该限制时间段,则认为交互作用的次序结束,并且转到步骤110。
当达到步骤110时,这意味着交互作用的次序结束,并且该交互作用次序的“初始状态”和“当前状态”被存储在交互作用寄存器IR中。在步骤110中,接着使用上述方法(在表VFT的描述之后的),对于存储在交互作用寄存器IR中的交互作用次序是否可以完全由语音快捷方式所代替,执行一个测试。
如果测试110的结果是否定的,也就是说如果不可能对所存储的交互作用次序检测所有语音快捷方式,则返回到步骤101以开始存储一个新的交互作用次序。但是,在测试110的结果是肯定的情况下,也就是说对应于所存储的交互作用次序的所有语音快捷方式被检测,则在步骤111中检查该语音快捷方式是否还没有在交互作用次序中使用。这是因为,用户可以通过导航经过菜单体系来执行多个交互作用,例如通过节目指南,然后通过说出“亮度”利用语音快捷方式到达调节亮度的功能,在这种情况下,没有提醒用户存在语音快捷方式的时刻。为了检测语音快捷方式(例如“亮度”)是否已经在交互作用次序过程中使用,检查“亮度”出来语音指令是否存在于已用的快捷方式的列表USL中。
如果在步骤111中的测试是肯定的,测在步骤110中检测的语音快捷方式已经被在交互作用次序中使用,则返回到步骤101。在相反的情况下,该处理过程继续执行步骤112,其中包括测试对于语音指令(存储在表VST中)的使用计数器是否大于或等于预定阈值,例如设为5。这等价于测试用户在以前是否已经5次以上使用该语音快捷方式。如果对该测试的回答是肯定的,则用于语音快捷方式的使用计数器将在步骤113中减少,但是由于用户已经几次使用该语音快捷方式,因此认为提醒用户该语音快捷方式的存在是多余的,并且返回到步骤101。
相反,如果对测试112的回答是否定的,则需要提醒用户该语音快捷方式的存在。在此以前,关于检测用户是否故意拒绝使用该语音快捷方式,例如为了不干扰他附近的人,在步骤114中执行附加测试。为此,第一计数器A从由用户最后一次使用语音指令开始倒计时。该计数器是基于系统的时钟的,并且在每次检测到新的语音指令时复位,或者当电视机转为待机状态时复位。第二计数器B被提供用于在由计数器A倒计时的时间段中已经给出的关于存在语音快捷方式的提醒的次数。该计数器在每次向用户提示语音快捷方式时增加,并且在每次使用新的语音快捷方式时复位。
为了执行测试114,查看计数器A的数值是否大于或等于预定时间段,例如15分,以及计数器B的数值是否大于或等于语音快捷方式的提醒的预定次数,例如5。如果测试的结果是肯定的,则没有通知把在步骤110检测的语音快捷方式的存在通知给用户的时刻,并且返回到步骤101,以开始存储一个新的交互作用次序。
在测试114的结果是否定的情况下,则认为用户系统地拒绝使用语音指令,并且在步骤115中,发送一条信息把在步骤110中检测的语音快捷方式的存在通知给用户。该消息可以通过在电视机的屏幕上显示的文本的形式传送,或者利用语音合成器以可听形式传送。
另一个优点是提供一种方法,它在用户故意不希望被语音辅助模块发送来提醒他关于语音指令的存在的消息所打扰时,使该语音辅助模块24无效。为此,可以专门在遥控装置上提供一个特别的附加按键(未示出)或者在菜单体系中提供一个特定标题(未示出)。

Claims (13)

1.具有用于访问其功能的语音和/或手动用户接口的设备,所述功能可被通过菜单体系(30-45)访问,其中可以被特定语音指令所短路的分支被称为语音快捷方式,其特征在于,其具有:
-用于存储由用户作出的交互作用次序的装置(15);
-用于检测对应于所存储的交互作用次序的语音快捷方式的装置(24,17);以及
-用于在检测到语音快捷方式的存在时把一个消息传送到用户以把所述语音快捷方式存在的情况通知用户的显示或音频装置(20-28)。
2.一种用于辅助学习根据权利要求1所述的设备的语音指令的方法,其特征在于,其包括如下步骤:
a)存储由用户作出的存储交互作用的次序(101-108);
b)测试是否存在对应于所述交互作用次序的语音快捷方式(110);以及
c)在检测到存在语音快捷方式的情况下,提供用于把所述语音快捷方式存在的情况通知用户的方式(115)。
3.根据权利要求2所述的方法,其特征在于,该步骤a)包括:
i)存储用户接口的初始状态(101);
ii)检测由用户执行的行为(102);
iii)存储在该行为之后的用户接口的当前状态(106);
步骤ii)和iii)被重复执行,直到满足用于交互作用次序的结束的如下条件中的一个(105,108):
-所检测的行为对应于一个功能的激活;或者
-在比预定限制时间段更长的时间段内没有检测到行为。
4.根据权利要求3所述的方法,其特征在于,在步骤ii)检测的行为属于如下情况:
-在用户接口的遥控装置上的一个按键被按下;以及
-用户接口的话筒拾取对应于一个语音指令的关键字。
5.根据权利要求3或4所述的方法,其特征在于,它还包括如下步骤:
iv)测试(103)在步骤ii)中所检测的行为是否是一个对应于一个语音快捷方式的语音指令;以及
v)当对上述测试的回答为肯定时,增加(104)与上述语音指令相关联的使用计数器。
6.根据权利要求3所述的方法,其特征在于,该设备的存储装置包括交互作用寄存器(15),其中包括:
-“初始状态”字段,其中在步骤i)过程中存储用户接口的初始状态;
-“当前状态”字段,其中在步骤iii)过程中存储用户接口的当前状态。
7.根据权利要求6所述的方法,其特征在于,用于检测语音快捷方式的存在的装置包括一个语音功能表(17),其中对于每个用户接口的“开始状态”包括一个所有“结束状态”的列表,作为已用“语音指令”的一个功能,以及“语音快捷方式指示符”表示通过利用“语音指令”从一个“开始状态”变为一个“结束状态”是否构成一个语音快捷方式;
以及,步骤iv)是通过如下判断而执行(103):
I)在步骤ii)中检测的行为是否为一个语音指令,并且如果对该测试I)的回答为肯定,
II)通过测试判断:
-对于“语音指令”等于交互作用寄存器(15)的“当前状态”,可以找到:
-一个“语音指令”等于在测试I)过程中识别的语音指令,使得:
-该“语音快捷方式指示符”表示语音快捷方式的存在。
8.根据权利要求7所述的方法,其特征在于,步骤b)通过测试而执行,在语音功能表(17)中,判断:
-对于一个“开始状态”等于交互作用寄存器(15)的“初始状态”,是否可以找到:
-一个“结束状态”等于交互作用寄存器(15)的“当前状态”,使得:
-“语音快捷方式指示符”表示一个语音快捷方式的存在。
9.根据权利要求5所述的方法,其特征在于,步骤a)还包括:
vi)存储在步骤iv)中检测的每个语音快捷方式的使用(104)。
10.根据权利要求9所述的方法,其特征在于,步骤c)还包括:
vii)检查(111)对应于所存储的交互作用次序的语音快捷方式还没有在所述交互作用次序的过程中使用。
11.根据权利要求10所述的方法,其特征在于,如果在步骤vii)检测的对应于所存储的交互作用次序的语音快捷方式还没有在所述交互作用次序的过程中使用,则执行如下步骤:
viii)把对应于所述语音快捷方式的语音指令的使用计数器与一预定阈值相比较(112),并且
-如果该使用计数器大于或等于所述阈值,则
ix)减小(113)所述使用计数器;
-或者,
x)把一个消息(115)发送到用户,通知他在步骤b)中检测的语音快捷方式的存在。
12.根据权利要求11所述的方法,其特征在于,还包括如下步骤:
以及,在步骤x)之前执行测试(114),以便检测自用户对语音指令的最后的使用开始,进行倒计时的计数器A的数值是否大于或等于预定时间段,其中,如果在由计数器A倒计时的时间段中,根据步骤x)计数发送给用户的消息数目的计数器B的数值大于或等于消息的预定数目,则步骤x)仅仅在对所述测试(114)否定回答的情况下执行。
13.根据权利要求1所述的设备,其特征在于,其包括用于使根据权利要求2至12中的一项的方法无效的装置。
CNB001002155A 1999-01-18 2000-01-06 具有语音手动用户接口的设备和辅助学习语音指令的方法 Expired - Lifetime CN1153128C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9900460 1999-01-18
FR9900460A FR2788615B1 (fr) 1999-01-18 1999-01-18 Appareil comportant une interface utilisateur vocale ou manuelle et procede d'aide a l'apprentissage des commandes vocales d'un tel appareil

Publications (2)

Publication Number Publication Date
CN1261178A CN1261178A (zh) 2000-07-26
CN1153128C true CN1153128C (zh) 2004-06-09

Family

ID=9540951

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001002155A Expired - Lifetime CN1153128C (zh) 1999-01-18 2000-01-06 具有语音手动用户接口的设备和辅助学习语音指令的方法

Country Status (5)

Country Link
US (1) US6751594B1 (zh)
EP (1) EP1020789B8 (zh)
JP (1) JP2000231398A (zh)
CN (1) CN1153128C (zh)
FR (1) FR2788615B1 (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19942871B4 (de) * 1999-09-08 2013-11-21 Volkswagen Ag Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug
DE60133902D1 (zh) * 2000-07-28 2008-06-19 Siemens Vdo Automotive Corp
JP3423296B2 (ja) * 2001-06-18 2003-07-07 沖電気工業株式会社 音声対話インターフェース装置
EP1273978A3 (en) * 2001-07-06 2005-06-08 Ricoh Company, Ltd. Method for setting a function and a setting item by selectively specifying a position in a tree-structured menu
KR100457509B1 (ko) 2001-07-07 2004-11-17 삼성전자주식회사 터치스크린과 음성인식을 통해 동작 제어되는 정보단말기 및 그의 명령 실행 방법
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
JP3500383B1 (ja) 2002-09-13 2004-02-23 コナミ株式会社 ゲーム装置、ゲーム装置の制御方法及びプログラム
WO2006001794A1 (en) * 2004-06-10 2006-01-05 Thomson Licensing S.A. Method for operating a menu system
US9098826B2 (en) * 2004-09-30 2015-08-04 The Invention Science Fund I, Llc Enhanced user assistance
KR100744541B1 (ko) * 2005-12-07 2007-08-01 한국전자통신연구원 멀티모달 인터액션 자동화 장치 및 방법
US8457973B2 (en) * 2006-03-04 2013-06-04 AT&T Intellectual Propert II, L.P. Menu hierarchy skipping dialog for directed dialog speech recognition
US20080082316A1 (en) * 2006-09-30 2008-04-03 Ms. Chun Yu Tsui Method and System for Generating, Rating, and Storing a Pronunciation Corpus
JP2008096541A (ja) * 2006-10-06 2008-04-24 Canon Inc 音声処理装置およびその制御方法
US7881938B2 (en) * 2007-03-27 2011-02-01 Nuance Communications, Inc. Speech bookmarks in a voice user interface using a speech recognition engine and acoustically generated baseforms
JP5343652B2 (ja) * 2009-03-24 2013-11-13 コニカミノルタ株式会社 操作画面制御装置、画像形成装置、およびコンピュータプログラム
JP2011071937A (ja) * 2009-09-28 2011-04-07 Kyocera Corp 電子機器
EP2362186A1 (de) * 2010-02-26 2011-08-31 Deutsche Telekom AG Bedieneinrichtung für elektronische Gerätefunktionen in einem Kraftfahrzeug
TWI398805B (zh) * 2010-07-29 2013-06-11 Hon Hai Prec Ind Co Ltd 具遙控功能的可擕式電子裝置
CN101968712B (zh) * 2010-10-08 2012-09-19 鸿富锦精密工业(深圳)有限公司 具有触摸显示屏的遥控器
JP2013019958A (ja) * 2011-07-07 2013-01-31 Denso Corp 音声認識装置
US9135914B1 (en) 2011-09-30 2015-09-15 Google Inc. Layered mobile application user interfaces
KR20140089863A (ko) 2013-01-07 2014-07-16 삼성전자주식회사 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
US10170114B2 (en) 2013-05-30 2019-01-01 Promptu Systems Corporation Systems and methods for adaptive proper name entity recognition and understanding
KR102261552B1 (ko) 2014-06-30 2021-06-07 삼성전자주식회사 음성 명령어 제공 방법 및 이를 지원하는 전자 장치
JP6208837B1 (ja) 2016-10-12 2017-10-04 株式会社エイチアイ ユーザインタフェースを制御する方法、プログラム及び装置
DE102016012474A1 (de) 2016-10-18 2018-04-19 Reifenhäuser GmbH & Co. KG Maschinenfabrik Verfahren zur schnellen Navigation in einer Benutzeroberfläche, Verfahren zum Herstellen eines Produkts aus thermoplastischem Kunststoff, Anlagensteuerung zur schnellen Navigation in einer Benutzeroberfläche und Anlage zum Herstellen eines Produkts aus thermoplastischem Kunststoff
CN108322791B (zh) * 2018-02-09 2021-08-24 咪咕数字传媒有限公司 一种语音评测方法及装置
CN115118814A (zh) * 2021-03-17 2022-09-27 上海擎感智能科技有限公司 信息推送方法及系统、电子设备及存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5388198A (en) * 1992-04-16 1995-02-07 Symantec Corporation Proactive presentation of automating features to a computer user
US5465358A (en) * 1992-12-28 1995-11-07 International Business Machines Corporation System for enhancing user efficiency in initiating sequence of data processing system user inputs using calculated probability of user executing selected sequences of user inputs
JPH0844520A (ja) * 1994-07-29 1996-02-16 Toshiba Corp 対話装置及び同装置に適用される操作ガイダンス出力方法
JPH08166866A (ja) * 1994-10-14 1996-06-25 Hitachi Ltd 対話型インターフェースを具備した編集支援システム
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
US6021403A (en) * 1996-07-19 2000-02-01 Microsoft Corporation Intelligent user assistance facility
CA2292959A1 (en) * 1997-05-06 1998-11-12 Speechworks International, Inc. System and method for developing interactive speech applications
JP3965538B2 (ja) * 1998-02-27 2007-08-29 株式会社エクォス・リサーチ エージェント装置
US6246989B1 (en) * 1997-07-24 2001-06-12 Intervoice Limited Partnership System and method for providing an adaptive dialog function choice model for various communication devices
US6370238B1 (en) * 1997-09-19 2002-04-09 Siemens Information And Communication Networks Inc. System and method for improved user interface in prompting systems
JPH11203006A (ja) * 1998-01-20 1999-07-30 Fujitsu Ltd ユーザ状況推定装置
US6085159A (en) * 1998-03-26 2000-07-04 International Business Machines Corporation Displaying voice commands with multiple variables
US6182046B1 (en) * 1998-03-26 2001-01-30 International Business Machines Corp. Managing voice commands in speech applications
US6321198B1 (en) * 1999-02-23 2001-11-20 Unisys Corporation Apparatus for design and simulation of dialogue
US6308157B1 (en) * 1999-06-08 2001-10-23 International Business Machines Corp. Method and apparatus for providing an event-based “What-Can-I-Say?” window
US6397186B1 (en) * 1999-12-22 2002-05-28 Ambush Interactive, Inc. Hands-free, voice-operated remote control transmitter

Also Published As

Publication number Publication date
EP1020789A1 (en) 2000-07-19
CN1261178A (zh) 2000-07-26
FR2788615B1 (fr) 2001-02-16
EP1020789B1 (en) 2017-03-15
JP2000231398A (ja) 2000-08-22
US6751594B1 (en) 2004-06-15
EP1020789B8 (en) 2017-05-17
FR2788615A1 (fr) 2000-07-21

Similar Documents

Publication Publication Date Title
CN1153128C (zh) 具有语音手动用户接口的设备和辅助学习语音指令的方法
US11385861B2 (en) Smart controlling device and method of controlling therefor
CN1230798C (zh) 利用语音识别的选台装置及其控制方法
CN105659318B (zh) 声音识别处理装置、声音识别处理方法以及显示装置
CN103826145A (zh) 显示装置及其控制方法
US20140095175A1 (en) Image processing apparatus and control method thereof and image processing system
CN1749960A (zh) 具有改进的醒目性的活动内容向导执行
CN1604617A (zh) 对接系统和方法、遥控器和遥控器信号发送方法
CN1622055A (zh) 用于移动终端的应用数据管理方法和其中使用的移动终端
CN1916843A (zh) 一种布局和访问用户界面组件的方法和系统
CN108446095A (zh) 图像处理设备、其控制方法、以及图像处理系统
CN100348022C (zh) 电视接收机及包含它的系统
CN1798295A (zh) 用于显示广播节目引导信息的方法及其遥控器
CN1643553A (zh) 可编程遥控器和用于编程可编程遥控器的方法、可读存储器和程序
CN1882146A (zh) 用于发送和接收语音呼叫内容的设备和方法
US20150194167A1 (en) Display apparatus which operates in response to voice commands and control method thereof
CN1838807A (zh) 在空闲屏幕上显示消息的移动通信终端和方法以及使用它们发送空闲屏幕显示消息的方法
KR20150054490A (ko) 음성인식 시스템, 음성인식 서버 및 디스플레이 장치의 제어방법
CN1846455A (zh) 控制装置和控制方法
CN105141994A (zh) 数字电视机顶盒及机顶盒遥控器按键功能的更新方法
CN110402583A (zh) 图像显示设备及其操作方法
CN1402944A (zh) 通信信息方法、其实现系统及其使用的接收机和发射机
CN1314046A (zh) 在显示电视节目及相关文本的方法和装置中使用的数据库
CN101047807A (zh) 显示/响应系统和装置以及显示/响应程序存储介质
CN1933643A (zh) 移动通信终端的影像文件管理方法及移动通信终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: La France

Patentee after: COLOR PRINTING TECHNOLOGY Co.

Address before: La France

Patentee before: THOMSON MULTIMEDIA

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING S.A.

Address before: French Boulogne Billancourt

Patentee before: THOMSON LICENSING S.A.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190301

Address after: Paris France

Patentee after: International Digital Madison Patent Holding Co.

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

Effective date of registration: 20190301

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING S.A.

Effective date of registration: 20190301

Address after: French Boulogne Billancourt

Patentee after: THOMSON LICENSING S.A.

Address before: La France

Patentee before: COLOR PRINTING TECHNOLOGY Co.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20040609