CN1346566A - 用于电话手机的语音识别用户接口 - Google Patents
用于电话手机的语音识别用户接口 Download PDFInfo
- Publication number
- CN1346566A CN1346566A CN00806017A CN00806017A CN1346566A CN 1346566 A CN1346566 A CN 1346566A CN 00806017 A CN00806017 A CN 00806017A CN 00806017 A CN00806017 A CN 00806017A CN 1346566 A CN1346566 A CN 1346566A
- Authority
- CN
- China
- Prior art keywords
- user
- function
- state
- name
- prompting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Abstract
一种在电话中提供响应用户训练的语音指令有限词汇组的用户接口的方法和设备。接口允许用户使用语音指令来执行所有电话手机拨号。另外,用户可以创建和修改语音识别电话簿中的记录,其中,语音识别电话簿中的号码可以通过说出与之相联系的名字来进行呼叫。用户接口提供了语音和LCD相结合的用户提示以及语音输入响应。接口响应用户语音指令,并依照是否匹配先前存储在存储器中的用户训练指令词汇字来执行指令功能。
Description
技术领域
本发明涉及通讯和电信设备。特别是,本发明涉及一种新颖的改进语音识别用户接口以及相关的使用便携式电话的方法,和相关的免提电话附件。
背景技术
用户接口技术一直代表了一个不断前进的领域。技术的革新使得客户所使用的设备例如蜂窝电话可以通过大量的菜单选项得到许多用户可以使用的功能。蜂窝电话通常具有显示用户提示和菜单选项的LCD显示屏。蜂窝电话也具有根据激活菜单而改变功能的软键。软键通常显示在LCD显示屏上。蜂窝电话通常结合了许多特色,包括存储常用呼叫号码在用户定义电话簿中的功能,单键重拨最后号码的功能,先前呼叫号码记忆,以及呼叫者电话号码识别。而且,小的手提蜂窝电话通常可以与附件结合,例如允许用户在他们的车中不用拿起电话就能操作电话的免提汽车套件适配器。
这种不用手拿电话就可以操作电话的功能同时也带来了一些缺点。用户仍然必须盯着电话显示屏获得提示,并且必须拨号和手工按键来查询电话簿。这对于那些一边开车,同时试图浏览电话中可获得的不同菜单的用户来说可能就是一个障碍。本发明通过将一种允许完全免除用手拨号的语音识别用户接口结合入电话手机或免提套件中的方法,来解决这些问题。另外,本发明的方法提供了利用语音识别的额外功能。这种语音识别用户接口可以与标准电话用户接口协同将用户所需的手工按键次数大大减少。
发明内容
本发明是一种新颖的和改进的用于执行语音识别强化电话用户接口的方法和设备。一种用于允许用户通过语音识别来完成拨号功能的方法被揭示。这将使得用户具有真正意义上的免提电话接口。
语音识别用户接口可能通过微处理器上运行的软件代码来实现,或作为一种硬连线设备。语音识别器(VR)可以定义为一种用于在用户和具有语音识别能力的电话之间实现接口的处理和方法。语音识别处理细节本身不是本发明的目的,而且也没有讨论。本发明仅仅处理在用户和具有语音识别能力的电话之间的接口。
在较佳实施例中,揭示了一种方法,用户可以通过说两次激活术语,例如“唤醒”(Wake up)或按手机键,来从待用电话模式进入语音识别模式。在下面所讨论的较佳实施例中,本方法先检测是否先前进行过初始语音训练。如果语音训练已经在这之前进行过,较佳实施例随后进入顶层菜单。然而,如果语音训练没有进行过,本方法就启动训练菜单。
较佳实施例包括两个需要训练的词汇组:基本组和数字组。基本组包括用户指令术语,而数字组包括键盘和拨号功能相关的字。在本较佳实施例中,电话提示用户连续说出训练词汇组中的字。用户被提示重复这些字,并且随后,如果语音识别器判断发音和字匹配,它就存储该字。本训练方法一直持续到目前的词汇组中所有的字都被训练过为止。
在顶层菜单中,本较佳方法允许用户语音指令访问4个功能,并且通过说“休眠”(Sleep),提供了退出语音识别器(VR)的功能。在顶层菜单中,本方法允许用户启动“重拨”(Redial)、“呼叫”(Call)、“语音簿”(Voicebook)指令,或说出事先存储在语音识别器电话簿中的名字。每个顶层菜单中的可能语音指令:“重拨”、“呼叫”、“电话簿”或名字将,在本较佳实施例中,启动相应的功能。
本较佳方法中的重拨功能通过语音指令能使用户始发最后一个拨打过的号码的呼叫。
呼叫功能能使用户通过说出一个语音识别器电话簿中的名字而使用语音指令,或通过语音指令而进入允许电话号码被加入和登录的号码功能,而使用户能开始电话呼叫。在呼叫功能中,本方法首先检测数字组训练是否完成。本方法随后检测如果在语音识别器(VR)电话簿中,有没有号码存在。如果数字组训练没有完成而且VR电话簿是空的,该方法指示VR告知用户这个情况,并且退回到VR模式的顶层菜单。只要VR电话清非空,VR将提示给用户名字。如果用户说出了这个名字,VR开始名字功能。如果数字组训练已经完成,用户可以另外通过说“号码”来进入号码功能。号码功能在本较佳方法中如果数字组训练没有完成就无法获得。相反地,如果数字组训练已经完成,而VR电话簿为空,那么号码功能就是仅有的可以获得的功能。
在号码功能中,本方法提示用户说出电话号码中的数字或要求“呼叫”或“验证”(Verify)。用户被允许键入电话号码,每次一个数字,长度在32个数字之内。本方法允许用户通过说“清除”每次擦除一个键入的错误数字。清除指令会导致最后一个键入的数字被删除。本较佳方法也允许用户通过说“验证”来对输入的电话号码进行验证。如果用户指令是“验证”,VR将读出输入的数字,并随后给出提示键入更多数字。这允许用户在完成整个电话号码输入前验证已输入的数字。“验证”指令可以同样地用在始发一呼叫前对输入的电话号码验证。在数字被初步输入后,用户可以通过说“呼叫”开始电话呼叫。
本方法的名字功能允许用户通过说出与电话号码相对应的名字来重拨VR电话簿中的电话号码。在顶层菜单或呼叫功能中,当用户说出一个名字,VR就会检测在电话簿中的多个名字是否匹配这个名字。如果电话簿中的多个名字匹配用户名字请求,VR编辑一张匹配名字列表,随后询问用户最佳匹配的名字是不是请求的那个。如果用户回答否,VR继续询问下一个最佳匹配是否是请求的名字。VR持续进行询问直到用户认可了匹配或VR的匹配列表结束。如果VR查完匹配列表,VR就会取消名字功能,并返回顶层菜单。如果用户认可某一匹配,VR就当做这里匹配的仅有一个名字而继续进行。如果仅有一个名字匹配,VR就要求确认要呼叫的名字。如果用户确认,VR退出,并开始呼叫。如果用户不确认,VR就取消名字功能,并退回顶层菜单。
本较佳方法允许在顶层菜单访问语音簿功能。一些功能可以通过语音指令被访问,而访问其他的功能需要用户通过手机按键输入。进入语音簿功能之后,VR提示用户说“添加”(ADD)、“删除”(Delete)、“查看”(List)或从按键选项中选取。
查看功能允许用户浏览整个VR电话簿。作为对用户说出在语音簿中的“查看”指令的回应,VR检测VR电话簿是否为空。如果VR电话簿是为空,那么就没有纪录可以浏览。如果VR电话簿是非空,VR就会从VR电话簿中读取名字,并持续到最后一条记录,或VR被用户中断。
用户说出“添加”功能,就能对VR电话簿进行加入操作。如果VR电话簿未满,VR就会询问用户加入的名字。当用户说出名字后,VR就提示用户重复名字。在用户重复名字后,VR首先检测新的名字与指令字是否匹配。如果名字与指令字匹配,用户就会被告知哪个指令字与名字相近,并建议用户说别的名字。VR随后直接回到添加功能的名字输入循环开始的步骤。如果名字不匹配任何一个指令字,VR就检测两次名字的发音是否匹配。如果两个字不匹配,VR告知用户匹配失败,并再尝试一次。在不成功匹配后,VR回到添加功能的最初提示。而成功匹配之后,VR检测手机电话簿(不是VR电话簿)是否包含任意记录。如果手机电话簿为空,VR建议用户使用按键键入电话号码。一旦用户完成电话号码输入,VR告知用户名字添加入了VR电话簿。VR存储号码,并返回语音簿功能。如果手机电话簿非空,VR允许用户使用按键或翻卷浏览手机电话簿寻找分配给名字的号码,来输入电话号码。一旦号码被输入,无论是通过翻卷浏览手机电话簿,还是通过按键输入,用户按下“添加”键就把号码存储在VR电话簿中。VR随后告知用户名字被添加到VR电话簿中。VR保存号码,并返回到语音簿功能。
用户在语音簿功能中通过说出“删除”指令就进入删除功能。VR首先检测VR电话簿中有没有记录。如果VR电话簿中有记录,VR询问用户需要删除的名字。另外,电话上的软键将指示“下一个”(NEXT)。如果用户回应了一个名字,VR首先检测VR电话簿所匹配的多个名字。如果有多个名字匹配,VR就提供匹配名字的列表,决定最佳匹配,并询问用户最佳匹配是否是用户所说的名字。如果用户回答“否”,VR使用下一个最佳匹配继续询问。这个过程一直重复匹配名字列表结束或用户认可匹配。如果所有可能匹配名字都检测过,还没有找到该匹配,VR就返回到删除功能的顶层。如果用户认可了匹配,VR就从存储器中删除名字和号码,并告知用户该名字被删除。如果VR电话簿中只有一个名字匹配,VR询问用户这个是否是用户想删除的名字。如果用户回答“是”,VR告知用户名字已删除,并返回到顶层菜单。如果用户回答“否”,VR返回到删除功能的顶层。
如果电话上的“下一个”软键被按下,VR就从VR电话簿中选取下一个名字,并询问用户是否该名字要删除。VR随后就依照如同用户最初说出名字后的同样的方法继续处理删除过程。
语音簿功能顶层中的按键选项允许用户选择清除VR簿的记录。清除簿选项仅作为按键功能而提供是因为它不是经常使用。这种清除簿功能将清除VR电话簿所有的记录。
训练功能提供了更进一步的对应于基本组训练、数字组训练或重新训练的按键选项。基本组训练和数字组训练已经在上面概述过,并将在下面进一步详细阐述。重训练功能仅允许基本组或数字组中的一部分被重新训练。用户被提示选择对应于基本组或数字组的按键。一旦用户做出了决定,,VR从相应的词汇组中获得第一个字,并询问用户这个字是否是要重训练的字。如果用户同意,VR指示用户重训练该字,并在重训练之后,从词汇组中取出下一个字,并重复步骤直到所有的字都检测过。如果,当询问是否一个字要重训练时,用户回应“否”,VR取出词汇组中下一个字,并重复用新字询问。无论用户是否真的选择重训练它们,当词汇组中的所有字都已经被询问过后,VR告知用户重训练已经完成,并退回到顶层菜单。
免提模式中应答进入呼叫的能力和免提模式中启动呼叫的能力同样重要。本方法通过加入允许语音指令呼叫应答的特性来实现。当有进入呼叫时,VR告知用户有进入呼叫,并询问用户是否应答呼叫。如果用户说“是”呼叫就被应答。如果用户回答“否”,对于这个进入呼叫就没有进一步的语音提醒。
附图说明
本发明的特性、目的和优点将在下面所要进行的结合参考特性说明的附图的详细描述中更加体现出来。
图1示出用户以及具有手机支架或免提组件的电话。
图2A-2B是说明顶层功能流程图,该功能提供访问其他所有功能的入口;
图3A-3B是说明呼叫功能的流程图,该功能提供给用户始发呼叫的接口;
图4A-4C是说明号码功能的流程图,该功能允许用户把所说的电话号码数字提供给呼叫开始。
图5是说明连续清除功能的流程图,该功能可以在呼叫功能中使用来清除输入的电话号码;
图6是说明在本发明顶层功能中驻留的隐藏专家菜单的流程图;
图7A-7B是说明名字功能的流程图,该功能允许用户把所说的与电话号码相联系的名字提供给呼叫开始;
图8是说明重拨功能的流程图,该功能允许用户通过所说的“重拨”来重新拨打最后的号码;
图9A-9B是说明语音簿功能的流程图,该功能允许用户编辑电话号码记录语音簿;
图10A-10C是在语音簿功能中可获得的添加功能流程图,该功能允许用户给VR语音簿添加名字和电话号码;
图11A-11C是在语音簿功能中可获得的删除功能流程图,该功能允许用户删除VR语音簿中的名字和电话号码;
图12A-12B是说明训练功能的流程图,用户利用该功能来访问特定的训练功能;
图13A-13B是说明完整训练功能的流程图,该功能必须被执行,从而能够访问完整的语音识别用户接口功能性;
图14A-14C是重训练功能的流程图,该功能允许用户仅对在基本和数字词汇组中的子字组进行重训练;
图15A-15B是说明进入呼叫应答特性的流程图,该功能提供给用户在完全免提的模式中应答呼叫的能力;
图16是说明处理说话太早机制的流程图,该机制当需要用户语音输入时被应用;
图17是说明系统时间超时处理过程的流程图,当VR系统提示没有及时被用户回应时,该处理过程就发生;和
图18是说明隐含是/否装置的流程图,该装置当需要用户提供是/否回应的时候被应用。
具体实施方式
不同图中的模块可以被看作是表示接口的状态、处理的步骤或所需实现模块相应功能的硬件模块。
参照图1,语音识别用户接口的新特性包括提供给用户70仅使用语音输入80操作电话10的能力。在较佳实施例中,电话10是具有免提组件20的蜂窝手机。当电话10具有免提组件20支架时。电话和免提套件(没有展示)之间的接口允许RF、控制和音频信号通过免提组件。一种典型的蜂窝电话特性在于显示屏152和显示在显示屏152上执行不同功能操作的软键30。另外,通常提及的电话或手机10,包含键盘50和接收用户语音输入80的微型话筒60。电话的功能性通过电话内部接收程序代码和在存储器40(外部不可见)存储信息的微处理器来控制。
参照图2A,当移动电话处于没有号码102的状态等待时,电话显示屏152通常显示标题140、当前的系统日期和时间142,和当前的软键选择144和146之类的信息。语音识别器(VR)处于休眠模式。用户可以进入语音识别器来激活语音操作的电话功能。用户可以通过在步骤103处,按下结束键(END)或说两次“唤醒”(Wake up),来退出休眠模式,并进入VR激活模式。在这点上,步骤104中,VR检测初始训练是否被执行。如果没有,VR进到完整训练700。如果有一部分初始训练被执行过,VR就进入隐藏专家菜单600。隐藏专家菜单600允许用户实现与顶层菜单一样的功能性,而不用等待顶层菜单的提示。仅仅有1.5秒的激活时间的隐藏专家菜单600将在以后进一步讨论。在隐藏专家菜单600的后续步骤表示顶层菜单状态110,其他的菜单或功能在完成或取消它们的处理过程后都会退回到顶层菜单状态。在顶层菜单状态110 VR提示用户,步骤108中,“呼叫、重拨、语音簿或休眠”。VR也会发出提示语音106。手机上的显示屏152指示语音识别开始。另外,手机显示可用训练软键来访问如900(图12A-B)展示的训练功能。
参照图2B,在发出提示音后,VR处理过程进入状态112,并在超时之间等待用户语音输入。如果VR在状态112超时,VR将回到顶层菜单110,并在状态108处再次提示用户说出“呼叫、重拨、语音簿或休眠”指令。VR再次提供提示音106。VR随后回到模块112再次等待用户语音输入。用户可以选择说4个指令中的一个或VR电话簿中记录的名字。可用指令包括呼叫、重拨、语音簿和休眠。重拨指令,步骤122;呼叫指令,步骤126;和语音簿指令,步骤128将引起VR开始执行相应的功能200、400和500,这些功能将在下面讨论。同样,如果用户说了VR电话簿中的一个名字,名字功能300将开始执行。如果用户在步骤130处,说出语音指令“休眠”或按下任意键,VR将退回到等待或休眠模式。开始退出过程的状态如图1中120所示。VR在状态132处,显示“语音识别器已经休眠”,并发出退出音134。手机显示屏152显示“语音识别器已经休眠”。VR随后回到等待状态102。
参照图3A,当用户在顶层菜单110或隐藏专家菜单600说出“呼叫”指令之后,就进入了呼叫功能400。在进入呼叫功能400后,用户立刻被给予1.5秒隐藏专家窗口开启的状态402。这种隐藏专家窗口402与顶层功能100获得的隐藏专家菜单600是不同的。状态402中的隐藏专家窗口允许用户在没有提示的情况下,访问所有的呼叫功能指令。如果用户在1.5秒窗口内没有发出指令,呼叫功能过程就转到VR检测数字训练是否完成的状态404。呼叫功能随后前进到状态406(图3B)或状态408,这取决于数字训练是否完成。在状态406和408,VR都检测在VR电话簿中是否有记录。
如果在VR电话簿中没有记录,并且数字组训练没有完成,呼叫功能过程转到状态434。VR提示说“语音簿为空。”随后从呼叫功能退出,并回到顶层菜单,状态110。这么做是因为如果数字组训练没有执行,并且在VR电话簿中没有记录,用户就不能访问呼叫功能指令。
如果数字组训练没有执行,而VR电话簿非空,用户还不能访问“号码”指令,但“名字”指令可以使用。在这种情况下,呼叫功能过程转到状态410。VR提示说“说出一个名字或说清除来离开呼叫功能。”VR发出提示音106,并转到状态418来等待用户输入。如果在状态418超时先于用户输入发生,VR转到VR检测先前的提示是否被重复的状态420。如果提示没有被重复,VR就返回到状态410。如果提示已经被重复,VR就转到引起功能退出VR的状态120。
参照图3B,如果在VR电话簿中没有记录,但数字组训练已经完成,呼叫功能就转到状态430。VR提示说“语音簿为空。”,并转到号码功能1400(图4A)中的状态1420。因为VR电话簿中没有记录,用户就不能使用“名字”指令,而只能使用“号码”指令。因此,功能流程就直接到号码提示。
如果数字组训练已经完成,而且在VR电话簿中有记录,用户就可以访问呼叫功能中所有的指令。呼叫功能流程转到出现VR提示说“说出一个名字或说出号码或说清除离开呼叫功能”的状态412。VR发出提示音106,并转到状态414等待用户输入。如果在状态414的超时发生在用户输入之前,VR转到VR检测先前提示是否被重复的状态416。如果提示没有被重复,VR回到状态412。如果提示已经被重复,VR就转到引起功能退出VR的状态120。
如果用户回应了在状态414和418中提供的第一或第二回应窗口,呼叫功能流程依据不同的用户指令转到下面三种路径之一:指令“号码”,到状态426;指令“清除”,到状态422或说出VR电话簿中的一个名字,到状态424。如果说出VR电话簿中的一个名字,状态424,VR就转到名字功能300。如果用户说“清除”或按下CLS键,就到状态422,VR取消呼叫功能,并回到顶层菜单110。
参照图4A,如果用户说“号码”,状态426,VR转到号码功能1400。在号码功能1400中,VR首先提供可获得1.5秒隐藏专家窗口的状态1416。这种隐藏专家窗口1416和隐藏专家菜单600或其他功能中的隐藏专家窗口是不同的,并且各自独立。在这个隐藏这专家窗口1416中,用户可以先于听到状态1422的提示,而提供口头的任意号码功能指令。如果隐藏专家窗口1416超时,VR转到号码提示,状态1422。通向状态1422的点1420是当VR电话簿没有记录,但数字组训练已经完成时从呼叫功能退回的VR转到的点。在状态1422中,VR通过“一次说出一个数字。当完成时,说呼叫或验证。”来提示用户。VR发出提示音106,随后转到模块1424等待用户输入。如果用户没有先于输入超时做出回应,VR转到状态1428,来检测先前的提示是否被重复了5遍。如果提示已经被重复了5遍,号码功能转到状态120来退出VR模式。如果提示没有重复5遍,VR返回到状态1422。如果用户在状态1424中先于输入超时回应,VR检测用户输入是指令字还是数字。
如果指令为“验证”,状态1454,在状态1458中VR读出拨打的号码。VR随后转到使VR返回隐藏专家窗口1416的点1410。
参照图4A到4B的底部,如果用户说出数字,状态1430,VR检测数字的最大数目是否已经被输入,状态1432。如果输入的数字数目已经和最大的数字数目相等,在状态1438中,VR提示说“最大数目长度已经达到。完成时说呼叫或验证。”VR随后转到点1410以返回到隐藏专家窗口1416来等待下一个用户输入。如果最大数字数目没有输入,VR,在状态1434,重复用户所说的号码。VR随后转到点1410使VR返回到隐藏专家窗口1416来等待进一步的用户输入。
如果用户回应状态1422的提示是休眠状态1460,VR转到图4B所示的状态1462,并提示说“你说了休眠?”如果用户回应“是”状态1464,VR转到点120退出VR。如果用户在状态回应“否”状态1466,VR转到隐藏专家窗口1416。如果回应是STS或拒绝状态1490,VR转到状态1492,并提示说“你是否说了是?”如果用户回应提示为“是”状态1496,VR转到点120退出VR。如果用户回应“否”或其他STS或拒绝,VR转到点1410返回隐藏专家窗口1416。
参照图4A到4C的底部,如果用户指令是“清除”或用户按下“清除”键,状态1440,VR转到状态1444来检测输入的数字数目是否大于0。如果没有数字被输入,VR,在状态1454中,提示说“没有数字输入。”,并转到点1410返回隐藏专家窗口1416(状态1422)。如果数字事先已输入,VR转到状态1442来检测是否连续的清除指令下达,并且输入数字数目是否大于1。如果有连续的清除指令下达,并且输入数字数目是大于1,VR转到连续清除功能4400,来允许用户清除(如希望的话)整个记录。如果连续“清除”指令没有被下达或只有1个数字输入,VR转到状态1446删除最后一个输入数字,并提示说“已删除”。VR随后回到点1410等待下一用户输入。
如果在状态1450中用户指令是“呼叫”,VR转到状态1452,并检测是否有号码输入。如果没有号码输入,VR前进到状态1454,并提示说“没有号码输入。”随后回到点1420返回用户输入提示。如果号码被输入,如状态1470所示,VR提示说“呼叫”并重复输入的号码。如果用户对提示保持静默或回答“是”,状态1472,VR前进到状态1494,并开始呼叫。如果用户说“否”,状态1474,VR转到点1410返回到隐藏专家窗口1416。如果VR判定用户回应为STS或拒绝,状态1480,VR转到状态1482,并询问“你想呼叫吗?”如果用户回答“是”或保持静默,状态1484,VR转到状态1488,并开始呼叫。如果用户回应为“否”或其他拒绝,状态1486,VR转到点1410返回到隐藏专家窗口1416。
如上面所提到的,连续的“清除”指令经过特殊处理能够允许用户选择清除整个号码。连续清除功能流程图如图5所示。一旦VR判定连续“清除”指令已经输入,VR在状态4410提示说“清除整个号码?”如果用户回答“是”如状态4420所示,VR提示说“所有的数字被清除”,状态4422,并清除当前输入的所有数字。VR随后发出提示音106。VR随后返回点1410到号码功能1400内的隐藏专家窗口1416。
如果,在响应VR询问是否要清除整个电话号码时,用户回答“否”,状态4430,VR在状态4432中提示说“单个数字被清除”,并清除最后输入的数字。VR随后发出提示音106。如果不存在连续清除功能,“清除”指令就会清除单个数字,因此连续清除功能默认这个结果。在这点上,流程和肯定回应所进行的程序步骤是一样的。VR返回到点1410来转到号码功能1400中的隐藏专家窗口1416。
参照图6,隐藏专家菜单600并不是真正的独立菜单,因为它不提供附加的指令和功能性。相反,隐藏专家菜单600允许用户不用等待VR提示就可以输入指令。从图3中可以了解从等待模式状态102开始,通过初始训练判定,状态104,的流程图是从图1中顶层功能流程图得来的。一旦VR判定初始训练已经执行,状态104,隐藏专家菜单600就可以被用户使用。在隐藏专家菜单600中,用户能够先于听到VR提示音而访问顶层菜单中的任意指令。VR激活隐藏专家菜单600的时间仅为1.5秒。如果用户希望等待提示,或如果用户没有察觉到隐藏专家菜单600的存在,VR在状态620中所示的1.5秒响应窗口时间之后,转到顶层菜单110,如状态620中所示。隐藏专家菜单600与其他许多不同功能可获得的隐藏专家窗口是有区别的。每个功能中的隐藏专家窗口允许在各自的功能中不用先听用户提示音,就可以输入。
参照图7A,名字功能300通过用户说出VR电话簿中一条记录的名字而被访问。从顶层功能100或呼叫功能400中,用户在说出VR电话簿301中的一条表项的名字后进入名字功能300。在状态310,VR检测是否有多个名字匹配。
参照图7B,如果有多个名字匹配,VR对这些名字排序以确定最佳匹配。在下一状态330,VR提示说“你说的是(最佳匹配)吗?”(最佳匹配)代表了VR电话簿中VR所确定的最佳匹配的名字。VR也发出提示音106来提示用户需要给出回应。如果用户回应为“否”,如状态332所示,VR转到状态344,来检测是否所有的匹配已经询问过。如果不是所有的匹配被询问过,VR在状态346获得下一个最佳匹配,并用这下一个最佳匹配重复状态330中的提示。如果没有更多的名字,VR取消名字功能300,并回到顶层菜单110。
如果用户,如状态336所示,对多状态330的提示应答“是”,VR转到状态320,状态320中,VR处理匹配名字就如同只找到一个相匹配的名字。如果用户说话太早(STS)或如果用户在状态330对询问的回应是否决,状态334,VR转到状态338,并询问“你说了是吗?”VR随后发出提示音106。如果用户回应状态338中的询问是“否”,如状态342所示,VR前进到状态344来处理状态332中对初始“否”应答的回应。如果用户回应“是”,VR转到状态320。对于其他任何回应,或如果用户不回应而超时,状态348,VR退出名字功能,回到顶层菜单110。
回顾图7A,一旦VR判定有1个匹配名字,VR转到状态320,并提示说“呼叫(名字)”(名字)代表的是VR电话簿中的匹配名字。VR随后对用户回应等待1.5秒。如果用户静默或回应“是”,状态322,VR开始在状态324中呼叫。VR认为用户静默是默示“是”。如果用户回应“否”,如状态326所示,VR在状态370提示说“取消。”VR随后在状态372中取消名字功能300,并退回到顶层菜单110。如果用户回应是STS或拒绝,如状态350所示,VR,在状态352,询问用户“你想呼叫吗?”VR随后发出提示音106。如果用户回答“是”,状态354,VR开始在状态356中进行呼叫。如果用户回应“否”或回应是STS或拒绝,状态358,VR在状态360中提示说“取消。”名字功能300在状态362中被取消,并且VR退回顶层菜单110。
参照图8,用户可以从顶层功能100访问重拨功能200。重拨功能允许用户对最后拨打的号码进行重新拨打。在顶层菜单110中,用户通过说“重拨”来进入重拨功能200。进入重拨功能200之后,VR在状态210处提示用户而说“重拨(最后拨打的号码)”,(最后拨打的号码)代表手机最后所拨打的号码。VR另外还发出提示音106来提示用户需要应答。如果用户回答“否”或按下任意键区中的按键,状态212,VR提示说“取消”状态214。VR取消重拨功能,并回到顶层菜单110。如果用户回答“是”或保持静默,状态216,VR开始呼叫,状态218。如果VR检测到STS回应或如果用户回应是拒绝,状态220,VR转到状态222,并询问用户“你想呼叫吗?”VR随后发出提示音106。用户做出“否”应答,状态224,引起VR转到状态214,在状态214中,VR提示说“取消”并取消重拨功能。VR随后返回顶层菜单110。如果用户回应“是”或保持静默,状态226,VR在状态218开始呼叫。别的STS或拒绝,状态228,引起VR转到状态214,在状态214中,VR提示说“取消”并取消重拨功能。VR随后返回顶层菜单110。
参照图9A,用户可以从顶层功能100访问语音簿功能500。语音簿功能500允许用户添加和删除VR语音簿中的记录以及指令VR读取VR电话簿的记录。后一个特性允许用户以免提方式浏览整个VR电话簿。从顶层菜单110,用户通过说“语音簿”进入语音簿功能500。一旦用户进入语音簿功能500,用户有1.5秒的时间可使用隐藏专家窗口502。隐藏专家窗口502与顶层功能100中可用的隐藏专家菜单600不同且各自独立的。这个隐藏专家窗口仅仅在语音簿功能500中被激活,并允许用户不用等待用户提示,就能访问语音簿的所有指令。如果用户在隐藏专家窗口502的时间帧中没有应答,VR就转到语音簿用户提示510。在语音簿用户提示510,VR提示说“列表、添加或删除或说清除来离开语音簿。”随后VR发出提示音106。另外,电话显示“清除簿”键盘选项514。
如果用户按下对应于“清除簿”选项的按键,状态520,VR前进到状态522,并控制手机显示屏显示对用户的询问“擦除所有语音簿记录?”用户可利用软键523和525代表的“是”和“否”来操作。如果用户选择“是”软键,状态524,手机显示屏152显示“所有语音簿中的记录已被擦除。”VR随后转到状态528,并提示说“语音簿为空。”VR随后返回顶层菜单110。如果用户选择“否”软键,状态526,VR取消语音簿功能,并返回顶层菜单110。
如果用户回应语音簿用户提示而说出“清除”或按下CLR键,状态512,VR取消语音簿功能,并返回顶层菜单110。用户回应为“添加”时,状态532,将引起VR启动添加功能5200。类似,用户回应为“删除”,状态530,将引起VR启动删除功能5300。
如果用户回应语音簿用户提示510为说“列表”,状态5100,VR首先检测VR电话簿是否为空,状态5110。如果VR电话簿为空,VR在状态5112中提示说“语音簿为空”并返回隐藏专家窗口502。
参照图9B,如果VR电话簿非空,VR在状态5114提示说“簿记录:(名字1)…(最后名字)”其中(名字1)代表VR电话簿中的第一个名字,而最后名字代表VR电话簿中的最后一个名字。另外,手机显示屏152提供了软键表示“更多”5116和“返回”5118。如果用户按下“更多”软键5116,VR将前进并读取下一个名字。如果用户按下“返回”键5118,VR将开始从第一记录中读取名字。若用户保持静默,状态5120,VR将转到状态5122,并继续从VR电话簿中列出名字,直到最后的记录。一旦VR读取最后的记录,状态5124,VR提示说“没有更多的记录”并返回到先于隐藏专家窗口502的点。
如果,当VR在罗列语音簿记录的时候,VR侦测到STS,VR用户输入拒绝,或用户说话,状态5130,VR转到状态5132,并询问“你还想继续听记录吗?”如果用户回应“是”或保持静默,状态5134,VR就读取语音簿中的下一条记录。如果用户回应“否”,状态5136,VR返回到先于隐藏专家窗口的点506。如果VR侦测到别的STS或拒绝,状态5140,VR在状态5142中提示说“你说过是吗?”如果用户回应“是”,状态5144,VR读取语音簿中下一条记录,状态5150。如果用户回应“否”,状态5146,VR返回到先于隐藏专家窗口502的点506。
如果在语音簿列表中,用户回应指令为“休眠”,状态5160,VR前进到状态120以退回到等待模式102。
参照图10A,用户可以通过在语音簿功能用户提示510处说“添加”来进入添加功能。当第一次进入添加功能,VR检测记录的最大数目是否达到,状态5210。如果存在记录的最大数目,VR转到状态5212,并提示说“语音簿已满。”随后VR退出添加功能5200,并回到顶层菜单110。
如果语音簿中有多余空间,VR转到状态5220,并提示说“要添加的名字。”VR随后发出提示音。在提示后,VR在状态5222等待用户输入。如果在超时前没有用户输入,VR启动系统超时程序1200。如果用户在超时之前说出一个名字,状态5224,VR在状态5234中检测该名字是否和指令字匹配。VR不允许用户将与指令字匹配的名字保存,因为在处理字的时候会产生混淆的结果。如果该名字匹配指令字,在状态5250中VR提示说“该名字匹配字:(字)太相近。”其中(字)代表VR判定与用户希望添加的名字匹配的指令字。VR也将发出提示音106,来告知用户需要回应。VR随后返回状态5220来提示新用户回应。
一旦一个满意的名字被输入,VR通过在状态5230中提示说“再说一次”来提示用户重复名字。VR也发出提示音106。参照图10B,VR随后在状态5232等待用户重复名字。如果用户没有先于超时回应,VR就启动超时程序1200。
即使名字不匹配任何指令字,用户的两次发音也必须匹配。VR在状态5240检测两次用户发音的匹配性。如果两次发音不匹配,VR转到状态5242,并提示说“字匹配失败,请重试。”VR随后回到状态5220来提示用户说新的名字。如果两次用户发音匹配,VR允许用户输入对应于该名字的电话号码。
VR允许通过键盘或从手机电话簿中存储的号码中复制过来的电话号码来输入电话号码。在给出用户从手机电话簿中复制号码的选项前,VR在状态5260中检测手机电话簿中是否有任何存储过的号码。
参照图10C,如果在手机电话簿中没有存储的号码,VR转到状态5262,并提示说“使用键盘输入电话号码。完成时,按下添加。”在这点上,用户仅被允许使用键盘输入电话号码。当用户输入电话号码时,输入的号码被显示在手机显示屏152上。另外,手机显示屏显示可用的“添加”软键5292。一旦用户输入电话号码,用户必须按下“添加”软键5292来在语音簿中存储记录。在用户按下“添加”软键5292后,VR转到状态5280,并提示说“(名字)被添加。”其中(名字)对应于先前提示用户所发的音。VR随后回到语音簿功能500中的隐藏专家窗口502。
如果在状态5260,VR判定手机电话簿中有记录,VR转到状态5270,并提示说“使用键盘输入电话号码。完成时,按下添加。”注意这个语音提示与手机电话簿中没有记录的情况下VR的语音提示是相同的。而手机显示屏152允许用户翻卷浏览手机电话簿中的记录。如果用户选择使用键盘按键输入电话号码,VR根据状态5264继续前进。而用户可以选择翻卷浏览手机电话簿,状态5272,并显示对应的电话号码。一旦用户确认手机电话簿中的记录,用户可以按下〔查看〕软键5252来显示对应的电话号码。如果记录不是用户所希望添加的,用户可以按下〔返回〕软键5254以返回到先前的手机电话簿显示屏152。当在浏览显示屏152时,用户可以通过按下〔添加〕软键5256将手机电话簿中的电话号码添加到VR电话簿中。一旦用户按下〔添加〕软键5256,VR转到5280,并提示说“(名字)被添加。”VR随后返回语音簿功能500中的隐藏专家窗口502。
参照图11A,用户同样被允许从VR电话簿中删除记录。用户在语音簿功能用户提示510处通过说“删除”可以进入删除功能5300。进入删除功能后,VR首先检测VR电话簿是不是为空,状态5310。如果VR电话簿已经为空,就没有记录可以删除。VR在状态5312提示说“语音簿为空。”VR随后回到顶层菜单110。如果VR电话簿中有记录,VR转到状态5320,并提示说“要删除的名字。”VR随后发出提示音106。VR在状态5322等待用户语音或按键输入。如果没有用户输入,并且系统超时,VR转到状态5324,在那里VR检测提示是否被重复。如果提示没有被重复,VR转到状态5328,并提示说“说出一个要删除的名字或使用〔下一个〕键来听更多的名字。”VR也发出提示音106。VR随后返回到状态5322,等待用户输入。如果系统第二次超时,VR取消删除功能,并返回顶层菜单110。
用户可以通过说出名字或按下〔下一个〕软键5314来回应先前的提示。如果用户按下〔下一个〕键5314,如状态5380所示,VR前进到状态5332,状态5332将参照图11C在下面讨论。
参照图11B,如果用户如状态5326所示说出一个名字,VR转到状态5330,并检测是否有多个名字匹配。当有多个名字匹配时,VR对多个名字的匹配处理方法和VR在名字功能300中处理多个名字匹配的方法十分相同。如果多个名字匹配,VR在状态5340中提示说“你说的是(最佳名字匹配)”其中(最佳名字匹配)代表VR电话簿中VR判定的最佳匹配。VR也发出提示音106来提示用户需要回应。如果询问的名字不是用户所说的,用户回应“否”,如状态5342所示。VR随后转到状态5344来检测是否所有可能的匹配都被询问过。如果不是所有的名字匹配都被询问过,VR在状态5346获得下一个最佳名字匹配,随后返回状态5340来用下一个最佳匹配重复提示。而如果没有更多的名字,VR转到状态5390(参照图11A),并提示说“说出一个要删除的名字或按下〔下一个〕键来听更多的名字。”VR发出提示音106来提示用户需要输入。VR随后返回状态5322等待用户输入。如果询问的名字和用户说的名字相同,用户回应“是”,如状态5348所示。VR随后前进到点5394,在那里VR转到状态5372,并提示说“(名字)已被删除。”在状态5372之后,VR返回到语音簿功能500中的隐藏专家窗口502。
如状态5350所示,如果用户说话太早(STS)或如果用户在状态5340处回应询问被拒绝,VR转到状态5352,并询问“你说过是吗?”VR发出提示音106来提示用户需要输入。如果用户回应“否”,状态5356,VR转到点5392来如,框5342那样处理初次对“否”回答的响应。如果用户应答“是”,VR通过前进到点5394来处理状态5348对初始“是”应答的回应。对于其他任何回应,如状态5358所示,VR取消删除功能,并返回顶层菜单110。
参照图11C,如果VR判定VR电话簿中仅有一个名字与用户输入的名字匹配或如果用户按下〔下一个〕软键,VR转到状态5332,并提示说“(名字)删除?”其中(名字)对应于在VR电话簿中VR确定的匹配名字。VR同时发出提示音106来告知用户需要应答。VR随后在状态5360等待用户输入。如果没有用户回应,并VR超时,VR返回到状态5332,来重复提示。如果用户回应“是”或如果用户按下〔擦除〕软键5398,如状态5370所示,VR转到状态5372,并提示说“(名字)已删除。”VR随后返回到语音簿功能500中的隐藏专家窗口502。如果用户回应“否”,如状态5376所示,VR返回到状态5320(图11A)来提示用户对名字进行删除。如果用户按下〔下一个〕软键5399,如状态5378所示,从VR转到状态5382来从VR电话簿中检索下一个名字。VR随后回到状态5332来用VR电话簿中的下一个名字提示用户。如果用户回应的是STS或拒绝,如状态5362所示,VR转到状态5364,并提示说“你说过是,删除(名字)吗?”VR随后发出提示音106。如果用户回应这个询问为“是”,状态5374,VR转到状态5372,就像用户是在状态5370中回应“是”一样,使用相同的过程删除记录。如果用户回应“否”或别的STS或拒绝,状态5366,VR转到状态5368,提示说“取消”,并返回状态5320来提示用户删除一个名字。
参照图12A,用户仅能通过按在顶层功能100中的“训练”软键150来访问训练功能。训练功能900的操作只能通过响应用户键盘按键,这是因为在没有进行最初的训练而想通过语音指令访问训练功能是不可能的。一旦用户进入训练功能900,VR转到状态902,在其中手机显示屏152显示了用户可以选择训练的两个词汇组,基本组906和数字组908。基本组由指令字组成,包括:呼叫、重拨、是、否、添加、删除、语音簿、休眠、唤醒、清除、列表和应答。数字组由键盘和与拨号相关的字,包括:0、1、2、3、4、5、6、7、8、9、oh、星号、磅、验证和号码。无论用户选择基本组,状态910,或数字组,状态920,用户都有选择进行完整训练或重训练的权利。手机显示屏152显示训练选项942和重训练选项944。手机同时也显示〔退出〕软键946。如果用户选择训练词汇组,状态914,VR开始完整的训练700。如果用户仅选择重训练词汇组,状态916,VR开始重训练功能800。用户可以决定通过选择〔退出〕软键946来不执行训练功能。这种选择如状态924所示。如果用户按下〔退出〕软键946,VR前进到点120,并退出VR,转回到等待状态102。
参照图12B,用户也可以通过一直按下“0”键,状态930,来擦除所有的语音指令和VR电话簿记录。这个选项是隐藏的,并没有在手机显示屏上显示。如果用户一直按下“0”键,VR转到状态932,在其中手机显示950“擦除语音指令和簿记录”并提供“是”和“否”软键选择,952和954。如果用户按下“是”软键,状态936,VR转到状态938,在其中VR擦除所有的VR指令字和所有VR电话簿中的记录。VR随后前进到点120来退出语音识别模式。如果用户按下“否”软键,状态934,VR前进到点120,并不提示任何内容而退出语音识别模式。
参照图13A,通过训练功能900或如果没有进行过训练(参照图1,104)而自动进入VR的话,就会访问完整训练功能700。在完整训练功能700中,VR首先检测初始的训练有没有完成,状态702。如果初始训练没有进行过,VR默认训练基本组,状态704。手机显示屏显示“基本组”作为标题762。如果从训练功能900进入完整训练功能700,训练功能900中所选择的词汇组在手机显示屏152上作为标题762被显示。手机显示屏152也同时显示〔退出〕软键764。如果用户选择〔退出〕软键764,VR在状态706提示说“语音识别器进入休眠,”VR随后退出语音识别模式,转为等待模式102。
词汇组被确定后,在状态710,VR提示说“跟随语音指示开始训练”。VR在状态712随后提示说“读出字(字)”其中(字)代表正在训练的词汇组中的第一个字。VR发出提示音106告知用户需要回应。VR随后在状态716等待用户输入。如果系统先于用户输入而超时,VR退回到状态712来重复提示。
参照图13B,如果用户回应提示,VR要求用户重复该字。VR在状态720提示说“再说一次。”VR随后发出提示音106。VR在状态724等待用户重复该字。如果VR先于用户输入超时,VR退回到状态720来重复“再说一次”提示。如果用户回应,VR在状态726比较用户的两次发音来检测它们是否匹配。如果两次发音在状态740不匹配,提示说“字匹配失败。”VR随后退回到状态712来对相同字的重复训练程序。如果VR确定两次发音匹配,VR在存储器中保存该字,随后在状态728中检测在词汇组中所有的字是否都被训练过。如果词汇组中并不是所有的字都被训练过,VR就检取词汇组中下一个字,状态732。VR随后退回到状态712,并对词汇组中下一字重复训练程序。一旦词汇组中所有的字都被训练过,VR转到状态730,并提示说“(词汇组)训练完成。语音识别现在激活。”术语(词汇组)对应于当前被训练的词汇组,基本或是数字的。VR随后退回顶层菜单110。
参照图14A,从训练功能900中可以访问重训练功能800。重训练功能800允许用户重训练词汇组中的任意部分。进入重训练功能,VR提示说“跟随语音指示开始训练。”状态802。用户有许多键盘选项。用户可以按下结束键或〔退出〕软键870,状态860,来到达点120以退出VR。用户可以按下清除键,状态862,来退回到先前在训练功能中的显示,状态864。其他任意按键按下,状态866,不会导致有功能操作,状态868。
如果用户没有选择任何引起VR退出重训练功能800的按键按下,VR在状态810中检取进行重训练的词汇组的第一个字。VR转到状态812,并提示说“(字)重训练这个字?”在询问中,(字)代表在被重训练的词汇组中当前的字。VR随后发出提示音106来告知用户需要回应。如果用户回应“否”或按下“否”软键874,如状态814所示,VR就检取词汇组中下一个字,状态838,并退回到状态812的提示。如果用户回应“是”或按下“是”软键872,如话筒816所示,VR就开始重训练该字。VR转到状态820,并提示说“说出字(字)”随后VR发出提示音106。VR随后在状态822中等待用户输入。如果用户先于系统超时没有做出回应,VR启动系统超时程序1200。
参照图14B,如果用户先于系统超时回应,VR在状态824通过“再说一次”要求用户重复该字。在要求后,VR发出提示音106。VR在状态826等待用户重复该字。如果从这点开始的系统时间先于用户回应而超时,VR启动系统超时程序1200。如果用户先于系统超时回应,VR在状态828中确认两次发音是否匹配。如果两次发音不匹配,VR转到状态832,并提示说“字匹配失败,请重试。”VR随后退回到状态820提示用户对同一字重训练。如果两次发音匹配,VR转到状态830,并提示说“(字)已被重训练。”手机显示屏152显示软键“下一个”和“完成”882和884。
参照图14C,如果用户选择“完成”软键,状态850,VR转到状态852,并提示说“重训练完成。”VR随后退回到顶层菜单110。如果用户选择“下一个”软键,状态834,VR在状态836检测当前词汇组中所有的字是否都被重训练过。如果不是所有的字都被重训练过,VR退回到状态838来取得词汇组中下一个用来重训练的字。如果词汇组中所有的字已经被重训练过,VR转到状态852,提示说“重训练完成”,并退回到顶层菜单110。在这点上有一个没有显示或提示的指令可以被用户使用,就是“休眠”指令。如果用户发出“休眠”指令,状态840,VR先保存对当前词汇组的任何改动,状态842,并随后回到顶层菜单110。
参照图15A,用户可以使用语音指令应答进入呼叫。当电话接收到进入呼叫时,VR首先检测电话是否处于自动应答模式,状态1010。如果电话处于自动应答模式,对VR来说就没有必要接收用户回应,状态1012。而是,同没有VR系统的电话一样,电话进行自动应答操作。
VR随后检测基本组训练是否完成,状态1002。没有经过基本训练,VR将不能识别用户语音指令。因而,如果基本训练没有执行,系统转到状态1004,并且电话不能开始VR应答。而是电话仅仅如同缺少VR的电话一样,进行振铃提示。如果基本训练已经完成,VR依据进入呼叫是否是漫游呼叫来回应。如果进入呼叫不是漫游呼叫,VR在状态1008发出简短的振铃声,随后提示说“进入呼叫,应答吗?”如果进入呼叫是漫游呼叫,VR在状态1008发出简短的振铃声,随后提示说“进入漫游呼叫,应答吗?”无论提示说什么,VR都发出提示音106来告知用户需要回应。
参照图15B,VR在状态1020等待用户回应。如果用户没有回应,VR转到状态1032来检测提示是否重复了两次。如果提示没有被重复两次,VR在状态1030提示说“进入(漫游)呼叫。”仅当进入呼叫是漫游呼叫时,VR才提示字“漫游”。VR随后退回到框1020等待用户回应。如果在两次重复提示之后,用户还是没有回应,VR提示说“未接听呼叫”,状态1034。VR随后退回到等待状态102。
如果用户对任何进入呼叫提示的回应是“是”或“应答”,或如果用户按下任意配置为应答呼叫的按键,状态1022,电话就应答进入呼叫,状态1026。VR随后发出呼叫应答音1036来提示用户进入已经被应答。
另外,如果用户对进入呼叫提示回应为“否”,或如果用户按下任何配置为使进入警告静默的按键,状态1024,呼叫没有应答,并且没有进一步警告提供给这个特定的呼叫,状态1028。
如果VR检测到STS或拒绝,状态1040,VR转到状态1042,并提示说“你说过是吗?”如果用户回应“否”,状态1046,VR转到状态1048,并停止进入警告。如果用户回应“是”,状态1050,VR应答进入呼叫,状态1052,随后发出呼叫应答音1036。如果其他STS或拒绝发生,状态1044,VR退回到点1006来重复进入呼叫提示。
参照图16,VR加入了说话太早(STS)程序1100来处理用户回应太早或与VR提示重叠的情况。如果STS程序不存在,VR将产生更多的输入拒绝,因为VR仅能分析发生在当回应窗口开启时的用户回应。因为当STS发生时,仅有一部分的用户回应被分析,VR不能可靠地确定用户所说的字。STS程序在用户需要回应的绝大多数情况下都存在。即使标准STS程序没有被使用,VR也通常加入有STS程序的修改版本。STS程序1100在VR提示用户回应的情况下是有效的,状态1102。VR通常发出提示音106来告知用户需要回应。如果VR侦测到STS,状态1104,VR转到状态1106,在其中在STS发生后1秒VR仍然保持静默,来允许用户回应。VR随后前进到状态1120,并重复先前的提示。VR再次发出提示音106来提示用户需要回应。VR在状态1108等待有效用户回应。如果用户提供了有效回应,VR转到状态1110,并执行功能中的指令。如果由于其他的STS,VR不能确定所说的字,系统在状态1122保持1秒的静默。VR再次重复先前的提示,状态1132,并再次发出提示音106。如果在第二次提示之后,还有其他STS、拒绝或没有用户回应,状态1124,VR就不再尝试纠正用户。取而代之,VR取消了激活的功能,并退回到顶层菜单110。如果用户回应没涉及STS或拒绝,状态1126,VR就按命令继续前进,状态1130,并退回到利用STS程序的功能中的点。
参照图17,VR加入了系统超时功能1200来处理VR需要用户回应而没有回应的情况。当没有用户回应,系统超时功能1200给用户另外一个机会回应而不是取消激活的功能。VR对大多数提示都使用系统超时功能1200,但有时也处理功能流程图中特定的输入超时。VR在不同的系统超时功能1200激活的情况下,提供了开始的提示和提示音106,状态1202。用户被提供了2秒回应窗口,状态1204。如果用户回应,VR转到状态1206,执行指令,并返回到功能。如果用户在2秒回应窗口内没有回应,VR重复初始提示,状态1210,并重复提示音106。用户又被给予2秒回应窗口,状态1212。如果用户回应,VR转到状态1206,执行指令,并返回到功能。如果用户没有回应第二次提示,VR前进到点120,并退出VR,转到等待状态102。
参照图18,VR加入了隐含是/否装置1300来处理用户对询问的静默,将其作为“是”回应。这种隐含是/否装置1300,当VR预期从用户那里得到“是”的回应时,被有选择地用于用户接口。隐含是/否装置1300常被用于VR从用户接收指令,状态1302,并且随后寻找指令确认,状态1304。在1.5秒的用户回应窗口(没有描述),可能的用户回应包括静默,状态1310、“是”状态1320、“否”状态1330,以及STS或拒绝,状态1340。如果用户保持静默,状态1310,VR认为这是隐含“是”,状态1312。VR转到状态1314,并执行功能。如果用户应答“是”,状态1320,系统执行功能,状态1322。如果用户应答“否”,状态1330,功能在状态1332中被取消,并且VR退回到顶层菜单110。如果回应是STS或拒绝,状态1340,VR转到状态1342,其中它提示用户说“你说过是了吗?”VR发出提示音106来告知用户需要回应。用户随后给予另一个回应窗口。如前所述,如果用户回应“是”,状态1346,系统执行功能,状态1346。同样,如果用户回应“否”或如果用户回应是其他的STS或拒绝,状态1350,功能被取消,状态1352,并且VR退回到顶层菜单110。
前面所述的较佳实施例是为了让本领域中的技术人员能够制造和使用本发明而提供的。本领域的技术人员对这些实施例可以做出轻易的修改,而且在不必使用发明性机制的情况下,这里定义的普通原理也可以被应用到其他实施例上。虽然,本发明并不局限于这里所示的实施例,但其所对应的最大范畴与这里所揭示的原理和新颖特性是一致的。
Claims (14)
1、一种用于为电话提供语音识别用户接口的方法,其特征在于,所述方法包括下述步骤:
(a)提示用户语音输入;
(b)在输入响应时间窗口监控所述用户语音输入;
(c)接收所述用户语音输入;和
(d)执行对应于该用户输入的预定功能。
2、如权利要求1所述的方法,其特征在于,所述提示用户输入的步骤包括:
在电话显示屏上显示提示。
3、如权利要求2所述的方法,其特征在于,所述提示用户输入的步骤进一步包括:
提供一个声响提示。
4、如权利要求1所述的方法,其特征在于,所述监控用户输入的步骤进一步包括:
对用户键盘输入进行监控。
5、如权利要求1所述的方法,其特征在于,所述提示用户输入的步骤包括:
提供一个声响提示。
6、如权利要求1所述的方法,其特征在于,所述接收用户语音输入步骤包括:
将用户语音输入与存储在存储器中预先由用户训练的语音输入有限词汇组相比较;
当语音输入与有限词汇组中预先由用户训练的任何一个语音输入都不匹配时,拒绝用户语音输入;和
当语音输入与有限词汇组中预先由用户训练的任何一个语音输入匹配时,接受用户语音输入。
7、一种用于为电话提供语音识别用户接口的方法,其特征在于,所述方法包括下述步骤:
提供一个可以访问所有语音识别功能的顶层菜单;
所述语音识别功能包括:
呼叫功能;名字功能;进入呼叫功能;
提供呼叫功能,由此通过说出的电话号码数字序列以及伴随的指令字,来开始电话呼叫;
提供名字功能,由此通过说出预先储存在语音识别电话簿中的一个名字,来开始电话呼叫;而
提供进入呼叫功能,由此提示用户有进入呼叫,并且用户可以使用语音指令,来应答进入呼叫。
8、如权利要求7所述的方法,其特征在于,进一步包括:
提供重拨功能,所述重拨功能就是通过说出对应于重拨功能的指令字,来开始电话呼叫,所述电话呼叫是使用对应于最后一个被呼叫的号码的电话号码来进行的呼叫。
9、如权利要求8所述的方法,其特征在于,进一步包括:
提供语音簿功能,在其中:
如果用户说出对应列表功能的指令字,语音识别电话簿中的记录就会读回给用户;
在语音簿功能中,用户可以通过说出对应添加功能的指令字来访问添加功能,添加记录到语音识别电话簿中;并且
在语音簿功能中,用户可以通过说出对应删除功能的指令字来访问删除功能,删除语音识别电话簿中的记录。
10、如权利要求9所述的方法,其特征在于,进一步包括:提供训练功能,在其中:
用户可以训练语音识别用户接口的完整词汇组;并且
用户可以选择仅仅对语音识别用户接口的完整词汇组中的部分进行重训练。
11、一种实现语音识别接口的设备,其特征在于,所述设备包括:
电话;和
语音识别接口;
所述语音识别接口包括:
用于提示用户语音输入的装置;
用于监控输入响应窗口中用户语音输入的装置;
用于接收用户语音输入的装置;和
用于执行对应于用户语音输入的预定功能的装置。
12、如权利要求11所述的设备,其特征在于,所述用于提示用户语音输入的装置包括:
用于显示提示的装置;和
用于提供声响提示的装置。
13、如权利要求12所述的设备,其特征在于,所述接收用户语音输入的装置包括:
用于将用户语音输入与预先由用户训练的语音输入有限词汇组相比较的装置;
用于当语音输入与有限词汇组中预先由用户训练的任何一个语音输入都不匹配时,拒绝用户语音输入的装置;和
用于当语音输入与有限词汇组中预先由用户训练的任何一个语音输入匹配时,接受用户语音输入的装置。
14、一种实现语音识别接口的设备,其特征在于,所述设备包括:
电话;和
语音识别接口;
所述语音识别接口包括:
用于提供一个可以访问所有语音识别功能的顶层菜单的装置;
用于提供呼叫功能的装置,由此,通过说出的电话号码数字序列以及伴随的指令字,来开始电话呼叫;
用于提供名字功能的装置,由此,通过说出预先储存在语音识别电话簿中的一个名字,来开始电话呼叫;
用于提供重拨功能的装置,由此,通过说出对应于重拨功能的指令字,来开始电话呼叫,所述电话呼叫是使用对应于最后一个被呼叫的号码的电话号码来进行的呼叫;
用于提供语音簿功能的装置,由此:
如果用户说出对应列表功能的指令字,语音识别电话簿中的记录就会读回给用户;
在语音簿功能中,用户可以通过说出对应删除功能的指令字来访问删除功能,删除语音识别电话簿中的记录;和
用于提供进入呼叫特性的装置,由此,提示用户有进入呼叫,并且用户可以使用语音指令,来应答进入呼叫。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/246,499 | 1999-02-08 | ||
US09/246,499 US6449496B1 (en) | 1999-02-08 | 1999-02-08 | Voice recognition user interface for telephone handsets |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1346566A true CN1346566A (zh) | 2002-04-24 |
CN1173541C CN1173541C (zh) | 2004-10-27 |
Family
ID=22930933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB008060177A Expired - Lifetime CN1173541C (zh) | 1999-02-08 | 2000-02-08 | 用于电话手机的语音识别用户接口 |
Country Status (12)
Country | Link |
---|---|
US (1) | US6449496B1 (zh) |
EP (1) | EP1151594B1 (zh) |
JP (1) | JP2002536917A (zh) |
KR (1) | KR100616787B1 (zh) |
CN (1) | CN1173541C (zh) |
AT (1) | ATE445285T1 (zh) |
AU (1) | AU2986600A (zh) |
BR (1) | BR0008078A (zh) |
CA (1) | CA2362053C (zh) |
DE (1) | DE60043098D1 (zh) |
HK (1) | HK1043460B (zh) |
WO (1) | WO2000046969A1 (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7177670B2 (en) | 2002-10-22 | 2007-02-13 | Lg Electronics Inc. | Mobile communication terminal provided with handsfree function and controlling method thereof |
CN1306470C (zh) * | 2003-12-04 | 2007-03-21 | 乐金电子(中国)研究开发中心有限公司 | 便携终端机的语音识别方法 |
CN100426823C (zh) * | 2003-04-11 | 2008-10-15 | 乐金电子(中国)研究开发中心有限公司 | 在通话中传送检索电话号码的方法 |
CN100452863C (zh) * | 2006-02-16 | 2009-01-14 | 华为技术有限公司 | 一种可视电话控制方法及设备 |
CN100463576C (zh) * | 2004-10-10 | 2009-02-18 | 英华达(南京)科技有限公司 | 导向语音个人移动通讯装置及其处理方法 |
WO2010124478A1 (zh) * | 2009-04-30 | 2010-11-04 | Sheng Yongxiang | 用户识别系统中语音管理用户的装置及方法 |
CN101083809B (zh) * | 2006-06-01 | 2010-12-01 | 三星电子株式会社 | 使用语音识别来改变操作模式的移动终端及方法 |
CN101976186A (zh) * | 2010-09-14 | 2011-02-16 | 方正科技集团苏州制造有限公司 | 一种计算机语音识别方法及其计算机 |
CN102782459A (zh) * | 2009-09-11 | 2012-11-14 | 诺沃迪吉特公司 | 使用人类呼吸控制设备的用户界面的方法和系统 |
CN101557432B (zh) * | 2008-04-08 | 2013-06-19 | Lg电子株式会社 | 移动终端及其菜单控制方法 |
CN103185599A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 一种车载端数据处理系统及地理信息数据处理平台 |
CN103531201A (zh) * | 2013-09-29 | 2014-01-22 | 上海云视科技有限公司 | 终端语音命名唤醒方法和系统 |
CN103888587A (zh) * | 2012-12-19 | 2014-06-25 | 中国移动通信集团公司 | 一种唤醒终端的方法、dsp芯片及终端 |
CN104078042A (zh) * | 2013-03-25 | 2014-10-01 | 联想(北京)有限公司 | 一种电子设备及一种信息处理的方法 |
US8958848B2 (en) | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
US9753533B2 (en) | 2008-03-26 | 2017-09-05 | Pierre Bonnat | Method and system for controlling a user interface of a device using human breath |
Families Citing this family (108)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7644282B2 (en) | 1998-05-28 | 2010-01-05 | Verance Corporation | Pre-processed information embedding system |
JP2000244625A (ja) * | 1999-02-23 | 2000-09-08 | Nec Saitama Ltd | 携帯電話機における音声認識起動方法及び音声認識携帯電話装置 |
US7260187B1 (en) * | 1999-05-11 | 2007-08-21 | Verizon Services Corp. | Voice response apparatus and method of providing automated voice responses with silent prompting |
JP3847624B2 (ja) * | 1999-07-28 | 2006-11-22 | 三菱電機株式会社 | 携帯電話機 |
US6737957B1 (en) | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
JP3570332B2 (ja) * | 2000-03-21 | 2004-09-29 | 日本電気株式会社 | 携帯電話装置及びその着信メロディ入力方法 |
US6661879B1 (en) * | 2000-07-19 | 2003-12-09 | Xtend Communications Corp. | System and method for recording telephonic communications |
AU2002246550A1 (en) * | 2000-11-30 | 2002-08-06 | Enterprise Integration Group, Inc. | Method and system for preventing error amplification in natural language dialogues |
DE60008893T2 (de) * | 2000-12-14 | 2004-09-09 | Telefonaktiebolaget L M Ericsson (Publ) | Sprachgesteuertes tragbares Endgerät |
US7400712B2 (en) * | 2001-01-18 | 2008-07-15 | Lucent Technologies Inc. | Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access |
US20020097843A1 (en) * | 2001-01-19 | 2002-07-25 | Ivoice.Com, Inc. | Speech activated telephone device for connection to existing telephone |
GB0103053D0 (en) * | 2001-02-07 | 2001-03-21 | Nokia Mobile Phones Ltd | A communication terminal having a predictive text editor application |
US20020137553A1 (en) * | 2001-03-22 | 2002-09-26 | Kraemer Tim D. | Distinctive ringing for mobile devices using digitized user recorded audio message |
US20020137470A1 (en) * | 2001-03-23 | 2002-09-26 | Baron Jason C. | Method and system for multiple stage dialing using voice recognition |
WO2002087202A1 (en) * | 2001-04-19 | 2002-10-31 | British Telecommunications Public Limited Company | Voice response system |
US6892081B1 (en) * | 2001-05-31 | 2005-05-10 | Nokia Corporation | Mobile terminal and method of operation using content sensitive menu keys in keypad locked mode |
EP1271346A1 (en) * | 2001-06-28 | 2003-01-02 | Nokia Corporation | Method for searching data in at least two databases |
JP4437633B2 (ja) * | 2001-08-10 | 2010-03-24 | 富士通株式会社 | 携帯端末 |
GB0121150D0 (en) * | 2001-08-31 | 2001-10-24 | Mitel Knowledge Corp | Menu presentation system |
US7418381B2 (en) * | 2001-09-07 | 2008-08-26 | Hewlett-Packard Development Company, L.P. | Device for automatically translating and presenting voice messages as text messages |
FI20012358A0 (fi) | 2001-11-30 | 2001-11-30 | Nokia Corp | Matkaviestinlaite ja menetelmä ohjelmistotoimintojen suorittamiseksi |
US7324942B1 (en) * | 2002-01-29 | 2008-01-29 | Microstrategy, Incorporated | System and method for interactive voice services using markup language with N-best filter element |
KR20040001318A (ko) * | 2002-06-27 | 2004-01-07 | 엘지전자 주식회사 | 음성인식을 이용한 휴대폰의 원격 제어방법 |
US7372826B2 (en) * | 2002-08-01 | 2008-05-13 | Starent Networks, Corp. | Providing advanced communications features |
US7072684B2 (en) * | 2002-09-27 | 2006-07-04 | International Business Machines Corporation | Method, apparatus and computer program product for transcribing a telephone communication |
AU2003282763A1 (en) | 2002-10-15 | 2004-05-04 | Verance Corporation | Media monitoring, management and information system |
GB2420060B (en) * | 2002-12-09 | 2006-11-08 | Voice Signal Technologies Inc | Provider-activated software for mobile communication devices |
CN1739279A (zh) * | 2002-12-20 | 2006-02-22 | 萤火虫移动公司 | 用于无线通信的方法和系统 |
US20040162116A1 (en) * | 2003-02-14 | 2004-08-19 | Lucent Technologies Inc. | User programmable voice dialing for mobile handset |
US20050164692A1 (en) * | 2003-09-11 | 2005-07-28 | Voice Signal Technologies, Inc. | Method and apparatus for back-up of customized application information |
US20050118986A1 (en) * | 2003-09-11 | 2005-06-02 | Voice Signal Technologies, Inc. | Phone number and name pronunciation interchange via cell phone |
KR20050028150A (ko) * | 2003-09-17 | 2005-03-22 | 삼성전자주식회사 | 음성 신호를 이용한 유저-인터페이스를 제공하는휴대단말기 및 그 방법 |
US20060239501A1 (en) | 2005-04-26 | 2006-10-26 | Verance Corporation | Security enhancements of digital watermarks for multi-media content |
EP1687961A2 (en) * | 2003-11-14 | 2006-08-09 | Voice Signal Technologies Inc. | Installing language modules in a mobile communication device |
US7801283B2 (en) * | 2003-12-22 | 2010-09-21 | Lear Corporation | Method of operating vehicular, hands-free telephone system |
US20050134504A1 (en) * | 2003-12-22 | 2005-06-23 | Lear Corporation | Vehicle appliance having hands-free telephone, global positioning system, and satellite communications modules combined in a common architecture for providing complete telematics functions |
US7050834B2 (en) * | 2003-12-30 | 2006-05-23 | Lear Corporation | Vehicular, hands-free telephone system |
US7778604B2 (en) * | 2004-01-30 | 2010-08-17 | Lear Corporation | Garage door opener communications gateway module for enabling communications among vehicles, house devices, and telecommunications networks |
US7197278B2 (en) * | 2004-01-30 | 2007-03-27 | Lear Corporation | Method and system for communicating information between a vehicular hands-free telephone system and an external device using a garage door opener as a communications gateway |
KR20070002017A (ko) * | 2004-02-17 | 2007-01-04 | 보이스 시그널 테크놀로지스, 인코포레이티드. | 멀티모달 내장형 인터페이스들의 교체가능한 커스텀화 방법및 장치 |
US7570746B2 (en) | 2004-03-18 | 2009-08-04 | Sony Corporation | Method and apparatus for voice interactive messaging |
KR100621401B1 (ko) * | 2004-03-31 | 2006-09-08 | 삼성전자주식회사 | 회전상태를 인식하여 저장된 정보를 탐색하는이동통신기기 및 그 방법 |
US20050239511A1 (en) * | 2004-04-22 | 2005-10-27 | Motorola, Inc. | Speaker identification using a mobile communications device |
KR100640505B1 (ko) * | 2004-06-01 | 2006-10-30 | 삼성전자주식회사 | 검색된 전화번호에 대한 전화번호 연계 기능을 수행하는방법 |
KR100605959B1 (ko) * | 2004-06-21 | 2006-08-02 | 삼성전자주식회사 | 음성을 이용한 번호입력방법 |
WO2006032721A1 (en) * | 2004-09-24 | 2006-03-30 | Nokia Corporation | Method for receiving inputs from user of electronic device |
JP4802489B2 (ja) * | 2004-12-07 | 2011-10-26 | 日本電気株式会社 | 音データ提供システムおよびその方法 |
US20060178159A1 (en) * | 2005-02-07 | 2006-08-10 | Don Timms | Voice activated push-to-talk device and method of use |
US8020004B2 (en) | 2005-07-01 | 2011-09-13 | Verance Corporation | Forensic marking using a common customization function |
US8781967B2 (en) | 2005-07-07 | 2014-07-15 | Verance Corporation | Watermarking in an encrypted domain |
US7668540B2 (en) * | 2005-09-19 | 2010-02-23 | Silverbrook Research Pty Ltd | Print on a mobile device with persistence |
US20070197266A1 (en) * | 2006-02-23 | 2007-08-23 | Airdigit Incorporation | Automatic dialing through wireless headset |
US20070286398A1 (en) * | 2006-06-07 | 2007-12-13 | Venkatesan Ramamoorthy | Voice Recognition Dialing For Alphabetic Phone Numbers |
US20080039056A1 (en) * | 2006-06-28 | 2008-02-14 | Motorola, Inc. | System and method for interaction of a mobile station with an interactive voice response system |
KR20080026691A (ko) * | 2006-09-21 | 2008-03-26 | 삼성전자주식회사 | 휴대용 단말에서 음성 다이얼링을 제어하는 장치 및 방법 |
US7759168B2 (en) * | 2008-05-13 | 2010-07-20 | International Business Machines Corporation | Electromagnetic interference shield for semiconductors using a continuous or near-continuous peripheral conducting seal and a conducting lid |
US8259938B2 (en) | 2008-06-24 | 2012-09-04 | Verance Corporation | Efficient and secure forensic marking in compressed |
KR101185093B1 (ko) * | 2008-12-19 | 2012-09-21 | 한국전자통신연구원 | Autosar 응용 소프트웨어의 소프트웨어 구조 모델링 도구를 위한 프로젝트 관리 장치 및 방법 |
KR101387270B1 (ko) * | 2009-07-14 | 2014-04-18 | 주식회사 팬택 | 터치 궤적에 따라 메뉴 정보를 표시하는 이동 단말기 |
US9264259B2 (en) * | 2009-12-31 | 2016-02-16 | General Motors Llc. | Instructional ring tone |
US20110184736A1 (en) * | 2010-01-26 | 2011-07-28 | Benjamin Slotznick | Automated method of recognizing inputted information items and selecting information items |
US9607131B2 (en) | 2010-09-16 | 2017-03-28 | Verance Corporation | Secure and efficient content screening in a networked environment |
US8682026B2 (en) | 2011-11-03 | 2014-03-25 | Verance Corporation | Efficient extraction of embedded watermarks in the presence of host content distortions |
US8533481B2 (en) | 2011-11-03 | 2013-09-10 | Verance Corporation | Extraction of embedded watermarks from a host content based on extrapolation techniques |
US8615104B2 (en) | 2011-11-03 | 2013-12-24 | Verance Corporation | Watermark extraction based on tentative watermarks |
US8923548B2 (en) | 2011-11-03 | 2014-12-30 | Verance Corporation | Extraction of embedded watermarks from a host content using a plurality of tentative watermarks |
US8745403B2 (en) | 2011-11-23 | 2014-06-03 | Verance Corporation | Enhanced content management based on watermark extraction records |
US9547753B2 (en) | 2011-12-13 | 2017-01-17 | Verance Corporation | Coordinated watermarking |
US9323902B2 (en) | 2011-12-13 | 2016-04-26 | Verance Corporation | Conditional access using embedded watermarks |
US9117449B2 (en) | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
US9063731B2 (en) | 2012-08-27 | 2015-06-23 | Samsung Electronics Co., Ltd. | Ultra low power apparatus and method to wake up a main processor |
US9571606B2 (en) | 2012-08-31 | 2017-02-14 | Verance Corporation | Social media viewing system |
US20140075469A1 (en) | 2012-09-13 | 2014-03-13 | Verance Corporation | Content distribution including advertisements |
US8726304B2 (en) | 2012-09-13 | 2014-05-13 | Verance Corporation | Time varying evaluation of multimedia content |
US8869222B2 (en) | 2012-09-13 | 2014-10-21 | Verance Corporation | Second screen content |
US9691377B2 (en) | 2013-07-23 | 2017-06-27 | Google Technology Holdings LLC | Method and device for voice recognition training |
US10438591B1 (en) | 2012-10-30 | 2019-10-08 | Google Llc | Hotword-based speaker recognition |
CN103021409B (zh) * | 2012-11-13 | 2016-02-24 | 安徽科大讯飞信息科技股份有限公司 | 一种语音启动拍照系统 |
US20140149118A1 (en) * | 2012-11-28 | 2014-05-29 | Lg Electronics Inc. | Apparatus and method for driving electric device using speech recognition |
US9264801B2 (en) * | 2012-12-04 | 2016-02-16 | Storz Endoskop Produktions Gmbh | System and method for pairing a command device incorporating a microphone to a remotely controlled medical system |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9112984B2 (en) | 2013-03-12 | 2015-08-18 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9275638B2 (en) | 2013-03-12 | 2016-03-01 | Google Technology Holdings LLC | Method and apparatus for training a voice recognition model database |
US9262793B2 (en) | 2013-03-14 | 2016-02-16 | Verance Corporation | Transactional video marking system |
US9169684B2 (en) | 2013-04-26 | 2015-10-27 | GM Global Technology Operations LLC | Methods, program products, and systems relating to vehicular garage door control systems |
CN103280217B (zh) * | 2013-05-02 | 2016-05-04 | 锤子科技(北京)有限公司 | 一种移动终端的语音识别方法及其装置 |
US9251549B2 (en) | 2013-07-23 | 2016-02-02 | Verance Corporation | Watermark extractor enhancements based on payload ranking |
US20150032238A1 (en) * | 2013-07-23 | 2015-01-29 | Motorola Mobility Llc | Method and Device for Audio Input Routing |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
US9208334B2 (en) | 2013-10-25 | 2015-12-08 | Verance Corporation | Content management using multiple abstraction layers |
JP2017514345A (ja) | 2014-03-13 | 2017-06-01 | ベランス・コーポレイション | 埋め込みコードを用いた対話型コンテンツ取得 |
TWI536366B (zh) * | 2014-03-18 | 2016-06-01 | 財團法人工業技術研究院 | 新增口說語彙的語音辨識系統與方法及電腦可讀取媒體 |
US9712623B2 (en) | 2014-05-30 | 2017-07-18 | Apple Inc. | Answering a call with client through a host |
US9602661B2 (en) | 2014-05-30 | 2017-03-21 | Apple Inc. | Answer and hold with client and host |
CN106161726A (zh) * | 2015-03-23 | 2016-11-23 | 钰太芯微电子科技(上海)有限公司 | 一种语音唤醒系统及语音唤醒方法及移动终端 |
CN106161755A (zh) * | 2015-04-20 | 2016-11-23 | 钰太芯微电子科技(上海)有限公司 | 一种关键词语音唤醒系统及唤醒方法及移动终端 |
EP3414759B1 (en) | 2016-02-10 | 2020-07-01 | Cerence Operating Company | Techniques for spatially selective wake-up word recognition and related systems and methods |
EP3754653A1 (en) | 2016-06-15 | 2020-12-23 | Cerence Operating Company | Techniques for wake-up word recognition and related systems and methods |
US10404847B1 (en) * | 2016-09-02 | 2019-09-03 | Amnon Unger | Apparatus, method, and computer readable medium for communicating between a user and a remote smartphone |
EP3535751A4 (en) | 2016-11-10 | 2020-05-20 | Nuance Communications, Inc. | METHOD FOR LANGUAGE-INDEPENDENT WAY RECOGNITION |
CN106961508A (zh) * | 2017-06-01 | 2017-07-18 | 诺雪(重庆)科技有限公司 | 基于姓名识别的通信方法及装置 |
CN107564532A (zh) * | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 电子设备的唤醒方法、装置、设备及计算机可读存储介质 |
KR20190138915A (ko) | 2018-06-07 | 2019-12-17 | 현대자동차주식회사 | 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법 |
JP7055721B2 (ja) | 2018-08-27 | 2022-04-18 | 京セラ株式会社 | 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム |
KR102700032B1 (ko) | 2019-01-21 | 2024-08-29 | 삼성전자주식회사 | 디스플레이의 손상을 방지하기 위한 전자 장치 및 방법 |
GB2584167B (en) * | 2019-05-24 | 2023-06-28 | Sensae Aps | User interface, user interface system and method |
CN113470645B (zh) * | 2021-06-30 | 2024-05-28 | 百度在线网络技术(北京)有限公司 | 呼叫处理的方法、装置、设备以及存储介质 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4320256A (en) | 1979-11-27 | 1982-03-16 | Freeman Michael J | Verbally interactive telephone interrogation system with selectible variable decision tree |
US4348550A (en) | 1980-06-09 | 1982-09-07 | Bell Telephone Laboratories, Incorporated | Spoken word controlled automatic dialer |
US4644107A (en) | 1984-10-26 | 1987-02-17 | Ttc | Voice-controlled telephone using visual display |
JP2584249B2 (ja) | 1986-10-31 | 1997-02-26 | 三洋電機株式会社 | 音声認識電話機 |
US4853953A (en) | 1987-10-08 | 1989-08-01 | Nec Corporation | Voice controlled dialer with separate memories for any users and authorized users |
US4928302A (en) | 1987-11-06 | 1990-05-22 | Ricoh Company, Ltd. | Voice actuated dialing apparatus |
US5007081A (en) | 1989-01-05 | 1991-04-09 | Origin Technology, Inc. | Speech activated telephone |
JP2927891B2 (ja) * | 1989-06-19 | 1999-07-28 | 日本電気株式会社 | 音声ダイヤル装置 |
US5325421A (en) | 1992-08-24 | 1994-06-28 | At&T Bell Laboratories | Voice directed communications system platform |
US5566229A (en) * | 1992-08-24 | 1996-10-15 | At&T | Voice directed communications system employing shared subscriber identifiers |
US5483579A (en) * | 1993-02-25 | 1996-01-09 | Digital Acoustics, Inc. | Voice recognition dialing system |
US5452340A (en) | 1993-04-01 | 1995-09-19 | Us West Advanced Technologies, Inc. | Method of voice activated telephone dialing |
US5594784A (en) * | 1993-04-27 | 1997-01-14 | Southwestern Bell Technology Resources, Inc. | Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls |
EP0666542A3 (en) * | 1994-02-04 | 1996-05-15 | Fuji Facom Corp | Multimedia system for monitoring and controlling processes. |
JPH08307509A (ja) | 1995-04-19 | 1996-11-22 | Texas Instr Inc <Ti> | 手を使わずに電話機のダイアル操作を行う方法および装置 |
FI111893B (fi) * | 1995-06-02 | 2003-09-30 | Nokia Corp | Menetelmä ja laite puhelimen ohjaamiseksi komennoilla |
US5787152A (en) * | 1995-07-18 | 1998-07-28 | Freadman; Tommyca | Computer communications device |
DE69634474T2 (de) | 1996-01-31 | 2006-04-27 | Nokia Corp. | Interaktives Verfahren zur Sprachsteuerung zwischen einem Telefon und einem Benutzer |
US5719921A (en) * | 1996-02-29 | 1998-02-17 | Nynex Science & Technology | Methods and apparatus for activating telephone services in response to speech |
US5991637A (en) * | 1996-04-19 | 1999-11-23 | Mack, Ii; Gawins A. | Integrated passive and active communications system |
US5765130A (en) * | 1996-05-21 | 1998-06-09 | Applied Language Technologies, Inc. | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems |
US5892813A (en) * | 1996-09-30 | 1999-04-06 | Matsushita Electric Industrial Co., Ltd. | Multimodal voice dialing digital key telephone with dialog manager |
US6112103A (en) | 1996-12-03 | 2000-08-29 | Puthuff; Steven H. | Personal communication device |
US6289140B1 (en) * | 1998-02-19 | 2001-09-11 | Hewlett-Packard Company | Voice control input for portable capture devices |
US6098043A (en) * | 1998-06-30 | 2000-08-01 | Nortel Networks Corporation | Method and apparatus for providing an improved user interface in speech recognition systems |
US6167251A (en) * | 1998-10-02 | 2000-12-26 | Telespree Communications | Keyless portable cellular phone system having remote voice recognition |
US6212408B1 (en) * | 1999-05-03 | 2001-04-03 | Innovative Global Solution, Inc. | Voice command system and method |
-
1999
- 1999-02-08 US US09/246,499 patent/US6449496B1/en not_active Expired - Lifetime
-
2000
- 2000-02-08 DE DE60043098T patent/DE60043098D1/de not_active Expired - Lifetime
- 2000-02-08 CN CNB008060177A patent/CN1173541C/zh not_active Expired - Lifetime
- 2000-02-08 BR BR0008078-0A patent/BR0008078A/pt not_active IP Right Cessation
- 2000-02-08 WO PCT/US2000/003257 patent/WO2000046969A1/en active IP Right Grant
- 2000-02-08 AU AU29866/00A patent/AU2986600A/en not_active Abandoned
- 2000-02-08 JP JP2000597937A patent/JP2002536917A/ja active Pending
- 2000-02-08 CA CA002362053A patent/CA2362053C/en not_active Expired - Fee Related
- 2000-02-08 AT AT00908545T patent/ATE445285T1/de not_active IP Right Cessation
- 2000-02-08 EP EP00908545A patent/EP1151594B1/en not_active Expired - Lifetime
- 2000-02-08 KR KR1020017010041A patent/KR100616787B1/ko active IP Right Grant
-
2002
- 2002-07-10 HK HK02105124.6A patent/HK1043460B/zh not_active IP Right Cessation
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101272558B (zh) * | 2002-10-22 | 2011-09-07 | Lg电子株式会社 | 设置有免提功能的移动通信终端及其控制方法 |
US7177670B2 (en) | 2002-10-22 | 2007-02-13 | Lg Electronics Inc. | Mobile communication terminal provided with handsfree function and controlling method thereof |
USRE44871E1 (en) | 2002-10-22 | 2014-04-29 | Lg Electronics Inc. | Mobile communication terminal provided with handsfree function and controlling method thereof |
USRE42831E1 (en) | 2002-10-22 | 2011-10-11 | Lg Electronics Inc. | Mobile communication terminal provided with handsfree function and controlling method thereof |
CN100426823C (zh) * | 2003-04-11 | 2008-10-15 | 乐金电子(中国)研究开发中心有限公司 | 在通话中传送检索电话号码的方法 |
CN1306470C (zh) * | 2003-12-04 | 2007-03-21 | 乐金电子(中国)研究开发中心有限公司 | 便携终端机的语音识别方法 |
CN100463576C (zh) * | 2004-10-10 | 2009-02-18 | 英华达(南京)科技有限公司 | 导向语音个人移动通讯装置及其处理方法 |
CN100452863C (zh) * | 2006-02-16 | 2009-01-14 | 华为技术有限公司 | 一种可视电话控制方法及设备 |
CN101083809B (zh) * | 2006-06-01 | 2010-12-01 | 三星电子株式会社 | 使用语音识别来改变操作模式的移动终端及方法 |
US9753533B2 (en) | 2008-03-26 | 2017-09-05 | Pierre Bonnat | Method and system for controlling a user interface of a device using human breath |
US8958848B2 (en) | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
US9692865B2 (en) | 2008-04-08 | 2017-06-27 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
US9497305B2 (en) | 2008-04-08 | 2016-11-15 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
CN101557432B (zh) * | 2008-04-08 | 2013-06-19 | Lg电子株式会社 | 移动终端及其菜单控制方法 |
US9900414B2 (en) | 2008-04-08 | 2018-02-20 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
WO2010124478A1 (zh) * | 2009-04-30 | 2010-11-04 | Sheng Yongxiang | 用户识别系统中语音管理用户的装置及方法 |
CN102483919A (zh) * | 2009-04-30 | 2012-05-30 | 深圳市永盛世纪指纹技术有限公司 | 用户识别系统中语音管理用户的装置及方法 |
CN102782459A (zh) * | 2009-09-11 | 2012-11-14 | 诺沃迪吉特公司 | 使用人类呼吸控制设备的用户界面的方法和系统 |
CN101976186B (zh) * | 2010-09-14 | 2013-04-03 | 方正科技集团苏州制造有限公司 | 一种计算机语音识别方法及其计算机 |
CN101976186A (zh) * | 2010-09-14 | 2011-02-16 | 方正科技集团苏州制造有限公司 | 一种计算机语音识别方法及其计算机 |
CN103185599A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 一种车载端数据处理系统及地理信息数据处理平台 |
CN103185599B (zh) * | 2011-12-28 | 2017-11-07 | 上海博泰悦臻电子设备制造有限公司 | 一种车载端数据处理系统及地理信息数据处理平台 |
CN103888587B (zh) * | 2012-12-19 | 2016-01-20 | 中国移动通信集团公司 | 一种唤醒终端的方法、dsp芯片及终端 |
CN103888587A (zh) * | 2012-12-19 | 2014-06-25 | 中国移动通信集团公司 | 一种唤醒终端的方法、dsp芯片及终端 |
CN104078042A (zh) * | 2013-03-25 | 2014-10-01 | 联想(北京)有限公司 | 一种电子设备及一种信息处理的方法 |
CN109065042A (zh) * | 2013-03-25 | 2018-12-21 | 联想(北京)有限公司 | 一种电子设备及一种信息处理的方法 |
CN103531201B (zh) * | 2013-09-29 | 2016-04-06 | 上海云视科技股份有限公司 | 终端语音命名唤醒方法和系统 |
CN103531201A (zh) * | 2013-09-29 | 2014-01-22 | 上海云视科技有限公司 | 终端语音命名唤醒方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
BR0008078A (pt) | 2003-02-25 |
HK1043460A1 (en) | 2002-09-13 |
EP1151594B1 (en) | 2009-10-07 |
HK1043460B (zh) | 2005-05-20 |
JP2002536917A (ja) | 2002-10-29 |
CA2362053C (en) | 2009-07-14 |
KR20010102001A (ko) | 2001-11-15 |
CA2362053A1 (en) | 2000-08-10 |
KR100616787B1 (ko) | 2006-08-29 |
EP1151594A1 (en) | 2001-11-07 |
ATE445285T1 (de) | 2009-10-15 |
WO2000046969A9 (en) | 2001-09-13 |
AU2986600A (en) | 2000-08-25 |
US6449496B1 (en) | 2002-09-10 |
DE60043098D1 (de) | 2009-11-19 |
CN1173541C (zh) | 2004-10-27 |
WO2000046969A1 (en) | 2000-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1173541C (zh) | 用于电话手机的语音识别用户接口 | |
CN1096205C (zh) | 用于蜂窝无线电话的网络号码簿方法与系统 | |
US6792082B1 (en) | Voice mail system with personal assistant provisioning | |
CN1177502C (zh) | 通信终端设备及其控制方法 | |
EP1447959A1 (en) | User programmable voice dialing for mobile handset | |
US6940951B2 (en) | Telephone application programming interface-based, speech enabled automatic telephone dialer using names | |
KR100696439B1 (ko) | 음성 인식에 의하여 데이터 레코드들을 핸들링하기 위한방법 및 이동 통신 장치 | |
CN1377550A (zh) | 完成呼叫中功能的话音激活信令 | |
JP2002536917A5 (zh) | ||
CN1157920C (zh) | 无线通信设备信息记录处理系统及方法 | |
CN101040549A (zh) | 发送语音和文本消息的电话 | |
CN1115068C (zh) | 电话装置与警号提醒控制方法 | |
US7088994B2 (en) | Network address lookup for telephony devices | |
CN1839616A (zh) | 具有邮件发送功能的电话机 | |
US7471776B2 (en) | System and method for communication with an interactive voice response system | |
US20070286395A1 (en) | Intelligent Multimedia Dial Tone | |
CN1866976A (zh) | 固定终端设备使用移动终端号码信息的装置及方法 | |
CN1385999A (zh) | 访问移动通信终端中电话号码的方法 | |
CN1231038C (zh) | 快速语音拨号装置和方法 | |
CN1798196A (zh) | 一种移动通信终端的呼出限制设置方法 | |
US8396193B2 (en) | System and method for voice activated signaling | |
JP5826254B2 (ja) | ローカルネットワークに位置する第1の固定通信端末からこの同じローカルネットワークの第2の固定通信端末への呼の転送 | |
US20070010234A1 (en) | Method, system, modules and program for associating a callback number with a voice message | |
CN1522034A (zh) | 使用公共通信网络进行开关控制或状态切换的方法 | |
CN1630394A (zh) | 具有语音接口的移动电话 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20041027 |