CN1723487A - 用于选择性语音识别的方法和装置 - Google Patents

用于选择性语音识别的方法和装置 Download PDF

Info

Publication number
CN1723487A
CN1723487A CNA2003801053631A CN200380105363A CN1723487A CN 1723487 A CN1723487 A CN 1723487A CN A2003801053631 A CNA2003801053631 A CN A2003801053631A CN 200380105363 A CN200380105363 A CN 200380105363A CN 1723487 A CN1723487 A CN 1723487A
Authority
CN
China
Prior art keywords
speech recognition
recognition engine
audio frequency
engine
frequency input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2003801053631A
Other languages
English (en)
Other versions
CN100580769C (zh
Inventor
塞纳卡·巴拉苏里亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Mobility LLC
Google Technology Holdings LLC
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of CN1723487A publication Critical patent/CN1723487A/zh
Application granted granted Critical
Publication of CN100580769C publication Critical patent/CN100580769C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

一种用于选择性语音识别的方法和装置,包括接收具有媒体类型指示(114)的媒体文件(112)。该方法和装置进一步包括接收媒体文件的浏览器(104),从浏览器(104)接收媒体类型指示的语音识别引擎选择器(106)。所选的语音识别引擎选择器(106)随后选择第一语音识别引擎(108)或者第二语音识别引擎(110),以响应媒体类型指示。该方法和装置进一步包括音频接收机(102),其接收音频输入(116),将其提供给启用的第一语音识别引擎(108)或第二语音识别引擎(110),由此允许通过禁用语音识别引擎(108或110)直到被语音识别引擎选择器(106)有效选择而降低功耗。

Description

用于选择性语音识别的方法和装置
技术领域
本发明通常涉及语音识别,更具体涉及基于媒体类型选择多个语音识别引擎之一。
背景技术
随着语音识别引擎性能的提高,其在应用数量上有相应的增加,并且用于语音识别。基于语音识别引擎相对于用户的位置,开发了不同类型的语音识别应用和系统。一种这样的例子是嵌入式语音识别引擎,或者被称为本地语音识别引擎,诸如SpeechToGo语音识别引擎,其可以从SpeechWorks International,Inc.,696Atlantic Avenue,Boston,MA 02111购得。另一类型的语音识别引擎是基于网络的语音识别引擎,诸如也可以从SpeechWorks International,Inc.,696Atlantic Avenue,Boston,MA 02111购得的Speech Works6。
嵌入式或本地语音识别引擎在识别语音输入时提供了增加速度的好处,其中的语音输入包括任何类型的可听的或者基于音频的输入。嵌入式语音或本地语音识别引擎的缺陷在于,这些引擎通常包含有限的词汇量。由于存储有限,嵌入式或本地语音识别引擎仅能够向可以由基于网络的语音识别引擎识别的音频输入的一个片断来提供识别。
基于网络的语音识别引擎提供了增加词汇量的好处,其源于消除了存储和处理限制。尽管如此,在用户提供语音输入和语音输入可被识别并被提供给用户用于确认识别之间的额外延迟被减小了。在典型的语音识别系统中,用户提供音频输入,且由此将音频输入通过通信路径提供给服务器,由此可以得到识别。
当多语音识别引擎可用于识别语音输入时就会出现问题。尽管每个语音识别引擎提供了优点和缺点,如果能够选择特定的语音识别引擎之一将会更有效率。当前存在选择在多语音识别引擎之间使用多种因素进行选择的可能性,诸如基于用户的选择。另一种选择可以通过特定项的识别而做出,这表明了可以输入第二类型的特定输入,诸如,如果初始语音输入是单词“dial”,根据具有有选择地识别特定名称或电话簿输入的可利用性,或许可以选择第二语音识别引擎。
附图说明
通过下面的附图将更容易理解本发明,其中:
图1说明了用于选择语音识别引擎的装置的一个例子;
图2说明了用于选择语音识别引擎的方法的例子;
图3说明了用于选择语音识别引擎的装置的另一个例子;
图4说明了用于选择语音识别引擎的方法的另一例子;
图5说明了用于选择语音识别引擎的装置的另一个例子;和
图6说明了使用用于选择语音识别引擎的方法的实施例的一个例子。
具体实施方式
简言之,一种用于选择性语音识别的方法和装置包括接收具有媒体类型指示的媒体文件。媒体文件包括任何类型的文件,该文件包含或者引向提供媒体输出的内容信息。媒体文件具有媒体类型指示,其中媒体类型指示是对于媒体文件内内容信息的媒体类型的指示,诸如指示媒体文件内容信息是音频信息、视频信息、文本信息或者任何其他类型的媒体输出。
该方法和装置进一步包括响应于媒体类型指示而选择所选的语音识别引擎,其中,所选的语音识别引擎或者是第一语音识别引擎、或者是第二语音识别引擎。该方法和装置进一步包括使所选的语音识别引擎能够接收至少一个音频输入。音频输入通常是由端用户通过音频输入设备(诸如麦克风)提供的。
图1说明了一种电子设备100,其具有音频接收机102、浏览器104和语音识别引擎选择器106。电子设备100包括但不限于,蜂窝电话、笔记本电脑、桌上电脑、个人数字助理、寻呼机、智能电话、或者本领域普通技术人员所知的任何其他合适的设备,其能够执行媒体文件和提供对音频输入的本地或外部语音识别。浏览器104可以实现为硬件、软件或其组合,用于允许下载和查看内容信息。而且,语音识别引擎选择器106也可以实现为硬件、软件或其组合,用于选择语音识别引擎。
在一个实施例中,音频接收机102有效连接到第一语音识别引擎108和第二语音识别引擎110。浏览器104接收媒体文件112,其具有与之相关的媒体类型指示。浏览器104由此提取媒体类型指示114并将其提供给语音识别引擎选择器106。
语音识别引擎选择器106响应于媒体类型指示,选择第一语音识别引擎108或者第二语音识别引擎110,以接收和识别音频输入116。这样,语音识别引擎选择器106提供选择信号118给音频接收机102,以使音频接收机可以提供音频输入116给所选的语音识别引擎,108或者110。
如果选择信号118指示了第一语音识别引擎108,当向音频接收机102提供音频输入116时,向第一语音识别引擎108提供编码的音频信号120。第一语音识别引擎108根据公知的语音识别技术识别编码的输入120,并提供第一识别项122给浏览器104。当选择信号118指示了第二语音识别引擎110时,音频接收机102提供编码的音频输入124给第二语音识别引擎110。由此,第二语音识别引擎110根据公知的语音识别技术识别编码的音频输入124,并提供第二识别项126给浏览器104。
图2说明了用于所选的选择语音识别引擎的方法的例子。方法开始于150,在步骤152,接收具有媒体类型指示的媒体文件。如上面所讨论的,媒体文件可以是具有媒体内容信息或者到内容信息的指针的任何类型的文件,诸如标记语言文件、通用资源指示符(URI)、音频文件、视频文件或者任何其他类型的基于单一或多媒体的内容信息。
下一步,步骤154,包括响应于媒体类型指示,选择所选的语音识别引擎,其中,所选的语音识别引擎包括第一语音识别或第二语音识别引擎。如上面所讨论的,第一语音识别引擎108可能是嵌入式语音识别引擎,位于电子设备100内,第二语音识别引擎110可能是外部语音识别引擎,位于电子设备之外,诸如在内容服务器上。而且,如上面所讨论的,在另一实施例中,第一和第二语音识别引擎108、110可能都位于通信服务器上,或者都在电子设备内,或者跨越多个电子设备或通信服务器。
因此,本发明包括在步骤156使所选的语音识别引擎能够接收至少一个音频输入。这个步骤包括提供初始化命令或激活命令,并建立直接链路以使所有语音输入都提供给所选的语音识别引擎。这样,本方法在步骤158完成。
图3说明了用于所选的选择语音识别引擎的装置的另一例子。图3说明了电子设备100,其具有音频接收机102和浏览器104,以及位于其中的语音识别选择器106。电子设备还包括输出设备160,其有效连接到浏览器104,以使浏览器104提供媒体文件112的输出102。例如,输出设备可以是显示器,用于提供视觉输出或文本输出,或者可以是扬声器,用于提供音频输出,或者可以是本领域普通技术人员所知的任何其他类型的输出设备。电子设备100包括与网络164进行通信的能力,网络164诸如标准通信网络、蜂窝或其他无线区域网络或无线局域网。网络164同外部语音识别引擎162通过通信路径168进行通信,通信路径168可能是有线或无线的通信路径。如本领域普通技术人员所知,外部语音识别引擎166可以位于通信网络服务器上,并且可以通过一个或多个用于路由音频输入(诸如116)来进行语音识别的代理服务器(未示出)访问。
电子设备100进一步包括嵌入式语音识别引擎170,其有效连接到音频接收机102,音频接收器102又可通过网络164连接到外部语音识别引擎166。类似于上述实施例,根据图1,语音识别引擎选择器106提供选择信号118给音频接收机102。音频接收机102一旦接收到音频输入116,就将编码的音频输入172或174分别提供给外部语音识别引擎166或嵌入式语音识别引擎170。
在一个实施例中,音频接收机102在接收音频输入116之前,根据接收选择信号118,可以选择激活特定语音识别引擎之一,166或170。例如,在正常操作节能期间,嵌入式语音识别引擎170可能不可用,但在接收媒体类型指示时,使得嵌入式语音识别引擎170可以使用,音频接收机102可以发送确认或初始化信号到嵌入式语音识别引擎170。因此,当浏览器104提供用于内容信息162的输出到输出设备160时,任何音频输入116可以直接提供给嵌入式语音识别引擎170,此时该语音识别引擎响应于浏览器接收到的媒体文件112的媒体类型而已被选择性激活并且接通或开启。
在一个实施例中,媒体文件112可以从网络164中接收。媒体文件可以是任何类型的媒体文件,其能够由浏览器104接收和执行,并由此提供给输出设备160。而且,图3说明了一旦接收到编码的音频输入172,网络164就通过通信路径168提供输入到外部语音识别引擎166。外部语音识别引擎166根据公知的语音识别技术识别输入并将识别项返回给浏览器104,将识别项176从网络164提供给浏览器104。而且,如果嵌入式语音识别引擎170被激活且音频接收机102向其提供编码的音频输入174,嵌入式语音识别引擎170根据公知的语音识别技术来识别该项,并提供识别项178给浏览器104。
因此,根据一个实施例,浏览器104接收识别项,176或178,并且由此执行命令来响应识别项。例如,如果媒体文件112包括视频内容而浏览器104提供该视频内容162到输出设备160的话,端用户可以提供音频输出116,指令浏览器104暂停显示。在这个例子中,音频接收机102接收音频输入116,并根据选择信号118,将输入提供给外部语音识别引擎166或嵌入式语音识别引擎170。在选择信号118指示激活嵌入式语音识别引擎170的情况下,向其提供编码的音频输入174,以识别命令暂停并将该命令提供给浏览器104。由此,浏览器可以暂停内容信息162和输出设备160的显示。
图4说明了用于根据媒体文件类型选择性选择语音识别的方法的另一例子。方法开始于200,在步骤102,接收媒体文件,在媒体类型指示中具有内容信息。接下来的步骤包括确定媒体类型指示,该步骤可以通过响应于媒体文件,检查文件类型扩展名,诸如.HTM、.XML,或者通过检查文件MIME类型、检查媒体文件自身的内容信息、或者检测浏览器所执行的应用来完成,如步骤102所示。
因此,响应于媒体类型指示,本方法包括选择语音识别引擎,其中,所选的语音识别引擎或者是嵌入式语音识别引擎、或者是外部语音识别引擎,如步骤206所示。在一个实施例中,选择的步骤进一步包括比较媒体类型指示和用于每个语音识别引擎的识别能力信号,其中,识别能力信号包括任何能够提供关于对相关联语音识别引擎的语音识别能力的指示的信号。例如,嵌入式语音识别引擎通常具有较低的语音识别能力,而外部语音识别引擎通常具有较高的语音识别能力。识别复杂度水平对应于语音识别引擎能够使用可用资源处理多少单词或者短语。识别复杂度随着可识别语言集的增加而增加。通常,可识别的短语针对语音识别引擎的需要而表示为节点和弧的有限状态网络。例如,识别复杂度水平将是把识别限制于这样的50个节点的网络。如本领域普通技术人员所知,识别复杂度水平存在其他的实现和变化。接下来的步骤208包括启用所选的语音识别引擎,使其能够接收至少一个音频输入。
在浏览器内,接下来的步骤是执行媒体程序以响应媒体类型指示,如步骤210所示。例如,浏览器可以启动音频播放器来执行音频文件或者可以启动视频播放器来执行视频文件。接下来的步骤包括显示媒体文件的内容信息,如步骤212所示。
此处,电子设备可以接收音频输入并由此提供音频输入给所选的语音识别引擎,如步骤214所示。如上面所讨论的,为了举例,如果媒体文件是视频文件的话,音频输入可以是指向用于查看视频文件的指令的命令,诸如开始、停止、暂停。
接下来的步骤,步骤216,包括从所选的语音识别引擎接收识别的音频命令和执行操作以响应识别的音频命令。例如,如果正在显示视频文件且用户输入了“暂停”的语音输入的话,所选的语音识别引擎识别了语音输入并提供识别项给浏览器,其中,浏览器由此暂停该视频文件的显示。由此,本方法在步骤218完成。
图5说明了电子设备100的另一例子,其能够根据直接类型(immediate type)选择语音识别。电子设备包括音频接收机102,浏览器104和语音识别引擎选择器106。电子设备100进一步包括输出设备160、嵌入式语音识别引擎170和应用数据库172。应用数据库230包括可执行应用232的数据库,这些应用可以从浏览器104提取或者提供给浏览器104,以响应对应用230的请求。例如,如果浏览器104请求使用音频播放器,音频播放器可以位于应用数据库230中且提供给浏览器104,以使浏览器可以播放音频文件。浏览器104进一步有效连接到存储器234,用于从存储器向浏览器104提供媒体文件236。存储器234和数据库230可以是,但不限于,单个存储器、多个存储位置、共享存储器、CD、DVD、ROM、RAM、EEPROM、光学存储或能够储存数字数据以供浏览器104使用的任何其他非易失性存储。
类似于图3的电子设备100,电子设备100可通过通信路径168连接到网络164并由此与外部语音识别引擎166通信。图5说明了音频接收机向网络164提供编码的音频输入172,网络将识别项176提供给浏览器104,网络将媒体文件112提供给浏览器104以及进一步从语音识别引擎选择器118接收接合(engagement)信号238。如本领域普通技术人员所知,信号可以通过公共通信路径240传送,诸如从中央发射机/接收机(未示出)提供,但是显示为分离的和不同的信号仅仅是为了说明和简洁的目的。
在一个实施例中,内容服务器242,诸如通信或其他因特网服务器,可以提供内容媒体文件244给网络164,由此将媒体文件112提供给浏览器104。作为响应,浏览器104从中提取媒体文件类型指示114。在一个实施例中,媒体文件类型指示可以通过查看文件扩展名(诸如.HTM、.XML)、通过查看MIME类型、检查媒体文检自身内容、或者确定从应用数据库230中提供哪个应用232来确定。
如上面所讨论的,语音识别引擎选择器106接收媒体文件类型指示114并由此选择将使用哪个语音识别引擎。在一个实施例中,选择信号118被提供给音频接收机102,以使音频接收机可以活动地接合、启动、或者选择以路由所选的语音识别引擎166或170。在另一实施例中,语音识别引擎选择器106可以发送包括路由信息的选择信号118到音频接收机102以提供音频输入116给所选的引擎,但是语音识别引擎选择器106可以进一步生成启用信号来启用/激活所选的语音识别引擎。在选择了嵌入式语音识别引擎170的情况下,语音识别引擎选择器106生成嵌入式语音识别引擎激活信号246,而在选择了外部语音识别引擎166的情况下,语音识别引擎选择器106生成外部语音识别引擎启用信号238,该信号通过网络164来提供。因此,在图5所示的系统中,嵌入式语音识别引擎170和/或外部语音识别引擎166可以有效地禁用,直到提供了启用信号,诸如246或238,这样做的目的是为了节能和减少功耗。
而且,在另一实施例中,语音识别引擎选择器106可以提供启用信号给所选的语音识别引擎,可以是嵌入式语音识别引擎170或者外部语音识别引擎166,并且进一步提供忽略列表给没有选择的语音识别引擎,即,如果选择了嵌入式语音识别引擎170就提供给外部语音识别引擎166,如果选择了外部语音识别引擎166就提供给嵌入式语音识别引擎170。因此,在这个实施例中,音频接收机102可以提供音频输入116给这两个语音识别引擎,其中,当来自识别列表的识别项是由没有选择的语音识别引擎识别的时,没有选择的语音识别引擎不会提供识别项给浏览器104。在这个实施例中,提供了中断序列,其中,用户可以不管电子设备100所请求的所选语音输入。例如,如果用户正在输出设备160上查看视频文件,并且决定呼叫另一用户的话,该用户可以不管正在播放视频的浏览器104,而讲出命令“拨号”,其中,没有选择的语音识别引擎将识别该命令并执行分离的命令以允许电子设备100呼叫特定的一方,而不是需要端用户提供“停止”的音频输入116并进一步退出视频播放应用以提供对第三方的拨号。
图6说明了用于根据媒体类型选择性选择语音识别引擎的方法的实施例的一个例子的步骤流程图。该过程开始于300,在步骤302,用户按下电子设备上的按钮来调用新服务。例如,用户可以滚动电子设备上可用服务的菜单并且进一步选择特定的网站或服务提供商。接下来的步骤是电子设备建立与远程通信网络的通信会话,如步骤304所示。通信会话的建立依据所建立的通信技术。
远程网络发送标记页面寻找特定服务类型,例如,提供语音XML命令“你需要什么服务?”,如步骤306所示。由此,用户可以提供音频输入“新闻”,如步骤308所示。远程内容服务器将新闻网页推送到可位于电子设备上的视频浏览器,如步骤310。
电子设备显示菜单,说明有各种可获得的新闻故事,并且允许用户通过选择链接或者URL来选择视频剪辑,如步骤312。由此,电子设备上的浏览器启用嵌入式语音识别引擎,同时从远程内容服务器中提取视频剪辑,如步骤314。接下来的步骤316允许显示视频剪辑,在视频剪辑播放过程中,用户说出命令“停止”,如步骤316所示。
响应于命令“停止”,嵌入式语音识别识别输入并且指令浏览器停止播放视频剪辑,如步骤318。而且,在这个例子中,用户然后可以点击任何其他所列的新闻URL。嵌入式语音识别引擎被禁用,从远程内容服务器中提取其他的新闻项,如步骤320。由此,方法在322完成,其中,在电子设备内,嵌入式语音识别引擎被禁用,直到基于特定环境的信息表明激活嵌入式语音识别引擎来识别与浏览器媒体显示相关联的相关项。
应该理解,本发明及其各种方面存在其他变化和修改的实现,本领域普通技术人员将很容易认识到这一点,而且本发明不限于这里所描述的特定的实施例。例如,语音识别引擎选择器106可以有效连接到任意数量的电子设备内或电子设备外的语音识别引擎,并且通过网络164或者通过任何其他服务器或代理的组合来通信,以使每个特定语音识别引擎可以提供对于浏览器104通过输出设备160所显示的媒体的单独或有利的语音识别能力。同时,媒体文件可以是流媒体文件或者具有多个媒体类型指示。因此本发明可以预见和涵盖任何和所有落入到这里公开和要求保护的基本潜在原理的精神和范围内的修改、变化或等价物。

Claims (18)

1.一种用于选择性语音识别的方法,包括:
接收具有媒体类型指示的媒体文件;
响应于媒体类型指示,选择所选的语音识别引擎,其中,所选的语音识别引擎包括第一语音识别引擎和第二语音识别引擎中至少一个;和
使得所选语音识别引擎能够接收至少一个音频输入。
2.如权利要求1所述的方法,其中,所述媒体文件包括内容信息,所述方法进一步包括:
执行媒体程序以响应媒体类型指示;和
显示媒体文件的内容信息。
3.如权利要求1所述的方法,进一步包括:
接收所述至少一个音频输入;和
将所述至少一个音频输入提供给所选的语音识别引擎。
4.如权利要求3所述的方法,进一步包括:
从所选的语音识别引擎接收识别的音频输入;和
执行操作以响应识别的音频输入。
5.如权利要求1所述的方法,其中,选择的步骤进一步包括:
比较媒体类型指示与第一语音识别引擎和第二语音识别引擎的每个的识别能力指示。
6.如权利要求1所述的方法,其中,第一语音识别引擎是嵌入式语音识别引擎,第二语音识别引擎是外部语音识别引擎。
7.如权利要求1所述的方法,其中,启用的步骤进一步包括禁用没有选择的语音识别,其中,没有选择的语音识别引擎是下述之一:不是所选的语音识别引擎的第一语音识别引擎和第二语音识别引擎。
8.如权利要求7所述的方法,其中,启用至少一个语音识别引擎的步骤进一步包括将忽略输入列表提供给没有选择的语音识别引擎。
9.一种电子设备,包括:
能够接收音频输入的音频接收机;
能够接收具有媒体类型指示的媒体文件的浏览器,该浏览器有效连接到音频接收机并且可有效连接到第一语音识别引擎和第二语音识别引擎;和
语音识别引擎选择器,使得语音识别选择器根据媒体类型指示选择所选的语音识别引擎,其中,所选的语音识别引擎包括下述至少一个:第一语音识别引擎和第二语音识别引擎,其中,当接收音频输入时,音频输入被提供给所选的语音识别引擎。
10.如权利要求9所述的电子设备,进一步包括:
能够从浏览器接收输出信号的输出设备,其中,输出信号表示位于媒体文件内的内容信息。
11.如权利要求9所述的电子设备,其中,第一语音识别引擎是嵌入式语音识别引擎,第二语音识别引擎是外部语音识别引擎。
12.如权利要求9所述的电子设备,其中,音频接收机接收音频输入,音频输入被提供给所选的语音识别引擎,以使语音识别引擎可以识别音频输入并且提供识别的输入给浏览器,其中,浏览器执行操作以响应识别的输入。
13.一种用于选择性语音识别的方法,包括:
接收具有媒体类型指示的媒体文件;
确定媒体类型指示;
响应于媒体类型指示,选择所选的语音识别引擎,其中,所选的语音识别引擎包括第一语音识别引擎和第二语音识别引擎中至少一个;和
使得所选语音识别引擎能够接收至少一个音频输入。
14.如权利要求13所述的方法,其中,媒体文件包括内容信息,所述方法进一步包括:
执行媒体程序以响应媒体类型指示;
显示媒体文件的内容信息;
接收所述至少一个音频输入;和
将所述至少一个音频输入提供给所选的语音识别引擎。
15.如权利要求14所述的方法,进一步包括:
从所选的语音识别引擎接收识别的音频输入;和
执行操作以响应识别的音频输入。
16.如权利要求13所述的方法,其中,选择的步骤进一步包括:
比较媒体类型指示与第一语音识别引擎和第二语音识别引擎的每个的识别能力指示。
17.如权利要求13所述的方法,其中,第一语音识别引擎是嵌入式语音识别引擎,第二语音识别引擎是外部语音识别引擎。
18.如权利要求13所述的方法,其中,媒体文件包括内容信息,确定媒体类型指示的步骤包括下面至少一个:检查文件类型扩展名、检查文件MIME类型、检查媒体文件的内容信息和检查浏览器所启动的应用。
CN200380105363A 2002-12-13 2003-11-18 用于选择性语音识别的方法和装置 Expired - Lifetime CN100580769C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/319,746 2002-12-13
US10/319,746 US6834265B2 (en) 2002-12-13 2002-12-13 Method and apparatus for selective speech recognition

Publications (2)

Publication Number Publication Date
CN1723487A true CN1723487A (zh) 2006-01-18
CN100580769C CN100580769C (zh) 2010-01-13

Family

ID=32506694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200380105363A Expired - Lifetime CN100580769C (zh) 2002-12-13 2003-11-18 用于选择性语音识别的方法和装置

Country Status (4)

Country Link
US (1) US6834265B2 (zh)
CN (1) CN100580769C (zh)
AU (1) AU2003295628A1 (zh)
WO (1) WO2004055778A2 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103117058A (zh) * 2012-12-20 2013-05-22 四川长虹电器股份有限公司 基于智能电视平台的多语音引擎切换系统及方法
CN103714814A (zh) * 2013-12-11 2014-04-09 四川长虹电器股份有限公司 一种语音识别引擎语音对接方法
CN103871409A (zh) * 2012-12-17 2014-06-18 联想(北京)有限公司 一种语音识别的方法、信息处理的方法及电子设备
CN105493180A (zh) * 2013-08-26 2016-04-13 三星电子株式会社 用于语音识别的电子装置和方法
WO2017128775A1 (zh) * 2016-01-28 2017-08-03 中兴通讯股份有限公司 一种语音控制系统、语音处理方法及终端设备
CN107657031A (zh) * 2017-09-28 2018-02-02 四川长虹电器股份有限公司 基于Android系统管理智能音箱语音技能的方法
US9959865B2 (en) 2012-11-13 2018-05-01 Beijing Lenovo Software Ltd. Information processing method with voice recognition
US10586554B2 (en) 2012-11-09 2020-03-10 Samsung Electronics Co., Ltd. Display apparatus, voice acquiring apparatus and voice recognition method thereof
CN111429911A (zh) * 2020-03-11 2020-07-17 云知声智能科技股份有限公司 一种降低噪音场景下语音识别引擎功耗的方法及装置
CN112071302A (zh) * 2016-10-03 2020-12-11 谷歌有限责任公司 计算代理的合成语音选择
CN113241066A (zh) * 2020-01-22 2021-08-10 广州汽车集团股份有限公司 语音交互方法及其系统、语音交互设备
CN113241067A (zh) * 2020-01-22 2021-08-10 广州汽车集团股份有限公司 一种语音交互方法及其系统、语音交互设备

Families Citing this family (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003295890A (ja) * 2002-04-04 2003-10-15 Nec Corp 音声認識対話選択装置、音声認識対話システム、音声認識対話選択方法、プログラム
US7398209B2 (en) 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
US7197331B2 (en) * 2002-12-30 2007-03-27 Motorola, Inc. Method and apparatus for selective distributed speech recognition
US20040138885A1 (en) * 2003-01-09 2004-07-15 Xiaofan Lin Commercial automatic speech recognition engine combinations
US7711568B2 (en) * 2003-04-03 2010-05-04 At&T Intellectual Property Ii, Lp System and method for speech recognition services
US20050177371A1 (en) * 2004-02-06 2005-08-11 Sherif Yacoub Automated speech recognition
US7340395B2 (en) * 2004-04-23 2008-03-04 Sap Aktiengesellschaft Multiple speech recognition engines
US7925510B2 (en) * 2004-04-28 2011-04-12 Nuance Communications, Inc. Componentized voice server with selectable internal and external speech detectors
JP4070745B2 (ja) 2004-05-21 2008-04-02 三洋電機株式会社 放送受信携帯端末
JP4429081B2 (ja) * 2004-06-01 2010-03-10 キヤノン株式会社 情報処理装置及び情報処理方法
US8589156B2 (en) * 2004-07-12 2013-11-19 Hewlett-Packard Development Company, L.P. Allocation of speech recognition tasks and combination of results thereof
EP1619662A1 (en) * 2004-07-22 2006-01-25 Alcatel Speech recognition system
US9224394B2 (en) * 2009-03-24 2015-12-29 Sirius Xm Connected Vehicle Services Inc Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
US8706501B2 (en) * 2004-12-09 2014-04-22 Nuance Communications, Inc. Method and system for sharing speech processing resources over a communication network
US7895039B2 (en) 2005-02-04 2011-02-22 Vocollect, Inc. Methods and systems for optimizing model adaptation for a speech recognition system
US7949533B2 (en) 2005-02-04 2011-05-24 Vococollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US7865362B2 (en) 2005-02-04 2011-01-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US7827032B2 (en) 2005-02-04 2010-11-02 Vocollect, Inc. Methods and systems for adapting a model for a speech recognition system
US8200495B2 (en) * 2005-02-04 2012-06-12 Vocollect, Inc. Methods and systems for considering information about an expected response when performing speech recognition
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
JP5394738B2 (ja) * 2005-08-09 2014-01-22 モバイル・ヴォイス・コントロール・エルエルシー 音声制御型ワイヤレス通信デバイス・システム
US7620549B2 (en) 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US8626152B2 (en) 2008-01-31 2014-01-07 Agero Connected Sevices, Inc. Flexible telematics system and method for providing telematics to a vehicle
US8837465B2 (en) 2008-04-02 2014-09-16 Twilio, Inc. System and method for processing telephony sessions
EP3484135A1 (en) 2008-04-02 2019-05-15 Twilio Inc. System and method for processing telephony sessions
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8964726B2 (en) 2008-10-01 2015-02-24 Twilio, Inc. Telephony web event system and method
US8515762B2 (en) * 2009-01-22 2013-08-20 Microsoft Corporation Markup language-based selection and utilization of recognizers for utterance processing
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US8509415B2 (en) 2009-03-02 2013-08-13 Twilio, Inc. Method and system for a multitenancy telephony network
US8315369B2 (en) 2009-03-02 2012-11-20 Twilio, Inc. Method and system for a multitenancy telephone network
US20110083179A1 (en) * 2009-10-07 2011-04-07 Jeffrey Lawson System and method for mitigating a denial of service attack using cloud computing
US8582737B2 (en) * 2009-10-07 2013-11-12 Twilio, Inc. System and method for running a multi-module telephony application
US9210275B2 (en) 2009-10-07 2015-12-08 Twilio, Inc. System and method for running a multi-module telephony application
US9171541B2 (en) * 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
WO2011091085A1 (en) 2010-01-19 2011-07-28 Twilio Inc. Method and system for preserving telephony session state
US9459926B2 (en) 2010-06-23 2016-10-04 Twilio, Inc. System and method for managing a computing cluster
US8416923B2 (en) 2010-06-23 2013-04-09 Twilio, Inc. Method for providing clean endpoint addresses
US9338064B2 (en) 2010-06-23 2016-05-10 Twilio, Inc. System and method for managing a computing cluster
US9459925B2 (en) 2010-06-23 2016-10-04 Twilio, Inc. System and method for managing a computing cluster
US20120208495A1 (en) 2010-06-23 2012-08-16 Twilio, Inc. System and method for monitoring account usage on a platform
US9590849B2 (en) 2010-06-23 2017-03-07 Twilio, Inc. System and method for managing a computing cluster
WO2011163538A1 (en) 2010-06-24 2011-12-29 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
US8838707B2 (en) 2010-06-25 2014-09-16 Twilio, Inc. System and method for enabling real-time eventing
US8649268B2 (en) 2011-02-04 2014-02-11 Twilio, Inc. Method for processing telephony sessions of a network
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US20140044123A1 (en) 2011-05-23 2014-02-13 Twilio, Inc. System and method for real time communicating with a client application
WO2012162397A1 (en) 2011-05-23 2012-11-29 Twilio, Inc. System and method for connecting a communication to a client
US9648006B2 (en) 2011-05-23 2017-05-09 Twilio, Inc. System and method for communicating with a client application
US10182147B2 (en) 2011-09-21 2019-01-15 Twilio Inc. System and method for determining and communicating presence information
EP2759123B1 (en) 2011-09-21 2018-08-15 Twilio, Inc. System and method for authorizing and connecting application developers and users
US9495227B2 (en) 2012-02-10 2016-11-15 Twilio, Inc. System and method for managing concurrent events
US9431012B2 (en) 2012-04-30 2016-08-30 2236008 Ontario Inc. Post processing of natural language automatic speech recognition
US9093076B2 (en) * 2012-04-30 2015-07-28 2236008 Ontario Inc. Multipass ASR controlling multiple applications
US9240941B2 (en) 2012-05-09 2016-01-19 Twilio, Inc. System and method for managing media in a distributed communication network
US9602586B2 (en) 2012-05-09 2017-03-21 Twilio, Inc. System and method for managing media in a distributed communication network
US20130304928A1 (en) 2012-05-09 2013-11-14 Twilio, Inc. System and method for managing latency in a distributed telephony network
US9247062B2 (en) 2012-06-19 2016-01-26 Twilio, Inc. System and method for queuing a communication session
US8737962B2 (en) 2012-07-24 2014-05-27 Twilio, Inc. Method and system for preventing illicit use of a telephony platform
US8738051B2 (en) 2012-07-26 2014-05-27 Twilio, Inc. Method and system for controlling message routing
US8938053B2 (en) 2012-10-15 2015-01-20 Twilio, Inc. System and method for triggering on platform usage
US8948356B2 (en) 2012-10-15 2015-02-03 Twilio, Inc. System and method for routing communications
KR20140054643A (ko) * 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
KR20140058127A (ko) * 2012-11-06 2014-05-14 삼성전자주식회사 음성인식장치 및 음성인식방법
US9601111B2 (en) * 2012-11-13 2017-03-21 GM Global Technology Operations LLC Methods and systems for adapting speech systems
US9253254B2 (en) 2013-01-14 2016-02-02 Twilio, Inc. System and method for offering a multi-partner delegated platform
KR102112742B1 (ko) * 2013-01-22 2020-05-19 삼성전자주식회사 전자장치 및 그 음성 처리 방법
US9282124B2 (en) 2013-03-14 2016-03-08 Twilio, Inc. System and method for integrating session initiation protocol communication in a telecommunications platform
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
US9001666B2 (en) 2013-03-15 2015-04-07 Twilio, Inc. System and method for improving routing in a distributed communication platform
US9225840B2 (en) 2013-06-19 2015-12-29 Twilio, Inc. System and method for providing a communication endpoint information service
US9160696B2 (en) 2013-06-19 2015-10-13 Twilio, Inc. System for transforming media resource into destination device compatible messaging format
US9338280B2 (en) 2013-06-19 2016-05-10 Twilio, Inc. System and method for managing telephony endpoint inventory
US9483328B2 (en) 2013-07-19 2016-11-01 Twilio, Inc. System and method for delivering application content
US9137127B2 (en) 2013-09-17 2015-09-15 Twilio, Inc. System and method for providing communication platform metadata
US9274858B2 (en) 2013-09-17 2016-03-01 Twilio, Inc. System and method for tagging and tracking events of an application platform
US9338018B2 (en) 2013-09-17 2016-05-10 Twilio, Inc. System and method for pricing communication of a telecommunication platform
US9553799B2 (en) 2013-11-12 2017-01-24 Twilio, Inc. System and method for client communication in a distributed telephony network
US9325624B2 (en) 2013-11-12 2016-04-26 Twilio, Inc. System and method for enabling dynamic multi-modal communication
DE102014200570A1 (de) * 2014-01-15 2015-07-16 Bayerische Motoren Werke Aktiengesellschaft Verfahren und System zur Erzeugung eines Steuerungsbefehls
US9344573B2 (en) 2014-03-14 2016-05-17 Twilio, Inc. System and method for a work distribution service
US9226217B2 (en) 2014-04-17 2015-12-29 Twilio, Inc. System and method for enabling multi-modal communication
US9516101B2 (en) 2014-07-07 2016-12-06 Twilio, Inc. System and method for collecting feedback in a multi-tenant communication platform
US9774687B2 (en) 2014-07-07 2017-09-26 Twilio, Inc. System and method for managing media and signaling in a communication platform
US9246694B1 (en) 2014-07-07 2016-01-26 Twilio, Inc. System and method for managing conferencing in a distributed communication network
US9251371B2 (en) 2014-07-07 2016-02-02 Twilio, Inc. Method and system for applying data retention policies in a computing platform
CN104202458A (zh) * 2014-09-02 2014-12-10 三星电子(中国)研发中心 一种自动保存联系人信息的方法和智能终端
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
US9626703B2 (en) 2014-09-16 2017-04-18 Voicebox Technologies Corporation Voice commerce
WO2016061309A1 (en) 2014-10-15 2016-04-21 Voicebox Technologies Corporation System and method for providing follow-up responses to prior natural language inputs of a user
US9749428B2 (en) 2014-10-21 2017-08-29 Twilio, Inc. System and method for providing a network discovery service platform
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
KR102387567B1 (ko) * 2015-01-19 2022-04-18 삼성전자주식회사 음성 인식 방법 및 음성 인식 장치
US9477975B2 (en) 2015-02-03 2016-10-25 Twilio, Inc. System and method for a media intelligence platform
US9948703B2 (en) 2015-05-14 2018-04-17 Twilio, Inc. System and method for signaling through data storage
US10419891B2 (en) 2015-05-14 2019-09-17 Twilio, Inc. System and method for communicating through multiple endpoints
US10659349B2 (en) 2016-02-04 2020-05-19 Twilio Inc. Systems and methods for providing secure network exchanged for a multitenant virtual private cloud
US10686902B2 (en) 2016-05-23 2020-06-16 Twilio Inc. System and method for a multi-channel notification service
US10063713B2 (en) 2016-05-23 2018-08-28 Twilio Inc. System and method for programmatic device connectivity
US20180025731A1 (en) * 2016-07-21 2018-01-25 Andrew Lovitt Cascading Specialized Recognition Engines Based on a Recognition Policy
US10714121B2 (en) 2016-07-27 2020-07-14 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments
US10331784B2 (en) 2016-07-29 2019-06-25 Voicebox Technologies Corporation System and method of disambiguating natural language processing requests
US10748531B2 (en) * 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
JP2019211599A (ja) * 2018-06-04 2019-12-12 本田技研工業株式会社 音声認識装置、音声認識方法およびプログラム
CN109949816A (zh) * 2019-02-14 2019-06-28 安徽云之迹信息技术有限公司 机器人语音处理方法及装置、云端服务器
CN111128154B (zh) * 2019-12-03 2022-06-03 杭州蓦然认知科技有限公司 一种聚合形成交互引擎簇的方法及装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2292781A (en) 1940-09-25 1942-08-11 Crown Cork & Seal Co Sheet handling and treating mechanism
US5087906A (en) 1990-03-05 1992-02-11 Motorola, Inc. Selective call receiver having a light channel for providing a visual alert
US5365574A (en) 1990-05-15 1994-11-15 Vcs Industries, Inc. Telephone network voice recognition and verification using selectively-adjustable signal thresholds
ZA948426B (en) 1993-12-22 1995-06-30 Qualcomm Inc Distributed voice recognition system
US6122613A (en) 1997-01-30 2000-09-19 Dragon Systems, Inc. Speech recognition using multiple recognizers (selectively) applied to the same input sample
US6101472A (en) * 1997-04-16 2000-08-08 International Business Machines Corporation Data processing system and method for navigating a network using a voice command
US6125345A (en) 1997-09-19 2000-09-26 At&T Corporation Method and apparatus for discriminative utterance verification using multiple confidence measures
US6006183A (en) 1997-12-16 1999-12-21 International Business Machines Corp. Speech recognition confidence level display
US6119087A (en) 1998-03-13 2000-09-12 Nuance Communications System architecture for and method of voice processing
US6229880B1 (en) 1998-05-21 2001-05-08 Bell Atlantic Network Services, Inc. Methods and apparatus for efficiently providing a communication system with speech recognition capabilities
US6269336B1 (en) * 1998-07-24 2001-07-31 Motorola, Inc. Voice browser for interactive services and methods thereof
US6185535B1 (en) 1998-10-16 2001-02-06 Telefonaktiebolaget Lm Ericsson (Publ) Voice control of a user interface to service applications
US6377922B2 (en) 1998-12-29 2002-04-23 At&T Corp. Distributed recognition system having multiple prompt-specific and response-specific speech recognizers
AU3165000A (en) * 1999-03-26 2000-10-16 Koninklijke Philips Electronics N.V. Client-server speech recognition
US6453290B1 (en) * 1999-10-04 2002-09-17 Globalenglish Corporation Method and system for network-based speech recognition
US7203651B2 (en) 2000-12-07 2007-04-10 Art-Advanced Recognition Technologies, Ltd. Voice control system with multiple voice recognition engines

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11727951B2 (en) 2012-11-09 2023-08-15 Samsung Electronics Co., Ltd. Display apparatus, voice acquiring apparatus and voice recognition method thereof
US10586554B2 (en) 2012-11-09 2020-03-10 Samsung Electronics Co., Ltd. Display apparatus, voice acquiring apparatus and voice recognition method thereof
US9959865B2 (en) 2012-11-13 2018-05-01 Beijing Lenovo Software Ltd. Information processing method with voice recognition
CN103871409A (zh) * 2012-12-17 2014-06-18 联想(北京)有限公司 一种语音识别的方法、信息处理的方法及电子设备
CN103871409B (zh) * 2012-12-17 2018-01-23 联想(北京)有限公司 一种语音识别的方法、信息处理的方法及电子设备
CN103117058B (zh) * 2012-12-20 2015-12-09 四川长虹电器股份有限公司 基于智能电视平台的多语音引擎切换系统及方法
CN103117058A (zh) * 2012-12-20 2013-05-22 四川长虹电器股份有限公司 基于智能电视平台的多语音引擎切换系统及方法
US11158326B2 (en) 2013-08-26 2021-10-26 Samsung Electronics Co., Ltd Electronic device and method for voice recognition using a plurality of voice recognition devices
CN105493180A (zh) * 2013-08-26 2016-04-13 三星电子株式会社 用于语音识别的电子装置和方法
US10192557B2 (en) 2013-08-26 2019-01-29 Samsung Electronics Co., Ltd Electronic device and method for voice recognition using a plurality of voice recognition engines
CN105493180B (zh) * 2013-08-26 2019-08-30 三星电子株式会社 用于语音识别的电子装置和方法
CN103714814A (zh) * 2013-12-11 2014-04-09 四川长虹电器股份有限公司 一种语音识别引擎语音对接方法
WO2017128775A1 (zh) * 2016-01-28 2017-08-03 中兴通讯股份有限公司 一种语音控制系统、语音处理方法及终端设备
CN112071302A (zh) * 2016-10-03 2020-12-11 谷歌有限责任公司 计算代理的合成语音选择
CN107657031A (zh) * 2017-09-28 2018-02-02 四川长虹电器股份有限公司 基于Android系统管理智能音箱语音技能的方法
CN113241066A (zh) * 2020-01-22 2021-08-10 广州汽车集团股份有限公司 语音交互方法及其系统、语音交互设备
CN113241067A (zh) * 2020-01-22 2021-08-10 广州汽车集团股份有限公司 一种语音交互方法及其系统、语音交互设备
CN113241067B (zh) * 2020-01-22 2022-04-22 广州汽车集团股份有限公司 一种语音交互方法及其系统、语音交互设备
CN113241066B (zh) * 2020-01-22 2022-04-22 广州汽车集团股份有限公司 语音交互方法及其系统、语音交互设备
CN111429911A (zh) * 2020-03-11 2020-07-17 云知声智能科技股份有限公司 一种降低噪音场景下语音识别引擎功耗的方法及装置

Also Published As

Publication number Publication date
CN100580769C (zh) 2010-01-13
WO2004055778A2 (en) 2004-07-01
US6834265B2 (en) 2004-12-21
AU2003295628A1 (en) 2004-07-09
AU2003295628A8 (en) 2004-07-09
WO2004055778A3 (en) 2005-02-03
US20040117179A1 (en) 2004-06-17

Similar Documents

Publication Publication Date Title
CN100580769C (zh) 用于选择性语音识别的方法和装置
US8886540B2 (en) Using speech recognition results based on an unstructured language model in a mobile communication facility application
US10056077B2 (en) Using speech recognition results based on an unstructured language model with a music system
US8949130B2 (en) Internal and external speech recognition use with a mobile communication facility
US8996379B2 (en) Speech recognition text entry for software applications
US6912581B2 (en) System and method for concurrent multimodal communication session persistence
US8838457B2 (en) Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility
US20080221899A1 (en) Mobile messaging environment speech processing facility
US20090030687A1 (en) Adapting an unstructured language model speech recognition system based on usage
US20090030697A1 (en) Using contextual information for delivering results generated from a speech recognition facility using an unstructured language model
US20090030685A1 (en) Using speech recognition results based on an unstructured language model with a navigation system
US20090030691A1 (en) Using an unstructured language model associated with an application of a mobile communication facility
US20030167172A1 (en) System and method for concurrent multimodal communication
US20090030688A1 (en) Tagging speech recognition results based on an unstructured language model for use in a mobile communication facility application
US20080288252A1 (en) Speech recognition of speech recorded by a mobile communication facility
US20060122836A1 (en) Dynamic switching between local and remote speech rendering
US6983250B2 (en) Method and system for enabling a user to obtain information from a text-based web site in audio form
US20030187944A1 (en) System and method for concurrent multimodal communication using concurrent multimodal tags
CN1617559A (zh) 顺序多模输入
CN1658635A (zh) 导航应用的方法和系统
JP2002123283A (ja) 音声認識操作装置
CN1663260A (zh) 在电信设备电话会议期间当用户占用线路时的辅助信息传输
KR100716147B1 (ko) Vxml을 이용하여 이동통신 단말기에 메뉴 네비게이션서비스를 제공하는 서버, 시스템 및 방법
EP1714224A1 (en) Method and system of bookmarking and retrieving electronic documents
CN103903620B (zh) 控制UPnP设备的方法、系统与UPnP控制设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MOTOROLA MOBILE CO., LTD.

Free format text: FORMER OWNER: MOTOROLA INC.

Effective date: 20110111

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20110111

Address after: Illinois State

Patentee after: MOTOROLA MOBILITY, Inc.

Address before: Illinois, USA

Patentee before: Motorola, Inc.

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Illinois State

Patentee after: MOTOROLA MOBILITY LLC

Address before: Illinois State

Patentee before: MOTOROLA MOBILITY, Inc.

TR01 Transfer of patent right

Effective date of registration: 20160304

Address after: California, USA

Patentee after: Google Technology Holdings LLC

Address before: Illinois State

Patentee before: MOTOROLA MOBILITY LLC

CX01 Expiry of patent term

Granted publication date: 20100113

CX01 Expiry of patent term