CN1298249A - 无线装置的基于用户界面的语音识别 - Google Patents
无线装置的基于用户界面的语音识别 Download PDFInfo
- Publication number
- CN1298249A CN1298249A CN00128488A CN00128488A CN1298249A CN 1298249 A CN1298249 A CN 1298249A CN 00128488 A CN00128488 A CN 00128488A CN 00128488 A CN00128488 A CN 00128488A CN 1298249 A CN1298249 A CN 1298249A
- Authority
- CN
- China
- Prior art keywords
- user
- speech
- data file
- accordance
- symbol data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 claims abstract description 99
- 238000000034 method Methods 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 9
- 230000006855 networking Effects 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000001413 cellular effect Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 5
- 238000010295 mobile communication Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims 10
- 238000012552 review Methods 0.000 abstract 1
- 238000003860 storage Methods 0.000 description 18
- 230000008676 import Effects 0.000 description 15
- 230000008901 benefit Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012856 packing Methods 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000007474 system interaction Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 208000015976 Corneal dystrophy-perceptive deafness syndrome Diseases 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/60—Medium conversion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2207/00—Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place
- H04M2207/18—Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place wireless networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
一种无线通信系统,用远端语音识别服务器系统翻译从移动装置接收的语音输入为符号数据文件,如字符或控制符,这种文件可由移动装置进行处理。翻译处理是从接收的移动装置与语音识别服务器间的语音通信信道建立开始。然后移动装置用户按一种可由语音识别服务器系统检测的方式开始讲话。当检测到用户语音时,语音识别服务器系统翻译该语音为符号数据文件,该文件然后经分别的数据通信信道被传送给用户。当在移动装置接收到该符号数据文件时,该用户浏览和编辑其内容并按其需要进一步利用该文件。
Description
一般来说,本发明涉及数据通信,具体地,是涉及利用基于网络的语音识别资源来增强本机用户界面(user interface)的双向无线通信装置。
基于超文本技术的使用已经拓宽了无线通信系统的范畴。双向无线装置,本说明书中也称为移动装置,和无线网络协议已经被设计得允许通过各种无线和有线网络交互地访问远端信息服务(例如,商业数据库、电子邮件、在线购物),这些网络最明显的是因特网和一些专用网。
许多移动装置(例如,蜂窝电话)是面向消费者大众市场的装置。因此,在不限制装置功能的情况下,其用户界面应当是简单并容易使用的。当前,对于大多数移动装置的主要数据输入方法是键盘,但当用于输入很长的字符串时,键盘输入方法是相对低效率的。由于尺寸的限制和成本的考虑,对于起草需要大量用户输入的消息(例如,Email消息),这些移动装置的键盘不是一种特别用户友好的界面。这种类型装置的键盘通常具有12至24个之间的键,对于数字输入有足够数量的键,但当涉及对于具有网络功能装置的字符数据输入就显得非常不够。
从因特网要求信息的用户一般利用浏览器通过全球网(WWW)进行导航。例如,利用InfoseekTM作为搜索引擎对斯坦福大学要求信息的用户将必需输入以下字符串:
“http://www.Infoseek.com”后接“Stanford University”
列在上面的搜索字符串包括40个字符。用户利用标准台式计算机键盘和浏览器(例如,Netscape或Explorer)输入这种类型的字符串是没有问题的。但是,同样的用户操作移动装置的键盘通过紧凑的键盘和各个键之间密集的间隔输入相同字符串就相当困难了。
因特网的通常用途之一是电子邮件。希望发一个具有上述段落尺寸的电子邮件消息的用户将必需输入超过400个字符。利用台式计算机的标准键盘,用户可能用低于2分钟(假设该用户具有平均熟练程度的打字水平)输入那些字符。然而,在移动装置的键盘上输入同样数量的击键可能要用相当长的时间并且变得非常冗长乏味以及容易出错。
近来,语音识别(VR)技术的进步和硬件能力的增加使得台式系统的基于语音识别的用户界面的开发成为商业可用的。VR技术提取讲话的单词并翻译这些单词为一种可以容易由数字系统操作和显示的格式。这些开发成果已经试图装备具有VR技术的紧凑的移动装置,但是,这些努力一般都要求昂贵的器件修改,诸如额外的部件(例如,DSP(数字信号处理)芯片)或增加处理和存储能力。一部典型的蜂窝电话具有等效于低于一般台式或便携计算机的百分之一的计算资源。在不修改该装置的部件的情况下,按比例缩小运行VR应用的电话可能仅仅能够识别很少一组预定的讲话单词。
近来,对于台式和膝上计算机的语音识别软件(例如,来自Dragonsystem,Inc.的Naturally Speaking;来自Apple Computer的PlainTalkTM,来自IBM的Viavoice 98TM和来自Philips Talk的FreeSpeech 98TM)每个许可证一般都在39美元到数百美元。这个数目代表了装有可比的应用软件的移动装置价格的相当大一部分。
在每个移动装置中装入语音识别应用软件并修改其硬件部件以运行该应用程序对手机制造商在他们的装置中加入VR功能起到一种在财务上的阻碍作用。这些修改可能要使该移动装置的最后价格增加可观的成本,可能使通常由大众市场拥有的移动装置的价格超出目标价格范围(例如,150美元)。
就硬件资源而言,这些应用程序可以要求对于每种支持的语言的高达60兆字节的存储器。另外,大多数商用语音识别应用软件被设计为针对相对快速的处理器(例如,133MHz奔腾处理器)。
因此,对能以最有效的方式使移动装置与数字计算机网进行交互通信的设备和方法存在着很大的需求。在不需要显著改动硬件资源或提高成本的情况下,结合标准移动装置用户界面(例如,电话键盘)的利用语音识别的能力可以极大地改善利用有限资源的具有网络能力的移动装置的可用性和商业生存性。
本发明涉及一种利用遥控语音识别服务器系统的无线通信系统,该服务器系统翻译从移动装置接收的语音输入到一种可以由移动装置处理的符号数据文件(例如,字符数字或控制字符)。这种翻译处理是通过移动装置与语音识别服务器之间建立的语音通信信道开始的。然后,移动装置的用户以一种用可由语音识别服务器系统检测的方式开始讲话。当检测到该用户的话音时,语音识别服务器系统翻译该话音为符号数据文件,然后该文件通过另外的数据通信信道转移给用户。当在移动装置接收到符号数据文件时,该用户检查并编辑该符号数据文件,并且按需要进一步利用该文件。例如,用户可以利用该符号数据文件填充一个电子邮件中的各个字段或者一个浏览器请求字段。
本发明可以按各种方式实现,包括按照一种方法、一种设备或一种装置、一种用户界面、一种计算机可读的存储器和一种系统。下面讨论本发明的若干实施例。
按照一个实施例,本发明是一种用于在不具有执行语音识别本地处理的资源和/或软件的移动装置中获得语音识别服务的方法。该方法包括驻留在该移动装置中的本地应用程序建立和协调该目标移动装置与运行语音识别应用程序的远端服务器系统(在本说明书称为语音识别服务器系统)之间的语音信道。
当建立了语音信道后,该目标移动装置的用户排队(queuing)开始对该移动装置(例如,蜂窝电话)的麦克风讲话。作为这个交互的结果,在语音识别服务器系统接收到的语音输入被变换为符号数据文件。这个处理可以利用以前存储的用户专用数据文件帮助进行。然后,该符号数据文件被传送回始发的移动装置或者通过另外建立和协调的数据通信信道转移到一个指定的第三方装置。符号数据文件可以被用于与该移动装置上本地应用程序进行交互通信,或者与网络资源(例如,因特网的服务器或专用网)进行交互。
连同前面的描述,下面的描述和附图,可以说明本发明的其它目的和优点。
通过结合附图的下面的详细描述本发明将会获得很容易的理解,其中各标记是表示各个结构部件,和其中:
图1表示可以实施本发明的示意性结构;
图2A表示典型的有语音能力的移动装置的显示器和用户界面部件;
图2B表示一种示例性有语音能力的移动装置功能性方框图;
图3表示按照本发明的一个优选实施例的链路服务器装置的功能性方框图;
图4是表示按照本发明的一个实施例的语音识别服务器的示例性的各个处理级的示意性图;
图5表示说明关于移动装置与语音识别服务器系统之间的各种操作的各个屏幕显示。
图6表示根据按本发明的一个实施例的移动装置方面的处理流程图;
图7表示根据按本发明的一个实施例的语音识别服务器方面的处理流程图。
在下面的本发明的详细描述中,描述了许多具体细节以便对本发明有全面的理解。但是,对于本专业的技术人员而言不用这些具体的细节也可以实施本发明。在另外的情况下,没有详细地描述各公知的方法、程序、部件和电路,这样作是为了避免不必要地混淆了本发明的主要方面。在下面的本发明的详细描述是很大方面体现在关于程序、步骤、逻辑方框、处理、和耦合到网络上的类似数据处理装置的其它符号表示。这些处理描述和表示是本专业的技术人员有效传达他们的工作成果给本专业的其他技术人员所使用的手段。
本发明涉及使一个移动装置能根据联网的语音识别服务器系统接入(access)语音识别服务的各种系统和方法。按照本发明的一个实施例,语音识别服务是通过在希望用语音识别服务的移动装置用户与联网的语音识别服务器系统之间建立一个语音信道而接入的。
一旦建立语音信道,当语音识别服务器系统准备好接收话音信号时,移动装置的用户排队开始讲话。接收的话音信号由语音识别服务器系统利用现有技术公知的语音识别技术(例如,模板匹配、傅立叶变换或线性预测编码(LPC))进行处理并产生符号数据文件。
符号数据文件是一种与接收的语音信号具有某种关系,按照由语音识别系统翻译的,含有指定对象、数量、操作、功能、音素、单词、词组或其任何组合的多个字母、音素、单词、数字、对象、功能、控制字符或其它常规标记的文件。各种语音识别系统一般使用语音模板、傅立叶变换编码、或线性预测编码方案来映射语音的输入成分为预存储的符号构造块。符号数据文件的例子包括ASCII文件和二进制数据文件。
为了使本发明容易描述,列举某些可以应用本发明的通信系统的特点是有用的。图1到图4提供了原理性系统部件的概况。
参照图1,表示一种按照本发明的一个实施例的典型通信系统的方框图。移动装置102和103通过话音通信信道接收电话呼叫和超媒体(hypermedia)信息(例如,超文本标记语言(Hyper Text Markup LanguageHTML))文件、紧凑超文本传输协议(cHTML)文件、可扩充标记语言(ExtensibleMarkup Language XML)文件、手持装置标记语言(HDML)文件、或无线标记语言(WML)文件、或者类似的数据类型,这些文件是从远端服务器装置通过宽带或窄带(例如,SMS)数据通信信道接收的,这些信道可以包括链路服务器装置106和短消息服务中心107。
移动装置102和103的每个都有一个显示器和一个用户界面。此外,移动装置102和103可以具有存储在本机存储器(也称为客户机模块)中的一个微浏览器(例如,Phone.com公司的微浏览器,800Chesapeake Drive RedwoodCity,CA,94063),使得该装置处理从远端服务器装置接收的超媒体信息。
如图1所示,移动装置102和103可以通过无线运营商(carrier)网络104(这里也称为无线网络)被耦合到链路服务器装置106。移动装置102和103可以是从一组装置中提取的,这一组装置包括移动电话、带有语音发送和/或接收能力的掌中计算装置和个人数字助理。语音能力被定义为装备在移动装置中允许用户传送/接收语音信息到/从远端目的地(例如,到另外的用户或装置)的能力。
接入到语音通信信道一般要求该用户和/或装置是由无线运营商网络104进行身份识别。网络识别包括一个目标移动装置与无线运营商网络104之间身份识别信息的交换。一般,所述该用户和/或移动装置的身份识别信息被存储在该装置的存储器中,并且当该用户试图进入网络时进行自动发送。
无线运营商网络104可以是任何一种公知的无线通信网络(例如,蜂窝数字分组(CDPD)网、全球系统移动通信(GSM)网、码分多址(CDMA)网、个人手持电话系统(PHS)或时分多址(TDMA)网)。链路服务器装置106还被耦合到与语音识别服务器系统109和由网络服务器113代表的多个联网的服务器相耦合的有线网108。
语音识别服务器系统109是由服务器装置110与存储设施112组成的,该存储设施112能够存储与一个运营商实体所服务的多个用户相关的用户专用文件等。该用户专用文件与语音识别处理结合使用并且在一个实施例中是本发明的一部分。
用户专用文件的例子可以包括用户专用语音模板、一个或多个用户规定的语言词典(例如,法语、英语、德语或广东话)和个别用户高频词汇的一个或多个用户专用的词典或表。这些文件可以利用联网的多媒体计算机(例如,多媒体计算机140)或者通过被服务的移动装置的用户界面进行上载和管理。例如,语音模板是通过用户读一个预定脚本到一个具有语音功能装置中产生的。用户的喜好(例如,选择语言)可以利用在移动装置的显示器上提供给用户的菜单选择屏进行输入,或经有线网连接到语音识别服务器系统的其它装置输入。
为了简化起见,天线121代表无线运营商的基础设施,一般包括基站和操作与维护中心。基站控制与移动装置102和103的无线或电信链路。操作与维护中心包括移动交换中心,该中心在各个移动装置与其它固定的或移动网络用户之间交换呼叫。另外,操作与维护中心管理移动通信计费业务,诸如验证、监管正确操作和无线网络建立。对于本专业技术人员运营商的基础设施121中的每个硬件部件和处理都是公知的,为了避免不必要地混淆了本发明的主要方面,这里不再赘述。
空中网104所有的通信协议例如可以是无线接入协议(WAP)或手持装置传输协议(HDTP)。有线网108是一个陆基网,该网可以是因特网、专用网或任何专用网的数据网。一般,支持陆地网118的通信协议可以是传输控制协议(TCP/IP)、超文本传输协议(HTTP)、或安全超文本传送协议(sHTTP)。
链路服务器装置106和网络服务器113一般是计算机工作站,例如SunMicrosystem公司(http://www.sun.com)的具有联网资料库和因特网连接的SPARC的工作站。网络服务器113代表耦合到陆地网108的多个联网服务器和能够提供访问包含移动装置102和103的信息的超媒体信息。
链路服务器装置106被描述为一个独立的装置并因此经常被称为网关或无线数据服务器。链路服务器106可以被组成为按照无线网104与有线网108之间的一个桥路进行操作。应当指出的是,链路服务器106的功能可以由连接到有线网108的具有现有技术公知的提供无线网104与有线网108之间连接的其它装置来执行。
前面描述的语音通信信道一般是由语音信道126代表的。这个通信信道通常利用现有技术公知的用于建立电话呼叫的基础设施和处理过程进行建立和协调的。
一般,存在着两种给移动装置102和103提供服务的数据通信信道的类型。数据通信信道128代表宽带数据通信信道。数据通信信道130代表窄带数据通信信道,例如,短消息通信(SMS)服务信道。这些数据通信路径的任何一种都可以被用于传送数据到/从移动装置102和103。
按照本发明的优选实施例,希望从语音识别服务系统109接收语音识别服务的移动装置(例如,移动装置102或103),首先建立一般由语音信道126代表的语音信道。用于语音识别服务系统109的联络信息(例如,电话号码或统一的资源指示符(URI))可以插入到装入移动装置的软件中、从链路服务器装置106中检索或者由用户直接输入。
一旦在正在请求的移动装置与语音识别服务器系统109之间建立语音信道,用户信息被转移到该语音识别服务器系统。这允许以前存储的用于正在请求的移动装置的用户专用文件将被访问和利用。用户信息可以在分别的数据通信信道(例如,数据通信信道128或130)上进行发送,或者由用户输入。一般,用户的专用文件给一个具体用户帐户提供专用的功能特征。例如,用户可以对语音识别处理规定一种或多种语言选择。
一旦用于目标移动装置/用户的用户专用文件被检索到,该用户被提示提供语音输入(例如,开始讲话)。注意,用户可以在利用语音识别服务的同时,利用移动装置的用户界面(例如,电话键盘)这一点是重要的。当用户已经完成他们与移动装置输入交互(语音和物理输入)时,可以由用户(语音的或键输入的)提供一个指示结束输入阶段。然后,语音识别服务器系统109变换语音输入为符号数据文件,该文件经链路服务器106被转送到发出请求的移动装置。
正如前面所述,符号数据文件是一种含有当由语音识别系统进行翻译时与接收的语音信号有某种关系的用于指示对象、数量、操作、功能、音素、单词、短语或其任何组合的多个字母、音素、单词、数字、对象、功能、控制符或其它常用标记的文件。一般,语音识别系统利用语音模板、傅立叶编码、或线性预测编码方案映射接收的输入组成部分到预存储的符号构造块。符号数据文件的例子包括ASCII文件和二进制数据文件。
符号数据文件可以开始被转送到链路服务器装置106,该装置可以在经宽带信道128或窄带信道130发送到请求的移动装置的符号数据文件之前执行附加处理。然后,移动装置的用户可以查看接收的符号数据文件和按照需要使用。
语音识别服务器系统109的语音识别应用程度的准确度在很大程度上取决于使用的翻译方法学和使用的语言词典的大小和语种。一般,与讲话者相关的方法学(例如,模板匹配)具有高达98%的准确度,和与讲话者无关的方法学(例如,傅立叶变换和线性预测编码(LPC))具有90-95%范围(www.hitl.washington.edu-Voice Recognition,Jim Baumann)的准确度。
根据本发明的原理,如果语音识别应用程序曾由该装置执行过,则移动装置(例如,移动装置102和103)的用户可以在这些移动装置上访问语音识别服务器,而无需大的硬件或软件的修改。另外,因为执行语音识别处理器的软件驻留在以高处理速度(与移动装置相比)和大存储容量的可访问的远端服务器装置,可以给该装置的用户提供具有全部功能特征的语音识别应用程序相关的功能和资源。例如,语音识别应用可以访问大的语言词典、对多种语言可选择的语言词典、和用户专用文件(例如,语音模板和用户定制的词典和表)。
图2A描述一种示例性移动装置200,该移动装置对应于图1中的各移动装置(102或103)之一。移动装置200包括显示屏204、扩充的电话型键盘210、光标导航键222和224、一对软键(softkey)208A和208B、送话器212A和麦克风212B。显示屏204一般是能够显示文本信息和某些图形的液晶显示器(LCD)显示屏。扩充的电话键盘210最好包括具有附加键的常规的电话键盘,这些附加键提供一些附加的字符(例如,空格)和功能(例如,退格或清除)。
光标导航键222和224允许用户重新置位光标或一个元件指示符216,例如,激活显示在显示屏204上的各个应用程序之一。通用键208A和208B一般被用于执行如由软功能识别符214和215所指示的应用程序专用功能。应当由本专业技术人员理解的是,实施本发明并不要求一定具有常规电话键盘。因为某些移动装置有时完全没有物理的键,诸如掌中计算装置利用软键或图标作为输入机构。
当利用相关的链路服务器装置(例如,图1的链路服务器装置106)建立通信会话时,移动装置200一般接收一个或多个标记语言卡组(markuplanguage card deck)以帮助用户与装置交互。取决于实施中的优先次序考虑,标记语言卡组,另外还可以被称为屏幕描述命令文件,可以是标记语言的,但并不限于此,还可以包括手持装置标记语言(HDML)、超文本标记语言(HTML)、紧凑HTML、无线标记语言(WML)、标准通用标记语言(SGML)、可扩充标记语言(XML)。或者,数据文件可以是对应的标记文件的一种被剥离、被压缩、编辑或被变换的版本。
出现在图2A的LCD屏幕204上的正文是这种显示屏的一个例子。在这个例子中,提供给用户下列选项的选择:
1)书签
2)内部搜索(Search Int)
3)电子邮件
4)新闻
每种选择一般链接到网络的资源,或者是本地的软件应用程序。用户可以从上述菜单上利用导航键222和224通过用户选择的元件指示符216进行选择。这种相同的方法可以被利用在提供用于与远端服务器装置(例如,图1的语音识别服务器系统109)的用户提示上。
现在参照图2B,是移动装置250的更详细的描述,装置250可以是图1的移动装置102或103和图2的200。移动装置250包括:耦合到运营商无线网104的无线控制协议(WCP)接口252,该接口接收输入和输出的信号。装置识别符(ID)存储器254存储并提供装置ID给WCP接口252,用于外部实体(例如,图1的链路服务器装置)识别移动装置250的用途。装置ID是一个与移动装置250相关的特定的码,并且直接与相关用户帐户中的装置ID相关联,一般帐户在相关的链路服务器装置(例如,图1的106)中提供。
移动装置250包括处理器268、编码器/解码器电路264、工作存储器258和客户机模块256。客户机模块256是装载在装置存储资源中的软件部件,这些软件执行移动装置250执行的许多处理任务,包括:经由无线运营商网络104建立与链路服务器装置的通信会话、操作和维护本地应用、在移动装置250的显示屏260上显示信息、和接收来自键盘262的用户输入。客户机模块256可以与把软件装载在计算装置中非常相似的方式装载在移动装置250的存储器中。
此外,移动装置250包括语音回路266,用于变换语音活动为可以在数字和模拟通信系统中发送和接收的电脉冲。这些部件及其功能在现有技术中是公知的并将不予赘述。
按照本发明的原理,装入移动装置250中的软件包括:在运行语音识别应用程序中对用户与服务器装置交互提供帮助的部件。该提供帮助的软件可以作为微浏览器或其它应用软件的一部分,或者作为单独的应用程序装入。这个应用程序负责诸如对服务器装置提供服务、接收符号数据文件的管理、和用户喜好的输入/变更之类任务的检索和存储联络信息。用户帮助可以例如是屏幕显示信息、可闻或触觉提示和/或软键映射功能的形式。
例如,结合一种应用程序(例如,电子邮件消息)希望利用语音识别服务的用户可以访问感兴趣的应用程序和激活一个软键来访问语音识别服务器。然后与软键相关的功能将检索对于运行语音识别应用程序的服务器装置的联络信息,如果尚未存储,和处理将按照上述进行处理。提供这个例子的目的是为了说明,它不是对本发明范围的限制。
图3示意性地说明链路服务器装置340的各原理性部件,装置340可以对应于图1的链路服务器装置106。链路服务器装置340是作为有线网300与无线网320之间的网关进行操作的服务器计算机。为了避免与本发明的主要部分相混淆,在链路服务器装置340中的公知方法、程序、部件和电路不详细描述了。
链路服务器装置340包括:耦合到有线网300的陆地控制协议(LCP)接口358、和耦合到无线网320的无线控制协议(WCP)接口341。服务器模块310耦合在LCP接口358与WCP接口341之间。
服务器模块310执行传统的服务器处理以及从一种通信协议到另外一种通信协议的协议变换处理。消息处理器316是用于协议变换和相关任务的一个部件。在协议变换的情况下(例如,HDTP和HTTP之间),变换一般是数据映射处理。本专业的技术人员将理解到,WCP接口341取决于无线网和使用的协议,可以由其他接口模块替代。当有线网和协议改变时,同样LCP接口358也可以由其他接口替代。
服务器模块310还包括:帐户管理器312有帐户接口314。帐户管理器312管理多个用户帐户,一般这些移动装置的每个都是由链路服务器装置340服务的。应当理解为,用户帐户信息可以被存储在耦合到链路服务器装置340的另外的网络服务器中。换言之,用户计费可以保持在一个物理上放置在经有线网耦合到链路服务器装置340的任何计算装置中的数据库中。
由链路服务器装置340服务的每个移动装置被分配一个身份识别符(ID)或装置ID。装置ID可以是该装置的电话号码或IP地址、或者是IP地址和端口号的组合,例如,204.163.165.132:01905,其中204.163.165.132是IP地址和01905是端口号。装置ID作为在激活的用于移动装置的用户帐户中涉及的过程一部分还与由运营商控制的链路服务器装置340建立和管理的用户ID相联系。用户ID可以关联于并用来访问与一个特定用户或装置相关的用户专用文件(例如,图1的112)。
用户ID可以采取例如,AT&T无线服务商的861234567-10900-pn.mobile.att.net形式,并对用户移动装置是唯一的识别符。帐户管理器312负责产生对于允许与链路服务器装置340进行安全通信的移动装置的用户计费。在这种情况下,帐户管理器312保证对由链路服务器装置340提供服务的移动装置适当的安全访问水平。
链路服务器装置340还包括处理器318和存储资源320作为主要硬件部件。处理器318在服务模块310的控制下执行操作。本专业技术人员将理解,链路服务器装置340可以包括一个或者多个处理器(例如,处理器318)、工作存储器(例如,存储器资源320)、各个总线、各个接口和其他部件,和代表一个或多个装入链路服务器装置的340的工作存储器执行指定功能的软件模块。相同的特性同样可应用到客户机模块和目标移动装置的硬件部件。
一般,支持陆地网300的陆地网通信协议(LCP)可以包括传输控制协议(TCP)、超文本传输协议(HTTP)或安全超文本传输协议(HTTPS)、和无线通信协议(WCP)可以包括(TCP)、(HTTP)或(HTTPS)、手持装置传输协议(HDTP)或无线电会话协议(WSP)。在不同于WCP的LCP的情况下,服务器模块310包括用于从一种协议映射到另外一种协议的映射模块(即,映射器),使得耦合到无线网320的一个移动装置可以与耦合到有线网300的装置进行通信。
一旦接收的语音信号被语音识别服务器系统(未示出)进行处理,符号数据文件被产生并发送到链路服务器装置340。符号数据文件由管理处理器316经LCP接口358进行接收。管理处理器316变换符号数据文件为可能是在无线网320上传输最佳(按照无线网的协议要求和发出请求的移动装置的装置特性)的数据格式。当从语音识别服务器系统接收时,该符号数据文件可以是由消息处理器316理解的一种格式,例如,标记语言(例如,HTML)或文本文件(例如,ASCII)。被处理的符号数据文件可以经重新形成格式,以便与正在请求的移动装置相兼容,然后该文件被转送到该请求移动装置或到指定的第三方装置。
参照图4,表示出一个示例性语音识别服务器系统460的功能模块(可以对应于图1的语音识别服务器系统109),该模块执行下列处理:1)语音检测,2)语音分析,3)模式匹配和4)符号文件产生。在语音检测462期间,语音识别服务器系统460检测在其输入中的语音信号的存在。当检测到时,接收的语音信号经过语音分析处理464,在此该语音信号被减少到对模式匹配可用的可量化指标。在模式匹配级466期间,可量化指标与存储在存储装置480中的用户语音模板(如果利用根据模板语音识别处理)进行比较,该存储装置可以是各种语言的词典和多个用户专用文件。如上面所述,符号数据文件经有线网300(见图3)被转移到语音识别服务器340。本专业技术人员将理解,不脱离本发明的范围,可以使用其他的语音识别方案(例如,傅立叶变换或者线性预测编码(LCP))。本专业技术人员还将理解为,链路服务器装置(例如,图1的106)可以执行语音识别服务器系统(例如,图1的109)的功能。
图5表示涉及请求语音识别服务的移动装置与语音识别服务器系统之间的交互会话的多个示例性显示屏。开始,显示屏500允许用户在手工输入504和VR(语音识别)帮助输入508之间进行选择。用户选择是由选择指示符512指示的。在这个例子中,VR帮助输入512可以通过激活与软键功能指示符516相关的软键进行选择的。这种选择检索提供服务的语音识别服务器系统的联络信息。在这个例子中,联络信息包括电话号码(例如,650-555-7272)。本专业技术人员将理解为,联络信息还可以包括统一资源识别符(URI)或者类似的唯一识别符。用于访问用户专用文件的相关用户和/或装置的识别信息可以在后台进行传送(例如,利用另外的数据信道或语音通信信道)或者由用户输入。
当取出语音识别服务器系统联络信息522时,如显示屏520所示,可以通过激活与软键功能指示符524相关的软键(OK),建立语音信道。显示屏530表示信息的类型,它可以提供给请求移动装置的用户。字符串532给用户提供关于建立与提供服务的语音识别服务器系统的通信会话状态的信息。字符串534提供给用户关于用于处理该用户的请求设置的信息。这可能包含一个简单的字符串(例如,“Initializing Default Settings”)或多个交互和非交互的显示,这些显示允许用户输入选择(例如,语言的选择)。当服务的语音识别服务器系统准备好接收输入时,给用户呈现一个提示536(“开始讲话”)。用户可以通过激活与软键功能指示符538相关的软键结束输入会话。
语音识别服务器可以被构成为与驻留在发请求的移动装置中的特定应用程序进行交互。例如,可以产生经处理的符号数据文件,用作对一个诸如电子邮件之类的应用程序中的特定字段的输入。另外,一旦用于语音识别服务的激活的语音信道被建立起来,用户可以利用该服务改变应用程序,而不用关闭和重建语音通信信道。例如,用户可以在电子邮件程序与个人事务安排程序之间进行转换。这个特点降低了用户的成本和网络的拥塞。
现在参照图6和图7,分别表示按照本发明的一个实施例的描述移动装置与语音识别服务器操作的处理流程图。图6和图7两者都应当结合图1进行理解。
按照本发明的一个优选实施例,一个希望语音识别服务的用户将通过利用本机用户界面(例如,通过按一个键)启动对于服务的请求。一般,用户可以利用驻留的应用程序(例如,电子邮件或web浏览器)结合所希望的任务进行启动。作为该请求的结果,返回到移动装置的信息可能被插入与正在执行的任务相关的文件中。
该请求的处理产生将建立在请求服务的移动装置与提供服务的语音识别服务器系统之间的语音信道。一旦该语音信道被建立和用户排队开始讲话,该用户可以开始与移动装置的输入交互,该输入除了语音输入外,可能包括利用本机用户界面(例如,电话键盘)进行物理输入。当完成与移动装置的初始输入交互时,用户可以选择保持语音信道开通的开通状态并执行另外的任务或者结束该语音信道。
图6是说明由移动装置(例如,移动装置102和103)使用的从相应的移动装置与远端语音识别服务器系统(例如,语音识别服务器系统109)进行交互的处理600的流程图。在604,作出是否在目标移动装置与提供服务的语音识别服务器系统之间存在一个有效语音信道的确定。这个处理通常发生在软件控制的后台中。
如果存在一个激活的语音信道,则用户在608被提示提供一个输入,表示用户是否希望禁止该激话语音信道。这可能是这样一种情况,即对于计划的用该移动装置的输入交互,用户不要求VR服务。
如果用户判断禁止语音信道,则在612禁止语音信道。然后用户前进到物理输入628,使用该装置的用户界面(例如,键盘)。在622,作出是否用户的输入(例如,物理输入628)已经进行了寄存(例如,输入被装置接受)的判断。如果用户的输入被寄存,则在632进行处理并且用户在636被提示提供表示是否继续输入会话或者结束之。如果用户选择了结束,则在640作出所建立的语音信道/回路(即,语音信道/回路有效)的状态的确定。正如在上面所描述的那样,这种检查通常发生在后台中。在上面描述的序列中,不存在激活语音信道,这样处理将被结束。
如果在608,用户判断采用语音信道,则将可能是对于移动装置输入交互,用户试图使用语音识别服务的这样一种情况,然后用户提供语音输入624和物理输入628,并且在622作出是否用户的输入已经被寄存的确定。如果用户的输入已经被寄存,则在632进行处理,并且用户在636被提示提供是否用户希望继续输入会话或者结束会话的指示。如果用户选择结束会话,则在640作出所建立的语音信道/回路的任何状态的确定。当结束时,激活语音信道/回路被关闭(secured)。然后处理被结束。
如果在636用户判断不结束输入会话,则处理返回处理600的开始。
如果在604作出没有激活语音信道的确定,则用户在614被提示,提供是否用户希望建立有效语音信道的指示。这将是用户要求对于与移动装置输入交互的语音识别服务的情况。
如果在614,用户要求用于输入交互的语音信道,则在618建立一个信道。然后用户提供语音输入624和物理输入628并且作出是否用户的输入已经被寄存的确定。如果用户的输入已经被寄存,则在632进行处理和用户被提示,在636提供是否继续输入会话还是结束的指示。如果用户选择结束,则在640作出和上面描述的一样建立的任何语音信道/回路的状态的确定。当结束时,激活语音信道/回路被关闭。然后处理结束。
如果在614,用户不要求用于即将进行的输入交互的语音信道,这可能是该用户不要求语音识别服务的情况,然后用户利用移动装置的用户界面(例如,键盘)前进到物理输入628。在622,作出是否用户的输入(例如,物理输入)已经被寄存的确定。如果用户的输入已经被寄存,则在632进行处理并且在636作出是继续输入会话还是结束的判断。然后处理结束。
如果在636用户判断不结束输入会话,则处理返回处理600的开始。
如果在上面这些示例性的交互的任何一个中,在622用户输入不被寄存,则用户被提示,在636提供是否他们希望结束与语音识别服务器系统进行会话的指示。
一旦提供服务的语音识别服务器系统与请求服务的移动装置之间的语音信道被建立,该语音识别服务器系统可以检索与该移动装置用户相关的用户专用文件(例如,语言的选用、模板文件等)和利用这些文件来处理输入的文件语音输入。语音识别服务器系统然后检测和处理输入的与请求服务相关的语音信号。输入的语音信号利用模板匹配处理、傅立叶变换方法、线性预测编码方案或任何合适的语音识别编码方案被变换为符号数据文件,并且利用数据通信信道被转移到正在请求的移动装置(或指定的第三方装置),该数据通信信道可能包括中间服务器装置(例如,图1中的链路服务器装置106)。
符号数据文件可以按一种适合由请求移动装置进行处理的格式(例如,cHTML、WML或HDML)或者按任何一种适合由中间服务器装置进行处理器的格式(例如,HTML、WML、XML、ASCII等)。在后一种情况下,如果有要求的话,中间服务器装置可以执行任何的变换处理。
按照本发明的原理,用户与移动装置的会话根据服务器装置运行的语音识别应用程序(例如,一种语音识别服务器系统),可能能够访问远端的可用语音识别服务器。存储在电话中的软件(例如,微浏览器)在这种会话中通过检索和管理用于服务器装置的联络信息并且通过提供提示和执行涉及与语音识别服务器系统交互的各功能来帮助用户。利用这种系统和方法,具有有限处理能力和存储容量的移动装置可以访问具有全面功能特征的在高性能计算机工作站上运行的语音识别应用程序。
图7是说明由语音识别服务器系统(例如,语音识别服务器系统109)与移动装置(例如,移动装置102)从相应的语音识别服务器系统交互的处理700的流程图。在704,作出(例如,通过软件处理)是否在语音识别服务器系统(例如,语音识别服务器系统109)与请求服务的移动装置(例如,移动装置102)之间的语音回路/信道已经建立的确定。
如果在704,确与请求服务的移动装置已经建立语音回路(circuit)/信道,则然后在708作出是否已经检测到语音信号的另一个确定。如果在708检测到语音信号,则接收的语音输入716被用于在712产生符号数据文件。
如上所述,符号数据文件是一种含有多个字母、音素、单词、数字、对象、功能、控制符或其他的常用标记,这些标记指定作为由语音识别系统进行翻译的对象、数量、操作、功能、音素、单词、短语、或其任何组合。语音识别系统一般利用语音模板、傅立叶变换编码、或线性预测编码方案来映射语音的输入组成部分为预存储的符号构造块。符号数据文件的例子包括ASCII文件和二进制数据文件。
然后在720符号数据文件被转送到请求的移动装置(或者指定的第三方装置)。在724进行是否从请求服务的移动装置接收到结束命令的确定。如果接收到结束命令,则处理结束。如果没有接收到结束命令,则在708该处理继续搜索输入语音信号。如果在708,在预定时间周期内没有接收到语音信号,则在728作出是否已经接收到结束的命令的确定。如果接收到结束命令,则该处理结束。当然,该系统可能具有导致处理结束的预定的超时或者周期限制,即使结束命令没有接收到也是如此。
如果在704,作出与正在请求服务的移动装置建立语音回路/信道的确定,则语音识别服务器系统等待与希望语音识别服务的移动装置的激活语音信道的建立。
按照本发明的原理,语音识别服务器系统起到移动装置的用户界面的延伸的作用。例如,对于利用本机用户界面,可能在一般情况下要求相当长的时间和努力进行输入的冗长的交互,用户可以选择使用语音识别服务。另外,因为移动装置的资源并不限制使用的语音识别应用程序,所以用户可以被提供访问一个大的词汇表。
本发明的优点是很多的。不同的实现可能产生一个或多个下面的优点。本发明的一个优点是某些移动装置(例如,具有有限处理和存储能力的装置)的用户能够使用全面功能的在远端服务器装置中运行的语音识别应用程序,增强了标准装置的用户界面。
本发明的另外的优点是因为所使用的语音识别应用不受移动装置的处理和存储的限制,可以给用户提供有全面功能特征的运行在更强有力的计算机中的语音识别应用程序的功能。与这个功能相关的优点包括提供给用户以具有大的词汇表的多语言词典和个性化的词典。另外,因为语音识别应用不是存储在移动装置中的,所以对移动装置的单机成本几乎没有或没有影响。本发明的再一个优点是提供服务的运营商可以对于访问它的用户收取少的服务费。
本发明的还再一个优点是用户可以同时利用语音识别服务和本机用户界面(例如,电话键盘),因此提供给用户更多的灵活性。例如,用户可以输入语音信号并且混合从本机用户界面输入的符号。
从说明书的描述来看,本发明的许多特点和优点是明显的,所附的权利要求书应覆盖本发明的所有这些特点和优点。再有,因为对于本专业的技术人员将很容易作出多种修改和改变,所以本发明不是限制于按照所说明和描述的精确结构和构成上。因此,所有适当的修改和等效物应被视为落入本发明的范围内。
Claims (48)
1.一种用于对具有显示屏幕和用户界面的无线通信装置提供语音识别服务的方法,包括:
在运行语音识别应用程序的服务器装置接收从无线通信装置发出的对语音识别服务的请求;
检索与来自第一通信路径的请求相关的语音输入信号;
利用语音识别应用程序变换该语音输入信号为符号数据文件;和
利用第二通信路径发送符号数据文件到无线通信装置。
2.按照权利要求1所述的方法,其中第一通信路径是建立在无线通信网上。
3.按照权利要求2所述的方法,其中该无线网是从下列一组网中选择的,这些网是:蜂窝数字分组数据(CDPD)网、移动通信全球系统(GSM)网、码分多址(CDMA)网、个人手持电话系统(PHS)或时分多址(TDMA)网。
4.按照权利要求1所述的方法,其中符号数据文件是一种标记语言文件。
5.按照权利要求1所述的方法,其中标记语言文件是从以下组合中选出的:手持装置标记语言(HDML)、超文本标记语言(HTML)、紧凑HTML(cHTML)、无线标记语言(WML)、标准通用标记语言(SGML)、可扩充标记语言(XML)。
6.按照权利要求1所述的方法,其中符号数据文件是二进制数据文件。
7.按照权利要求1所述的方法,其中符号数据文件是ASCII格式的数据文件。
8.按照权利要求1所述的方法,其中第二通信路径包括一链路服务器装置,经使用第一通信协议的有线网连接到运行语音识别应用程序的服务器装置,并且经使用第二通信协议的无线网连接到无线通信装置。
9.按照权利要求8所述的方法,其中第一通信协议是从以下一组协议中选择的,这些协议包括:传输控制协议(TCP/IP)、超文本传送协议(HTTP)、和安全超文本传输协议(sHTTP)。
10.按照权利要求8所述的方法,其中第二通信协议是无线通信协议。
11.按照权利要求10所述的方法,其中无线通信协议是从以下一组协议中选择的,这些协议是:无线接入协议(WAP)和手持装置传输协议(HDTP)。
12.按照权利要求1所述的方法,其中从无线通信装置中接收的请求包括用户专用的识别信息。
13.按照权利要求12所述的方法,其中该用户专用识别信息被用于检索用户专用文件,以处理对语音识别服务的请求。
14.按照权利要求1所述的方法,其中从无线通信装置中接收的请求包括装置专用识别信息。
15.按照权利要求14所述的方法,其中装置专用识别信息被用于检索用户专用文件,以处理对语音识别服务的请求。
16.按照权利要求14所述的方法,其中装置专用识别信息是从以下一组信息中选择的,这些信息包括:电话号码和统一资源识别符(URI)。
17.按照权利要求1所述的方法,其中无线通信装置是移动电话。
18.按照权利要求17所述的方法,其中移动电话包括微处理器和软件的存储区。
19.按照权利要求18所述的方法,其中微处理器利用在存储区中存储的软件来控制电话功能和本机应用程序。
20.按照权利要求19所述的方法,其中本机应用程序提供有关获得语音识别服务的功能。
21.一种对具有显示屏和用户界面的无线通信装置提供语音识别服务的方法,包括:
检索运行语音识别应用程序的服务器装置的联络信息;
产生对与所检索的联络信息相关的服务器装置的语音识别服务的请求;
将对语音识别服务的请求发送到与所检索的联络信息相关的服务器装置;
建立无线通信装置和与所检索的联络信息相关的服务器装置之间的语音通信信道;
从使用无线通信装置的用户接收输入,该输入的至少一部分包括语音组成部分;和
发送该用户输入到所述服务器装置,用于由语音识别应用程序进行处理。
22.按照权利要求21所述的方法,其中联络信息是从以下一组信息中选择的,这些信息包括:电话号码和统一资源识别符(URI)。
23.按照权利要求21所述的方法,其中语音通信信道是在无线网上建立的。
24.按照权利要求23所述的方法,其中无线网是从以下一组网中选择的,这些网是:蜂窝数字分组数据(CDPD)网、移动通信全球系统(GSM)网、码分多址(CDMA)网、个人手持电话系统(PHS)或时分多址(TDMA)网。
25.按照权利要求21所述的方法,还包括:
从与所检索的联络信息相关的服务器装置接收符号数据文件,该符号数据文件包括用服务器装置对用户输入进行语言识别处理的处理后输出;
利用无线通信装置的本机资源处理接收的符号数据文件;和
显示至少经处理的符号数据文件的一部分给用户,用于浏览和修改。
26.按照权利要求25所述的方法,其中接收的符号数据文件是标记语言文件。
27.按照权利要求26所述的方法,其中标记语言文件是从以下一组文件中选择的,这些文件是:手持装置标记语言(HDML)、超文本标记语言(HTML)、紧凑HTML(cHTML)、无线标记语言(WML)、标准通用标记语言(SGML)、可扩充标记语言(XML)。
28.按照权利要求25所述的方法,其中符号数据文件是二进制数据文件。
29.按照权利要求25所述的方法,其中符号数据文件是ASCII格式的数据文件。
30.一种计算机可读介质,该介质上具有用于对无线通信装置产生对语音识别服务的请求的编码的计算机程序代码,包括:
检索用于提供语音识别服务的服务器装置的联络信息的计算机程序代码;
产生对与检索到的联络信息相关的服务器装置的语音识别服务的请求的计算机程序代码;
用于从无线通信装置的用户接收语音的计算机程序代码,该输入是与对语音识别服务的请求相关的;和
计算机程序代码,用于建立无线通信装置与服务器装置之间的语音通信会话代码,以发送语音信号到服务器装置进行语音识别处理。
31.按照权利要求30所述的计算机可读介质,其中联络信息是从以下一组信息中选择的,这些信息是:电话号码和统一资源识别符(URI)。
32.一种计算机可读介质,该介质上有对无线通信装置提供语音识别服务的编码的计算机程序代码,包括:
用于从移动装置接收对语音识别服务的请求的计算机程序代码;
用于接收与对语音识别服务的请求相关的语音输入的计算机程序代码;
用于变换接收的语音输入为符号数据文件的计算机程序代码;
用于发送符号数据文件到始发请求的移动装置的计算机程序代码。
33.按照权利要求32所述的计算机可读介质,其中符号数据文件是一种标记语言文件。
34.按照权利要求33所述的计算机可读介质,其中符号数据文件是从以下一组语言中选择的:这些语言包括:手持装置标记语言(HDML)、超文本标记语言(HTML)、紧凑HTML(cHTML)、无线标记语言(WML)、标准通用标记语言(SGML)、可扩充标记语言(XML)。
35.按照权利要求32所述的计算机可读介质,还包括:
用于检索与该请求相关的用户专用文件的计算机程序代码;和
在变换处理中利用用户专用文件变换语音输入为符号数据文件的计算机程序代码。
36.按照权利要求35所述的计算机可读介质,其中用户专用文件含有用户的喜好选择。
37.按照权利要求35所述的计算机可读介质,其中用户专用文件含有用户的语音模板。
38.一种提供语音识别服务的无线通信系统,包括:
在第一通信路径为语音识别处理提供语音输入和在第二通信路径接收表示经处理的语音输入的符号数据文件的无线通信装置;和
运行语音识别应用程序的服务器装置,在第一通信路径上从无线通信装置接收语音输入,变换接收的语音输入为符号数据文件并且利用第二通信路径传送该符号数据文件到无线装置。
39.按照权利要求38所述的无线通信系统,其中第一通信路径是建立在无线网上。
40.按照权利要求39所述的无线通信系统,其中无线网是从以下一组网中选择的,这些网是:蜂窝数字分组数据(CDPD)网、移动通信全球系统(GSM)网、码分多址(CDMA)网、个人手持电话系统(PHS)或时分多址(TDMA)网。
41.按照权利要求40所述的无线通信系统,其中第二通信路径包括链路服务器装置,使用第一通信协议通过有线网连接到运行语音识别应用程序的服务器装置,并利用第二通信协议通过无线网连接到无线通信装置。
42.按照权利要求41所述的无线通信系统,其中第一通信协议是从以下一组协议中选择的,这些协议是:传输控制协议/因特网协议(TCP/IP)、超文本传输协议(HTTP)、和安全超文本传输协议(sHTTP)。
43.按照权利要求41所述的无线通信系统,其中第二通信协议是无线通信协议。
44.按照权利要求43所述的无线通信系统,其中无线通信协议是从以下一组协议中选择的,这些协议是:无线接入协议(WAP)和手持装置传输协议(HDTP)。
45.按照权利要求38所述的无线通信系统,其中无线通信装置是移动电话。
46.按照权利要求45所述的无线通信系统,其中移动电话包括微处理器和用于软件的存储区。
47.按照权利要求46所述的无线通信系统,其中微处理器利用存储在存储器区中的软件控制电话功能和本机应用程序。
48.按照权利要求47所述的无线通信系统,其中本机应用提供关于获得语音识别服务的功能。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16729099P | 1999-11-24 | 1999-11-24 | |
US60/167,290 | 1999-11-24 | ||
US09/643,558 | 2000-08-21 | ||
US09/643,558 US6532446B1 (en) | 1999-11-24 | 2000-08-21 | Server based speech recognition user interface for wireless devices |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1298249A true CN1298249A (zh) | 2001-06-06 |
Family
ID=26863029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN00128488A Pending CN1298249A (zh) | 1999-11-24 | 2000-11-24 | 无线装置的基于用户界面的语音识别 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6532446B1 (zh) |
EP (1) | EP1104155A3 (zh) |
JP (1) | JP2001222294A (zh) |
KR (1) | KR20010051903A (zh) |
CN (1) | CN1298249A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007045188A1 (fr) * | 2005-10-21 | 2007-04-26 | Huawei Technologies Co., Ltd. | Procede, appareil et systeme pour executer la fonction de reconnaissance vocale |
CN100367185C (zh) * | 2003-04-07 | 2008-02-06 | 诺基亚有限公司 | 在具有用户接口的电子设备中提供允许语音的输入的方法和设备 |
CN1953447B (zh) * | 2005-10-21 | 2010-09-15 | 华为技术有限公司 | 媒体资源处理方法 |
CN103095910A (zh) * | 2006-12-28 | 2013-05-08 | 英特尔公司 | Nfc应用的话音接口 |
CN103617795A (zh) * | 2013-10-31 | 2014-03-05 | 广东好帮手电子科技股份有限公司 | 一种车载语音识别控制方法及系统 |
CN110058832A (zh) * | 2013-10-15 | 2019-07-26 | 三星电子株式会社 | 图像处理装置及其控制方法 |
Families Citing this family (359)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6630800A (en) * | 1999-08-13 | 2001-03-13 | Pixo, Inc. | Methods and apparatuses for display and traversing of links in page character array |
US7203721B1 (en) * | 1999-10-08 | 2007-04-10 | At Road, Inc. | Portable browser device with voice recognition and feedback capability |
JP2001197379A (ja) * | 2000-01-05 | 2001-07-19 | Matsushita Electric Ind Co Ltd | 機器設定装置、機器設定システムおよび機器設定処理プログラムを記録した記録媒体 |
JP3452250B2 (ja) * | 2000-03-15 | 2003-09-29 | 日本電気株式会社 | 無線携帯端末通信システム |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8355912B1 (en) * | 2000-05-04 | 2013-01-15 | International Business Machines Corporation | Technique for providing continuous speech recognition as an alternate input device to limited processing power devices |
US7134073B1 (en) * | 2000-06-15 | 2006-11-07 | International Business Machines Corporation | Apparatus and method for enabling composite style sheet application to multi-part electronic documents |
JP2002074188A (ja) * | 2000-06-16 | 2002-03-15 | Sony Computer Entertainment Inc | 会員情報登録方法および装置、会員認証方法および装置、サーバコンピュータ |
WO2002010900A2 (en) * | 2000-07-28 | 2002-02-07 | Siemens Automotive Corporation | User interface for telematics systems |
US7114077B2 (en) * | 2000-08-23 | 2006-09-26 | Ryan Miller | Verification system for confidential data input |
FI20001918A (fi) | 2000-08-30 | 2002-03-01 | Nokia Corp | Monimodaalinen sisältö ja automaattinen puheen tunnistus langattomassa tietoliikennejärjestelmässä |
JP2002073561A (ja) * | 2000-09-01 | 2002-03-12 | Toyota Motor Corp | 通信網を介してアクセスするユーザの認証方法及び認証システム、並びに、これらを利用した情報処理システム |
WO2002023389A1 (en) * | 2000-09-15 | 2002-03-21 | Robert Fish | Systems and methods for translating an item of information using a distal computer |
US20110238855A1 (en) * | 2000-09-25 | 2011-09-29 | Yevgeny Korsunsky | Processing data flows with a data flow processor |
US20110231564A1 (en) * | 2000-09-25 | 2011-09-22 | Yevgeny Korsunsky | Processing data flows with a data flow processor |
US20110213869A1 (en) * | 2000-09-25 | 2011-09-01 | Yevgeny Korsunsky | Processing data flows with a data flow processor |
US20070192863A1 (en) * | 2005-07-01 | 2007-08-16 | Harsh Kapoor | Systems and methods for processing data flows |
US9800608B2 (en) * | 2000-09-25 | 2017-10-24 | Symantec Corporation | Processing data flows with a data flow processor |
JP4135307B2 (ja) * | 2000-10-17 | 2008-08-20 | 株式会社日立製作所 | 音声通訳サービス方法および音声通訳サーバ |
US7181508B1 (en) * | 2000-11-09 | 2007-02-20 | Oki Data Americas, Inc. | System and method for communicating, monitoring and configuring a device operatively connected to a network |
US7496510B2 (en) * | 2000-11-30 | 2009-02-24 | International Business Machines Corporation | Method and apparatus for the automatic separating and indexing of multi-speaker conversations |
US20020097692A1 (en) * | 2000-12-29 | 2002-07-25 | Nokia Mobile Phones Ltd. | User interface for a mobile station |
GB0108044D0 (en) * | 2001-03-30 | 2001-05-23 | British Telecomm | Application synchronisation |
US20020178003A1 (en) * | 2001-03-09 | 2002-11-28 | Motorola, Inc. | Method and apparatus for providing voice recognition service to a wireless communication device |
US20040117804A1 (en) * | 2001-03-30 | 2004-06-17 | Scahill Francis J | Multi modal interface |
US6832196B2 (en) * | 2001-03-30 | 2004-12-14 | International Business Machines Corporation | Speech driven data selection in a voice-enabled program |
KR100414064B1 (ko) * | 2001-04-12 | 2004-01-07 | 엘지전자 주식회사 | 음성인식에 의한 이동통신 단말기 제어시스템 및 방법 |
US6931463B2 (en) * | 2001-09-11 | 2005-08-16 | International Business Machines Corporation | Portable companion device only functioning when a wireless link established between the companion device and an electronic device and providing processed data to the electronic device |
US6901364B2 (en) * | 2001-09-13 | 2005-05-31 | Matsushita Electric Industrial Co., Ltd. | Focused language models for improved speech input of structured documents |
US6865532B2 (en) * | 2001-09-19 | 2005-03-08 | Mitsubishi Electric Research Laboratories, Inc. | Method for recognizing spoken identifiers having predefined grammars |
US7158499B2 (en) * | 2001-09-19 | 2007-01-02 | Mitsubishi Electric Research Laboratories, Inc. | Voice-operated two-way asynchronous radio |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
GB2382749B (en) * | 2001-11-28 | 2005-12-07 | Nokia Mobile Developments | Call routing |
US20030125959A1 (en) * | 2001-12-31 | 2003-07-03 | Palmquist Robert D. | Translation device with planar microphone array |
EP1466261B1 (en) | 2002-01-08 | 2018-03-07 | Seven Networks, LLC | Connection architecture for a mobile network |
US20030157959A1 (en) * | 2002-01-11 | 2003-08-21 | Jakke Makela | Method, system, apparatus and computer program product for portable networking of multi-user applications |
KR20020024045A (ko) * | 2002-01-22 | 2002-03-29 | 배성윤 | 셀룰러폰을 이용한 외국어 회화학습과 통역지원 시스템 |
US7286993B2 (en) * | 2002-01-31 | 2007-10-23 | Product Discovery, Inc. | Holographic speech translation system and method |
FR2835999B1 (fr) * | 2002-02-13 | 2004-04-02 | France Telecom | Edition et consultation de services vocaux telephoniques interactifs |
WO2003084173A1 (en) * | 2002-03-28 | 2003-10-09 | British Telecommunications Public Limited Company | Synchronisation in multi-modal interfaces |
JP2003308283A (ja) * | 2002-04-18 | 2003-10-31 | Mitsubishi Electric Corp | 通信装置、通信方法及び車載用ナビゲーション装置 |
US7376701B2 (en) * | 2002-04-29 | 2008-05-20 | Cisco Technology, Inc. | System and methodology for control of, and access and response to internet email from a wireless device |
US7509117B2 (en) * | 2002-05-31 | 2009-03-24 | Nokia Corporation | Apparatus, and associated method, for notifying a user in a radio communication system of a commercially-related transaction |
KR20030097347A (ko) * | 2002-06-20 | 2003-12-31 | 삼성전자주식회사 | 휴대용 단말기의 음성인식을 이용한 문자메시지 전송 방법 |
SE0202058D0 (sv) * | 2002-07-02 | 2002-07-02 | Ericsson Telefon Ab L M | Voice browsing architecture based on adaptive keyword spotting |
AU2002345308A1 (en) | 2002-07-17 | 2004-02-02 | Nokia Corporation | Mobile device having voice user interface, and a methode for testing the compatibility of an application with the mobile device |
US7421390B2 (en) * | 2002-09-13 | 2008-09-02 | Sun Microsystems, Inc. | Method and system for voice control of software applications |
US20040107250A1 (en) * | 2002-10-21 | 2004-06-03 | Guillermo Marciano | Methods and systems for integrating communication resources using the internet |
GB2413040B (en) | 2002-12-09 | 2006-10-18 | Voice Signal Technologies Inc | Provider-activated software for mobile communication devices |
US7917468B2 (en) | 2005-08-01 | 2011-03-29 | Seven Networks, Inc. | Linking of personal information management data |
US8468126B2 (en) | 2005-08-01 | 2013-06-18 | Seven Networks, Inc. | Publishing data in an information community |
US7853563B2 (en) | 2005-08-01 | 2010-12-14 | Seven Networks, Inc. | Universal data aggregation |
US7669134B1 (en) | 2003-05-02 | 2010-02-23 | Apple Inc. | Method and apparatus for displaying information during an instant messaging session |
EP1489596B1 (en) * | 2003-06-17 | 2006-09-13 | Sony Ericsson Mobile Communications AB | Device and method for voice activity detection |
US7089604B2 (en) * | 2003-11-05 | 2006-08-15 | Wright Glenn H | Toilet support device and method |
DE10353068A1 (de) * | 2003-11-13 | 2005-06-23 | Voice Trust Ag | Verfahren zur Authentifizierung eines Benutzers anhand dessen Stimmprofils |
WO2005050958A2 (en) * | 2003-11-14 | 2005-06-02 | Voice Signal Technologies, Inc. | Installing language modules in a mobile communication device |
FI115274B (fi) * | 2003-12-19 | 2005-03-31 | Nokia Corp | Puhekäyttöliittymällä varustettu elektroninen laite ja menetelmä elektronisessa laitteessa käyttöliittymäkieliasetuksien suorittamiseksi |
US20050171781A1 (en) * | 2004-01-08 | 2005-08-04 | Poploskie Jon M. | Speech information system |
US8954325B1 (en) * | 2004-03-22 | 2015-02-10 | Rockstar Consortium Us Lp | Speech recognition in automated information services systems |
US20060009974A1 (en) * | 2004-07-09 | 2006-01-12 | Matsushita Electric Industrial Co., Ltd. | Hands-free voice dialing for portable and remote devices |
WO2006045102A2 (en) | 2004-10-20 | 2006-04-27 | Seven Networks, Inc. | Method and apparatus for intercepting events in a communication system |
US8010082B2 (en) | 2004-10-20 | 2011-08-30 | Seven Networks, Inc. | Flexible billing architecture |
US7706781B2 (en) | 2004-11-22 | 2010-04-27 | Seven Networks International Oy | Data security in a mobile e-mail service |
FI117152B (fi) | 2004-12-03 | 2006-06-30 | Seven Networks Internat Oy | Sähköpostiasetusten käyttöönotto matkaviestimelle |
US7529677B1 (en) | 2005-01-21 | 2009-05-05 | Itt Manufacturing Enterprises, Inc. | Methods and apparatus for remotely processing locally generated commands to control a local device |
ATE361524T1 (de) * | 2005-01-31 | 2007-05-15 | Harman Becker Automotive Sys | Erweiterung der bandbreite eines schmalbandigen sprachsignals |
US7752633B1 (en) | 2005-03-14 | 2010-07-06 | Seven Networks, Inc. | Cross-platform event engine |
US7796742B1 (en) | 2005-04-21 | 2010-09-14 | Seven Networks, Inc. | Systems and methods for simplified provisioning |
US8438633B1 (en) | 2005-04-21 | 2013-05-07 | Seven Networks, Inc. | Flexible real-time inbox access |
WO2006136660A1 (en) | 2005-06-21 | 2006-12-28 | Seven Networks International Oy | Maintaining an ip connection in a mobile network |
US8069166B2 (en) | 2005-08-01 | 2011-11-29 | Seven Networks, Inc. | Managing user-to-user contact with inferred presence information |
US20070038455A1 (en) * | 2005-08-09 | 2007-02-15 | Murzina Marina V | Accent detection and correction system |
US8677377B2 (en) * | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US8635073B2 (en) * | 2005-09-14 | 2014-01-21 | At&T Intellectual Property I, L.P. | Wireless multimodal voice browser for wireline-based IPTV services |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
US20070112571A1 (en) * | 2005-11-11 | 2007-05-17 | Murugappan Thirugnana | Speech recognition at a mobile terminal |
WO2007070842A2 (en) * | 2005-12-15 | 2007-06-21 | Josef Berger | System and methods for initiating, maintaining, and delivering personalized information by communication server |
US7769395B2 (en) | 2006-06-20 | 2010-08-03 | Seven Networks, Inc. | Location-based operations and messaging |
US8370141B2 (en) * | 2006-03-03 | 2013-02-05 | Reagan Inventions, Llc | Device, system and method for enabling speech recognition on a portable data device |
US7761293B2 (en) * | 2006-03-06 | 2010-07-20 | Tran Bao Q | Spoken mobile engine |
US8510109B2 (en) | 2007-08-22 | 2013-08-13 | Canyon Ip Holdings Llc | Continuous speech transcription performance indication |
US20090124272A1 (en) * | 2006-04-05 | 2009-05-14 | Marc White | Filtering transcriptions of utterances |
WO2007117626A2 (en) | 2006-04-05 | 2007-10-18 | Yap, Inc. | Hosted voice recognition system for wireless devices |
US9436951B1 (en) | 2007-08-22 | 2016-09-06 | Amazon Technologies, Inc. | Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof |
US9123343B2 (en) * | 2006-04-27 | 2015-09-01 | Mobiter Dicta Oy | Method, and a device for converting speech by replacing inarticulate portions of the speech before the conversion |
US8204748B2 (en) * | 2006-05-02 | 2012-06-19 | Xerox Corporation | System and method for providing a textual representation of an audio message to a mobile device |
US9208785B2 (en) * | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
US9086737B2 (en) * | 2006-06-15 | 2015-07-21 | Apple Inc. | Dynamically controlled keyboard |
US11450331B2 (en) | 2006-07-08 | 2022-09-20 | Staton Techiya, Llc | Personal audio assistant device and method |
WO2008008730A2 (en) | 2006-07-08 | 2008-01-17 | Personics Holdings Inc. | Personal audio assistant device and method |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US7912828B2 (en) * | 2007-02-23 | 2011-03-22 | Apple Inc. | Pattern searching methods and apparatuses |
US20080221884A1 (en) * | 2007-03-07 | 2008-09-11 | Cerra Joseph P | Mobile environment speech processing facility |
US8635243B2 (en) * | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8886540B2 (en) * | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Using speech recognition results based on an unstructured language model in a mobile communication facility application |
US8838457B2 (en) * | 2007-03-07 | 2014-09-16 | Vlingo Corporation | Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility |
US8949266B2 (en) * | 2007-03-07 | 2015-02-03 | Vlingo Corporation | Multiple web-based content category searching in mobile search application |
US10056077B2 (en) | 2007-03-07 | 2018-08-21 | Nuance Communications, Inc. | Using speech recognition results based on an unstructured language model with a music system |
US20090030691A1 (en) * | 2007-03-07 | 2009-01-29 | Cerra Joseph P | Using an unstructured language model associated with an application of a mobile communication facility |
US20080221900A1 (en) * | 2007-03-07 | 2008-09-11 | Cerra Joseph P | Mobile local search environment speech processing facility |
US8949130B2 (en) | 2007-03-07 | 2015-02-03 | Vlingo Corporation | Internal and external speech recognition use with a mobile communication facility |
US8515728B2 (en) * | 2007-03-29 | 2013-08-20 | Microsoft Corporation | Language translation of visual and audio input |
US8977255B2 (en) * | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8352264B2 (en) * | 2008-03-19 | 2013-01-08 | Canyon IP Holdings, LLC | Corrective feedback loop for automated speech recognition |
US9973450B2 (en) * | 2007-09-17 | 2018-05-15 | Amazon Technologies, Inc. | Methods and systems for dynamically updating web service profile information by parsing transcribed message strings |
US8611871B2 (en) | 2007-12-25 | 2013-12-17 | Canyon Ip Holdings Llc | Validation of mobile advertising from derived information |
US20090076917A1 (en) * | 2007-08-22 | 2009-03-19 | Victor Roditis Jablokov | Facilitating presentation of ads relating to words of a message |
US8326636B2 (en) | 2008-01-16 | 2012-12-04 | Canyon Ip Holdings Llc | Using a physical phenomenon detector to control operation of a speech recognition engine |
US8352261B2 (en) * | 2008-03-07 | 2013-01-08 | Canyon IP Holdings, LLC | Use of intermediate speech transcription results in editing final speech transcription results |
US8805425B2 (en) | 2007-06-01 | 2014-08-12 | Seven Networks, Inc. | Integrated messaging |
US8693494B2 (en) | 2007-06-01 | 2014-04-08 | Seven Networks, Inc. | Polling |
US20100169003A1 (en) * | 2007-06-04 | 2010-07-01 | Sander Van Der Meer | Location data processing apparatus and method of importing location information |
US9053489B2 (en) | 2007-08-22 | 2015-06-09 | Canyon Ip Holdings Llc | Facilitating presentation of ads relating to words of a message |
US8335829B1 (en) | 2007-08-22 | 2012-12-18 | Canyon IP Holdings, LLC | Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof |
US20090070109A1 (en) * | 2007-09-12 | 2009-03-12 | Microsoft Corporation | Speech-to-Text Transcription for Personal Communication Devices |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8065152B2 (en) | 2007-11-08 | 2011-11-22 | Demand Media, Inc. | Platform for enabling voice commands to resolve phoneme based domain name registrations |
US8620662B2 (en) * | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US8364181B2 (en) | 2007-12-10 | 2013-01-29 | Seven Networks, Inc. | Electronic-mail filtering for mobile devices |
US8793305B2 (en) | 2007-12-13 | 2014-07-29 | Seven Networks, Inc. | Content delivery to a mobile device from a content service |
US9002828B2 (en) | 2007-12-13 | 2015-04-07 | Seven Networks, Inc. | Predictive content delivery |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8327272B2 (en) | 2008-01-06 | 2012-12-04 | Apple Inc. | Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars |
US8067701B2 (en) * | 2008-01-07 | 2011-11-29 | Apple Inc. | I/O connectors with extendable faraday cage |
US8107921B2 (en) | 2008-01-11 | 2012-01-31 | Seven Networks, Inc. | Mobile virtual network operator |
US8862657B2 (en) | 2008-01-25 | 2014-10-14 | Seven Networks, Inc. | Policy based content service |
US20090193338A1 (en) | 2008-01-28 | 2009-07-30 | Trevor Fiatal | Reducing network and battery consumption during content delivery and playback |
US8065143B2 (en) * | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US9886231B2 (en) | 2008-03-28 | 2018-02-06 | Kopin Corporation | Head worn wireless computer having high-resolution display suitable for use as a mobile internet device |
US8676577B2 (en) * | 2008-03-31 | 2014-03-18 | Canyon IP Holdings, LLC | Use of metadata to post process speech recognition output |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US8787947B2 (en) | 2008-06-18 | 2014-07-22 | Seven Networks, Inc. | Application discovery on mobile devices |
US8078158B2 (en) | 2008-06-26 | 2011-12-13 | Seven Networks, Inc. | Provisioning applications for a mobile device |
US8700008B2 (en) | 2008-06-27 | 2014-04-15 | Microsoft Corporation | Providing data service options in push-to-talk using voice recognition |
US9128981B1 (en) | 2008-07-29 | 2015-09-08 | James L. Geer | Phone assisted ‘photographic memory’ |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8110744B2 (en) * | 2008-08-19 | 2012-02-07 | Apple Inc. | Flexible shielded cable |
US8301454B2 (en) | 2008-08-22 | 2012-10-30 | Canyon Ip Holdings Llc | Methods, apparatuses, and systems for providing timely user cues pertaining to speech recognition |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US9129291B2 (en) * | 2008-09-22 | 2015-09-08 | Personics Holdings, Llc | Personalized sound management and method |
US8352272B2 (en) * | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for text to speech synthesis |
US20100082328A1 (en) * | 2008-09-29 | 2010-04-01 | Apple Inc. | Systems and methods for speech preprocessing in text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8396714B2 (en) * | 2008-09-29 | 2013-03-12 | Apple Inc. | Systems and methods for concatenation of words in text to speech synthesis |
US8355919B2 (en) * | 2008-09-29 | 2013-01-15 | Apple Inc. | Systems and methods for text normalization for text to speech synthesis |
US8352268B2 (en) * | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US8909759B2 (en) | 2008-10-10 | 2014-12-09 | Seven Networks, Inc. | Bandwidth measurement |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
CA2748695C (en) | 2008-12-31 | 2017-11-07 | Bce Inc. | System and method for unlocking a device |
US8380507B2 (en) * | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10540976B2 (en) * | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US20110010179A1 (en) * | 2009-07-13 | 2011-01-13 | Naik Devang K | Voice synthesis and processing |
US20110111800A1 (en) * | 2009-11-11 | 2011-05-12 | Temar Harper | Cellular Phone Memory Card With Voice Activated Component |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US20110110534A1 (en) * | 2009-11-12 | 2011-05-12 | Apple Inc. | Adjustable voice output based on device status |
US9875671B2 (en) * | 2009-12-17 | 2018-01-23 | Google Llc | Cloud-based user interface augmentation |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
TW201209697A (en) | 2010-03-30 | 2012-03-01 | Michael Luna | 3D mobile user interface with configurable workspace management |
US8639516B2 (en) | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
GB2495877B (en) | 2010-07-26 | 2013-10-02 | Seven Networks Inc | Distributed implementation of dynamic wireless traffic policy |
US8838783B2 (en) | 2010-07-26 | 2014-09-16 | Seven Networks, Inc. | Distributed caching for resource and mobile network traffic management |
EP3651028A1 (en) | 2010-07-26 | 2020-05-13 | Seven Networks, LLC | Mobile network traffic coordination across multiple applications |
WO2012018556A2 (en) | 2010-07-26 | 2012-02-09 | Ari Backholm | Mobile application traffic optimization |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US10013976B2 (en) | 2010-09-20 | 2018-07-03 | Kopin Corporation | Context sensitive overlays in voice controlled headset computer displays |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US8484314B2 (en) | 2010-11-01 | 2013-07-09 | Seven Networks, Inc. | Distributed caching in a wireless network of content delivered for a mobile application over a long-held request |
US9330196B2 (en) | 2010-11-01 | 2016-05-03 | Seven Networks, Llc | Wireless traffic management system cache optimization using http headers |
US8326985B2 (en) | 2010-11-01 | 2012-12-04 | Seven Networks, Inc. | Distributed management of keep-alive message signaling for mobile network resource conservation and optimization |
CN103620576B (zh) | 2010-11-01 | 2016-11-09 | 七网络公司 | 适用于移动应用程序行为和网络条件的缓存 |
US8190701B2 (en) | 2010-11-01 | 2012-05-29 | Seven Networks, Inc. | Cache defeat detection and caching of content addressed by identifiers intended to defeat cache |
US8166164B1 (en) | 2010-11-01 | 2012-04-24 | Seven Networks, Inc. | Application and network-based long poll request detection and cacheability assessment therefor |
WO2012060995A2 (en) | 2010-11-01 | 2012-05-10 | Michael Luna | Distributed caching in a wireless network of content delivered for a mobile application over a long-held request |
US9060032B2 (en) | 2010-11-01 | 2015-06-16 | Seven Networks, Inc. | Selective data compression by a distributed traffic management system to reduce mobile data traffic and signaling traffic |
US8843153B2 (en) | 2010-11-01 | 2014-09-23 | Seven Networks, Inc. | Mobile traffic categorization and policy for network use optimization while preserving user experience |
EP2636268B1 (en) | 2010-11-22 | 2019-02-27 | Seven Networks, LLC | Optimization of resource polling intervals to satisfy mobile device requests |
CN103404193B (zh) | 2010-11-22 | 2018-06-05 | 七网络有限责任公司 | 调校数据传输以优化为通过无线网络的传输建立的连接 |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US8818797B2 (en) * | 2010-12-23 | 2014-08-26 | Microsoft Corporation | Dual-band speech encoding |
WO2012094675A2 (en) | 2011-01-07 | 2012-07-12 | Seven Networks, Inc. | System and method for reduction of mobile network traffic used for domain name system (dns) queries |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US20120271903A1 (en) | 2011-04-19 | 2012-10-25 | Michael Luna | Shared resource and virtual resource management in a networked environment |
GB2493473B (en) | 2011-04-27 | 2013-06-19 | Seven Networks Inc | System and method for making requests on behalf of a mobile device based on atomic processes for mobile network traffic relief |
GB2505585B (en) | 2011-04-27 | 2015-08-12 | Seven Networks Inc | Detecting and preserving state for satisfying application requests in a distributed proxy and cache system |
CN109116985A (zh) | 2011-05-10 | 2019-01-01 | 寇平公司 | 控制信息显示的方法 |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US8984581B2 (en) | 2011-07-27 | 2015-03-17 | Seven Networks, Inc. | Monitoring mobile application activities for malicious traffic on a mobile device |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
CN102496364A (zh) * | 2011-11-30 | 2012-06-13 | 苏州奇可思信息科技有限公司 | 基于云端网络的交互式语音识别方法 |
US8918503B2 (en) | 2011-12-06 | 2014-12-23 | Seven Networks, Inc. | Optimization of mobile traffic directed to private networks and operator configurability thereof |
WO2013086225A1 (en) | 2011-12-06 | 2013-06-13 | Seven Networks, Inc. | A mobile device and method to utilize the failover mechanisms for fault tolerance provided for mobile traffic management and network/device resource conservation |
US9277443B2 (en) | 2011-12-07 | 2016-03-01 | Seven Networks, Llc | Radio-awareness of mobile device for sending server-side control signals using a wireless network optimized transport protocol |
US9009250B2 (en) | 2011-12-07 | 2015-04-14 | Seven Networks, Inc. | Flexible and dynamic integration schemas of a traffic management system with various network operators for network traffic alleviation |
US9832095B2 (en) | 2011-12-14 | 2017-11-28 | Seven Networks, Llc | Operation modes for mobile traffic optimization and concurrent management of optimized and non-optimized traffic |
US8861354B2 (en) | 2011-12-14 | 2014-10-14 | Seven Networks, Inc. | Hierarchies and categories for management and deployment of policies for distributed wireless traffic optimization |
US9021021B2 (en) | 2011-12-14 | 2015-04-28 | Seven Networks, Inc. | Mobile network reporting and usage analytics system and method aggregated using a distributed traffic optimization system |
US8909202B2 (en) | 2012-01-05 | 2014-12-09 | Seven Networks, Inc. | Detection and management of user interactions with foreground applications on a mobile device in distributed caching |
US9203864B2 (en) | 2012-02-02 | 2015-12-01 | Seven Networks, Llc | Dynamic categorization of applications for network access in a mobile network |
US9326189B2 (en) | 2012-02-03 | 2016-04-26 | Seven Networks, Llc | User as an end point for profiling and optimizing the delivery of content and data in a wireless network |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US8812695B2 (en) | 2012-04-09 | 2014-08-19 | Seven Networks, Inc. | Method and system for management of a virtual network connection without heartbeat messages |
US20130268656A1 (en) | 2012-04-10 | 2013-10-10 | Seven Networks, Inc. | Intelligent customer service/call center services enhanced using real-time and historical mobile application and traffic-related statistics collected by a distributed caching system in a mobile network |
EP2842055B1 (en) * | 2012-04-25 | 2018-06-27 | Kopin Corporation | Instant translation system |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US10019994B2 (en) | 2012-06-08 | 2018-07-10 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9576572B2 (en) | 2012-06-18 | 2017-02-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and nodes for enabling and producing input to an application |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US8775631B2 (en) | 2012-07-13 | 2014-07-08 | Seven Networks, Inc. | Dynamic bandwidth adjustment for browsing or streaming activity in a wireless network based on prediction of user behavior when interacting with mobile applications |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
US9161258B2 (en) | 2012-10-24 | 2015-10-13 | Seven Networks, Llc | Optimized and selective management of policy deployment to mobile clients in a congested network to prevent further aggravation of network congestion |
WO2014094859A1 (en) | 2012-12-20 | 2014-06-26 | Widex A/S | Hearing aid and a method for audio streaming |
US20140177497A1 (en) | 2012-12-20 | 2014-06-26 | Seven Networks, Inc. | Management of mobile device radio state promotion and demotion |
CN103177557B (zh) * | 2012-12-28 | 2016-05-11 | 吴玉胜 | 基于智能设备的家电控制方法及系统 |
US9922639B1 (en) | 2013-01-11 | 2018-03-20 | Amazon Technologies, Inc. | User feedback for speech interactions |
US9271238B2 (en) | 2013-01-23 | 2016-02-23 | Seven Networks, Llc | Application or context aware fast dormancy |
US8874761B2 (en) | 2013-01-25 | 2014-10-28 | Seven Networks, Inc. | Signaling optimization in a wireless network for traffic utilizing proprietary and non-proprietary protocols |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US8750123B1 (en) | 2013-03-11 | 2014-06-10 | Seven Networks, Inc. | Mobile device equipped with mobile network congestion recognition to make intelligent decisions regarding connecting to an operator network |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
CN112230878B (zh) | 2013-03-15 | 2024-09-27 | 苹果公司 | 对中断进行上下文相关处理 |
CN105190607B (zh) | 2013-03-15 | 2018-11-30 | 苹果公司 | 通过智能数字助理的用户培训 |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US20140297709A1 (en) * | 2013-03-27 | 2014-10-02 | Xiaomi Inc. | Method and mobile terminal for creating a contact |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
EP3008964B1 (en) | 2013-06-13 | 2019-09-25 | Apple Inc. | System and method for emergency calls initiated by voice command |
US9065765B2 (en) | 2013-07-22 | 2015-06-23 | Seven Networks, Inc. | Proxy server associated with a mobile carrier for enhancing mobile traffic management in a mobile network |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
KR102345611B1 (ko) * | 2013-11-18 | 2021-12-31 | 삼성전자주식회사 | 디스플레이 장치 및 제어 방법 |
US9449602B2 (en) * | 2013-12-03 | 2016-09-20 | Google Inc. | Dual uplink pre-processing paths for machine and human listening |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
KR102225404B1 (ko) * | 2014-05-23 | 2021-03-09 | 삼성전자주식회사 | 디바이스 정보를 이용하는 음성인식 방법 및 장치 |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9741344B2 (en) * | 2014-10-20 | 2017-08-22 | Vocalzoom Systems Ltd. | System and method for operating devices using voice commands |
EP3220372B1 (en) * | 2014-11-12 | 2019-10-16 | Fujitsu Limited | Wearable device, display control method, and display control program |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
TWI621340B (zh) * | 2015-02-26 | 2018-04-11 | 默科資訊股份有限公司 | 偵測空氣波動的控制系統與其控制方法 |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US9953631B1 (en) | 2015-05-07 | 2018-04-24 | Google Llc | Automatic speech recognition techniques for multiple languages |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
KR101642918B1 (ko) * | 2015-08-03 | 2016-07-27 | 서치콘주식회사 | 코드네임 프로토콜을 이용한 네트워크 접속 제어 방법, 이를 수행하는 네트워크 접속 제어 서버 및 이를 저장하는 기록매체 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
DE102015222956A1 (de) * | 2015-11-20 | 2017-05-24 | Robert Bosch Gmbh | Verfahren zum Betreiben eines Serversystems und zum Betreiben eines Aufnahmegeräts zum Aufnehmen eines Sprachbefehls, Serversystem, Aufnahmegerät und Sprachdialogsystem |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
US10560974B2 (en) | 2016-09-11 | 2020-02-11 | Lg Electronics Inc. | Method and apparatus for connecting device by using Bluetooth technology |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
KR20180101926A (ko) * | 2017-03-06 | 2018-09-14 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 어플리케이션 제어 방법 |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN107342083B (zh) * | 2017-07-05 | 2021-07-20 | 百度在线网络技术(北京)有限公司 | 用于提供语音服务的方法和装置 |
US10586537B2 (en) * | 2017-11-30 | 2020-03-10 | International Business Machines Corporation | Filtering directive invoking vocal utterances |
CN109508171A (zh) * | 2018-12-19 | 2019-03-22 | 上海龙旗科技股份有限公司 | 一种基于四通道的语音处理方法及设备 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0637711A (ja) * | 1992-07-20 | 1994-02-10 | Nec Corp | 自動車電話機 |
US5335276A (en) * | 1992-12-16 | 1994-08-02 | Texas Instruments Incorporated | Communication system and methods for enhanced information transfer |
ZA948426B (en) | 1993-12-22 | 1995-06-30 | Qualcomm Inc | Distributed voice recognition system |
US5651056A (en) * | 1995-07-13 | 1997-07-22 | Eting; Leon | Apparatus and methods for conveying telephone numbers and other information via communication devices |
US6456974B1 (en) | 1997-01-06 | 2002-09-24 | Texas Instruments Incorporated | System and method for adding speech recognition capabilities to java |
US5928325A (en) * | 1997-02-24 | 1999-07-27 | Motorola, Inc. | Method of dynamically establishing communication of incoming messages to one or more user devices presently available to an intended recipient |
GB2323693B (en) | 1997-03-27 | 2001-09-26 | Forum Technology Ltd | Speech to text conversion |
USH1895H (en) * | 1997-09-26 | 2000-10-03 | Dsc/Celcore, Inc. | Application provider and method for communication |
US6167251A (en) * | 1998-10-02 | 2000-12-26 | Telespree Communications | Keyless portable cellular phone system having remote voice recognition |
US6351523B1 (en) * | 1999-03-22 | 2002-02-26 | Sharp Laboratories Of America, Inc. | Method and apparatus for management of EMail originated by thin client devices |
JP3452250B2 (ja) * | 2000-03-15 | 2003-09-29 | 日本電気株式会社 | 無線携帯端末通信システム |
-
2000
- 2000-08-21 US US09/643,558 patent/US6532446B1/en not_active Expired - Lifetime
- 2000-11-22 JP JP2000356405A patent/JP2001222294A/ja active Pending
- 2000-11-23 KR KR1020000070088A patent/KR20010051903A/ko not_active Application Discontinuation
- 2000-11-24 CN CN00128488A patent/CN1298249A/zh active Pending
- 2000-11-24 EP EP00310429A patent/EP1104155A3/en not_active Withdrawn
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100367185C (zh) * | 2003-04-07 | 2008-02-06 | 诺基亚有限公司 | 在具有用户接口的电子设备中提供允许语音的输入的方法和设备 |
WO2007045188A1 (fr) * | 2005-10-21 | 2007-04-26 | Huawei Technologies Co., Ltd. | Procede, appareil et systeme pour executer la fonction de reconnaissance vocale |
CN100426377C (zh) * | 2005-10-21 | 2008-10-15 | 华为技术有限公司 | 一种实现语音识别功能的方法 |
CN1953447B (zh) * | 2005-10-21 | 2010-09-15 | 华为技术有限公司 | 媒体资源处理方法 |
US8417521B2 (en) | 2005-10-21 | 2013-04-09 | Huawei Technologies Co., Ltd. | Method, device and system for implementing speech recognition function |
CN103095910A (zh) * | 2006-12-28 | 2013-05-08 | 英特尔公司 | Nfc应用的话音接口 |
US8849674B2 (en) | 2006-12-28 | 2014-09-30 | Intel Corporation | Voice interface to NFC applications |
CN103095910B (zh) * | 2006-12-28 | 2017-07-04 | 英特尔公司 | Nfc应用的话音接口 |
CN110058832A (zh) * | 2013-10-15 | 2019-07-26 | 三星电子株式会社 | 图像处理装置及其控制方法 |
CN110058832B (zh) * | 2013-10-15 | 2022-11-25 | 三星电子株式会社 | 图像处理装置及其控制方法 |
CN103617795A (zh) * | 2013-10-31 | 2014-03-05 | 广东好帮手电子科技股份有限公司 | 一种车载语音识别控制方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
KR20010051903A (ko) | 2001-06-25 |
EP1104155A2 (en) | 2001-05-30 |
EP1104155A3 (en) | 2002-11-27 |
US6532446B1 (en) | 2003-03-11 |
JP2001222294A (ja) | 2001-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1298249A (zh) | 无线装置的基于用户界面的语音识别 | |
US6594484B1 (en) | Automated access by mobile device to automated telephone information services | |
US6708214B1 (en) | Hypermedia identifier input mode for a mobile communication device | |
RU2355044C2 (ru) | Последовательный мультимодальный ввод | |
US20050015406A1 (en) | Method and system for customizable client aware content selection and rendering in a portal server | |
JP3490235B2 (ja) | 携帯電話機等の双方向データ通信デバイスとコンピュータとの間の通信のための双方向データ通信システム及びそこで使用される双方向通信デバイスとその使用方法 | |
US7003327B1 (en) | Heuristically assisted user interface for a wireless communication device | |
US7054626B2 (en) | Method and architecture for an interactive two-way data communication network | |
JP4059502B2 (ja) | 予測エディタアプリケーションを有する通信端末装置 | |
EP0964590A2 (en) | Visual interface to mobile subscriber account services | |
US20070143307A1 (en) | Communication system employing a context engine | |
US20070123223A1 (en) | Enhanced analogue of interactive voice response structures and functions for mobile phones and similar handheld communications devices | |
US20090132487A1 (en) | System and method for video call based content retrieval, directory and web access services | |
CN1244076A (zh) | 用于管理无线数据网络中一组移动台的方法和结构 | |
CN1369164A (zh) | 用于从蜂窝通信系统中的服务器取内容的方法和系统 | |
JPH11328078A (ja) | 複合要求を用いてハイパ―テキストペ―ジのナビゲ―ションを加速させるための方法及び装置 | |
CN1236924A (zh) | 用别名实现灵活链接的方法与装置 | |
CN103347137A (zh) | 一种用户业务办理数据的处理方法及装置 | |
US20020174177A1 (en) | Voice activated navigation of a computer network | |
JP2002091847A (ja) | 数の組合せを使用する無線インターネット短縮接続及び短縮キーを利用する無線インターネット接続方法 | |
KR20000024577A (ko) | 무선 인터넷 문서 통합 작성기 | |
CN109660672A (zh) | 语音类型的转换方法、设备及计算机可读存储介质 | |
CN1798152A (zh) | 向内容提供商进行简易注册及其方法 | |
JP4764299B2 (ja) | 携帯電話機特定方法、サーバ装置およびコンピュータプログラム | |
KR20040042927A (ko) | 단문 메시지 서비스를 이용한 정보 검색 서비스 시스템 및그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |