CN1620018A - 通过个人计算系统访问语音服务的方法和系统 - Google Patents

通过个人计算系统访问语音服务的方法和系统 Download PDF

Info

Publication number
CN1620018A
CN1620018A CNA2004100889623A CN200410088962A CN1620018A CN 1620018 A CN1620018 A CN 1620018A CN A2004100889623 A CNA2004100889623 A CN A2004100889623A CN 200410088962 A CN200410088962 A CN 200410088962A CN 1620018 A CN1620018 A CN 1620018A
Authority
CN
China
Prior art keywords
user
computing system
request
voice
personal computing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004100889623A
Other languages
English (en)
Inventor
S·B·甘地
P·P·曼塞
A·B·帕特尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1620018A publication Critical patent/CN1620018A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/06Authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种通过个人计算系统访问语音服务的方法能包括:在该个人计算系统中接收来自于已向该个人计算系统注册的用户的电话呼叫,其中该用户位于远离该个人计算系统的地方;通过该电话呼叫接收用户的语音表述;以及对该用户的语音表述进行语音识别,以确定对一语音服务的请求。该方法还能包括:根据该对一语音服务的请求格式化一电子消息;并根据该对一语音服务的请求通过一通信网络将该电子消息发送给远程计算系统。再有,该方法能包括处理和格式化从该远程计算系统接收的响应并通过电话呼叫将音频重放给用户。

Description

通过个人计算系统访问语音服务的方法和系统
技术领域
本发明涉及语音服务领域,更具体地说,涉及通过个人计算机系统提供对基于网络的信息服务的访问。
背景技术
门户是一个作为访问信息入口点的Web站点。门户有效地提供一个中心网络位置,用户能通过它访问信息,如新闻、天气报告、股票报价、电子邮件等。通常,通过门户提供的内容和该内容的提供方式能被用户定制。因此,每个用户能通过该门户以用户特定的方式访问和观看个性化的信息以及得到各种服务。
访问门户的主要机制一直是通过Web使能的设备。具体地说,用户经由有适当因特网连接的家庭计算机系统访问门户。只要用户能访问这类计算机系统,该用户便能从门户得到信息和其他服务。
当离开该计算机系统时,用户仍可访问门户,尽管是通过某种无线的因特网使能的设备。传统上,蜂窝电话,例如被配置成使用无线访问协议(WAP)进行通信的那些蜂窝电话,已向用户提供访问门户的能力。尽管蜂窝电话提供了可移动性,但用户被限定于通过装入蜂窝电话的小可视显示器访问信息和服务。
在任何情况中,为了从一个Web门户访问信息,用户一直被限定于使用具有因特网连接的设备。再有,用户通常必须订购一个收费服务以在移动时访问个性化信息。
发明内容
本发明提供一种方法、系统和装置,用于使用语音命令通过电话连接访问Web内容。特别是,本发明允许用户呼叫一个家庭计算机系统并通过已建立的呼叫请求信息或服务。该家庭计算机系统能得到所请求的信息或完成用户请求的服务。这样,该用户能通过用户自己的计算机系统访问因特网上的例如来自一个Web门户的信息和内容。通过允许经由电话访问Web门户和其他服务,如电子邮件和即时消息传送,能免除或至少是最大限度地减少对订购额外无线服务或其他付费服务的需求。
本发明的一个方面能包括一种通过个人计算系统访问语音服务的方法。该方法能包括:在个人计算系统中接收来自已向该个人计算系统注册的用户的电话呼叫,其中该用户位于远离该个人计算系统的地方;通过该电话呼叫接收用户的语音表述;以及对该用户的语音表述进行语音识别,以确定对一个语音服务的请求。该方法还能包括:根据该对一个语音服务的请求格式化电子消息;并根据该对一个语音服务的请求,通过一个通信网络将该电子消息发送给远程计算系统。
在本发明的一个实施例中,该请求能是一个从远程计算系统获取内容的请求。在那种情况中,所述格式化步骤能包括构建要通过因特网发送的电子消息。该方法还能包括:在该个人计算系统中接收来自远程计算系统的内容;在该个人计算系统中把该内容转换成语音音频;以及通过该电话呼叫把该音频播放给该用户。
在本发明的另一实施例中,该请求能是发送电子邮件的请求。因此,该方法能包括:接收至少一个附加的用户语音表述,并将这附加的语音表述转换成文本。值得注意的是,所述格式化步骤能构建一个要在发送步骤中发送的电子邮件。由语音识别出的文本能被包括在该电子邮件中。
在又一个实施例中,该请求能是发送一个即时消息的请求。因此,该方法能包括:接收至少一个附加的用户语音表述,并将这附加的用户语音表述转换成文本。在那种情况中,所述格式化步骤能包括构建一个要在发送步骤中发送的即时消息。该即时消息能包括上述由语音识别出的文本。
本发明的另一方面能包括一种用于通过个人计算系统访问语音服务的系统。该系统能包括:一个接口,用于在该个人计算系统中接收电话呼叫;以及布置在该个人计算系统中的语音识别系统,用于将通过已建立的电话呼叫接收的用户语音表述转换成文本。该系统还能包括一个服务引擎,其被配置成接收来自上述语音识别系统的由语音识别出的文本,从该文本中识别用户请求,根据该用户请求产生消息,以及通过通信网络向至少一个远程计算系统发送这些消息。
在本发明的另一实施例中,该系统能包括布置在该个人计算系统中的文本到语音转换引擎,用于将收到的文本转换成语音以通过建立的电话呼叫播放。上述服务引擎能接收响应于所发送消息的内容并将该内容提供给文本到语音转换引擎以按语音来呈现。
根据本发明的另一实施例,该服务引擎能包括一个电子邮件接口,其被配置成根据用户请求产生消息,例如电子邮件消息。该服务引擎还能包括一个即时消息传送接口,其被配置成根据用户请求产生消息,其中的消息是即时消息。还有,该服务引擎能包括一个超文本传输协议接口,其被配置成对用户请求进行格式化供通过因特网传送。
附图说明
附图中显示当前的优选实施例,然而应该理解,本发明不限于所示精确的结构安排和手段。
图1是示意图,显示根据这里公开的本发明结构安排,经由电话连接通过个人计算系统访问基于因特网的内容的系统;
图2是示意图,显示根据这里公开的本发明结构安排,个人家庭语音门户的一个实施例;以及
图3是流程图,显示根据这里公开的本发明结构安排,经由电话连接和家庭计算系统从各个网络位置访问信息和/或服务的方法。
具体实施方式
图1是示意图,显示根据这里公开的本发明结构安排,经由电话连接通过个人计算系统访问基于因特网的内容的系统100。如图所示,系统100能包括一个或多个电话,它们经由网络,如公共交换电话网(PSTN)110与个人计算系统105通信链接。个人计算系统105经由通信网络与一个或多个服务器通信链接。
无线电话120能是一个蜂窝电话或能通过中继站或中继塔125通信链接于PSTN 110的其他无线通信设备。电话130能是常规的陆线电话,它能经由中心局或其他电话交换系统通信链接到PSTN 110。电话130能包括远离计算机系统105的任何电话,包括但不限于公共电话。因特网协议(IP)电话135能经服务器140或能使基于IP的通信网络与PSTN 110接口的其他网关机制与PSTN 110通信链接。
应该理解,这里公开的举例只是为了示例的目的而提供的。这样,本发明不受所使用的特定类型通信设备的限制。相反,能通过PSTN发送和接收语音信号和/或双音多频(DTMF)信号的各种通信设备中的任何设备都能用于实施本发明。
个人计算系统105能是各种能连接于PSTN 110和通信网络115,如因特网、万维网(Web)、局域网(LAN)或广域网(WAN)等的计算和/或信息处理设备中的任何设备。例如,个人计算系统105能实现为一个常规的带有调制解调器的家庭台式计算机、还带有调制解调器的便携式计算机(如膝上计算机)或被配置成具有这里所述功能的某些其他信息处理设备。
个人计算系统105能包括个人家庭语音门户(未示出),它允许用户使用这里描述的电话设备从远程位置呼叫个人计算系统105。个人家庭语音门户(PHVP)能接收用户语音命令、口授指令和DTMF信号,从而使个人计算系统105发起某种动作。例如,PHVP允许用户访问来自门户服务器145的信息和/或服务,经由IM服务器150发送和接收即时消息(IM),以及经由电子邮件服务器155发送和接收电子邮件(e-mail)。PHVP能包括文本到语音转换和语音识别功能,从而用户能通过语音命令、口授指令、DTMT信号或它们的任何组合来执行前述的功能。
个人计算系统105能通过通信网络115通信链接到一个或多个服务器,如门户服务器145、IM服务器150以及电子邮件服务器155。尽管IM服务器150和电子邮件服务器155能是专用于特定用途的,但门户服务器145能提供多种服务,如电子邮件、新闻、股票报价等财经信息以及其他服务,如列表服务和分组。门户服务器145能被每个用户定制使用。就是说,用户能配置门户服务器145使其只提供该用户所希望的那些服务。通常,用户能注册到门户服务器145。于是该用户能对门户服务器145上的一个或多个Web页进行个性化,用户能以适当的用户名、口令和/或其他认证机制访问它们。每个Web页能包括由用户选择的内容。再有,应该理解,个人计算系统105能通信链接到一个或多个其他基于Web的服务器,不论是基于订购的还是可自由访问的服务器。
在操作上,用户能从无线电话120、电话130和/或IP电话135发起一个电话呼叫。该呼叫可被引导到用户自己的个人计算系统105,例如位于该用户家里的一个计算系统。该用户在登录到个人计算系统105并通过认证之后,能发出一个或多个语音命令。该用户能向门户服务器145请求信息、发送电子邮件、检查收到的电子邮件、发送IM和接收IM。
例如,该用户能发出一个要发送电子邮件的口头请求。该用户能说明要向其发送电子邮件的用户名或电子邮件地址。该用户能继续口授该电子邮件的正文,然后命令PHVP发送该电子邮件。PHVP能包括一个电子邮件客户机程序或与一个电子邮件客户机程序进行交互作用,该电子邮件客户机程序能把该电子邮件转发到电子邮件服务器155。
在另一个例子中,用户能通过该电话线路请求一个或多个股票报价。PHVP能代表该用户登录到门户服务器145。该用户请求能被PHVP语音识别并转换成文本,被格式化为超文本传输协议(HTTP)请求并转发给门户服务器145。PHVP能接收所请求的内容并把该内容转换成要通过该电话呼叫播放给用户的语音。
这里公开的本发明结构安排能向呼叫用户提供对个性化服务的访问,这或者是通过访问该用户已在一个远程服务器(如门户服务器145)上注册的服务,或者是通过访问存储在个人计算系统105上的地址簿或其他信息,或者是通过访问个人计算系统105、IM服务器150和电子邮件服务器155上的电子邮件或即时消息传送。再有,尽管个人计算系统105能应答来自图1所示电话设备的呼叫,但本领域技术人员将会认识到,个人计算系统105的功能并不是作为传统的服务器起作用。特别是,个人计算系统105并不实施对多个客户机的管理性控制。就是说,就访问门户服务器145、IM服务器150以及电子邮件服务器155而言,个人计算系统105的功能是作为客户机。呼叫进入个人计算机105的各种电话设备不能通过个人计算系统105受到管理或控制。
图2是示意图,显示根据这里公开的本发明结构安排,PHVP 200的一个实施例。PHVP 200能包括电话接口205(如调制解调器)、语音识别系统(SRS)210、文本到语音转换(TTS)引擎215以及服务引擎220。在本发明的一个实施例中,PHVP 200能包括HTTP接口225、IM接口230和电子邮件接口235。可替代地,PHVP 200能被配置成与被配置成提供这类功能的其他软件应用进行交互作用。例如,PHVP 200能被配置成与浏览器、IM客户机和/或电子邮件客户机进行交互作用。
电话接口205能接收来自PSTN的进入的电话呼叫。电话接口205还能完成PSTN和PHVP 200之间交换的音频(不论是语音和/或DTMF信号)的模-数和数-模转换。如本领域已知,SRS 210能把接收的音频转换成等价文本。在本发明的一个实施例中,SRS 210能完成独立于说话者的语音识别和/或依赖于设备的语音识别。就是说,用户能登记到SRS 210并为该用户希望与PHVP 200一起使用的每个电话设备创建一个或多个登记记录。该登记过程提高了语音识别精度,因为SRS 210学习该用户的说话方式和所用电话设备的音频特性。然而,在另一实施例中,SRS 210能完成依赖说话者和/或独立于设备的语音识别。TTS引擎215能接收文本并产生音频输出。就是说,TTS引擎215能产生所接收文本的等价语音或口语。
HTTP接口225提供与Web页和/或门户进行交互作用的功能。HTTP接口225能对要通过通信网络发送的请求进行格式化并对收到的响应请求的信息进行解码。应该理解,各种不同类型请求中的任何请求都能通过HTTP接口225被格式化和解码。例如,HTTP接口225能处理遵从文件传输协议(FTP)、轻量目录访问协议(LDAP)、HTTP以及能用于在通信网络上进行通信的其他类型通信协议的请求和响应。
IM接口230能把消息格式化为即时消息(IM)以供在通信网络上发送,以及接收和解码IM以供服务引擎220使用。类似地,电子邮件接口235能对电子邮件进行格式化以供在通信网络上发送,并接收和解码电子邮件以供服务引擎220使用。
服务引擎220能协调PHVP 200各部件的动作。特别是,服务引擎220能从SRS 210接收语音识别后的文本并处理该文本以确定用户希望的一个或多个功能或操作。服务引擎220还能向TTS引擎215提供文本以按音频来呈现。例如,服务引擎220能把经由HTTP接口225、IM接口230以及电子邮件接口235接收的内容路由到TTS引擎215供作为语音重放。于是,这个音频能经由电话接口205通过已建立的电话呼叫播放给用户。
服务引擎220能对即时消息(IM)、电子邮件、或其他Web内容(如Web页)的文本进行格式化以供通过TTS引擎215重放。例如,服务引擎220能去掉那些不被TTS引擎215需要或理解的标记语言标记或其他附加注释,以及添加能被TTS引擎215理解的注释。在一个实施例中,服务引擎220能包括用于去掉可由HTTP接口225、IM接口230和/或电子邮件接口235使用的标记语言、符号和/或文本的规则。服务引擎215还能对要提供给TTS引擎215的文本进行注释,以控制向用户读或播放该文本的方式。例如,服务引擎215能对该文本进行注释以在数据字段、股票报价或列表中的其他项之间添加停顿。还能在电子邮件的主题和正文部分之间添加停顿,视情况而定。插入停顿能有利于顺畅和合乎逻辑地重放内容,不论内容来自Web页、即时消息还是电子邮件。
服务引擎220还能确定正由用户请求的特定动作或服务。如果不需要进一步的信息来完成用户指定的动作,则服务引擎220能指示HTTP接口225、IM接口230和/或电子邮件接口235去完成用户指定的动作。如果必要,服务引擎220能使TTS引擎215提示用户提供其他所需要的信息和/或口授指令。任何用户响应,不论是语音还是DTMF输入,都能由SRS 210处理并提供给服务引擎220以供处理。由服务引擎220接收的信息,不论是来自HTTP接口225的内容、从IM接口230接收的即时消息和/或从电子邮件接口235接收的电子邮件都能被提供给TTS引擎215以供通过电话呼叫重放给用户。
PHVP 200能包括一个数据存储区240,其中有一个或多个用户简档。每个用户简档能说明用户请求与相应动作的关联。例如,能把用户对股票报价的请求与该用户已向其注册了一个账户的特定Web门户关联。当收到一个用户对股票报价的请求并与存储在用户简档中的股票报价请求匹配时,便能执行与用户简档中所匹配的请求关联的动作。继续参见图示,在用户简档中指定的与股票报价请求关联的信息源能被访问或查询以获取用户指定的信息。值得注意的是,用户简档还能包括任何用户名和/或口令,它们可能对于服务引擎220代表该用户登录到一个Web门户或其他订购的服务是必须的。
在该简档中能存储类似的关联,用于请求发送电子邮件、即时消息等。通过将语音识别出的用户请求文本与用户简档中说明的请求进行比较,服务引擎220能与HTTP接口225通信以发送请求和接收电子内容,与IM接口230通信以发送和接收即时消息以及与电子邮件接口235通信以发送和接收电子邮件。
图3是流程图,显示根据这里公开的本发明结构安排的一个实施例,经由电话连接和家庭计算系统从各个网络位置访问信息和/或服务的方法300。方法300能在用户位于远离他或她自己的个人计算机系统但能进行电话访问的状态下开始。于是,在步骤305,用户能发起对该用户个人计算系统的电话呼叫。例如,用户能拨打该用户的家庭电话号码。
在步骤310,PHVP能应答所接收的电话呼叫。例如,在用户个人计算系统内操作的PHVP能被配置成应答在家中接收的电话呼叫或应答一个特定的线路。在步骤315,一旦PHVP已应答该电话呼叫,能由PHVP系统对该用户或呼叫者进行验证。该用户能提供用户名和/或口令,不论是以用户语音和/或DTMF信号形式。在本发明的另一实施例中,能进行生物统计验证方法。例如,声纹技术能用于验证用户。在任何情况下,一旦用户被识别出来,便能选出该用户的简档。
在步骤320,PHVP可选地能识别出由用户使用发起该呼叫的设备。如果必要,则PHVP能提供音频提示,或只是识别出指明发起该呼叫所用设备类型的用户语音或DTMF信号。例如,由于PHVP是在用户的个人计算系统中操作,该用户能向SRS建立多个登记记录。每个登记记录能属于一个特定电话或语音通信设备。作为示例,用户能使用蜂窝电话、IP电话、或用户可选择用于发起电话呼叫的任何其他设备进行登记。每个登记记录存储进行登记所用设备的音频通道特征以及用户的语音特征。通过选择与正在用于呼叫的设备对应的登记记录,能提高语音识别的准确性。
在本发明的一个实施例中,用户能在被PHVP识别出之后选择一个特定简档。每个简档能指明一个要在该呼叫期间内使用的特定登记记录,因此也指明了电话设备。每个简档进一步能指明对于给定任务要使用的不同信息源。例如,用于一个用户的一个简档能指明要从一个“已付费”服务访问股票报价和要从第一电子账户访问电子邮件。用于这同一用户的第二用户简档能指明要从一个免费Web门户得到股票报价和要检查一个不同的电子邮件账户。这使该用户能够拥有例如一个商务简档和一个人简档,每个简档访问不同的信息源并被设计成与不同类型的电话设备一起使用。
在识别出用户和正用于发起电话呼叫的特定设备二者之后,在步骤325能加载用于该呼叫者的登记记录。如已指出的那样,选定的登记记录不仅能对应于用户,而且还能对应于呼叫期间内正由该呼叫者使用的电话设备类型。尽管方法300说明的实施例中进行的是依赖于说话者和设备的语音识别,本领域技术人员将会认识到,本发明不限于此。相反,独立于说话者和/或独立于设备的语音识别也能被使用。
在步骤330,PHVP能通过已建立的电话呼叫接收用户对服务的请求。该服务请求能是从一个Web站点、门户或其他远程信息源请求内容,请求检查电子邮件、发送或编写电子邮件、检查接收的即时消息、编写即时消息或发送即时消息等。在步骤335,由语音识别出的用户请求文本能与选定的用户简档进行比较。该文本能被匹配于该用户简档中说明的一个特定请求。然后,可执行与所匹配的请求关联的动作。
在步骤340,PHVP能按照与所匹配的用户简档请求关联的动作指定的那样登录到该用户已经注册的一个服务器,不论是门户服务器、IM服务器还是电子邮件服务器。例如,如果该用户已请求股票报价信息,而且如果已在该用户简档中进行了说明,则PHVP能登录到该用户的门户账户以下载个性化信息,在这一情况中,该个性化信息为股票信息,如来自一个被在线维护的个性化证券组合(portfolio)的报价。如果该用户已请求编写或访问电子邮件,PHVP能登录到该用户在一个远程服务器上的电子邮件账户。如果该用户已请求能从不需订购的数据源得到的更一般性信息,则PHVP不需登录到一个服务器来得到信息,而是查询一个一般性信息服务。
在步骤345,如果必要的话,PHVP能询问该用户,以得到系统为执行和/或完成用户指定任务所需要的任何附加信息。例如,这些附加信息能包括一个消息要发送到的一个或多个地址、或要插入到一个电子通信正文部分内的口授指令等。本领域技术人员将会认识到,PHVP能被配置成与用户持续一个对话以得到任何需要的信息。
在步骤350,能对收到的数据以及由PHVP确定或访问到的任何数据(例如来自用户简档的数据)根据接收到的用户请求进行格式化。例如,如果该用户请求是要编写和/或发送电子邮件,则所接收的口授指令和任何指定的电子邮件地址能被插入到电子邮件消息中。类似地,由语音识别出的文本能被插入到一个即时消息中或被纳入到一个HTTP请求中。
在步骤355,格式化后的数据能被转发到远程计算机系统。这样,例如,能发送格式化后的电子邮件、格式化后的即时消息、HTTP请求、或要下载新电子邮件的请求。应该理解,如果在步骤355发送的消息是调用一个响应的请求,则该响应能由服务引擎处理并提供给TTS引擎供重放给用户。作为示例,响应HTTP请求所接收的内容能重放给用户。检索出的电子邮件或接收到的即时消息也能重放给用户。
在任何情况下,在步骤360,能在用户的个人计算系统中的PHVP中接收来自远程计算机系统的响应。该响应能是一个,关于该用户请求的操作是否成功完成的指示,或者能是由用户(因而也是PHVP)请求的信息。例如,PHVP能接收一个指示,指出一个电子邮件或即时消息已被成功发送。如果用户请求了财经信息,则那个信息能被接收。
在步骤365,该响应能由PHVP处理或转换成音频。所接收的消息能被解析以提取文本。例如,能去掉附加的信息,如标记或标头信息,从而只从接收的消息中提取内容。此外,该内容的韵律特征(prosodiccharacteristics)能被改变,以使得到的音频声音更加自然。例如,该文本能被注释以在制表符或逗号分开的数据、列等之间插入停顿。还能改变其他韵律特征,如音节重音。最终内容能提供给PHVP的TTS引擎以按音频呈现。在步骤370,最终音频能通过已建立的电话呼叫由PHVP重放播放给用户。
本发明提供一个性化语音门户,它使得用户能使用个人计算系统和电话设备访问各种Web内容和基于因特网的订购服务。通过调用用户自己的个人计算系统,用户能经由电话例如从Web门户访问个性化的和定制的数据。于是,用户通过电话呼叫听见所请求数据的有声呈现,无需订购额外的付费移动信息服务。
本发明能以硬件、软件或硬件和软件的组合实现。本发明能以集中式方式在一个计算机系统中实现,或以分布式方式实现,其中不同的部件跨若干互连的计算机系统分布。任何种类的计算机系统或适于实现这里所述方法的其他装置都是适用的。硬件和软件的典型组合能是一台具有计算机程序的通用计算机系统,该计算机程序在被加载和执行时控制该计算机系统使其实现这里描述的方法。
本发明还能嵌入到一个计算机程序产品中,它包含使能实现这里所述方法的全部特征,当它被加载到计算机系统时能实现这些方法。在本情境中的计算机程序是指欲使具有信息处理能力的系统执行特定功能的一组指令的以任何语言、代码或符号的任何表达,其特定功能的执行或者是直接的或者是在下述二者之一或二者之后进行:a)转换成另一种语言、代码或符号;b)以不同的材料形式再现。
本发明能以其他形式体现而不背离其精神或本质属性。因此,应参考下列权利要求而不是前文的说明书,以指示本发明的范围。

Claims (20)

1.一种通过个人计算系统访问语音服务的方法,包含如下步骤:
在该个人计算系统中接收来自于已向该个人计算系统注册的用户的电话呼叫,其中该用户位于远离该个人计算系统的地方;
通过该电话呼叫接收用户的语音表述;
对该用户的语音表述进行语音识别,以确定对一语音服务的请求;
根据上述对一语音服务的请求格式化一电子消息;以及
根据上述对一语音服务的请求通过一通信网络将该电子消息发送给一远程计算系统。
2.权利要求1的方法,其中该请求是一从远程计算系统获取内容的请求,所述格式化步骤包含构建要通过因特网发送的电子消息。
3.权利要求2的方法,进一步包含如下步骤:
在该个人计算系统中接收来自所述远程计算系统的内容;
在该个人计算系统中将该内容转换成语音音频;以及
通过该电话呼叫将该音频播放给该用户。
4.权利要求1的方法,其中该请求是请求发送电子邮件,所述方法进一步包含如下步骤:
接收至少一个附加的用户语音表述;以及
将这至少一个附加的用户语音表述转换成文本,其中所述格式化步骤构建一个要在所述发送步骤中发送的电子邮件并在该电子邮件中包括由该语音识别出的文本。
5.权利要求1的方法,其中该请求是请求发送即时消息,所述方法进一步包含如下步骤:
接收至少一个附加的用户语音表述;以及
将这至少一个附加的用户语音表述转换成文本,其中所述格式化步骤构建一个要在所述发送步骤中发送的即时消息并在该即时消息中包括由该语音识别出的文本。
6.一种用于通过个人计算系统访问语音服务的系统,包含:
一接口,用于在该个人计算系统中接收电话呼叫;
布置在该个人计算系统中的一语音识别系统,用于将通过已建立的电话呼叫接收的用户语音表述转换为文本;以及
一服务引擎,被配置成接收来自所述语音识别系统的由语音识别出的文本,从该文本中识别用户请求,根据该用户请求产生消息,以及通过通信网络向至少一个远程计算系统发送这些消息。
7.权利要求6的系统,进一步包含布置在该个人计算系统中的文本到语音转换引擎,用于将收到的文本转换成语音以通过建立的电话呼叫播放,其中所述服务引擎接收响应于所发送消息的内容并将该内容提供给该文本到语音转换引擎以按语音来呈现。
8.权利要求7的系统,其中所述服务引擎包含一电子邮件接口,被配置成根据用户请求产生消息,其中的消息是电子邮件消息。
9.权利要求8的系统,其中所述服务引擎包含一即时消息客户机,被配置成根据用户请求产生消息,其中的消息是即时消息。
10.权利要求9的系统,其中所述服务引擎与一超文本传输协议接口进行交互作用,该接口被配置成对用户请求进行格式化供通过因特网传送。
11.一种用于通过个人计算系统访问语音服务的系统,包含:
用于在该个人计算系统中接收来自于已向该个人计算系统注册的用户的电话呼叫的装置,其中该用户位于远离该个人计算系统的地方;
用于通过该电话呼叫接收用户语音表述的装置;
用于对该用户语音表述进行语音识别以确定对一语音服务的请求的装置;
用于根据上述对一语音服务的请求格式化电子消息的装置;以及
用于根据上述对一语音服务的请求通过一通信网络将该电子消息发送给一远程计算系统的装置。
12.权利要求11的系统,其中该请求是一从远程计算系统获取内容的请求,所述用于格式化的装置构建要通过因特网发送的电子消息。
13.权利要求12的系统,进一步包含:
用于在该个人计算系统中接收来自所述远程计算系统的内容的装置;
用于在该个人计算系统中将该内容转换成语音音频的装置;以及
用于通过该电话呼叫将该音频播放给该用户的装置。
14.权利要求11的系统,其中该请求是请求发送电子邮件,所述系统进一步包含:
用于接收至少一个附加的用户语音表述的装置;以及
用于将这至少一个附加的用户语音表述转换成文本的装置,其中所述用于格式化的装置构建一要发送的电子邮件并在该电子邮件中包括由该语音识别出的文本。
15.权利要求11的系统,其中该请求是请求发送即时消息,所述系统进一步包含:
用于接收至少一个附加的用户语音表述的装置;以及
用于将这至少一个附加的用户语音表述转换成文本的装置,其中所述用于格式化的装置构建一要在所述用于发送的装置中发送的即时消息并在该即时消息中包括由该语音识别出的文本。
16.一种机器可读存储装置,其上存储有计算机程序,该计算机程序具有多个可由机器执行以使该机器实现如下步骤的代码部分:
在个人计算系统中接收来自于已向该个人计算系统注册的用户的电话呼叫,其中该用户位于远离该个人计算系统的地方;
通过该电话呼叫接收用户的语音表述;
对该用户的语音表述进行语音识别,以确定对一语音服务的请求;
根据上述对一语音服务的请求格式化一电子消息;以及
根据上述对一语音服务的请求通过一通信网络将该电子消息发送给一远程计算系统。
17.权利要求16的机器可读存储装置,其中该请求是一从远程计算系统获取内容的请求,所述格式化步骤包含构建要通过因特网发送的电子消息。
18.权利要求17的机器可读存储装置,进一步使该机器完成如下步骤:
在该个人计算系统中接收来自所述远程计算系统的内容;
在该个人计算系统中将该内容转换成语音音频;以及
通过该电话呼叫将该音频播放给该用户。
19.权利要求16的机器可读存储装置,其中该请求是请求发送电子邮件,所述机器可读存储装置进一步使该机器完成如下步骤:
接收至少一个附加的用户语音表述;以及
将这至少一个附加的用户语音表述转换成文本,其中所述格式化步骤构建一要在所述发送步骤中发送的电子邮件并在该电子邮件中包括由该语音识别出的文本。
20.权利要求16的机器可读存储装置,其中该请求是请求发送即时消息,所述机器可读存储装置进一步使该机器完成如下步骤:
接收至少一个附加的用户语音表述;以及
将这至少一个附加的用户语音表述转换成文本,其中所述格式化步骤构建一要在所述发送步骤中发送的即时消息并在该即时消息中包括由该语音识别出的文本。
CNA2004100889623A 2003-11-10 2004-11-09 通过个人计算系统访问语音服务的方法和系统 Pending CN1620018A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/705,328 US8233592B2 (en) 2003-11-10 2003-11-10 Personal home voice portal
US10/705,328 2003-11-10

Publications (1)

Publication Number Publication Date
CN1620018A true CN1620018A (zh) 2005-05-25

Family

ID=34552335

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004100889623A Pending CN1620018A (zh) 2003-11-10 2004-11-09 通过个人计算系统访问语音服务的方法和系统

Country Status (3)

Country Link
US (2) US8233592B2 (zh)
JP (1) JP2005151553A (zh)
CN (1) CN1620018A (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8023624B2 (en) 2005-11-07 2011-09-20 Ack Ventures Holdings, Llc Service interfacing for telephony
WO2007121441A2 (en) 2006-04-17 2007-10-25 Vovision Llc Methods and systems for correcting transcribed audio files
US8015014B2 (en) * 2006-06-16 2011-09-06 Storz Endoskop Produktions Gmbh Speech recognition system with user profiles management component
US7890138B2 (en) * 2006-06-30 2011-02-15 Advanced Micro Devices, Inc. Mechanism for remotely accessing a portable computer including wireless communication functionality
US7805131B2 (en) * 2007-05-03 2010-09-28 Sonus Networks, Inc. Personal service integration on a network
US9191514B1 (en) 2007-05-07 2015-11-17 At&T Intellectual Property I, L.P. Interactive voice response with user designated delivery
US20110022387A1 (en) * 2007-12-04 2011-01-27 Hager Paul M Correcting transcribed audio files with an email-client interface
US9953646B2 (en) 2014-09-02 2018-04-24 Belleau Technologies Method and system for dynamic speech recognition and tracking of prewritten script
CN111241588B (zh) * 2016-10-08 2020-11-10 创新先进技术有限公司 一种在应用中实现辅助功能的方法及装置
US11875798B2 (en) 2021-05-03 2024-01-16 International Business Machines Corporation Profiles for enhanced speech recognition training

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953392A (en) * 1996-03-01 1999-09-14 Netphonic Communications, Inc. Method and apparatus for telephonically accessing and navigating the internet
US5884262A (en) * 1996-03-28 1999-03-16 Bell Atlantic Network Services, Inc. Computer network audio access and conversion system
US6233318B1 (en) * 1996-11-05 2001-05-15 Comverse Network Systems, Inc. System for accessing multimedia mailboxes and messages over the internet and via telephone
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
JPH10190884A (ja) 1996-12-27 1998-07-21 Casio Comput Co Ltd 通信制御装置及び記憶媒体
US5995597A (en) * 1997-01-21 1999-11-30 Woltz; Robert Thomas E-mail processing system and method
JP3244014B2 (ja) 1997-02-14 2002-01-07 日本電気株式会社 マルチメディア変換装置および変換方式
US6721306B1 (en) 1997-03-11 2004-04-13 Verizon Services Corp. Public wireless/cordless internet gateway
KR100280045B1 (ko) * 1997-05-02 2001-02-01 윤종용 외부전화를이용한메일독출방법및그장치
EP0907271A1 (en) * 1997-09-25 1999-04-07 Alcatel Individualized system for exchanging data between a terminal and access means via a telephone network
US6859451B1 (en) * 1998-04-21 2005-02-22 Nortel Networks Limited Server for handling multimodal information
EP0987860A3 (en) 1998-09-16 2004-01-14 Mitsubishi Materials Corporation Radio server system
US6243445B1 (en) * 1998-11-03 2001-06-05 At&T Corporation Method and apparatus for telephone data network access
US6401085B1 (en) 1999-03-05 2002-06-04 Accenture Llp Mobile communication and computing system and method
CN1286561A (zh) 1999-08-30 2001-03-07 广东金科信息网络中心 使用普通电话机收发互联网电子邮件的信息服务系统
US6970915B1 (en) * 1999-11-01 2005-11-29 Tellme Networks, Inc. Streaming content over a telephone interface
JP2001216211A (ja) 1999-11-24 2001-08-10 Sharp Corp インターネットサービス提供システムおよび方法、ならびにインターネットサービス提供システムで用いられるマクロサーバ
US6625258B1 (en) * 1999-12-27 2003-09-23 Nortel Networks Ltd System and method for providing unified communication services support
US20010023400A1 (en) * 2000-02-04 2001-09-20 Webley Systems, Inc. Collectively functioning bundle of telephone and network services
US6721705B2 (en) * 2000-02-04 2004-04-13 Webley Systems, Inc. Robust voice browser system and voice activated device controller
JP2002033832A (ja) 2000-07-18 2002-01-31 Ntt Docomo Inc サービス提供システム、ボイスゲートウェイ、コンテンツサーバおよびサービス提供方法
US6507727B1 (en) 2000-10-13 2003-01-14 Robert F. Henrick Purchase and delivery of digital content using multiple devices and data networks
US20020169615A1 (en) * 2001-03-23 2002-11-14 Irwin Kruger Computerized voice-controlled system for compiling quality control data
US7016348B2 (en) * 2001-08-28 2006-03-21 Ip Unity Method and system for direct access to web content via a telephone
JP2003167895A (ja) 2001-11-30 2003-06-13 Denso Corp 情報検索システム、サーバおよび車載端末
US20030152203A1 (en) * 2002-02-13 2003-08-14 Berger Adam L. Message accessing
JP2003309673A (ja) 2002-04-16 2003-10-31 Nippon Telegraph & Telephone East Corp 音声の提供及び課金装置、音声の提供及び課金方法、コンピュータプログラム及びそのプログラムを記録した記録媒体
US20040088358A1 (en) * 2002-11-05 2004-05-06 Nokia Corporation Method and system for setting up a notification
US20040117838A1 (en) * 2002-12-11 2004-06-17 Jeyhan Karaoguz Headend pre-processing media guide support for personal media exchange network
CN1531312A (zh) 2003-03-10 2004-09-22 联想(北京)有限公司 电话语音交互系统的输入方法
US20060218191A1 (en) * 2004-08-31 2006-09-28 Gopalakrishnan Kumar C Method and System for Managing Multimedia Documents
US7672440B2 (en) * 2005-01-20 2010-03-02 International Business Machines Corporation Single point of contact personal communication system
US8606781B2 (en) * 2005-04-29 2013-12-10 Palo Alto Research Center Incorporated Systems and methods for personalized search
US7976386B2 (en) * 2006-06-12 2011-07-12 Tran Bao Q Mesh network game controller with voice transmission, search capability, motion detection, and/or position detection
GB0703974D0 (en) * 2007-03-01 2007-04-11 Sony Comp Entertainment Europe Entertainment device
US20080318679A1 (en) * 2007-06-21 2008-12-25 Alexander Bach Tran Foot game controller with motion detection and/or position detection

Also Published As

Publication number Publication date
US8831185B2 (en) 2014-09-09
JP2005151553A (ja) 2005-06-09
US20050100142A1 (en) 2005-05-12
US20120263281A1 (en) 2012-10-18
US8233592B2 (en) 2012-07-31

Similar Documents

Publication Publication Date Title
US7649877B2 (en) Mobile device for sending text messages
US6385306B1 (en) Audio file transmission method
CN1303555C (zh) 通过无线装置访问目标确定的、个人化的万维网语音/音频内容的方法和设备
US7167830B2 (en) Multimodal information services
US7986964B2 (en) System and method for providing SMS2PSTN united messaging service using SMS/MMS gateway
CN100343849C (zh) 在通信节点储存地理信息的方法
US8831185B2 (en) Personal home voice portal
EP2248335B1 (en) System and method for providing audible spoken name pronunciations
US7636426B2 (en) Method and apparatus for automated voice dialing setup
WO2001052503A2 (en) Methods and apparatus for forwarding audio content using an audio web retrieval telephone system
US20050114139A1 (en) Method of operating a speech dialog system
US20010014861A1 (en) Voice internet service system
US6640210B1 (en) Customer service operation using wav files
KR20020032488A (ko) 멀티디바이스 통합형 구인·구직 정보 제공 및 중계시스템과 그 방법
KR100443498B1 (ko) 음성 홈페이지 시스템을 이용한 부재중 자동응답시스템
KR20010083862A (ko) 무선 단말기를 이용한 모바일 업무 시스템 및 그 방법
US20040156483A1 (en) Unified messaging communication method and system with user-specific announcement message
KR100420773B1 (ko) 음성 인식을 이용한 실시간 통화 중 음성 정보 서비스제공 시스템 및 그 방법
US20070160187A1 (en) System and method for redirecting a telecommunicating party to an information source over a computer network
US20040258217A1 (en) Voice notice relay service method and apparatus
KR100629460B1 (ko) 음성 인터페이스를 이용하여 인터넷 커뮤니티 서비스를무선으로 제공하는 방법 및 시스템
KR20020032249A (ko) 클라이언트 컴퓨터에서 실행가능한 인터넷 통신 서비스 방법
KR20020072359A (ko) 음성인식을 이용한 무인 자동 전화교환 및 웹메일링시스템 및 방법
KR20050063673A (ko) Tts를 이용한 콜렉트 콜 서비스 제공 방법 및 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication