CN1836431A - 一种用于向无线信息设备提供语音邮件的方法 - Google Patents

一种用于向无线信息设备提供语音邮件的方法 Download PDF

Info

Publication number
CN1836431A
CN1836431A CNA2004800136152A CN200480013615A CN1836431A CN 1836431 A CN1836431 A CN 1836431A CN A2004800136152 A CNA2004800136152 A CN A2004800136152A CN 200480013615 A CN200480013615 A CN 200480013615A CN 1836431 A CN1836431 A CN 1836431A
Authority
CN
China
Prior art keywords
message
text
transcribing
user
text message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800136152A
Other languages
English (en)
Other versions
CN1836431B (zh
Inventor
丹尼尔·迈克尔·道尔顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Ltd
Original Assignee
SpinVox Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SpinVox Ltd filed Critical SpinVox Ltd
Priority claimed from PCT/GB2004/001805 external-priority patent/WO2004095821A2/en
Publication of CN1836431A publication Critical patent/CN1836431A/zh
Application granted granted Critical
Publication of CN1836431B publication Critical patent/CN1836431B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/06Message adaptation to terminal or network requirements
    • H04L51/066Format adaptation, e.g. format conversion or compression
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42204Arrangements at the exchange for service or number selection by voice
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/4228Systems providing special services or facilities to subscribers in networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/537Arrangements for indicating the presence of a recorded message, whereby the presence information might include a preview or summary of the message
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/45Aspects of automatic or semi-automatic exchanges related to voicemail messaging
    • H04M2203/4536Voicemail combined with text-based messaging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

在语音邮件服务器接收语音邮件并且将其转换为音频文件格式;然后经由广域网将其发送或者流送至包括计算机网络的语音-文本转录系统。其中一个联网计算机向操作方播放所述语音消息,并且操作方通过把对应的文本消息(实际上是原始语音消息的简练版本,不是啰嗦的字对字的转换)输入计算机以生成转录的文本消息来智能地根据原始语音消息转录实际消息。然后把转录的文本消息从计算机发送到无线信息设备。因为是使用操作员而不是机器转录,所以得以正确地、智能地、适当地并且简练地将语音邮件转录为文本消息(SMS/MMS)。

Description

一种用于向无线信息设备提供语音邮件的方法
技术领域
本发明涉及一种用于向无线信息设备提供语音邮件的方法。在本专利说明书中使用的术语‘无线信息设备’应该被可扩展地解释为覆盖具有双向无线信息能力的任何类型的设备,并且包括但不限于无线电话、智能电话、发信机、无线消息终端、个人计算机、计算机和应用程序专用设备。它包括能够经由任何类型的网络依照任何方式来进行通信的设备,诸如GSM或者UMTS、CDMA和WCDMA移动无线电通信、蓝牙、IrDA(红外线数据传输)等等。
背景技术
语音邮件具有这样的专用目的,即:当某人尝试呼叫一用户的电话但该用户不可用时,用于存储来自该人的语音消息,并且随后在方便的时候将该消息传递给该用户。但是如今的语音邮件系统(尤其是对于诸如移动电话之类的无线信息设备而言)无法智能地执行此操作。主要原因在于从用户无线信息设备到远程语音邮件服务器的交互特性:通常,移动电话用户将呼叫由网络操作方控制的语音邮件服务器(或者由语音邮件服务器呼叫移动电话用户)。所述语音邮件服务器将生成合成语音,用于向用户通告消息数目,然后重放所述消息;然后由所述合成语音讲出各种选项,诸如“按1回复”、“按2删除”、“按3重复”等。这向用户提出了多个问题:第一,他也许没有笔和纸在手边来记下任何重要的信息;第二,他可能忘记或不能够听到选项,并且因此将无法有效地操作语音邮件系统。
由于这种不适当的并且晦涩的交互,所以至少45%的移动电话用户不使用语音邮件。在使用语音邮件的用户中,语音邮件通常占据用户通话时间和花费的30%。这种可能令人吃惊的高程度的其中一个原因是:由于交互困难,仅仅为了收听在第一次收听时没有得到关键消息的细节,用户经常再次拨入电话。
为了使获取语音邮件更加容易,已经做出了一些努力:例如可以参考Breveon公司的US 6507643:在该篇专利中,使用语音识别计算机将语音邮件自动地转换为文本消息,该文本消息适合作为电子邮件消息发送,并且可以在诸如PC或者膝上型计算机的文本显示设备上查看。读取书面消息比必须收听讲出的语音邮件要快;而且因为已经将其转录,所以不需要写下来自消息的重要信息。然而,自动语音邮件系统具有十分有限的性能和准确性;它们还盲从地转录人的话语中的正常停顿(‘呃’、‘嗯’、‘啊’等)。当一个人正在收听人讲话时,他很容易过滤出这些声音并且关注于实质交流。把这些停顿盲从地转录为电子邮件会使发件人看起来不容易被理解。
从理论上看,在移动电话自身内也可以配置自动语音-文本转换:可以参考“Nokia Short Voice Messaging system”(诺基亚短语音消息系统)(参见EP 1248486),在该系统中,用户可以向其移动电话讲一条消息,所述移动电话使用自动语音识别引擎在本地将其转换为文本,然后将其打包并且作为SMS消息发送。
在语音-文本转换系统的领域中不可避免的偏见在于改善自动语音识别软件的准确性;然而,当前一代的软件仍需要被训练来识别特定人员所讲的单词,或者仅限于识别非常有限的词汇,而且在语境方面存在很大困难。训练要求用户读出非常广泛的测试段落,然后校正由机器转录引入的转录错误。这是非常慢并且是费力的工作。虽然这可以避免使用移动电话的小按键来输入文本消息,但是它没有解决常规自动语音识别软件固有的不准确和不恰当转录的问题。
构造可以可靠并且正确识别涉及任何对象、任何人并且以正常速度讲出的自然言语的语音识别软件的任务是令人畏惧的事情。然而,在语音-文本系统的领域中,这是重要的目标。本发明挑战这种传统观念。
发明内容
依照第一方面,提供了一种用于向无线信息设备提供语音邮件的方法,包括如下步骤:
(a)在语音邮件服务器上接收语音消息;
(b)把所述语音消息转换为音频文件格式;
(c)经由广域网向包括计算机网络的语音-文本转录系统发送或者流送所述音频文件;
其中所述方法的特征在于如下步骤:
(i)一个联网计算机向操作方播放所述语音消息;
(ii)所述操作方智能地把原始语音消息转录到所述计算机中,以生成转录的文本消息;
(iii)所述操作方使所述转录的文本消息将被从计算机发送到所述无线信息设备。
因为使用操作员而不是机器转录,所以语音邮件能够被正确地、智能地、适当地并且简练地转录为文本消息(例如,SMS/MMS)。
使用此方法提供语音邮件存在许多优点:
A.替你记录
ο不进行拨入来获取消息;取而代之,它们已经被正确地并且智能地(例如省去停顿、重复等等)转录为消息格式。
ο通过给予用户接收的语音邮件的‘收件箱’视图,可以在打开并且读取消息前看见该消息实际来自于谁,并且控制读取哪些以及何时对其进行存储、转发、删除、回复等。已转换的语音邮件将具有与标准文本消息不同的图标。在号码可以得到的情况下,呼叫方ID被用于利用该号码来填充文本消息首部,从而使其看上去像是直接来自那个人。否则,如果所述号码不能得到,那么收件人将看到它是来自于‘Spin Vox语音邮件’。
ο关键信息在手边—当你被假定‘移动’时,不需要搜索笔和纸
·大部分新的电话(尤其是智能电话)都能够解析文本,然后提供其有用部分以便在电话及其应用程序内部自动使用,由此节省用户复制交叉——例如,电话号码可用于立即存储或者使用,地址可以被超链接并且被添加到联系人,或者被用于在映射软件上自动地定位等等。
B.离散的并且便利
ο当繁忙时没有来自语音邮件的骚扰呼叫。相反,用户可以在会议时看到语音消息到达,并且自行决定是否读取它们。
C.始终可以给你消息
οSMS存储&转发能力确保一旦用户电话返回到或返回进覆盖范围内,就快速地递送
ο选择便利的递送方法:SMS、电子邮件、传真
D.将支持呼叫转移的任何其他电话,例如你的办公室电话(座机)转移至文本转换服务
ο座机&移动语音邮件现在都可以作为文本递送到用户的移动电话——所有都在一个地方,在手边很方便
ο从任何电话——移动电话或者座机,来访问语音邮件,这是因为语音邮件的原始语音文件被存储在服务器,其中所述服务器可以由任何电话利用密码来访问
E.当在国外漫游时,语音消息递送便宜
ο无论用户在何地,他们都可以继续接收到文本形式的语音消息
ο用户可以改为电子邮件接收它们,以便用户可以在全世界以及移动覆盖范围之外获取
ο不需要漫游费用或者昂贵的回拨来获取消息
付账
存在两种选择——预付或者后付,可以经由用户电话账单上的小账单或者信用/借记卡,以及可以直接借记按月付款。实际上,经由第三方商业服务供应商可以使用任何支付方法,因此甚至是美国常见的PayPal在欧洲正变得作为有效支付方法可用。
信用/借记卡
用户将能签约信用/借记卡来用于自动按月付款,包括直接借记(UK)以及美国的PayPal。
小账单
用户将能通过单个回复付款的SMS来购买SpinVox信用(例如£10的价值),该SMS将确认他们的新信用。通常,这样做将引起预付市场的兴趣。这样做巧妙地避免了每当他们使用所述服务时、多个个体微小事务的相对昂贵的成本(60%+),在相反的情况下,会使其非常昂贵,并且鼓励来自用户的对服务的一些承诺。
附图说明
将参照附图描述本发明,其中:
图1-3是依照本发明的整个语音邮件处理过程的示意图,所述处理过程从语音邮件发起开始、直到语音邮件处理、以及语音邮件递送;
图4描述了使用本发明的方法转录的语音邮件的消息通知格式(在移动电话的消息收件箱中显示);
图5描述了常规的文本消息通知;
图6描述了使用本发明的方法转录的语音邮件如何表现为在移动电话上显示的文本消息;
图7描述了在消息收件箱中显示文本消息列表的移动电话。转录的语音邮件存在于所述列表中;插图示出了如果选择,将如何进行显示;
图8描述了可作为与转录语音邮件有关的选项加以利用的三个新功能的菜单列表;
图9A至9D描述了用于管理常规音频语音邮件的基于GUI的语音邮件管理应用程序;
图10描述了允许用户向其移动电话讲入消息并且使其远程转换为文本消息的应用程序的操作;
图11示出了语音邮件服务器处的动作的整个流程,以表明由用户输入启动的动作;
图12示出了在语音消息转录方进行的整体动作流程;
图13示出由语音消息转录方使用的基于网页的交互的屏幕快照。
发明详述
本发明是作为一组移动电话产品的一部分由英国伦敦的SpinVox有限公司实现的:
1.VoicemailViewTM:语音邮件-文本系统——这给予订户选项,以将语音邮件作为文本(SMS/MMS或等效消息格式)递送到其移动电话,其中具有选项来在移动电话上听取原始语音邮件。术语‘SMS’指的是短消息服务,用于向移动电话发送明文消息;‘MMS’指的是由3GPP(第三代合伙项目,Third Generation Partnership Project)开发的多媒体消息服务,用于在移动电话以及其他形式的无线信息设备之间发送多媒体通信。所述术语还包含任何中间技术(诸如EMS(增强消息业务))以及诸如收费SMS之类的变体,以及这些业务的任何进一步增强和开发。
2.VoicemailManagerTM:新的语音邮件管理应用程序——其向移动电话添加了GUI(图形用户界面);它补充了(或者替代)由蜂窝电话语音邮件系统提供的现有音频菜单系统(UI)并且集成了电话的呼叫转移特征、问候控制以及其它有关控制,以便在移动电话上为语音邮件管理提供单个环境(应用程序)。
3.VoiceMessengerTM:语音-文本系统——其允许用户向他们的移动电话讲出文本消息,使其被远程转换为文本,然后在不使用通常令人厌倦的字母数字的电话键盘输入系统情况下进行发送。
把语音消息准确转录为文本格式(如VoicemailView和VoiceMessenger中所配置的)的关键在于:使用操作员来通过提取消息(不是罗嗦的逐词转录)智能地执行实际转录、而不是利用自动语音识别系统。此系统有效操作的关键在于这样一种IT体系结构:该IT体系结构向操作方快速地发送语音文件,并且允许他们快速地听取这些消息且有效地生成转录,以及允许他们把转录的消息作为文本消息发送。
A.VoicemailViewTM语音邮件-文本系统
描述了用于递送的语音邮件-文本系统的三种解决方案:
1.网络操作方内部——所述系统被集成在操作方的网络服务内(参见图1)。
2.网络操作方的外部——服务公司经由固定电话来访问网络操作方的语音邮件系统,并且提供导向终端用户的外部服务;参见图2,或者在服务公司内安放自己的语音邮件系统且完全在网络操作方的服务以外递送其服务,并且因此是网络操作方和手机相互独立,参见图3。
A.1VoicemailView:操作方变体的内部
现在参照图1,如下配置所述过程:
1呼叫者从PSTN或者移动电话网络留下语音邮件。
2通过语音转录服务把语音邮件转换为SMS或者MMS文件:这不是由自动语音识别系统执行,而是由操作员来执行。这些操作员比自动语音识别系统更加准确并且灵活,并且可以智能地翻译所述消息、消除不必要停顿和重复,从而生成短的、简单的并且易懂的消息。附录II定义了有效的并且简明转录的要求。操作员往往能够显著地缩短消息以便使它们适合在160个字符的现有SMS文本消息最大限度内(否则经由标准级连使更长的消息适合多个SMS消息);然而对于MMS,则没有这种最大限度。
·生成至原始语音邮件文件的链接(唯一i/d)——此i/d可以仅仅是时间/日期&呼叫者号码的散列
·把语音邮件的所述时间&日期添加到SMS/MMS文件的首部
·把呼叫者号码添加到SMS/MMS文件的首部
3把消息文件发送到SMS或者MMS服务器以用于存储。
4经由SMS或者MMS网关把消息发送至无线终端。
5用户在SMS或者MMS应用程序内查看并且管理‘文本’语音邮件,或者甚至在取决于平台的消息应用程序内部查看并且管理‘文本’语音邮件。
6用户可以请求通过在终端上运行的新VoicemailManager应用程序(其为所有语音邮件功能提供GUI接口;参见B.2)听取原始语音邮件:播放、快进(FFW)、回倒(REW)、下一、擦除、存储、转发、消息的时间/日期、回呼(以及通过音频提示/菜单可得到的任何其他现有语音邮件控制)。
7当消息‘读取’时,SMS/MMS的可靠递送使SMS/MMS存储与语音邮件存储同步。
A.2操作方变体的外部;服务公司为操作方提供语音-文本设施
现在参照图2,如下配置所述过程:
1新的订户向服务公司提供他们的电话号码、语音邮箱PIN号以及其它细节。这使得所述语音邮件获取和存储服务器能够通过对其进行定时轮询或者通过操作方内部的语音邮件系统向其发送新的语音邮件通知,来访问它们的语音邮箱,以获取消息。对于用户付账存在2种选项(预付或者后付):
1.回复文本账单(小账单)
2.按月信用/借记卡账单
2呼叫者从PSTN或者移动电话网络留下语音邮件。
3服务公司语音邮件获取&存储服务器访问订户的语音邮箱&‘收听’消息:
·使用标准DTMF音调播放消息、获取呼叫的时间、呼叫者号码以及其他数据来构建文本递送所必需的数据
·创建唯一的i/d——可以仅仅是时间/日期&呼叫者号码的散列
·存储语音邮件,以用于将来播放
4将语音邮件音频文件发送给基于操作员的语音转录系统并且将其转换为SMS或者MMS文件,并且发送给第3方SMS/MMS网关以用于递送
·生成至原始语音邮件文件的链接(唯一i/d)并且被作为用户无法知晓的信息嵌入SMS/MMS文件中
·把语音邮件的时间&日期添加到SMS/MMS文件的首部
·把呼叫者号码添加到SMS/MMS文件的首部
·MMS文件可以包含被嵌入来用于本地播放的原始音频文件
5经由订户的网络操作方来递送SMS或者MMS消息
·经由SMS或者MMS网关把消息发送至无线终端。
·用户在SMS或者MMS应用程序内查看并且管理‘文本’语音邮件,或者甚至在取决于平台的消息应用程序内部查看并且管理‘文本’语音邮件。
6用户可以使用终端上的新语音邮件管理应用程序(其提供了GUI;参见B.2)拨入他们在网络上的语音邮件:播放、快进(FFW)、回倒(REW)、下一、擦除、存储、转发、消息的时间/日期、回呼(以及通过音频提示/菜单可得到的任何其他现有语音邮件控制)。
7为了听到原始语音邮件,用户被连接回服务公司的语音邮件存储服务器。所述唯一的i/d(在SMS/MMS消息中用户无法知晓的)获取正确的文件来用于播放。
A.3操作方外部:由服务公司完全提供的语音邮件
现在参照图3,如下配置所述过程:
1新的订户向服务公司提供他们的电话号码和账单细节。
他们现在正在将服务公司用作他们的语音邮件供应商。
2个选项:
1.他们人工地把对他们电话的呼叫转移为服务公司语音邮件网关号码
2.服务公司提供空中传递(over the air)升级来改变这个行为
对于付账存在2种选择(预付或者后付):
3.回复文本账单(小账单)
4.按月信用/借记卡账单
2呼叫者从任何电话,通常是PSTN或者移动电话网络留下语音邮件。
3服务公司语音邮件提供所有语音邮件功能
1.存储语音邮件以用于将来播放
2.创建唯一的i/d——可以仅仅是时间/日期&呼叫者号码的散列
4将语音邮件音频文件发送给基于操作员的语音转录系统并且由操作员转换为SMS或者MMS文件,并且发送给第3方SMS/MMS网关以用于递送
·生成至原始语音邮件文件的链接(唯一i/d)并且作为SMS/MMS文件中用户无法知晓的信息被嵌入
·把语音邮件时间&日期添加到SMS/MMS文件的首部
·把呼叫者号码添加到SMS/MMS文件的首部
·MMS文件可以包含被嵌入来用于本地播放的原始音频文件
5经由订户的网络操作方来递送SMS或者MMS消息
·经由SMS或者MMS网关把消息发送至无线终端。
·用户在SMS或者MMS应用程序内查看并且管理‘文本’语音邮件,或者甚至在取决于平台的消息应用程序内部查看并且管理‘文本’语音邮件。
6用户可以使用标准IVR控制或者终端上的新语音邮件管理应用程序(提供GUI;参见B.2)拨入他们在网络上的语音邮件:播放、快进(FFW)、回倒(REW)、下一、擦除、存储、转发、消息的时间/日期、回呼(以及通过音频提示/菜单可得到的任何其他现有语音邮件控制)。
7为了听取原始语音邮件,用户被连接回服务公司的语音邮件存储服务器。所述唯一的i/d(在SMS/MMS消息中用户无法知晓的)获取正确文件以用于播放。
B.移动电话软件
在任何上述变体中,所述移动电话(或者具有某些特性的其他无线信息设备)将需要经由OTA(空中传递)进行升级或另外采用以下方式升级:
B.1查看语音邮件-文本消息
存在两种选项:
1.不修改现有电话GUI——仅仅将所述SMS处理为另一消息,所述SMS是转录的语音邮件
2.将所述GUI修改为并入如下所示的新特征:
图4示出了电话手持机图标,该电话手持机图标可以紧跟SMS消息使用,以表明它是消息收件箱中的语音邮件消息。转录为文本的语音邮件存在于设备的消息收件箱中;它已经被从Homer Simpson发送。图5示出了当前SMS文本图标看起来的样子。另一个解决方案是对于语音邮件而言在每个首部之前加上某些逻辑,诸如“V:”——因此,“V:Homer Simpson”将表明转录的语音邮件的SMS来自Homer Simpson。另外,在语音邮件消息的文本文件内部,应该添加语音邮件的时间和日期(由于不是所有网关都正确地用时间戳表明已发送消息),如图6所示。图7示出了移动电话环境中的此种操作。用户对高亮度显示的已转录语音邮件(来自Daniel Davies)选择‘读取’选项;所述设备依照正常方式显示所述SMS,但是具有所添加的数据和时间。还可能的是,仅仅通过按下并按住特定按键(在该图中是按键‘1’)来激活基于正常音频的语音邮件播放功能。
当人们打开标准SMS消息时,通常可以容易地访问进一步的功能(例如经由诺基亚移动电话中的选项菜单),诸如‘擦除(Erase)’、‘回复(Reply)’、‘编辑(Edit)’等等。基于此标准‘选项’菜单或等效物,本实现方式添加了三种新功能,如图8所示:
·听取原始文件
·回呼
·添加联系人
下面我们详述这些新的功能:
听取原始文件:其允许用户此刻听取原始语音邮件,并且使用编码入SMS/MMS消息的唯一i/d来正确地连接到原始语音文件。
存在三个选项:
(i)用户进入标准语音邮件系统,并且遵循现有音频提示来听取消息。
(ii)用户进入下文在B.2示出的新的语音邮件管理应用程序。
在任何一种情况下,当结束对语音邮件的呼叫时,用户返回到消息应用程序中的同一点来判定采用文本/音频版本做什么。
(iii)用户把原始声音文件嵌入MMS消息(或等效物,诸如电子邮件)以待在终端上本地播放。
回呼
此操作使用与消息一同记录的呼叫者号码来对其进行回呼。添加联系人
此操作获取呼叫者的号码并且自动将其添加到用户的新联系人/地址条目以便利用名称等来完成。
这是移动电话软件的特定例子,其能够解析已经从语音转换的文本并且智能地使用它。其他例子包括:
(a)提取讲出的电话号码,以允许它被使用(来进行一个呼叫)、保存、编辑或添加到电话簿;
(b)提取电子邮件地址并且允许它被使用、保存、编辑或添加到地址簿;
(c)提取物理地址并且允许它被使用、保存、编辑或添加到地址簿;
(d)提取网页地址(超链接)并且允许它被使用、编辑、保存或添加到地址簿或者浏览器收藏夹。
(e)提取会议时间并且允许它被使用、保存、编辑并且作为条目添加到议程
(f)提取号码并且将它保存到其中一个设备应用程序
(g)提取实际名词并且提供选项来在网页上(WAP或者全部的浏览器)对其进行搜索或者查找。
此操作可以进行的程度取决于你手机的智能性(实质上是其解析能力以及与其它应用程序和通常存储这种数据以用于其它应用程序的普遍剪贴板之间的互操作性)。目前,几乎所有的电话都支持从文本消息中提取电话号码、电子邮件地址和网页地址。当用户读取到消息时,利用加下划线的内容通常可以获得它(如超链接或等效物);然后用户仅仅选择‘选项’(如在诺基亚电话上找到的、或在不同手机上的等效物)和‘使用’(如在诺基亚电话上找到的,或者在不同手机上的等效物),然后根据内容类型,进一步进行上下文相关的选项(例如利用它可以提供的街道地址——在地址簿查找、导航、保存等等)。
B.2VoicemailManagerTM:语音邮件管理应用程序
此应用程序可被单独使用或者作为如上在B.1所述的VoicemailView语音-SMS/MMS系统(或等效的文本递送系统)的组成部分。
在访问和管理正常的音频语音邮件时,除通常接收到的标准音频提示以外,所述语音邮件管理应用程序还给予用户GUI(图形用户界面)。当订户使用他们的移动电话访问(图9A)他们的音频语音邮件时,首先使他们进入其‘语音邮件收件箱’,然后利用图9B至9D示出的控制来进行呈现。
出于编程的目的,这些控制将几乎全部涉及标准DTMF音调,当用户现在按下他们电话小键盘上的按键时,所述语音邮件系统将其用作对它的输入。
图9A示出了用户呼叫语音邮件;图9B示出了如何调用新的管理应用程序,其首次显示收件箱的所有语音邮件内容(此处,3条新的音频呼叫以及2条存储音频呼叫)。所述选项菜单如下操作:
  选项菜单上列出的条目   动作
  全部播放   按照次序播放所有消息
  全部删除   提供将删除的消息——所有新的和所有存储的——并且将其全部删除
  全部标记为已听   把所有新消息移入存储文件夹
  转发给   把消息转发至另一个订户收件箱
  存储   存储——只在新消息中或者播放期间可用——把消息移至存储文件夹
参照图9C,如果用户选择他希望收听的音频语音邮件类别(即,新的或者存储的),那么向其示出该类别中的音频语音邮件的菜单列表,每个邮件利用发件人名字(如果可得到的话)或者缺少名字、以及呼叫者号码进行标识。转录的文本消息在理想情况下已经通过转录服务为其添加呼叫者名字。这包括通知用户何时在VoicemailView中关闭语音-文本转换(即,他们希望明码语音邮件),以便使他们在判断是否拨入并且收听它之前,能够看到给他们留下语音邮件的人员名字。用户可以容易地导航到和选择他希望收听的音频消息。一旦消息被选择,那么如图9C所示,在屏幕上显示新的语音邮件控制。它们的功能如下:
  语音邮件控制   动作
  1擦除   擦除当前消息—返回到前一屏。新的或者存储文件夹视图被用户用来选择现在收听哪个消息,或者直接播放下一条消息。
  2下一   跳至下一条消息。在消息结束时,返回到前一屏,新的或者存储文件夹视图。
  3FFW   在按住按钮时快进消息。在消息结束时,停止并且显示待听取的下一条消息(新的或者存储的文件夹视图),或者在所有消息结束时,返回到顶层视图(新的&存储文件夹视图)
  4REW   在按住按钮时回倒消息。在消息结束时,停止并且显示待听取的前一条消息(新的或者存储文件夹视图),或者在所有消息结束时,返回到顶层视图(新的&存储文件夹视图)
  5前一条   跳至前一条消息。在消息开始时,返回到前一屏,新的或者存储的文件夹视图。
  6回呼   回呼用户并且结束语音邮件呼叫。
 7文本消息   打开文本(SMS或者MMS)应用程序,利用被选择为用户的默认收件人的呼叫者号码,用户向他们发送文本消息。
 8转发   把消息转发至另一个订户语音邮件收件箱。
 9添加联系人   通过电话的标准联系人/电话簿应用程序,将号码添加到联系人
 0配置   配置语音邮件——记录新的问候、打开/关闭问候等的标准选项并入现有电话软件中以用于配置转移行为——例如基于繁忙/无人应答/关机来转移到语音邮件或指定号码
在此过程期间,始终向用户提供听觉的导航选项,其与显示在屏幕上的内容同步,以便使他们在两个领域都是最好的。通过使用基于简单命令的语音识别,用户可以仅仅讲出他们希望执行的命令,因此如果用户希望播放新消息,那么他们将仅仅说出“播放”,并且VoicemailManager引擎将识别此命令并且仅仅执行该操作——播放消息。
注释:正确的号码(小键盘号码)以及它们的相关功能与现有语音邮件系统相同,并且通过网络操作方/语音邮件系统来改变。
B.3VoiceMessengerTM:语音-文本(SMS/MMS)服务
对于用户而言,优选的是,希望依照文本格式发送消息、而不是语音——例如,如果他们不希望干扰收件人,但是希望给他们消息。对于人们在小型字母数字小键盘上使用手指键入文本通常是十分困难的。他们还可能在移动(诸如步行),或者在汽车中,或者只有一只手可用,或者不能键入(诸如正在驾车时)。所述VoiceMessengerTM语音-文本服务解决了此种需要。
用户进入在他们的移动电话上运行的他们的消息/文本应用程序,仅仅从他们电话的地址簿中或者键入他们的号码来选择消息收件人,然后通过按下并且按住‘2’键来选择新的VoiceMessenger选项,如图10所示。所述用户还可以被连接到所述服务来开始,并且仅仅向本地(移动电话上)或者远程语音识别引擎讲出所述号码或者名字,其中所述语音识别引擎将通过所述处理来获取用户。
当被连接至远程VoiceMessenger引擎时,所述用户仅仅讲出其消息,并且所述远程VoiceMessenger引擎记录它,然后发送所述音频文件以用于使用基于操作员的语音转录系统来转换为文本。然后把所述文本格式消息打包为SMS/MMS(电子邮件或者其他适当的消息系统)并且通过SMS/MMS等等网关发送。将给予用户听觉上的提示以便控制所述输入,听取所述转换并且发送所述消息。
C.扩展
C.1MMS语音备忘录(voice-note)至文本
具有允许MMS操作的电话的用户将能经由MMS发送语音备忘录,然后,基于操作员的语音转录服务将其转录并且发送到他们期望的目的地。如果优选,他们还可以依照MMS格式来转换语音邮件并且发送到他们的电话。
C.2自动语音识别
其将会加速进入的语音文件的处理并且减少操作成本。主要的功能将是自动检测讲出的电话号码,并且检测语言以便把音频文件发送至转录处的恰当操作方。它还用于检测来自用户在线电话簿(参见下文)的名字和讲出的号码以及地址以及用于VoicemailManager控制的命令。
C.3在线地址簿
将有两种形式的在线地址簿,其中当仅仅通过说出他们希望诉说的人员名字来连接至SpinVox服务时,用户就能使用所述两种在线地址簿。
Figure A20048001361500211
SpinVox在线电话簿——经由用户网络登录,他们能够将他们希望的人员名字和号码添加在他们的SpinVox在线地址簿中。
与他们的Microsoft Outlook(Express或者完全版)或者其他电子邮件/PIM/地址簿客户端同步——这样做使得他们能够使他们的所有联系人在线,并且不仅能说出收件人的名字,而且能确定他们希望发送的消息类型:SMS、MMS、电子邮件、传真等等。
Figure A20048001361500222
利用网络操作方,还能够提供SIM备份功能,然后向他们提供SIM电话簿以便于他们从中呼叫名字。
C.4目前可用的服务(当前)
使用目前可用的服务器,用户可以定义他们希望的模式以用于接收通信,例如‘会议’让用户在通信之前知道他们希望联络的那个人正在会议中,并且将接受所说的SMS/MMS或者VoiceView文本消息。一旦在会议之外,用户就能将其联络状态改变为‘可用’并且可以通过电话联络到。
附录I
1.SpinVox语音邮件IVR结构
具有IVR的标准语音邮件服务器系统是基础;所述IVR被编程为如图11中所示的流程图。
2.VoicemailView
用户的电话将重新编程(在如下显示的技术提供期间)‘1’键(标准语音邮件访问键)以便自动地呼叫SpinVox语音邮件服务器,并且让它们自动登录(唯一的电话号码+PIM),从而将其带入IVR树的顶层。
如果在任一点用户挂断,那么所述会话以相关结果终止。如果这发生在记录期间,包括来自另一个移动呼叫者的掉线(dropped line),那么被假定记录结束,并且系统进行到转录阶段。
每个转录的语音邮件将包含从说‘4’开始的唯一号码(取决于最终IVR树配置),使得当用户按下并按住‘1’来连接至SpinVox的语音邮件服务器时,他们仅仅按下唯一消息i/d(例如403),这将把他们带入队列中其拥有的第三个消息。
2.1座机或者其他移动电话访问
如图11所示,所述IVR树将允许用户使用他们的唯一转移号(语音邮件号)来拨入,并且随后将被提示来输入他们的PIN。
2.2快速拨号
所述IVR系统将接受在快速拨号时的用户编程,这允许他们拨出他们的唯一SpinVox号码+PIN。然后他们能够访问上面示出的所有特征。
2.3留下语音邮件
用户的电话被配置为在他们如下定义的条件下转移到SpinVox语音邮件,其中呼叫者将听到下述之一:
Figure A20048001361500231
默认SpinVox问候:“欢迎来到SpinVox语音邮件。请在嘟声后清楚地口述你的消息。”[嘟]
用户自己的问候:[用户的记录问候][嘟]
然后:
1.系统在默认长度(30秒)或者用户定义的长度(10秒-2分钟或者任何SpinVox设置的参数)内记录呼叫者的语音邮件。
2.在记录结束时,呼叫者通过提示听取标准IVR选项:“按下:
1.听取你的消息
2.删除你的消息并且重新记录
3.重新记录你的消息
#结束或者只挂断”
3.如果用户超出记录长度,那么他们被提示:“对不起,你已经超出可用的记录时间。在嘟声后请重试”。
a.如果用户挂断而不记录新消息,那么消息被发送来用于转录。
b.如果用户已经选择了‘高级转录选项’,那么出现另一个变体;此种选项操作来使得如果消息的记录时间小于用户设置的最大时间时,那么转录所述消息,否则,就不转录,而是把标准的通知发送给用户,以便依照下面4c中示出的格式通知他们有新的语音邮件要收听。此操作阐明了这样的事实,即:偶尔向用户发送了更有利于收听而不是读取的长语音邮件。然而,对于这些长消息来说,转录方可以简要地收听所述语音消息,并且写下发送给消息收件人的呼叫主题的非常短的指示。此外,对于支持小于一定文本量的手机(通常是旧手机)来说,系统首先查找用户手机以及电话数据库中的限制(由SpinVox提供),然后向用户提供相关的记录长度。例如,对于不支持链接并且最多仅4个文本消息的旧西门子电话来说,系统警告用户:记录长度应该保持在说30秒以下,以确保大多数消息适合他们的电话并且告诉他们为什么。同样,需要系统为他们把这些手机的默认记录长度设置为相称的长度。
4.把消息发送给相关转录队列:
a.如果呼叫者CLID(呼叫线路识别,Caller Line Identification)被获取,那么自动填充‘From(来自)’字段。如果没有,插入‘SpinVoxVoicemailView’作为发件人。
b.如果能够转录,那么把消息的文本版本发送给用户
c.如果不能转录,那么把具有自动填充的某些字段的模板文本消息发送给用户:
“你有[来自CLI的,如果可得到]新的语音邮件要收听。按你电话上的‘1’连接至你的语音邮件,然后按4xx可听取此指定消息。谢谢。SpinVox”。所述‘From’字段是来自于‘SpinVox VoicemailView’
d.依照SMS的发送数目来付账。
5.把文本消息发送给用户并且他们可以按照其手机上可用的标准选项来选择接下来做什么。
3.VoiceMessenger
上述IVR图表示出了用户如何访问VoiceMessenger,是直接从他们的移动电话还是通过另一个电话访问。
3.1快速拨号
所述IVR系统将接受在快速拨号时的用户编程,这允许他们拨出他们的唯一SpinVox号码+PIN+‘3’。
如果利用他们的移动电话,那么下面的技术提供将配置有快速拨号(通过默认键‘2’)来拨号并且使他们直接登入(语音邮件号码+PIN+3)到VoiceMessenger选项。
他们于是将听到标准提示:
″欢迎来到SpinVox的VoiceMessenger。在嘟声后,请讲出目的地号码或者键入它,然后口述你希望发送的消息。挂断来发送,或者按#来发送新消息。”[嘟]
然后:
1.如果无法检测到DTMF音调,或者发生混淆(当使用*或者+进行国际拨号时),那么提示输入新号码:
“对不起,我们无法检测到你键入的号码。请重试,并且记住国际号码以00开头,没有+”[嘟声提示重新输入]
2.系统在默认长度(30秒)或者用户定义的长度(10秒-2分钟)内记录。
3.在记录结束时,用户通过提示听到标准的IVR选项:
“按下:
4.听取你的消息
5.删除你的消息并且重新记录
6.重新记录你的消息
#发送新消息或者只挂断”
4.如果用户超出记录长度,那么他们被提示:“对不起,你已经超出可用的记录时间。在嘟声后请重试”。
a.如果用户挂断而不记录新消息,那么消息被发送来用于转录。
5.把消息发送给转录队列,其中所述‘From’字段自动填充(当SpinVox知道谁是客户端时):
a.如果能够转录,那么把消息的文本版本发送给用户
b.如果不能转录,那么把自动填充某些字段的模板文本消息发送给用户:
“对不起,但是我们不能转换[时间/日期]你口述的消息[到号码,如果检测到]。请在安静环境下重试并且清楚地口述。谢谢。SpinVox”。所述‘From’字段是‘SpinVox VoiceMessenger’。
c.依照SMS的发送数目或者MMS大小(千字节)付账。
6.把文本消息发送给收件人并且他们可以按照其手机上可用的标准选项来选择接下来做什么。
4.技术提供
在技术提供期间,用户数据(手机、网络等)将重新用于确认用户已经选择了什么。
关键是发送用户SMS消息的系统使用户手机的配置部分自动化(用于VoiceMessenger的转移&V.Card)并且确认成功设置。把这些消息全部作为高优先级发送,以便确保用户/销售员在等待配置SMS成功时不会‘挂电话’(hanging)。
所述步骤是:
步骤1:从在提供屏幕上显示的下拉列表中进行手机选择(通常在销售点)
步骤2:语音邮件查看设置:
<创建如下符号串:‘+COUNTRY CODE_USERS UNIQUEVOICEMAIL NUMBER_p_PIN NUMBER_#_’>>>>这被称为SPINVOX语音邮件号并且对于每个用户而言是唯一的!>
步骤3:呼叫转移选择:其解释通常如何设置移动电话来转移到用户的语音邮件(基于所有如下情况)。如果他特别希望其转移到他人或者号码,而不是他自己的语音邮件,那么用户可以改变这些
<基于上面用于配置手机的选择创建的USSD符号串...(数字线)作为具有4xUSSD符号串的高优先级SMS被发送,其中用户需要4xUSSD符号串来进行回答/动作。>
步骤4:经由SMS的呼叫转移设置。告诉顾客他刚才已经发送SMS并且在接收时应该点击提供屏幕上的指定按钮(或者如果在3分钟内未接收到,那么另外点击‘未接收到’按钮)。
步骤5:呼叫转移设置:SMS。所述提供屏幕通知用户如果他已经接收到配置SMS,那么请执行下列步骤:
1.打开SMS消息
2.选择‘选项’(具有用于每个手机的功能名称的数据库)
3.滚动&选择‘使用号码’
4.你此刻将看到4个号码,选择第一个号码并且按‘发送’。
你此刻将看到正在拨出的号码并且在你的移动电话的屏幕上显示‘正在请求’。如果你接收到确认消息,那么对剩余3个号码重复此步骤。
步骤5:呼叫转移设置:移动电话。所述提供屏幕通知用户:
在你的移动电话上:
1.选择‘菜单’2。
<为指定的手机从数据库导入VOICEMAILVIEW数据...告诉你将做什么/利用‘+COUNTRY CODE_USERS UNIQUE VOICEMAILNUMBER_p_PIN NUMBER_#_’>
步骤6:选择递送方法。一旦语音邮件被转换为文本(典型的选项是带有音频文件的SMS、MMS、MMS,电子邮件,带有音频文件的电子邮件),所述提供屏幕允许用户选择他想要如何接收语音邮件。然后所述系统把适当的vCard发送至用户的移动电话。
步骤7:语音消息器设置。所述提供屏幕通知用户:
请如下执行:
我们刚向你发送SMS-VCard。当你已经接收到它时,请执行下列步骤:
1.接受并且在你的移动电话上保存所述VCard,而不对其进行修改——进入步骤2。
如果你在5分钟内未接收到此消息,或者无法保存所述VCard,那么请执行下列步骤:
创建称为‘VoiceMessenger’的新‘联系人’,其具有如下号码:
+COUNTRY CODE_USERS UNIQUE VOICEMAILNUMBER_p_PIN NUMBER_#_,1′
如果你不知道如何添加新的‘联系人’,请点击这里——(进入‘如何’页面,该页面具有从数据库获得的信息——告诉你做什么)
2.<为指定的手机导入来自数据库的VOICEMESSENGER快速拨号配置数据...告诉你做什么/利用>
步骤8:祝贺屏幕:
感谢选择SpinVox服务。
*你此刻将接收到作为文本的语音邮件,并且不要忘记:你总是可以仅仅通过按下并按住你电话上的‘1’键(以便与你的SpinVox语音邮件账号连接)来听取原始邮件。
*为了讲出文本消息——按下并按住‘2’(或者你指定为VoicemailView的键)并且你将立即被连接到VoiceMessenger。清楚地口述你的号码以及消息——你说它...我们将它转换为文本!
*你可以通过按下并按住‘1’键并且遵照提示来一直访问VoiceMessenger。
*你可以使用你的移动电话号码和PIN在www.SpinVox.com上查看你的账号设置,查看帐目并且管理你的SpinVox账号。
如果你尚未打印或者记录你的PIN号,在这里再次得到
1234
5.转录辅助
当操作转录方登记他们的账号时,将这提供给他们。所有他们需要的是网络浏览器、声卡、能够播放并且控制媒体文件播放或者流送协议的媒体播放器以及高速互联网接入。图12示出了转录的处理流程图。每个转录方登录并且开始接收VoicemailView(参见图13,他们在其中键入转录消息并且用来导致消息被发送的屏幕),或者待转录的VoiceMessenger音频文件(参见图14),一次一个。当登录时,只存在2个状态:消息目前在转录过程中,以及暂停。
5.1转录方控制面板按钮(参见图13):
已完成转录
Figure A20048001361500292
不可译的转录——按照上面2&3:
ο对于VoicemailView来说,依照下文将具有自动填充的字段(如果能得到)的自动SMS发送给他们,所述文本是“你有[‘From CLI’,如果能够得到]的新语音邮件要听取。按你电话上的‘1’来连接到你的语音邮件,然后按4xx来听此指定消息。谢谢。SpinVox。”
所述‘From’字段是来自于‘SpinVox VoicemailView’
ο对于VoiceMessenger来说,当数据可得到时,依照下文利用自动填充字段把自动的SMS发送给他们,所述文本是:“对不起,但是我们不能转换你[时间/日期“到电话号码”,如果能得到]口述的消息。请在安静的环境下重试并且清楚地口述。谢谢。SpinVox”。
ο所述‘From’字段是‘SpinVox VoiceMessenger’。
暂停并且重新队列当前信息
Figure A20048001361500294
将当前信息重新路由至不同语言处,菜单用于选择语言或者“未知”。使转录方回到队列以便接收新消息。
5.2电话号码:
Figure A20048001361500295
在VoicemailView的情况下,‘From’字段是利用当呼叫者留下信息时获取的CLID(插入消息首部中)或者“SpinVoxVoicemailView”自动填充的
Figure A20048001361500296
在VoiceMessenger的情况下,所述‘From’字段是用户使用DTMF时为转录方自动填充的,或者如果未使用DTMF,所述转录辅助向所述转录方提供字段以便将其键入。
注释:出于用户数据保护原因,转录方决不会看到自动填充的电话字段(或者其他用户数据字段),因此所述系统不会示出这些,除非其要求所述转录方键入目的地号码。
5.3拼写检查
当所述转录方敲击‘发送’时,系统将自动地对消息进行拼写检查,并且如果发生任何错误,那么纠正它们并且利用提示“接受&发送”来向转录方显示校正结果,或者允许他们人工地纠正(由于可能有他们希望的特殊拼写)。
为了正确地执行此操作,所述拼写检查过程将包括与用户的地理区域和文化有关的实际名词词典。因此,例如在英国,实际名词词典将不仅包含英语名字,而且包括地名、地标、公路名称、连锁商店名称(例如酒馆、酒吧、饭店等)等等。
当不存在匹配时,所述转录方仅仅双击加下划线的字,就可被提供最接近的匹配。如果有必要,他们可以倒带并且重听该部分消息以便做出适当选择。
5.4转录处管理员
他们可以查看他们自己名下的所有转录方账号的统计量。他们将能查看并且分析:
每小时、每日、每周、每月、每年键入的转录数目(签字,支持)
Figure A20048001361500302
每小时、每日、每周、每月、每年键入的SMS的发送数目
Figure A20048001361500303
每小时、每日、每周、每月、每年的队列时间
Figure A20048001361500304
每小时、每日、每周、每月、每年键入的平均消息长度
每小时、每日、每周、每月、每年的转录次数/速率
Figure A20048001361500306
每小时、每日、每周、每月、每年键入的转录次数/速率的变化
转录方账号的所有这些
Figure A20048001361500311
每日、每周、每月、每年键入的不能转录消息的数目和%
每日、每周、每月、每年发送给不同处来转录的消息数目和%
Figure A20048001361500313
转录准确度——通过每日随机采样并且测量相对于原始的准确度(CCA管理器执行此操作&把结果输入系统)以及来自CCA关于事故单的反馈来执行。这两个数字中较差的是准确性。
附录II:转录服务要求
这些是用于VoicemailView(语音邮件查看)和VoiceMessenger(语音消息)服务的转录服务的要求。
要求
关键要求在于递送实际消息,而不是所有的冗余信息,这些冗余信息经常被讲出并且留在信息中。
要求
保密性转录服务必须在数据保护法98或者此时有效的其它立法内最低限度地提供所转录的消息的完全保密性。·所有转录雇员在能够处理任何消息之前必须签订保密协议,并且不准泄漏、共享、复制、转发或用其他方式共享任何用户信息·将消息和号码分离来保护用户信息:ο在VoicemailView的情况下,转录方不会示出他们正向其发送文本消息的用户电话号码ο在VoiceMessenger的情况下,他们不会看到呼叫者的号码,只有目的地号码·每个转录方将具有唯一的登录名和密码。然后所述系统记录他们
所做出的每个转录,因此我们具有完全的系统透明度。此数据可用于转录处管理员(其创建并且管理转录方账号)和SpinVox系统管理员·在SpinVox的系统之间沿任一方向的消息通信必须是安全的——使用行业标准进行加密(例如RC4-124、RSA-124、SSL3等)·对服务器(或者其它地方)上保存的消息的访问必须是安全的
转换的准确性是99%+如果用户接收文本消息,那么该文本消息是可理解的,相对于原始语音文件消息的准确性是99%。
所有号码、电话号码、电子邮件地址、网页地址、街道地址将被正确地转换。
字符集与SMS/MMS允许的字符100%兼容在转录期间使用的字符与导致消息将通过其发送的系统兼容。
消息的级连是有意义的用户将清楚地知道继续到下一消息以便继续读取转录。如果系统不自动地提供明显的提示来这样做,那么插入‘2中的1(1 of 2)’、‘3中的2(2 of 3)’等。
地区口音和谚语转录方必须能够应付一个国家中出现的各种地区口音和谚语。例如,单在英国,就存在超过12种的地区口音,从‘优雅的’东南口音到西苏格兰的含糊不清的格拉斯哥口音、再到有韵律的爱尔兰人口音。这些应该被正确地并且依照他们讲话的格式进行翻译。提供将把消息发送至具有适当能力的转录方的路由。
去除语音假象(arteface)通常语音包含很多冗余‘噪音’,例如:‘呐’、‘啊’、‘哦’、‘嗯’,以及暂停、呼吸、咳嗽、打喷嚏以及其他典型的语音假象。这些显然必须不包括在转录中。
去除明显的重复消息经常包含重复的短语或者名字以便澄清要说的是什么。这些不应该包括在内。例如
讲出消息:“在Waxy O′Connors的外面看见你,其中Waxy是candlewax(蜡烛石蜡)中的Waxy而O′Connor是爱尔兰人歌手Sinead O′Connor的O′Connor。”转录应该读取:“在Waxy O′Connors外面看见你。”
缩写
应该使用通用术语的标准缩写:讲出                                 缩写Apartment(公寓)                      Apt.Number(号码)                         No.Telephone Number(电话号码)           Tel.Fax Number(传真号码)                 Fax.Example(例如)                        E.g.Okay(好的)                           okElectronic Mail(电子邮件)            emailInternet Website(互联网网站)         website(即,不需要http://)
数字每当讲出数字时,数字格式将被写下。例如,“在晚上七点四十五看见你”=“在7:45pm看见你”例如,“我们想定购一万一千七百八十八个D4大小的坚果。”=“我们想定购11,788个D4大小的坚果。”例如,“Jane住在十一七十五公园风景(Park View),第四层的二十三房间”=“Jane住在1175公园风景(Park View),4rd层apt.23。”
电话号码为了节省字符空间,电话号码是没有空格的单个数字串:例如:07798625155,而不是像使用两个附加的空格字符那样的07798625155。
国际前缀如果在进行国际拨号时以00给出电话号码,那么将其转换为‘+’。例如,00442075864103应该是+442075864103。
这样做进一步节省字符空间并且正确地定义国际拨号前缀的号码,此号码由本地网络翻译为合适的国际拨出代码,所述代码并不总是00(例如在美国,它是011)。
拼写检查消息必须被正确地拼写,并且有人建议对所有消息使用相关的拼写检查程序——例如对于英国使用英国英语,对于美国使用美国英语等等。
实际名词和地名所使用的字典/拼写检查程序必须包括实际名词(名称)和地名来帮助首次正确获得消息中的信息。
事件计划——事件、庆典、新闻等的每日日历。其存在多个方面:(i)文化谚语在多文化社会中,重要的是知道在很多天、某一团体将要庆祝一些事情。例如,印度(Hindi)新年(Divali)与主要的UK新年不相同,因此,针对Divali,转录方必须准备倾听其中具有这些以及其他关联词的问候和祝福,并且知道如何拼写它们,或者知道消息的语音可能意味着什么。(ii)正常的每年的事件——复活节、圣诞节、新年等等。(iii)体育赛事——国家联赛、世界杯、F1赛事、帆船赛事等。(iv)媒体事件——奥斯卡、英国电影和电视艺术学院奖(BAFTA)等等的获奖者(v)不测事件——像近来的‘世贸中心双塔’的攻击、马德里爆炸、伊拉克战争等等。本地转录处管理员必须具有所有文化、社会、体育事件的全部日历,他们必须至少提前2天来为这些日历作计划。另外,这将是确定人员所要求的可能的负担平衡的关键。例如,在最近英国橄榄球世界杯获胜结束时,在赛后的2-3小时内文本消息和语音邮件负荷大概超出其正常水平的300%,并且往往大多涉及球员姓名、比赛中使用的术语(带球触地进攻(try)、转换(conversion)、拉克(ruck)、冒尔(maul)等)、外国城市和位置,当然,随后的日子,与从所述赛事回来的人们相关的所有交通,
将自然地使负担平衡再次偏离。
不可译的词语在做出最大努力来想出这个单词是什么(可能是常用词汇以外的酒吧或者地点的名字)之后,将在其后在括号中设置问号。例如讲出消息:今晚6点在Jongleurs会见你。转录:今晚6点在Junglers(?)会见你。
间隙或者掉词(drop-out)消息可能由于出现临时网络故障而包含‘掉词’、‘间隙’或者其他干扰。在该情况下,在缺少字的地方插入“_”。例如“John,Mike和我_迟到__,因此在6pm见你。”这将可能提示用户拨入来听取原始文件,并且看看是否他们可以理解所述消息。3次以上的掉线:在该情况下,由于掉词的次数太多(3次或更多),所以消息难易理解,那么使用‘不可译’选项来向用户发送通知,告诉他们需要收听语音邮件或者尝试再次讲出他们的文本消息。
不可译的语音消息将使用标准模板通过文本消息通知用户:对于他们收听而言,存在不可译的语音消息:VoicemailView所述标准文本将说“你有x条无法转换的新的语音邮件需要收听。要听取它们,请通过按住并按下1来连接至VoicemailView。”然后,如下字段将被自动地填充:·当CLI禁止时,呼叫者[电话号码]或者[“私人号码”]·[时间/日期]·[唯一i/d]以便用户可以直接获得该消息VoiceMessenger
所述标准文本将说“对不起,我们无法转换你刚刚口述的消息。请重试稍慢并且清楚地讲出。谢谢!”然后,如下字段将被自动地填充:·[时间和日期]他们试图发送消息·至:[电话号码]他们正试图转换为文本
语气或者其他暗含语境当留下消息的人员明显还使用了语气作为消息的一部分时,那么转录方将在消息开始时包括如下内容:·[笑]大笑·[哭]哭·[耳语]耳语·[叫喊]叫喊/尖叫(除非这样做是为了克服当处于酒吧或类似地方时的背景噪音,如果是那样的话就忽略)·[尖叫]当某人非常痛苦、挨批评或者惊恐时的尖叫声。·[惊恐]当某人明显惊恐时·[生气]当呼喊和/或猛击拳头时的生气(应该从消息的内容显现)当语气不清楚时(例如,可以刚好是那个人交谈的方式或者他们所处的语音),那么不要添加这些。
VoiceMessenger文本风格(textism)插入文本符号来表示情绪(情绪图标)已经变得非常普遍。如下内容将被公布并且将被支持。这些是我们将支持并且公布在我们的网站上的集合。SMS-Speak的官方完整列表在:http://sites. ninemsn.com.au/minisite/web2sms/help/smsdict.asp在口述VoiceMessenger消息期间,用户可以说“插入符号名”,所述转录方将插入适当的符号。例如,“感谢确认我们的旅程。插入微笑。再见!”=“感谢确认我们的旅程:-)再见!”
  符号        符号名:-)         微笑:-D         大笑;-)         眨眼:-*        亲吻:-(         悲伤:’-(       哭泣:-c         不高兴:-‖        生气:-(0)       叫喊:-<         欺骗>:-(        非常生气:-O         哦:-|         确定:-*        痛苦   符号                  符号名O:-)                  一个天使:-9                   流口水:-<>                  惊奇%-6                  不是非常聪明:-()                  震惊:-o zz                厌烦:-                   怀疑:@                    叫喊:-o                   惊骇:-X                   没有说一句话|-I                   睡觉%-}                  陶醉:-V                   交谈
标点应该使用正常的标点,诸如在语句开始大写、句号、问号、感叹号、引号和半引号,很明显,语调或者语法要求它。
用于转录辅助的语法检查程序应当帮助消除错误键入。
文本被迅速地递送文本消息从结束语音邮件记录至到达收件人电话所花费的时间平均是2分钟:·80%在2分钟内·10%在3分钟内·10%在5分钟内为了确保消息的最佳吞吐量,队列和负载平衡是必须的。

Claims (21)

1、一种用于向无线信息设备提供语音邮件的方法,包括如下步骤:
(a)在语音邮件服务器接收语音消息;
(b)把所述语音消息转换为音频文件格式;
(c)经由广域网向包括计算机网络的语音-文本转录系统发送或者流送所述音频文件;
其中所述方法的特征在于如下步骤:
(i)一个所述联网计算机向操作方播放所述语音消息;
(ii)所述操作方智能地把原始语音消息转录到计算机中,以生成转录的文本消息;
(iii)所述操作方使所述转录的文本消息将被从所述计算机发送到所述无线信息设备。
2、如权利要求1所述的方法,其中,所述转录的文本消息包括唯一标识,所述唯一标识把所述文本消息链接至在所述语音邮件服务器保存的所述语音消息,以便允许通过终端用户选择在设备上显示的涉及所述转录的文本消息的选项,向所述无线信息设备播放所述语音消息。
3、如前述权利要求中任一项权利要求所述的方法,其中,所述转录的文本消息已经被添加了时间和日期,所述时间和日期是在所述语音邮件服务器最初接收所述语音消息的时间和日期。
4、如前述权利要求中任一项权利要求所述的方法,其中,所述语音消息是在移动电话或者在座机电话发起的。
5、如前述权利要求中任一项权利要求所述的方法,其中,所述转录的文本消息已经被添加了呼叫者标识数据,诸如电话号码或者呼叫者名字。
6、如权利要求5所述的方法,其中,所述转录的文本消息被显示在所述设备上,如同所述转录的文本消息是直接从所述语音消息的发起者发送的一样。
7、如权利要求3所述的方法,其中所述计算机不向所述操作方显示与所述无线信息设备相关联的所述电话号码。
8、如前述权利要求中的任一项权利要求所述的方法,其中所述计算机向所述操作方显示一选项,以把所述音频文件重新路由至由于语言、方言或者文化的原因而更加适合转录所述语音消息的具有操作方的不同计算机。
9、如前述权利要求中任一项权利要求所述的方法,其中,所述计算机向所述操作方提供专业术语的可查找列表,以帮助所述操作方正确地转录那些专业术语,其中所述专业术语与文化谚语、常规事件、体育赛事、媒体事件、其它类型的有新闻价值的事件有关。
10、如前述权利要求中任一项权利要求所述的方法,其中,所述操作方使用书面描述或者表情,在所述转录的文本消息中表示留下所述语音消息的所述呼叫者的情绪。
11、如前述权利要求中任一项权利要求所述的方法,其中,所述操作方简洁地概括所述语音消息。
12、如权利要求10所述的方法,其中,所述操作方概括所述语音消息,以使其符合160字符的SMS限制或者级连的文本消息。
13、如前述权利要求中任一项权利要求所述的方法,其中,所述操作方从所述转录的文本消息中略去所述语音消息中出现的任何停顿、假象或者重复。
14、如前述权利要求中任一项权利要求所述的方法,其中,依照先前由所述设备用户适当指定的格式将所述文本消息发送至所述无线信息设备。
15、如权利要求所述的方法,其中,所述文本消息是作为SMS、MMS、电子邮件或者传真发送的。
16、如前述权利要求中任一项权利要求所述的方法,还包括步骤:解析所述转录的文本消息并且把所述已解析的数据用于在所述无线信息设备上运行的应用程序。
17、如权利要求16所述的方法,其中,解析所述转录的文本消息并且使用所述已解析数据的步骤涉及一个或多个如下步骤:
(a)提取讲出的所述电话号码,以允许它被使用(来进行一个呼叫)、保存、编辑或添加到电话簿;
(b)提取电子邮件地址并且允许它被使用、保存、编辑或添加到地址簿;
(c)提取物理地址并且允许它被使用、保存、编辑或添加到地址簿;
(d)提取网页地址(超链接)并且允许它被使用、编辑、保存或添加到地址簿或者浏览器收藏夹;
(e)提取会议时间并且允许它被使用、保存、编辑并且作为条目添加到议程;
(f)提取号码并且将它保存到其中一个所述设备应用程序;
(g)提取实际名词并且提供选项来在网页上(WAP或者全部的浏览器)对其进行搜索或者查找。
18、如前述权利要求中任一项权利要求所述的方法,其中,如果语音消息的所述记录时间小于用户设置的最大时间,那么转录所述语音消息,否则,不进行转录,而是把标准的通知发送给所述用户,即他们有新的语音邮件要收听。
19、如权利要求18所述的方法,其中转录员收听所述语音消息,并且书面记录被发送给消息收件人的所述呼叫的主题的非常短的指示。
20、如权利要求18所述的方法,其中,对于支持小于一定文本量的设备而言,首先在数据库中查找文本限制,随后自动建议合适的最大记录时间。
21、一种文本消息,其是使用如先前权利要求1-20中任一项所述的方法从语音邮件转录而来并且被提供给无线信息设备。
CN2004800136152A 2003-04-22 2004-04-22 一种用于向无线信息设备提供语音邮件的方法 Expired - Fee Related CN1836431B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB0309088.3 2003-04-22
GBGB0309088.3A GB0309088D0 (en) 2003-04-22 2003-04-22 Voicemail to text (sms/mms or other relevant graphical representation) and associated user interface
GBGB0313615.7A GB0313615D0 (en) 2003-04-22 2003-06-12 Specifications for mobile voicemail management system
GB0313615.7 2003-06-12
PCT/GB2004/001805 WO2004095821A2 (en) 2003-04-22 2004-04-22 Operator performed voicemail transcription

Publications (2)

Publication Number Publication Date
CN1836431A true CN1836431A (zh) 2006-09-20
CN1836431B CN1836431B (zh) 2011-09-07

Family

ID=9957081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800136152A Expired - Fee Related CN1836431B (zh) 2003-04-22 2004-04-22 一种用于向无线信息设备提供语音邮件的方法

Country Status (5)

Country Link
KR (2) KR101296500B1 (zh)
CN (1) CN1836431B (zh)
GB (2) GB0309088D0 (zh)
HK (1) HK1095235A1 (zh)
ZA (5) ZA200508719B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103825801A (zh) * 2012-11-16 2014-05-28 中兴通讯股份有限公司 语音邮件的发送及展示方法和系统
CN103970477A (zh) * 2014-04-30 2014-08-06 华为技术有限公司 控制语音消息的方法和设备
CN112802475A (zh) * 2020-12-30 2021-05-14 厦门市美亚柏科信息股份有限公司 基于语音识别的应用自动登录方法及计算机可读存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8160212B2 (en) 2007-02-21 2012-04-17 Avaya Inc. Voicemail filtering and transcription
US8064576B2 (en) 2007-02-21 2011-11-22 Avaya Inc. Voicemail filtering and transcription
US8107598B2 (en) 2007-02-21 2012-01-31 Avaya Inc. Voicemail filtering and transcription
KR102144868B1 (ko) 2014-02-11 2020-08-14 삼성전자주식회사 통화 기록 제공 장치 및 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5163081A (en) * 1990-11-05 1992-11-10 At&T Bell Laboratories Automated dual-party-relay telephone system
GB2310970A (en) * 1996-03-05 1997-09-10 Ibm Voice mail on the Internet
US5712901A (en) * 1996-06-26 1998-01-27 Mci Communications Corporation Automatic voice/text translation of phone mail messages
US6449342B1 (en) * 1999-05-05 2002-09-10 Agere Systems Guardian Corp. Recorded voice message summary
EP1238508A1 (en) * 1999-11-26 2002-09-11 Mobile Telephone Networks (Proprietary) Limited Communication method and system
US6580786B1 (en) 2000-09-11 2003-06-17 Yahoo! Inc. Message store architecture
US6990180B2 (en) 2001-04-05 2006-01-24 Nokia Mobile Phones Limited Short voice message (SVM) service method, apparatus and system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103825801A (zh) * 2012-11-16 2014-05-28 中兴通讯股份有限公司 语音邮件的发送及展示方法和系统
CN103970477A (zh) * 2014-04-30 2014-08-06 华为技术有限公司 控制语音消息的方法和设备
CN112802475A (zh) * 2020-12-30 2021-05-14 厦门市美亚柏科信息股份有限公司 基于语音识别的应用自动登录方法及计算机可读存储介质

Also Published As

Publication number Publication date
GB0309088D0 (en) 2003-05-28
KR101296500B1 (ko) 2013-08-13
ZA200508719B (en) 2007-03-28
CN1836431B (zh) 2011-09-07
ZA200700776B (en) 2008-06-25
KR20120099465A (ko) 2012-09-10
ZA200700777B (en) 2008-08-27
HK1095235A1 (en) 2007-04-27
KR101273743B1 (ko) 2013-06-12
ZA200700775B (en) 2008-11-26
ZA200700778B (en) 2008-08-27
GB0313615D0 (en) 2003-07-16
KR20120007081A (ko) 2012-01-19

Similar Documents

Publication Publication Date Title
CN1792082A (zh) 操作方执行的语音邮件转录
US20070054678A1 (en) Method of generating a sms or mms text message for receipt by a wireless information device
CN1354851A (zh) 交互式服务所使用的标记语言及其方法
CN1836431A (zh) 一种用于向无线信息设备提供语音邮件的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CI02 Correction of invention patent application

Correction item: Priority

Correct: 2003.06.12 GB 0313615.7

False: Lack of priority second

Number: 38

Page: The title page

Volume: 22

COR Change of bibliographic data

Free format text: CORRECT: PRIORITY; FROM: MISSING THE SECOND ARTICLE OF PRIORITY TO: 2003.6.12 GB 0313615.7

REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1095235

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1095235

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110907

Termination date: 20210422

CF01 Termination of patent right due to non-payment of annual fee