发明详述
本发明是作为一组移动电话产品的一部分由英国伦敦的SpinVox有限公司实现的:
1.VoicemailViewTM:语音邮件-文本系统——这给予订户选项,以将语音邮件作为文本(SMS/MMS或等效消息格式)递送到其移动电话,其中具有选项来在移动电话上听取原始语音邮件。术语‘SMS’指的是短消息服务,用于向移动电话发送明文消息;‘MMS’指的是由3GPP(第三代合伙项目,Third Generation Partnership Project)开发的多媒体消息服务,用于在移动电话以及其他形式的无线信息设备之间发送多媒体通信。所述术语还包含任何中间技术(诸如EMS(增强消息业务))以及诸如收费SMS之类的变体,以及这些业务的任何进一步增强和开发。
2.VoicemailManagerTM:新的语音邮件管理应用程序——其向移动电话添加了GUI(图形用户界面);它补充了(或者替代)由蜂窝电话语音邮件系统提供的现有音频菜单系统(UI)并且集成了电话的呼叫转移特征、问候控制以及其它有关控制,以便在移动电话上为语音邮件管理提供单个环境(应用程序)。
3.VoiceMessengerTM:语音-文本系统——其允许用户向他们的移动电话讲出文本消息,使其被远程转换为文本,然后在不使用通常令人厌倦的字母数字的电话键盘输入系统情况下进行发送。
把语音消息准确转录为文本格式(如VoicemailView和VoiceMessenger中所配置的)的关键在于:使用操作员来通过提取消息(不是罗嗦的逐词转录)智能地执行实际转录、而不是利用自动语音识别系统。此系统有效操作的关键在于这样一种IT体系结构:该IT体系结构向操作方快速地发送语音文件,并且允许他们快速地听取这些消息且有效地生成转录,以及允许他们把转录的消息作为文本消息发送。
A.VoicemailViewTM语音邮件-文本系统
描述了用于递送的语音邮件-文本系统的三种解决方案:
1.网络操作方内部——所述系统被集成在操作方的网络服务内(参见图1)。
2.网络操作方的外部——服务公司经由固定电话来访问网络操作方的语音邮件系统,并且提供导向终端用户的外部服务;参见图2,或者在服务公司内安放自己的语音邮件系统且完全在网络操作方的服务以外递送其服务,并且因此是网络操作方和手机相互独立,参见图3。
A.1VoicemailView:操作方变体的内部
现在参照图1,如下配置所述过程:
1呼叫者从PSTN或者移动电话网络留下语音邮件。
2通过语音转录服务把语音邮件转换为SMS或者MMS文件:这不是由自动语音识别系统执行,而是由操作员来执行。这些操作员比自动语音识别系统更加准确并且灵活,并且可以智能地翻译所述消息、消除不必要停顿和重复,从而生成短的、简单的并且易懂的消息。附录II定义了有效的并且简明转录的要求。操作员往往能够显著地缩短消息以便使它们适合在160个字符的现有SMS文本消息最大限度内(否则经由标准级连使更长的消息适合多个SMS消息);然而对于MMS,则没有这种最大限度。
·生成至原始语音邮件文件的链接(唯一i/d)——此i/d可以仅仅是时间/日期&呼叫者号码的散列
·把语音邮件的所述时间&日期添加到SMS/MMS文件的首部
·把呼叫者号码添加到SMS/MMS文件的首部
3把消息文件发送到SMS或者MMS服务器以用于存储。
4经由SMS或者MMS网关把消息发送至无线终端。
5用户在SMS或者MMS应用程序内查看并且管理‘文本’语音邮件,或者甚至在取决于平台的消息应用程序内部查看并且管理‘文本’语音邮件。
6用户可以请求通过在终端上运行的新VoicemailManager应用程序(其为所有语音邮件功能提供GUI接口;参见B.2)听取原始语音邮件:播放、快进(FFW)、回倒(REW)、下一、擦除、存储、转发、消息的时间/日期、回呼(以及通过音频提示/菜单可得到的任何其他现有语音邮件控制)。
7当消息‘读取’时,SMS/MMS的可靠递送使SMS/MMS存储与语音邮件存储同步。
A.2操作方变体的外部;服务公司为操作方提供语音-文本设施
现在参照图2,如下配置所述过程:
1新的订户向服务公司提供他们的电话号码、语音邮箱PIN号以及其它细节。这使得所述语音邮件获取和存储服务器能够通过对其进行定时轮询或者通过操作方内部的语音邮件系统向其发送新的语音邮件通知,来访问它们的语音邮箱,以获取消息。对于用户付账存在2种选项(预付或者后付):
1.回复文本账单(小账单)
2.按月信用/借记卡账单
2呼叫者从PSTN或者移动电话网络留下语音邮件。
3服务公司语音邮件获取&存储服务器访问订户的语音邮箱&‘收听’消息:
·使用标准DTMF音调播放消息、获取呼叫的时间、呼叫者号码以及其他数据来构建文本递送所必需的数据
·创建唯一的i/d——可以仅仅是时间/日期&呼叫者号码的散列
·存储语音邮件,以用于将来播放
4将语音邮件音频文件发送给基于操作员的语音转录系统并且将其转换为SMS或者MMS文件,并且发送给第3方SMS/MMS网关以用于递送
·生成至原始语音邮件文件的链接(唯一i/d)并且被作为用户无法知晓的信息嵌入SMS/MMS文件中
·把语音邮件的时间&日期添加到SMS/MMS文件的首部
·把呼叫者号码添加到SMS/MMS文件的首部
·MMS文件可以包含被嵌入来用于本地播放的原始音频文件
5经由订户的网络操作方来递送SMS或者MMS消息
·经由SMS或者MMS网关把消息发送至无线终端。
·用户在SMS或者MMS应用程序内查看并且管理‘文本’语音邮件,或者甚至在取决于平台的消息应用程序内部查看并且管理‘文本’语音邮件。
6用户可以使用终端上的新语音邮件管理应用程序(其提供了GUI;参见B.2)拨入他们在网络上的语音邮件:播放、快进(FFW)、回倒(REW)、下一、擦除、存储、转发、消息的时间/日期、回呼(以及通过音频提示/菜单可得到的任何其他现有语音邮件控制)。
7为了听到原始语音邮件,用户被连接回服务公司的语音邮件存储服务器。所述唯一的i/d(在SMS/MMS消息中用户无法知晓的)获取正确的文件来用于播放。
A.3操作方外部:由服务公司完全提供的语音邮件
现在参照图3,如下配置所述过程:
1新的订户向服务公司提供他们的电话号码和账单细节。
他们现在正在将服务公司用作他们的语音邮件供应商。
2个选项:
1.他们人工地把对他们电话的呼叫转移为服务公司语音邮件网关号码
2.服务公司提供空中传递(over the air)升级来改变这个行为
对于付账存在2种选择(预付或者后付):
3.回复文本账单(小账单)
4.按月信用/借记卡账单
2呼叫者从任何电话,通常是PSTN或者移动电话网络留下语音邮件。
3服务公司语音邮件提供所有语音邮件功能
1.存储语音邮件以用于将来播放
2.创建唯一的i/d——可以仅仅是时间/日期&呼叫者号码的散列
4将语音邮件音频文件发送给基于操作员的语音转录系统并且由操作员转换为SMS或者MMS文件,并且发送给第3方SMS/MMS网关以用于递送
·生成至原始语音邮件文件的链接(唯一i/d)并且作为SMS/MMS文件中用户无法知晓的信息被嵌入
·把语音邮件时间&日期添加到SMS/MMS文件的首部
·把呼叫者号码添加到SMS/MMS文件的首部
·MMS文件可以包含被嵌入来用于本地播放的原始音频文件
5经由订户的网络操作方来递送SMS或者MMS消息
·经由SMS或者MMS网关把消息发送至无线终端。
·用户在SMS或者MMS应用程序内查看并且管理‘文本’语音邮件,或者甚至在取决于平台的消息应用程序内部查看并且管理‘文本’语音邮件。
6用户可以使用标准IVR控制或者终端上的新语音邮件管理应用程序(提供GUI;参见B.2)拨入他们在网络上的语音邮件:播放、快进(FFW)、回倒(REW)、下一、擦除、存储、转发、消息的时间/日期、回呼(以及通过音频提示/菜单可得到的任何其他现有语音邮件控制)。
7为了听取原始语音邮件,用户被连接回服务公司的语音邮件存储服务器。所述唯一的i/d(在SMS/MMS消息中用户无法知晓的)获取正确文件以用于播放。
B.移动电话软件
在任何上述变体中,所述移动电话(或者具有某些特性的其他无线信息设备)将需要经由OTA(空中传递)进行升级或另外采用以下方式升级:
B.1查看语音邮件-文本消息
存在两种选项:
1.不修改现有电话GUI——仅仅将所述SMS处理为另一消息,所述SMS是转录的语音邮件
2.将所述GUI修改为并入如下所示的新特征:
图4示出了电话手持机图标,该电话手持机图标可以紧跟SMS消息使用,以表明它是消息收件箱中的语音邮件消息。转录为文本的语音邮件存在于设备的消息收件箱中;它已经被从Homer Simpson发送。图5示出了当前SMS文本图标看起来的样子。另一个解决方案是对于语音邮件而言在每个首部之前加上某些逻辑,诸如“V:”——因此,“V:Homer Simpson”将表明转录的语音邮件的SMS来自Homer Simpson。另外,在语音邮件消息的文本文件内部,应该添加语音邮件的时间和日期(由于不是所有网关都正确地用时间戳表明已发送消息),如图6所示。图7示出了移动电话环境中的此种操作。用户对高亮度显示的已转录语音邮件(来自Daniel Davies)选择‘读取’选项;所述设备依照正常方式显示所述SMS,但是具有所添加的数据和时间。还可能的是,仅仅通过按下并按住特定按键(在该图中是按键‘1’)来激活基于正常音频的语音邮件播放功能。
当人们打开标准SMS消息时,通常可以容易地访问进一步的功能(例如经由诺基亚移动电话中的选项菜单),诸如‘擦除(Erase)’、‘回复(Reply)’、‘编辑(Edit)’等等。基于此标准‘选项’菜单或等效物,本实现方式添加了三种新功能,如图8所示:
·听取原始文件
·回呼
·添加联系人
下面我们详述这些新的功能:
听取原始文件:其允许用户此刻听取原始语音邮件,并且使用编码入SMS/MMS消息的唯一i/d来正确地连接到原始语音文件。
存在三个选项:
(i)用户进入标准语音邮件系统,并且遵循现有音频提示来听取消息。
(ii)用户进入下文在B.2示出的新的语音邮件管理应用程序。
在任何一种情况下,当结束对语音邮件的呼叫时,用户返回到消息应用程序中的同一点来判定采用文本/音频版本做什么。
(iii)用户把原始声音文件嵌入MMS消息(或等效物,诸如电子邮件)以待在终端上本地播放。
回呼
此操作使用与消息一同记录的呼叫者号码来对其进行回呼。添加联系人
此操作获取呼叫者的号码并且自动将其添加到用户的新联系人/地址条目以便利用名称等来完成。
这是移动电话软件的特定例子,其能够解析已经从语音转换的文本并且智能地使用它。其他例子包括:
(a)提取讲出的电话号码,以允许它被使用(来进行一个呼叫)、保存、编辑或添加到电话簿;
(b)提取电子邮件地址并且允许它被使用、保存、编辑或添加到地址簿;
(c)提取物理地址并且允许它被使用、保存、编辑或添加到地址簿;
(d)提取网页地址(超链接)并且允许它被使用、编辑、保存或添加到地址簿或者浏览器收藏夹。
(e)提取会议时间并且允许它被使用、保存、编辑并且作为条目添加到议程
(f)提取号码并且将它保存到其中一个设备应用程序
(g)提取实际名词并且提供选项来在网页上(WAP或者全部的浏览器)对其进行搜索或者查找。
此操作可以进行的程度取决于你手机的智能性(实质上是其解析能力以及与其它应用程序和通常存储这种数据以用于其它应用程序的普遍剪贴板之间的互操作性)。目前,几乎所有的电话都支持从文本消息中提取电话号码、电子邮件地址和网页地址。当用户读取到消息时,利用加下划线的内容通常可以获得它(如超链接或等效物);然后用户仅仅选择‘选项’(如在诺基亚电话上找到的、或在不同手机上的等效物)和‘使用’(如在诺基亚电话上找到的,或者在不同手机上的等效物),然后根据内容类型,进一步进行上下文相关的选项(例如利用它可以提供的街道地址——在地址簿查找、导航、保存等等)。
B.2VoicemailManagerTM:语音邮件管理应用程序
此应用程序可被单独使用或者作为如上在B.1所述的VoicemailView语音-SMS/MMS系统(或等效的文本递送系统)的组成部分。
在访问和管理正常的音频语音邮件时,除通常接收到的标准音频提示以外,所述语音邮件管理应用程序还给予用户GUI(图形用户界面)。当订户使用他们的移动电话访问(图9A)他们的音频语音邮件时,首先使他们进入其‘语音邮件收件箱’,然后利用图9B至9D示出的控制来进行呈现。
出于编程的目的,这些控制将几乎全部涉及标准DTMF音调,当用户现在按下他们电话小键盘上的按键时,所述语音邮件系统将其用作对它的输入。
图9A示出了用户呼叫语音邮件;图9B示出了如何调用新的管理应用程序,其首次显示收件箱的所有语音邮件内容(此处,3条新的音频呼叫以及2条存储音频呼叫)。所述选项菜单如下操作:
选项菜单上列出的条目 |
动作 |
全部播放 |
按照次序播放所有消息 |
全部删除 |
提供将删除的消息——所有新的和所有存储的——并且将其全部删除 |
全部标记为已听 |
把所有新消息移入存储文件夹 |
转发给 |
把消息转发至另一个订户收件箱 |
存储 |
存储——只在新消息中或者播放期间可用——把消息移至存储文件夹 |
参照图9C,如果用户选择他希望收听的音频语音邮件类别(即,新的或者存储的),那么向其示出该类别中的音频语音邮件的菜单列表,每个邮件利用发件人名字(如果可得到的话)或者缺少名字、以及呼叫者号码进行标识。转录的文本消息在理想情况下已经通过转录服务为其添加呼叫者名字。这包括通知用户何时在VoicemailView中关闭语音-文本转换(即,他们希望明码语音邮件),以便使他们在判断是否拨入并且收听它之前,能够看到给他们留下语音邮件的人员名字。用户可以容易地导航到和选择他希望收听的音频消息。一旦消息被选择,那么如图9C所示,在屏幕上显示新的语音邮件控制。它们的功能如下:
语音邮件控制 |
动作 |
1擦除 |
擦除当前消息—返回到前一屏。新的或者存储文件夹视图被用户用来选择现在收听哪个消息,或者直接播放下一条消息。 |
2下一 |
跳至下一条消息。在消息结束时,返回到前一屏,新的或者存储文件夹视图。 |
3FFW |
在按住按钮时快进消息。在消息结束时,停止并且显示待听取的下一条消息(新的或者存储的文件夹视图),或者在所有消息结束时,返回到顶层视图(新的&存储文件夹视图) |
4REW |
在按住按钮时回倒消息。在消息结束时,停止并且显示待听取的前一条消息(新的或者存储文件夹视图),或者在所有消息结束时,返回到顶层视图(新的&存储文件夹视图) |
5前一条 |
跳至前一条消息。在消息开始时,返回到前一屏,新的或者存储的文件夹视图。 |
6回呼 |
回呼用户并且结束语音邮件呼叫。 |
7文本消息 |
打开文本(SMS或者MMS)应用程序,利用被选择为用户的默认收件人的呼叫者号码,用户向他们发送文本消息。 |
8转发 |
把消息转发至另一个订户语音邮件收件箱。 |
9添加联系人 |
通过电话的标准联系人/电话簿应用程序,将号码添加到联系人 |
0配置 |
配置语音邮件——记录新的问候、打开/关闭问候等的标准选项并入现有电话软件中以用于配置转移行为——例如基于繁忙/无人应答/关机来转移到语音邮件或指定号码 |
在此过程期间,始终向用户提供听觉的导航选项,其与显示在屏幕上的内容同步,以便使他们在两个领域都是最好的。通过使用基于简单命令的语音识别,用户可以仅仅讲出他们希望执行的命令,因此如果用户希望播放新消息,那么他们将仅仅说出“播放”,并且VoicemailManager引擎将识别此命令并且仅仅执行该操作——播放消息。
注释:正确的号码(小键盘号码)以及它们的相关功能与现有语音邮件系统相同,并且通过网络操作方/语音邮件系统来改变。
B.3VoiceMessengerTM:语音-文本(SMS/MMS)服务
对于用户而言,优选的是,希望依照文本格式发送消息、而不是语音——例如,如果他们不希望干扰收件人,但是希望给他们消息。对于人们在小型字母数字小键盘上使用手指键入文本通常是十分困难的。他们还可能在移动(诸如步行),或者在汽车中,或者只有一只手可用,或者不能键入(诸如正在驾车时)。所述VoiceMessengerTM语音-文本服务解决了此种需要。
用户进入在他们的移动电话上运行的他们的消息/文本应用程序,仅仅从他们电话的地址簿中或者键入他们的号码来选择消息收件人,然后通过按下并且按住‘2’键来选择新的VoiceMessenger选项,如图10所示。所述用户还可以被连接到所述服务来开始,并且仅仅向本地(移动电话上)或者远程语音识别引擎讲出所述号码或者名字,其中所述语音识别引擎将通过所述处理来获取用户。
当被连接至远程VoiceMessenger引擎时,所述用户仅仅讲出其消息,并且所述远程VoiceMessenger引擎记录它,然后发送所述音频文件以用于使用基于操作员的语音转录系统来转换为文本。然后把所述文本格式消息打包为SMS/MMS(电子邮件或者其他适当的消息系统)并且通过SMS/MMS等等网关发送。将给予用户听觉上的提示以便控制所述输入,听取所述转换并且发送所述消息。
C.扩展
C.1MMS语音备忘录(voice-note)至文本
具有允许MMS操作的电话的用户将能经由MMS发送语音备忘录,然后,基于操作员的语音转录服务将其转录并且发送到他们期望的目的地。如果优选,他们还可以依照MMS格式来转换语音邮件并且发送到他们的电话。
C.2自动语音识别
其将会加速进入的语音文件的处理并且减少操作成本。主要的功能将是自动检测讲出的电话号码,并且检测语言以便把音频文件发送至转录处的恰当操作方。它还用于检测来自用户在线电话簿(参见下文)的名字和讲出的号码以及地址以及用于VoicemailManager控制的命令。
C.3在线地址簿
将有两种形式的在线地址簿,其中当仅仅通过说出他们希望诉说的人员名字来连接至SpinVox服务时,用户就能使用所述两种在线地址簿。
SpinVox在线电话簿——经由用户网络登录,他们能够将他们希望的人员名字和号码添加在他们的SpinVox在线地址簿中。
与他们的Microsoft Outlook(Express或者完全版)或者其他电子邮件/PIM/地址簿客户端同步——这样做使得他们能够使他们的所有联系人在线,并且不仅能说出收件人的名字,而且能确定他们希望发送的消息类型:SMS、MMS、电子邮件、传真等等。
利用网络操作方,还能够提供SIM备份功能,然后向他们提供SIM电话簿以便于他们从中呼叫名字。
C.4目前可用的服务(当前)
使用目前可用的服务器,用户可以定义他们希望的模式以用于接收通信,例如‘会议’让用户在通信之前知道他们希望联络的那个人正在会议中,并且将接受所说的SMS/MMS或者VoiceView文本消息。一旦在会议之外,用户就能将其联络状态改变为‘可用’并且可以通过电话联络到。
附录I
1.SpinVox语音邮件IVR结构
具有IVR的标准语音邮件服务器系统是基础;所述IVR被编程为如图11中所示的流程图。
2.VoicemailView
用户的电话将重新编程(在如下显示的技术提供期间)‘1’键(标准语音邮件访问键)以便自动地呼叫SpinVox语音邮件服务器,并且让它们自动登录(唯一的电话号码+PIM),从而将其带入IVR树的顶层。
如果在任一点用户挂断,那么所述会话以相关结果终止。如果这发生在记录期间,包括来自另一个移动呼叫者的掉线(dropped line),那么被假定记录结束,并且系统进行到转录阶段。
每个转录的语音邮件将包含从说‘4’开始的唯一号码(取决于最终IVR树配置),使得当用户按下并按住‘1’来连接至SpinVox的语音邮件服务器时,他们仅仅按下唯一消息i/d(例如403),这将把他们带入队列中其拥有的第三个消息。
2.1座机或者其他移动电话访问
如图11所示,所述IVR树将允许用户使用他们的唯一转移号(语音邮件号)来拨入,并且随后将被提示来输入他们的PIN。
2.2快速拨号
所述IVR系统将接受在快速拨号时的用户编程,这允许他们拨出他们的唯一SpinVox号码+PIN。然后他们能够访问上面示出的所有特征。
2.3留下语音邮件
用户的电话被配置为在他们如下定义的条件下转移到SpinVox语音邮件,其中呼叫者将听到下述之一:
默认SpinVox问候:“欢迎来到SpinVox语音邮件。请在嘟声后清楚地口述你的消息。”[嘟]
用户自己的问候:[用户的记录问候][嘟]
然后:
1.系统在默认长度(30秒)或者用户定义的长度(10秒-2分钟或者任何SpinVox设置的参数)内记录呼叫者的语音邮件。
2.在记录结束时,呼叫者通过提示听取标准IVR选项:“按下:
1.听取你的消息
2.删除你的消息并且重新记录
3.重新记录你的消息
#结束或者只挂断”
3.如果用户超出记录长度,那么他们被提示:“对不起,你已经超出可用的记录时间。在嘟声后请重试”。
a.如果用户挂断而不记录新消息,那么消息被发送来用于转录。
b.如果用户已经选择了‘高级转录选项’,那么出现另一个变体;此种选项操作来使得如果消息的记录时间小于用户设置的最大时间时,那么转录所述消息,否则,就不转录,而是把标准的通知发送给用户,以便依照下面4c中示出的格式通知他们有新的语音邮件要收听。此操作阐明了这样的事实,即:偶尔向用户发送了更有利于收听而不是读取的长语音邮件。然而,对于这些长消息来说,转录方可以简要地收听所述语音消息,并且写下发送给消息收件人的呼叫主题的非常短的指示。此外,对于支持小于一定文本量的手机(通常是旧手机)来说,系统首先查找用户手机以及电话数据库中的限制(由SpinVox提供),然后向用户提供相关的记录长度。例如,对于不支持链接并且最多仅4个文本消息的旧西门子电话来说,系统警告用户:记录长度应该保持在说30秒以下,以确保大多数消息适合他们的电话并且告诉他们为什么。同样,需要系统为他们把这些手机的默认记录长度设置为相称的长度。
4.把消息发送给相关转录队列:
a.如果呼叫者CLID(呼叫线路识别,Caller Line Identification)被获取,那么自动填充‘From(来自)’字段。如果没有,插入‘SpinVoxVoicemailView’作为发件人。
b.如果能够转录,那么把消息的文本版本发送给用户
c.如果不能转录,那么把具有自动填充的某些字段的模板文本消息发送给用户:
“你有[来自CLI的,如果可得到]新的语音邮件要收听。按你电话上的‘1’连接至你的语音邮件,然后按4xx可听取此指定消息。谢谢。SpinVox”。所述‘From’字段是来自于‘SpinVox VoicemailView’
d.依照SMS的发送数目来付账。
5.把文本消息发送给用户并且他们可以按照其手机上可用的标准选项来选择接下来做什么。
3.VoiceMessenger
上述IVR图表示出了用户如何访问VoiceMessenger,是直接从他们的移动电话还是通过另一个电话访问。
3.1快速拨号
所述IVR系统将接受在快速拨号时的用户编程,这允许他们拨出他们的唯一SpinVox号码+PIN+‘3’。
如果利用他们的移动电话,那么下面的技术提供将配置有快速拨号(通过默认键‘2’)来拨号并且使他们直接登入(语音邮件号码+PIN+3)到VoiceMessenger选项。
他们于是将听到标准提示:
″欢迎来到SpinVox的VoiceMessenger。在嘟声后,请讲出目的地号码或者键入它,然后口述你希望发送的消息。挂断来发送,或者按#来发送新消息。”[嘟]
然后:
1.如果无法检测到DTMF音调,或者发生混淆(当使用*或者+进行国际拨号时),那么提示输入新号码:
“对不起,我们无法检测到你键入的号码。请重试,并且记住国际号码以00开头,没有+”[嘟声提示重新输入]
2.系统在默认长度(30秒)或者用户定义的长度(10秒-2分钟)内记录。
3.在记录结束时,用户通过提示听到标准的IVR选项:
“按下:
4.听取你的消息
5.删除你的消息并且重新记录
6.重新记录你的消息
#发送新消息或者只挂断”
4.如果用户超出记录长度,那么他们被提示:“对不起,你已经超出可用的记录时间。在嘟声后请重试”。
a.如果用户挂断而不记录新消息,那么消息被发送来用于转录。
5.把消息发送给转录队列,其中所述‘From’字段自动填充(当SpinVox知道谁是客户端时):
a.如果能够转录,那么把消息的文本版本发送给用户
b.如果不能转录,那么把自动填充某些字段的模板文本消息发送给用户:
“对不起,但是我们不能转换[时间/日期]你口述的消息[到号码,如果检测到]。请在安静环境下重试并且清楚地口述。谢谢。SpinVox”。所述‘From’字段是‘SpinVox VoiceMessenger’。
c.依照SMS的发送数目或者MMS大小(千字节)付账。
6.把文本消息发送给收件人并且他们可以按照其手机上可用的标准选项来选择接下来做什么。
4.技术提供
在技术提供期间,用户数据(手机、网络等)将重新用于确认用户已经选择了什么。
关键是发送用户SMS消息的系统使用户手机的配置部分自动化(用于VoiceMessenger的转移&V.Card)并且确认成功设置。把这些消息全部作为高优先级发送,以便确保用户/销售员在等待配置SMS成功时不会‘挂电话’(hanging)。
所述步骤是:
步骤1:从在提供屏幕上显示的下拉列表中进行手机选择(通常在销售点)
步骤2:语音邮件查看设置:
<创建如下符号串:‘+COUNTRY CODE_USERS UNIQUEVOICEMAIL NUMBER_p_PIN NUMBER_#_’>>>>这被称为SPINVOX语音邮件号并且对于每个用户而言是唯一的!>
步骤3:呼叫转移选择:其解释通常如何设置移动电话来转移到用户的语音邮件(基于所有如下情况)。如果他特别希望其转移到他人或者号码,而不是他自己的语音邮件,那么用户可以改变这些
<基于上面用于配置手机的选择创建的USSD符号串...(数字线)作为具有4xUSSD符号串的高优先级SMS被发送,其中用户需要4xUSSD符号串来进行回答/动作。>
步骤4:经由SMS的呼叫转移设置。告诉顾客他刚才已经发送SMS并且在接收时应该点击提供屏幕上的指定按钮(或者如果在3分钟内未接收到,那么另外点击‘未接收到’按钮)。
步骤5:呼叫转移设置:SMS。所述提供屏幕通知用户如果他已经接收到配置SMS,那么请执行下列步骤:
1.打开SMS消息
2.选择‘选项’(具有用于每个手机的功能名称的数据库)
3.滚动&选择‘使用号码’
4.你此刻将看到4个号码,选择第一个号码并且按‘发送’。
你此刻将看到正在拨出的号码并且在你的移动电话的屏幕上显示‘正在请求’。如果你接收到确认消息,那么对剩余3个号码重复此步骤。
步骤5:呼叫转移设置:移动电话。所述提供屏幕通知用户:
在你的移动电话上:
1.选择‘菜单’2。
<为指定的手机从数据库导入VOICEMAILVIEW数据...告诉你将做什么/利用‘+COUNTRY CODE_USERS UNIQUE VOICEMAILNUMBER_p_PIN NUMBER_#_’>
步骤6:选择递送方法。一旦语音邮件被转换为文本(典型的选项是带有音频文件的SMS、MMS、MMS,电子邮件,带有音频文件的电子邮件),所述提供屏幕允许用户选择他想要如何接收语音邮件。然后所述系统把适当的vCard发送至用户的移动电话。
步骤7:语音消息器设置。所述提供屏幕通知用户:
请如下执行:
我们刚向你发送SMS-VCard。当你已经接收到它时,请执行下列步骤:
1.接受并且在你的移动电话上保存所述VCard,而不对其进行修改——进入步骤2。
如果你在5分钟内未接收到此消息,或者无法保存所述VCard,那么请执行下列步骤:
创建称为‘VoiceMessenger’的新‘联系人’,其具有如下号码:
+COUNTRY CODE_USERS UNIQUE VOICEMAILNUMBER_p_PIN NUMBER_#_,1′
如果你不知道如何添加新的‘联系人’,请点击这里——(进入‘如何’页面,该页面具有从数据库获得的信息——告诉你做什么)
2.<为指定的手机导入来自数据库的VOICEMESSENGER快速拨号配置数据...告诉你做什么/利用>
步骤8:祝贺屏幕:
感谢选择SpinVox服务。
*你此刻将接收到作为文本的语音邮件,并且不要忘记:你总是可以仅仅通过按下并按住你电话上的‘1’键(以便与你的SpinVox语音邮件账号连接)来听取原始邮件。
*为了讲出文本消息——按下并按住‘2’(或者你指定为VoicemailView的键)并且你将立即被连接到VoiceMessenger。清楚地口述你的号码以及消息——你说它...我们将它转换为文本!
*你可以通过按下并按住‘1’键并且遵照提示来一直访问VoiceMessenger。
*你可以使用你的移动电话号码和PIN在www.SpinVox.com上查看你的账号设置,查看帐目并且管理你的SpinVox账号。
如果你尚未打印或者记录你的PIN号,在这里再次得到
1234
5.转录辅助
当操作转录方登记他们的账号时,将这提供给他们。所有他们需要的是网络浏览器、声卡、能够播放并且控制媒体文件播放或者流送协议的媒体播放器以及高速互联网接入。图12示出了转录的处理流程图。每个转录方登录并且开始接收VoicemailView(参见图13,他们在其中键入转录消息并且用来导致消息被发送的屏幕),或者待转录的VoiceMessenger音频文件(参见图14),一次一个。当登录时,只存在2个状态:消息目前在转录过程中,以及暂停。
5.1转录方控制面板按钮(参见图13):
已完成转录
ο对于VoicemailView来说,依照下文将具有自动填充的字段(如果能得到)的自动SMS发送给他们,所述文本是“你有[‘From CLI’,如果能够得到]的新语音邮件要听取。按你电话上的‘1’来连接到你的语音邮件,然后按4xx来听此指定消息。谢谢。SpinVox。”
所述‘From’字段是来自于‘SpinVox VoicemailView’
ο对于VoiceMessenger来说,当数据可得到时,依照下文利用自动填充字段把自动的SMS发送给他们,所述文本是:“对不起,但是我们不能转换你[时间/日期“到电话号码”,如果能得到]口述的消息。请在安静的环境下重试并且清楚地口述。谢谢。SpinVox”。
ο所述‘From’字段是‘SpinVox VoiceMessenger’。
暂停并且重新队列当前信息
将当前信息重新路由至不同语言处,菜单用于选择语言或者“未知”。使转录方回到队列以便接收新消息。
5.2电话号码:
在VoicemailView的情况下,‘From’字段是利用当呼叫者留下信息时获取的CLID(插入消息首部中)或者“SpinVoxVoicemailView”自动填充的
在VoiceMessenger的情况下,所述‘From’字段是用户使用DTMF时为转录方自动填充的,或者如果未使用DTMF,所述转录辅助向所述转录方提供字段以便将其键入。
注释:出于用户数据保护原因,转录方决不会看到自动填充的电话字段(或者其他用户数据字段),因此所述系统不会示出这些,除非其要求所述转录方键入目的地号码。
5.3拼写检查
当所述转录方敲击‘发送’时,系统将自动地对消息进行拼写检查,并且如果发生任何错误,那么纠正它们并且利用提示“接受&发送”来向转录方显示校正结果,或者允许他们人工地纠正(由于可能有他们希望的特殊拼写)。
为了正确地执行此操作,所述拼写检查过程将包括与用户的地理区域和文化有关的实际名词词典。因此,例如在英国,实际名词词典将不仅包含英语名字,而且包括地名、地标、公路名称、连锁商店名称(例如酒馆、酒吧、饭店等)等等。
当不存在匹配时,所述转录方仅仅双击加下划线的字,就可被提供最接近的匹配。如果有必要,他们可以倒带并且重听该部分消息以便做出适当选择。
5.4转录处管理员
他们可以查看他们自己名下的所有转录方账号的统计量。他们将能查看并且分析:
每小时、每日、每周、每月、每年键入的转录数目(签字,支持)
每小时、每日、每周、每月、每年键入的SMS的发送数目
每小时、每日、每周、每月、每年的转录次数/速率
每小时、每日、每周、每月、每年键入的转录次数/速率的变化
转录方账号的所有这些
每日、每周、每月、每年键入的不能转录消息的数目和%
每日、每周、每月、每年发送给不同处来转录的消息数目和%
转录准确度——通过每日随机采样并且测量相对于原始的准确度(CCA管理器执行此操作&把结果输入系统)以及来自CCA关于事故单的反馈来执行。这两个数字中较差的是准确性。
附录II:转录服务要求
这些是用于VoicemailView(语音邮件查看)和VoiceMessenger(语音消息)服务的转录服务的要求。
要求
关键要求在于递送实际消息,而不是所有的冗余信息,这些冗余信息经常被讲出并且留在信息中。
要求 |
保密性转录服务必须在数据保护法98或者此时有效的其它立法内最低限度地提供所转录的消息的完全保密性。·所有转录雇员在能够处理任何消息之前必须签订保密协议,并且不准泄漏、共享、复制、转发或用其他方式共享任何用户信息·将消息和号码分离来保护用户信息:ο在VoicemailView的情况下,转录方不会示出他们正向其发送文本消息的用户电话号码ο在VoiceMessenger的情况下,他们不会看到呼叫者的号码,只有目的地号码·每个转录方将具有唯一的登录名和密码。然后所述系统记录他们 |
所做出的每个转录,因此我们具有完全的系统透明度。此数据可用于转录处管理员(其创建并且管理转录方账号)和SpinVox系统管理员·在SpinVox的系统之间沿任一方向的消息通信必须是安全的——使用行业标准进行加密(例如RC4-124、RSA-124、SSL3等)·对服务器(或者其它地方)上保存的消息的访问必须是安全的 |
转换的准确性是99%+如果用户接收文本消息,那么该文本消息是可理解的,相对于原始语音文件消息的准确性是99%。 |
所有号码、电话号码、电子邮件地址、网页地址、街道地址将被正确地转换。 |
字符集与SMS/MMS允许的字符100%兼容在转录期间使用的字符与导致消息将通过其发送的系统兼容。 |
消息的级连是有意义的用户将清楚地知道继续到下一消息以便继续读取转录。如果系统不自动地提供明显的提示来这样做,那么插入‘2中的1(1 of 2)’、‘3中的2(2 of 3)’等。 |
地区口音和谚语转录方必须能够应付一个国家中出现的各种地区口音和谚语。例如,单在英国,就存在超过12种的地区口音,从‘优雅的’东南口音到西苏格兰的含糊不清的格拉斯哥口音、再到有韵律的爱尔兰人口音。这些应该被正确地并且依照他们讲话的格式进行翻译。提供将把消息发送至具有适当能力的转录方的路由。 |
去除语音假象(arteface)通常语音包含很多冗余‘噪音’,例如:‘呐’、‘啊’、‘哦’、‘嗯’,以及暂停、呼吸、咳嗽、打喷嚏以及其他典型的语音假象。这些显然必须不包括在转录中。 |
去除明显的重复消息经常包含重复的短语或者名字以便澄清要说的是什么。这些不应该包括在内。例如 |
讲出消息:“在Waxy O′Connors的外面看见你,其中Waxy是candlewax(蜡烛石蜡)中的Waxy而O′Connor是爱尔兰人歌手Sinead O′Connor的O′Connor。”转录应该读取:“在Waxy O′Connors外面看见你。” |
缩写 |
应该使用通用术语的标准缩写:讲出 缩写Apartment(公寓) Apt.Number(号码) No.Telephone Number(电话号码) Tel.Fax Number(传真号码) Fax.Example(例如) E.g.Okay(好的) okElectronic Mail(电子邮件) emailInternet Website(互联网网站) website(即,不需要http://) |
数字每当讲出数字时,数字格式将被写下。例如,“在晚上七点四十五看见你”=“在7:45pm看见你”例如,“我们想定购一万一千七百八十八个D4大小的坚果。”=“我们想定购11,788个D4大小的坚果。”例如,“Jane住在十一七十五公园风景(Park View),第四层的二十三房间”=“Jane住在1175公园风景(Park View),4rd层apt.23。” |
电话号码为了节省字符空间,电话号码是没有空格的单个数字串:例如:07798625155,而不是像使用两个附加的空格字符那样的07798625155。 |
国际前缀如果在进行国际拨号时以00给出电话号码,那么将其转换为‘+’。例如,00442075864103应该是+442075864103。 |
这样做进一步节省字符空间并且正确地定义国际拨号前缀的号码,此号码由本地网络翻译为合适的国际拨出代码,所述代码并不总是00(例如在美国,它是011)。 |
拼写检查消息必须被正确地拼写,并且有人建议对所有消息使用相关的拼写检查程序——例如对于英国使用英国英语,对于美国使用美国英语等等。 |
实际名词和地名所使用的字典/拼写检查程序必须包括实际名词(名称)和地名来帮助首次正确获得消息中的信息。 |
事件计划——事件、庆典、新闻等的每日日历。其存在多个方面:(i)文化谚语在多文化社会中,重要的是知道在很多天、某一团体将要庆祝一些事情。例如,印度(Hindi)新年(Divali)与主要的UK新年不相同,因此,针对Divali,转录方必须准备倾听其中具有这些以及其他关联词的问候和祝福,并且知道如何拼写它们,或者知道消息的语音可能意味着什么。(ii)正常的每年的事件——复活节、圣诞节、新年等等。(iii)体育赛事——国家联赛、世界杯、F1赛事、帆船赛事等。(iv)媒体事件——奥斯卡、英国电影和电视艺术学院奖(BAFTA)等等的获奖者(v)不测事件——像近来的‘世贸中心双塔’的攻击、马德里爆炸、伊拉克战争等等。本地转录处管理员必须具有所有文化、社会、体育事件的全部日历,他们必须至少提前2天来为这些日历作计划。另外,这将是确定人员所要求的可能的负担平衡的关键。例如,在最近英国橄榄球世界杯获胜结束时,在赛后的2-3小时内文本消息和语音邮件负荷大概超出其正常水平的300%,并且往往大多涉及球员姓名、比赛中使用的术语(带球触地进攻(try)、转换(conversion)、拉克(ruck)、冒尔(maul)等)、外国城市和位置,当然,随后的日子,与从所述赛事回来的人们相关的所有交通, |
将自然地使负担平衡再次偏离。 |
不可译的词语在做出最大努力来想出这个单词是什么(可能是常用词汇以外的酒吧或者地点的名字)之后,将在其后在括号中设置问号。例如讲出消息:今晚6点在Jongleurs会见你。转录:今晚6点在Junglers(?)会见你。 |
间隙或者掉词(drop-out)消息可能由于出现临时网络故障而包含‘掉词’、‘间隙’或者其他干扰。在该情况下,在缺少字的地方插入“_”。例如“John,Mike和我_迟到__,因此在6pm见你。”这将可能提示用户拨入来听取原始文件,并且看看是否他们可以理解所述消息。3次以上的掉线:在该情况下,由于掉词的次数太多(3次或更多),所以消息难易理解,那么使用‘不可译’选项来向用户发送通知,告诉他们需要收听语音邮件或者尝试再次讲出他们的文本消息。 |
不可译的语音消息将使用标准模板通过文本消息通知用户:对于他们收听而言,存在不可译的语音消息:VoicemailView所述标准文本将说“你有x条无法转换的新的语音邮件需要收听。要听取它们,请通过按住并按下1来连接至VoicemailView。”然后,如下字段将被自动地填充:·当CLI禁止时,呼叫者[电话号码]或者[“私人号码”]·[时间/日期]·[唯一i/d]以便用户可以直接获得该消息VoiceMessenger |
所述标准文本将说“对不起,我们无法转换你刚刚口述的消息。请重试稍慢并且清楚地讲出。谢谢!”然后,如下字段将被自动地填充:·[时间和日期]他们试图发送消息·至:[电话号码]他们正试图转换为文本 |
语气或者其他暗含语境当留下消息的人员明显还使用了语气作为消息的一部分时,那么转录方将在消息开始时包括如下内容:·[笑]大笑·[哭]哭·[耳语]耳语·[叫喊]叫喊/尖叫(除非这样做是为了克服当处于酒吧或类似地方时的背景噪音,如果是那样的话就忽略)·[尖叫]当某人非常痛苦、挨批评或者惊恐时的尖叫声。·[惊恐]当某人明显惊恐时·[生气]当呼喊和/或猛击拳头时的生气(应该从消息的内容显现)当语气不清楚时(例如,可以刚好是那个人交谈的方式或者他们所处的语音),那么不要添加这些。 |
VoiceMessenger文本风格(textism)插入文本符号来表示情绪(情绪图标)已经变得非常普遍。如下内容将被公布并且将被支持。这些是我们将支持并且公布在我们的网站上的集合。SMS-Speak的官方完整列表在:http://sites.
ninemsn.com.au/minisite/web2sms/help/smsdict.asp在口述VoiceMessenger消息期间,用户可以说“插入符号名”,所述转录方将插入适当的符号。例如,“感谢确认我们的旅程。插入微笑。再见!”=“感谢确认我们的旅程:-)再见!” |
|
符号 符号名:-) 微笑:-D 大笑;-) 眨眼:-* 亲吻:-( 悲伤:’-( 哭泣:-c 不高兴:-‖ 生气:-(0) 叫喊:-< 欺骗>:-( 非常生气:-O 哦:-| 确定:-* 痛苦 |
符号 符号名O:-) 一个天使:-9 流口水:-<> 惊奇%-6 不是非常聪明:-() 震惊:-o zz 厌烦:- 怀疑:@ 叫喊:-o 惊骇:-X 没有说一句话|-I 睡觉%-} 陶醉:-V 交谈 |
标点应该使用正常的标点,诸如在语句开始大写、句号、问号、感叹号、引号和半引号,很明显,语调或者语法要求它。 |
用于转录辅助的语法检查程序应当帮助消除错误键入。 |
文本被迅速地递送文本消息从结束语音邮件记录至到达收件人电话所花费的时间平均是2分钟:·80%在2分钟内·10%在3分钟内·10%在5分钟内为了确保消息的最佳吞吐量,队列和负载平衡是必须的。 |