发明内容
本发明要解决的技术问题是提供一种交互式视频语音应答系统及实现方法,在IVR系统基础上实现视频信息显示和视频播放控制功能,提高用户体验。
为了解决上述问题,本发明提供了一种交互式视频语音应答系统的实现方法,包括:用户终端经由应用服务器与媒体服务器完成媒体协商后,所述应用服务器在向媒体服务器发起的放音收号请求过程中向媒体服务器发送视频文件的标识,所述媒体服务器根据所述标识获取所述视频文件并向所述用户终端播放所述视频文件。
进一步地,上述方法还具有以下特点:
所述应用服务器还根据所述标识获取所述视频文件的视频显示信息,并向媒体服务器发送所述标识时,向所述媒体服务器发送所述视频文件的视频显示信息;所述媒体服务器将所述视频显示信息叠加到所述视频文件的视频图像中,并将叠加所述视频显示信息的视频文件向所述用户终端播放。
进一步地,上述方法还具有以下特点:
所述应用服务器设置所述用户终端使用的媒体播放控制操作与所述用户终端中按键标号的对应关系称为视频播放按键控制信息;并在向所述媒体服务器发送所述标识的同时发送所述视频播放按键控制信息;所述用户终端在接收所述视频文件的过程中,进行按键操作后,所述媒体服务器使用收号功能判断出所述按键操作的按键标号,通过所述视频播放按键控制信息获知所述用户终端选择的视频控制操作,并对所述视频文件进行相应的控制。
进一步地,上述方法还具有以下特点:
所述视频控制操作是以下操作中的一种:暂停、继续、停止、快进、快退。
进一步地,上述方法还具有以下特点:
所述应用服务器在向所述媒体服务器发送的放音收号请求消息中携带所述视频文件的标识,以及所述视频显示信息和/或所述视频播放控制信息。
进一步地,上述方法还具有以下特点:
所述应用服务器将携带所述视频文件的标识,以及所述视频显示信息和/或所述视频播放控制信息的放音收号请求编辑为可扩展标记语言的格式,向所述媒体服务器发送;所述媒体服务器收到后,解析可扩展标记语言格式的放音收号请求,获知所述视频文件的标识或者视频显示信息或者所述视频播放控制信息。
为了解决上述技术问题,本发明还提供了一种交互式视频语音应答系统,包括用户终端、应用服务器和媒体服务器;所述应用服务器,用于协助所述用户终端与所述媒体服务器完成媒体协商后,在向媒体服务器发起放音收号请求过程中向媒体服务器发送视频文件的标识;所述媒体服务器,用于存储视频文件;还用于根据接收的放音收号请求获取所述标识,并根据所述标识获取所述视频文件并向所述用户终端播放;
进一步地,上述交互式视频语音应答系统还具有以下特点:
所述应用服务器,还用于根据所述标识获取所述视频文件的视频显示信息,并向媒体服务器发送所述标识时,向所述媒体服务器发送所述视频文件的视频显示信息;所述媒体服务器,还用于将所述视频显示信息叠加到所述视频文件的视频图像中,并将叠加所述视频显示信息的视频文件向所述用户终端播放。
进一步地,上述交互式视频语音应答系统还具有以下特点:
所述应用服务器,还用于设置所述用户终端使用的媒体播放控制操作与所述用户终端中按键标号的对应关系称为视频播放按键控制信息;并在向所述媒体服务器发送所述标识的同时发送所述视频播放按键控制信息;所述用户终端,还用于在接收并播放所述视频文件的过程中,进行按键操作;所述媒体服务器,还用于使用收号功能判断出所述按键操作的按键标号,通过所述视频播放按键控制信息获知所述用户终端选择的视频控制操作,并对所述视频文件进行相应的控制;视频控制操作是以下操作中的一种:暂停、继续、停止、快进、快退。
进一步地,上述交互式视频语音应答系统还具有以下特点:
所述应用服务器,还用于将携带所述视频文件的标识,以及所述视频显示信息和/或所述视频播放控制信息的放音收号请求编辑为可扩展标记语言的格式,向所述媒体服务器发送;所述媒体服务器,还用于解析可扩展标记语言格式的放音收号请求,获知所述视频文件的标识或者视频显示信息或者所述视频播放控制信息。
本发明在交互式语音应答系统的基础上,实现了视频信息显示,媒体播放控制等视频交互功能,在语音应答的基础上,给用户更为形象的视频体验,同时该系统对业务开放接口,可由业务进行灵活控制,具有很强的通用性和良好的用户体验,利于大规模的业务开发和使用,同时也能促进多媒体交互式视频语音应答系统业务的开发和普及。
具体实施方式
本实施例中,如图1所示,交互式视频语音应答系统,包括用户终端、应用服务器和媒体服务器;应用服务器和媒体服务器均具备视频编码协商以及传递和加载实现视频播放控制的能力;且媒体服务器中存储中有视频文件。
用户终端,用于选择视频文件后通知应用服务器,并通过所述应用服务器与所述媒体服务器进行媒体协商;还用于收到所述媒体服务器发送的视频文件数据后,播放所述视频文件;还用于在接收并播放所述视频文件的过程中,进行按键操作。
应用服务器(AS),用于协助用户终端与所述媒体服务器完成媒体协商后,在向媒体服务器发起放音收号请求过程中向媒体服务器发送视频文件的标识,具体为:将携带视频文件的标识的放音收号请求消息编辑为可扩展标记语言的格式向媒体服务器发送;还用于根据所述标识获取所述视频文件的视频显示信息,并向媒体服务器发送所述标识时,向所述媒体服务器发送所述视频文件的视频显示信息,具体为:将携带视频文件的标识和视频显示信息的放音收号请求消息编辑为可扩展标记语言的格式向媒体服务器发送;还用于设置所述用户终端使用的媒体播放控制操作与所述用户终端中按键标号的对应关系称为视频播放按键控制信息,并在向所述媒体服务器发送所述标识的同时发送所述视频播放按键控制信息,具体为:将携带视频文件的标识和视频播放按键控制信息的放音收号请求消息编辑为可扩展标记语言的格式向媒体服务器发送;典型的应用中,还可以在放音收号请求消息中同时携带视频文件的标识、视频显示信息和视频播放按键控制信息。
媒体服务器(MS),用于解析应用服务器发送的可扩展标记语言格式的放音收号请求,获知所述视频文件的标识或者视频显示信息或者所述视频播放控制信息;还用于根据所述标识获取所述视频文件并向所述用户终端播放;还用于将收到的视频显示信息叠加到所述视频文件的视频图像中,并将叠加视频显示信息的视频文件向所述用户终端播放;还用于使用收号功能判断出所述用户终端进行按键操作的按键标号,通过所述视频播放按键控制信息获知所述用户终端选择的视频控制操作,并对所述视频文件进行相应的控制,视频控制操作是以下操作中的一种:暂停、继续、停止、快进、快退。
如图2所示,在交互式视频语音应答系统内实现视频播放的方法包括以下步骤:
步骤201,用户终端经软交换设备(Soft Switch,简称SS)向应用服务器发起SIP信令的呼叫请求消息(INVITE),同时携带用户侧的媒体信息SDP1;
步骤202,应用服务器向软交换设备返回临时应答(100Trying);
步骤203,应用服务器在触发了IVVR业务后,向媒体服务器发起请求消息(INVITE),携带用户侧的媒体信息SDP1;
步骤204,媒体服务器向应用服务器返回临时应答(100Trying);
步骤205,媒体服务器向应用服务器返回请求响应消息(200OK),同时携带媒体服务器的媒体信息SDP2;
步骤206,应用服务器向媒体服务器发送请求响应消息的应答;
步骤207,应用服务器向软交换设备返回接收的请求响应消息(200OK),同时透传来自媒体服务器的媒体信息SDP2;
步骤208,软交换设备向应用服务器发送应答;用户终端与媒体服务器之间建立起SIP会话;用户终端选择想观看的视频文件;
步骤209,应用服务器通过与用户终端的信令交互(通过核心网)获得此视频文件的标识;向媒体服务器发送放音收号请求消息(INFO),并携带此视频文件的标识;
在其它实施例中,在步骤208处也可以不需用户终端选择视频文件,在步骤209处应用服务器根据系统设定的规则选择出视频文件(例如,系统默认的视频文件或者用户预订的视频文件)并获取视频文件的标识发送至媒体服务器。
步骤210,媒体服务器向应用服务器返回响应消息(200OK);
步骤211,媒体服务器根据应用服务器发送的标识,在存储区查找到对应的视频文件后,向用户终端播放此视频文件;
步骤212,此视频文件播放结束后,媒体服务器向应用服务器发送播放结束消息(INFO);
步骤213,应用服务器向媒体服务器返回INFO消息的应答消息;
步骤214,媒体服务器完成本次放音收号任务,通过INFO消息将对话退出消息通知至应用服务器;
步骤215,应用服务器向媒体服务器返回应答消息;本次放音收号任务完成;
步骤216,执行其它业务相关流程;
步骤217,应用服务器向媒体服务器发送结束消息(BYE),结束本次媒体会话;
步骤218,媒体服务器向应用服务器返回BYE消息的应答;媒体服务器结束媒体会话;
步骤219,应用服务器在完成本次呼叫任务后,通过软交换设备向用户终端发送结束消息(BYE),结束本次呼叫流程;
步骤220,用户终端通过软交换设备向应用服务器返回BYE消息的应答,本次呼叫结束。
在上述图2所示的流程基础上,还可以增加系统功能,将与视频显示信息(即与视频业务相关的信息内容,例如视频字幕等)通过视频的方式呈现给用户。与图2所示步骤类似,步骤208中用户终端选择想观看的视频文件后,步骤209中,应用服务器通过与用户终端的信令交互(通过核心网)获得视频文件的标识后,还可以获得此视频文件的视频显示信息,并将同时携带视频文件标识和视频显示信息的放音收号请求发送给媒体服务器,媒体服务器将视频显示信息叠加到视频文件中,向用户终端播放,则用户可以在看到视频的同时看到相关显示信息。
在上述流程基础上,还可以增加系统功能,使用户终端可以对视频的播放进行控制。应用服务器还可以设置用户终端使用的媒体播放控制操作与用户终端中按键标号的对应关系称为视频播放按键控制信息;例如按键“5”表示暂停,按键“6”表示快进,按键“7”表示快退,按键“8”表示继续,按键“#”表示停止;并在步骤209处,将同时携带视频文件标识和视频播放按键控制信息的放音收号请求发送给媒体服务器。
如图3所示,媒体服务器在进行视频播放控制过程中的处理过程为:
步骤301,向用户终端播放视频文件;用户在观看视频播放的过程中,进行按键操作;
步骤302,媒体服务器进行收号流程;
步骤303,媒体服务器判断出按键操作的按键标号指示的按键是视频播放按键控制信息中定义的按键时,对视频播放作相应的操作;
步骤304;媒体服务器判断出按键操作的按键标号指示的按键是视频播放按键控制信息定义之外的按键时,向应用服务器上报此收号结果,由应用服务器再进行下一步的处理。
上述方法中,对视频播放进行控制的过程不需业务服务器的干预,只需媒体服务器即可完成直接对终端的视频播放控制,且不需向应用服务器上报收号信息。
根据上述描述,媒体服务器除支持叠加视频显示信息的视频播放外,还支持直接对用户终端的按键操作进行视频播放的控制;当然媒体服务器也可以同时支持这两个流程。
应用服务器将携带视频文件的标识,以及视频显示信息和/或视频播放控制信息的放音收号请求消息编辑为与原放音收号控制信令相统一的可扩展标记语言(Extensible Markup Language,简称XML)码流向媒体服务器发送;媒体服务器收到后,从可扩展标记语言格式的放音收号请求消息中解析出视频显示信息和/或视频播放控制信息,进行视频显示信息的叠加和/或根据用户终端的按键操作对视频文件的播放作相应控制。具体将放音收号请求消息编辑为可扩展标记语言码流的方法是本领域技术人员常用的编程技术,此处不再赘述。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。