CN110971577B - 一种会话管理方法及装置 - Google Patents
一种会话管理方法及装置 Download PDFInfo
- Publication number
- CN110971577B CN110971577B CN201811159317.4A CN201811159317A CN110971577B CN 110971577 B CN110971577 B CN 110971577B CN 201811159317 A CN201811159317 A CN 201811159317A CN 110971577 B CN110971577 B CN 110971577B
- Authority
- CN
- China
- Prior art keywords
- terminal
- media processing
- video
- user
- session management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/10—Architectures or entities
- H04L65/1016—IP multimedia subsystem [IMS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1101—Session protocols
- H04L65/1104—Session initiation protocol [SIP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请实施例提供一种会话管理方法及装置,用以在考虑用户的媒体处理能力的情况下对终端间的视频通话进行管理,提升用户体验。方法包括:会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力,其中,第一终端为主叫终端,第二终端为被叫终端;会话管理设备根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源,该媒体处理资源用于对不同类型的信息进行转换;会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种会话管理方法及装置。
背景技术
在当前的移动通信系统中,视频通话通常基于会话发起协议(sessioninitiation protocol,SIP)。SIP是由因特网工程任务组(internet engineering taskforce,IETF)制定的多媒体通信协议,可用于创建、修改和释放一个或多个参与者的会话。SIP广泛应用于互联网协议多媒体子系统(internet protocolmultimedia subsystem,IMS)中,为用户提供语音、视频、数据等多媒体业务。
两个终端在基于SIP进行视频通话时,由网络侧对音视频进行转发或简单处理(例如在多方视频通话时进行混屏处理)。但是,网络侧的处理过程中并未考虑终端用户的媒体处理能力。比如,在终端用户为聋哑人的情况下,聋哑人仅能提供视频画面而无法发出声音,即聋哑人具备视频处理能力,但并不具备音频处理能力。聋哑人通过终端进行视频通话时,如果仅向对端提供视频画面,难以达到理想的通信效果。再比如,终端用户在图书馆、会议室等环境安静的地点时可能不适于接听或发出语音,若此时进行视频通话时对端的声音仍传输至本端,会对安静的环境产生噪音干扰,影响用户体验。
综上,现有的会话管理方案未考虑终端用户的媒体处理能力,在视频通话过程中影响用户体验。
发明内容
本申请实施例提供一种会话管理方法及装置,用以在考虑终端用户的媒体处理能力的情况下对终端间的视频通话进行管理,提升用户体验。
第一方面,本申请实施例提供一种会话管理方法,该方法包括如下步骤:会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力,其中,第一终端为主叫终端,第二终端为被叫终端;会话管理设备根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源,媒体处理资源用于在第一终端和第二终端进行视频通话时对不同类型的信息进行转换;会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
通过上述方法,在第一终端与第二终端的会话建立过程中,会话管理设备根据第一终端的用户的媒体处理能力和第二终端的媒体处理能力为此次视频通话分配媒体处理资源。与现有技术中针对具有不同媒体处理能力的用户采用统一的会话建立和管理流程相比,采用第一方面提供的方法,在后续的视频通话过程中,会话管理设备可通过分配的媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,以实现会话管理,即通过该媒体处理资源进行不同类型信息的转换,以弥补终端用户在媒体处理能力方面的缺陷,使得第一终端的用户和第二终端的用户在视频通话过程中能更加准确地明白对方所要表达的想法,从而提升用户体验。
在一种可能的设计中,在会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力之前,会话管理设备还可接收第一终端发送的第一呼叫请求,该第一呼叫请求用于指示第一终端请求与第二终端进行视频通话。
在一种可能的设计中,在会话管理设备根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源之后,会话管理设备还可向第二终端发送第二呼叫请求,该第二呼叫请求用于指示第一终端请求与第二终端进行视频通话,第二呼叫请求携带第二终端的用户的媒体处理能力;会话管理设备接收第二终端发送的第一呼叫响应,第一呼叫响应携带第二终端的用户的媒体处理能力;会话管理设备向第一终端发送第二呼叫响应,第二呼叫响应携带第一终端的用户的媒体处理能力。
采用上述方案,会话管理设备通过第二呼叫请求将第二终端的用户的媒体处理能力发送给第二终端,第二终端可根据用户的媒体处理能力开通或关闭相应的处理通道;会话管理设备通过第二呼叫响应将第一终端的用户的媒体处理能力发送给第一终端,第一终端可根据用户的媒体处理能力开通或关闭相应的处理通道。而在现有技术提供视频通话的会话建立过程中,无论主叫终端的用户和被叫终端的用户的媒体处理能力如何,会话管理设备与终端间进行信令交互时,交互信令中携带的媒体处理能力均为音视频处理能力。因此,采用上述方案,可以在会话建立过程中考虑用户的不同的媒体处理能力,并针对具备不同媒体处理能力的用户开启或关闭相应处理通道,从而避免开启过多的处理通道造成资源浪费的问题。
在第一方面提供的方法中,具体地,根据第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力的不同,会话管理设备可以为此次视频通话分配不同的媒体处理资源,例如分配视频处理资源和/或语音转文本资源;然后,实时通信系统可通过不同的媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。下面介绍实时通信系统进行信息类型转换的三种实现方式。
方式一
在方式一中,在第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力均为视频处理能力的情况下,媒体处理资源包括视频处理资源,视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息。
那么,在方式一中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体可通过如下方式实现:会话管理设备接收第一终端传输的第一视频画面;会话管理设备通过视频处理资源将第一视频画面指示的信息转换为第一文本信息;会话管理设备将第一文本信息叠加在第一视频画面上传输至第二终端。
对于仅具备视频处理能力的第一终端的用户,该用户可通过第一视频画面表达一些信息,例如聋哑人可通过哑语表达自己的想法。那么,在方式一中,会话管理设备可通过视频处理资源对聋哑人传输的第一视频画面进行分析,即对聋哑人的手语进行解析,将该第一视频画面表达的信息转换为第一文本信息并传输给对端(第二终端)。
同样地,会话管理设备在接收到第二终端传输的视频画面后,也可采用与上述方式类似的方式进行会话管理。即,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,还可以通过如下方式实现:会话管理设备接收第二终端传输的第二视频画面;会话管理设备通过视频处理资源将第二视频画面指示的信息转换为第二文本信息;会话管理设备将第二文本信息叠加在第二视频画面上传输至第一终端。
方式二
在方式二中,在第一终端的用户的媒体处理能力为视频处理能力、第二终端的用户的媒体处理能力为音频处理能力和视频处理能力的情况下,实时媒体处理资源包括视频处理资源和语音转文本资源,视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,语音转文本资源用于将语音信息转换为文本信息。
在方式二中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体可通过如下方式实现:会话管理设备接收第一终端传输的第三视频画面;会话管理设备通过视频处理资源将第三视频画面指示的信息转换为第一语音信息;会话管理设备将第三视频画面和第一语音信息同步传输至第二终端。
对于仅具备视频处理能力的第一终端的用户,该用户可通过第三视频画面表达一些信息,例如聋哑人可通过哑语表达自己的想法。那么,在方式二中,会话管理设备可通过视频处理资源对聋哑人传输的第三视频画面进行分析,即对聋哑人的手语进行解析,将第三视频画面转换成第一语音信息并传输给对端(第二终端),使得第二终端的用户可以通过第一语音信息确定第一终端的用户所要表达的信息。
此外,在方式二中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体还可通过如下方式实现:会话管理设备接收第二终端传输的第四视频画面和第二语音信息;会话管理设备通过语音转文本资源将第二语音信息转换为第三文本信息;会话管理设备将第三文本信息叠加在第四视频画面上传输至第一终端。
对于具备音频处理能力的第二终端的用户,该用户可通过第二语音信息表达自己的想法,但是第一终端的用户并不具备音频处理能力,因而第一终端的用户无法通过获知第二终端的用户通过第二语音信息表达的想法。那么,在方式二中,会话管理设备可通过语音转文本资源将第二语音信息转换为第三文本信息并传输给对端(第一终端),使得第一终端的用户可以通过第三文本信息确定第二终端的用户所要表达的信息。
方式三
在方式三中,在第一终端的用户的媒体处理能力为音频处理能力和视频处理能力、第二终端的用户的媒体处理能力为视频处理能力的情况下,实时媒体处理资源包括视频处理资源和语音转文本资源,视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,语音转文本资源用于将语音信息转换为文本信息。
在方式三中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体可通过如下方式实现:会话管理设备接收第一终端传输的第五视频画面和第三语音信息;会话管理设备通过语音转文本资源将第三语音信息转换为第四文本信息;会话管理设备将第四文本信息叠加在第五视频画面上传输至第二终端。
对于具备音频处理能力的第一终端的用户,该用户可通过第三语音信息表达自己的想法,但是第二终端的用户并不具备音频处理能力,因而第二终端的用户无法通过获知第一终端的用户通过第三语音信息表达的想法。那么,在方式三中,会话管理设备可通过语音转文本资源将第三语音信息转换为第四文本信息并传输给对端(第二终端),使得第二终端的用户可以通过第四文本信息确定第一终端的用户所要表达的信息。
此外,在方式三中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体还可通过如下方式实现:会话管理设备接收第二终端传输的第六视频画面;会话管理设备通过视频处理资源将第六视频画面指示的信息转换为第四语音信息;会话管理设备将第六视频画面和第四语音信息同步传输至第一终端。
对于仅具备视频处理能力的第二终端的用户,该用户可通过第六视频画面表达一些信息,例如聋哑人可通过哑语表达自己的想法。那么,在方式三中,会话管理设备可通过视频处理资源对聋哑人传输的第六视频画面进行分析,即对聋哑人的手语进行解析,将第六视频画面转换成第四语音信息并传输给对端(第一终端),使得第一终端的用户可以通过第四语音信息确定第二终端的用户所要表达的信息。
在一种可能的设计中,会话管理设备可通过如下方式获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力:会话管理设备接收第一终端发送的第一注册请求,第一注册请求包含第一终端的用户的媒体处理能力;并,会话管理设备接收第二终端发送的第二注册请求,第二注册请求包含第二终端的用户的媒体处理能力。
采用上述方案,可以通过终端的注册流程实现会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力。
在一种可能的设计中,会话管理设备还可通过如下方式更改第一终端的用户的媒体处理能力和/或第二终端的用户的媒体处理能力:在会话管理设备接收第二终端发送的第二注册请求之后,会话管理设备接收第一终端发送的第一更改请求,第一更改请求用于更改第一终端的用户的媒体处理能力;和/或,会话管理设备接收第二终端发送的第二更改请求,第二更改请求用于更改第二终端的用户的媒体处理能力。
采用上述方案,可以更改终端用户的媒体处理能力,从而使得第一方面的会话管理方案适用于不同的应用场景、满足用户的使用需求。
第二方面,本申请实施例还提供了一种会话管理装置。该装置具有实现上述第一方面的方法实例中行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,所述装置的结构中包括接收单元、处理单元和发送单元,这些单元可以执行上述第一方面方法示例中的相应功能,具体参见方法示例中的详细描述,此处不做赘述。
第三方面,本申请实施例还提供了一种会话管理装置。所述会话管理装置的结构中包括处理器和存储器,所述处理器被配置为支持所述会话管理装置执行上述第一方面方法中相应的功能。所述存储器与所述处理器耦合,其保存所述会话管理装置必要的程序指令和数据。所述会话管理装置的结构中还可包括通信接口,用于与其他设备进行通信。
第四方面,本申请实施例还提供了一种实时通信系统,该实时通信系统包括第一终端、第二终端以及会话管理设备;其中,该会话管理设备可以视为第二方面或第三方面提供的会话管理装置。
第一终端,用于向会话管理设备发送第一呼叫请求,第一呼叫请求用于指示第一终端请求与第二终端进行视频通话。
会话管理设备,用于获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力。
会话管理设备,还用于根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源,媒体处理资源用于在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
会话管理设备,还用于向第二终端发送第二呼叫请求,第二呼叫请求用于指示第一终端请求与第二终端进行视频通话,第二呼叫请求携带第二终端的用户的媒体处理能力。
第二终端,用于向会话管理设备发送第一呼叫响应,第一呼叫响应携带第二终端的用户的媒体处理能力。
会话管理设备,还用于向第一终端发送第二呼叫响应,第二呼叫响应携带第一终端的用户的媒体处理能力。
会话管理设备,还用于通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
第五方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面及其各种可能的设计中所述的方法。
第六方面,本申请实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面及其各种可能的设计中所述的方法。
第七方面,本申请实施例还提供一种计算机芯片,所述芯片与存储器相连,所述芯片用于读取并执行所述存储器中存储的软件程序,执行上述第一方面及其各种可能的设计中所述的方法。
另外,第二方面至第七方面中任一种可能设计方式所带来的技术效果可参见第一方面中不同设计方式所带来的技术效果,此处不再赘述。
附图说明
图1为本申请实施例提供的一种会话建立过程的流程示意图;
图2为本申请实施例提供的一种IMS的工作模式的示意图;
图3为本申请实施例提供的另一种IMS的工作模式的示意图;
图4为本申请实施例提供的一种实时通信系统的结构示意图;
图5为本申请实施例提供的第一种会话管理方法的流程示意图;
图6为本申请实施例提供的另一种会话建立过程的流程示意图;
图7为本申请实施例提供的第二种会话管理方法的流程示意图;
图8为本申请实施例提供的第三种会话管理方法的流程示意图;
图9为本申请实施例提供的第一种会话管理的流程示意图;
图10为本申请实施例提供的第四种会话管理方法的流程示意图;
图11为本申请实施例提供的第二种会话管理的流程示意图;
图12为本申请实施例提供的第五种会话管理方法的流程示意图;
图13为本申请实施例提供的一种会话管理装置的结构示意图;
图14为本申请实施例提供的另一种会话管理装置的结构示意图;
图15为本申请实施例提供的一种实时通信系统的结构示意图。
具体实施方式
当前通信系统中,终端间的视频通话是基于IMS网络进行的,终端间的呼叫建立过程基于SIP。具体地,视频通话的呼叫建立流程可以如图1所示。
1、终端A的用户在发起视频通话时,终端A向IMS网络发送会话邀请(INVITE)消息,以邀请终端B进行视频通话。
2、IMS网络在接收到INVITE消息后,向终端B转发INVITE消息。
3、终端B在接收到INVITE消息后,向IMS网络发送18X消息。
其中,18X消息可以是180消息,也可以是183消息。180消息即振铃消息,表示终端B接收到INVITE消息后已振铃,并等待终端B的用户进行响应;183消息即会话进度(sessionprogress)消息,用于提示会话建立的进度。
4、IMS网络将18X消息转发给终端A。
需要说明的是,在步骤3和步骤4中,终端B通过IMS网络向终端A发送18X消息的过程可能涉及一个或多个18X消息的发送。例如,终端B可先通过IMS网络向终端A发送183消息,然后再通过IMS网络向终端A发送180消息;或者,终端B可直接通过IMS网络向终端发送180消息。
5、终端B的用户接听后,终端B向IMS网络发送200OK消息,以指示终端B已接听此次视频通话。
6、IMS网络将200OK消息转发给终端A。
7、终端A向IMS网络发送ACK消息,以指示终端A以接收到200OK消息。
8、IMS网络将200OK消息转发给终端B。
在图1所示的呼叫建立流程中,终端A可以称为主叫终端,终端B可以称为被叫终端。主叫终端为发起视频通话的终端;被叫终端为响应视频通话的终端。
通过对图1所示的呼叫建立流程的介绍不难看出,该呼叫建立流程并未考虑终端A的用户或终端B的用户的媒体处理能力。也就是说,对于具有不同的媒体处理能力的用户,其呼叫建立流程均为图1所示的流程。
终端A与终端B基于图1所示的呼叫建立流程建立会话后,IMS网络对视频的处理过程可以有两种。
第一种,如图2所示,针对两个终端的视频通话,IMS网络工作在视频转发模式,即IMS网络用于将终端A发送的音视频转发给终端B,以及将终端B发送的音视频转发给终端A。
第二种,如图3所示,针对两个以上终端的视频通话,IMS网络工作在视频处理模式,即IMS网络用于对多个终端发来的视频进行混屏处理。
通过对图2和图3所示的IMS网络视频处理过程可以看出,IMS网络的视频处理流程也并未考虑终端用户的媒体处理能力。也就是说,对于具有不同的媒体处理能力的用户,IMS网络针对该用户的视频处理过程均采用图2或图3所示的方式。
综上,现有技术中,终端在基于SIP进行视频通话时,网络侧在进行会话建立和视频处理时,均未考虑到终端用户的媒体处理能力,因而难以达到理想的通信效果。
比如,在终端用户为聋哑人的情况下,聋哑人仅能提供视频画面而无法发出声音,即聋哑人具备视频处理能力,但并不具备音频处理能力。网络侧在呼叫建立过程中按照图1所示流程,网络侧无法感知终端用户的媒体处理能力,也就无法申请相应的媒体处理资源对聋哑人的视频通话过程进行相应处理;网络侧在进行视频处理时,采用图2或图3示出的方式,仅能对视频进行转发或混屏等简单处理,也无法根据聋哑人的媒体处理能力对视频通话进行处理。因此,聋哑人通过终端进行视频通话时,仅能向对端提供视频画面而无法提供声音、文字等信息,难以达到理想的通信效果。
再比如,终端的用户在图书馆、会议室等环境安静的地点进行视频通话时,用户可能不方便接听或发出语音,即终端用户此时具备视频处理能力、不具备音频处理能力。网络侧在呼叫建立过程中按照图1所示流程,网络侧无法感知终端用户的媒体处理能力,也就无法申请相应的媒体处理资源针对视频通话过程进行相应处理;网络侧在进行视频处理时,采用图2或图3示出的方式,仅能对视频进行转发或混屏等简单处理,也就无法根据用户此时的媒体处理能力对视频通话进行特殊的处理。因此,用户进行视频通话时对端的声音仍传输至本端,会对图书馆、会议室等场景产生噪音干扰,影响用户体验。
基于上述问题,本申请实施例提供一种会话管理方法及装置,用以在考虑终端用户的媒体处理能力的情况下对终端间的视频通话进行管理,提升用户体验。其中,方法和装置是基于同一发明构思的,由于方法及装置解决问题的原理相似,因此装置与方法的实施可以相互参见,重复之处不再赘述。
需要说明的是,本申请中所涉及的多个,是指两个或两个以上。另外,需要理解的是,在本申请的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
下面,对本申请实施例的应用场景加以介绍。
本申请实施例可应用于图4所示的实时通信系统中。该实时通信系统中包含第一终端、第二终端以及会话管理设备。
其中,第一终端为主叫终端,第二终端为被叫终端。第一终端发起视频通话请求,以请求与第二终端进行视频通话;第一终端和第二终端通过会话管理设备进行信令交互实现会话的建立,该信令交互过程可基于SIP信令完成;在会话建立过程中,会话管理设备还为此次会话分配媒体处理资源,用于在第一终端和第二终端进行视频通话时对不同类型的信息进行转换;会话建立完成后,第一终端和第二终端可通过会话管理设备进行视频通话,会话管理设备在视频通话过程中通过会话建立过程中分配的媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
具体地,会话管理设备也可以视为实时通信网络或IMS网络。具体地,会话管理设备中可以包含信令系统和媒体处理系统。信令系统用于建立会话以及在会话建立过程中为此次会话分配媒体处理资源;媒体处理系统用于根据建立会话过程中分配的媒体处理资源对第一终端与第二终端间的视频通话在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。实际实现时,信令系统和媒体处理系统可以是两个独立的物理功能实体,也可以是部署在同一物理功能实体中的两个逻辑功能实体。
示例性地,信令系统可以是SIP服务器,媒体处理系统的处理过程可以采用用户数据报协议(user datagram protocol,UDP)协议承载实时传输协议(real-time transportprotocol,RTP)。终端可以是手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端、增强现实(augmented reality,AR)终端、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请实施例提供的会话管理方案进行具体说明。
参见图5,为本申请实施例提供的会话管理方法的流程示意图。该方法包括如下步骤:
S501:会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力。
其中,第一终端为主叫终端,第二终端为被叫终端。第一终端的用户的媒体处理能力可以是音频处理能力、视频处理能力,也可以是音频处理能力和视频处理能力;同样地,第二终端的用户的媒体处理能力可以是音频处理能力、视频处理能力,也可以是音频处理能力和视频处理能力。音频处理能力和视频处理能力这两种媒体处理能力也可以统称为音视频处理能力。具有音视频处理能力的终端的用户在视频通话过程中可以处理视频信息也可以处理音频信息。
示例性地,由于聋哑人无法发出声音,因而其媒体处理能力仅为视频处理能力;处于便于进行视频通话的场景下的普通人,其媒体处理能力为音视频处理能力;处于图书馆、会议室等环境安静的地点的普通人,由于不便发出声音,因而其媒体处理能力为视频处理能力。
具体地,会话管理设备可以通过第一终端的注册请求获取第一终端的用户的媒体处理能力;同样地,会话管理设备也可以通过第二终端的注册请求获取第二终端的用户的媒体处理能力。即,会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力,具体可通过如下方式实现:会话管理设备可接收第一终端发送的第一注册请求,该第一注册请求包含第一终端的用户的媒体处理能力;并且,会话管理设备可接收第二终端发送的第二注册请求,该第二注册请求包含第二终端的用户的媒体处理能力。
其中,终端的注册请求可以用于终端在会话管理设备中进行注册,终端在会话管理设备中注册后,会话管理设备中保存有终端的相关信息(例如终端标识、终端的媒体处理能力、终端的常用地址等),只有在会话管理设备中注册成功的终端才可发起视频通话。
示例性地,若第一终端的用户为聋哑人,第一终端可以向会话管理设备发送第一注册请求以请求在会话管理设备中开户,在开户时用户可选择自己为聋哑人,会话管理设备在接收到第一注册请求后即可确定第一终端的用户的媒体处理能力为视频处理能力。
示例性地,若第二终端的用户为普通人,第二终端可以向会话管理设备发送第二注册请求以请求在会话管理设备中开户,在开户时用户可选择自己为普通人,会话管理设备在接收到第二注册请求后即可确定第二终端的用户的媒体处理能力为音视频处理能力。
此外,在某些场景下,用户可能需要更改自身的媒体处理能力。比如,具有音视频处理能力的用户由方便接听语音的地点移动到不方便接听语音的地点后,用户需要将音视频处理能力更改为视频处理能力;再比如,终端原来由聋哑人使用,现在该终端转由普通人使用,用户需要将终端的视频处理能力更改为音视频处理能力。在这种情况下,用户可通过如下方式更改自身的媒体处理能力:会话管理设备接收第一终端发送的第一更改请求,第一更改请求可以携带更改后的媒体处理能力,用于更改第一终端的用户的媒体处理能力;和/或,会话管理设备接收第二终端发送的第二更改请求,第二更改请求可以携带更改后的媒体处理能力,用于更改第二终端的用户的媒体处理能力。
也就是说,第一终端可通过向会话管理设备发送第一更改请求以更改第一终端的用户的媒体处理能力;同样地,第二终端也可通过向会话管理设备发送第二更改请求以更改第二终端的用户的媒体处理能力。
通过上述方案,可以更改终端用户的媒体处理能力,从而使得本申请实施例提供的会话管理方案适用于不同的应用场景、满足用户的使用需求。
S502:会话管理设备根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源。
其中,该媒体处理资源用于在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
在一种可能的示例中,该媒体处理资源可以包括视频处理资源,视频处理资源可用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息。例如,若第一终端和第二终端的用户均为聋哑人,视频处理资源可用于分析第一终端传输的视频画面中用户的手语动作,将第一终端的用户用手语表达的信息转换为文本信息提供给第二终端的用户,以协助第二终端的用户更好地理解第一终端的用户所传递的信息;或者,若第一终端的用户为聋哑人、第二终端的用户为普通人,视频处理资源可用于分析第一终端传输的视频画面中用户的手语动作,将第一终端的用户用手语表达的信息转换为语音信息或者文本信息提供给第二终端的用户,以便第二终端的用户可以准确获悉第一终端的用户所传递的信息。
在一种可能的示例中,该媒体处理资源还可以包括语音转文本资源,语音转文本资源用于将语音信息转换为文本信息。例如,若第一终端的用户为普通人、第二终端的用户为聋哑人,语音转文本资源可用于将第一终端传输的语音信息转换为文本信息后呈现给第二终端的用户,以便第二终端的用户可以准确获悉第一终端的用户所传递的信息。
S503:会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
具体地,该会话管理过程可以通过图4所示的会话管理设备中的媒体处理系统执行。
针对第一终端与第二终端的会话建立流程,在会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力之前,会话管理设备可接收第一终端发送的第一呼叫请求,第一呼叫请求用于指示第一终端请求与第二终端进行视频通话。
此外,在会话管理设备根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源之后,会话管理设备还可向第二终端发送第二呼叫请求,该第二呼叫请求用于指示第一终端请求与第二终端进行视频通话,该第二呼叫请求携带第二终端的用户的媒体处理能力;会话管理设备接收第二终端发送的第一呼叫响应,该第一呼叫响应携带第二终端的用户的媒体处理能力;会话管理设备向第一终端发送第二呼叫响应,该第二呼叫响应携带第一终端的用户的媒体处理能力。
示例性地,第一终端与第二终端的会话建立流程可以如图6所示。
S601:会话管理设备接收第一终端发送的第一呼叫请求。
其中,第一呼叫请求用于指示第一终端请求与第二终端进行视频通话。示例性地,第一呼叫请求可以视为图1所示方法的步骤1中发送的会话邀请(INVITE)消息。
此外,在S601中,第一终端在发送第一呼叫请求时,第一呼叫请求中还可携带音频处理能力和视频处理能力。也就是说,无论第一终端的用户在此次视频通话中是否具有音频处理能力和视频处理能力这两种媒体处理能力,第一终端在发送第一呼叫请求时均可携带这两种媒体处理能力。这样做主要是出于两点考虑:一、现有技术中,主叫终端在发起视频通话时,即在发起视频通话的请求中携带音频处理能力和视频处理能力,本申请实施例中在第一呼叫请求中携带两种媒体处理能力,可以使得第一终端发起视频通话的过程与现有技术中的发起视频通话的过程相同,因而采用本申请实施例提供的方案不必对现有的终端进行改造或升级;二、第一终端在发送第一呼叫请求时,无法获知第二终端的用户的媒体处理能力,因而第一终端可以在第一呼叫请求中携带两种媒体处理能力,后续的视频通话过程中需要使用第一终端和第二终端的哪一种或几种媒体处理能力可以由会话管理设备去判断。
S602:会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力。
其中,S602中会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力的具体方式可参见S501中的相关描述,此处不再赘述。
S603:会话管理设备根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源。
其中,该媒体处理资源用于在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
其中,S603中会话管理设备根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源的具体方式可参见S502中的相关描述,此处不再赘述。
S604:会话管理设备向第二终端发送第二呼叫请求。
其中,第二呼叫请求用于指示第一终端请求与第二终端建立会话,第二呼叫请求携带第二终端的用户的媒体处理能力。示例性地,第二呼叫请求可以视为图1所示方法的步骤2中发送的会话邀请(INVITE)消息。
会话管理设备发送给第二终端的第二呼叫请求中携带第二终端的用户的媒体处理能力,其含义是:会话管理设备可以获取到所有已注册终端(包括第二终端)的开户信息,进而确定第二终端的用户的媒体处理能力,并通过第二呼叫请求发送给第二终端。第二终端可通过第一呼叫响应确认会话管理设备中记录的自身的媒体处理能力是否准确。
需要注意的是,在现有技术提供的会话建立过程中,无论主叫终端的用户和被叫终端的用户的媒体处理能力如何,会话管理设备与终端间进行交互时,交互信令中携带的媒体处理能力均为音视频处理能力。也就是说,在会话建立过程中,会话管理设备并未根据终端用户的媒体处理能力进行相应处理,而是采用统一的、标准的会话建立流程。而本申请实施例中,会话管理设备可以根据终端用户的媒体处理能力建立会话,从而根据终端用户的媒体处理能力开启或关闭相应的处理通道,并在后续视频通话过程中通过会话管理设备的会话管理过程弥补终端用户在媒体处理能力方面的缺陷,从而提升用户体验。
例如,在第二终端的用户的媒体处理能力为视频处理能力的情况下,可关闭第二终端的音频处理通道;然后,在后续视频通话过程中,会话管理设备可通过视频处理资源分析第二终端传输的视频画面中用户的手语动作,将第二终端的用户用手语表达的信息转换为文本信息或语音信息提供给第一终端的用户。
S605:会话管理设备接收第二终端发送的第一呼叫响应。
其中,第一呼叫响应携带第二终端的用户的媒体处理能力。示例性地,第一呼叫响应可以视为图1所示方法的步骤3中发送的18X消息。
第二终端向会话管理设备发送第一呼叫响应,可表示第二终端接收到第二呼叫请求后已振铃,并等待第二终端的用户进行响应;也可以用于提示第一终端与第二终端间会话建立的进度。
此外,第一呼叫响应中携带第二终端的用户的媒体处理能力,可以表示第二终端已通过第一呼叫响应确认会话管理设备中记录的自身的媒体处理能力是正确的。具体地,第二终端在接收到第二呼叫请求之后,确定第二呼叫请求中携带的媒体处理能力与第二终端的用户的媒体处理能力一致,则可根据第二呼叫请求中携带的媒体处理能力开通或关闭相应的处理通道。例如,在第二终端的用户的媒体处理能力为音视频处理能力的情况下,第二终端可开通视频处理通道和音频处理通道。然后,第二终端向会话管理设备发送第一呼叫响应。
S606:会话管理设备向第一终端发送第二呼叫响应。
其中,第二呼叫响应携带第一终端的用户的媒体处理能力。示例性地,第二呼叫响应可以视为图1所示方法的步骤4中发送的18X消息。
第一终端在接收到第二呼叫响应后,即可获知第二终端已振铃或者获知会话建立进度。
此外,第二呼叫响应中携带第一终端的用户的媒体处理能力,其含义是:会话管理设备在确定第一终端的用户的媒体处理能力后,将第一终端的用户的媒体处理能力发送给第一终端,第一终端即可据此开通或关闭相应的处理通道。例如,在第二响应消息中携带的第一终端的用户的媒体处理能力为视频处理能力的情况下,第一终端可开通视频处理通道、关闭音频处理通道。
当然,在S606中会话管理设备向第一终端发送第二呼叫响应之后,也可以按照现有技术中给出的流程,由第二终端通过会话管理设备向第一终端发送200OK消息;第一终端在接收到200OK消息之后,即可确定与第二终端的会话已建立,并通过会话管理设备向第二终端发送ACK消息。
需要说明的是,本申请实施例中,会话管理设备在接收到第一呼叫请求之后,先确定第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力,然后通过第二呼叫请求将第二终端的用户的媒体处理能力发送给第二终端、通过第二呼叫响应将第一终端的用户的媒体处理能力发送给第一终端,以便第一终端和第二终端开启或关闭相应的处理通道。实际应用中,会话管理设备也可通过会话建立过程中的其他信令将第一终端的用户的媒体处理能力发送给第一终端、将第二终端的用户的媒体处理能力发送给第二终端,只要第一终端和第二终端可在会话建立过程中根据自身用户的媒体处理能力开启或关闭相应的处理通道即可。例如,会话管理设备可通过200OK消息将第一终端的用户的媒体处理能力发送给第一终端,会话管理设备可通过ACK消息将第二终端的用户的媒体处理能力发送给第二终端。
图6所示的会话建立流程可以通过图4所示的会话管理设备中的信令系统执行。后续,在会话建立完成后,如S503中所述,会话管理设备还可通过会话建立流程中确定的媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。具体地,S503中的信息类型转换过程可以通过图4所示的会话管理设备中的媒体处理系统执行。
具体地,根据第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力的不同,会话管理设备可以为此次视频通话分配不同的媒体处理资源,例如分配视频处理资源和/或语音转文本资源;然后,会话管理设备可通过不同的媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。下面介绍会话管理设备进行信息类型转换的三种实现方式。
方式一
在方式一中,在第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力均为视频处理能力的情况下,媒体处理资源包括视频处理资源,视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息。
示例性地,在第一终端的用户和第二终端的用户均为聋哑人的情况下,第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力均为视频处理能力。
示例性地,在第一终端的用户为聋哑人,且第二终端的用户在图书馆、会议室等环境安静的地点的情况下,第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力均为视频处理能力。
在方式一中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体可通过如下方式实现:会话管理设备接收第一终端传输的第一视频画面;会话管理设备通过视频处理资源将第一视频画面指示的信息转换为第一文本信息;会话管理设备将第一文本信息叠加在第一视频画面上传输至第二终端。
由于第一终端的用户和第二终端的用户均不具备音频处理能力,因而在视频通话过程中,会话管理设备无需进行音频方面的处理和信息类型转换。对于仅具备视频处理能力的第一终端的用户,该用户可通过第一视频画面表达一些信息,例如聋哑人可通过哑语表达自己的想法。那么,在本申请实施例中,会话管理设备可通过视频处理资源对聋哑人传输的第一视频画面进行分析,即对聋哑人的手语进行解析,将该第一视频画面表达的信息转换为第一文本信息并传输给对端(第二终端)。
同样地,会话管理设备在接收到第二终端传输的视频画面后,也可采用与上述方式类似的方式进行会话管理。即,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,还可以通过如下方式实现:会话管理设备接收第二终端传输的第二视频画面;会话管理设备通过视频处理资源将第二视频画面指示的信息转换为第二文本信息;会话管理设备将第二文本信息叠加在第二视频画面上传输至第一终端。
方式二
在方式二中,在第一终端的用户的媒体处理能力为视频处理能力、第二终端的用户的媒体处理能力为音频处理能力和视频处理能力的情况下,实时媒体处理资源包括视频处理资源和语音转文本资源,视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,语音转文本资源用于将语音信息转换为文本信息。
示例性地,在第一终端的用户为聋哑人去,且第二终端的用户为普通人的情况下,第一终端的用户的媒体处理能力为视频处理能力、第二终端的用户的媒体处理能力为音频处理能力和视频处理能力。
示例性地,在第一终端的用户处于图书馆、会议室等环境安静的地点,且第二终端的用户为普通人的情况下,第一终端的用户的媒体处理能力为视频处理能力、第二终端的用户的媒体处理能力为音频处理能力和视频处理能力。
在方式二中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体可通过如下方式实现:会话管理设备接收第一终端传输的第三视频画面;会话管理设备通过视频处理资源将第三视频画面指示的信息转换为第一语音信息;会话管理设备将第三视频画面和第一语音信息同步传输至第二终端。
由于第一终端的用户不具备音频处理能力,而第二终端的用户具备音频处理能力,因而在视频通话过程中,会话管理设备需要进行音频方面的处理和信息类型转换。对于仅具备视频处理能力的第一终端的用户,该用户可通过第三视频画面表达一些信息,例如聋哑人可通过哑语表达自己的想法。那么,在本申请实施例中,会话管理设备可通过视频处理资源对聋哑人传输的第三视频画面进行分析,即对聋哑人的手语进行解析,将第三视频画面转换成第一语音信息并传输给对端(第二终端),使得第二终端的用户可以通过第一语音信息确定第一终端的用户所要表达的信息。
此外,在方式二中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体可通过如下方式实现:会话管理设备接收第二终端传输的第四视频画面和第二语音信息;会话管理设备通过语音转文本资源将第二语音信息转换为第三文本信息;会话管理设备将第三文本信息叠加在第四视频画面上传输至第一终端。
由于第一终端的用户不具备音频处理能力,而第二终端的用户具备音频处理能力,因而在视频通话过程中,会话管理设备需要进行音频方面的处理和信息类型转换。对于具备音频处理能力的第二终端的用户,该用户可通过第二语音信息表达自己的想法,但是第一终端的用户并不具备音频处理能力,因而第一终端的用户无法通过获知第二终端的用户通过第二语音信息表达的想法。那么,在本申请实施例中,会话管理设备可通过语音转文本资源将第二语音信息转换为第三文本信息并传输给对端(第一终端),使得第一终端的用户可以通过第三文本信息确定第二终端的用户所要表达的信息。
方式三
在方式三中,在第一终端的用户的媒体处理能力为音频处理能力和视频处理能力、第二终端的用户的媒体处理能力为视频处理能力的情况下,实时媒体处理资源包括视频处理资源和语音转文本资源,视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,语音转文本资源用于将语音信息转换为文本信息。
示例性地,在第一终端的用户为普通人、第二终端的用户为聋哑人的情况下,第一终端的用户的媒体处理能力为音频处理能力和视频处理能力、第二终端的用户的媒体处理能力为视频处理能力。
示例性地,在第一终端的用户为普通人,且第二终端的用户处于图书馆、会议室等环境安静的地点的情况下,第一终端的用户的媒体处理能力为音频处理能力和视频处理能力、第二终端的用户的媒体处理能力为视频处理能力。
在方式三中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体可通过如下方式实现:会话管理设备接收第一终端传输的第五视频画面和第三语音信息;会话管理设备通过语音转文本资源将第三语音信息转换为第四文本信息;会话管理设备将第四文本信息叠加在第五视频画面上传输至第二终端。
由于第二终端的用户不具备音频处理能力,而第一终端的用户具备音频处理能力,因而在视频通话过程中,会话管理设备需要进行音频方面的处理和信息类型转换。对于具备音频处理能力的第一终端的用户,该用户可通过第三语音信息表达自己的想法,但是第二终端的用户并不具备音频处理能力,因而第二终端的用户无法通过获知第一终端的用户通过第三语音信息表达的想法。那么,在本申请实施例中,会话管理设备可通过语音转文本资源将第三语音信息转换为第四文本信息并传输给对端(第二终端),使得第二终端的用户可以通过第四文本信息确定第一终端的用户所要表达的信息。
此外,在方式三中,会话管理设备通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,具体可通过如下方式实现:会话管理设备接收第二终端传输的第六视频画面;会话管理设备通过视频处理资源将第六视频画面指示的信息转换为第四语音信息;会话管理设备将第六视频画面和第四语音信息同步传输至第一终端。
由于第二终端的用户不具备音频处理能力,而第一终端的用户具备音频处理能力,因而在视频通话过程中,会话管理设备需要进行音频方面的处理和信息类型转换。对于仅具备视频处理能力的第二终端的用户,该用户可通过第六视频画面表达一些信息,例如聋哑人可通过哑语表达自己的想法。那么,在本申请实施例中,会话管理设备可通过视频处理资源对聋哑人传输的第六视频画面进行分析,即对聋哑人的手语进行解析,将第六视频画面转换成第四语音信息并传输给对端(第一终端),使得第一终端的用户可以通过第四语音信息确定第二终端的用户所要表达的信息。
需要说明的是,以上列举的实时通信系统进行信息类型转换的三种实现方式仅为一种示例。实际实现时,在第一终端与第二终端的视频通话过程中,会话管理设备还可采用其他方式对不同类型的信息进行转换,从而使得进行视频通话的两个用户便于理解对方所要表达的想法。
本申请实施例中,在第一终端与第二终端的会话建立过程中,会话管理设备根据两个终端的用户的媒体处理能力为此次视频通话分配媒体处理资源。然后,会话管理设备通过第二呼叫请求将第二终端的用户的媒体处理能力发送给第二终端,第二终端可根据用户的媒体处理能力开通或关闭相应的处理通道;会话管理设备通过第二呼叫响应将第一终端的用户的媒体处理能力发送给第一终端,第一终端可根据用户的媒体处理能力开通或关闭相应的处理通道。而在现有技术提供视频通话的会话建立过程中,无论主叫终端的用户和被叫终端的用户的媒体处理能力如何,会话管理设备与终端间进行信令交互时,交互信令中携带的媒体处理能力均为音视频处理能力。因此,采用本申请实施提供的方案,可以在会话建立过程中考虑用户的不同的媒体处理能力,并针对具备不同媒体处理能力的用户开启或关闭相应处理通道,从而避免开启过多的处理通道造成资源浪费的问题。此外,采用本申请实施例可根据两个终端的用户的媒体处理能力为此次视频通话分配媒体处理资源,在后续的视频通话过程中,会话管理设备可通过分配的媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换,以实现会话管理,即通过该媒体处理资源进行不同类型信息的转换,以弥补终端用户在媒体处理能力方面的缺陷,从而提升用户体验。
需要说明的是,如前所述,本申请实施例中,第一终端的用户可以通过第一注册请求将自身的媒体处理能力上报给会话管理设备,第二终端的用户也可以通过第二注册请求将自身的媒体处理能力上报给会话管理设备。在完成注册后,若用户需要更改自身的媒体处理能力,则可以通过向会话管理设备单独发送更改请求实现:会话管理设备可接收第一终端发送的第一更改请求,该第一更改请求用于更改第一终端的用户的媒体处理能力;和/或,会话管理设备可接收第二终端发送的第二更改请求,该第二更改请求用于更改第二终端的用户的媒体处理能力。
上述对用户的媒体处理能力的更改方式仅为一种示例。实际实现时,终端也可以在会话建立过程中对用户的媒体处理能力进行更改。例如,第二终端可通过第一呼叫响应对第二终端的用户的媒体处理能力进行更改,第一终端也可通过第一呼叫请求对第一终端的用户的媒体处理能力进行更改,本申请实施例中对终端修改媒体处理能力的时机和方式不做具体限定。
当然,若在会话管理设备已经为此次视频通话分配媒体处理资源的情况下,会话管理设备又接收到更改媒体处理能力的指示,那么会话管理设备可以根据更改后的媒体处理能力再次为此次视频通话分配媒体处理资源。
示例性地,假设第一终端的用户的媒体处理能力为视频处理能力,第二终端的用户的媒体处理能力为音视频处理能力;在会话管理设备为此次视频通话分配视频处理资源和语音转文本资源后,第二终端的用户通过第一呼叫响应更改用户的媒体处理能力,第一呼叫响应指示第二终端的用户的媒体处理能力为视频处理能力。会话管理设备在接收到第一呼叫响应后,可重新分配媒体处理资源。由于此时第一终端的用户和第二终端的用户均只具备视频处理能力,因而重新分配后媒体处理资源可仅包含视频处理资源。
示例性地,假设第一终端的用户的媒体处理能力为视频处理能力,第二终端的用户的媒体处理能力也为视频处理能力;在会话管理设备为此次视频通话分配视频处理资源后,第二终端的用户通过第一呼叫响应更改用户的媒体处理能力,第一呼叫响应指示第二终端的用户的媒体处理能力为音视频处理能力。会话管理设备在接收到第一呼叫响应后,可重新分配媒体处理资源。由于此时第二终端的用户具备音视频处理能力,因而重新分配后媒体处理资源可包含视频处理资源和语音转文本资源。
基于以上更改媒体处理能力的示例,本申请实施例还提供一种会话管理方法。参见图7,该方法包括如下步骤。
S701:会话管理设备接收第一终端发送的第一呼叫请求。
其中,第一呼叫请求用于指示第一终端请求与第二终端进行视频通话。
S702:会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力。
其中,第一终端的用户的媒体处理能力为视频处理能力;第二终端的用户的媒体处理能力为视频处理能力。
S703:会话管理设备根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源。
其中,该媒体处理资源用于在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。具体地,该媒体处理资源可包括视频处理资源。
S704:会话管理设备向第二终端发送第二呼叫请求。
其中,第二呼叫请求用于指示第一终端请求与第二终端建立会话,第二呼叫请求携带第二终端的用户的媒体处理能力,即视频处理能力。
S705:会话管理设备接收第二终端发送的第一呼叫响应。
其中,第一呼叫响应携带更改后的、第二终端的用户的媒体处理能力,包括音视频处理能力。
S706:会话管理设备根据更改后的、第二终端的用户的媒体处理能力,重新分配媒体处理资源。
由于在第二终端更改媒体处理能力前,第一终端的用户和第二终端的用户均不具备音频处理能力,因而会话管理设备无需为此次视频通话分配语音转文本资源。而第二终端更改媒体处理能力后,第二终端具备音频处理能力,此时可为此次视频通话分配语音转文本资源,以便将第二终端传输的语音信息转换为本文信息呈现给第一终端的用户。因此,重新分配后,媒体处理资源包括视频处理资源和语音转文本资源。
S707:会话管理设备向第一终端发送第二呼叫响应。
其中,第二呼叫响应携带第一终端的用户的媒体处理能力。
在图7所示方法中,第二终端可在会话建立过程中更改自身的媒体处理能力。会话管理设备可根据更改后的媒体处理能力重新为第一终端和第二终端的视频通话分配媒体处理资源,以便在第二终端更改媒体处理能力后,进行视频通话的两个用户间更便于理解对方所要表达的想法。
当然,图7所示方法仅为一种示例,实际实现时,终端更改媒体处理能力的情况可能有多种,例如第二终端可以将用户的媒体处理能力由音视频处理能力更改为视频处理能力、第一终端可以将用户的媒体处理能力由音视频处理能力更改为视频处理能力、第一终端可以将用户的媒体处理能力由视频处理能力更改为音视频处理能力等等。会话管理设备也可以根据媒体处理能力不同的更改情况重新为此次视频通话分配合适的媒体处理资源,分配媒体处理资源的原则可参照前面的描述,此处不再赘述。
基于同一发明构思,本申请实施例还提供三种会话管理方法。这三种会话管理方法均可视为图5所示方法的具体示例。下面分三个示例对这三种会话管理方法进行介绍。
示例一:主叫和被叫均为聋哑人
在示例一中,终端A和终端B在开户时选择自己为聋哑人,会话管理设备记录此信息。其中,终端A为主叫终端,可视为图5所示方法中第一终端的一个具体示例;终端B为被叫终端,可视为图5所示方法中第二终端的一个具体示例。
具体地,参见图8,该会话管理方法包括如下步骤:
1、终端A通过INVITE消息发起呼叫,携带会话描述协议(session descriptionprotocol,SDP)音视频能力。
2、会话管理设备中的信令系统收到呼叫请求后,根据终端的用户开户信息,查询到主叫(终端A)的用户和被叫(终端B)的用户都是聋哑人,则信令系统向会话管理设备中的媒体处理系统申请视频处理资源。
3、媒体处理系统返回视频处理资源。
4、信令系统转发呼叫请求到终端B,携带SDP视频能力,不携带音频能力。
5、终端B返回18X消息,并携带自己的SDP视频能力。
6、信令系统转发18X消息,携带SDP视频能力。
7、终端B返回200OK消息。
8、信令系统转发200OK消息。
9、终端A返回ACK消息。
10、信令系统转发ACK消息。
在采用图8所示的信令协商过程建立终端A与终端B的会话后,会话管理设备中的媒体处理系统还可通过视频处理资源在终端A与终端B进行视频通话时对不同类型的信息进行转换,具体处理过程可以是:通过在媒体处理系统中建立起图9所示的媒体处理模型,媒体处理系统通过分析终端的视频画面(哑语动作),生成文本,并进行字幕叠加处理。
示例二:主叫为聋哑人,被叫为普通人
在示例二中,终端A在开户时选择自己为聋哑人,会话管理设备记录此信息。其中,终端A为主叫终端,可视为图5所示方法中第一终端的一个具体示例;终端B为被叫终端,可视为图5所示方法中第二终端的一个具体示例。
具体地,参见图10,该会话管理方法包括如下步骤:
1、终端A通过INVITE消息发起呼叫,携带会话描述协议(session descriptionprotocol,SDP)音视频能力。
2、会话管理设备中的信令系统收到呼叫请求后,根据终端的用户开户信息,查询到主叫终端(终端A)的用户是聋哑人、被叫终端(终端B)的用户是普通人,则信令系统向会话管理设备中的媒体处理系统申请视频处理资源。
3、媒体处理系统返回视频处理资源。
4、信令系统向会话管理设备中的媒体处理系统申请语音转文本资源。
5、媒体处理系统返回语音转文本资源。
6、信令系统转发呼叫请求到终端B,携带SDP音视频能力。
7、终端B返回18X消息,并携带自己的SDP音视频能力。
8、信令系统转发18X消息,携带SDP视频能力。
9、终端B返回200OK消息。
10、信令系统转发200OK消息。
11、终端A返回ACK消息。
12、信令系统转发ACK消息。
在采用图10所示的信令协商过程建立终端A与终端B的会话后,会话管理设备中的媒体处理系统还可通过视频处理资源和语音转文本资源在终端A与终端B进行视频通话时对不同类型的信息进行转换,具体处理过程可以是:通过在媒体处理系统中建立起图11所示的媒体处理模型,媒体处理系统可通过分析终端A的视频画面(哑语动作),生成语音,并视频画面和语音一起传输给终端B;媒体处理系统也可将终端B的语音信息转换为文本信息,并进行字幕叠加处理后传输给终端A。
示例三:主叫为普通人,被叫为聋哑人
在示例二中,终端A在开户时选择自己为聋哑人,会话管理设备记录此信息。其中,终端B为主叫终端,可视为图5所示方法中第一终端的一个具体示例;终端A为被叫终端,可视为图5所示方法中第二终端的一个具体示例。
具体地,参见图12,该会话管理方法包括如下步骤:
1、终端B通过INVITE消息发起呼叫,携带会话描述协议(session descriptionprotocol,SDP)音视频能力。
2、会话管理设备中的信令系统收到呼叫请求后,根据终端的用户开户信息,查询到主叫终端(终端B)的用户是普通人、被叫终端(终端A)的用户是聋哑人,则信令系统向会话管理设备中的媒体处理系统申请视频处理资源。
3、媒体处理系统返回视频处理资源。
4、信令系统向会话管理设备中的媒体处理系统申请语音转文本资源。
5、媒体处理系统返回语音转文本资源。
6、信令系统转发呼叫请求到终端A,携带SDP视频能力。
7、终端A返回18X消息,并携带自己的SDP视频能力。
8、信令系统转发18X消息,携带SDP音视频能力。
9、终端A返回200OK消息。
10、信令系统转发200OK消息。
11、终端B返回ACK消息。
12、信令系统转发ACK消息。
在采用图12所示的信令协商过程建立终端A与终端B的会话后,会话管理设备中的媒体处理系统还可通过视频处理资源和语音转文本资源在终端A与终端B进行视频通话时对不同类型的信息进行转换,具体处理过程与示例二中相同,此处不再赘述。
需要说明的是,以上三种会话管理方法仅为图5所示方法的一个具体示例,其中未详细描述的实现方式及其技术效果可参见图5所示方法中的相关描述,此处不再赘述。
基于同一发明构思,本申请实施例还提供一种会话管理装置,该装置可用于执行图5所示的会话管理方法中会话管理设备所执行的操作。参见图13,该会话管理装置1300(以下简称“装置1300”)包括接收单元1301和处理单元1302。
接收单元1301,用于获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力,其中,第一终端为主叫终端,第二终端为被叫终端。
处理单元1302,还用于根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源,媒体处理资源用于在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
处理单元1302,还用于通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
可选地,接收单元1301还用于:在获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力之前,接收第一终端发送的第一呼叫请求,该第一呼叫请求用于指示第一终端请求与第二终端进行视频通话。
可选地,装置1300还包括:发送单元,用于向第二终端发送第二呼叫请求,第二呼叫请求用于指示第一终端请求与第二终端进行视频通话,第二呼叫请求携带第二终端的用户的媒体处理能力。接收单元1301,还用于接收第二终端发送的第一呼叫响应,第一呼叫响应携带第二终端的用户的媒体处理能力。发送单元,还用于向第一终端发送第二呼叫响应,第二呼叫响应携带第一终端的用户的媒体处理能力。此外,在装置1300中,处理单元1302还可用于:在发送单元向第一终端发送第二呼叫响应之后,通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
具体地,处理单元1302在进行信息类型转换时可以采用不同的方式。
方式一
在方式一中,在第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力均为视频处理能力的情况下,媒体处理资源包括视频处理资源,视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息。
那么,针对第一终端,处理单元1302在通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:通过接收单元1301接收第一终端传输的第一视频画面;通过视频处理资源将第一视频画面指示的信息转换为第一文本信息;通过发送单元将第一文本信息叠加在第一视频画面上传输至第二终端。
那么,针对第二终端,处理单元1302在通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:通过接收单元1301接收第二终端传输的第二视频画面;通过视频处理资源将第二视频画面指示的信息转换为第二文本信息;通过发送单元第二文本信息叠加在第二视频画面上传输至第一终端。
方式二
在方式二中,在第一终端的用户的媒体处理能力为视频处理能力、第二终端的用户的媒体处理能力为音频处理能力和视频处理能力的情况下,实时媒体处理资源包括视频处理资源和语音转文本资源,视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,语音转文本资源用于将语音信息转换为文本信息。
那么,针对第一终端,处理单元1302在通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:通过接收单元1301接收第一终端传输的第三视频画面;通过视频处理资源将第三视频画面指示的信息转换为第一语音信息;通过发送单元将第三视频画面和第一语音信息同步传输至第二终端。
那么,针对第二终端,处理单元1302在通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:通过接收单元1301接收第二终端传输的第四视频画面和第二语音信息;通过语音转文本资源将第二语音信息转换为第三文本信息;通过发送单元将第三文本信息叠加在第四视频画面上传输至第一终端。
方式三
在方式三中,在第一终端的用户的媒体处理能力为音频处理能力和视频处理能力、第二终端的用户的媒体处理能力为视频处理能力的情况下;实时媒体处理资源包括视频处理资源和语音转文本资源,视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,语音转文本资源用于将语音信息转换为文本信息。
那么,针对第一终端,处理单元1302在通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:通过接收单元1301接收第一终端传输的第五视频画面和第三语音信息;通过语音转文本资源将第三语音信息转换为第四文本信息;通过发送单元将第四文本信息叠加在第五视频画面上传输至第二终端。
那么,针对第二终端,处理单元1302在通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:通过接收单元1301接收第二终端传输的第六视频画面;通过视频处理资源将第六视频画面指示的信息转换为第四语音信息;通过发送单元将第六视频画面和第四语音信息同步传输至第一终端。
为了获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力,在一种可能的设计中,接收单元1301在获取第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力时,具体用于:接收第一终端发送的第一注册请求,第一注册请求包含第一终端的用户的媒体处理能力;并,接收第二终端发送的第二注册请求,第二注册请求包含第二终端的用户的媒体处理能力。
为了更改第一终端的用户的媒体处理能力和/或第二终端的用户的媒体处理能力,在一种可能的设计中,接收单元1301还用于:在接收第二终端发送的第二注册请求之后,接收第一终端发送的第一更改请求,第一更改请求用于更改第一终端的用户的媒体处理能力;和/或,接收第二终端发送的第二更改请求,第二更改请求用于更改第二终端的用户的媒体处理能力。
本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本申请各个实施例中的各功能单元可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备(可以是个人计算机,手机,或者网络设备等)或处理器(processor)执行本申请各个实施例该方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-onlymemory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,如前所述,会话管理设备中可以包含信令系统和媒体处理系统。实际实现时,信令系统和媒体处理系统可以是两个独立的物理功能实体,也可以是部署在同一物理功能实体中的两个逻辑功能实体。在图13所示的会话管理装置1300中,可以认为信令系统和媒体处理系统为部署在同一物理功能实体中的两个逻辑功能实体。若信令系统和媒体处理系统为两个独立的物理功能实体,则信令系统和媒体处理系统中的每个系统均包含接收单元、处理单元和发送单元。信令系统通过接收单元、处理单元和发送单元的配合实现第一终端与第二终端的会话建立流程;媒体处理系统通过接收单元、处理单元和发送单元的配合实现会话管理流程。
在本申请实施例中,所述会话管理装置可以采用集成的方式划分各个功能模块的形式来呈现。这里的“模块”可以指特定ASIC,电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。
在一个简单的实施例中,本领域的技术人员可以想到所述会话管理装置可采用图14所示的形式。
如图14所示的会话管理装置1400,包括至少一个处理器1401、存储器1402,可选的,还可以包括通信接口1403。
存储器1402可以是易失性存储器,例如随机存取存储器;存储器也可以是非易失性存储器,例如只读存储器,快闪存储器,硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器1402是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1402可以是上述存储器的组合。
本申请实施例中不限定上述处理器1401以及存储器1402之间的具体连接介质。本申请实施例在图中以存储器1402和处理器1401之间通过总线1404连接,总线1404在图中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。该总线1404可以分为地址总线、数据总线、控制总线等。为便于表示,图14中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
处理器1401可以具有数据收发功能,能够与其他设备进行通信,在如图14所示的装置中,也可以设置独立的数据收发模块,例如通信接口1403,用于收发数据;处理器1401在与其他设备进行通信时,可以通过通信接口1403进行数据传输。
当所述会话管理装置采用图14所示的形式时,图14中的处理器1401可以通过调用存储器1402中存储的计算机执行指令,使得所述会话管理装置可以执行上述任一方法实施例中的所述会话管理设备执行的方法。
具体的,图13中的发送单元、接收单元和处理单元的功能/实现过程均可以通过图14中的处理器1401调用存储器1402中存储的计算机执行指令来实现。或者,图13中的处理单元的功能/实现过程可以通过图14中的处理器1401调用存储器1402中存储的计算机执行指令来实现,图13中的发送单元和接收单元的功能/实现过程可以通过图14中的通信接口1403来实现。
需要说明的是,如前所述,会话管理设备中可以包含信令系统和媒体处理系统。实际实现时,信令系统和媒体处理系统可以是两个独立的物理功能实体,也可以是部署在同一物理功能实体中的两个逻辑功能实体。在图14所示的会话管理装置1400中,可以认为信令系统和媒体处理系统为部署在同一物理功能实体中的两个逻辑功能实体。若信令系统和媒体处理系统为两个独立的物理功能实体,则信令系统和媒体处理系统中的每个系统均包含处理器、存储器和通信接口。信令系统通过处理器、存储器和通信接口的配合实现第一终端与第二终端的会话建立流程;媒体处理系统通过处理器、存储器和通信接口的配合实现会话管理流程。
基于与方法实施例同一发明构思,本申请实施例还提供了一种实时通信系统,用于执行上述实施例的方法,相关特征可参见上述方法实施例,此处不再赘述。
本申请实施例提供的一种实时通信系统的结构示意图可参见图15,具体的,实时通信系统包括第一终端、第二终端以及会话管理设备;其中,该会话管理设备可以视为图13所示的会话管理装置1300或者图14所示的会话管理装置1400。
第一终端,用于向会话管理设备发送第一呼叫请求,第一呼叫请求用于指示第一终端请求与第二终端进行视频通话;
会话管理设备,用于获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力;
会话管理设备,还用于根据第一终端的用户的媒体处理能力和第二终端的用户的媒体处理能力分配媒体处理资源,媒体处理资源用于在第一终端和第二终端进行视频通话时对不同类型的信息进行转换;
会话管理设备,还用于向第二终端发送第二呼叫请求,第二呼叫请求用于指示第一终端请求与第二终端进行视频通话,第二呼叫请求携带第二终端的用户的媒体处理能力;
第二终端,用于向会话管理设备发送第一呼叫响应,第一呼叫响应携带第二终端的用户的媒体处理能力;
会话管理设备,还用于向第一终端发送第二呼叫响应,第二呼叫响应携带第一终端的用户的媒体处理能力。
会话管理设备,还用于通过媒体处理资源在第一终端和第二终端进行视频通话时对不同类型的信息进行转换。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
Claims (26)
1.一种会话管理方法,其特征在于,包括:
会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力,其中,所述第一终端为主叫终端,所述第二终端为被叫终端;
所述会话管理设备根据所述第一终端的用户的媒体处理能力和所述第二终端的用户的媒体处理能力分配媒体处理资源,所述媒体处理资源用于在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换;
所述会话管理设备通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换;
其中,在所述会话管理设备根据所述第一终端的用户的媒体处理能力和所述第二终端的用户的媒体处理能力分配媒体处理资源之后,还包括:
所述会话管理设备向所述第二终端发送第二呼叫请求,所述第二呼叫请求用于指示所述第一终端请求与所述第二终端进行视频通话,所述第二呼叫请求携带所述第二终端的用户的媒体处理能力;
所述会话管理设备接收所述第二终端发送的第一呼叫响应,所述第一呼叫响应携带所述第二终端的用户的媒体处理能力;
所述会话管理设备向所述第一终端发送第二呼叫响应,所述第二呼叫响应携带所述第一终端的用户的媒体处理能力。
2.如权利要求1所述的方法,其特征在于,在会话管理设备获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力之前,还包括:
所述会话管理设备接收所述第一终端发送的第一呼叫请求,所述第一呼叫请求用于指示所述第一终端请求与所述第二终端进行视频通话。
3.如权利要求1所述的方法,其特征在于,在所述第一终端的用户的媒体处理能力以及所述第二终端的用户的媒体处理能力均为视频处理能力的情况下,所述媒体处理资源包括视频处理资源,所述视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息。
4.如权利要求3所述的方法,其特征在于,所述会话管理设备通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换,包括:
所述会话管理设备接收所述第一终端传输的第一视频画面;
所述会话管理设备通过所述视频处理资源将所述第一视频画面指示的信息转换为第一文本信息;
所述会话管理设备将所述第一文本信息叠加在所述第一视频画面上传输至所述第二终端。
5.如权利要求3或4所述的方法,其特征在于,所述会话管理设备通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换,包括:
所述会话管理设备接收所述第二终端传输的第二视频画面;
所述会话管理设备通过所述视频处理资源将所述第二视频画面指示的信息转换为第二文本信息;
所述会话管理设备将所述第二文本信息叠加在所述第二视频画面上传输至所述第一终端。
6.如权利要求1所述的方法,其特征在于,在所述第一终端的用户的媒体处理能力为视频处理能力、所述第二终端的用户的媒体处理能力为音频处理能力和视频处理能力的情况下,实时媒体处理资源包括视频处理资源和语音转文本资源,所述视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,所述语音转文本资源用于将语音信息转换为文本信息。
7.如权利要求6所述的方法,其特征在于,所述会话管理设备通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换,包括:
所述会话管理设备接收所述第一终端传输的第三视频画面;
所述会话管理设备通过所述视频处理资源将所述第三视频画面指示的信息转换为第一语音信息;
所述会话管理设备将所述第三视频画面和所述第一语音信息同步传输至所述第二终端。
8.如权利要求6或7所述的方法,其特征在于,所述会话管理设备通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换,包括:
所述会话管理设备接收所述第二终端传输的第四视频画面和第二语音信息;
所述会话管理设备通过所述语音转文本资源将所述第二语音信息转换为第三文本信息;
所述会话管理设备将所述第三文本信息叠加在所述第四视频画面上传输至所述第一终端。
9.如权利要求1所述的方法,其特征在于,在所述第一终端的用户的媒体处理能力为音频处理能力和视频处理能力、所述第二终端的用户的媒体处理能力为视频处理能力的情况下,实时媒体处理资源包括视频处理资源和语音转文本资源,所述视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,所述语音转文本资源用于将语音信息转换为文本信息。
10.如权利要求9所述的方法,其特征在于,所述会话管理设备通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换,包括:
所述会话管理设备接收所述第一终端传输的第五视频画面和第三语音信息;
所述会话管理设备通过所述语音转文本资源将所述第三语音信息转换为第四文本信息;
所述会话管理设备将所述第四文本信息叠加在所述第五视频画面上传输至所述第二终端。
11.如权利要求9或10所述的方法,其特征在于,所述会话管理设备通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换,包括:
所述会话管理设备接收所述第二终端传输的第六视频画面;
所述会话管理设备通过所述视频处理资源将所述第六视频画面指示的信息转换为第四语音信息;
所述会话管理设备将所述第六视频画面和所述第四语音信息同步传输至所述第一终端。
12.如权利要求1-4、6、7、9、10任一项所述的方法,其特征在于,所述会话管理设备在获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力时,包括:
所述会话管理设备接收所述第一终端发送的第一注册请求,所述第一注册请求包含所述第一终端的用户的媒体处理能力;并,
所述会话管理设备接收所述第二终端发送的第二注册请求,所述第二注册请求包含所述第二终端的用户的媒体处理能力。
13.如权利要求12所述的方法,其特征在于,在所述会话管理设备接收所述第二终端发送的第二注册请求之后,还包括:
所述会话管理设备接收所述第一终端发送的第一更改请求,所述第一更改请求用于更改所述第一终端的用户的媒体处理能力;和/或
所述会话管理设备接收所述第二终端发送的第二更改请求,所述第二更改请求用于更改所述第二终端的用户的媒体处理能力。
14.一种会话管理装置,其特征在于,包括:
接收单元,用于获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力,其中,所述第一终端为主叫终端,所述第二终端为被叫终端;
处理单元,用于根据所述第一终端的用户的媒体处理能力和所述第二终端的用户的媒体处理能力分配媒体处理资源,所述媒体处理资源用于在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换;
所述处理单元,还用于通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换;
发送单元,用于向所述第二终端发送第二呼叫请求,所述第二呼叫请求用于指示所述第一终端请求与所述第二终端进行视频通话,所述第二呼叫请求携带所述第二终端的用户的媒体处理能力;
所述接收单元,还用于:接收所述第二终端发送的第一呼叫响应,所述第一呼叫响应携带所述第二终端的用户的媒体处理能力;
所述发送单元,还用于:向所述第一终端发送第二呼叫响应,所述第二呼叫响应携带所述第一终端的用户的媒体处理能力。
15.如权利要求14所述的装置,其特征在于,所述接收单元还用于:
在获取所述第一终端的用户的媒体处理能力以及所述第二终端的用户的媒体处理能力之前,接收所述第一终端发送的第一呼叫请求,所述第一呼叫请求用于指示所述第一终端请求与所述第二终端进行视频通话。
16.如权利要求14所述的装置,其特征在于,在所述第一终端的用户的媒体处理能力以及所述第二终端的用户的媒体处理能力均为视频处理能力的情况下,所述媒体处理资源包括视频处理资源,所述视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息。
17.如权利要求16所述的装置,其特征在于,所述处理单元在通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:
通过所述接收单元接收所述第一终端传输的第一视频画面;
通过所述视频处理资源将所述第一视频画面指示的信息转换为第一文本信息;
通过发送单元将所述第一文本信息叠加在所述第一视频画面上传输至所述第二终端。
18.如权利要求16或17所述的装置,其特征在于,所述处理单元在通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:
通过所述接收单元接收所述第二终端传输的第二视频画面;
通过所述视频处理资源将所述第二视频画面指示的信息转换为第二文本信息;
通过发送单元所述第二文本信息叠加在所述第二视频画面上传输至所述第一终端。
19.如权利要求14所述的装置,其特征在于,在所述第一终端的用户的媒体处理能力为视频处理能力、所述第二终端的用户的媒体处理能力为音频处理能力和视频处理能力的情况下,实时媒体处理资源包括视频处理资源和语音转文本资源,所述视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,所述语音转文本资源用于将语音信息转换为文本信息。
20.如权利要求19所述的装置,其特征在于,所述处理单元在通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:
通过所述接收单元接收所述第一终端传输的第三视频画面;
通过所述视频处理资源将所述第三视频画面指示的信息转换为第一语音信息;
通过发送单元将所述第三视频画面和所述第一语音信息同步传输至所述第二终端。
21.如权利要求19或20所述的装置,其特征在于,所述处理单元在通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:
通过所述接收单元接收所述第二终端传输的第四视频画面和第二语音信息;
通过所述语音转文本资源将所述第二语音信息转换为第三文本信息;
通过发送单元将所述第三文本信息叠加在所述第四视频画面上传输至所述第一终端。
22.如权利要求14所述的装置,其特征在于,在所述第一终端的用户的媒体处理能力为音频处理能力和视频处理能力、所述第二终端的用户的媒体处理能力为视频处理能力的情况下,实时媒体处理资源包括视频处理资源和语音转文本资源,所述视频处理资源用于分析视频画面并将视频画面所指示的信息转换为文本信息或语音信息,所述语音转文本资源用于将语音信息转换为文本信息。
23.如权利要求22所述的装置,其特征在于,所述处理单元在通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:
通过所述接收单元接收所述第一终端传输的第五视频画面和第三语音信息;
通过所述语音转文本资源将所述第三语音信息转换为第四文本信息;
通过发送单元将所述第四文本信息叠加在所述第五视频画面上传输至所述第二终端。
24.如权利要求22或23所述的装置,其特征在于,所述处理单元在通过所述媒体处理资源在所述第一终端和所述第二终端进行视频通话时对不同类型的信息进行转换时,具体用于:
通过所述接收单元接收所述第二终端传输的第六视频画面;
通过所述视频处理资源将所述第六视频画面指示的信息转换为第四语音信息;
通过发送单元将所述第六视频画面和所述第四语音信息同步传输至所述第一终端。
25.如权利要求14~17、19、20、22、23任一项所述的装置,其特征在于,所述接收单元在获取第一终端的用户的媒体处理能力以及第二终端的用户的媒体处理能力时,具体用于:
接收所述第一终端发送的第一注册请求,所述第一注册请求包含所述第一终端的用户的媒体处理能力;并,接收所述第二终端发送的第二注册请求,所述第二注册请求包含所述第二终端的用户的媒体处理能力。
26.如权利要求25所述的装置,其特征在于,所述接收单元还用于:
在接收所述第二终端发送的第二注册请求之后,接收所述第一终端发送的第一更改请求,所述第一更改请求用于更改所述第一终端的用户的媒体处理能力;和/或,接收所述第二终端发送的第二更改请求,所述第二更改请求用于更改所述第二终端的用户的媒体处理能力。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811159317.4A CN110971577B (zh) | 2018-09-30 | 2018-09-30 | 一种会话管理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811159317.4A CN110971577B (zh) | 2018-09-30 | 2018-09-30 | 一种会话管理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110971577A CN110971577A (zh) | 2020-04-07 |
CN110971577B true CN110971577B (zh) | 2021-05-04 |
Family
ID=70028864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811159317.4A Active CN110971577B (zh) | 2018-09-30 | 2018-09-30 | 一种会话管理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110971577B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1882116A (zh) * | 2005-08-11 | 2006-12-20 | 华为技术有限公司 | 内置视频网关的移动交换中心及实现多媒体互通的方法 |
CN101123824A (zh) * | 2007-09-12 | 2008-02-13 | 华为技术有限公司 | 多媒体通信方法及网元设备 |
CN101888377A (zh) * | 2010-05-26 | 2010-11-17 | 中兴通讯股份有限公司 | 一种通信方法及媒体服务器及通信系统 |
CN107707726A (zh) * | 2016-08-09 | 2018-02-16 | 深圳市鹏华联宇科技通讯有限公司 | 一种用于正常人与聋哑人通讯的终端和通话方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100527343B1 (ko) * | 2003-06-28 | 2005-11-09 | 한국전자통신연구원 | 호 설정을 위한 미디어게이트웨이 제어장치 및 방법 |
-
2018
- 2018-09-30 CN CN201811159317.4A patent/CN110971577B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1882116A (zh) * | 2005-08-11 | 2006-12-20 | 华为技术有限公司 | 内置视频网关的移动交换中心及实现多媒体互通的方法 |
CN101123824A (zh) * | 2007-09-12 | 2008-02-13 | 华为技术有限公司 | 多媒体通信方法及网元设备 |
CN101888377A (zh) * | 2010-05-26 | 2010-11-17 | 中兴通讯股份有限公司 | 一种通信方法及媒体服务器及通信系统 |
CN107707726A (zh) * | 2016-08-09 | 2018-02-16 | 深圳市鹏华联宇科技通讯有限公司 | 一种用于正常人与聋哑人通讯的终端和通话方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110971577A (zh) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9338285B2 (en) | Methods and systems for multi-factor authentication in secure media-based conferencing | |
AU2016202485B2 (en) | Methods and systems for secure media-based conferencing | |
US8195147B2 (en) | Method of enabling a combinational service and communication network implementing the service | |
US20150295974A1 (en) | Method, User Equipment and Application Server for Adding Media Stream of Multimedia Session | |
JP2012085317A (ja) | マルチメディア通話サービスを遂行するためのマルチメディアセッション開設及び管理のためのサーバ | |
CN101420315B (zh) | 多媒体会议的控制方法及装置 | |
CN104869106A (zh) | 录音方法、语音交换设备、录音服务器及录音系统 | |
CN108574689B (zh) | 一种可视通话的方法和装置 | |
EP3192252A1 (en) | Methods and systems for multi-factor authentication in secure media-based conferencing | |
CN111835674A (zh) | 通信方法、装置、第一网元及通信系统 | |
US10742929B2 (en) | Communication system | |
CN110971577B (zh) | 一种会话管理方法及装置 | |
WO2022262729A1 (zh) | 建立数据通道的方法、装置、设备、控制系统及存储介质 | |
US9559888B2 (en) | VoIP client control via in-band video signalling | |
CN108809912B (zh) | 终端核心功能应用方法及装置 | |
CN112019791A (zh) | 基于教育考试的多方音视频通话方法及系统 | |
CN111865874A (zh) | 数据传输方法及装置 | |
CN110839008B (zh) | 专网下ims在媒体协商后向用户放音的方法及ims | |
EP4395304A1 (en) | Communication method, device and system | |
WO2024051562A1 (zh) | 通信方法、装置和系统 | |
US20240283833A1 (en) | Desktop sharing method, apparatus, and system | |
WO2017000781A1 (zh) | 一种视频通信方法及装置 | |
EP4395306A1 (en) | Communication method, apparatus, and system | |
CN107786836A (zh) | 一种音视频会话业务实现方法和装置 | |
CN118740992A (zh) | 一种信息传递方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |