CN117099363A - 用于在移动通信系统中提供对话服务的方法和装置 - Google Patents
用于在移动通信系统中提供对话服务的方法和装置 Download PDFInfo
- Publication number
- CN117099363A CN117099363A CN202280025982.2A CN202280025982A CN117099363A CN 117099363 A CN117099363 A CN 117099363A CN 202280025982 A CN202280025982 A CN 202280025982A CN 117099363 A CN117099363 A CN 117099363A
- Authority
- CN
- China
- Prior art keywords
- media
- message
- video
- volumetric video
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000010295 mobile communication Methods 0.000 title claims abstract description 15
- 230000006835 compression Effects 0.000 claims abstract description 47
- 238000007906 compression Methods 0.000 claims abstract description 47
- 238000004891 communication Methods 0.000 claims abstract description 21
- 230000004044 response Effects 0.000 claims abstract description 13
- 238000012546 transfer Methods 0.000 claims description 3
- 230000003190 augmentative effect Effects 0.000 description 24
- 239000000872 buffer Substances 0.000 description 18
- 230000005540 biological transmission Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 101150071716 PCSK1 gene Proteins 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000000245 forearm Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1101—Session protocols
- H04L65/1104—Session initiation protocol [SIP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1069—Session establishment or de-establishment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/61—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
- H04L65/612—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for unicast
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/65—Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/70—Media network packetisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/756—Media network packet handling adapting media to device capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/762—Media network packet handling at the source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/643—Communication protocols
- H04N21/6437—Real-time Transport Protocol [RTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
- H04N7/157—Conference systems defining a virtual conference space and using avatars or agents
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
公开了一种用于在移动通信系统中发送和接收用于体积视频通信服务的体积视频的方法和装置。该方法包括:确定用于体积视频的体积视频压缩方案;将包括用于所确定的体积视频压缩方案的第一媒体参数的第一消息发送到对等设备;响应于第一消息的发送,从对等设备接收包括第二媒体参数的第二消息;以及将根据第二媒体参数压缩的体积视频发送到对等设备。
Description
技术领域
各种实施例涉及用于使用媒体内容提供视频对话服务的方法和装置。
背景技术
增强现实(AR)是将三维(或二维)虚拟图像叠加在真实图像或背景上并在单个图像中显示的技术。混合真实对象和虚拟对象的增强现实技术使得用户能够查看真实环境中的对象,从而提供更好的真实感和附加信息。
随着通信技术的发展,对提供各种设备和扩展现实(XR)服务的需求正在增加。“XR”可以包括虚拟现实(VR)、增强现实(AR)或混合现实(MR)。XR服务可以包括例如根据基于位置的服务应用和三维(3D)XR对象的XR呼叫、XR流式传输等。XR呼叫指其中产生和再现3D对象的功能被添加到一般视频和语音呼叫的服务,并且XR流式传输指其中XR设备从服务器接收XR内容并再现该内容的服务。
发明内容
技术问题
“AR”是这样的技术,其中通过输出实际上不存在的对象来补充现实世界,以与由用户的眼睛观看的现实世界重叠。可以以体积视频(volumetric video)的形式产生、存储和传输对象。体积视频可以利用比一般视频更高的计算能力和更多的网络资源。处理AR视频的设备可以具有各种形状因子,诸如轻型眼镜类型、护目镜类型和配备有单独的外部计算设备的设备,并且可以取决于形状因子而具有不同的计算能力。
本公开的实施例可以提供用于具有不同计算能力的设备之间的AR通信服务的方法和装置。
本公开的实施例可以提供用于根据网络情况动态地控制AR视频的质量的方法和装置。
本公开的实施例可以提供用于在使用增强现实(AR)内容提供对话服务时与对等设备协商用于3D视频的压缩技术的方法和装置。
本公开的实施例可以提供用于在压缩3D视频时配置2D转换压缩方案和用于场景改变的参数并且与对等设备协商压缩方案的方法和装置。
问题的解决方案
根据实施例的用于在移动通信系统中发送用于体积视频通信服务的体积视频的方法可以包括:确定用于体积视频的体积视频压缩方案;将包括用于所确定的体积视频压缩方案的第一媒体参数的第一消息发送到对等设备;响应于第一消息的发送,从对等设备接收包括第二媒体参数的第二消息;以及将根据第二媒体参数压缩的体积视频发送到对等设备。
根据实施例的用于在移动通信系统中接收用于体积视频通信服务的体积视频的方法可以包括:从对等设备接收包括用于体积视频的视频压缩方案的第一媒体参数的第一消息;响应于第一消息的接收,向对等设备发送包括第二媒体参数的第二消息;以及从对等设备接收根据第二媒体参数压缩的体积视频。
根据实施例的用于在移动通信系统中发送用于体积视频通信服务的体积视频的用户设备的装置可以包括收发器和在功能上连接到收发器的控制器,其中控制器可以被配置为:确定用于体积视频的体积视频压缩方案,将包括用于所确定的体积视频压缩方案的第一媒体参数的第一消息发送到对等设备,响应于第一消息的发送,从对等设备接收包括第二媒体参数的第二消息,以及将根据第二媒体参数压缩的体积视频发送到对等设备。
根据实施例的用于在移动通信系统中接收用于体积视频通信服务的体积视频的用户设备的装置可以包括收发器和在功能上连接到收发器的控制器,其中控制器可以被配置为从对等设备接收包括用于体积视频的视频压缩方案的第一媒体参数的第一消息,响应于接收到第一消息而向对等设备发送包括第二媒体参数的第二消息,以及从对等设备接收根据第二媒体参数压缩的体积视频。
根据所公开的实施例,通过在具有不同计算能力的终端之间协商媒体参数来提供优异的AR通信服务。
在进行下面的具体实施方式的描述之前,阐述贯穿本专利文件使用的某些词语和短语的定义可能是有利的:术语“包括”和“包含”及其派生词意指包括但不限于;术语“或”是包含性的,意指和/或;短语“与……相关联”和“与其相关联”及其派生词可以意指包括、被包括在……内、与……互连、包含、被包含在……内、连接到或与……连接、耦合到或与……耦合、可与……通信、与……协作、交错、并置、接近于、绑定到或与……绑定、具有、具有……的属性等;并且术语“控制器”意指控制至少一个操作的任何设备、系统或其部分,这样的设备可以以硬件、固件或软件或其中至少两个的某种组合来实现。应当注意,与任何特定控制器相关联的功能可以是集中式的或分布式的,无论是本地的还是远程的。
此外,下面描述的各种功能可以由一个或多个计算机程序实现或支持,每个计算机程序由计算机可读程序代码形成并体现在计算机可读介质中。术语“应用”和“程序”是指适于在合适的计算机可读程序代码中实现的一个或多个计算机程序、软件组件、指令集、过程、功能、对象、类、实例、相关数据或其一部分。短语“计算机可读程序代码”包括任何类型的计算机代码,包括源代码、目标代码和可执行代码。短语“计算机可读介质”包括能够由计算机访问的任何类型的介质,诸如只读存储器(ROM)、随机存取存储器(RAM)、硬盘驱动器、光盘(CD)、数字视频光盘(DVD)或任何其他类型的存储器。“非暂时性”计算机可读介质不包括传输暂时性电信号或其他信号的有线、无线、光学或其他通信链路。非暂时性计算机可读介质包括可以永久存储数据的介质和可以存储数据并随后重写数据的介质,诸如可重写光盘或可擦除存储器设备。
贯穿本专利文件提供了某些词语和短语的定义,本领域普通技术人员应当理解,在许多情况下(如果不是大多数情况),这样的定义适用于这样定义的词语和短语的先前以及未来的使用。
附图说明
通过以下结合附图的详细描述,本公开的上述和其他方面、特征和优点将更加明显,附图中:
图1示出了根据各种实施例的增强现实设备和服务器;
图2示出了基于元素的3D模型媒体结构;
图3示出了基于场景的3D模型媒体结构;
图4示出了被配置为连续3D模型的体积视频;
图5示出了基于动画的体积视频;
图6示出了根据各种实施例的体积视频对话系统;
图7示出了根据各种实施例的用于体积视频对话的协商过程;
图8示出了根据各种实施例的体积视频的基于视频的压缩;
图9示出了根据各种实施例的体积视频的基于场景的压缩;以及
图10示出了根据各种实施例的体积视频解码器。
具体实施方式
下面讨论的图1至图10以及用于描述本专利文件中的本公开的原理的各种实施例仅作为说明,并且不应以任何方式解释为限制本公开的范围。本领域技术人员将理解,本公开的原理可以在任何适当布置的系统或设备中实现。
在下文中,将参考附图详细描述本公开的实施例。
图1示出了根据各种实施例的增强现实设备和服务器。
参考图1,增强现实设备130和增强现实设备140可以是由参与同一会议的会议参与者拥有的电子设备。根据各种实施例,增强现实设备130和增强现实设备140中的至少一个可以显示在会议中共享的媒体内容。服务器110可以控制多个增强现实设备130和140之间的通信并连接它们。
根据各种实施例,服务器110可以直接与增强现实设备140通信。根据各种实施例,服务器110可以与和增强现实设备130交互的电子设备120通信。根据各种实施例,电子设备120可以执行至少一个操作以确定要在增强现实设备130上显示的内容。根据各种实施例,服务器110可以控制用于增强现实设备130的通信的信息(例如,必要信息)或者通过电子设备120接收管理。
根据各种实施例,增强现实设备130可以将包括要在会议中使用的媒体内容的数据发送到增强现实设备140,并且增强现实设备140可以输出(例如,显示)包括在接收到的数据中的媒体。根据各种实施例,增强现实设备140可以显示媒体内容,并且同时还显示增强现实设备140的个人内容,其中个人内容不在会议成员之间共享。根据各种实施例,服务器110可以通过电子设备120将包括要在会议中使用的媒体内容的数据发送到增强现实设备130或增强现实设备140。
尽管将结合由增强现实设备130或140执行的操作来描述本公开中提到的实施例,但是增强现实设备130可以通过电子设备120与服务器110交换信息,并且在这种情况下,下面要描述的实施例中包括的操作中的至少一些操作可以由如图1所示的电子设备120或服务器110执行。
在实施例中,XR(包括VR和AR)中的关键内容可以是体积视频。可以实时捕获对象或空间并在三维中将其记录到视频中。体积视频可以包括随时间变化的连续体积帧。每个体积帧可以被表示为在特定时间存在于三维空间中的一组点,并且这些点可以具有各种属性,诸如颜色和反射率。取决于内容的特性和应用,可以以具有不同结构的3D模型媒体的形式存储和传输体积帧。在本公开的实施例中,基于元素的3D模型结构和基于场景的3D模型媒体结构可以被认为是3D模型媒体的结构。
图2示出了基于元素的3D模型媒体结构。这里,示出了作为基于元素的3D模型媒体的示例的多边形(PLY)文件格式205(例如,PLY文件)。
参考图2,PLY文件格式205可以将存在于三维空间中的对象(例如,媒体对象)视为表示一组顶点的点云,并且可以使用表示顶点的属性(其可以包括例如坐标和/或颜色)的元素在三维中表示和存储对象。顶点指示体积空间中的点,并且位置信息可以根据坐标系中的三个轴来表示。一个顶点可以具有一个或多个属性。PLY文件格式205还可以包括提供关于包括点的边缘或面的信息的元素。边可以指示两个顶点之间的线。例如,面可以是由三个或四个顶点形成的三角形或矩形。
图3示出了基于场景的3D模型媒体结构。这里,示出了作为基于场景的3D模型媒体的示例的图形语言传输格式(gltf)格式305(例如,gltf文件)。
参考图3,gltf格式305可以通过在空间上和逻辑上构造三维空间中的场景来表示三维空间中的场景。更具体地,场景可以被构造为具有树或图形结构的多个节点(例如,相机节点、网格(mesh)节点、皮肤节点、材料节点、访问器(accessor)节点、纹理节点、缓冲区视图(bufferView)节点、采样器节点、视频节点和/或缓冲区(buffer)节点),并且可以以JavaScript对象表示法(JSON)格式表示。由每个节点引用的实际媒体数据可以被描述为上述基于元素的3D模型结构(例如,PLY文件格式205)。
由<mesh>节点引用的二维向量值可以与<buffer>节点的值相关。例如,<buffer>节点可以具有字节单元值“35”,其可以指示35字节的缓冲区数据。<bufferView>节点可以将由<buffer>节点指定的缓冲区数据段定义为byteOffset=4和ByteLength=28,这可以指示4到32字节的缓冲区数据。<accessor>节点可以包括byteOffset=4作为附加偏移,其可以指示8到32字节的缓冲区数据。作为另一示例,<bufferView>节点可以将缓冲数据中的元素之间的步幅指定为byteStride=12,其可以指示8到16的字节距离和20到28的字节距离。<accessor>节点可以包括type=“VEC2”和componentType=GL_FLOAT,以定义元素是二维绘图向量。
在实施例中,缓冲区的大小取决于表示3D对象的顶点、边和面的数量,并且因此,当捕获真实对象和对真实对象进行3D建模时,缓冲区的大小是确定3D模型的质量的重要因素。
gltf格式305可以以在预定方向上变换特定节点的形式提供动画功能。例如,人的手臂可以被建模为包括分别表示手、前臂和上臂的三个节点的树,并且可以通过使用这三个节点之间的连接关系移动前臂和上臂来实现向上移动手的动画效果。
上述3D模型的多样性使得包括构成体积视频的体积帧和与体积帧相对应的信息的3D模型可以具有各种相关性。
图4示出了被配置为连续3D模型的体积视频。
参考图4,被配置为连续3D模型的体积视频405可以包括10个体积帧410,并且每个体积帧410可以与一个3D模型(例如,图2中的基于元素的3D模型或图3中的基于场景的3D模型)相关。
图5示出了基于动画的体积视频。
参考图5,被配置为基于动画的3D模型的体积视频505可以包括四个体积帧510,并且所有四个体积帧510可以与包括动画信息的一个3D模型(例如,图2中的基于元素的3D模型或图3中的基于场景的3D模型)相关。
图6示出了根据各种实施例的体积视频对话系统。
参考图6,体积视频对话系统可以包括两个或更多个用户设备(UE)605和655(也分别被称为呼叫方605和被呼叫方655)、服务控制器645和传输网络650。例如,用户设备605和655中的用户设备605可以包括例如网络接口(I/F)640、体积视频控制器610、体积视频解码器620、体积视频编码器635、体积视频播放器615或体积视频生成器630中的至少一个。这里,网络接口(I/F)640可以作为收发器操作。体积视频控制器610、体积视频解码器620、体积视频编码器635、体积视频播放器615和体积视频生成器630中的至少一个可以被包括在控制器中。
传输网络650可以包括用于携带用于用户设备605和655之间的体积视频对话的体积媒体数据的媒体传输路径,并且服务控制器645可以执行通过媒体传输路径交换用于体积视频对话的实际媒体数据所需的一系列操作。
由体积视频对话服务控制器645执行的操作可以包括识别对等用户设备(例如,用户设备655)的网络地址以及协商用于体积视频对话的媒体参数。作为实施例,如果5G系统提供基于IP多媒体子系统(IMS)的体积视频对话服务,则可以使用会话发起协议(SIP)和会话描述协议(SDP)来提供体积视频对话服务控制器645的操作。在实施例中,可以使用SDP信令和格式来协商用于体积视频对话的媒体参数。
图7示出了根据各种实施例的用于体积视频对话的协商过程。这里,示出了作为呼叫方操作的用户设备(例如,用户设备605)和作为被呼叫方操作的用户设备(例如,用户设备655)之间的SDP消息。
参考图7,在操作705中,呼叫方605使用SDP向被呼叫方655发送SDP消息,该SDP消息包括信令信息,该信令信息包括用于要发送/接收的视频和音频的媒体参数。SDP消息可以是例如“SDP提议”。媒体参数可以包括关于体积媒体数据的编解码器和视频分辨率的至少一个信息,并且可以包括关于一个媒体的多个配置信息。
在操作710中,被呼叫方655基于通过SDP提供消息接收的媒体参数中包括的多个配置信息,考虑被呼叫方655的处理能力来确定最终使用的至少一个配置信息,并使用SDP消息将所确定的配置信息发送到呼叫方605。SDP消息可以是“SDP应答”。SDP应答消息可以包括配置信息,其没有被包括在SDP提议中。
在操作715中,如果呼叫方605同意通过SDP应答消息接收的配置信息,则呼叫方605可以发起呼叫。尽管未示出,但是如果呼叫方605不同意通过ADP应答消息接收的配置信息,则呼叫方605可以再次执行操作705和710以修改包括在SDP应答消息中的配置信息并执行重新协商。
在实施例中,如果呼叫方605或被呼叫方655需要在操作715中的呼叫期间改变至少一个媒体参数,则呼叫方605或被呼叫方655可以执行包括操作705和710的重新协商,或者使用实时传输控制协议(RTCP)交换新的配置信息。在实施例中,可以通过SDP重新协商来交换影响任何一个用户设备的处理能力或网络容量的媒体参数。在实施例中,可以使用RTCP来交换不影响任何一个用户设备的处理能力或网络容量或者动态可变的媒体参数。
如上所述,取决于所使用的3D模型(例如,图2或图3中的模型结构),体积视频可以具有不同的体积帧结构(例如,图4或图5),并且可以取决于3D模型或帧结构来不同地确定体积视频的压缩方案。
在使用作为基于元素的3D模型结构的示例的PLY文件格式(参考图2)的情况下,体积视频可以包括一系列体积帧410,每个体积帧410包括PLY文件,如图4所示。由于表示为PLY文件的3D模型的体积帧410在时间轴上具有相关性,因此可以有效地使用基于视频的压缩工具。
图8示出了根据各种实施例的体积视频的基于视频的压缩。这里,支持ISO/IEC23090-5基于视觉体积视频的编码(V3C)和基于视频的点云压缩(V-PCC)标准的体积视频编码器(例如,635)被示出为基于视频的压缩的示例。
参考图8,体积捕获模块810可以产生反映实际对象805的3D模型数据,投影模块815可以通过投影过程将3D模型数据划分成多个(例如,四个)子流,子流可以分别由多个(例如,四个)编解码器820、825、830和835压缩,并且复用器840可以将经压缩的子流复用成V3C比特流以用于传输。在实施例中,子流中的每一个可以包括图集(atlas,Atl)数据、占用(occupancy,Occ)数据、几何(geometry,Geo)数据及属性(attribute,Att)数据。这里,可以使用例如诸如高效视频编码(HEVC)或高级视频编码(AVC)的视频编解码器来压缩包括占用、几何及属性数据的子流。
在使用基于场景的3D模型结构的情况下,体积视频可以具有混合图4和图5中所示的结构的结构。作为基于场景的3D模型的示例,gltf格式的媒体数据(例如,图3)可以包括指示场景结构和实际媒体数据的JSON文档。在实施例中,图4中的体积视频和图5中的体积视频可以通过分别更新媒体数据和更新JSON文档来实现。
图9示出了根据各种实施例的体积视频的基于场景的压缩。具有实施例中所示的配置的体积帧生成器905、基于场景的差分3D模型生成器910、基于场景的3D模型缓冲区915、场景结构编码器920和媒体编码器935可以被包括在图6中的体积视频编码器635中。
参考图9,体积帧生成器905可以产生一系列体积帧。基于场景的差分3D模型生成器910可为每个体积帧产生gltf格式的场景结构。例如,场景结构可以由构成3D场景的节点之间的层级给出,以便描述3D场景的整个内容,如图3所示。所产生的场景结构可以存储在基于场景的3D模型缓冲区915中,并且可以输入到场景结构编码器920。场景结构编码器920可以以JSON补丁文档的形式输出关于场景结构的差分数据。媒体编码器935可以输出使用给定视频编码技术编码的媒体数据。
传统的视频编码器输出时间上连续的编码数据作为处理输入信号的结果。相比之下,在根据本公开的实施例的基于场景的压缩中,特定时间处的输入信号(例如,体积帧)可以由场景结构编码器920、媒体编码器935、或场景结构编码器920和媒体编码器935两者处理,并且可以被输出以用于传输。因此,场景结构编码器920和媒体编码器935的输出可以是时间上不连续的。
当场景结构编码器920和媒体编码器935的输出数据在相应的流中被存储和发送时,从场景结构编码器920输出的场景结构信息(例如,包含关于场景结构的差分数据的JSON补丁文档)可以包括用于获得媒体编码器935的输出数据的位置信息。例如,位置信息可以包括文件的统一资源定位符(URL)、ISO基本媒体文件格式(ISOBMFF)的轨道标识符或用于访问流式传输会话的信息中的至少一个。例如,用于访问流式传输会话的信息可以包括IP地址、协议标识符或端口号中的至少一个,并且还可以包括取决于协议标识符的协议有效载荷类型。
图10示出了根据各种实施例的体积视频解码器的结构。在实施例中,所示出的配置的场景结构更新器1025、体积帧生成器1035、解码器流水线1030以及缓冲区1040和1045可以被包括在图6中的体积视频解码器625中。网络接口640可以将通过网络1005接收的多个流的媒体数据发送到体积视频解码器625,并且体积视频解码器625可以通过稍后将描述的配置来对媒体数据进行解码。
参考图10,场景结构更新器1025可以输出通过多个流中的至少一个接收的数据中包括的更新的场景结构。解码器流水线1030可以包括用于分别解码通过多个流接收的媒体数据的至少一个媒体解码器。每个媒体解码器可以将与每个流相对应的更新的媒体数据输出到对应的缓冲区1040或1045。体积帧生成器1035可以使用更新的场景结构和从缓冲区1040和1045输入的更新的媒体数据中的至少一个来配置体积帧。
在根据实施例的体积视频对话系统中,用户设备605可以使用SDP与对等用户设备655协商媒体参数。在SDP中,其中发送媒体数据的会话可以由媒体(m)行来描述。被发送以协商用于至少一个会话的媒体参数的SDP消息(例如,图7中的SDP提议消息或SDP应答消息)可以包括至少一个m行和与属性(a)行相对应的信息元素,该属性(a)行指示用于描述在每个m行的对应会话中发送的媒体数据的特性的属性。
在实施例中,m行可以具有以下格式。
m=<media><port><proto><fmt>...
这里,<media>字段指示媒体类型,并且可以具有例如值“音频”、“视频”(“video”)或“应用”。
<port>字段指示通过其发送媒体流的端口,并且可以根据定义为<proto>的网络和传输协议而具有不同的含义。
<proto>字段可以指示传输协议。
<fmt>字段可以指示媒体格式。
根据实施例的体积视频对话系统可以使用基于视频的压缩技术来提供体积视频。可以在一个或多个会话中发送体积视频数据。
在实施例中,在一个会话中发送体积视频数据的情况下,可以描述发送以协商会话的配置信息的SDP消息,例如,如下表1所示。
[表1]
在SDP消息的示例中,m行可以包括包含用于标识媒体数据的会话的信息的字段(例如,媒体类型=视频,端口号=1000,协议=RTP/AVPF,以及媒体格式=97和98)。第一属性行和第三属性行可以指示被发送到被描述为m行的会话的媒体格式97和98中的媒体数据使用实时协议(RTP)连接并且使用被标识为V3C的体积视频压缩方案。第二属性行和第四属性行分别包括CodecGroup1和CodecGroup2,它们分别指示要在标识为97和98的媒体格式中使用的一组媒体参数。媒体参数可以包括用于对应流的媒体压缩的编解码器类型、简档或级别中的至少一个。
在实施例中,在体积视频数据在两个或更多个会话中发送的情况下,可以描述被发送以协商会话的配置信息的SDP消息(例如,图7中的SDP提议消息或SDP应答消息),例如,如下面的<表2>所示。
[表2]
在SDP消息的示例中,第一a行“V3CGroup:Atl Occ Geo Att1 Att2”指示使用被标识为V3C的体积视频压缩方案的媒体数据的子流通过分别具有mid(媒体id)属性值Atl、Occ、Geo、Att1和Att2的媒体会话来发送。这里,“at1”可以指示图集信息,“Occ”可以指示占用视频数据,“Geo”可以指示几何视频数据,并且“Att1”和“Att2”可以指示属性视频数据。“a=AltParam”可以包括特定于图集格式的参数和用于描述整个V3C比特流的媒体参数。用于描述整个V3C比特流的媒体参数可以包括例如包括在相应子流中使用的编解码器参数的CodecGroup、关于整个分组媒体会话的带宽的信息、包括在压缩3D模型中的点的限制数量(例如,最大数量)、或指示指定属性的标识符中的至少一个。在某些实施例中,指定属性包括基本属性,但是本公开不要求指定属性包括基本属性。
在<表2>中,“a=mid:Atl”可以指示由下一行中的m行描述的媒体会话携带Atl信息。m行“m=video 10002RTP/AVPF 97 98”可以指示媒体会话的媒体类型是视频,端口号是10002,协议是RTP/AVPF,并且媒体格式被标识为97和98。m行之后的a行可以包括与媒体会话相关的媒体参数。“a=mid:Occ”、“a=mid:Geo”、“a=mid:Attl”以及与其相关的行的描述与上述类似。
根据实施例的体积视频对话系统可以使用基于场景的压缩技术来提供体积视频。用于配置其中发送通过基于场景的压缩技术获得的体积视频数据的会话的SDP消息可以包括例如下面的表3中所示的信息元素。
[表3]
在SDP消息的示例中,第一a行“a=SDGroup:SD M1 M2”指示使用由场景描述(SD)标识的体积视频压缩方案的媒体数据通过分别具有mid属性值SD和M1的媒体会话来发送。“a=SDParam”可以包括特定于SD格式的参数。特定于SD格式的参数可以包括例如多用途互联网邮件扩展(MIME)类型参数。
在<表3>中,“a=mid:SD”可以指示由下一行中的m行描述的媒体会话携带SD格式的媒体数据。m行“video 10002RTP/AVPF 97 98”可以指示媒体会话的媒体类型是视频,端口号是10002,协议是RTP/AVPF,并且媒体格式被标识为97和98。m行之后的a行可以包括与媒体会话相关的媒体参数。“A=mid:M1”和与其相关的行的描述与上述类似。
在SDP消息的示例中,“a=mid:M1”和“a=mid:M2”中的参数M1和M2可以用作标识符,以引用通过具有SD格式的3D模型中的“m=video 10002RTP/AVPF”和“m=video10004RTP/AVPF”发送的媒体流。在实施例中,3D模型中使用的媒体流的标识符是单独的属性值,诸如“a=label:media1”和“a=label:media2”,其可以被包括在SDP消息中。
在实施例中,上述参数可以被包括在RTCP反馈消息或超文本传输协议(HTTP)restful应用程序接口(API)的命令中,并且可以在调用期间发送。
在实施例中,用户设备可以使用数据信道将静态3D模型的媒体数据发送到对等用户设备,并且使用SDP重新邀请来协商要在基于场景的压缩体积视频的发送中使用的媒体参数。如果协商成功,则可以将基于协商的媒体参数产生的数据发送到对等用户设备。换句话说,静态3D模型的媒体数据最初使用数据信道发送,并且用于更新3D模型的媒体数据传输参数可以通过数据信道发送到对等用户设备,或者可以通过用于协商的包括单独m行的消息发送到对等用户设备。取决于用户设备的能力,本公开的实施例使得用户设备能够在使用静态3D模型的媒体数据进行发送的同时使用静态3D模型的媒体数据和语音数据,而不是使用SDP重新邀请来执行协商过程。
根据实施例的用于在移动通信系统中发送用于体积视频通信服务的体积视频的方法可以包括:确定用于体积视频的体积视频压缩方案;将包括用于所确定的体积视频压缩方案的第一媒体参数的第一消息发送到对等设备;响应于第一消息的发送,从对等设备接收包括第二媒体参数的第二消息;以及将根据第二媒体参数压缩的体积视频发送到对等设备。
在实施例中,第一消息或第二消息中的至少一个可以包括:第一属性行信息,该第一属性行信息指示使用体积视频压缩方案产生的体积视频的媒体数据通过多个媒体会话来发送;第二属性行信息,第二属性行信息包括描述整个多个媒体会话的媒体参数;第三属性行信息,第三属性行信息指示多个媒体会话中的第一媒体会话的媒体属性值;第一媒体行信息,第一媒体行信息描述与第三属性行信息相关的第一媒体会话的媒体类型、端口号、协议以及媒体格式;以及至少一个第四属性行信息,至少一个第四属性行信息包括与第一媒体行信息相关的第一媒体会话的媒体参数。
在实施例中,第一属性行信息可以指示体积视频的媒体数据通过分别具有图集信息、占用视频数据、几何视频数据和至少一个属性视频数据的媒体属性值的多个媒体会话来发送。
在实施例中,第二属性行信息可以包括在通过多个媒体会话携带的子流中使用的一组编解码器参数、关于整个分组的媒体会话的带宽的信息、压缩三维(3D)模型中包括的点的限制数量(例如,最大数量)、或指定属性中的至少一个。
在实施例中,第一属性行信息可以指示体积视频的媒体数据使用被标识为SD(场景描述)的体积视频压缩方案来产生并且通过分别具有媒体属性值SD和M1的多个媒体会话来发送,并且第二属性行信息可以包括特定于SD格式的至少一个媒体参数。
在实施例中,第一消息或第二消息中的至少一个可以是SDP提议消息、SDP应答消息、RTCP反馈消息或HTTP restful API的命令。
根据实施例的用于在移动通信系统中接收用于体积视频通信服务的体积视频的方法可以包括:从对等设备接收包括用于体积视频的视频压缩方案的第一媒体参数的第一消息;响应于第一消息的接收,向对等设备发送包括第二媒体参数的第二消息;以及从对等设备接收根据第二媒体参数压缩的体积视频。
在实施例中,第一消息或第二消息中的至少一个可以包括:第一属性行信息,第一属性行信息指示使用体积视频压缩方案产生的体积视频的媒体数据通过多个媒体会话来发送;第二属性行信息,第二属性行信息包括描述整个多个媒体会话的媒体参数;第三属性行信息,第三属性行信息指示多个媒体会话中的第一媒体会话的媒体属性值;第一媒体行信息,第一媒体行信息描述与第三属性行信息相关的第一媒体会话的媒体类型、端口号、协议、以及媒体格式;以及至少一个第四属性行信息,至少一个第四属性行信息包括与第一媒体行信息相关的第一媒体会话的媒体参数。
在实施例中,第一属性行信息可以指示体积视频的媒体数据通过分别具有图集信息、占用视频数据、几何视频数据和至少一个属性视频数据的媒体属性值的多个媒体会话来发送。
在实施例中,第二属性行信息可以包括在通过多个媒体会话携带的子流中使用的一组编解码器参数、关于整个分组的媒体会话的带宽的信息、压缩三维(3D)模型中包括的点的限制数量(例如,最大数量)、或指定属性中的至少一个。
在实施例中,第一属性行信息可以指示体积视频的媒体数据使用被标识为SD(场景描述)的体积视频压缩方案来产生并且通过分别具有媒体属性值SD和M1的多个媒体会话来发送,并且第二属性行信息可以包括特定于SD格式的至少一个媒体参数。
在实施例中,第一消息或第二消息中的至少一个可以是SDP提议消息、SDP应答消息、RTCP反馈消息或HTTP restful API的命令。
根据实施例的用于在移动通信系统中发送用于体积视频通信服务的体积视频的装置可以包括收发器和在功能上连接到收发器的控制器,其中控制器可以被配置为确定用于体积视频的体积视频压缩方案,将包括用于所确定的体积视频压缩方案的第一媒体参数的第一消息发送到对等设备,响应于第一消息的发送而从对等设备接收包括第二媒体参数的第二消息,以及将根据第二媒体参数压缩的体积视频发送到对等设备。
根据实施例的用于在移动通信系统中接收用于体积视频通信服务的体积视频的装置可以包括收发器和在功能上连接到收发器的控制器,其中,控制器可以被配置为从对等设备接收包括用于体积视频的视频压缩方案的第一媒体参数的第一消息,响应于第一消息的接收而向对等设备发送包括第二媒体参数的第二消息,以及从对等设备接收根据第二媒体参数压缩的体积视频。
执行、管理和实现各种实施例的电子设备可以是各种类型的电子设备之一。电子设备可以包括例如便携式通信设备(例如,智能电话)、计算机设备、便携式多媒体设备、便携式医疗设备、相机、可穿戴设备或家用电器。根据本公开的实施例,电子设备不限于上述那些。
应当理解,本公开的各种实施例和其中使用的术语并不旨在将本文阐述的技术特征限制于特定实施例,并且包括相应实施例的各种改变、等同物或替换。关于附图的描述,类似的附图标记可以用于指代类似或相关的元件。应当理解,除非相关上下文另有明确说明,否则对应于项目的名词的单数形式可以包括一个或多个事物。如本文所使用的,诸如“A或B”、“A和B中的至少一个”、“A或B中的至少一个”、“A、B或C”、“A、B和C中的至少一个”和“A、B或C中的至少一个”的短语中的每一个可以包括在相应的一个短语中一起列举的项目中的任何一个或所有可能的组合。如本文所使用的,诸如“第一”和“第二”的术语可以用于简单地将相应的元件与另一个元件区分开,并且不在其他方面(例如,重要性或顺序)限制元件。应当理解,如果元件(例如,第一元件)在有或没有术语“可操作地”或“通信地”的情况下被称为“与另一元件(例如,第二元件)耦合”、“耦合到另一元件”、“与另一元件连接”或“连接到另一元件”,则意味着该元件可以直接(例如,有线地)、无线地或经由第三元件与另一元件耦合。
如结合本公开的各种实施例所使用的,术语“模块”可以包括以硬件、软件或固件实现的单元,并且可以与其他术语(例如,“逻辑”、“逻辑块”、“部件”或“电路”)互换使用。模块可以是适于执行一个或多个功能的单个集成部件或其最小单元或部分。例如,根据实施例,模块可以以专用集成电路(ASIC)的形式实现。
本文阐述的各种实施例可以实现为软件(例如,程序),该软件包括存储在机器(例如,电子设备301)可读的存储介质(例如,内部存储器336或外部存储器338)中的一个或多个指令。例如,机器(例如,电子设备301)的处理器(例如,处理器320)可以调用存储在存储介质中的一个或更多个指令中的至少一个,并执行它。这允许操作机器以根据所调用的至少一个指令执行至少一个功能。一个或多个指令可以包括由编译器生成的代码或可由解释器执行的代码。机器可读存储介质可以以非暂时性存储介质的形式提供。其中,术语“非暂时性”简单地表示存储介质是有形设备,并且不包括信号(例如,电磁波),但是该术语不区分数据半永久地存储在存储介质中的位置和数据临时存储在存储介质中的位置。
根据实施例,可以在计算机程序产品中包括和提供根据本公开的各种实施例的方法。计算机程序产品可以作为产品在卖方和买方之间交易。计算机程序产品可以以机器可读存储介质(例如,光盘只读存储器(CD-ROM))的形式分发,或者经由应用商店(例如,PlayStoreTM)在线分发(例如,下载或上传),或者直接在两个用户设备(例如,智能电话)之间分发(例如,下载或上传)。如果在线分发,则计算机程序产品的至少一部分可以临时生成或至少临时存储在机器可读存储介质中,诸如制造商服务器的存储器、应用商店的服务器或中继服务器。
根据各种实施例,上述组件中的每个组件(例如,模块或程序)可以包括单个实体或多个实体,并且多个实体中的一些实体可以单独地设置在不同的组件中。根据各种实施例,可以省略上述组件或操作中的一个或多个,或者可以添加一个或多个其他组件或操作。替代地或附加地,多个组件(例如,模块或程序)可以集成到单个组件中。在这种情况下,集成组件仍然可以以与在集成之前由多个组件中的对应组件执行的方式相同或相似的方式执行多个组件中的每个组件的一个或多个功能。根据各种实施例,由模块、程序或另一组件执行的操作可以顺序地、并行地、重复地或启发式地执行,或者操作中的一个或多个可以以不同的顺序执行或省略,或者可以添加一个或多个其他操作。
尽管已经利用各种实施例描述了本公开,但是可以向本领域技术人员建议各种改变和修改。本公开旨在涵盖落入所附权利要求的范围内的这些改变和修改。
Claims (15)
1.一种方法,包括:
确定用于针对移动通信系统中的体积视频通信服务要发送的体积视频的体积视频压缩方案;
将包括用于所确定的体积视频压缩方案的第一媒体参数的第一消息发送到对等设备;
响应于所述第一消息的发送,从所述对等设备接收包括第二媒体参数的第二消息;以及
将根据所述第二媒体参数压缩的压缩体积视频发送到所述对等设备。
2.根据权利要求1所述的方法,其中,所述第一消息或所述第二消息中的至少一个包括:
第一属性行信息,所述第一属性行信息指示所述体积视频的媒体数据使用所述体积视频压缩方案来产生并且通过多个媒体会话来发送;
第二属性行信息,所述第二属性行信息包括描述整个所述多个媒体会话的媒体参数;
第三属性行信息,所述第三属性行信息指示所述多个媒体会话中的第一媒体会话的媒体属性值;
第一媒体行信息,所述第一媒体行信息描述与所述第三属性行信息相关的所述第一媒体会话的媒体类型、端口号、协议和媒体格式;以及
至少一个第四属性行信息,所述至少一个第四属性行信息包括与所述第一媒体行信息相关的所述第一媒体会话的媒体参数。
3.根据权利要求2所述的方法,其中,所述第一属性行信息指示所述体积视频的媒体数据通过分别包括图集信息、占用视频数据、几何视频数据和至少一个属性视频数据的媒体属性值的所述多个媒体会话来发送。
4.根据权利要求2所述的方法,其中,所述第二属性行信息包括以下中的至少一个:在通过所述多个媒体会话携带的子流中使用的一组编解码器参数;关于整个分组的媒体会话的带宽的信息;包括在压缩三维(3D)媒体中的点的限制数量;或指定的属性。
5.根据权利要求2所述的方法,其中,所述第一属性行信息指示所述体积视频的媒体数据使用被标识为场景描述(SD)的体积视频压缩方案来产生,并且通过分别包括媒体属性值SD和M1的所述多个媒体会话来发送;并且
其中,所述第二属性行信息包括特定于SD格式的至少一个媒体参数。
6.根据权利要求1所述的方法,其中,所述第一消息或所述第二消息中的至少一个是会话描述协议(SDP)提议消息、SDP应答消息、实时传输控制协议(RTCP)反馈消息或超文本传输协议(HTTP)restful应用程序接口(API)的命令。
7.一种方法,包括:
从对等设备接收第一消息,所述第一消息包括用于移动通信系统中的体积视频通信服务的体积视频的视频压缩方案的第一媒体参数;
响应于所述第一消息的接收,向所述对等设备发送包括第二媒体参数的第二消息;以及
从所述对等设备接收根据所述第二媒体参数压缩的压缩体积视频。
8.根据权利要求7所述的方法,其中,所述第一消息或所述第二消息中的至少一个包括:
第一属性行信息,所述第一属性行信息指示所述体积视频的媒体数据使用所述体积视频压缩方案来产生并且通过多个媒体会话来发送;
第二属性行信息,所述第二属性行信息包括描述整个所述多个媒体会话的媒体参数;
第三属性行信息,所述第三属性行信息指示所述多个媒体会话中的第一媒体会话的媒体属性值;
第一媒体行信息,所述第一媒体行信息描述与所述第三属性行信息相关的所述第一媒体会话的媒体类型、端口号、协议和媒体格式;以及
至少一个第四属性行信息,所述至少一个第四属性行信息包括与所述第一媒体行信息相关的所述第一媒体会话的媒体参数。
9.根据权利要求8所述的方法,其中,所述第一属性行信息指示所述体积视频的媒体数据通过分别包括图集信息、占用视频数据、几何视频数据和至少一个属性视频数据的媒体属性值的所述多个媒体会话来发送。
10.根据权利要求8所述的方法,其中,所述第二属性行信息包括以下中的至少一个:在通过所述多个媒体会话携带的子流中使用的一组编解码器参数;关于整个分组的媒体会话的带宽的信息;包括在压缩三维(3D)媒体中的点的限制数量;或指定的属性。
11.根据权利要求8所述的方法,其中,所述第一属性行信息指示所述体积视频的媒体数据使用被标识为场景描述(SD)的体积视频压缩方案来产生,并且通过分别包括媒体属性值SD和M1的所述多个媒体会话来发送;并且
其中,所述第二属性行信息包括特定于SD格式的至少一个媒体参数。
12.根据权利要求7所述的方法,其中,所述第一消息或所述第二消息中的至少一个是会话描述协议(SDP)提议消息、SDP应答消息、实时传输控制协议(RTCP)反馈消息或超文本传输协议(HTTP)restful应用程序接口(API)的命令。
13.一种装置,包括:
收发器;以及
控制器,所述控制器与所述收发器耦合,
其中,所述控制器被配置为:
确定用于针对移动通信系统中的体积视频通信服务要发送的体积视频的体积视频压缩方案;
将包括用于所确定的体积视频压缩方案的第一媒体参数的第一消息发送到对等设备;
响应于所述第一消息的发送,从所述对等设备接收包括第二媒体参数的第二消息;以及
将根据所述第二媒体参数压缩的压缩体积视频发送到所述对等设备。
14.根据权利要求13所述的装置,所述装置被配置为执行根据权利要求1至6之一所述的方法。
15.一种装置,包括:
收发器;以及
控制器,所述控制器与所述收发器耦合,
其中,所述控制器被配置为:从对等设备接收第一消息,所述第一消息包括用于移动通信系统中的体积视频通信服务的体积视频的视频压缩方案的第一媒体参数,响应于所述第一消息的接收而向所述对等设备发送包括第二媒体参数的第二消息,并且从所述对等设备接收根据所述第二媒体参数压缩的压缩体积视频。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210041203A KR20220135483A (ko) | 2021-03-30 | 2021-03-30 | 이동 통신 시스템에서 영상 대화 서비스를 제공하기 위한 방법 및 장치 |
KR10-2021-0041203 | 2021-03-30 | ||
PCT/KR2022/003760 WO2022211327A1 (en) | 2021-03-30 | 2022-03-17 | Method and apparatus for providing conversational services in mobile communication system |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117099363A true CN117099363A (zh) | 2023-11-21 |
Family
ID=83449339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280025982.2A Pending CN117099363A (zh) | 2021-03-30 | 2022-03-17 | 用于在移动通信系统中提供对话服务的方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11838488B2 (zh) |
EP (1) | EP4264940A4 (zh) |
KR (1) | KR20220135483A (zh) |
CN (1) | CN117099363A (zh) |
WO (1) | WO2022211327A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220135483A (ko) * | 2021-03-30 | 2022-10-07 | 삼성전자주식회사 | 이동 통신 시스템에서 영상 대화 서비스를 제공하기 위한 방법 및 장치 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040068583A1 (en) * | 2002-10-08 | 2004-04-08 | Monroe David A. | Enhanced apparatus and method for collecting, distributing and archiving high resolution images |
US7509425B1 (en) * | 2002-01-15 | 2009-03-24 | Dynamicsoft, Inc. | Establishing and modifying network signaling protocols |
US7286128B2 (en) * | 2004-07-08 | 2007-10-23 | Actuality Systems, Inc. | System and method for rendering data associated with a 3-D scene description |
KR101421587B1 (ko) * | 2007-08-23 | 2014-07-22 | 삼성전자주식회사 | 무선 영상 전화 단말간의 선호 영상 규격을 결정하는 방법및 장치 |
US20100011012A1 (en) * | 2008-07-09 | 2010-01-14 | Rawson Andrew R | Selective Compression Based on Data Type and Client Capability |
US20110096699A1 (en) * | 2009-10-27 | 2011-04-28 | Sakhamuri Srinivasa | Media pipeline for a conferencing session |
US8649424B2 (en) * | 2010-02-17 | 2014-02-11 | Juniper Networks, Inc. | Video transcoding using a proxy device |
US9942580B2 (en) * | 2011-11-18 | 2018-04-10 | At&T Intellecutal Property I, L.P. | System and method for automatically selecting encoding/decoding for streaming media |
US8949466B1 (en) * | 2012-02-08 | 2015-02-03 | Excelfore Corporation | System and method for adaptive compression |
US9516268B2 (en) * | 2014-03-28 | 2016-12-06 | International Business Machines Corporation | Maintaining audio video conference continuity |
US20170163607A1 (en) * | 2015-12-03 | 2017-06-08 | Microsoft Technology Licensing, Llc | Establishing a Communication Event Using Secure Signalling |
US10708569B2 (en) * | 2016-09-29 | 2020-07-07 | Eric Wilson | Turbine-Powered Pool Scrubber |
GB2577024B (en) * | 2017-06-09 | 2022-08-03 | Displaylink Uk Ltd | Using headset movement for compression |
JP7486527B2 (ja) * | 2019-05-20 | 2024-05-17 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | イマーシブメディアコンテンツの提示および双方向性の360°ビデオ通信 |
JP7344988B2 (ja) * | 2019-05-22 | 2023-09-14 | ノキア テクノロジーズ オサケユイチア | ボリュメトリック映像の符号化および復号化のための方法、装置、およびコンピュータプログラム製品 |
US11696001B2 (en) * | 2019-06-28 | 2023-07-04 | Cox Communications, Inc. | Enhanced immersive digital media |
US11711544B2 (en) * | 2019-07-02 | 2023-07-25 | Apple Inc. | Point cloud compression with supplemental information messages |
WO2021011772A1 (en) * | 2019-07-16 | 2021-01-21 | Apple Inc. | Streaming of volumetric point cloud content based on session description protocols and real time protocols |
US11159779B2 (en) * | 2019-09-24 | 2021-10-26 | At&T Intellectual Property I, L.P. | Multi-user viewport-adaptive immersive visual streaming |
KR20220046356A (ko) | 2020-10-07 | 2022-04-14 | 삼성전자주식회사 | 이동 통신 시스템에서 컨텐츠를 렌더링하는 방법 및 장치 |
KR20220135483A (ko) * | 2021-03-30 | 2022-10-07 | 삼성전자주식회사 | 이동 통신 시스템에서 영상 대화 서비스를 제공하기 위한 방법 및 장치 |
-
2021
- 2021-03-30 KR KR1020210041203A patent/KR20220135483A/ko unknown
-
2022
- 2022-03-17 EP EP22781447.2A patent/EP4264940A4/en active Pending
- 2022-03-17 CN CN202280025982.2A patent/CN117099363A/zh active Pending
- 2022-03-17 WO PCT/KR2022/003760 patent/WO2022211327A1/en active Application Filing
- 2022-03-29 US US17/657,076 patent/US11838488B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP4264940A4 (en) | 2023-11-01 |
US20220321861A1 (en) | 2022-10-06 |
WO2022211327A1 (en) | 2022-10-06 |
KR20220135483A (ko) | 2022-10-07 |
EP4264940A1 (en) | 2023-10-25 |
US11838488B2 (en) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9210372B2 (en) | Communication method and device for video simulation image | |
US20030220971A1 (en) | Method and apparatus for video conferencing with audio redirection within a 360 degree view | |
CN110430441B (zh) | 一种云手机视频采集方法、系统、装置及存储介质 | |
CN114600468B (zh) | 将复合视频流中的视频流与元数据组合的组合器系统、接收器设备、计算机实现的方法和计算机可读介质 | |
US20040001091A1 (en) | Method and apparatus for video conferencing system with 360 degree view | |
van der Hooft et al. | From capturing to rendering: Volumetric media delivery with six degrees of freedom | |
WO2020234373A1 (en) | Immersive media content presentation and interactive 360° video communication | |
Nadir et al. | Immersive services over 5G and beyond mobile systems | |
CN109040786A (zh) | 摄像头数据的传输方法、装置、系统及存储介质 | |
CN111464828A (zh) | 虚拟特效显示方法、装置、终端及存储介质 | |
CN110519247A (zh) | 一种一对多虚拟现实展示方法及装置 | |
CN114938408B (zh) | 一种云手机的数据传输方法、系统、设备及介质 | |
US11838488B2 (en) | Method and apparatus for providing conversational services in mobile communication system | |
CN106507115B (zh) | 基于iOS设备的VR视频的解码方法、装置及终端设备 | |
CN115606170A (zh) | 用于沉浸式远程会议和远程呈现的多分组 | |
CN109963110A (zh) | 多方视频会议的处理方法、装置、存储介质及计算设备 | |
EP4156109A1 (en) | Apparatus and method for establishing a three-dimensional conversational service | |
US11985181B2 (en) | Orchestrating a multidevice video session | |
CN116980392A (zh) | 媒体流处理方法、装置、计算机设备和存储介质 | |
Mosmondor et al. | LiveMail: Personalized avatars for mobile entertainment | |
Tamm et al. | Plugin free remote visualization in the browser | |
Lee et al. | Overview of 3GPP standardization for 5G AR/MR experiences using glasses-type devices | |
CN113473180B (zh) | 一种基于无线的Cloud XR数据传输方法以及装置、存储介质、电子装置 | |
WO2024100028A1 (en) | Signalling for real-time 3d model generation | |
EP4375947A1 (en) | Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |