CN103026713B - 3d视频广播中的辅助数据 - Google Patents
3d视频广播中的辅助数据 Download PDFInfo
- Publication number
- CN103026713B CN103026713B CN201180034477.6A CN201180034477A CN103026713B CN 103026713 B CN103026713 B CN 103026713B CN 201180034477 A CN201180034477 A CN 201180034477A CN 103026713 B CN103026713 B CN 103026713B
- Authority
- CN
- China
- Prior art keywords
- data
- auxiliary
- video
- auxiliary data
- right view
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 51
- 230000005540 biological transmission Effects 0.000 claims description 30
- 239000000203 mixture Substances 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 26
- 230000004069 differentiation Effects 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 9
- 230000008520 organization Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 13
- 230000011664 signaling Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 12
- 230000008859 change Effects 0.000 description 6
- 238000006073 displacement reaction Methods 0.000 description 6
- 238000012856 packing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 206010048865 Hypoacusis Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/122—Improving the 3D impression of stereoscopic images by modifying image signal contents, e.g. by filtering or adding monoscopic depth cues
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/139—Format conversion, e.g. of frame-rate or size
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/156—Mixing image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/172—Processing image signals image signals comprising non-image signal components, e.g. headers or format information
- H04N13/183—On-screen display [OSD] information, e.g. subtitles or menus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/23439—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
一种用于传递3D视频信息的系统具有用于向接收器(110)广播信号(104)的发送器(100)。所述3D视频信息包括用于在所述3D视频数据上的覆盖范围中显示的辅助数据,诸如字幕。所述3D视频数据具有被例如并排地安排在主安排中的2D帧中的左视图和右视图。例如也并行地根据对应于所述主安排的辅助安排中的2D传输格式将所述辅助数据的辅助左和右视图安排在辅助数据流中。另外,所述辅助数据的2D版本以及辅助差异数据被包括在所述传输流中,其中,所述辅助差异数据指示当被覆盖在所述左视图和所述右视图上时将被应用于辅助数据的所述2D版本的差异。有利地,所述接收器可以基于所述接收器处理体系结构使用所述辅助数据的合适版本。
Description
技术领域
本发明涉及一种处理三维[3D]视频信息以便生成用于根据2D传输格式传递所述3D视频信息的数据传输流的方法,所述3D视频信息包括3D视频数据和辅助数据,
所述3D视频数据包括将被显示给观看者的各个眼以便生成3D效果的至少左视图和右视图,所述辅助数据被安排为在所述3D视频数据上的覆盖范围中显示,所述方法包括:
-根据主安排中的所述2D传输格式将所述左视图和所述右视图的3D视频数据安排在针对主视频数据的2D帧中,
-向接收器提供包括参数的控制数据,以便使所述接收器能够再现所述主视频数据和覆盖所述辅助数据,
-组装包括所述主安排中的3D视频数据、所述辅助数据和所述控制数据的数据传输流。
本发明进一步涉及一种用于处理3D视频信息的设备、用于传送3D视频信息的信号和用于处理三维[3D]视频信息的接收器。
本发明涉及3D视频广播领域。来自娱乐业的数量增长的作品正瞄准3D电影院。这些作品使用主要旨在用于眼镜辅助观看的两视图格式(将显示给观看者的各个眼睛以便生成3D效果的左视图和右视图)。行业中存在对将这些3D作品带到家庭中的关注。同样,广播公司已开始对3D内容特别是实况运动事件的实验性传输。当前,针对数字视频广播(DVB)的标准正被调整为适于传送立体内容。当然在早期,将被使用的格式将是通常所使用的立体格式,所述立体格式包括将显示给观看者的各个眼睛以便生成3D效果的至少左视图和右视图,所述两个视图的数据例如以并排(SBS)或上下(TB)安排被格式化到2D视频帧中。包含所述3D左和右视图的所述2D帧经由现有(2D)视频信道被发送和接收。
用于生成2D视频数据的系统和设备是已知的,例如视频服务器、广播工作室或创作设备。当前需要用于提供3D图像数据的类似3D视频设备,以及,正在提出用于渲染(render)所述3D视频数据的补充3D视频设备,诸如处理接收的3D视频信号的机顶盒。所述3D视频设备可以耦接到诸如电视机或监视器的显示设备,以便经由合适的接口传送所述3D视频数据,所述接口优选是例如HDMI的高速数字接口。所述3D显示器还可以与所述3D视频设备集成,例如具有接收部件和3D显示器的电视(TV)。
背景技术
国际公共标准ISO/IEC14496-10“Informationtechnology–Codingofaudio-visualobjects–Part10:AdvancedVideoCoding”第五版2009-05-15,描述了例如用于数字视频广播(DVB)的视频信息的数字编码。视频数据定义将被显示的主视频的内容。辅助数据定义任何可以与主视频数据结合在一起被显示的其它数据,例如图形数据或字幕。所述标准以及进一步的相关文档还定义用于向接收器指示参数的控制数据,以便使接收器能够再现主视频数据和覆盖辅助数据,以及组装包括视频数据、辅助数据和控制数据的数据传输流以用于传输。AVC标准是一个示例;例如MPEG-2视频可以还用于高清,如在ISO/IEC13818-2运动图像(movingpictures)和关联音频信息的一般编码:视频,中描述的那样。
为实现对3D视频数据进行编码和传送,正在对上面的标准进行调整。特别地,已提议定义一种系统,所述系统用于指示3D视频信息经由2D视频信道被传输,被格式化到2D视频帧中,例如以所述并排(SBS)或上下(TB)的安排。因此,3D视频数据具有将显示给观看者的各个眼睛以便生成3D效果的至少左视图和右视图,以及辅助数据被安排在3D视频数据上的覆盖范围中显示。根据主安排中的2D传输格式将左视图和右视图的3D视频数据格式化到用于主视频数据的2D帧中。例如,在针对上面的ISO标准的修正案中,已提议通过定义新的补充增强信息(SEI)消息来扩展被称为SEI消息的控制数据消息,其中,该新SEI消息指示视频数据的左和右视图在2D视频帧中的空间交织以用作立体视频递送。所述空间交织可以例如是所述并排(SBS)或上下(TB)安排,或棋盘交织。
WO2009/078678描述了一种基于MPEG4的立体数据格式。该格式定义将被覆盖的视频数据和文本数据。在第一实施例中,文本节点被包括在场景描述符中。该第一实施例定义具有对应于左和右视点的两个文本的左字符串和右字符串字段。
此外,在第二实施例中,不同的文本节点被包括在场景描述符中。该第二实施例定义具有同样用于左和右视点这两者的一个文本的单一立体字符串字段和差异数据。
发明内容
所提出的经由2D视频信道的3D视频信息传送使主视频数据能够以3D被传送。然而,诸如字幕的任何辅助数据必须也被传送,例如使用用于字幕的DVB标准:ETSIEN300743-数字视频广播(DVB);字幕系统。应当指出,所述辅助数据被单独进行传送,例如在传输流中的辅助数据流中。被DVB提到的所述传输流的示例在以下标准中定义:ISO/IEC13818-1运动图像和关联音频信息的一般编码:系统。在接收端提供通常基于由用户选择的设置的辅助数据覆盖。可以考虑与主视频类似地例如也以SBS方式将辅助数据格式化到辅助安排中。然而,所述格式可以导致接收器处的困难或额外成本。
本发明的目的是提供一种用于传送包括辅助数据的3D视频信息的系统,该系统避免所述接收器处的困难和额外成本。
为此,根据本发明的第一方面,所述方法如在开篇描述的那样,进一步包括:
-提供将被覆盖在所述3D视频数据的左视图和右视图上的辅助数据的辅助左视图和辅助右视图,和所述辅助数据的2D版本,以及辅助差异数据,其中,所述辅助差异数据指示当被覆盖在所述左视图和所述右视图上时将应用于辅助数据的所述2D版本的差异,
-根据对应于所述主安排的辅助安排中的2D传输格式,将所述辅助左视图和所述辅助右视图的辅助数据安排在辅助数据流中,
-将所述2D版本的辅助数据安排在进一步的辅助数据流中,
-在所述传输流中包括所述进一步的辅助数据流、所述辅助差异数据和差异格式指示符,其中,所述差异格式指示符指示所述进一步的辅助数据流。
为此,根据本发明的进一步的方面,提供一种包括视频处理器的设备,其中,所述视频处理器用于:
-根据主安排中的所述2D传输格式,将所述左视图和所述右视图的3D视频数据安排在用于主视频数据的2D帧中,
-向接收器提供包括参数的控制数据,以便使所述接收器能够再现所述主视频数据和覆盖所述辅助数据,
-组装包括所述主安排中的3D视频数据、所述辅助数据和所述控制数据的数据传输流,
所述视频处理器被进一步安排用于:
-提供将被覆盖在所述3D视频数据的左视图和右视图上的辅助数据的辅助左视图和辅助右视图,和所述辅助数据的2D版本,以及辅助差异数据,其中,所述辅助差异数据指示当被覆盖在所述左视图和右视图上时将应用于辅助数据的所述2D版本的差异,
-根据对应于所述主安排的辅助安排中的2D传输格式,将所述辅助左视图和辅助右视图的所述辅助数据安排在辅助数据流中,
-将所述2D版本的辅助数据安排在进一步的辅助数据流中,
-在所述传输流中包括所述进一步的辅助数据流、所述辅助差异数据和差异格式指示符,其中,所述差异格式指示符指示所述进一步的辅助数据流。
同样,一种信号包括:根据主安排中的2D传输格式的、用于主视频数据的2D帧中的所述左视图和所述右视图的3D视频数据;包括用于接收器的参数的控制数据,以便使所述接收器能够再现所述主视频数据和覆盖所述辅助数据;以及包括所述主安排中的所述3D视频数据、所述辅助数据和所述控制数据的数据传输流以用于传输,所述信号进一步包括:
-将被覆盖在所述3D视频数据的左视图和右视图上的辅助数据的辅助左视图和辅助右视图,以及所述辅助数据的2D版本,以及辅助差异数据,其中,所述辅助差异数据指示当被覆盖在所述左视图和所述右视图上时将被应用于辅助数据的所述2D版本的差异,
-根据对应于所述主安排的辅助安排中的2D传输格式的、辅助数据流中的所述辅助左视图和所述辅助右视图的辅助数据,
-进一步的辅助数据流中的所述2D版本的辅助数据,
-以及,所述传输流中的所述进一步的辅助数据流、所述辅助差异数据以及差异格式指示符,其中,所述差异格式指示符指示所述进一步的辅助数据流。
同样,一种接收器包括用于接收所述信号的输入单元和视频处理器,所述视频处理器用于从所述进一步的辅助数据流检索所述辅助数据,同时丢弃在所述辅助数据流中提供的所述辅助安排中的所述辅助数据,以及,基于所述辅助数据的2D版本和所述辅助差异数据生成用于在所述3D视频数据上的覆盖范围中显示的覆盖数据。
同样,一种用于处理3D视频信息的计算机程序产品,其可运行为导致处理器执行如上面所定义的方法。
所述控制数据可以包括指示视频格式(SBS、TB等)的控制数据和包含所述辅助数据的差异的控制数据这两者。所述措施具有这样的效果:在对应于所述主视频安排的辅助安排中传递所述辅助数据。除此之外,同时还结合辅助差异数据在2D版本中传递所述辅助数据,其中,所述辅助差异数据指示当被覆盖在所述左视图和所述右视图上时将被应用于辅助数据的所述2D版本的差异。辅助数据的所述双重传输使任何接收器都能够检索辅助数据集合,所述辅助数据集合有助于对主视频和辅助数据的结合的方便3D渲染。有优势地,使遗留2D接收设备和新颖3D接收设备这两者都能够基于辅助数据的所述双重传输高效运行。此外,尽管被打包到所述辅助安排中的所述辅助视图的质量由于所述打包的降低的分辨率而可能是有限的,但由于具有完全分辨率的辅助差异数据和所述2D版本的出现,实现了渲染所述辅助信息的高质量。
本发明还基于以下认识。在通过将所述左视图和右视图的主视频帧打包到单一2D帧中而将现有2D传输系统扩展为用于3D时,可以存在看来类似的用于辅助数据的解决方案,即,通过例如并排地使用与所述主视频数据类似的辅助安排。发明人已注意到,该安排可以被普通视频处理体系结构处理,其中,所述普通视频处理体系结构通过首先对所述主视频和辅助数据进行解码以及然后进行覆盖来处理到来的主视频。直到此时为止,信号被当作2D信号,并且随后,将其缩放为所需的屏幕分辨率进行显示。如果所述3D视图被安排在所述2D帧中,则对缩放的步骤进行修改。假设所述左和右帧的顺序显示用于被相应眼睛经由快门眼镜(shutterglasses)进行观看。首先,所述左视图部分,例如采用SBS的帧的左半边,被取得,被粗化至屏幕分辨率并被显示。接下来,所述右视图部分,例如采用SBS的帧的右半边,被取得,被粗化至屏幕分辨率并被显示。在实践中,当使用遗留2D机顶盒(STB)和3DTV时,所述体系结构可以出现。所述机顶盒首先生成待显示的显示数据,例如以经由诸如HDMI的数字接口被传递。3DTV接收仍然采用SBS格式的所述显示数据。所述STB将把所述SBS辅助数据覆盖在SBS主视频上;所述3DTV将分离都被覆盖了相应的辅助数据的所述左视图和所述右视图。
然而,发明人已注意到,在其它3D接收器中,不同的体系结构可以出现。所述主视频数据被首先进行分析,并且,当左和右视图被安排在2D帧格式中时,所述视频数据被首先从2D帧中检索出并分离,以及随后被(重新)缩放以便再生成完全的左和右视图。已选择的辅助数据流可以然后被覆盖在所述左和右视图上。使用所述辅助安排中的所述辅助数据现在必需另外的步骤,诸如选择相应部分和粗化所述辅助数据。然而,具有完全分辨率的所述辅助数据的2D版本在不进行任何缩放的情况下被直接覆盖。相同的辅助数据被覆盖在所述左和右视图这两者上,仅在水平位置上相差称为差异的预定义的量。所述差异导致所述辅助数据的对应深度位置。当覆盖所述辅助数据的2D版本时将被应用的所述差异的值可直接经由所述辅助差异数据获得,所述辅助差异数据也被包括在所述传输流中。有优势地,可以进一步基于屏幕尺寸、观看距离或者进一步的观看参数或偏好对所应用的差异进行调整。下面参考图2至4提供对在渲染所述3D视频数据和辅助数据时各种处理环境的问题的详细阐述。
通过分析各种视频处理体系结构,发明人已注意到,在首先覆盖所述辅助数据并随后应用从所述2D帧中检索所述视图和进行缩放的体系结构中,处理所述2D和差异格式看来有问题。在所述体系结构中,必须添加另外的覆盖步骤,该步骤需要大量另外的处理硬件和/或软件。此外,所述辅助安排导致所述辅助数据的较低分辨率。发明人已研究所述降低的分辨率的影响,其看来对诸如图形对象或字幕的辅助数据更明显,而3D中的主视频较少受降低的分辨率的限制。所提出的解决方案,即,通过将所述辅助安排和带有辅助差异数据的所述2D版本这两者中的辅助数据包括在所述传输流中来改变所述传输系统,方便地消除了实践中使用的所述视频处理体系结构中的各种问题和缺点,同时在许多情况下允许经由软件更新对2D处理设备的升级。
最后,应当指出,通过添加同一辅助数据的第二版本而扩大经由所述传输流传递的数据量可以认为与常识相悖,但鉴于较小额外数据量和在使各种接收器体系结构适应高效地在3D视频上覆盖辅助数据时的重大优势,其仍然是可接受的。
在用于传递3D视频信息的系统的一个实施例中,所述控制数据包括根据所述2D传输格式的3D扩展的3D格式指示符,该指示符指示所述左视图和所述右视图的所述3D视频数据在所述2D帧中的安排。这具有优势:接收器直接知道2D帧中的3D视频数据的出现和格式。
在系统的一个实施例中,所述辅助安排仅由指示所述主安排的3D格式指示符指示。应当指出,所述辅助数据流实际上被不同于普通2D辅助数据流地进行格式化,而不存在任何另外或修改的指示所述差别的信令。这是有利的,因为所述视频传递信道中的任意遗留2D部件将不知道所述差别,并且将正常地传递或处理所述辅助数据。此外,根据本发明的新颖接收器可以基于检测所述主视频数据的安排来适应3D辅助数据,并对所述辅助数据应用对应的安排。
在系统的一个实施例中,所述辅助差异数据包括用于所述覆盖范围中的至少一个区域的区域差异数据,所述区域差异数据指示当被覆盖在所述左视图和右视图上时在相应区域中所述辅助数据的差异。这具有优点:区域的差异数据被高效地传递。
在系统的一个实施例中,所述辅助数据流包括对象,所述对象定义将被覆盖的图形对象的像素数据,并且,所述辅助数据流和所述进一步的辅助数据流包括对相同对象的引用,以便在所述辅助左视图、所述辅助右视图和/或所述辅助数据的2D版本之间共享所述各个相同的对象。所述对象定义实际像素数据,即,将被覆盖的图形数据的低层表示。所述实际像素数据需要辅助数据的全部中的较大部分。发明人已注意到,尽管字幕的左和右视图在所述辅助安排中必须被合并,但是,在维持DVB标准的约束的同时,相同对象可以在这两个视图中被使用。在所述标准的进一步扩展或其它系统中,所述对象可以还被用于所述2D版本,因为所述2D版本的内容等于所述左和右辅助视图安排的集合。在此情况下,所述对象可以被缩放为适应所述2D版本以及所述辅助左和右视图。有利地,额外辅助数据流总共所需的额外数据传递容量较小,因为所述对象被共享,并且对于相应图像覆盖必须被传送仅一次。
在所附权利要求中给出了根据本发明的设备和方法的进一步优选实施例,所附权利要求的公开通过引用包含于此。在针对特定方法或设备的从属权利要求中定义的特征对应地适用于其它设备或方法。
附图说明
通过参考以下描述中作为示例描述的实施例和参考附图,本发明的这些和其它方面将从中显而易见和被进一步阐明,其中:
图1A示出了用于传送三维(3D)视频信息的系统,
图1B示出了3D视频数据和辅助数据,
图2示出了接收设备中的视频处理系统,
图3示出了3D视频和辅助数据的安排,
图4示出了处理辅助安排,
图5示出了页面组成结构,
图6示出了组件描述符(的一部分),
图7示出了显示清晰度结构,
图8示出了区域组成结构,
图9示出了用于立体差异描述符的段类型,
图10示出了定义差异的分组化基本流(PES)数据分组,以及
图11示出了针对PES分组的数据标识符值。
附图是纯示意性的,并且未按比率绘制。在附图中,对应于已描述元素的元素具有相同标号。
具体实施方式
图1A示出了用于传送三维(3D)视频信息的系统。该系统具有发送器100,该发送器100提供将经由广播网络130发送的信号104。接收器110在输入单元112的输入111上从广播网络接收信号。接收器向3D显示设备120提供显示数据114,其中,3D显示设备120例如是3DTV或3D投影系统。接收器可以是单独的设备,诸如机顶盒(STB)或卫星接收器。可替换地,接收器110和3D显示器120被合并到单一设备中,该单一设备诸如是内置了数字调谐器和3D处理器的数字3DTV。
所述系统被安排为传送包括3D视频数据和辅助数据的3D视频信息105。例如在接收器100的主输入101上提供的3D视频数据包括将显示给观看者的各个眼睛以便生成3D效果的至少左视图和右视图。例如在接收器100的辅助输入102上提供的辅助数据被安排为在3D视频数据上的覆盖范围中显示,例如是字幕。应当指出,可以包括辅助数据的多个流。
在发送器侧,所述系统提供下面的功能。所述功能可以在发送器中的视频处理器103中被实现,但还可以在基于专用计算机程序的创作系统中被执行。
通过根据主安排中的2D传输格式将左视图和右视图的3D视频数据安排在用于主视频数据的2D帧中,对主视频进行处理。3D视频数据在2D帧中的所述打包通常称为帧打包。根据适用的传输标准,系统提供用于向接收器指示参数的控制数据,以便使接收器能够再现主视频数据和覆盖辅助数据。最后,组装信号104中的数据传输流,包括经由广播网络130传输的控制数据、主安排中的3D视频数据和辅助数据。
所述系统进一步涉及提供将被覆盖在3D视频数据的左视图和右视图上的辅助数据的辅助左视图和辅助右视图,以及,根据对应于主安排的辅助安排中的2D传输格式将辅助左视图和辅助右视图的辅助数据安排在辅助数据流中。辅助数据流被包括在上面指示的传输流中。
在一个实施例中,例如辅助左视图和辅助右视图中并排的字幕的辅助安排被填入可用于字幕的数据空间中。在DVB中,借助于显示清晰度段,可以设置显示配置。在全HD服务中,存在3个使用DVB字幕的选项:
a)图形分辨率是720×576,并且被向上转换为全HD分辨率的服务。
b)图形分辨率是720×576,并且被放置在全HD视频的中央。
c)图形分辨率是1920×1080,与HD服务的分辨率相同。
在a)中,一个视图仅具有360个用于字幕的像素,因为屏幕必须被拆分为两半。360个像素通过粗化(upscaling)被伸展到屏幕宽度,因此分辨率较低。对于DVB,选项b导致字幕仅在左和右视图的一小部分(少于一半)上。选项c)如此精细。然而,进一步的限制被列出,例如,将要使用最大720个像素的实际显示的区域,以及在水平线上仅允许一个区域(没有任何区域彼此相邻)。然而,至少一个或两个限制都可以被消除,以便如果必要则在固件升级之后以提高的质量水平提供将被覆盖在SbS主视频上的SbS字幕。
另外,辅助数据的2D版本和辅助差异数据也被包括在传输流中,其中,辅助差异数据指示当被覆盖在左视图和右视图上时将被应用于辅助数据的2D版本的差异。因此,包括了相同辅助数据的第二版本,例如安排在单独的进一步辅助数据流中。应当指出,有利地,进一步的辅助数据流可以遵循2D传输格式,以便不干扰也接收信号的遗留2D接收器。然而,可以将辅助差异数据存储在传输流中可用的数据结构中的各种位置中,如下面阐述的那样。最后,进一步的辅助数据流、辅助差异数据和差异格式指示符被包括在传输流中。差异格式指示符指示进一步的辅助数据流,例如,指示进一步的辅助数据流中辅助数据的出现和特定格式。
如上面所描述的用于传送3D视频信息105的信号104经由广播网络130被传送,其中,广播网络130例如是公共TV传输网络、卫星网络、互联网等。在信号中,传输流代表3D视频信息105。根据主安排中诸如DVB的2D传输格式安排主视频数据的2D帧中的左视图和右视图的3D视频数据。另外,可以扩展2D传输格式,其是通过添加用于3D视频信息的数据结构的定义和对应的控制数据,所述控制数据用于向接收器指示参数以便使接收器能够再现主视频数据和覆盖辅助数据。数据传输流包括主安排中的3D视频数据、辅助数据和控制数据以用于传输。信号进一步包括如上面所描述的辅助左和右视图以及辅助数据的2D版本以及辅助差异数据。根据对应于主安排的辅助安排中的2D传输格式将辅助左视图和辅助右视图的辅助数据打包到辅助数据流中,以及,将2D版本的辅助数据打包到进一步的辅助数据流中。传输流包含进一步的辅助数据流、辅助差异数据和差异格式指示符,其中,差异格式指示符指示进一步的辅助数据流。
接收器110具有用于从广播网络接收信号的输入单元112,如上所述。传输流被检索并耦接到视频处理器113,以便从进一步的辅助数据流中检索辅助数据,同时丢弃辅助数据流中提供的辅助安排中的辅助数据。如下面详细阐述的那样,视频处理器进一步基于辅助数据的2D版本和辅助差异数据生成用于在3D视频数据上的覆盖范围中显示的覆盖数据。
图1B示出了3D视频数据和辅助数据。视频数据具有左视图150和右视图151。两个视图都被示为具有辅助信息的覆盖。左视图具有辅助数据160,该辅助数据160是在水平起始位置X处示出的表明红色和绿色的字幕,以及,右视图具有辅助数据161,即在水平起始位置X-n处示出的同一字幕。值n代表字幕的左与右版本之间的差异。该图示出了立体图像,作为具有组合在视频之上的2D字幕的电影中的立体帧的代表,同时应用水平偏移n来设置字幕的深度。
用于广播立体视频的主要内容递送平台中的一个是普通数字电视频道,在本文档中进一步称为数字视频广播(DVB)。DVB应用各种针对陆地、线缆、卫星和移动的、用于音频/视频、图形(字幕等)和交互式应用(HTML/XML的Java应用)的传输和关联信令的标准。显示技术的当前进步正使得可能为大量市场观众引入3D视频。因此,为实现3D内容的广泛分发,DVB标准应当被扩展为允许3D内容的广播。
3D内容相比于2D内容必需多得多的存储、带宽和处理。因此,正在研究这样的解决方案,所述解决方案以最小额外成本提供3D体验,并且与机顶盒(STB)的当前安装基础兼容。正研究的解决方案中的一个是将现有高级机顶盒扩展为,允许其通过将立体图像的左和右视图按帧打包在2D帧中来回放3D。
立体视频还必需诸如字幕的立体辅助数据。在本文档中,将使用字幕作为辅助数据的示例。辅助数据可以进一步是将被覆盖在主视频上的任意类型的额外图形数据。在决定在视频之上的水平、竖直和深度方向上的何处放置字幕时,字幕在立体视频上的覆盖需要特别小心。如果未正确地完成,则字幕覆盖可以干扰背景视频导致视觉假象(artifacts),并且在字幕的边界处创建冲突的深度暗示。当在字幕的位置处字幕的深度小于视频的深度时,这可能发生。字幕阻隔视频的部分,因此大脑预期字幕在视频的前面。此外,因为字幕被复制到视频之上,所以看起来就像在字幕边缘处字幕刺穿视频创建假象。
字幕的正确放置可以经由以下来完成:改变立体字幕的左和右图像的差异,以及确保该差异或“深度”比视频的深度更靠近观看者。这样调整字幕的差异的缺点是,其必需在创作期间对图像进行处理,以及,其必需使用立体字幕,这使回放设备中的带宽和处理加倍。
一种可替换方法是使用2D字幕,并且将字幕复制到立体视频的左和右图像这两者之上。这经由以下来起作用:将字幕复制到立体视频的左图像部分上,并且在将其复制到立体视频的右图像部分上之前在水平方向上移动该字幕。通常称为差异的、左和右视图之间对象的水平位移量确定字幕的深度,并且该值应当高于字幕位置处视频的差异。
伴随对基于DVB的系统实现立体字幕的问题是与现有2D视频分配链的兼容性。一个选项是使用这样的立体字幕,所述立体字幕使用与视频相同的打包格式,例如上下、并排等。在本文档中将所述打包称为辅助安排。
图2示出了接收设备中的视频处理系统。设备可以例如是数字电视机或机顶盒。输入单元201包括用于例如从线缆网络、卫星天线等接收视频广播信号的解调器。解调器从输入信号中检索传输流,其耦接到解多路复用器单元202,其还可以包括用于从传输流中检索各种数据流和控制数据的解扰器。数据流被耦接到用于对视频和音频数据进行解码的主解码器203以及用于对辅助数据和控制数据进行解码的辅助解码器204。所述解码器和进一步的单元经由系统总线209耦接到中央处理单元(CPU)、图形处理器206、存储器207以及例如根据HDMI或LVDS等的输出级208。
在某些实现中,视频和字幕的处理管道是不同且分离的。例如A/V解码和图形处理(过滤操作等)的处理和高带宽操作在专用ASIC中完成,而例如字幕的低带宽信息的处理由低功耗通用处理器完成。直到处理管道完全结束之前,字幕和视频都不被合并(combine)。
因为在某些实现中,图200中的几个框被合并到单一硬件单元中,所以对于结合3D视频提供字幕可能出现某些无法预料的问题。
如果不存在任何用于字幕的信令并且字幕是2D的,则回放设备将假设字幕应当被复制到视频的左和右这两边上,在所述情况下,字幕将被放置在屏幕深度处,并且,如果字幕位置处的立体视频来到屏幕之外则可以干扰立体视频。已提议在左和右字幕之间具有合适差异的情况下使用立体字幕,从而立体字幕出现在视频前面。对于字幕,将使用与用于视频的相同的打包方法,以便使得可能在现有的用于2D的分配链中传送字幕。如上面所述,辅助数据被打包到对应于3D视频数据的主安排的辅助安排中。
图3示出了3D视频和辅助数据的安排。该图示出了立体视频的左视图301和右视图302。在水平方向上按50%对视图301、302进行二次抽样,以便适应一个2D帧303。主安排的打包方法称为并排(SBS)。诸如上下或棋盘的其它安排也是可能的。同样的安排被应用于左视图304和右视图305中的字幕,其导致辅助安排306。主和辅助安排这两者都然后被传送给接收设备,所述接收设备例如是具有集成接收器的诸如机顶盒或TV的回放设备。
在例如实现了3D的TV的、具有集成接收器的回放设备的一个实施例中,视频处理器体系结构可以根据图2,其中框206和203被集成在一个ASIC中。首先讨论在不应用本发明的情况下所述实施例的失灵。在ASIC中,SBS视频帧307将被拆分成左部分308和右部分(未示出)。首先,左部分在被复制到帧缓冲器之前被复制并粗化(upscale)回其初始尺寸309。在实施例中,字幕将由框205、CPU进行处理,并被复制到帧缓冲器中视频之上。针对左帧的错误结果310在该图中示出,因为是在字幕被添加之前对视频实施缩放和处理,所以被合并的左和右已合并SBS字幕以都在左帧上告终。对于右帧,可以发生相同的情况。
为避免上面的错误结果,为回放设备的一个实施例配备了修改的处理顺序。必须在SBS视频和字幕的左和右图像部分被复制到帧缓冲器并缩放回初始尺寸之前,将SBS字幕复制到SBS视频上。
图4示出了处理辅助安排。该图给出了使用上面修改的处理顺序的处理的表示。首先,主安排401中的视频被示为由A/V解码器203进行解码,其被复制到帧存储器中。辅助安排404中的字幕由数据解码器204进行解码,并随后被CPU205复制到帧存储器中视频图像上。然后,对于立体输出的左帧,图形处理器206复制合并了视频和字幕的帧存储器的左部分,如由矩形402所示。然后,图形处理器206将所述左部分扩展至其初始尺寸,并且将结果复制到输出帧缓冲器中。已示出了产生的左视图403。
应当指出,如在左视图403中可见,输出上的字幕的质量有限。这是合理的,因为已在发送之前按50%对字幕进行了二次采样,并在回放设备中粗化至正常尺寸。此外,在通常可用的回放设备中,改变处理步骤的顺序以允许与视频一起对字幕进行处理是不简单的,因为系统总线209的带宽不是高到足以支持视频图像数据向ASIC和从ASIC到存储器的频繁复制。因此,尽管该安排提供正确的字幕,但可能不是在每种情况下都令人满意。
由于在不同回放设备中字幕和视频被处理所采用的方式不同,所以出现上面的问题。为提供改进的字幕和高效的处理,已提议在辅助安排中不仅使用立体字幕,而在流中另外还提供2D字幕和信令,使得回放设备可以确定如何在没有由深度冲突导致的假象的情况下将字幕合成在立体视频之上。
在诸如DVB系统的实践系统中,存在几种用于发送例如字幕的图形或文本的方式。最常见的是使用DVB字幕标准(ETSIEN300743)或如在广播简档MHEG-5(多媒体&超媒体专家组;ETSIES202184)所描述的额外数据,其它方法可以使用电视文本(teletext)。可以如在DVB-SI标准(DVB服务信息规范;ETSIEN300468)中定义的那样发送信令参数。所述系统需要一种解决方案,所述解决方案用于指示,如何以不需要对遵循DVB的回放设备的现有硬件平台进行修改的方式将例如字幕的图形覆盖在立体视频上。在下面的小节中,讨论用于辅助数据和辅助差异的信令格式的各种选项。
在遵循DVB的机顶盒或TV中,由低功耗通用处理器与视频分离地对字幕进行处理,其还承担在信令参数被发送时检测和解释信令参数的责任。因此,合适的解决方案是,与在视频基本流中发信令相反,在字幕流内或字幕信令中承载差异信令。
DVB字幕标准定义三种类型的称为段的信令信息来信号通知文本或图形对象的放置。显示清晰度段信号通知预期的显示尺寸。页面组成信号通知文本和图形如何被放置在视频帧上。区域组成段将帧划分为两个不覆盖的区域。包含文本或图形的对象可以在不同页面和区域中被使用和重用。
因为在DVB字幕中,区域可以被放置在帧中的不同位置处,所以针对该区域中的图形或文本的每区域差异可以不同。在一个实施例中,例如作为偏移参数按区域对辅助差异进行传递。下面描述以兼容方式完成此的选项。
所需的偏移量可以相当有限,100个像素的左图像与右图像之间的差异通常将足够。由于移位可以被对称地完成,所以保存差异的字段仅需要指示像素移位的一半。因此,6位应当足够用于多数用途。
图5示出了页面组成结构。该图示出了以一系列字段表示页面组成结构50的表。指示了段类型和段长度,以及在字段page_id中指示了结构应用于的页面。在一个实施例中,差异数据的出现在进一步的字段reservedA51中指示。
在一个实施例中,辅助差异数据包括针对覆盖区域中的至少一个区域的区域差异数据,其指示当被覆盖在左视图和右视图上时相应区域中的辅助数据的差异。图5中的表在While循环中示出了许多区域的定义。对于每个区域,提供了字段region_id中的标识以及水平和竖直地址字段中的位置。
在一个实施例中,辅助数据流包括页面组成结构50,所述页面组成结构50定义将被显示在覆盖区域中的辅助数据的页面的组成。页面组成结构50具有至少一个区域定义53,区域定义53定义相应区域的位置和区域差异数据。
考虑图7中的显示清晰度段和图8中的区域组成段,可以看到仅有不足以用于精确指示差异字段的少量可用位。然而,在图5中所示的页面组成段中,存在每区域的循环,该循环定义一系列区域定义53。在该针对每区域的循环中,字段reservedB52中保留了8位。所述8位足以指示应用于该区域的差异或偏移。辅助差异的值在进一步的字段reservedB52中指示。在该字段中,Subtitle_disparity差异对于正差异(将左视图向左以及右视图向右移位)可以由0-127表示以及对于负差异可以(将左视图向右以及右视图向左移位)由128-255表示。
除接收字幕差异之外,回放设备必须能够识别哪个字幕流承载差异数据。在一个DVB中的实施例中,使用了节目映射表(DVB服务信息规范;ETSIEN300468)。节目映射表或PMT定义哪些流是广播中的节目的一部分。PMT还包括用于描述各种流的所谓的“组件描述符”,使得回放设备知道在每个流中出现哪些数据。
图6示出了组件描述符(的一部分)。该图示出了定义流的内容的组件描述符表60。流内容字段标识数据的类型,例如0用于视频、1用于音频以及2用于字幕数据。Component_type类型61指示格式,在字幕的情况下,指示字幕的种类,例如用于21:9显示的字幕或针对耳背的字幕。值的完整列表可以在ETSIEN300468的表26中找到。例如0x14的新组件类型值将被包括进来以指示字幕流承载差异数据。因此,在传输流中,进一步的辅助数据流被包括进来,同时新组件类型值提供指示该进一步的辅助数据流的差异格式指示符。应当指出,可以可替换地以不同方式来提供差异格式指示符,例如通过在传输流中添加或修正相应控制数据。
在一个实施例中,传输流的控制数据包括根据2D传输格式的3D扩展的3D格式指示符。3D格式指示符指示左视图和右视图的3D视频数据在2D帧中的所述主安排。2D传输标准的一个示例是早先提到的标准ISO-IEC14496-10。在一个修正中,3D格式指示符可以被添加到该标准,例如,在指示空间交织的新补充增强信息(SEI)消息中。3D格式指示符可以进一步定义辅助信息的格式。
在进一步的实施例中,辅助安排仅由指示主安排的3D格式指示符指示。因此,除基本上定义主安排的3D格式指示符之外,传输流中不包括任何明确指示辅助安排的进一步的控制数据。当没有进一步的指示符出现时,接收器不得不假设辅助信息必须具有对应于主安排的辅助安排。
应当指出,现有的无3D功能的回放设备将不识别如图6中所定义的新组件类型,并且因此将使用2D字幕流和2D视频。因此,如果视频和字幕被格式化为并排或上下的,则这将在所述遗留设备中起作用,例如现有的联接到3DTV的具有HD功能的机顶盒。STB将正确覆盖字幕,而3DTV将拆分图像并粗化左和右视图。
图7示出了显示清晰度结构。该图示出了在一系列字段中表示显示清晰度结构70的表。指示出了段类型和段长度,以及字段page_id中的该结构应用于的页面。该结构定义了辅助数据的页面的覆盖区域,如在字段display_window中定义的,其定义覆盖区域的位置。字段reserved71中仅少量位可用于指示辅助数据安排。
在可替换实施例中,定义了显示清晰度段中的额外字段。在该实施例中,辅助数据流包括显示清晰度结构70。在该额外字段中,定义了应用于覆盖区域的辅助差异数据。
图8示出了区域组成结构。该图示出了在一系列字段中表示区域组成结构80的区域组成段表。指示出了段类型和段长度,以及字段page_id中的该结构应用于的页面。在许多字段中,位可用于指示辅助数据安排,特别是字段reserved-181中的3位、字段reserved-282中的2位、字段reserved-383中的2位以及字段reserved-484中的4位。
为在区域组成段中定义差异格式,图8中所示的区域组成段具有如在下方的一系列对象定义85中定义的每对象的4个保留位,每个对象具有字段reserved-4。这靠其自身可以足以用于指示差异。然而,可替换地,这些可以用于以像素精度指示相对于区域的位置的、每对象偏移或差异。
在区域组成段表80的剩余部分中,存在某些其它保留字段。这些其它保留字段81、82、83可以用于指示每区域偏移。例如以双像素精度使用字段81中保留的3位时这可能较不精确,而字段82中的2位指示偏移的符号,以及字段83中的2位指示区域段包含偏移字段。
另一可替换实施例将定义新段类型,立体差异描述符。通过新段类型,我们不限于使用保留字段。
图9示出了用于立体差异描述符的段类型。该图示出了表90。称为差异段的该新段类型具有与图7和8中所示的其它段中类似的对应字段(从ETSIEN300743中同样可知)。在第一个新字段91中,提供了字幕差异值。Subtitle_disparity差异对于正差异(将左视图向左以及右视图向右移位)可以由0-127指示以及对于负差异(将左视图向右以及右视图向左移位)可以由128-255指示。在进一步的新字段中,可以提供其它差异值,诸如用于屏幕上显示数据的差异的第二个新字段92。
OSD_disparity可以使用与字幕差异相同的定义,但可以被内容作者用作给予回放设备的用于确定在何处放置任何OSD的提示。值0&FF可以指示没有任何辅助数据出现。
在进一步的实施例中,将讨论对屏幕上显示(OSD)的处理。在正常运行期间,响应于由用户、CI系统导致的或来自广播信道的事件,接收器可以不得不向用户显示某种屏幕上显示消息(OSD)。在3D传输期间,在错误的屏幕深度显示该相同的OSD可以导致其不可读。在3D传输期间,以下至关重要:接收器知道在什么深度放置OSD,并且如果不能找到任何合适的深度,则接收器可以将整个视频“向回”移位或切换到2D。接收器需要的关于传输的信息是3D图片的“体积”,其可以根据“最小和最大”差异来表述。“最大”差异是离开用户的距离,大正数,以及,“最小”差异是去往用户的距离,大负数。最小差异可以被接收器用于确保其OSD甚至更靠近用户。然而,如果其变得太靠近,则最大差异可以被使用,使得接收器可以选择在屏幕后将整个视频向后移位。然而,接收器从不可以将视频移位超过“无限”,因此在此情况下,接收器可以选择将视频切换到2D。在选择向何处通信最小和最大差异时,不得不考虑广播器的能力。广播器当然在实况传输期间从不可以实时地发送该传输的准确最小和最大差异,因为这改变得非常快。同样,根据实验已知,OSD也不应当迅速改变差异,特别如果其仅通信在几分钟内不变的消息的话。基于广播器能力和可读性,将用于最小和最大差异的逻辑位置在EIT中,或者如果服务总是3D的话,则在SDT中。如果在2D与3D之间切换服务,或者如果事件可以大大改变差异范围的话,则EIT是合适位置。如果服务总是3D的,并且广播器保持其自身在特定差异限制上的话,则SDT是更好的位置。只有服务不总是3D,PMT也是可能的位置,但是如果其改变,则在许多事件之后改变;基本在导致PMT版本更新的“流类型”改变期间。
本文中给出了用于处理OSD显示的实施例的详细实现。应当指出,可以独立于字幕处理地采用这些用于实现OSD处理的措施。在接收器希望将屏幕上显示信息正确覆盖在立体3D之上的情况下,其需要关于3D视频的深度范围的信息。该描述符经由像素移位来标识深度范围。此处标识的像素移位与视频分辨率一起定义在该描述符被包含的事件期间视频的体积包围(volumertricenclosure)。通过视频的体积信息,接收器可以选择许多方式来正确显示OSD信息。其可以在在前面显示OSD之前在屏幕后将整个视频向后移位。其可以还确定,体积太大,并且需要切换到2D。其可以还确定,体积小到足以在不影响视频深度的情况下恰好将OSD放在前面。
相关字段是标识最大水平移位的Maximum_horizontal_shift,其对应于“最远”,而minimum_horizontal_shift标识最小水平移位,其对应于“最近”对象。
例如,水平移位值指示在每个视图中在水平方向上按像素数量的水平移位。零值意味着不应用任何移位。在水平移位值为负的情况下,所有标识的像素在左视图中被向右移位以及在右视图中被向左移位。在水平移位值为正的情况下,所有标识的像素在左视图中被向左移位以及在右视图中被向右移位。像素的尺寸是如由视频在PES层标识的水平显示像素宽度中的一个。然而,可以考虑其它单位(例如屏幕尺寸的百分比)。
返回描述差异段的实施例,在进一步的实施例中,差异段被应用于传递字幕差异,即,在具有带辅助差异数据的2D字幕的视频数据流中,可以或者可以不将其与提供相同字幕的辅助安排合并。因为所述差异段是在分组基本流(PES)中,所以每秒可以发送许多不同的差异段。可替换地,差异段可以包含一列差异,所述差异带有暗含或明确的与开始计时相关的相关计时信息。
有利地达到了对差异的非常动态的控制。如图9中所示,差异段将包含字幕差异信息,并且可以另外包含OSD差异。该段可以还被扩展为标识特定区域和/或对象的差异。在所述差异段中,经由相应region_id来标识区域。实际区域的page_id将等于新差异段的page_id。此外,在扩展的段中,经由相应object_id来标识对象。在扩展的差异段中,可以存在一列对象和区域,每个具有其优选的差异。对于辅助安排,可以通过用对象的新水平位置值更新region_composition_segment来达到深度位置的动态行为,因为水平位置对应于差异。
动态行为的优势在于,字幕的差异(深度)可以以逐帧为基础被更新。这由于下面的原因是有用的。视频与字幕之间的深度冲突应当被避免,因为其确实有损害。然而,将字幕放置得在屏幕前方太多以避免任何可能的冲突对于观看者是极其不舒服的。因此,发明人已注意到对字幕平滑地来回移动的需求。同样,当观看电影时,观看者的眼睛在人物谈话与字幕之间切换。如果字幕在与人物不同的深度处,则难以来回切换。因此,将字幕放在与人物相同的深度处(如果可能,同时试图避免深度冲突!)是最好的。但人物可以移动深度位置,因此,字幕应当与其一起移动。
在一个实施例中,辅助数据流包括定义将被显示在覆盖区域中的辅助数据的页面中的区域的组成的区域组成结构,所述区域组成结构包括一系列对象结构,对象结构定义图形对象的位置,并且对象结构包括含有辅助差异数据的差异对象。
定义了新object_type来携带差异数据。在DVB字幕中,在object_data_fragments上承载用于字幕的像素数据。2D标准支持位图或字符对象。对于3D,这可以用仅承载差异数据的新对象扩展。对象的数据部分可以由指示关联页面和区域的差异的单一字节、或描述关联区域或甚至对象的每像素差异的完整位图组成。
在一个实施例中,辅助数据流包括对象,所述对象定义例如上面定义的将被覆盖的图形对象的像素数据。辅助数据流和进一步的辅助数据流现在使用对相同对象的引用,以便在辅助左视图、辅助右视图和/或辅助数据的2D版本之间共享各个相同的对象。所述引用可以应用于其它流,例如提供引用其它流的对应页面的相对寻址信息。可替换地,这两个流可以被合并为单一的多路复用流。
DVB字幕流中信号通知以指示字幕的偏移或差异是合适的解决方案,但具有这一缺点:其不直接提供用于MHEG或电视文本的差异信令,MHEG或电视文本这两者可以也被用于字幕。
图10示出了定义差异的分组基本流(PES)数据分组。该图示出了表示PES分组的表95。同样,分组基本流(PES)数据分组在ISO/IEC13818-1中定义。在一个可替换实施例中,提议定义在PMT中单独信号通知的新PES数据分组,其定义每视频帧或呈现时间戳(PTS)的差异,例如额外字段96中所指示的。基于该描述符,回放设备可以确定对字幕或图像对象应用多少偏移。
字段Video_min_disparity可以具有0-255的值,用于指示在该PES分组的PTS处视频的负差异(左帧向右以及右帧向左移位)。Data_identifier字段97可以指示该新类型的PES分组。可以在保留字段的一个中为数据标识符指派新值,以指示“差异信令描述符”。
图11示出了用于PES分组的数据标识符值。该图示出了具有指示各种类型的PES分组的值的表98。数据标识符值是8位值,其标识在PES分组中承载的数据的类型。将添加新值来指示“差异信令描述符”。
应当指出,本发明可以使用编程部件在硬件和/或软件中实现。一种用于实现本发明的方法具有对应于针对参考图1描述的系统定义的功能的步骤。
尽管已主要通过使用经由DVB的广播的实施例阐述了本发明,但本发明还适于例如经由互联网的、任何经由数字信道的视频分配。
应当认识到,上面的描述为清楚起见已参考不同功能单元和处理器描述了本发明的实施例。然而,应当显而易见,在不违反本发明的情况下,可以使用功能在不同功能单元或处理器之间的任何合适分布。例如,被示为由单独的单元、处理器或控制器执行的功能可以由相同的处理器或控制器执行。因此,对特定功能单元的引用将仅被看作对用于提供所描述功能的合适装置的引用,而非指示严格逻辑或物理结构或组织。本发明可以以包括硬件、软件、固件或这些的任意组合的任意合适形式来实现。
应当指出,在本文档中,词语“包括”不排除所列出那些之外的其它单元或步骤的出现,以及,单元前面的词语“一”或“一个”不排除多个所述单元的出现;任何引用符号不限制权利要求的范围;本发明可以借助于硬件和软件这两者来实现;以及,若干“装置”或“单元”可以由同一件硬件或软件来代表,以及,处理器可以可能与硬件单元协作地完成一个或多个单元的功能。进一步地,本发明不限于所述实施例,并且本发明存在于在上面描述或在相互不同的从属权利要求中陈述的每个新颖特征或特征组合中。
Claims (13)
1.一种处理三维[3D]视频信息以便生成用于根据2D传输格式传递所述3D视频信息的数据传输流的方法,
-所述3D视频信息包括3D视频数据和辅助数据,所述3D视频数据包括将被显示给观看者的各个眼睛以便生成3D效果的至少左视图和右视图,
所述辅助数据被安排为,用于在所述3D视频数据上的覆盖范围中显示,所述方法包括:
-根据主安排中的所述2D传输格式,将所述左视图和所述右视图的3D视频数据安排在用于主视频数据的2D帧中,
-向接收器提供包括参数的控制数据,以便使所述接收器能够再现所述主视频数据和覆盖所述辅助数据,
-组装包括所述主安排中的所述3D视频数据、所述辅助数据和所述控制数据的所述数据传输流,
其特征在于,所述方法进一步包括:
-提供将被覆盖在所述3D视频数据的所述左视图和所述右视图上的、所述辅助数据的辅助左视图和辅助右视图,以及所述辅助数据的2D版本,以及辅助差异数据,其中,所述辅助差异数据指示当被覆盖在所述左视图和所述右视图上时将被应用于辅助数据的所述2D版本的差异,
-根据对应于所述主安排的辅助安排中的2D传输格式,将所述辅助左视图和所述辅助右视图的辅助数据安排在辅助数据流中,
-将所述2D版本的辅助数据安排在进一步的辅助数据流中,
-在所述传输流中包括所述进一步的辅助数据流、所述辅助差异数据和差异格式指示符,其中,所述差异格式指示符指示所述进一步的辅助数据流。
2.根据权利要求1的方法,其中,所述控制数据包括根据所述2D传输格式的3D扩展的3D格式指示符,所述3D格式指示符指示所述左视图和所述右视图的3D视频数据在所述2D帧中的所述主安排。
3.根据权利要求2的方法,其中,所述辅助安排仅由指示所述主安排的所述3D格式指示符指示。
4.根据权利要求1的方法,其中,所述辅助差异数据包括用于所述覆盖范围中的至少一个区域的区域差异数据,所述区域差异数据指示当被覆盖在所述左视图和所述右视图上时在所述相应区域中所述辅助数据的差异。
5.根据权利要求4的方法,其中,所述辅助数据流包括定义将被显示在所述覆盖范围中的辅助数据的页面的组成的页面组成结构,所述页面组成结构包括至少一个区域定义,所述区域定义定义相应区域的位置和所述区域差异数据。
6.根据权利要求4的方法,其中,所述辅助数据流包括定义辅助数据的页面中的区域的组成的区域组成结构,所述区域组成结构包括所述区域的所述区域差异数据。
7.根据权利要求1的方法,其中,所述辅助数据流包括区域组成结构,其中,所述区域组成结构定义将被显示在所述覆盖范围中的辅助数据的页面中的区域的组成,所述区域组成结构包括一系列定义图形对象的位置的对象结构,并且所述对象结构包括包含所述辅助差异数据的差异对象,或者,所述辅助数据流包括显示清晰度,其中,所述显示清晰度定义辅助数据的页面的覆盖范围,所述显示清晰度定义所述覆盖范围的位置和所述辅助差异数据。
8.根据权利要求1的方法,其中,所述辅助数据流包括对象,其中,所述对象定义将被覆盖的图形对象的像素数据,以及所述辅助数据流和所述进一步的辅助数据流包括对相同对象的引用,以便在所述辅助左视图、所述辅助右视图和/或所述辅助数据的2D版本之间共享相应相同对象。
9.根据权利要求1的方法,其中,所述传输数据流包括根据所述2D传输格式的3D扩展的额外段类型,所述额外段类型包括包含所述辅助差异数据的立体差异描述符。
10.根据权利要求1的方法,其中,所述传输数据流包括根据所述2D传输格式的3D扩展包括所述辅助差异数据的分组基本流[PES]数据分组。
11.根据权利要求1的方法,其中,所述辅助数据包括字幕。
12.一种用于处理三维[3D]视频信息以便生成用于根据2D传输格式传递所述3D视频信息的数据传输流的设备(100),
-所述3D视频信息包括3D视频数据和辅助数据,
所述3D视频数据包括将被显示给观看者的各个眼睛以便生成3D效果的至少左视图和右视图,
所述辅助数据被安排为,用于在所述3D视频数据上的覆盖范围中显示,
所述设备包括视频处理器(103),所述视频处理器(103)用于
-根据主安排中的所述2D传输格式,将所述左视图和所述右视图的3D视频数据安排在用于主视频数据的2D帧中,
-向接收器提供包括参数的控制数据,以便使所述接收器能够再现所述主视频数据和覆盖所述辅助数据,
-组装包括所述主安排中的所述3D视频数据、所述辅助数据和所述控制数据的所述数据传输流,
其特征在于,所述视频处理器进一步被安排为,
-提供将被覆盖在所述3D视频数据的所述左视图和所述右视图上的所述辅助数据的辅助左视图和辅助右视图,以及所述辅助数据的2D版本,以及辅助差异数据,其中,所述辅助差异数据指示当被覆盖在所述左视图和所述右视图上时将被应用于辅助数据的所述2D版本的差异,
-根据对应于所述主安排的辅助安排中的所述2D传输格式,将所述辅助左视图和所述辅助右视图的辅助数据安排在辅助数据流中,
-将所述2D版本的辅助数据安排在进一步的辅助数据流中,
-在所述传输流中包括所述进一步的辅助数据流、所述辅助差异数据和差异格式指示符,其中,所述差异格式指示符指示所述进一步的辅助数据流。
13.用于处理三维[3D]视频信息的接收器(110),
-所述3D视频信息包括3D视频数据和辅助数据,
所述3D视频数据包括将被显示给观看者的各个眼睛以便生成3D效果的至少左视图和右视图,
所述辅助数据被安排为,用于在所述3D视频数据上的覆盖范围中显示,
其特征在于,所述接收器包括:
-输入单元(112),其用于接收如在权利要求12中定义的传输流,以及
-视频处理器(113),其用于:
从所述进一步的辅助数据流中检索所述辅助数据,同时丢弃所述辅助数据流中提供的所述辅助安排中的辅助数据,以及
基于所述辅助数据的2D版本和所述辅助差异数据,生成用于在所述3D视频数据上的覆盖范围中显示的覆盖数据。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10169203.6 | 2010-07-12 | ||
EP10169203A EP2408211A1 (en) | 2010-07-12 | 2010-07-12 | Auxiliary data in 3D video broadcast |
EP10188536.6 | 2010-10-22 | ||
EP10188536 | 2010-10-22 | ||
PCT/IB2011/052993 WO2012007876A1 (en) | 2010-07-12 | 2011-07-06 | Auxiliary data in 3d video broadcast |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103026713A CN103026713A (zh) | 2013-04-03 |
CN103026713B true CN103026713B (zh) | 2016-02-24 |
Family
ID=44501769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180034477.6A Active CN103026713B (zh) | 2010-07-12 | 2011-07-06 | 3d视频广播中的辅助数据 |
Country Status (11)
Country | Link |
---|---|
US (1) | US9986220B2 (zh) |
EP (1) | EP2594079B1 (zh) |
JP (1) | JP5960133B2 (zh) |
KR (1) | KR101819736B1 (zh) |
CN (1) | CN103026713B (zh) |
BR (1) | BR112013000580B1 (zh) |
ES (1) | ES2670663T3 (zh) |
MX (1) | MX2013000348A (zh) |
RU (1) | RU2589307C2 (zh) |
TW (1) | TWI568239B (zh) |
WO (1) | WO2012007876A1 (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102484729B (zh) * | 2009-04-07 | 2016-08-24 | Lg电子株式会社 | 广播发送器、广播接收器及其3d视频数据处理方法 |
JP2013066075A (ja) * | 2011-09-01 | 2013-04-11 | Sony Corp | 送信装置、送信方法および受信装置 |
US9872008B2 (en) * | 2012-01-18 | 2018-01-16 | Panasonic Corporation | Display device and video transmission device, method, program, and integrated circuit for displaying text or graphics positioned over 3D video at varying depths/degrees |
EP2822280A4 (en) * | 2012-02-27 | 2015-08-12 | Sony Corp | IMAGE PROCESSING DEVICE, IMAGE PROCESSING METHOD, AND COMPUTER PROGRAM |
JP2015517236A (ja) * | 2012-04-10 | 2015-06-18 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 表示オブジェクトの表示位置を提供し、3次元シーン内の表示オブジェクトを表示するための方法および装置 |
US9544566B2 (en) * | 2012-12-14 | 2017-01-10 | Qualcomm Incorporated | Disparity vector derivation |
US9716737B2 (en) * | 2013-05-08 | 2017-07-25 | Qualcomm Incorporated | Video streaming in a wireless communication system |
EP3026922B1 (en) | 2013-07-26 | 2021-01-06 | Panasonic Intellectual Property Management Co., Ltd. | Video receiving device, appended information display method, and appended information display system |
EP3043571A4 (en) | 2013-09-04 | 2016-08-17 | Panasonic Ip Man Co Ltd | VIDEO RECEIVING DEVICE, VIDEO RECOGNITION METHOD, AND ADDITIONAL INFORMATION DISPLAY SYSTEM |
WO2015033500A1 (ja) | 2013-09-04 | 2015-03-12 | パナソニックIpマネジメント株式会社 | 映像受信装置、映像認識方法および付加情報表示システム |
US10194216B2 (en) * | 2014-03-26 | 2019-01-29 | Panasonic Intellectual Property Management Co., Ltd. | Video reception device, video recognition method, and additional information display system |
CN105144734B (zh) | 2014-03-26 | 2018-11-06 | 松下知识产权经营株式会社 | 影像接收装置、影像识别方法以及附加信息显示系统 |
JP6471359B2 (ja) | 2014-07-17 | 2019-02-20 | パナソニックIpマネジメント株式会社 | 認識データ生成装置、画像認識装置および認識データ生成方法 |
CN106233746B (zh) | 2014-08-21 | 2019-07-09 | 松下知识产权经营株式会社 | 内容辨识装置、内容辨识方法以及记录介质 |
JP2016081553A (ja) * | 2014-10-17 | 2016-05-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 記録媒体、再生方法、および再生装置 |
CN106412718A (zh) * | 2016-09-18 | 2017-02-15 | 乐视控股(北京)有限公司 | 一种字幕在3d空间中的渲染方法及其装置 |
CN108881877B (zh) * | 2017-05-12 | 2020-07-24 | 京东方科技集团股份有限公司 | 显示处理装置及其显示处理方法以及显示装置 |
US11012657B2 (en) * | 2018-06-08 | 2021-05-18 | Lg Electronics Inc. | Method for processing overlay in 360-degree video system and apparatus for the same |
KR20220121574A (ko) * | 2021-02-25 | 2022-09-01 | 삼성전자주식회사 | Ar/vr 환경을 제공하는 전자 장치 및 그 운용 방법 |
US11743440B2 (en) | 2021-04-19 | 2023-08-29 | Apple Inc. | Transmission and consumption of multiple image subframes via superframe |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1524859A2 (en) * | 2003-10-16 | 2005-04-20 | Sharp Kabushiki Kaisha | System and method for three-dimensional video coding |
WO2009078678A2 (en) * | 2007-12-18 | 2009-06-25 | Electronics And Telecommunications Research Institute | Stereoscopic content service system and method |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1642287A4 (en) * | 2003-07-07 | 2012-08-08 | Samsung Electronics Co Ltd | INFORMATION STORAGE MEDIUM STORING MULTI-ANGULAR DATA, RECORDING METHOD, AND REPRODUCING APPARATUS THEREOF |
JP2009135686A (ja) * | 2007-11-29 | 2009-06-18 | Mitsubishi Electric Corp | 立体映像記録方法、立体映像記録媒体、立体映像再生方法、立体映像記録装置、立体映像再生装置 |
US8335425B2 (en) * | 2008-11-18 | 2012-12-18 | Panasonic Corporation | Playback apparatus, playback method, and program for performing stereoscopic playback |
WO2010058368A1 (en) | 2008-11-24 | 2010-05-27 | Koninklijke Philips Electronics N.V. | Combining 3d video and auxiliary data |
KR101622688B1 (ko) | 2008-12-02 | 2016-05-19 | 엘지전자 주식회사 | 3차원 캡션 디스플레이 방법 및 이를 구현하기 위한 3차원 디스플레이 장치 |
WO2010076846A1 (ja) * | 2008-12-29 | 2010-07-08 | パナソニック株式会社 | 記録媒体、再生装置、及び集積回路 |
EP2389767A4 (en) * | 2009-01-20 | 2013-09-25 | Lg Electronics Inc | 3D SUBTITLE DISPLAY METHOD AND 3D SUBTITLE DISPLAY DEVICE FOR USING THIS METHOD |
WO2010095381A1 (ja) * | 2009-02-20 | 2010-08-26 | パナソニック株式会社 | 記録媒体、再生装置、集積回路 |
US8723927B2 (en) * | 2009-03-31 | 2014-05-13 | Daniel Rosen | Subtitling stereographic imagery |
KR20110018261A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 텍스트 서브타이틀 데이터 처리 방법 및 재생 장치 |
CN104717479B (zh) * | 2009-10-13 | 2017-05-03 | Lg电子株式会社 | 广播接收机及其3d广播数据处理方法 |
JP5480915B2 (ja) * | 2009-12-28 | 2014-04-23 | パナソニック株式会社 | 表示装置と方法、記録媒体、送信装置と方法、及び再生装置と方法 |
CN102845067B (zh) * | 2010-04-01 | 2016-04-20 | 汤姆森许可贸易公司 | 三维(3d)呈现中的字幕 |
JP5964811B2 (ja) * | 2010-04-02 | 2016-08-03 | サムスン エレクトロニクス カンパニー リミテッド | 二次元コンテンツ並びに三次元コンテンツを提供するためのデジタル放送コンテンツ伝送方法及びその装置、デジタル放送コンテンツ受信方法及びその装置 |
US9055281B2 (en) * | 2010-05-20 | 2015-06-09 | Samsung Electronics Co., Ltd. | Source device and sink device and method of transmitting and receiving multimedia service and related data |
US8866886B2 (en) * | 2010-05-30 | 2014-10-21 | Lg Electronics Inc. | Method and apparatus for processing and receiving digital broadcast signal for 3-dimensional subtitle |
-
2011
- 2011-07-06 CN CN201180034477.6A patent/CN103026713B/zh active Active
- 2011-07-06 JP JP2013519192A patent/JP5960133B2/ja active Active
- 2011-07-06 WO PCT/IB2011/052993 patent/WO2012007876A1/en active Application Filing
- 2011-07-06 US US13/809,204 patent/US9986220B2/en active Active
- 2011-07-06 BR BR112013000580-7A patent/BR112013000580B1/pt active IP Right Grant
- 2011-07-06 EP EP11743369.8A patent/EP2594079B1/en active Active
- 2011-07-06 MX MX2013000348A patent/MX2013000348A/es active IP Right Grant
- 2011-07-06 ES ES11743369.8T patent/ES2670663T3/es active Active
- 2011-07-06 RU RU2013105715/08A patent/RU2589307C2/ru active
- 2011-07-06 KR KR1020137003095A patent/KR101819736B1/ko active IP Right Grant
- 2011-07-11 TW TW100124495A patent/TWI568239B/zh active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1524859A2 (en) * | 2003-10-16 | 2005-04-20 | Sharp Kabushiki Kaisha | System and method for three-dimensional video coding |
WO2009078678A2 (en) * | 2007-12-18 | 2009-06-25 | Electronics And Telecommunications Research Institute | Stereoscopic content service system and method |
Also Published As
Publication number | Publication date |
---|---|
WO2012007876A1 (en) | 2012-01-19 |
RU2589307C2 (ru) | 2016-07-10 |
EP2594079B1 (en) | 2018-03-21 |
TWI568239B (zh) | 2017-01-21 |
JP2013540374A (ja) | 2013-10-31 |
TW201223246A (en) | 2012-06-01 |
US20130106999A1 (en) | 2013-05-02 |
KR101819736B1 (ko) | 2018-02-28 |
KR20130135828A (ko) | 2013-12-11 |
BR112013000580B1 (pt) | 2022-03-29 |
RU2013105715A (ru) | 2014-08-20 |
EP2594079A1 (en) | 2013-05-22 |
JP5960133B2 (ja) | 2016-08-02 |
MX2013000348A (es) | 2013-03-08 |
BR112013000580A2 (pt) | 2016-07-05 |
ES2670663T3 (es) | 2018-05-31 |
CN103026713A (zh) | 2013-04-03 |
US9986220B2 (en) | 2018-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103026713B (zh) | 3d视频广播中的辅助数据 | |
US10158841B2 (en) | Method and device for overlaying 3D graphics over 3D video | |
US8878913B2 (en) | Extended command stream for closed caption disparity | |
US20160261927A1 (en) | Method and System for Providing and Displaying Optional Overlays | |
RU2633385C2 (ru) | Передающее устройство, способ передачи, приемное устройство, способ приема и способ отображения приема | |
US20140237536A1 (en) | Method of displaying contents, method of synchronizing contents, and method and device for displaying broadcast contents | |
CN102257824A (zh) | 3d图像信号处理方法和用于实现该方法的图像显示器 | |
JP2013538482A (ja) | マルチメディアアプリケーションのためのピクチャ・イン・ピクチャの方法 | |
CN102972030A (zh) | 用于生成和重建立体兼容视频流的方法及相关的编码和解码设备 | |
CN105120370A (zh) | 3d广播接收器和用于接收3d广播信号的方法 | |
US20160057488A1 (en) | Method and System for Providing and Displaying Optional Overlays | |
WO2013031549A1 (ja) | 送信装置、送信方法および受信装置 | |
JP5955851B2 (ja) | 3d画像データの転送 | |
US11936936B2 (en) | Method and system for providing and displaying optional overlays | |
WO2013018490A1 (ja) | 送信装置、送信方法および受信装置 | |
EP2408211A1 (en) | Auxiliary data in 3D video broadcast | |
CN103053166A (zh) | 立体图像数据发送设备、立体图像数据发送方法和立体图像数据接收设备 | |
CN103404153A (zh) | 发送装置、发送方法以及接收装置 | |
KR100430876B1 (ko) | 디지털 텔레비전 수신기의 여백 조정 장치 및 그 방법 | |
US20120300029A1 (en) | Video processing device, transmission device, stereoscopic video viewing system, video processing method, video processing program and integrated circuit | |
KR20120076625A (ko) | 3차원 콘텐츠를 제공하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |