CN1181687C - 用于传输mpeg-4二进制形式信息的方法和设备 - Google Patents

用于传输mpeg-4二进制形式信息的方法和设备 Download PDF

Info

Publication number
CN1181687C
CN1181687C CNB018013171A CN01801317A CN1181687C CN 1181687 C CN1181687 C CN 1181687C CN B018013171 A CNB018013171 A CN B018013171A CN 01801317 A CN01801317 A CN 01801317A CN 1181687 C CN1181687 C CN 1181687C
Authority
CN
China
Prior art keywords
data signal
video data
digital video
identifier
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB018013171A
Other languages
English (en)
Other versions
CN1381140A (zh
Inventor
G・福瓦克
G·福瓦克
P·多比尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1381140A publication Critical patent/CN1381140A/zh
Application granted granted Critical
Publication of CN1181687C publication Critical patent/CN1181687C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

本发明涉及处理数字视频数据信号(DVS)的一种方法,以便将二进制形式数据插入到该数字视频数据信号中。这样一种方法用于处理包括与方格式图像有关的数据的数字视频数据信号,和由该数字视频数据信号的分段步骤(SEG)提供的分段的视频数据信号(SVS),包括是该方格式图像的一个区域的一个视频目标(V0)的分段的视频数据信号。所说处理方法包括用一个识别符进行识别(ID)的步骤,用于识别一个方格式图像的像素属于分段的视频数据信号(SVS)的哪一个视频目标、将识别符(INS)插入到该数字视频数据信号中以形成修改的数字视频数据信号(DVSm),以及使用基于视频目标的编码框架对该修改的数字视频数据信号进行编码(ENC),以得到一个被编码的数据信号(ES)。

Description

用于传输MPEG-4二进制形式信息的方法和设备
技术领域
本发明涉及一种处理包括与方格式图像有关的数据的数字视频数据信号的方法,所说处理方法包括用于将数字视频数据信号分段的一个分段步骤,以提供分段的视频数据信号,一个分段的视频数据信号包括是该方格式图像的一个区域的一个视频目标。本发明还涉及相应于所说处理方法的设备。
这样一种处理方法例如可以用基于视频目标的编码框架,例如MPEG-4编码标准编码一个数字视频数据信号。
背景技术
基于视频目标的编码框架,例如被称为MPEG-4视觉版本1,ISO/IEC 14496-2的MPEG-4编码标准允许编码具有不同形状的视频目标,代替全部方格式的图像。方格式图像由具有亮度和色度值的像素表示。除这些值外,一个视频目标的一个像素具有一个二进制形式值。该值是从一个方格式图像由分段处理得到的,并且由一个位表示,该位表示该像素是在该目标中或者不在该目标中。视频目标的分开编码可以丰富在某些多媒体业务中的用户的相互作用,这是因为可灵活地对该数字视频数据信号进行存取和容易处理该视频信息。按这种框架,编码器可执行本地确定的预处理,目的在于自动地识别在一图像序列中出现的目标。
分段操作目的在于将一个方格式图像或图像的一个视频序列划分为按一个给定准则提取的区域。图1表示分段处理的一个例子,其中方格式图像(RP)已被划分成若干视频目标(V01-V04)。对于一个视频序列的情况,这种划分应当得到代表该视频目标的目标掩码的合成序列的时间相干性。基于空间均匀性,运动相干准则或空间时间处理已为分段视频序列推荐了不同的方法。这些方法期待按亮度均匀性和运动相干准则识别运动目标的类别。
发明内容
本发明的目的在于提供一种处理一个数字视频数据信号的方法,以得到包括二进制形式的修改的数字视频数据信号。
至今,仅由推荐的ITV-R BT.601-5标准化像素数据传输。其指定数字编码视频信号的方法,但并未提出或建议传输二进制形式数据的任何方法。
按本发明的处理方法,其特征在于包括用一个识别符进行识别的步骤,用于识别一个方格式图像的像素属于哪一个分段的视频数据信号的视频目标,和插入步骤,用于将该识别符插入该数字视频数据信号中以形成由基于视频目标的编码框架编码的修改的数字视频数据信号。该识别符被插入到如推荐的ITU-R BT.1364中定义的一个辅助数据分组中,接着该辅助数据分组被插入到一个行水平线上的数字视频数据信号的垂直消隐空间中。
这样的一种处理方法允许与二进制形式数据相关的信息通过视频目标的识别符插入到一个数字视频数据信号中,结果,由这种处理方法得到的修改的数字视频数据信号可直接由基于视频目标的编码器编码,特别地,由一个硬编码器进行编码。
在本发明的优选实施例中,数字视频数据信号由推荐的ITU-RBT.601-5定义,而识别符如在推荐的ITU-R BT.1364所定义的那样首先被插入到一个辅助数据分组中,然后插入到在行水平上的数字视频数据信号的垂直消隐空间。
本发明还应用到实施这样一种处理方法的处理设备。
根据参照下面描述的实施例的说明,本发明的这些和其他方面将显而易见。
附图的简述
现在参照附图,借助例子,描述本发明,其中:
图1表示包括不同视频目标的分段的图像的一个例子,
图2是按本发明的处理方法的方块图,
图3表示由推荐的ITU-R BT.601-5定义的一个数字视频数据信号,以及
图4表示由推荐的ITU-R BT.1364定义的一个辅助数据分组。
发明的详细说明
本发明的目的在于将二进制形式数据插入到一个数字视频数据信号中,这样得到的修改的数字视频数据信号直接由一个基于视频目标的编码器进行编码。图2是说明按本发明处理方法原理的方块图。
这样一种处理方法处理包括与方格式图像相关的数字视频数据信号(DVS),和由该数字视频数据信号的分段步骤(SEG)提供的分段的视频数据信号(SVS),包括是该方格式图像的一个区域的视频目标(V0)的分段的视频数据信号。
所说处理方法包括步骤:
用一个识别符识别(ID)一个方格式图像像素属于该分段的视频数据信号(SVS)的哪一个视频目标,
将该识别符(INS)插入到该数字视频数据信号中,以形成修改的数字视频数据信号(DVSm),以及
使用MPEG-4编码标准对修改的数字视频数据信号进行编码(ENC),以提供编码的数据信号(ES)。
在本发明的优选实施例中,数字视频数据信号(DVS)是由推荐的ITU-R BT.601-5定义的一种。图3表示由所说推荐定义的数字视频数据信号的结构。这样的数字视频数据信号包括:
视频数据(YCRCB[1]和YCRCB[2],包括亮度取样(Y)和两个同步的色-差信号(CR和CB)),
水平消隐空间(HBSu1,HBSd1,HBSu2和HBSd2),
垂直消隐空间(VBS1和VBS2)。
例如,在每秒50半帧的系统中,在那里整个图像包括625行,该视频数据被分成两个半帧,每半帧包括288行。该帧的剩余部分相应于不同的水平消隐空间。
如果取样频率对亮度信号是13.5MHz,对于4∶2∶2编码格式的每个色差信号而言取样频率是6.75MHz。这样对于亮度信号,每整行的取样数是864,而对于每个色差信号的是432。这些取样按8位(可选择10)编码。如果对亮度信号每数字有效行的取样数是720,而且对于每个色差信号的是360,对于垂直消隐空间可得到最大的288个取样数。
本发明可应用到如由推荐的ITU-R BT.601-5所定义的其他格式的数字视频数据信号,例如,如相应525行的每秒速率60半帧的系统,4∶4∶4编码格式,或取样频率18MHz用于亮度信号。
本发明还应用于其他的数字视频数据信号,例如,如由相应于HDTV信号的推荐的ITU-R BT.656,ITU-R BT.799,或ITU-RBT.1120定义的数字视频数据信号。
在由本发明处理方法处理之前,应使用产生若干分段的视频数据信号(SVS)的分段处理(SEG)分段该数字视频数据信号。可以用两种方法执行分段处理。第一种方法是基于一种通常的软件方法,例如在本发明背景中所描述的,但消耗很多时间。第二种方法快得多并被称为Chroma Key处理。这种处理专用于提取至少两个视频目标,其中一个是背景视频目标。该背景目标最好是蓝的或绿的,这样的分段处理可以用硬件应用程序实施。
之后使用如在推荐的ITU-R BT.1364中定义的辅助数据将视频目标的识别符插入到该数字视频数据信号中。辅助数据以分组方式传送,每个分组携带自己的识别符。图4表示如在推荐的ITU-RBT.1364中定义的一个辅助数据分组。所说的辅助数据分组包括:
一个辅助数据标志(ADF),是一个固定的始标,其可使辅助数据分组被检测,
一个数据识别字(DID),使分组携带一个特定类型的可加以识别的辅助数据,
一个数据块数(DBN),对每个连续的数据分组递增一,该连续的数据分组共享一个公共数据识别字并要求连续性指示,
一个数据计算字(DC),指示该分组长度,
一个用户数据字(UDW),它包含辅助数据,在每个分组高达255个字,
一个校验和字(CD),通过用户数据字,根据数据识别字确定辅助数据分组的有效性。
通过在数字视频数据信号的数字消隐部分中的数字视频部件接口,推荐的ITU-R BT.1364对传输辅助数据信号提供了一种机制。在本发明的优选实施例中,辅助数据分组插入到在行水平线上的数字视频数据信号(DVS)的垂直消隐空间(VBS1和VBS2)。对于在相同垂直消隐空间中提供的整个分组有充分的空间可利用。
每一个像素行或线表示720个像素和用户数据字的大小将不超过255个字或字节。结果,高达4个视频目标(V0)可以插入到该数字视频数据信号(DVS)中。至此,按本发明的处理方法包括一个识别步骤(ID),用于用一个识别符识别一个方格式图像像素属于哪一个分段视频数据信号的视频目标。视频目标用具有2位的一个识别符编码。因此,现在为充分地描述一个像素,需要相应180个字节的1440位。
所说识别符使得有可能按下列方式确定相应的像素属于哪一个视频目标:
00:该像素属于第一视频目标(V01),
01:该像素属于第二视频目标(V02),
10:该像素属于第三视频目标(V03),
11:该像素属于第四视频目标(V04)。
从0-179编号是用户数据字的字节。编码n字节的八位包含下列信息:
位0和1包含像素4n的识别符,
位2和3包含像素4n+1的识别符,
位4和5包含像素4n+2的识别符,
位6和7包含像素4n+3的识别符。
最后,将该识别符插入到一个辅助数据分组的子步骤(ADP)同将该辅助数据分组插入到一个垂直消隐空间的子步骤(VBS)组合,使得可能形成直接由一个基于视频目标的编码器进行编码的修改的数字视频数据信号(DVSm)。
要指出的是,使用动词“包括”和其配对并不排除存在任何其他的不同于在任一权利要求中所定义的那些步骤或元件。

Claims (4)

1.一种处理包括与方格式图像相关的数据的一个数字视频数据信号的方法,所说处理方法包括分段步骤,用于分段该数字视频数据信号,以提供分段的视频数据信号,一个分段的视频数据信号包括是该方格式图像的一个区域的一个视频目标,其特征在于所说处理方法包括:
一个识别步骤用于使用一个识别符识别一个方格式图像的像素属于该分段的视频数据信号的哪一个视频目标,以及
一个插入步骤,用于将该识别符插入到该数字视频数据信号中,以形成一个由基于视频目标的编码框架编码的修改的数字视频数据信号,所述插入步骤包括将识别符插入到如推荐的ITU-RBT.1364中定义的一个辅助数据分组中的第一子步骤,和用于将该辅助数据分组插入到一个行水平线上的数字视频数据信号的垂直消隐空间的第二子步骤。
2.如权利要求1的处理一个数字视频数据信号的方法,其特征在于识别步骤适于分配一个按两位编码的识别符到方格式图像的一个给定的像素。
3.一种用于处理包括与方格式图像相关的数据的一个数字视频数据信号的设备,所说处理设备包括用于分段该数字视频数据信号以提供分段的视频数据信号的装置,一个分段的视频数据信号包括是该方格式图像的一个区域的一个视频目标,其特征在于所说处理设备包括:
用于使用一个识别符识别一个方格式图像的像素属于分段的视频数据信号的哪一个视频目标的装置,以及
用于将该识别符插入到该数字视频数据信号中以形成由基于视频目标的编码框架编码的修改的数字视频数据信号的装置,所述装置适于首先将该识别符插入到如推荐的ITU-R BT.1364中定义的一个辅助数据分组中,接着该辅助数据分组被插入到一个行水平线上的数字视频数据信号的垂直消隐空间中。
4.如权利要求3的处理设备,其特征在于识别装置适于分配按两位编码的一个识别符到方格式图像的一个给定的像素。
CNB018013171A 2000-05-18 2001-04-27 用于传输mpeg-4二进制形式信息的方法和设备 Expired - Fee Related CN1181687C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP00401368 2000-05-18
EP00401368.6 2000-05-18

Publications (2)

Publication Number Publication Date
CN1381140A CN1381140A (zh) 2002-11-20
CN1181687C true CN1181687C (zh) 2004-12-22

Family

ID=8173688

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018013171A Expired - Fee Related CN1181687C (zh) 2000-05-18 2001-04-27 用于传输mpeg-4二进制形式信息的方法和设备

Country Status (6)

Country Link
US (1) US6944339B2 (zh)
EP (1) EP1287697A1 (zh)
JP (1) JP2003533949A (zh)
KR (1) KR20020025958A (zh)
CN (1) CN1181687C (zh)
WO (1) WO2001089222A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7575168B2 (en) * 2004-10-01 2009-08-18 Nokia Corporation Methods, devices and computer program products for generating, displaying and capturing a series of images of visually encoded data
US8795762B2 (en) 2010-03-26 2014-08-05 Battelle Memorial Institute System and method for enhanced electrostatic deposition and surface coatings
FR2959037A1 (fr) * 2010-04-14 2011-10-21 Orange Vallee Procede de creation d'une sequence media par groupes coherents de fichiers medias
US9934557B2 (en) * 2016-03-22 2018-04-03 Samsung Electronics Co., Ltd Method and apparatus of image representation and processing for dynamic vision sensor

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5786855A (en) * 1995-10-26 1998-07-28 Lucent Technologies Inc. Method and apparatus for coding segmented regions in video sequences for content-based scalability
US6035060A (en) * 1997-02-14 2000-03-07 At&T Corp Method and apparatus for removing color artifacts in region-based coding
KR19980084420A (ko) * 1997-05-23 1998-12-05 배순훈 윤곽정보 검출장치 및 방법
EP0921684B1 (en) * 1997-12-02 2005-11-02 Daewoo Electronics Corporation Method and apparatus for encoding object information of a video object plane
EP0923250A1 (en) * 1997-12-03 1999-06-16 Daewoo Electronics Co., Ltd Method and apparatus for adaptively encoding a binary shape signal
US6480626B1 (en) * 1998-09-24 2002-11-12 Xerox Corporation System and method for rapidly accessing image information using segmentation tags

Also Published As

Publication number Publication date
CN1381140A (zh) 2002-11-20
KR20020025958A (ko) 2002-04-04
JP2003533949A (ja) 2003-11-11
WO2001089222A1 (en) 2001-11-22
EP1287697A1 (en) 2003-03-05
US6944339B2 (en) 2005-09-13
US20020051076A1 (en) 2002-05-02

Similar Documents

Publication Publication Date Title
EP1834487B1 (en) Method for improved entropy coding
CN101222644B (zh) 运动图像编码、解码装置以及运动图像编码、解码方法
CN110401833B (zh) 图像传输方法及装置
US6058210A (en) Using encoding cost data for segmentation of compressed image sequences
CN1166211C (zh) 根据有效参考运动矢量数对一运动矢量进行编码的方法和装置
EP1050167B1 (en) Region-based information compaction for digital images
CN101053258A (zh) 用于处理编码的视频数据的方法和设备
WO2005036877A1 (en) Digital video signature apparatus and methods for use with video program identification systems
US20090022219A1 (en) Enhanced Compression In Representing Non-Frame-Edge Blocks Of Image Frames
CN1795681A (zh) 用于视频压缩的方法和设备
CN1208313A (zh) 编码移动矢量的方法及装置
CN1969556A (zh) 色度去块的方法
CN1813480A (zh) 变换域中零的早期检测
WO2014107029A1 (ko) 비디오 신호 처리 방법 및 장치
US20160029030A1 (en) Transmitting and receiving a composite image
US6078690A (en) Image data conversion device and method having function of inserting delimiter code into position in image data where a predetermined amount of data is reached
CN1181687C (zh) 用于传输mpeg-4二进制形式信息的方法和设备
US20160073124A1 (en) Transmitting and receiving a composite image
CN1185877C (zh) 用于解码视频信号的再同步方法
CN1310519C (zh) 视频编码和解码方法以及相应信号
US8139101B2 (en) Pre-processing of video data
CN1663279A (zh) 视频编码方法以及相应的编码和解码设备
CN1762160A (zh) 确定运动矢量的方法
CN110971903A (zh) 编码方法、设备及系统
US20220256174A1 (en) Video or image coding based on mapped luma component and scaled chroma component

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20041222