CN101669359A - 构造文件格式的方法及相应广播信号的处理装置及方法 - Google Patents
构造文件格式的方法及相应广播信号的处理装置及方法 Download PDFInfo
- Publication number
- CN101669359A CN101669359A CN200880014033A CN200880014033A CN101669359A CN 101669359 A CN101669359 A CN 101669359A CN 200880014033 A CN200880014033 A CN 200880014033A CN 200880014033 A CN200880014033 A CN 200880014033A CN 101669359 A CN101669359 A CN 101669359A
- Authority
- CN
- China
- Prior art keywords
- frame
- user data
- track
- data
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
提供了一种用于构造文件格式的方法。该文件格式包括第一框(mdat)和第二框(moov),所述第一框包括至少一个轨道,在所述至少一个轨道中定义了媒体数据和关于该媒体数据的用户数据,所述第二框包括轨道框(trak),用来指示所述至少一个轨道的每一个,以及用来定义关于所述用户数据的用户的数据和信息格式的用户数据框(udta)。所述用户数据框(udta)包括至少一个第三框(cmdt),所述第三框包括可以被用来标识用于指示其中定义了用户数据的轨道的轨道框的信息。多个用户可以将他们自己的独特数据单独地存储在先前创建的文件中,并且可以直观地确定每个用户数据指定了哪个轨道。
Description
技术领域
本发明涉及文件格式结构,并且更具体地,涉及一种用于构造包含用户数据文件的文件格式的方法,以及用于接收和处理包括具有根据该方法构造的文件格式的文件的广播信号的装置和方法。
背景技术
由于迅速发展的因特网和个人计算机(PC)技术,PC已经在家庭中广泛地普及。PC提供了用户可以容易地访问和使用因特网上的各种内容的环境。
通常建立在公寓建筑周围用于通过光纤线缆连接到因特网的网络提供了大约100Mbps的高传输速率。然而,这样的网络仍然不足以享受需要传送大量数据的具有高分辨率或高图像质量的内容。
近来,由于代替常规模拟广播的数字广播的商业化,广播环境正在非常迅速地改变。
常规的文件格式在这样的广播环境中也不足以完全地传送和接收期望量的数据。也就是说,需要定义或构造代替常规文件格式的新的文件格式,以应对广播环境中的改变。
通常,可以根据规范来变化地定义这样的新的文件格式。
作为这样的各种文件格式的示例的文件格式结构通常可以由根据规范定义的框(box)来表示。
尽管用户在常规的广播环境中被动地消费传送的内容,但是最近用户已经开始创建以及消费内容。这样的内容的示例是目前普遍的用户创建的内容(UCC)。
因此,在常规的广播环境中定义的文件格式不足以在这样的新的广播环境中定义文件。因此,本发明将提议定义新的文件格式,这使得能够接收和处理包含由各种创建者创建的各种数据的文件,并且使得一般的和通用文件格式能够应对未来的广播环境中的改变。
发明内容
技术问题
设计成满足提议的本发明的目的在于提供一种用于构造包括用户数据的文件格式的方法,以及一种用于处理包括具有该文件格式的文件的广播信号的装置和方法。
技术解决方案
本发明的实施例提供了一种用于构造文件格式的方法,其中,该文件格式包括:第一框,该第一框包括至少一个轨道,在该至少一个轨道中定义了媒体数据和关于该媒体数据的用户数据二者;以及第二框,该第二框包括轨道框,用于指示所述至少一个轨道的每一个,以及用来定义关于所述用户数据的用户的数据和信息格式的用户数据框,其中,用户数据框包括至少一个第三框,该第三框包括能够被用来标识指示定义了用户数据的轨道的轨道框的信息。
这里,第三框可以进一步包括关于轨道框所指示的轨道中的每个用户数据的起始位置的信息。
另外,第三框可以进一步包括能够被用来标识在第一框中已经添加了用户数据的用户的信息。
此外,第三框可以进一步包括关于第一框中的用户数据的版本的信息。
本发明的另一个实施例提供了一种用于构造文件格式的方法,其中,文件格式包括:第一框,该第一框包括至少一个轨道,在该至少一个轨道中定义了媒体数据和关于该媒体数据的用户数据;以及第二框,该第二框包括轨道框,用于指示至少一个轨道的每一个,并且包括用来定义关于用户数据的用户的数据和信息格式的用户数据框,其中,用户数据框包括至少一个第三框,该第三框包括关于对应轨道中的用户数据的起始位置的信息。
这里,第三框可以进一步包括能够被用来标识在第一框中已经添加了用户数据的用户的信息。
另外,第三框可以进一步包括关于第一框中的用户数据的版本的信息。
本发明的另一个实施例提供了一种用于接收和处理包括根据特定文件格式定义的文件的广播信号的方法,该方法包括:接收和存储广播信号;对在所存储的广播信号中的文件进行解复用,已解复用的文件的每一个包括第一框和第二框,该第一框包括至少一个轨道,在所述至少一个轨道中定义了媒体数据和关于该媒体数据的用户数据,该第二框包括轨道框,用于指示至少一个轨道的每一个,以及用来定义关于用户数据的用户的数据和信息格式的用户数据框;读取在已解复用的文件的每一个中的用户数据框,已读取的用户数据框包括至少一个第三框,该第三框包括能够被用来标识用来指示定义了用户数据的轨道的轨道框的信息;以及使用已读取的第三框来读取关于媒体数据的用户数据,并且对已读取的用户数据和已解复用的媒体数据进行解码和处理。
这里,第三框可以进一步包括关于轨道框所指示的轨道中的每个用户数据的起始位置的信息。
另外,第三框可以进一步包括能够被用来标识在第一框中已经添加了用户数据的用户的信息。
此外,第三框可以进一步包括关于在第一框中的用户数据的版本的信息。
本发明的另一个实施例提供了一种用于接收和处理包括根据特定文件格式定义的文件的广播信号的方法,该方法包括:接收和存储该广播信号;对在所存储的广播信号中的文件进行解复用,已解复用的文件的每一个包括第一框和第二框,该第一框包括至少一个轨道,该至少一个轨道包括媒体数据和关于该媒体数据的用户数据,该第二框包括轨道框,用于标识至少一个轨道的每一个,并且包括定义关于用户数据的用户的数据和信息格式的用户数据框;读取在已解复用的文件的每一个中的用户数据框,已读取的用户数据框包括至少一个第三框,该第三框包括关于对应轨道中的用户数据的起始位置的信息;以及使用已读取的第三框来读取与媒体数据有关的用户数据,并且对已读取的用户数据和已解复用的媒体数据进行解码和处理。
这里,第三框可以进一步包括能够被用来标识在第一框中已经添加了用户数据的用户的信息。
另外,第三框可以进一步包括与在第一框中的用户数据的版本有关的信息。
本发明的另一个实施例提供了一种用于接收和处理包括根据特定文件格式定义的文件的广播信号的装置,该装置包括:存储单元,该存储单元用于对广播信号进行接收和解复用并且存储广播信号的各文件;第一解码器,该第一解码器用于对包括在存储的各文件的每一个中的框进行读取和解码,已解码的框包括第一框和第二框,该第一框包括至少一个轨道,在所述至少一个轨道中定义了媒体数据和与该媒体数据有关的用户数据,该第二框包括轨道框,用于指示至少一个轨道的每一个,以及用来定义关于用户数据的用户的数据和信息格式的用户数据框,该用户数据框包括至少一个第三框,该第三框包括能够被用来标识定义了用户数据的轨道的轨道框的信息以及关于轨道框所指示的轨道中的用户数据的起始位置的信息;控制器,该控制器用于执行控制操作以使用已解码的第三框对在所存储的第一框中的用户数据和媒体数据进行解码或者构造UI;以及第二解码器,该第二解码器用于根据控制的控制来对用户数据和媒体数据进行解码,或者构造UI。
这里,该装置可以进一步包括输出单元,该输出单元用于输出由第二解码器解码的用户数据和媒体数据,或者输出已构造的UI。
另外,控制器可以控制第二解码器以与与已解码的用户数据和媒体数据相关联地构造UI。
本发明的另一个实施例提供了一种用于接收和处理包括根据特定文件格式定义的文件的广播信号的装置,该装置包括:存储单元,该存储单元用于对广播信号进行接收和解复用并且存储广播信号的文件;第一解码器,该第一解码器用于对包括在所存储的文件的每一个中的框进行读取和解码,已解码的框包括第一框和第二框,该第一框包括至少一个轨道,该至少一个轨道包括媒体数据和关于该媒体数据的用户数据,该第二框包括轨道框,用于标识至少一个轨道的每一个,并且包括定义与用户数据有关的用户的数据和信息格式的用户数据框,该用户数据框包括至少一个第三框,该第三框包括关于对应轨道中的用户数据的起始位置的信息;控制器,该控制器用于执行控制操作以使用在已解码的第三框中的信息对所存储的用户数据和媒体数据进行解码或者构造UI;以及第二解码器,该第二解码器用于根据控制器的控制来对所存储的用户数据和媒体数据进行解码或者构造UI。
这里,该装置可以进一步包括输出单元,该输出单元用于输出由第二解码器解码的用户数据和媒体数据。
另外,该控制器可以控制第二解码器与已解码的用户数据和媒体数据相关联地构造UI。
有益效果
用于构造包括用户数据的文件格式的方法以及用于处理包括具有该文件格式的文件的广播信号的装置和方法具有各种优点。
第一,多个用户可以将他们自己独特的数据单独地存储在先前创建的文件中。
第二,可以直观地确定每个用户数据指定了哪个轨道。
因此,根据本发明,即使在moov容器中提供了用户数据时,也可以存储多个用户数据,并且还可以指定适合于多个轨道的用户数据。在轨道容器中提供了用户数据的情况下,即使当对应的轨道仅包含一个媒体数据项时,多个用户也可以指定与他们相关的用户数据。另外,即使当将媒体数据添加到或连接到在对应的轨道中的媒体数据时,也可以附加地指定适合于该媒体数据的用户数据。
附图说明
图1图示了与本发明相关联地基于ISO的媒体文件格式的结构;
图2图示了根据本发明构造的用户数据的实施例;
图3图示了与图2中构造的用户数据相关联地构造的句法结构的实施例;
图4图示了根据本发明构造的用户数据的另一个实施例;
图5图示了提供以解释图4的实施例的句法结构的实施例;
图6图示了根据本发明构造的文件格式的实施例;
图7图示了根据本发明构造的文件格式的另一个实施例;
图8图示了根据本发明构造的文件格式的另一个实施例;
图9图示了根据本发明构造的文件格式的另一个实施例;
图10图示了说明用于处理根据本发明构造的文件格式的装置的实施例的框图;以及
图11是图示用于处理根据本发明构造的文件格式的过程的实施例的流程图。
*附图中必要部件的附图标记*
1001;调谐器 1002;解调器
1003;解复用器 1004;存储介质
1005;第一解码器 1006;第二解码器
1007;处理器 1008;输出单元
1009;控制器
具体实施方式
从下面结合附图的详细描述中将清楚地理解本发明的上述和其它目的、特征和优点。虽然已经在考虑到本发明中的要素的功能的情况下从本领域中广泛使用的一般要素中选择了本发明中的多数要素的术语,但是一些术语已经由申请人任意地选择,并且根据需要在下面的描述中详细解释了它们的含义。因此,应当基于本说明书的全部内容连同术语的约定含义而不是它们的简单的名称或含义来确定在本发明中使用的术语的定义。
现在将参考附图来描述根据本发明的用于使多个用户将他们自己独特的数据存储在文件中的方法和装置。
在提供用于更加清楚地理解本发明的精神的下面的描述中,为了便于解释,通过用于数字多媒体广播的信号来例示数字广播信号,并且通过基于ISO的文件格式来例示文件格式。
图1图示了与本发明相关联的基于ISO的媒体文件格式的结构。
如图1所示,基于ISO的媒体文件格式包括被称为“框(box)”的面向对象的块的集合。文件格式不仅包括音频/视频(A/V)信息,而且还包括时序、结构和媒体信息。
以下是对框的描述。在下面的描述中,为了便于解释,将用黑体给出框的名称。基本上可以将框划分为容器框和普通框。这里,虽然容器框可以是其中包括了其它框的聚合(grouping)框,但是容器框可以包含被聚合的各框的总体大小及名称,而普通框包含为实际使用而提供的数据。
图1示出了包括moov框、mdat框以及trak框的示例ISO文件格式。
moov框可以被描述为包括用来呈现场景的至少一个trak框的示例容器框。trak框可以包括单个媒体数据的描述(即,一个媒体数据项)。
在trak框中的媒体数据包括使用各种编解码器压缩的信息,诸如音频和视频信息、与仅音频广播有关的信息、与包含混合的(muxed)音频和视频数据的传输流有关的信息以及与数据广播的内容有关的信息。
以下是对每个框的更加详细的描述。作为影片框,moov框是可以包括与实际影片相关联的所有元数据框的容器框。因此,moov框不包含它自己的任何信息,而用于聚合其中的其它框。
作为容器框,moov框可以包含如上所述的至少一个trak框。
作为轨道框,trak框是容器框,可以存储关于用来呈现的一个轨道的信息。例如,trak(video)框表示包含视频数据的轨道,并且trak(audio)框表示包含音频数据的轨道。也就是说,当已经存储了音频数据的一个轨道时,可以把关于该音频数据的所有信息存储在各框中,并且该trak框用于聚合这些框。
mdat框是存储实际流的媒体数据框。由于存储在mdat框中的流不包含信息,所以可以从mdat框获得关于当前流的位置和信息。
在图1的示例中,moov框包括两个trak框,即,trak(video)框和trak(audio)框,并且mdat框包括作为由trak框指示的广播的实际信息的经交织的音频和视频帧或时间排序的音频和视频帧。
因此,经由流送或使用存储设备,传送端可以通过各种路径使用如上所述的基于ISO的文件格式结构来传送包含数据的每个文件。接收端可以接收或者复制和存储来自流送或存储设备的文件,并且然后再现所存储的文件。
虽然从内容创建者持有现有内容的服务提供商的视角考虑了分发和流送而定义了如图1所示的文件格式,但是可以提供“用户数据”框来实现用于应对其它情形的灵活性。
例如,由于随着最近诸如迅速成长的用户创建的内容(UCC)运动的概念的普及,仅消费内容的一般被动用户日益增多地变成主动创建者,所以当各种用户遇到他们可以在不考虑版权的情况下编辑内容并且将新的值添加到内容的情形时,将提高这种用户数据的实用性。
因此,本发明旨在提供一种用于更加广泛地利用用户数据的方法,从而将高值添加到各种内容创建者的内容产生活动。
在本发明中的“用户数据”是用于描述用户的信息格式和数据(即,可以由用户可选地定义的信息)的一般性术语。用户数据可以包括各种信息,包括由创建者期望的数据和信息格式,诸如元数据、知识产权管理和保护(IPMP)、音频/视频(AV)、文本、数据库(DB)等。
现在将与本发明相关联地参考根据基于ISO的文件格式定义的用户数据。
以下是与本发明相关联的用户数据的更加详细的描述。图2图示了根据本发明构造的用户数据的实施例,并且图3图示了与图2中构造的用户数据相关联地构造的句法结构的实施例。
与本发明相关联地,用户数据可以被包括在框类型“udta”中。虽然“udta”框是容器框,但是它可以被包含在另一个容器框中,例如“moov”框或“trak”框。虽然“udta”框不是必须包括在文件格式中的强制性框,但是考虑到如上所述的各种近来的广播环境,它可以被用作强制性框。
“udta”框可以包括至少一个用户数据项。
图2的实施例是其中单个用户数据(即,一个用户数据项)被包括在“udta”框中的基本结构。该结构主要包括指示大小的部分、指示包含用户数据的框的类型的部分以及包含实际用户数据的部分。具体地,“大小”部分指示包含用户数据的框类型的总大小,“udta”部分指示包含用户数据的框类型是“udta”框,并且“用户数据”部分指示包含实际用户数据的部分。
图3图示了提供以解释图2的基本用户数据结构的句法结构的实施例的类框。
图4图示了根据本发明构造的用户数据的另一个实施例,并且图5图示了被提供以解释图4的实施例的句法结构的实施例。
与图2的实施例不同,考虑到在“udta”框中可以包括多个用户数据的事实来构造图4的实施例。为了便于解释,将参考其中“udta”框包括两个用户数据项的示例来给出下面的描述。
图4的实施例的基本结构与图2的基本结构类似。也就是说,“大小1”指示是包含至少一个用户数据项的容器框的“udta”框的总大小,“大小2”指示包含至少一个用户数据项的第一个的“cmdt”框的大小,并且“大小3”指示包含第二个用户数据项的“cmdt”框的大小。
虽然在图4的示例中文件包括两个用户数据项,但是文件可以包括附加用户数据项。在这种情况下,可以定义文件格式以进一步包括如上所述的附加用户数据项的各自的大小、框类型、以及实际用户数据。
尽管在包括一个用户数据项的图2的示例中不包括“cdmt”框,但是在图4的示例中包括“cmdt”框,以允许“udta”容器框包括多个用户数据项。使用“cmdt”框在包含用户数据项的部分和包含实际用户数据的“cmdt”框的每一个之间进行区分。
图5是被提供用于解释在图4中构造的用户数据的句法结构的实施例。该实施例由包括除了图3的“Class Box”的“class FullBox”和“class USerDataMultipleBox extends FullBox”的多个框构造。
在图5的句法中,“user_brand”表示已经添加了用户数据的用户的标识符(ID),“minor_version”表示用户数据的版本,“track_ID”表示当容器框是moov框时指定用于包含用户数据的轨道的轨道ID,并且“sample_count”表示在mdat框中(即在媒体数据中)的用户数据的采样的起始位置。
然而,如果容器框不是moov框,则由于在要被指定的轨道中已经包括了轨道ID,所以句法可能不包括track_ID,并且如此一来就不必单独定义轨道ID。
现在将参考使用图4的结构构造的文件格式的实施例。
图6图示了在提供了多个轨道的情况下根据本发明构造的用户数据的文件格式的实施例。
如图6所示,ISO文件格式包括moov框和mdat框。根据以上本发明的图3和图4的实施例中所描述的,moov框包括包含用户数据的cmdt框、trak(video)框和trak(audio)框。
这里,trak(video)框指示mdat框包含视频数据,并且还指示视频数据的位置。trak(audio)框指示mdat框包含音频数据,并且还指示音频数据的位置。根据本发明的cmdt框可以包括标识轨道的信息和指示在mdat框中的用户数据的详细位置的信息中的至少一个。
在图6中,例如当轨道ID是2(track_ID=2)时,包含用户数据的cmdt框可以指定音频轨道,并且可以例如使用“sample_count=xx”在音频轨道中指定包含实际用户数据的部分。也就是说,根据本发明,图6的实施例指示了ISO文件包括关于音频数据的用户数据。
在图6中,指定了在moov框中的多个trak框的一个,以指示ISO文件包括对应的轨道的用户数据。
图7图示了根据本发明构造的用户数据的文件格式的另一个实施例,其中构造用户数据使得可以指定多个轨道的每一个。
图7的实施例的基本结构与图6的基本结构类似。将集中于与图6的实施例的部分不同的实施例的部分来给出对下面图7的实施例的描述,而将省略与图6的实施例的部分相同的图7的实施例的部分。
与图6的实施例不同,图7的实施例包括含有用户数据的多个cmdt框。具体地,根据本发明,ISO文件格式被构造成指示文件包括三个轨道(即,视频(track_ID=1)、视频2(track_ID=2)以及音频(track_ID=3))并且包括视频轨道的用户数据和视频2轨道的用户数据。
因此,指示视频数据的用户数据的cmdt框包括“track_ID=1”并且包括指示在由trak(video)框指定的视频数据中的用户数据的实际位置的“sample_count”。
指示视频数据2的用户数据的cmdt框包括“track_ID=2”并且包括指示在由trak(video2)框指定的视频数据中的用户数据2的实际位置的“sample_count”。
在图7的实施例中,根据本发明,包括用户数据的cmdt框被包括在moov容器框中,使得当moov框包括多个trak框时,可以指定多个trak框的每一个来指示文件包括对应的轨道的各自的用户数据。
图8图示了在一个轨道包括指示用户数据的一个cmdt框的情况下,根据本发明构造的文件格式的另一个实施例。图9图示了在一个轨道包括指示用户数据的多个cmdt框的情况下,根据本发明构造的文件格式的另一个实施例。
与图6和图7的实施例不同,在图8和图9的实施例中,trak框包括cmdt框,该cmdt框包括用户数据。
在图8的实施例中,一个trak框包括一个cmdt框,并且在图9的实施例中一个trak框包括多个cmdt框。与图6和图7的示例不同,在这些示例中,由于trak框包括cmdt框,cmdt框包括用户数据,所以可以标识与用户数据相对应的轨道,并且因此不必单独地定义track_ID信息。然而,应当在每个cmdt框中定义指示在对应的轨道中包含用户数据的部分的sample_count值。
图8图示了图6的实施例的另一个结构。尽管在图6的实施例中使用包括在moov框中的采样位置(sample_count)和(音频)轨道ID(track_ID)的信息来定义用户数据,但是在图8的实施例中,trak框中包括cmdt框,并且使用采样位置(sample_count)的信息来定义用户数据,而不单独地定义(视频)轨道ID(track_ID)的信息。
因此,图6和图8图示了文件格式的一个实施例,其中指示文件包括关于包含在单个轨道中的媒体数据的单个用户数据。
图7示出了文件格式的一个实施例,指示文件包括各轨道中所包括的媒体数据项中的两个媒体数据项,即指示了该文件包括两个与图6相同的轨道,每个媒体数据项都包含用户数据。
与图6到图8的实施例不同,图9的实施例图示了在包含视频数据的视频轨道中包括了两个用户数据项的情况下,根据本发明构造的文件格式的另一个实施例。例如,假设视频轨道包括影片(视频数据)。例如,一个用户可以创建影片系列的第一集和第二集,并且将它们包括在视频轨道中,而另一个用户可以创建第三集并且将它包括在视频轨道中。
根据本发明,例如当在moov框中提供了用户数据时,可以为多个轨道的每一个指定用户数据,并且还可以直观地确定用户数据指定了哪个轨道。另外,当在trak框中包括了用户数据时,添加的或删除的内容的用户数据可以被添加到轨道或者从轨道删除。
根据本发明,用户数据的基本文件格式包括数据框。当基本文件格式包括根据本发明的数据框时,它可以存储多个用户数据。
图10图示了说明用于处理根据本发明构造的文件格式的装置的实施例的框图。
图10的广播接收机可以包括调谐器单元1001、解调器1002、解复用器1003、存储介质1004、第一解码器1005、第二解码器1006、处理器1007、显示单元1008和控制器1009。
调谐器单元1001调谐并且接收通过信道传送的广播信号。
解调器1002根据与调制方案对应的方案对所接收到的广播信号进行解调。
解复用器1003对已解调的广播信号进行解复用。
存储介质1004包含如上所述的被构造用于广播的文件格式,并且输出对应的文件。如上所述,该文件包括具有各种文件格式结构的文件,诸如仅音频文件、仅视频文件和仅数据文件,并且根据本发明,每个文件可以包括至少一个用户数据项。
第一解码器1005是用于对具有以上文件格式结构的文件进行解码的文件解码器。第一解码器1005读取具有文件格式结构的接收到的文件,并且仅对文件的与媒体数据相关的部分进行解码和提取。
第二解码器1006根据文件的特性对文件进行解码以创建数据。
控制器1009控制第一和第二解码器1005和1006来进行解码,并且一起输出媒体数据和相关的用户数据。也就是说,控制器1009可以控制第一解码器1005与存储在存储介质1004中的媒体数据有关的用户数据相关联地对根据本发明定义的cmdt框进行解码,并且控制第二解码器1006使用在已解码的cmdt框中的信息对用户数据和媒体数据进行解码。
处理器1007根据对应的文件的特性来接收由第二解码器1006生成的数据,并且处理和输出所接收到的数据。在所接收到的数据包括指示其中包括了用户数据的部分的情况下,处理器1007处理该用户数据,使得可以对用户数据和对应的媒体数据进行解码,而与媒体数据分离地输出用户数据,从而允许用户选择数据。
显示单元1008根据对应的文件的特性来显示每个处理的数据项。在如上所述的用户数据被包括在对应的文件中并且被各自处理和输出的情况下,当构造的用户界面(UI)时,可以将用户数据各自提供给用户,允许用户选择用户数据。
与本发明相关联地,当具有以上文件格式结构的文件是用于仅音频广播的文件时,第二解码器1006可以是音频解码器,具体地是MPEG-1音频解码器,它对在第一解码器1005处提取的以MPEG-1层2(MUSICAM)格式压缩的仅音频广播文件进行解码,从而生成PCM数据。在音频处理器1007处处理已生成的PCM数据,并且然后通过显示单元的扬声器来输出已处理的PCM数据。
在文件是用于传输流的文件的情况下,在通过解复用器(未示出)对在传输流中复用的音频和视频数据进行解复用之后,第二解码器1006起音频和视频解码器的作用。
例如,MPEG-4音频解码器根据MPEG-4比特片段算术编码(BSAC)标准对已提取的音频数据进行解码,并且音频处理器接收和处理已解码的音频数据,并且通过扬声器输出PCM数据。
另外,MPEG-4视频解码器根据MPEG-4高级视频编码(AVC)标准对已提取的视频数据进行解码,并且视频处理器接收和处理已解码的视频数据,并且通过显示单元的屏幕输出PCM数据。
图11是图示用于处理根据本发明构造的文件格式的过程的实施例的流程图。
图11的流程图被提供用于解释图10的实施例的过程。
接收包括具有根据本发明构造的文件格式结构的每个文件的广播信号,并且将该广播信号存储在存储介质1001中(S1101)。
读取所存储的每个文件的数据(S1102),并且确定已读取的数据是否包括用户数据(S1103)。
如果已读取的数据包括用户数据,则读取用户数据(S1104),并且然后处理已读取的用户数据(S1105)。
在处理了用户数据之后,读取媒体数据(S1106),并且根据用户数据的特性来使用已处理的用户数据,或者与在读取之后处理的媒体数据一起或者各自地再现已处理的用户数据(S1107)。
例如,当用户数据具有与再现媒体数据所需要的数据库的类型相同的类型时,可以使用已处理的用户数据来再现媒体数据。
然而,当用户数据是应当与媒体数据同时显示的诸如字幕的信息时,或者当用户数据是一系列媒体数据中的一段时,可以在通过UI将用户数据提供给用户之后,根据用户的选择与媒体数据同时地或者在媒体数据之后再现用户数据。
工业实用性
根据用于构造包括用户数据的文件格式并且处理包括具有根据本发明的文件格式的文件的广播信号的装置和方法,多个用户可以将他们独特的用户数据单独地存储在先前创建的文件中。还可以直观地确定每个用户数据指定了哪个轨道。另外,接收机可以处理具有该文件格式的文件,并且将该文件提供给用户。
Claims (20)
1.一种用于构造文件格式的方法,其中,所述文件格式包括第一框(mdta)和第二框(moov),所述第一框(mdta)包括至少一个轨道,在所述至少一个轨道中定义了媒体数据和关于所述媒体数据的用户数据,所述第二框(moov)包括用来指示所述至少一个轨道的每一个的轨道框(trak)和用来定义关于所述用户数据的用户的数据和信息格式的用户数据框(udta),
其中,所述用户数据框(udta)包括至少一个第三框(cmdt),所述第三框(cmdt)包括能够被用来标识用于指示定义有所述用户数据的轨道的轨道框的信息。
2.根据权利要求1所述的方法,
其中,所述第三框进一步包括关于所述轨道框所指示的所述轨道中的每个用户数据的起始位置的信息。
3.根据权利要求2所述的方法,
其中,所述第三框进一步包括能够被用来标识在所述第一框中已经添加了用户数据的用户的信息。
4.根据权利要求2或3所述的方法,
其中,所述第三框进一步包括关于所述第一框中的用户数据的版本的信息。
5.一种用于构造文件格式的方法,
其中,所述文件格式包括第一框(mdta)和第二框(moov),所述第一框(mdta)包括至少一个轨道,在所述至少一个轨道中定义了媒体数据和关于所述媒体数据的用户数据,所述第二框(moov)包括轨道框(trak),所述轨道框(trak)用于指示所述至少一个轨道的每一个并且包括用来定义关于所述用户数据的用户的数据和信息格式的用户数据框(udta),
其中,所述用户数据框(udta)包括至少一个第三框(cmdt),所述第三框(cmdt)包括关于对应轨道中的所述用户数据的起始位置的信息。
6.根据权利要求5所述的方法,
其中,所述第三框进一步包括能够被用来标识在所述第一框中已经添加了用户数据的用户的信息。
7.根据权利要求5或6所述的方法,
其中,所述第三框进一步包括关于所述第一框中的用户数据的版本的信息。
8.一种用于接收和处理广播信号的方法,所述广播信号包括根据特定文件格式定义的文件,所述方法包括:
接收和存储所述广播信号;
解复用所存储的广播信号中的各文件,已解复用的各文件的每一个包括第一框和第二框,所述第一框包括至少一个轨道,在所述至少一个轨道中定义了媒体数据和关于所述媒体数据的用户数据,所述第二框包括用来指示所述至少一个轨道的每一个的轨道框和用来定义关于所述用户数据的用户的数据和信息格式的用户数据框;
读取在所述已解复用的各文件的每一个中的用户数据框,所读取的用户数据框包括至少一个第三框,所述第三框包括能够被用来标识用于指示定义有所述用户数据的轨道的轨道框的信息;以及
使用所读取的第三框来读取关于所述媒体数据的用户数据,并且解码和处理所读取的用户数据和所述已解复用的媒体数据。
9.根据权利要求8所述的方法,
其中,所述第三框进一步包括关于所述轨道框所指示的轨道中的每个用户数据的起始位置的信息。
10.根据权利要求9所述的方法,
其中,所述第三框进一步包括能够被用来标识在所述第一框中已经添加了用户数据的用户的信息。
11.根据权利要求9或10所述的方法,
其中,所述第三框进一步包括关于所述第一框中的用户数据的版本的信息。
12.一种用于接收和处理广播信号的方法,所述广播信号包括根据特定文件格式定义的文件,所述方法包括:
接收和存储所述广播信号;
解复用所存储的广播信号中的各文件,已解复用的各文件的每一个包括第一框和第二框,所述第一框包括至少一个轨道,所述至少一个轨道包括媒体数据和关于所述媒体数据的用户数据,所述第二框包括轨道框,所述轨道框用于标识所述至少一个轨道的每一个并且包括用来定义关于所述用户数据的用户的数据和信息格式的用户数据框(udta);
读取在所述已解复用的各文件的每一个中的用户数据框,所读取的用户数据框包括至少一个第三框(cmdt),所述第三框包括关于对应轨道中的所述用户数据的起始位置的信息;以及
使用所读取的第三框来读取关于所述媒体数据的用户数据,并且解码和处理所读取的用户数据和所述已解复用的媒体数据。
13.根据权利要求12所述的方法,
其中,所述第三框进一步包括能够被用来标识在所述第一框中已经添加了用户数据的用户的信息。
14.根据权利要求12或13所述的方法,
其中,所述第三框进一步包括关于所述第一框中的用户数据的版本的信息。
15.一种用于接收和处理广播信号的装置,所述广播信号包括根据特定文件格式定义的文件,所述装置包括:
存储单元,所述存储单元用于接收和解复用所述广播信号并存储所述广播信号的各文件;
第一解码器,所述第一解码器用于对包括在所存储的各文件的每一个中的框进行读取和解码,已解码的框包括第一框和第二框,所述第一框包括至少一个轨道,所述至少一个轨道具有在所述至少一个轨道中定义的媒体数据和关于所述媒体数据的用户数据,所述第二框包括用来指示所述至少一个轨道的每一个的轨道框和用来定义关于所述用户数据的用户的数据和信息格式的用户数据框,所述用户数据框包括至少一个第三框,所述第三框包括能够被用来标识用于指示定义有所述用户数据的轨道的轨道框的信息以及与在由所述轨道框指示的轨道中的用户数据的起始位置有关的信息;
控制器,所述控制器用于执行控制操作以使用所述已解码的第三框来解码所存储的第一框中的用户数据和媒体数据或者构造UI;以及
第二解码器,所述第二解码器用于根据所述控制器的控制对所述用户数据和所述媒体数据进行解码,或者构造UI。
16.根据权利要求15所述的装置,进一步包括:
输出单元,所述输出单元用于输出由所述第二解码器解码的所述用户数据和所述媒体数据,或者输出所构造的UI。
17.根据权利要求16所述的装置,
其中,所述控制器控制所述第二解码器,使得与所述已解码的用户数据和媒体数据相关联地构造UI。
18.一种用于接收和处理广播信号的装置,所述广播信号包括根据特定文件格式定义的文件,所述装置包括:
存储单元,所述存储单元用于接收和解复用所述广播信号并存储所述广播信号的各文件;
第一解码器,所述第一解码器用于读取和解码包括在所存储的各文件的每一个中的框,已解码的框包括第一框和第二框,所述第一框包括至少一个轨道,所述至少一个轨道包括媒体数据和关于所述媒体数据的用户数据,所述第二框包括轨道框,所述轨道框用于标识所述至少一个轨道的每一个并且包括用来定义关于所述用户数据的用户的数据和信息格式的用户数据框(udta),所述用户数据包括至少一个第三框(cmdt),所述第三框包括关于对应轨道中的用户数据的起始位置的信息;
控制器,所述控制器用于执行控制操作以使用在所述已解码的第三框中的信息来读取和解码所存储的用户数据和媒体数据;以及
第二解码器,所述第二解码器用于根据所述控制器的控制来读取和解码所存储的用户数据和媒体数据。
19.根据权利要求18所述的装置,进一步包括:
输出单元,所述输出单元用于输出由所述第二解码器解码的所述用户数据和媒体数据。
20.根据权利要求19所述的装置,
其中,所述控制器控制所述第二解码器,使得与所述已解码的用户数据和媒体数据相关联地构造UI。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070022687 | 2007-03-07 | ||
KR1020070022687A KR101295377B1 (ko) | 2007-03-07 | 2007-03-07 | 파일 포맷을 구성하는 방법과 상기 파일 포맷을 가지는파일을 포함한 방송 신호를 처리하는 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101669359A true CN101669359A (zh) | 2010-03-10 |
Family
ID=39738428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880014033A Pending CN101669359A (zh) | 2007-03-07 | 2008-03-07 | 构造文件格式的方法及相应广播信号的处理装置及方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20100191778A1 (zh) |
EP (1) | EP2132931A4 (zh) |
KR (1) | KR101295377B1 (zh) |
CN (1) | CN101669359A (zh) |
WO (1) | WO2008108600A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017084310A1 (zh) * | 2015-11-16 | 2017-05-26 | 深圳Tcl数字技术有限公司 | Mp4视频源的传送方法和装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8976871B2 (en) | 2009-09-16 | 2015-03-10 | Qualcomm Incorporated | Media extractor tracks for file format track selection |
CN102714715B (zh) * | 2009-09-22 | 2016-01-20 | 高通股份有限公司 | 用于文件格式轨迹选择的媒体提取器轨迹 |
KR20130089114A (ko) * | 2012-02-01 | 2013-08-09 | 삼성전자주식회사 | 미디어 파일을 관리하기 위한 장치 및 그 방법 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW302467B (en) * | 1996-03-12 | 1997-04-11 | Ibm | User/defined data in an unused region of data storage media |
KR20040078526A (ko) * | 2003-03-04 | 2004-09-10 | 한국전자통신연구원 | 입력 데이터를 엠펙-21 파일 포멧으로 변환하는 장치 및그 방법 |
CN1833439A (zh) * | 2003-08-08 | 2006-09-13 | 松下电器产业株式会社 | 数据处理装置和数据处理方法 |
US8472792B2 (en) * | 2003-12-08 | 2013-06-25 | Divx, Llc | Multimedia distribution system |
JP4203812B2 (ja) * | 2003-12-29 | 2009-01-07 | ソニー株式会社 | ファイル記録装置、ファイル記録方法、ファイル記録方法のプログラム、ファイル記録方法のプログラムを記録した記録媒体、ファイル再生装置、ファイル再生方法、ファイル再生方法のプログラム及びファイル再生方法のプログラムを記録した記録媒体 |
KR100602388B1 (ko) * | 2004-11-17 | 2006-07-20 | 주식회사 픽스트리 | 엠펙-21 멀티미디어 프레임워크에서의 리소스 참조 방법 |
JP4380533B2 (ja) * | 2004-12-24 | 2009-12-09 | キヤノン株式会社 | マルチメディアデータ処理装置及びその方法 |
JP4991034B2 (ja) * | 2005-11-04 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | モバイル通信ターミナル及びモバイル通信ターミナルのメディア再生時間を計算する方法 |
-
2007
- 2007-03-07 KR KR1020070022687A patent/KR101295377B1/ko active IP Right Grant
-
2008
- 2008-03-07 CN CN200880014033A patent/CN101669359A/zh active Pending
- 2008-03-07 US US12/450,008 patent/US20100191778A1/en not_active Abandoned
- 2008-03-07 EP EP08723356A patent/EP2132931A4/en not_active Withdrawn
- 2008-03-07 WO PCT/KR2008/001319 patent/WO2008108600A1/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017084310A1 (zh) * | 2015-11-16 | 2017-05-26 | 深圳Tcl数字技术有限公司 | Mp4视频源的传送方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
EP2132931A1 (en) | 2009-12-16 |
EP2132931A4 (en) | 2010-06-23 |
US20100191778A1 (en) | 2010-07-29 |
WO2008108600A1 (en) | 2008-09-12 |
KR20080082192A (ko) | 2008-09-11 |
KR101295377B1 (ko) | 2013-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1988646B (zh) | 显示关于广播内容的信息的方法和设备 | |
CN101536101A (zh) | 编码方法和装置以及解码方法和装置 | |
CN102782684B (zh) | 用于发送和接收包括多个流的内容文件的方法和设备 | |
CN103299648A (zh) | 接收增强服务的方法及其显示装置 | |
KR20110134857A (ko) | 프래그먼트 기반의 멀티미디어 스트리밍 서비스 제공 방법과 그 장치, 그리고 프래그먼트 기반의 멀티미디어 스트리밍 서비스 수신 방법과 그 장치 | |
CN102204248A (zh) | 视频数据处理方法、视频图像展示方法和装置 | |
CN104038774B (zh) | 生成铃声文件的方法及装置 | |
CN102780728A (zh) | 媒体文件转码下载方法及客户端 | |
CN101669359A (zh) | 构造文件格式的方法及相应广播信号的处理装置及方法 | |
CN101326825B (zh) | 视听装置和内容处理方法 | |
CN102969013A (zh) | 数据处理设备及其控制方法 | |
JP2010147507A (ja) | コンテンツ再生装置 | |
CN101883249A (zh) | 一种网络视频文件获取系统 | |
CN106899881A (zh) | 音视频文件的播放方法及播放装置 | |
CN102301386A (zh) | 通过使用元数据再现内容的方法和装置 | |
JP2008527837A (ja) | カスタマイズデータ放送サービスのためのメタデータ構成、並びに、これを用いたデータ放送サービス方法及びシステム | |
KR100619031B1 (ko) | 부가 데이터의 인터랙티브한 이용방법 및 장치, 그에 따른수신장치 | |
KR100988120B1 (ko) | 디지털 콘텐츠의 효율적인 저장/관리/소비를 위한 통합저장 포맷 및 이를 이용한 디지털 만화 콘텐츠 서비스시스템 및 방법 | |
KR20150048961A (ko) | 핫 씬 서비스 시스템, 핫 씬 서비스 방법 및 이를 위한 장치 | |
JP5659027B2 (ja) | 情報通信サーバ、及び情報通信方法 | |
JP2006301808A (ja) | コンテンツ配信システムおよび方法、プログラム | |
CN102480636A (zh) | 控制装置和控制方法 | |
KR101883793B1 (ko) | 이동통신 단말기에서 댓글을 공유하기 위한 장치 및 방법 | |
CN106331734A (zh) | 一种微信点歌台实现方法及系统 | |
Koenig et al. | Forensic Authenticity Analyses of the Metadata in Re-Encoded M4A iPhone iOS 12.1. 2 Voice Memos Files |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20100310 |