CN101261865B - 媒体电子文件的制作方法、装置及其播放设备及方法 - Google Patents

媒体电子文件的制作方法、装置及其播放设备及方法 Download PDF

Info

Publication number
CN101261865B
CN101261865B CN2008100934063A CN200810093406A CN101261865B CN 101261865 B CN101261865 B CN 101261865B CN 2008100934063 A CN2008100934063 A CN 2008100934063A CN 200810093406 A CN200810093406 A CN 200810093406A CN 101261865 B CN101261865 B CN 101261865B
Authority
CN
China
Prior art keywords
information
data
piece
audio
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008100934063A
Other languages
English (en)
Other versions
CN101261865A (zh
Inventor
孔文海
李智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ACTIONS (ZHUHAI) TECHNOLOGY CO., LTD.
Original Assignee
Actions Semiconductor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Actions Semiconductor Co Ltd filed Critical Actions Semiconductor Co Ltd
Priority to CN2008100934063A priority Critical patent/CN101261865B/zh
Publication of CN101261865A publication Critical patent/CN101261865A/zh
Application granted granted Critical
Publication of CN101261865B publication Critical patent/CN101261865B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种制作媒体电子文件的方法,该方法包括:按照块结构为基本组织形式,将视音频流进行编码,生成媒体电子文件,其中,所述块结构,包括若干个数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,及用于存储每个主类的视音频数据的摘要信息的摘要信息块。由于音频信息块和视频信息块单独编辑,音频数据和视频数据可按照不同格式编码在基本数据存储单元,易于扩展媒体电子文件,由于媒体电子文件以块为组织形式,每个数据块可按照层次保存数据,因此,与现有技术相比,可以节省媒体电子文件的存储空间。

Description

媒体电子文件的制作方法、装置及其播放设备及方法
技术领域
本发明涉及媒体播放技术领域,更具体说,涉及一种媒体电子文件的制作方法、装置及其播放设备及方法。 
背景技术
Matrox Electronic Systems Ltd.(迈创电子系统有限公司)于1997年9月制定了OpenDML AVI Format Extensions(开放DML音频视频交错格式范围),用于捕捉、编辑和视音频序列的回放。格式信息和数据信息单独存放在一个LIST(列表)中,每一项格式信息是唯一的。视音频数据是按帧存放,音频和视频数据的大小和存放位置是随机的,每帧数据是非加密数据。文件尾含有整个视音频数据帧的索引表。 
AVI(Audio Video Interleaved,音频视频交错)文件结构中格式LIST和媒体数据LIST对其它非媒体和格式信息的数据的扩展不方便。另外,每一项的格式信息都是唯一的,这对于需要增加的每一节目段的数据格式支持不够灵活。例如,如果需要添加用户可编辑的EXIF(Extended information,扩展信息)信息,在AVI中需要重新添加EXIF定义与LIST的支持;如果制作商制作音影文件时,录制了多个不同参数的节目,那么AVI对此就无能为力,它对同一个格式选项仅支持一项,不支持重复的同类格式信息。 
AVI中同步是根据视频的帧率与音频的比特率来进行视音频同步,在分离音频和视频数据时,需要计算音频和视频的时间戳,同时无规律的音视频帧顺序导致了分离的效率低下,同步效率低,这直接影响了回放的效率。 
此外,AVI中缺乏一定的安全机制,缺少与外部安全机制联系的接口。AVI不能提供措施保障广告商利益。最后,AVI中松散的帧结构,难以满足  K-Show(一种合成原唱、伴音、歌词、录音及录音回放的技术)中主音和伴音的无缝切换。 
发明内容
鉴于上述,本发明的目的是提供一种媒体播放方法和相应的便携式娱乐设备以及相应的系统,其支持多种文件格式,具有灵活的可扩展性。 
本发明的目的还在于提供一种制作媒体电子文件的方法及装置,能制作具有可扩展性的媒体电子文件。 
本发明实施例提供的一种制作媒体电子文件的方法,该方法包括: 
按照块结构为基本组织形式,将视音频流进行编码,生成媒体电子文件, 
其中,所述块结构包括若干个数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块。 
本发明实施例提供的一种制作媒体电子文件的方法,所述媒体电子文件包括若干个数据块,分别为:整体信息块,视频信息块、音频信息块、基本媒体数据块以及摘要信息块,该方法包括: 
将同步视频数据和同步音频数据合成打包存储在基本媒体数据块, 
将所述同步视频数据对应的文件视频信息存储在视频信息块,将所述同步音频数据对应的文件音频信息存储在音频信息块;以及, 
将获取的文件整体信息存储在整体信息块,将提取的基本媒体数据块的摘要信息存储在摘要信息块。 
本发明实施例提供的一种制作媒体电子文件的装置,该装置包括: 
存储单元,用于存储媒体电子文件,所述媒体电子文件至少包括若干个数据块,分别为基本媒体数据块、视频信息块、音频信息块、整体信息块以及摘要信息块; 
基本媒体数据处理单元,用于同步视频数据和同步音频数据合成打包存储在基本媒体数据块; 
视频信息处理单元,用于将所述同步视频数据对应的文件视频信息存储在视频信息块; 
音频信息处理单元,用于将所述同步音频数据对应的文件音频信息存储在音频信息块; 
整体信息处理单元,用于将文件整体信息存储在整体信息块; 
摘要信息处理单元,用于将基本媒体数据块的摘要信息存储在摘要信息块。 
本发明实施例提供的一种媒体播放方法,所播放媒体电子文件包含多个作为基本组织形式的数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块,该方法包括: 
读取整体信息块、视频信息块、音频信息块以及摘要信息块,获得文件整体信息、文件视频信息、文件音频信息以及摘要信息; 
根据文件视频信息中的视频编码格式以及文件音频信息中的音频编码格式,对所述基本媒体数据块中的视音频数据进行解码; 
根据所述摘要信息中的时间戳对视音频解码后的数据,按照所述整体信息中的播放速率,进行同步播放。 
本发明实施例提供的一种便携式娱乐设备,包括: 
数据存储器,所述数据存储器存储媒体电子文件,所述媒体电子文件包含多个作为基本组织形式的数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块; 
与数据存储器连接的处理器, 
所述处理器,用于处理视频流,负责视频流的解密、解压缩和显示和对音频流数据的解密、解压缩和输出; 
用于将声音信号的输入采样量化的ADC、提供音频数据转换成声音数据的DAC,ADC和DAC的配合实现声音的输入和合成输出。 
在本发明制作媒体电子文件的实施例中,由于音频信息块和视频信息块单独编辑,因此音频数据和视频数据可以按照不同格式编码在基本数据存储单元,易于扩展媒体电子文件,而且,由于媒体电子文件以块为组织形式,每个数据块可按照层次保存数据,因此,与现有技术相比,可以节省媒体电子文件的存储空间。 
在播放所述媒体电子文件中,每个基本媒体数据块内的数据是已同步好的数据,在播放时,无需担心同步问题和对时间戳进行计算和纠正。因此,相对于AVI中音频数据帧和视频数据帧随机存放,显著改善了回放效率。 
附图说明
图1为根据本发明的一个实施例的AMVB文件的结构框图。 
图2为根据本发明实施例的AMVB文件中‘AMVH’中的MainAMVBHeader数据结构。 
图3为根据本发明实施例的AMVB文件中‘VMHD’中的AMVBVideoStreamHeader数据结构。 
图4为根据本发明实施例的AMVB文件中‘AMHD’中的AMVBAudioStreamHeader数据结构。 
图5为根据本发明实施例的AMVB文件中媒体数据SBCK中的AMVBCUNKHeader数据结构。 
图6为根据本发明实施例的AMVB文件中‘DRM’(数字版权保护)中的AMVBDRMHeader数据结构。 
图7为根据本发明实施例的AMVB文件中媒体数据摘要信息中的AMVBINDEXENTRY数据结构。 
图8为根据本发明实施例的AMVB文件中‘EXIF’中的EXIFOffset、EXBaseInfo、EXVideoInfo、EXAudioInfo数据结构。 
图9为根据本发明实施例的AMVB文件中每个时刻歌词数据的AMVBLYRIC数据结构。 
图10为根据本发明实施例的AMVB文件中分段节目数据的AMVBPROGINDEXENTRY数据结构。 
图11为根据本发明实施例的AMVB文件中播放控制中的AMVBCTLPLAY数据结构。 
图12为根据本发明实施例的AMVB文件中的编辑控制AMVBEDITCTR数据结构。 
图13为根据本发明实施例的AMVB文件中的元素表描述AMVBFDDEPIC数据结构。 
图14示出播放媒体文件所需的硬件结构的一个实施例。 
图15示出媒体文件制作的实施例。 
图16示出媒体文件播放的实施例。 
图17A示出了一个实现完整的K-Show功能的实施例的流程示意图; 
图17B示出实现K-Show功能实施例。 
图18示出广告播放控制实施例。 
图19示出版权保护检测实施例。 
图20示出生物认证实施例。 
图21示出编辑控制实施例。 
图22示出播放控制实施例。 
具体实施方式
AVI(Audio Video Interleaved)是一种RIFF(Resource Interchange FileFormat,资源交换文件格式)文件格式,多用于音视频捕捉、编辑、回放等应用程序中。通常情况下,一个AVI文件可以包含多个不同类型的媒体流(典型的情况下有一个音频流和一个视频流),不过含有单一音频流或单一视频流的AVI文件也是合法的。在文件开始包含音频和视频格式信息。视音频数据是按帧存放,音频和视频数据的大小和存放位置是随机的,每帧数据是非加密数据。文件尾一般含有整个视音频数据帧的索引表。Matrox Electronic Systems Ltd.于1997年9月制定了OpenDML AVI Format Extensions。 
资源交换文件格式(Resource Interchange File Format,RIFF)文件使用四字符码(four-character code,FOURCC)来表征数据类型,比如‘RIFF’、‘AVI’、‘LIST’等。最开始的4个字节是一个四字符码‘RIFF’,表示这是一个RIFF文件;紧跟着后面用4个字节表示此RIFF文件的大小;然后又是一个四字符码说明文件的具体类型(比如AVI、WAVE等);最后就是实际的数据。注意文件大小值的计算方法为:实际数据长度+4(文件类型域的大小);也就是说,文件大小的值不包括‘RIFF’域和“文件大小”域本身的大小。 
RIFF文件的实际数据中,通常还使用了列表(List)和块的形式来组织。列表可以嵌套子列表和块。其中,列表的结构为:‘LIST’listSize listType listData-‘LIST’是一个四字符码,表示这是一个列表;listSize占用4字节,记录了整  个列表的大小;listType也是一个四字符码,表示本列表的具体类型;listData就是实际的列表数据。注意listSize值的计算方法为:实际的列表数据长度+4(listType域的大小);也就是说listSize值不包括‘LIST’域和listSize域本身的大小。再来看块的结构:ckID ckSize ckData——ckID是一个表示块类型的四字符码;ckSize占用4字节,记录了整个块的大小;ckData为实际的块数据。注意ckSize值指的是实际的块数据长度,而不包括ckID域和ckSize域本身的大小。 
注意:在下面的内容中,将以LIST(listType(listData))的形式来表示一个列表,以ckID(ckData)的形式来表示一个块,如[optional element]中括号中的元素表示为可选项。 
AVI文件类型用一个四字符码‘AVI’来表示。整个AVI文件的结构为:一个RIFF头+两个列表(一个用于描述媒体流格式、一个用于保存媒体流数据)+一个可选的索引块。AVI文件的展开结构大致如下: 
RIFF(‘AVI’ 
LIST(‘hdrl’ 
   ‘avih’(主AVI信息头数据) 
    LIST(‘strl’ 
      ‘strh’(流的头信息数据) 
      ‘strf’(流的格式信息数据) 
       [‘strd’(可选的额外的头信息数据)] 
       [‘stm’(可选的流的名字)] 
       … 
       ) 
    … 
    ) 
LIST(‘movi’ 
   {SubChunk |LIST(‘rec’ 
          SubChunk1 
          SubChunk2 
          … 
          ) 
      … 
    } 
    … 
    ) 
[‘idx1’(可选的AVI索引块数据)] 
AVI文件的数据组织形式,是按LIST的方式分别表明格式信息和数据,作为一种专门针对音影文件的文件格式,其缺乏对扩展信息的足够支持,比如AVI文件格式是针对32位操作系统,整个文件大小不超过4G;再比如如果在AVI中需要增加快速预览信息,则除了需要重新制定这个快速预览信息的格式外,还需要在格式LIST中增加该格式信息和增加另一个LIST存放数据(因为它不是音影播放数据,无法存放在LIST MOVI中)。并且如果有多个节目的时候,AVI的格式信息是唯一的,其不支持不同格式信息的媒体数据。此外,逐帧的结构视音频数据的随机存放增加了视音频同步的难度,降低了回放的效率;由于没有涉及节目和内容保护,缺乏有效的安全性;包括整个视音频数据帧的索引表,极大增加了整个文件的大小。 
下面举具体实施例详细介绍本发明的具体实施例方式。 
本发明实施例是按照块结构为基本组织形式,将视音频流进行编码,生成媒体电子文件,其中,所述块结构包括若干个数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块。 
所述数据块可以按照分层结构存储信息。比如:每个数据块可以至少包括  多个主类块,每个主类块按照信息类别存储信息;主类块可以包括多个子类块,每个子类块按照对应类别的子类存储信息。每个子类块可以包括多个层次块,每个层次块按照对应子下的分层结果存储信息。每个层次块也可以包括多个基本数据单元,用于存储数据的最小单位。 
下面再以基本媒体数据块为例说明分层结构存储的实施例,如果基本媒体数据块可以包括两个子类块,其中每个子类块用于存储视频流或音频流。所述子类块至少包括第一层次块和第二层次块,其中,第一层次块用于存储多帧同步的视频流,第二层次块用于存储多帧同步的音频流。所述第二层次块包括多个元素块,分别存储按照主音和伴音的多语言多音轨数据流,以及按照语言和音轨分离的数据流。这里,当所述块结构包括多个视频信息块或多个音频信息块时,每个视频信息块中存储的文件视频信息中的文件格式信息可以相同,也可以不同。相应的,每个音频信息块中存储的文件音频信息中的文件格式信息可以相同,也可以不同。 
所述块结构还可以包括:版权保护信息块,用于存储关键的版权保护或者内容保护的信息。 
所述块结构还可以包括:编辑控制块、元素块和元素描述块,其中,所述编辑控制块,用于存储对视音频内容进行修改的控制信息;元素块,用于存储对视音频内容进行修改的替换素材信息;所述元素描述块,用于存储所述替换素材信息的格式信息。 
所述块结构还包括:节目分段信息索引块,用于保存视频流分段的大小、分段信息摘要和分段时间戳。这里,视频流可以按照时间、内容和语言中的一种或几种进行分段。 
所述块结构还包含:播放控制块,用于存储针对特定的环境下数据的权限保护信息。所述权限保护信息可以包括:隐私保护所有权信息长度,以及在所述长度范围内的指纹信息或视网膜信息,用于提供给指纹传感器或者虹膜传感器进行权限认证。 
所述块结构还包括:快速预览图像信息块,用于存储多种语言的预览信息。 
所述摘要信息还可以包括所述基本媒体数据块按照主类类别存储的视音频信息之间的关联信息,自身与最近的广告块的偏移信息。 
所述块结构还可以包括歌词/字幕信息块,用于存储至少一种语言的歌词。 
所述块结构还可以包括用户可定义信息块,用于存储用户自定义信息。 
下面介绍下本发明实施例的制作媒体电子文件的方法。 
本发明实施例的制作媒体电子文件的方法可以这样实现: 
(1)将同步视频数据和同步音频数据合成打包存储在基本媒体数据块, 
(2)将所述同步视频数据对应的文件视频信息存储在视频信息块,将所述同步音频数据对应的文件音频信息存储在音频信息块; 
(3)将获取的文件整体信息存储在整体信息块,将提取的基本媒体数据块的摘要信息存储在摘要信息块。 
这里,步骤(1)、(2)和(3)的顺序不限。 
在将同步视频数据和同步音频数据合成打包存储在基本媒体数据块之前,可以进行水印处理,比如:将同步视频数据嵌入水印,或将同步音频数据嵌入水印。还可以生成数字版权管理DRM数据头保存在版权保护信息块中,并对同步视频数据和/或同步音频数据进行数字版权保护DRM加密。 
当然,制作的媒体电子文件中,还可以进入如下的任何一个或几个操作。 
将多种语言的预览信息保存在预览图像信息块中;将特定环境下数据的权限保护信息保存在播放控制块中;将视频流分段的大小、分段信息摘要和分段时间戳保存在分段信息索引块;将至少一种语言的歌词保存在歌词/字幕信息块中;将对视音频内容进行修改的控制信息存储在编辑控制块;将对视音频内容进行修改的替换素材信息存储在元素块;将所述替换素材信息的格式信息存储在元素描述块;将用户自定义信息存储在用户可定义信息块。 
本发明实施例的制作媒体电子文件的装置包括:存储单元、基本媒体数据处理单元、视频信息处理单元、视频信息处理单元、音频信息处理单元、整体  信息处理单元和摘要信息处理单元。 
其中,存储单元,用于存储媒体电子文件,所述媒体电子文件至少包括若干个数据块,分别为基本媒体数据块、视频信息块、音频信息块、整体信息块以及摘要信息块;基本媒体数据处理单元,用于同步视频数据和同步音频数据合成打包存储在基本媒体数据块;视频信息处理单元,用于将所述同步视频数据对应的文件视频信息存储在视频信息块; 
音频信息处理单元,用于将所述同步音频数据对应的文件音频信息存储在音频信息块; 
整体信息处理单元,用于将文件整体信息存储在整体信息块; 
摘要信息处理单元,用于将基本媒体数据块的摘要信息存储在摘要信息块。 
该装置还可以包括如下一个或几个处理单元。 
水印处理单元,用于在将同步视频数据和同步音频数据合成打包前,将提取的同步视频数据嵌入水印,和/或,将同步音频数据嵌入水印。 
加密处理单元,用于在将同步视频数据和同步音频数据合成打包前,生成数字版权管理DRM数据头保存在版权保护信息块中,并对同步视频数据和/或同步音频数据进行数字版权保护DRM加密。 
预览图像处理单元,用于将多种语言的预览信息保存在预览图像信息块中。 
播放控制处理单元,用于将特定环境下数据的权限保护信息保存在播放控制块中。 
分段信息索引处理单元,用于将视频流分段的大小和分段时间戳保存在分段信息索引块。 
歌词信息处理单元,用于将将至少一种语言的歌词保存在歌词/字幕信息块中。 
编辑控制处理单元,用于将对视音频内容进行修改的控制信息存储在编辑  控制块; 
元素处理单元,用于将对视音频内容进行修改的替换素材信息存储在元素块; 
元素描述处理单元,用于将所述替换素材信息的格式信息存储在元素描述块。 
以下以一个具体化的实施例来描述本发明提供的文件格式,这里,将这里描述的文件格式的例子命名为AMVB(Actions media video beta,炬力媒体视频格式β版),并且,为叙述方便起见,后面都采用这一称呼。然而,应当理解,本发明并不局限于这一具体的实施例。例如,AMVB文件本身的命名、具体的参数名称、字节数等等都不能限制本发明,具有与AMVB相同或类似的基本技术特征的任何文件都应落入AMVB的范畴。而且,具有本发明的基本技术特征的一切修改、等同物和可选方案都应落入本发明的保护范围。 
在此描述的实例AMVB是一种用于解决高效回放、内容和节目安全的媒体文件格式,它提供了节目分段、广告播放控制、K-Show(一种合成原唱、伴音、歌词、录音及录音回放的技术)、影音编辑合成、支持多语言预览信息等功能。AMVB的有效数据以块组成,块可以嵌套主类。块BLCK可以根据功能需要增加或者减少,并且各个块BLCK的顺序可以打乱,每个块BLCK后是主类标识,主类标识可以嵌套子类,一个主类下可以包含多个同类型的子类,子类下是各个层次的数据,各层次包含了不同类别的元素。AMVB文件基本配置依次包括AMVB文件整体信息块、视频信息块、音频信息块、用户可定义信息块、版权保护信息块、基本媒体数据块、摘要信息块。其中,基本媒体数据块是以主类‘MOVD’标识,子类‘SBCK’组成。SBCK是回放的基本单位,每个SBCK包含多个已同步的流信息,包括多轨道多语言音频流、视频流等。此外,AMVB还可包含可选的播放控制块、编辑控制块、内容素材块、素材描述块、多语言字幕信息块、多语言快速预览图像信息、多语言节目分段信息块等,用于内容的隐私保护,交互编辑和播放。 
AMVB文件格式引入了块和类的概念,每个块含有主类标识和子类标识。扩展了EXIF(Extended information,扩展信息)、快速预览信息和字幕流信息;增加了素材编辑和合成接口;增加的DRM(Digital right magagement,数字版权管理)和水印功能接口提高了内容安全和节目安全性。以媒体数据块内子块(或称子类)为同步和回放单位,极大的提高了回放的效率,同时也有效的减少了整个AMVB摘要信息的大小。AMVB文件格式中同属一个主类的子类数据块必须按照相应的顺序放置同一主类下,每个子类数据块可以不是唯一的。 
图1为根据本发明实施例的AMVB文件的结构框图。参考图1描述Amvb文件的具体的技术特征。 
根据本发明的优选实施例,AMVB文件格式中的最大单元是BLOCK(BLCK),每个块支持的大小用8字节表示,支持264-1字节大小的数据。满足日益增长的数据和64位的操作系统的需求;相比AVI有更大的扩展空间。 
AMVB文件格式中各块之间的顺序是不固定的,除了满足基本的AMVB文件格式要求外,用户可以根据需求,增加自己需要的BLCK,扩展很灵活。 
利用AMVB格式,在节目录制时,可以在时间上和内容上对节目分段,同时还支持对不同格式的节目的支持,也就是说,两个不同编码格式的媒体数据,只要满足AMVB数据组织的要求,在转制时,不需要对两个不同编码格式的媒体数据进行解码再编码,可以有效节省制作时间和增加节目录制的灵活性。 
在AMVB格式中,数据组织形式即音视频流在一个基本回放单位内是时间上基本同步的,不同于AVI中音视频数据帧的分离存放,在回放时,可以快速的对音视频同步,提高了回放的速度。 
在AMVB格式中,整个节目的索引信息只包含每个基本回放单元的信息,假设基本回放单元的时间是1秒,那么整个索引信息的大小至少比AVI中的索引信息小帧率的倍数,很适合在资源有限的便携式式设备上使用。 
根据AMVB格式,amvb文件保留DRM接口和版权保护接口,对于内容信息可以申请DRM保护或者版权保护,对于需要保护的模块,调用专用的DRM或者版权保护库进行保护,一旦出现非法用户,可以通过DRM信息来保护内容不被破坏,通过版权信息来保护内容不被盗版和盗播。 
amvb格式是一种多层次结构,在同一层次下支持不同表达形式的相同内容,如可以支持多语言功能。 
根据AMVB格式,通过增加控制编辑块、元素块和元素描述块提供交互接口; 
根据AMVB格式,通过增加节目分段和字幕信息块,结合基本媒体信息块提供完善的K-Show功能。 
根据AMVB格式,至少包括AMVB整体信息块、视频格式信息块,音频格式信息块、DRM信息块、EXIF信息块、基本媒体数据块和摘要信息块从而构成一个基本的AMVB文件。 
AMVB文件标识和大小:标识为4字符‘AMVB’,文件大小用8字节表示,不包含4字符标识和用于表示文件大小的8字节。 
块文件的标识和大小:每个块都有BLOCK(BLCK)标识,文件大小也用8字节表示。 
AMVB文件整体信息块:包含文件整体信息,由4字符主类标识‘AVHD’表示,紧接子类‘AMVH’标识和该子类大小,MainAMVBHeader结构中包含:视频帧间隔时间、媒体信息子块最大字节数、媒体信息子块总数、广告信息子块总数、总帧数、版本号、文件中包含的流个数、多语言分类、多音轨分类、视频帧缓存大小、从文件头到DRM块的偏移量、从文件头到预览信息块的偏移量、从文件头到媒体数据子块摘要信息块的偏移量、从文件头到媒体数据块的偏移量、从文件头到辅助信息块的偏移量、从文件头到歌词数据块的偏移量、歌词总条数、广告存放设置、广告播放时间设置、总播放时间、广告信息块的总时长,此外还可以包括各种信息块的有效性标志以及是否加密和是否含有水  印信息的标志位,最后保留16字节用于扩展。 
视频信息块:包含文件视频信息,由4字符主类标识‘AMVV’表示,紧接子类‘VMHD’标识和该子类大小,AMVBVideoStreamHeader结构中包含视频标志、编码器插件号、预览信息语言分类、视频数据流的时基标准、视频帧率、流的开始时间、流的长度、视频流数据缓存大小、视频的宽度、视频的高度、颜色深度和播放大小,此外视频还有可选的补充的特殊视频格式信息块,最后保留8字节用于扩展。 
音频信息块:包含文件音频信息,由4字符主类标识‘AMVA’表示,紧接子类‘AMHD’结构标识和该子类大小,AMVBAudioStreamHeade结构中包含音频标志、编码器插件号、音轨语言分类信息、数据流的时基标准、流的开始时间、流的长度、流数据缓存大小、音轨数与音频的通道数、音频的采样精度、音频的采样率、音频的比特率,此外音频还有可选的补充的特殊音频格式信息块,最后保留8字节用于扩展。 
用户可定义信息块(扩展信息块)EXIF:用于可由用户定义的扩展信息,由4字符主类标识‘EXIF’表示,紧接子类‘ofet’、子类‘base’、子类‘vido’和子类‘audo’,以及各个子类的大小。子类‘ofet’的EXIFOffset结构中主要包括后续的exif信息相对于‘EXIF’的偏移。子类‘base’的EXBaseInfo结构中主要包括发行次数、制作商、发行商、创作时间、发行时间地点、版权所有者、技术支持、软件开发和评价等。子类‘vido’的EXVideoInfo结构中主要包括帧宽高、颜色深度、播放速率、压缩格式、影名、主要演员、关键词等。子类‘audo’的EXAudioInfo结构中主要包括音频编码信息、采样率、采样精度、比特率、演唱者、歌曲名、关键词等。 
版权保护(DRM)准息块:由4字符主类标识‘DRM’表示,紧接子类‘VDRM’和子类‘VDRM’,以及各个子类的大小。子类‘VDRM’和子类‘ADRM’各保留2K字节的信息用于存储关键的版权保护或者内容保护的信息。 
节目分段索引块:由4字符主类标识‘PBSK’表示,紧接子类‘SBSC’标识和  该子类的大小。每个分段节目索引信息由标识‘psdx’,分段节目每段的大小,分段时间戳,12字节的扩展,语言数以及各种语言的分段节目内容的长度和内容组成。 
基本媒体数据块:由4字符主类标识‘MOVD’表示,包括各个由子类‘SBCK’标识的基本媒体数据子块(SBCK,SubBlock)及其大小。数据子块(这里也可称为子类)内容可以分别是视音频数据和广告视音频数据,每个子块中包括子块头、各种语言和轨道的音频包、视频数据包。每帧视频数据包括3字节视频帧头标识、1字节帧序号以及4字节帧大小;每帧音频包括3字节音频帧头标识、1字节语言和轨道序号以及4字节该帧大小。其中,音频数据包可以多个音轨,默认为1个音轨。注意,只有该媒体数据块中的主类标识‘MOVD’可以有多个,此时对应有多个节目的情况。 
基本媒体数据子块的摘要信息块:由4字符主类标识‘MMPS’表示,紧接子类‘SBPS’标识和该子类大小。子类‘SBPS’由各个子块的摘要信息组成。每个子块摘要信息由标识‘SBCK’、该‘SBCK’的时间戳、该数据块相对于‘MOVD’的偏移、该数据块与其后最近广告块的最小偏移量组成。 
快速预览图像信息块:由4字符主类标识‘PVIF’标识,紧接子类‘PVHD’标识和该子类大小。子类下对应各个语言的预览信息,其有3字节prv标识和一字节的语言标号标识,然后是该语言下的预览信息大小,预览图像信息可以是包括格式信息的商标(LOGO)或者图像序列。 
歌词数据块:由4字符主类标识‘WOAS’表示,紧接子类‘LCPS’标识和该子类大小。子类下对应于各个语言的歌词信息,每个语言的歌词信息由3字节lug标识和1字节语言标识。每个时间的子块歌词信息由标识‘lyrc’,‘lyrc’的时间戳,该时刻歌词数据长度和有效歌词数据组成。 
控制信息块:由4字符主类标识‘COPL’标识,紧接子类标识‘BSCO’和该子类大小。子类内容包括隐私保护所有权信息、分段节目播放控制、时间播放控制、存活控制、传播控制、传播平台控制、数据存放顺序和节目完整性信息。 
编辑控制块:由4字符主类标识‘EDCO’标识,紧接子类标识‘BSCO’、‘PCCO’、‘AUCO’、‘TXCO’、‘OTCO’和各子类的大小。子类‘BSCO’包括了基本的信息包括总时长(4字节)、用到的各类别的元素信息总数(各4字节);子类‘PCCO’包括了图像元素在元素表中的类别、编号、时间戳,在画面中的位置、该元素大小、时长、动作信息;子类‘AUCO’包括了音频元素在元素表中的类别、编号、时间戳、时长、演奏的乐器;子类‘TXCO’包括字幕元素在字幕信息表中的类别、编号、时间戳、持续长度和字体、特效和画面上的位置;子类‘OTCO’包括一些无法分类的信息包括用户自定义的语言等。 
元素块,由4字符主类标识‘FDLY’标识。紧接子类标识‘PCLY’、‘AULY’、‘TXLY’、‘BSLY’和‘SPLY’和各子类的大小。每个子类包括每一元素类别大小和子子类别标记和含有编号的有效数据。‘PCLY’可以划分为人物类别(‘hum’)、景物(‘viw’)、动物(‘zoo’)、卡通(‘kat’);‘AULY’可以分成人声(‘poa’)和乐声(‘mic’);‘BSLY’可以划分一些基本的元素,比如几何形状、脸型等;其中,元素块可以由多个,每个主类标识下根据需要可以增加相应的子类别。 
元素描述块,由4字符主类标识‘FDDP’标识,紧接子类标识‘PCDP’、‘AUDP’、‘TXDP’、‘BSDP’和‘SPDP’和该子类的大小。每个子类包括格式信息、包含元素子类别以及子类别文字描述。‘PCDP’可以进一步划分为人物类别(‘hum’)、景物(‘viw’)、动物(‘zoo’)、卡通(‘kat’);‘AUDP’可以分成人声(‘poa’)和乐声(‘mic’);其中主类标识‘FDDP’可以由多个,每个主类标识下根据需要可以增加相应的子类别。 
以本发明的文件格式制作的媒体文件,在很好的满足捕捉、编辑和播放功能的同时,其灵活的扩展性,增加了完善的广告播放功能和多语言K-Show功能接口;支持预览信息,节目分段和EXIF信息;改善节目和内容安全性,保障了节目、内容和广告商的利益;提高了回放的效率、减少文件的大小同时也使得同步机制更加简单和可靠;增加了交互模式下利用元素素材库中的影音元素对基本媒体数据进行编辑和合成的支持;提供了针对隐私和重要数据权限设  置的接口。 
图2为根据本发明实施例的AMVB文件中‘AMVH’中的MainAMVBHeader数据结构。其中各参数含义如下: 
dwMicroSecPerFrame:表示视频帧间隔时间(106/帧率); 
dwMaxBytesPercuk:表示所有SBCK单元中的最大字节数; 
dwFlags:辅助信息选项; 
dwTotalsubCuk:该文件中SBCK的总数; 
dwTotalADsbck:该文件中广告信息块的总数; 
dwTotalFrames:该文件中的总帧数; 
dwVersion:版本号; 
dwStreams:数据流个数; 
dwlanguage:支持语言数; 
dwtrack:支持音轨数; 
dwSuggestedBufferSize:表示流中视频缓存大小; 
dwOffsetofDRM[2]:表示从该节目文件‘AMVB’标志到相对应的‘DRM’标志处的偏移,低位在前,高位在后; 
dwOffsetofofet[2]:表示从该节目文件‘AMVB’标志到相对应的EXIF中‘ofet’标志处的偏移,低位在前,高位在后; 
dwOffsetofPVHD[2]:表示从该节目文件‘AMVB’标志到相对应的‘PVHD’标志处的偏移,低位在前,高位在后; 
dwOffsetofMOVB[2]:表示从该节目文件‘AMVB’标志到相对应的第一个‘MOVD’的偏移,低位在前,高位在后; 
dwOffsetofIndx[2]:表示从该节目文件‘AMVB’标志到相对应的‘MMPS’的偏移,低位在前,高位在后; 
dwOffsetLyrc[2]:表示从该节目文件‘AMVB’标志到相对应的‘LCPS’的偏移,低位在前,高位在后; 
dwTotalLyrc:表示歌词的总条数; 
dwADflags:最高位设置AD存放模式,1为独立放置,0为合成放置; 
dwADInterval:当dwADflags最高位为1时,指定播放时间或者播放间隔; 
dwTotalTime:总播放时间; 
dwTotalADTime:总的AD播放时间; 
dwReserved[4]:保留。 
图3为根据本发明实施例的AMVB文件中‘VMHD’中的AMVBVideoStreamHeader数据结构。其中各参数含义如下: 
fccType:视频标志为‘vido’; 
fccHandler:表示视频编码器插件GUID号; 
dwFlags:预览图像序列(logo)对应的语言分类; 
dwFields:视频流中一帧分的场数; 
dwOriTime:用于表示该视频数据流的时基标准,32位(单位:ms); 
dwFrameRate:视频帧率; 
dwStart:流的开始时间; 
dwLength:流的长度; 
dwSuggestedBufferSize:读取该视频流数据建议使用的缓存大小; 
dwWidth:表示视频的宽度; 
dwHeight:表示视频的高度; 
dwBitCount:表示颜色深度; 
rcFrameL和rcFrameH:指定这个流在视频主窗口中的显示位置; 
dwReserved[2]:备用; 
图4为根据本发明实施例的AMVB文件中‘AMHD’中的  AMVBAudioStreamHeader数据结构。其中各参数含义如下: 
fccType:音频标志为‘audo’; 
fccHandler:表示音频编码器插件GUID号; 
dwFlags:音轨对应的语言分类; 
dwOriTime:用于表示该音频数据流的时基标准,32位(单位:ms); 
dwStart:流的开始时间; 
dwLength:流的长度,建议取值总有效音频数据长度; 
dwSuggestedBufferSize:读取该音频流数据建议使用的缓存大小; 
dwChannels:低8位为音频的通道数,高8位为音轨数; 
dwBitsPerSample:音频的采样精度; 
dwSamplesPerSec:音频的采样率; 
dwBitrate:音频的比特率; 
dwReserved[2]:备用; 
图5为根据本发明实施例的AMVB文件中媒体数据SBCK中的AMVBCUNKHeader数据结构。其中各参数含义如下: 
dwStrType:基本的视音频流信息: 
bit[0...6]:SBCK包含的视频流总帧数; 
bit[7...14]:SBCK包含的音频流总帧数; 
bit[15]:SBCK中音视频位置先后选项,0表示音频在前,1相反; 
dwTick:时间戳,精确到毫秒(ms); 
dwOffset:时间偏移,精确到毫秒(ms); 
dwTxts:字幕流信息; 
dwSzRnd:从头‘SBCK’到第二个流头的距离; 
dwflags:备用; 
dwReserved:保留; 
图6为根据本发明实施例的AMVB文件中‘DRM’中的AMVBDRMHeader数据结构。其中各参数含义如下: 
dwReserved[2048]:DRM(数字版权保护)内容; 
图7为根据本发明实施例的AMVB文件中媒体数据摘要信息中的AMVBINDEXENTRY数据结构。其中各参数含义如下: 
dwChunkId:表征本数据块的四字符码; 
dwTick:用于该SBCK的时间戳,32位(单位,ms); 
dwOffset:本数据块在文件中的相对于本节目段的‘MOVD’的位置; 
dwOffsetAD:AD块信息; 
图8为根据本发明实施例的AMVB文件中‘EXIF’中的EXIFOffset、EXBaseInfo、EXVideoInfo、EXAudioInfo数据结构。其中EXIFOffset结构描述了对应于EXBaseInfo、EXVideoInfo、EXAudioInfo数据结构中每一个参数相对于‘EXIF’标识的偏移。 
EXBaseInfo中的参数含义如下: 
PublishTimes:发行次数;(2字节) 
Make:制作商;(36字节) 
Medium:媒体信息;(16字节) 
Mode:模式;(24字节) 
Publish:发行商;(32字节) 
CreatData:创作时间;(32字节) 
PublishData:发行时间;(32字节) 
Location:首次发行地点;(40字节) 
Copyright:版权所有者;(24字节) 
Technical:技术支持;(56字节) 
Software:软件开发;(24字节) 
Comments:评价;(≤256字节) 
EXVideoInfo中的参数含义如下: 
dwWitdh:视频帧宽度;(2字节) 
dwHeight:视频帧高度;(2字节) 
dwBPP:颜色深度;(2字节) 
dwBitRate:视频播放速率;(4字节) 
dwCompression:压缩格式;(4字节) 
dwTime:持续时长;(2字节) 
MovieName:影名;(56字节) 
Actor:主要演员;(48字节) 
KeyWord:关键词;(100字节) 
EXAudioInfo中的参数含义如下: 
dwID:音频编码信息;(2字节) 
dwSamplerate:采样率;(4字节) 
dwSamplebits:采样精度;(2字节) 
dwBitRate:比特率;(4字节) 
dwTime:持续时长;(4字节) 
Author:演唱者(32字节) 
MusicName:歌曲名(64字节) 
KeyWord:关键词(80字节) 
图9为根据本发明实施例的AMVB文件中每个时刻歌词数据的AMVBLYRIC数据结构。其中各参数含义如下: 
dwChunkId:表征本数据块的四字符码,‘lyrc’; 
dwTick:用于该‘lyrc’的时间戳,32位(单位,ms); 
dwOffset:ptrBuf的长度; 
ptrBuf:数据指针; 
图10为根据本发明实施例的AMVB文件中分段节目数据的  AMVBPROGINDEXENTRY数据结构。其中各参数含义如下: 
dwChunkId:表征本数据块的四字符码,‘psdx’; 
dwMovSize:该分段节目数据长度(包括‘MOVD’); 
dwTimeStamp:时间戳; 
dwReserved[3]:保留; 
dwLanguage:语言数(≤32); 
*dwLength:每段语言的节目信息长度; 
*ptrBuf:数据指针; 
图11为根据本发明实施例的AMVB文件中播放控制中的AMVBCTLPLAY数据结构。其中各参数含义如下: 
dwOrder:数据排列信息(参数,不在dwCrlInfo中给出); 
dwPracy:控制信息包括隐私保护所有权信息长度 
dwpsctr:分段节目播放控制信息长度 
dwTimeCtr:时间播放控制信息长度 
dwlong:存活控制信息长度 
dwspreadctr:传播控制信息长度 
dwsprosctr:传播平台控制信息长度 
dwintegrality:完整性标识长度; 
dwreserved:保留 
*dwCrlInfo:以上各个控制信息内容; 
dwcb:补充扩展长度 
图12为根据本发明实施例的AMVB文件中的编辑控制AMVBEDITCTR数据结构。其中各参数含义如下: 
dwClassify:元素表中的类别 
dwNo:元素表中的编号 
dwTime:时间戳 
dwLastTime:时长 
dwRect:画面中的位置 
dwSrcSize:源大小 
dwAct:动作信息 
dwYq:乐器信息 
dwfont:字体信息 
dwSp:特效信息 
dwres:保留 
dwcb:补充扩展长度 
图13为根据本发明实施例的AMVB文件中的元素表描述AMVBFDDEPIC数据结构。各参数含义如下: 
dwClassify:元素类别 
dwwidth:图像元素的宽 
dwheight:图像元素的高 
dwbpp:图像元素的色彩数 
dwCp:编码器 
dwsample:音频采样率 
dwbitrate:音频比特率 
dwbits:音频采样精度 
dwtotal:总子类别元素个数 
dwChlen:文字描述长度 
dwDepicLen:子类图片描述长度 
dwChTxt:子类别文字描述 
dwDepic:子类别图片或者音频缩略描述 
dwreserved:保留 
dwcb:补充扩展长度 
在本发明实施例中,AMVB的有效数据以块组成,块内包含主类。块BLCK可以根据功能需要增加或者减少,块BLCK可以随机存放,每个块BLCK后是主类标识,主类下面是子类,一个主类下可以包含多个同类型的子类,子类下是各个层次的数据,各层次内是不同类别的元素。AMVB文件基本配置依次包括AMVB文件整体信息块、视频信息块、音频信息块、版权保护信息块、基本媒体数据块、摘要信息块。基本媒体信息数据块中每个子块包含已同步的音视频流。 
该结构相对一般的媒体文件格式如AVI,扩展性区别如下: 
将整体信息块,视频信息块,音频信息块单独存放,当需要将不同格式的音频或者视频数据包含在文件中时,可以增加视频信息块或者音频信息块,将该格式信息包含在内。 
子类下层次,层次包含不同元素的结构,可以对在同一层次下区分不同的元素,比如,在音频流层次,包含各种语言的各种音轨。在AVI中只分音频流与视频流,不再往下细分,也就是说无法扩展。这种组织方式相对并列结构,逻辑更清晰,扩展更方便,因为并列结构在扩展时,必须按顺序规定好每个数据单元的代表何种信息,而我们这种方式每个数据单元(元素)的信息是通过层次下的每个信息字段标识出来,顺序是不强制的。此外这种方式组织的数据更紧凑,因为将同层次下同类别数据放在一起,查找更方便。 
版权保护信息块,由于AVI中数据是非加密的,而AVI中并没有定义来区分是否加密了数据。 
其它区别: 
第一、基本媒体信息数据块中每个子块包含已同步的音视频流,回放时查找更快。摘要信息块相对原AVI中的indx(索引信息)块更小,因为摘要信息块中标识的是每个媒体信息数据块中每个子块的信息,而每个子块是经过同步的音视频流,同步的时间可以是1S,0.5s等,如果同步是1S相对AVI就节省了20倍~30倍的数据量。 
第二、摘要信息块中,含有字段描述各个媒体数据子块间的相互关系,比如某些媒体数据子块需要播放,而某些媒体数据子块无需播放时,就可以通过该字段进行控制。而AVI中是没有控制信息可以描述的地方。 
作为播放amvb文件的硬件设备,可以是任何形式和结构的具有随机存取存储器(RAM)和执行其中的程序的CPU或MPU的装置,其中RAM可以接收并存储计算机程序和应用程序作为临时和/或非易失性状态的计算机可读指令。可以进一步具有从硬盘读取和写入到其中的硬盘驱动器、从磁盘读取和写入到其中的磁盘驱动器和/或从光盘读取和写入到其中的光盘驱动器。存储介质的实例包括但不限于:CD-ROM、磁光盘、ROM、RAM、EPROM、EEPROM、高速闪存、磁或光卡、DVD或适合于存储电子指令的任何类型的媒介。本领域普通技术人员将会理解到一种或多种这种存储器、驱动器和它们相应的媒介都是存储计算机可读指令的计算机程序产品的实例,当这些程序产品被CPU或MPU执行时,它们可以执行本发明的方法步骤的全部或其一部分。这些程序产品的执行或程序产品本身也作为本发明的实例。 
对于在计算机领域中的普通技术人员显然的是,使用根据本发明的教导编程的通用数字计算机也可以方便地实施本发明。例如利用本发明实施例的amvb文件进行播放的装置可以包括各种主机、终端、PC机、膝上型电脑、掌上型电脑等等。当计算机装载并执行适当的软件代码或程序时,这些适当的软件代码或程序可以执行本发明的方法步骤的全部或其一部分。这些程序的执行或程序本身也作为本发明的实施例。基于本发明的教导普通技术人员容易地制备的适当的软件代码或程序对于在软件领域的普通技术人员来说是显然的。具体而言,本领域的普通技术人员将会认识到,可以以许多种计算机语言(包括但不限于:C、C++、Fortran、Basic等)编写实现本发明的计算机程序产品。对本领域普通技术人员很显然的是,通过制备专用集成电路或者通过与常规设备和电路的适当网络互连也可以实施本发明。 
以下通过几个实施例进一步示意利用amvb文件进行播放的方法和设备。 
本领域技术人员可以理解,本发明的实施不局限于这些具体的实施例。 
实施例1 
图14提供了播放amvb文件的硬件结构的一个实施例,基本结构包括控制设备开关的电源(Power)、静态存储器(SRAM)、处理器、模数转换单元(ADC)、数模转换单元(DAC)等。SRAM用于存储媒体电子文件,所述媒体电子文件包含多个作为基本组织形式的数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块,当然,还可以存储图1所示的媒体电子文件;与数据存储器连接的处理器,所述处理器,用于处理视频流,负责视频流的解密、解压缩和显示和对音频流数据的解密、解压缩和输出;用于将声音信号的输入采样量化的ADC、提供音频数据转换成声音数据的DAC,ADC和DAC的配合实现声音的输入和合成输出。 
选择地,为控制未经授权的使用,还包括一个传感器,用于采集用户的指纹或者虹膜特征信息,并将传感器中SDRAM里的图像输出到处理器进行匹配;处理器用于处理视频流,负责视频流的解密、解压缩和显示和对音频流数据的解密、解压缩和输出;ADC负责声音信号的输入采样量化;DAC提供音频数据转换成声音数据;ADC和DAC的配合实现声音的输入和合成输出(K-Show实现条件之一)。 
处理器在播放同时可将ADC输入的声音或者合成声音录制成指定格式文件,并记录起始时间。 
选择地,当处理器对采用同音轨数目的处理时,将更加有利于K-Show的实现,可以提高实时性。 
实施例2 
图15提供了一个AMVB文件的制作实施例。该实施例的制作包含了DRM保护,版权保护,节目分段,广告选项和多音轨(伴音设置)。 
首先,设置视音频的格式信息,文件格式信息,包括节目表、DRM选项、广告播放选项、音轨数等;其次,对含有数据组织信息的视音频数据,根据DRM选项和版权保护选项分别嵌入水印信息和DRM加密,其中在音频数据DRM加密前,需先生成一个DRM数据头写入文件;此外,数据组织信息包括数据块类型(广告/非广告),该音频流音轨数,时间戳;然后,将经过保护的视音频数据按次序写入文件,同时更新图2整体数据块(如时长、各块偏移等)和图7媒体数据摘要信息块,并加密这两个数据块;最后,如果有的话,还要写入用户输入的用户信息和预览信息。 
参见图15所示,AMVB文件的制作步骤如下: 
步骤501:设置视频参数,包括:视频高度、宽度、帧率以及编码器。 
步骤502:设置音频参数,包括声道数、比特率、采样率、采样精度、编码器。 
步骤503:设置节目表,包括:DRM选项、广告播放选项、同步最小单位、音轨数设置、语言分类设置、流数、伴音设置、水印信息设置、控制信息设置,然后步骤512。 
步骤504:输入含数据组织信息的同步视频数据。 
步骤505:判断该数据是否需要嵌入水印,如果需要,执行步骤506,否则,执行步骤507。 
步骤506:嵌入视频水印,执行步骤507。 
步骤507:判断是否需要进行DRM保护,如果需要,则对该数据进行加密处理,执行步骤512,否则执行步骤512。 
步骤508:输入含输入组织信息的同步音频数据。 
步骤509:判断是否需要嵌入水印,如果是,则执行步骤510,否则,执行步骤511。 
步骤510:嵌入音频水印,执行步骤511。 
步骤511:判断是否需要进行DRM保护,如果是,则生成DRM头数据,  蒋该DRM头数据写入DRM块,并加密数据,执行步骤512,否则,执行步骤512。 
步骤512:根据设置的参数,以及同步视频数据以及同步音频数据进行合成。 
步骤513:判断所有节目数据是否合成完毕,如果合成完毕,则执行步骤512,否则,执行步骤514. 
步骤514:更新整体数据块、更新摘要信息块、 
步骤515:判断是否有用户信息或预览信息输入,如果有,则执行步骤516,否则,结束本流程。 
步骤516:写入用户信息,写入预览信息。 
整个AMVB文件的文件结构图,可参照图1。 
在本发明实施例中,文件制作过程主要是将经过同步的音频和视频流放在一起(打成一个packet),相对AVI,采用对逐帧的视音频数据的随机存放,造成对应时间点的音视频数据的位置比较分散,这就需要在解码播放时,搜索上下一定范围内的音频或者视频数据,增加读取数据的次数,而当范围比较大时,会需要更多的时间。而在制作时将经过同步的音频和视频流放在一起,可以减少读取文件的次数,完全不需要进行搜索,可以直接达到指定播放点,从而达到快速回放的目的。 
实施例3 
图16提供了一个AMVB文件的播放实施例。 
在播放AMVB文件前首先需要检测是否含有播放控制块,DRM数据保护,节目表;对含有播放控制块的AMVB文件进行合法用户权限检测;对含有DRM保护的进行DRM头数据解密,并解析媒体数据摘要信息块,检测数据的完整性;待合法性和完整性检测完成后,解析节目表,将节目表信息输出,节目表中每个节目的信息可参照图10;根据系统要求播放的节目号,读取该节目数据,进行同步播放。 
本实施例的媒体播放方法,所播放媒体电子文件包含多个作为基本组织形式的数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块,该方法包括: 
读取整体信息块、视频信息块、音频信息块以及摘要信息块,获得文件整体信息、文件视频信息、文件音频信息以及摘要信息; 
根据文件视频信息中的视频编码格式以及文件音频信息中的音频编码格式,对所述基本媒体数据块中的视音频数据进行解码; 
根据所述摘要信息中的时间戳对视音频解码后的数据,按照所述整体信息中的播放速率,进行同步播放。 
当所述媒体电子文件还包括:版权保护信息块, 
则在读取整体信息块、视频信息块、音频信息块以及摘要信息块时,对每个数据块进行解密,以及, 
对所述视音频数据进行解码前,根据所述DRM信息块中DRM数据头进行解密。 
在解码过程中,该方法进一步包括: 
如果没有检测到由内容商提供的水印信息或者水印信息不完整,停止读取和播放操作。 
所述媒体电子文件还包含播放控制块,用于存储针对特定的环境下数据的权限保护信息; 
则该方法还包括:读取播放控制块信息,检测播放控制条件,并根据所述播放控制条件,控制同步播放。 
当播放控制条件包括根据已播放次数时,则控制同步播放包括:判断已播放次数是否达到设定值,如果是,则停止播放,否则,每播放一次,修改当前播放次数。 
在播放过程中,该方法还包括: 
根据dwOrder值,对把基本媒体数据块内的子块顺序置乱的节目,利用dwOrder值产生序列控制真实的数据播放顺序; 
通过修改播放控制块dwPracy值和内容,设定用户的密钥组来设定可观赏的用户群; 
通过修改播放控制块dwpsctr值和内容,设定可播放的节目时间和长度; 
通过修改播放控制块dwlong值和内容,设定节目的播放次数; 
通过修改播放控制块dwspreadctr值和内容,设定节目的拷贝次数和删除权限; 
通过修改播放控制块dwsprosctr值和内容,设定节目的可以播放的平台。 
根据dwintegrality和对应的内容,利用dwOrder产生的前10个值的基本媒体数据子块内容进行hash(散列),将hash值与dwintegrality对应的内容进行匹配,来判断文件是否被窜改。 
还包括:在dwPracy指定的长度权限信息中,存储指纹信息或者视网膜信息,通过在播放设备接口上连接的指纹传感器或者虹膜传感器检测的使用者的指纹数据和虹膜数据,与文件中存储的特征信息比较,权限合法,则控制数据的读取和播放,否则,停止媒体数据的读取。 
当所述基本媒体数据块按照主类类别存储的视音频信息之间的关联信息,自身与最近的广告块的偏移信息时,该方法进一步包括: 
当要求广告强制播放,Seek(定点查找)或者快进时,如果seek的时间段内含有广告,则必须播放广告;当不要求广告强制播放,则同正常播放方式。 
所述媒体电子文件还包含编辑控制块、元素块和元素描述块,所述编辑控制块,用于存储对视音频内容进行修改的控制信息;元素块,用于存储对视音频内容进行修改的替换素材信息;所述元素描述块,用于存储所述替换素材信息的格式信息; 
则该方法还包括: 
向用户提供元素描述块内容,并接收用户根据所述元素描述块提供的可编辑替换素材信息,或者接收到用户从外部载入替换素材信息; 
根据接收到的输入命令,利用所述替换素材信息将当前节目的视音频内容进行替换播放。 
所述基本媒体数据块至少包括两个子类块,其中每个子类块用于存储视频流或音频流;所述子类块至少包括第一层次块和第二层次块,其中,第一层次块用于存储多帧同步的视频流,第二层次块用于存储多帧同步的音频流;所述第二层次块包括多个元素块,分别存储按照主音和伴音的多语言多音轨数据流,以及按照语言和音轨分离的数据流, 
则该方法还包括:接收用户输入的需要切换的音频频道和语言频道,并根据输入的命令,实时读取对应语言的音频数据,并进行多语言音轨切换。 
所述媒体电子文件还包含节目分段信息索引块,用于保存在用于保存视频流分段的大小、分段信息摘要和分段时间戳,则该方法进一步包括: 
在节目播放过程中,读取节目分段索引块,得到分段信息摘要和时间标记;然后,用户根据分段摘要信息,输入要播放的节目号;根据节目号,读取对应的节目内容,进行解码播放。 
所述媒体电子文件还包含歌词/字幕信息块,则该方法进一步包括: 
获取节目信息和语言和字幕信息;根据节目表信息,选取节目;根据要求在播放时,实时切换音轨;根据语言要求切换不同的声音和字幕。 
所述媒体电子文件还包括快速预览图像信息块; 
该方法进一步包括:当接收到快速预览命令时,提供各语言的预览信息。 
在播放媒体文件过程中,该方法进一步包括: 
接收到暂停播放命令时,从元素描述块中,获取素材信息; 
从编辑信息块中读取,默认的编辑方式; 
修改编辑方式、从元素块中获取需要替换或编辑的元素,并且设置与播放相关的一系列的命令,保存编辑; 
播放节目。 
更具体地说,包括如下步骤: 
1)、读取整体信息块和DRM块,计算节目分段数,判断DRM保护或者版权保护; 
2)、如1)所述,如果进行了DRM保护,则对整体信息块和播放控制块(如果含有编辑控制块)进行解密; 
3)、如1)所述,如果节目进行了分段,则读取节目分段表,记录节目分段的开始时间和结束时间,并且根据播放要求(例如可以根据外部命令输入)将节目分段内容的相应部分,如中文节目内容输出; 
4)、如2)所述,如果含有播放控制块,读取播放控制块信息,检测播放控制条件,譬如根据已播放次数控制此次播放,并修改当前播放次数,或者需要首先输入用户密码才可继续播放操作; 
5)、读取整体信息块,视音频信息块,获得视音频编码格式、媒体格式信息,包括音视频时长,音频的格式信息,视频的格式信息以及各数据块在整个文件中的相对文件头的偏移; 
6)、读取节目信息摘要表(如果进行了DRM保护,需首先要解密),记录摘要信息,如相对于本节目段的偏移,时间戳和广告位置偏移; 
7)、根据已读取信息,如果进行了DRM保护,则播放时,读取媒体数据块每一个SBCK都需要首先解密,然后分别输出音频和视频数据; 
8)、系统根据5)中得到的媒体编码格式,调相应的解码器对7)中输出数据进行解码; 
9)、系统根据8)中视音频解码输出数据的时间戳,进行同步播放。 
在本发明实施例中,由于层次下包含了各种类别的元素,这里元素就是音频或者视频数据,音频数据的类别可以继续细分为各种语言和各种音轨。在播放时,可以根据用户体验,选择播放不同的音轨或者将不同的音轨组合播放,体验不同的效果。由于每个媒体数据子块都是已经经过同步的数据,并且同类  别的数据是组织在一起的,所以在播放不同的音轨是可以达到无缝切换的目的。 
实施例4 
K-Show功能实现的实施例。 
图17A提供了一个完整的K-Show功能的实施例。 
首先,进入点播系统,阅读节目表,选取需要K-Show的文件;然后进入K-Show环节,进行实时切换音源,并合成背景声与人声输出。 
图17B提供了K-Show环节的一个包含硬件的具体实施过程。 
根据输入的需要K-Show的命令,判断是否需要进行模式切换,如果否,则打开ADC设备并初始化; 
如果需要进行模式切换,则在当前播放时间点的下一时刻,切换音轨,如需要解密数据,将对应的视音频数据解密,再执行播放进程; 
将背景音数据流输出处理器解码输出到输出buffer;同时对应的同步视频数据流进入处理器解码输出; 
与此同时,ADC采集麦克等设备输入人声,并在输出buffer中合成背景音与人声,并进行音效处理和回声消除; 
在合成声音的同时,根据用户的要求,如果要保存用户的歌声或合成声,则将其录制下来,并由处理器进行指定格式压缩保存; 
合成音频通过DAC与解码后的视频帧进行同步播放。 
此过程中需要ADC/DAC进行声音的输入和采集,由处理器进行声音的合成和音轨的切换及进行视频图像的同步输出。 
实施例5 
图18提供了一个广告播放控制的实施例。 
在制作广告数据时,可以在媒体数据摘要信息块AMVBINDEXENTRY的dwOffsetAD中记录该块与最近的广告块的偏移;在播放时,根据节目广告的播放权限设置: 
a)要求广告强制播放,Seek或者快进时,如果seek的时间段内含有广告,则必须播放广告。 
b)不要求广告强制播放,则同正常播放方式。 
实施例6 
图19提供了版权保护水印的检测过程实施例。 
水印信息可以在解码过程中提取,通过检测水印信息的完整性来控制播放的进行。更具体地说,可以包括: 
1)在播放前,导入版权标识库或者首先读取文件中存放的版权标识(该数据标识在原始文件中受DRM保护)或者也可以是用户的身份信息; 
2)播放时,解密并同时解码视音频数据,首先,对音频进行水印提取,该音频水印,当该文件仅用音频流时,其为版权标识;如果含有音视频,则音频水印为一组密钥,作为视频水印提取的输入,此时,视频水印为版权标识; 
3)将提取的版权标识与标准的版权标识进行匹配(此时提取的版权标识也可输出),在低于一定相似度的情况时,认为非法文件不予播放,否则,正常播放。 
实施例7 
图20提供了生物认证的实施例。 
首先,通过例如图14的设备连接的指纹或者虹膜传感器采集用户的生物特征,处理器通过计算传感器SRAM的生物特征图像,并与文件中读取的被hash过的特征值进行匹配,匹配成功则继续操作,否则拒绝非法用户继续播放。 
用户的生物特征不仅可以通过存储在被加密的amvb文件控制信息块中,将用户生物特征信息以不可见鲁棒水印的方式同时嵌入与该音影文件中将可以对用户生物特征信息与受限播放的节目内容有机的结合起来,达到对用户信息或内容保护的目的。 
实施例8 
图21是一个编辑控制的实施例。 
对于素材编辑和合成过程如下: 
a)暂停播放,从元素描述表中,获取素材信息; 
b)从编辑信息块中读取默认的编辑方式; 
c)修改编辑方式、从元素表中获取需要替换或编辑的元素,并且设置与播放相关的一系列的命令,保存编辑。编辑和合成的算法选择现有的算法。 
d)播放节目。 
实施例9 
图22是播放控制的实施例。 
在播放控制选项中,结合实施例6和7,可提供实施例6中的水印信息,提供实施例7中的指纹或者虹膜信息;此外,可根据提供的播放次数进行控制节目被播放的次数,以及节目允许播放和操作的平台,一旦检测到该平台不能很好的完成所提供的功能,可拒绝被进一步的播放。通过对节目内容hash生成完整性信息与该文件中保存的完整性信息匹配,如果信息完整,则允许播放,否则文件曾被播放,拒绝播放。 
本发明并不局限于说明书中描述的具体规格和上述具体实施例。例如,可以在其它文件格式中采用相同的广告信息措施,保障广告商的利益。可以采用类似的子块结构同步音视频数据。可以采用相同的方式在其它文件结构中提供K-Show功能。 
本发明提供的媒体电子文件,该电子文件包含作为基本组织形式的块,至少包括整体信息块、视频信息块、音频信息块、基本媒体数据块和摘要信息块,每个块嵌套主类,块后是主类标识,主类标识可以嵌套子类,子类可以含有不同的层次,一个主类下可以包含多个同类型的子类,层次下是不同的元素,基本媒体数据块是已同步的媒体信息流,所述媒体电子文件可以包含多个不同格式的媒体节目。 
本发明实施例的媒体电子文件,可以支持最大264-1字节文件大小,每个基本媒体信息块支持232-1字节的大小,当大于232-1字节时自动分段增加媒体  信息块,并且分段信息添加到分段表中。 
基于本发明的技术方案,在所述媒体电子文件中,基本媒体数据块保存的是已同步好的数据,在播放时,无需担心同步问题和对时间戳进行计算和纠正。因此,相对于AVI中音频数据帧和视频数据帧随机存放,显著改善了回放效率。此外,分离的主音数据包和伴音数据包有效的达到了无缝切换的要求。 
在本发明的实施例中,媒体电子文件以块为组织形式,每个块BLCK后是主类标识,主类标识可以嵌套子类,一个主类下可以包含多个同类型的子类;并且支持264-1字节的大小。这种方式相对于AVI扩展更灵活。 
在本发明的实施例中,可以采样DRM方法进行对数据的加密,有效保护用户商的利益,而AVI中没有任何的保护措施;并且增加了播放控制信息,便于用户自己保护特殊信息,其能够控制密钥播放某一段的内容、设置不可删除权限、自我复制权限等。 
在本发明的实施例中,提供了广告强制播放功能的措施,可以有力的保障广告商的利益。而AVI中没有相应的措施来达到这个要求。 
在本发明的实施例中,可以在媒体电子文件中提供K-Show的功能。 
在本发明的实施例中,增加了交互式元素合成和编辑的支持,可以用元素库中的元素对基本的媒体信息实时进行编辑和合成。 

Claims (58)

1.一种制作媒体电子文件的方法,其特征在于,该方法包括:
按照块结构为基本组织形式,将视音频流进行编码,生成媒体电子文件,
其中,所述块结构包括若干个数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块。
2.根据权利要求1所述的方法,其特征在于,所述数据块按照分层结构存储信息。
3.根据权利要求2所述的方法,其特征在于,所述数据块至少包括一个主类块,每个主类块按照信息类别存储信息。
4.根据权利要求3所述的方法,其特征在于,所述主类块至少包括一个子类块,每个子类块按照对应类别的子类存储信息。
5.根据权利要求4所述的方法,其特征在于,所述子类块至少包括一个层次块,每个层次块按照对应子下的分层结果存储信息。
6.根据权利要求5所述的方法,其特征在于,所述层次块至少包括一个包括基本数据单元,用于存储数据的最小单位。
7.根据权利要求3所述的方法,其特征在于,所述基本媒体数据块至少包括两个子类块,其中每个子类块用于存储视频流或音频流。
8.根据权利要求7所述的方法,其特征在于,所述子类块至少包括第一层次块和第二层次块,其中,第一层次块用于存储多帧同步的视频流,第二层次块用于存储多帧同步的音频流。
9.根据权利要求8所述的方法,其特征在于,所述第二层次块包括多个元素块,分别存储按照主音和伴音的多语言多音轨数据流,以及按照语言和音轨分离的数据流。
10.根据权利要求1所述的方法,其特征在于,所述块结构包括多个视频信息块时,每个视频信息块中存储的文件视频信息中的文件格式信息相同或不同。
11.根据权利要求1所述的方法,其特征在于,所述块结构包括多个音频信息块时,每个音频信息块中存储的文件音频信息中的文件格式信息相同或不同。
12.根据权利要求1所述的方法,其特征在于,所述块结构还包括:
版权保护信息块,用于存储关键的版权保护或者内容保护的信息。
13.根据权利要求1所述的方法,其特征在于,所述块结构还包括:编辑控制块、元素块和元素描述块,其中,
所述编辑控制块,用于存储对视音频内容进行修改的控制信息;
所述元素块,用于存储对视音频内容进行修改的替换素材信息;
所述元素描述块,用于存储所述替换素材信息的格式信息。
14.根据权利要求1所述的方法,其特征在于,所述块结构还包括:节目分段信息索引块,用于保存视频流分段的大小、分段信息摘要和分段时间戳。
15.根据权利要求14所述的方法,其特征在于,所述视频流是按照时间、内容和语言中的一种或几种进行分段。
16.根据权利要求1所述的方法,其特征在于,所述块结构还包含:
播放控制块,用于存储针对特定的环境下数据的权限保护信息。
17.根据权利要求16所述的方法,其特征在于,所述权限保护信息包括:
隐私保护所有权信息长度,以及在所述长度范围内的指纹信息或视网膜信息,用于提供给指纹传感器或者虹膜传感器进行权限认证。
18.根据权利要求1所述的方法,其特征在于,所述块结构还包括:
快速预览图像信息块,用于存储多种语言的预览信息。
19.根据权利要求1所述的方法,其特征在于,所述摘要信息包括:
所述基本媒体数据块按照主类类别存储的视音频信息之间的关联信息,自身与最近的广告块的偏移信息。
20.根据权利要求1所述的方法,其特征在于,所述块结构还包括歌词/字幕信息块,用于存储至少一种语言的歌词。
21.根据权利要求1所述的方法,其特征在于,所述块结构还包括用户可定义信息块,用于存储用户自定义信息。
22.一种制作媒体电子文件的方法,其特征在于,所述媒体电子文件包括若干个数据块,分别为:整体信息块,视频信息块、音频信息块、基本媒体数据块以及摘要信息块,该方法包括:
将同步视频数据和同步音频数据合成打包存储在基本媒体数据块,
将所述同步视频数据对应的文件视频信息存储在视频信息块,将所述同步音频数据对应的文件音频信息存储在音频信息块;以及,
将获取的文件整体信息存储在整体信息块,将提取的基本媒体数据块的摘要信息存储在摘要信息块。
23.根据权利要求22所述的方法,其特征在于,在将同步视频数据和同步音频数据合成打包存储在基本媒体数据块之前,该方法进一步包括:
将同步视频数据嵌入水印,和/或,将同步音频数据嵌入水印。
24.根据权利要求22所述的方法,其特征在于,在将同步视频数据和同步音频数据合成打包存储在基本媒体数据块之前,该方法进一步包括:
生成数字版权管理DRM数据头保存在版权保护信息块中,并对同步视频数据和/或同步音频数据进行DRM加密。
25.根据权利要求22所述的方法,其特征在于,该方法还进一步包括:
将多种语言的预览信息保存在预览图像信息块中。
26.根据权利要求22所述的方法,其特征在于,该方法还进一步包括:
将特定环境下数据的权限保护信息保存在播放控制块中。
27.根据权利要求22所述的方法,其特征在于,该方法还进一步包括:
用于将视频流分段的大小、分段信息摘要和分段时间戳保存在分段信息索引块。
28.根据权利要求22所述的方法,其特征在于,该方法进一步包括:
将至少一种语言的歌词保存在歌词/字幕信息块中。
29.根据权利要求26所述的方法,其特征在于,所述权限保护信息包括:
隐私保护所有权信息长度,以及在所述长度范围内的指纹信息或视网膜信息。
30.根据权利要求26所述的方法,其特征在于,所述摘要信息包括:
所述基本媒体数据块按照主类类别存储的视音频信息之间的关联信息,自身与最近的广告块的偏移信息。
31.根据权利要求22所述的方法,其特征在于,该方法还进一步包括:
将对视音频内容进行修改的控制信息存储在编辑控制块;
将对视音频内容进行修改的替换素材信息存储在元素块;
将所述替换素材信息的格式信息存储在元素描述块。
32.根据权利要求22所述的方法,其特征在于,该方法进一步包括:
将用户自定义信息存储在用户可定义信息块。
33.根据权利要求22所述的方法,其特征在于,按照分层结构将信息存储在对应的数据块中。
34.一种制作媒体电子文件的装置,其特征在于,该装置包括:
存储单元,用于存储媒体电子文件,所述媒体电子文件至少包括若干个数据块,分别为基本媒体数据块、视频信息块、音频信息块、整体信息块以及摘要信息块;
基本媒体数据处理单元,用于同步视频数据和同步音频数据合成打包存储在基本媒体数据块;
视频信息处理单元,用于将所述同步视频数据对应的文件视频信息存储在视频信息块;
音频信息处理单元,用于将所述同步音频数据对应的文件音频信息存储在音频信息块;
整体信息处理单元,用于将文件整体信息存储在整体信息块;
摘要信息处理单元,用于将基本媒体数据块的摘要信息存储在摘要信息块。
35.根据权利要求34所述的装置,其特征在于,该装置还包括:
水印处理单元,用于在将同步视频数据和同步音频数据合成打包前,将提取的同步视频数据嵌入水印,和/或,将同步音频数据嵌入水印。
36.根据权利要求34所述的装置,其特征在于,该装置还包括:
加密处理单元,用于在将同步视频数据和同步音频数据合成打包前,生成数字版权管理DRM数据头保存在版权保护信息块中,并对同步视频数据和/或同步音频数据进行DRM加密。
37.根据权利要求34所述的装置,其特征在于,该装置还包括:
预览图像处理单元,用于将多种语言的预览信息保存在预览图像信息块中。
38.根据权利要求34所述的装置,其特征在于,该装置还包括:
播放控制处理单元,用于将特定环境下数据的权限保护信息保存在播放控制块中。
39.根据权利要求34所述的装置,其特征在于,该装置还包括:
分段信息索引处理单元,用于将视频流分段的大小和分段时间戳保存在分段信息索引块。
40.根据权利要求34所述的装置,其特征在于,该装置还包括:
歌词信息处理单元,用于将至少一种语言的歌词保存在歌词/字幕信息块中。
41.根据权利要求34所述的装置,其特征在于,该装置还包括:
编辑控制处理单元,用于将对视音频内容进行修改的控制信息存储在编辑控制块;
元素处理单元,用于将对视音频内容进行修改的替换素材信息存储在元素块;
元素描述处理单元,用于将所述替换素材信息的格式信息存储在元素描述块。
42.一种媒体播放方法,其特征在于,所播放媒体电子文件包含多个作为基本组织形式的数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块,该方法包括:
读取整体信息块、视频信息块、音频信息块以及摘要信息块,获得文件整体信息、文件视频信息、文件音频信息以及摘要信息;
根据文件视频信息中的视频编码格式以及文件音频信息中的音频编码格式,对所述基本媒体数据块中的视音频数据进行解码;
根据所述摘要信息中的时间戳对视音频解码后的数据,按照所述整体信息中的播放速率,进行同步播放。
43.根据权利要求42所述的方法,其特征在于,当所述媒体电子文件还包括:版权保护信息块,
则在读取整体信息块、视频信息块、音频信息块以及摘要信息块时,对每个数据块进行解密,以及,
对所述视音频数据进行解码前,根据版权保护信息块中DRM数据头进行解密。
44.根据权利要求42所述的方法,其特征在于,在解码过程中,该方法进一步包括:
如果没有检测到由内容商提供的水印信息或者水印信息不完整,停止读取和播放操作。
45.根据权利要求42中的方法,其特征在于,所述媒体电子文件还包含播放控制块,用于存储针对特定的环境下数据的权限保护信息;
则该方法还包括:读取播放控制块信息,检测播放控制条件,并根据所述播放控制条件,控制同步播放。
46.根据权利要求45所述的方法,其特征在于,当播放控制条件包括根据已播放次数时,则控制同步播放包括:判断已播放次数是否达到设定值,如果是,则停止播放,否则,每播放一次,修改当前播放次数。
47.根据权利要求45所述的方法,其特征在于,在播放过程中,该方法还包括:
根据数据排列信息dwOrder值,对把基本媒体数据块内子块顺序置乱的节目,利用数据排列信息dwOrder值产生序列控制真实的数据播放顺序;
通过修改播放控制块包括隐私保护所有权信息的控制信息长度dwPracy值和内容,设定用户的密钥组来设定可观赏的用户群;
通过修改播放控制块分段节目播放控制信息长度dwpsctr值和内容,设定可播放的节目时间和长度;
通过修改播放控制块存活控制信息长度dwlong值和内容,设定节目的播放次数;
通过修改播放控制块传播控制信息长度dwspreadctr值和内容,设定节目的拷贝次数和删除权限;
通过修改播放控制块传播平台控制信息长度dwsprosctr值和内容,设定节目的可以播放的平台;
根据完整性标识长度dwintegrality和对应的内容,利用数据排列信息dwOrder产生的前10个值的基本媒体数据块内子块内容进行散列hash,将散列hash值与完整性标识长度dwintegrality对应的内容进行匹配,来判断文件是否被窜改。
48.根据权利要求45所述的方法,其特征在于,在还包括:在包括隐私保护所有权信息的控制信息长度dwPracy指定的长度权限信息中,存储指纹信息或者视网膜信息,通过在播放设备接口上连接的指纹传感器或者虹膜传感器检测的使用者的指纹数据和虹膜数据,与文件中存储的特征信息比较,权限合法,则控制数据的读取和播放,否则,停止媒体数据的读取。
49.根据权利要求42所述的方法,其特征在于,当所述基本媒体数据块按照主类类别存储的视音频信息之间的关联信息,自身与最近的广告块的偏移信息时,该方法进一步包括:
当要求广告强制播放,定点查找Seek或者快进时,如果定点查找seek的时间段内含有广告,则必须播放广告;当不要求广告强制播放,则同正常播放方式。
50.根据权利要求42所述的方法,其特征在于,所述媒体电子文件还包含编辑控制块、元素块和元素描述块,所述编辑控制块,用于存储对视音频内容进行修改的控制信息;元素块,用于存储对视音频内容进行修改的替换素材信息;所述元素描述块,用于存储所述替换素材信息的格式信息;
则该方法还包括:
向用户提供元素描述块内容,并接收用户根据所述元素描述块提供的可编辑替换素材信息,或者接收到用户从外部载入替换素材信息;
根据接收到的输入命令,利用所述替换素材信息将当前节目的视音频内容进行替换播放。
51.根据权利要求42所述的方法,其特征在于,所述基本媒体数据块至少包括两个子类块,其中每个子类块用于存储视频流或音频流;所述子类块至少包括第一层次块和第二层次块,其中,第一层次块用于存储多帧同步的视频流,第二层次块用于存储多帧同步的音频流;所述第二层次块包括多个元素块,分别存储按照主音和伴音的多语言多音轨数据流,以及按照语言和音轨分离的数据流,
则该方法还包括:接收用户输入的需要切换的音频频道和语言频道,并根据输入的命令,实时读取对应语言的音频数据,并进行多语言音轨切换。
52.根据权利要求42所述的方法,其特征在于,所述媒体电子文件还包含节目分段信息索引块,用于保存在用于保存视频流分段的大小、分段信息摘要和分段时间戳,则该方法进一步包括:
在节目播放过程中,读取节目分段索引块,得到分段信息摘要和时间标记;然后,用户根据分段摘要信息,输入要播放的节目号;根据节目号,读取对应的节目内容,进行解码播放。
53.根据权利要求42所述的方法,其特征在于,所述媒体电子文件还包含歌词/字幕信息块,则该方法进一步包括:
获取节目信息和语言和字幕信息;根据节目表信息,选取节目;根据要求在播放时,实时切换音轨;根据语言要求切换不同的声音和字幕。
54.根据权利要求42所述的方法,其特征在于,所述媒体电子文件还包括快速预览图像信息块;
该方法进一步包括:当接收到快速预览命令时,提供各语言的预览信息。
55.根据权利要求42所述的方法,其特征在于,在播放媒体文件过程中,该方法进一步包括:
接收到暂停播放命令时,从元素描述块中,获取素材信息;
从编辑信息块中读取,默认的编辑方式;
修改编辑方式、从元素块中获取需要替换或编辑的元素,并且设置与播放相关的一系列的命令,保存编辑;
播放节目。
56.一种便携式娱乐设备,其特征在于,包括:
数据存储器,所述数据存储器存储媒体电子文件,所述媒体电子文件包含多个作为基本组织形式的数据块,分别为:用于存储文件整体信息的整体信息块,用于存储文件视频信息的视频信息块、用于存储文件音频信息的音频信息块、用于按照划分的主类类别存储视音频数据的基本媒体数据块,以及用于存储每个主类的视音频数据的摘要信息的摘要信息块;
与数据存储器连接的处理器,
所述处理器,用于处理视频流,负责视频流的解密、解压缩和显示和对音频流数据的解密、解压缩和输出;
用于将声音信号的输入采样量化的ADC、提供音频数据转换成声音数据的DAC,ADC和DAC的配合实现声音的输入和合成输出。
57.根据权利要求56所述的设备,其特征在于,还包括指纹或虹膜传感器,用于采集用户的指纹或者虹膜特征信息,并将传感器捕捉到图像输出到处理器进行匹配。
58.根据权利要求56所述的设备,其特征在于,所述处理器,在处理视频流的同时,将ADC输入的声音或者合成声音录制成指定格式文件,并记录起始时间。
CN2008100934063A 2007-04-20 2008-04-21 媒体电子文件的制作方法、装置及其播放设备及方法 Expired - Fee Related CN101261865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100934063A CN101261865B (zh) 2007-04-20 2008-04-21 媒体电子文件的制作方法、装置及其播放设备及方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200710101275 2007-04-20
CN200710101275.4 2007-04-20
CN2008100934063A CN101261865B (zh) 2007-04-20 2008-04-21 媒体电子文件的制作方法、装置及其播放设备及方法

Publications (2)

Publication Number Publication Date
CN101261865A CN101261865A (zh) 2008-09-10
CN101261865B true CN101261865B (zh) 2012-07-04

Family

ID=39962255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100934063A Expired - Fee Related CN101261865B (zh) 2007-04-20 2008-04-21 媒体电子文件的制作方法、装置及其播放设备及方法

Country Status (1)

Country Link
CN (1) CN101261865B (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452723B (zh) * 2008-10-16 2012-03-07 北京光线传媒股份有限公司 一种媒体文件播放方法、播放系统及一种媒体播放器
EP2280521A1 (en) * 2009-07-30 2011-02-02 Alcatel Lucent Method of switching media content for a mobile apparatus
CN102081893B (zh) * 2009-11-26 2013-06-12 联想移动通信科技有限公司 制作产品的多媒体说明书的装置和方法
CN102724408B (zh) * 2011-03-30 2017-03-01 新奥特(北京)视频技术有限公司 一种基于aaf的全程字视分离制播的方法和装置
CN102955809A (zh) * 2011-08-26 2013-03-06 吴志刚 媒体文件编辑和播放的方法和系统
CN103366124A (zh) * 2012-03-26 2013-10-23 宇龙计算机通信科技(深圳)有限公司 终端和文件管理方法
CN103514351B (zh) * 2012-06-28 2017-05-10 三星电子(中国)研发中心 一种多媒体文件的编辑方法、装置和系统
CN104737512B (zh) * 2012-10-11 2019-04-19 三星电子株式会社 用于在混合网络中传送和接收多媒体数据的装置和方法
CN102857412A (zh) * 2012-10-12 2013-01-02 南京恩瑞特实业有限公司 一种新型的数据快速转换算法
CN102932668B (zh) * 2012-11-29 2016-07-06 济南中维世纪科技有限公司 一种基于usb传输的音视频数据处理装置
CN102932669B (zh) * 2012-11-29 2016-06-29 济南中维世纪科技有限公司 一种基于usb传输的音视频数据处理方法及装置
CN104065888A (zh) * 2013-03-21 2014-09-24 腾讯科技(深圳)有限公司 通信终端视频制作方法及制作装置
CN104575547B (zh) * 2013-10-17 2017-12-22 深圳市云帆世纪科技有限公司 多媒体文件制作方法、播放方法及系统
KR102370031B1 (ko) * 2014-03-18 2022-03-04 코닌클리케 필립스 엔.브이. 시청각 콘텐트 아이템 데이터 스트림들
CN106653037B (zh) * 2015-11-03 2020-02-14 广州酷狗计算机科技有限公司 音频数据处理方法和装置
CN106210766A (zh) * 2016-07-19 2016-12-07 北京正奇联讯科技有限公司 电视转播中的截播方法和系统
CN111444191B (zh) 2019-06-13 2021-10-12 黄亚娟 一种宇宙空间数据系统、方法、计算机设备和存储介质
CN112287127B (zh) * 2019-07-23 2022-10-14 上海哔哩哔哩科技有限公司 多媒体文件存储、读取方法
CN112700797B (zh) * 2019-10-22 2022-08-16 西安诺瓦星云科技股份有限公司 播放清单编辑方法、装置及系统和计算机可读存储介质
CN111104370A (zh) * 2019-12-18 2020-05-05 北京大龙得天力广告传媒有限公司 一种广告视频存储系统及方法
CN113453039B (zh) * 2020-03-24 2023-04-18 阿里巴巴集团控股有限公司 视频文件处理与水印提取的方法和装置
CN111857581A (zh) * 2020-07-06 2020-10-30 浙江鸿泉电子科技有限公司 一种数据存储的处理方法及系统
CN112347303A (zh) * 2020-11-27 2021-02-09 上海科江电子信息技术有限公司 媒体视听信息流监测监管数据样本及其标注方法
CN112911388B (zh) * 2021-02-02 2024-02-06 厦门美图之家科技有限公司 高效可编辑视频特效输出方法、装置及电子设备
CN113535105B (zh) * 2021-06-30 2023-03-21 北京字跳网络技术有限公司 媒体文件处理方法、装置、设备、可读存储介质及产品
CN114512152A (zh) * 2021-12-30 2022-05-17 赛因芯微(北京)电子科技有限公司 一种广播音频格式文件生成方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1290008A (zh) * 1999-09-24 2001-04-04 索尼株式会社 记录和/或再现设备及数据通信系统
JP2003151216A (ja) * 2001-11-12 2003-05-23 Hitachi Ltd 情報記録方法、及び情報記録装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1290008A (zh) * 1999-09-24 2001-04-04 索尼株式会社 记录和/或再现设备及数据通信系统
JP2003151216A (ja) * 2001-11-12 2003-05-23 Hitachi Ltd 情報記録方法、及び情報記録装置

Also Published As

Publication number Publication date
CN101261865A (zh) 2008-09-10

Similar Documents

Publication Publication Date Title
CN101261865B (zh) 媒体电子文件的制作方法、装置及其播放设备及方法
KR100860201B1 (ko) 통합 멀티미이어 콘텐츠를 저장하는 저장 매체와, 이를 기반으로 하는 멀티미디어 서비스 제공 시스템 및 그 방법
KR100680443B1 (ko) 반도체 메모리 카드, 반도체 메모리 카드에 데이터를 기록하는 장치 및 반도체 메모리 카드의 데이터를 재생하는 장치
CN101091184B (zh) 数据存储方法、数据记录装置和数据播放装置
US6570080B1 (en) Method and system for supplying contents via communication network
JP4099166B2 (ja) ディジタルデータ記録再生装置、ディジタルデータ記録再生方法、およびコンピュータ読み取り可能な記録媒体
US5636276A (en) Device for the distribution of music information in digital form
US6456725B1 (en) Method for increasing the functionality of a media player/recorder device or an application program
US20080115655A1 (en) Playback systems and methods with integrated music, lyrics and song information
CN1224910C (zh) 加密方法、解码方法和装置以及信息记录介质
KR100836217B1 (ko) 워터마크를 포함하는 콘텐츠의 실행 방법, 콘텐츠 실행디바이스 및 콘텐츠 패킷 기록 매체
US8787613B2 (en) Forensic mark insertion apparatus and method
JP2001142472A (ja) 著作権付きデータ処理方法およびその装置
Egidi et al. Bringing multimedia contents into MP3 files
JPH09307543A (ja) 著作物データ再生方法および装置
US20040025041A1 (en) Information recording/reproducing apparatus with security measure
US8332954B2 (en) Methods for embedding data in digital audio data
KR100741482B1 (ko) 멀티미디어 컨텐츠와 이에 대응하는 자막 정보를 개인용정보 처리기로 제공하기 위한 방법 및 그 시스템
CN106060604A (zh) 基于bhd文件实现数字权限管理播放的方法及系统
JP3180788B2 (ja) 電子情報付与及び検出のための装置及び方法
RU2249245C2 (ru) Способ и устройство для обработки данных с авторскими правами
CN100369031C (zh) 一种音乐电视制作播放系统及其方法
JP4370725B2 (ja) 電子情報処理方法及び装置
JP2002358765A (ja) 著作権情報が書込まれた書込み媒体、書込み装置及びその書込み方法
JP4373018B2 (ja) メディアプレーヤ/レコーダ装置あるいはアプリケーションプログラムの機能を強化する方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170605

Address after: 519085 C District, 1# workshop, No. 1, science and technology No. four road, hi tech Zone, Zhuhai, Guangdong, China

Patentee after: ACTIONS (ZHUHAI) TECHNOLOGY CO., LTD.

Address before: 519085 No. 1, unit 15, building 1, 1 Da Ha Road, Tang Wan Town, Guangdong, Zhuhai

Patentee before: Juli Integrated Circuit Design Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20180421