CN100563319C - 信息处理设备和方法 - Google Patents

信息处理设备和方法 Download PDF

Info

Publication number
CN100563319C
CN100563319C CNB2004800192129A CN200480019212A CN100563319C CN 100563319 C CN100563319 C CN 100563319C CN B2004800192129 A CNB2004800192129 A CN B2004800192129A CN 200480019212 A CN200480019212 A CN 200480019212A CN 100563319 C CN100563319 C CN 100563319C
Authority
CN
China
Prior art keywords
file
head
main part
data
atom
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004800192129A
Other languages
English (en)
Other versions
CN1817035A (zh
Inventor
兵头贤次
三田英明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Panasonic Holdings Corp
Original Assignee
Sony Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Matsushita Electric Industrial Co Ltd filed Critical Sony Corp
Publication of CN1817035A publication Critical patent/CN1817035A/zh
Application granted granted Critical
Publication of CN100563319C publication Critical patent/CN100563319C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

有可能在广播设备和个人计算机之间交换文件。在AV多路复用格式的文件中,在作为MXF文件而被忽略的文件头(插入部分)中描述QT跳过原子首标(大小和类型信息),并且在作为QT文件而被读取跳过的QT跳过原子中描述MXF首标。此外,在作为MXF而被忽略的填充符中描述QT影片原子和mdat首标。也就是,AV多路复用格式的文件首标部分既满足MXF文件结构,又满足QT文件结构。采用该文件配置,可以由基于MXF规范的编辑设备和具有QT的PC识别AV多路复用格式的文件。本发明可以应用于视频记录设备。

Description

信息处理设备和方法
技术领域
本发明涉及一种信息处理设备和方法、程序记录介质及程序,特别涉及允许在广播设备和个人计算机之间交换文件的信息处理设备和方法、程序记录介质及程序。
背景技术
近年来,通信协议等已被标准化,并且通信设备的价格已经下降。结果,标准地配备有通信I/F(接口)的个人计算机已经变得常见。
除了个人计算机之外,标准地配备有通信接口或者能够配备有通信接口的商用广播设备,如AV(音频视频)服务器和VTR(视频磁带记录器)也已经变得常见。在这些广播设备之间,交换视频数据和音频数据(以下,将它们统称为AV数据)的文件。
然而,在相关技术领域内,在广播设备之间交换的文件的格式取决于它们的型号和制造商。这样,难以在其型号不同和由不同制造商制造的广播设备之间交换文件。为了解决这个问题,作为文件交换格式,MXF(素材交换格式)在例如专利文献WO02/21845A1中被提出,并且正被标准化。
然而,由于MXF文件具有为了在不同型号和不同制造商的广播设备之间交换它们而提出的格式,因此MXF文件不能被通用计算机,如个人计算机识别。换句话说,不能在商用广播设备和个人计算机之间交换文件。
发明内容
本发明是从上述观点而提出的。本发明的目的是在广播设备和个人计算机之间交换文件。
根据本发明的第一信息处理设备包括:主体生成装置,用于以输入数据生成主体部分;获得装置,用于获得输入数据的大小;表生成装置,用于根据由获得装置获得的大小,生成用来作为第二格式的文件从主体部分读取输入数据的表信息;首标生成装置,用于在第一格式中被忽略的首标部分的开始区域中描述第二格式的跳过区域的首标,在第二格式的跳过区域中描述第一格式的主体部分的首标,并且在第一格式中被忽略的区域中描述由表生成装置生成的表信息以及第二格式的数据区域的首标,其中主体部分包含在数据区域中,以生成首标部分;以及文件生成装置,用于将脚注部分连接到主体部分的末尾,并且将由首标生成装置生成的首标部分连接到主体部分的开头,以生成文件。
该第一格式是MXF(素材交换格式),并且第二格式是QT(Quick Time)格式。
输入数据可以是比主数据具有更低分辨率的数据。
第一信息处理设备还可以包括:主体记录装置,用于将由主体生成装置生成的主体部分记录到记录介质;脚注记录装置,用于在由主体记录装置记录在记录介质上的主体部分之后记录脚注部分;以及首标记录装置,用于在由主体记录装置记录在记录介质上的主体部分之前记录首标部分。
第一信息处理设备还可以包括:传送装置,用于通过网络将由文件生成装置生成的文件传送到另一个信息处理设备;接收装置,用于通过网络、根据传送装置从该另一个信息处理设备传送的文件,接收元数据;以及元数据记录装置,用于将由接收装置接收的元数据记录到记录介质。
根据本发明的第一信息处理方法包括以下步骤:以输入数据生成主体部分;获得输入数据的大小;根据通过获得步骤的处理而获得的大小,生成用来作为第二格式的文件从主体部分读取输入数据的表信息;在第一格式中被忽略的首标部分的开始区域中描述第二格式的跳过区域的首标,在第二格式的跳过区域中描述第一格式的主体部分的首标,并且在第一格式中被忽略的区域中描述通过表生成步骤的处理而生成的表信息以及第二格式的数据区域的首标,其中主体部分包含在数据区域中,以生成首标部分;以及将脚注部分连接到主体部分的末尾,并且将通过首标生成步骤的处理而生成的首标部分连接到主体部分的开头,以生成文件。
根据本发明的第一程序记录介质,在该第一程序记录介质上记录了程序,该程序包括以下步骤:以输入数据生成主体部分;获得输入数据的大小;根据通过获得步骤的处理而获得的大小,生成用来作为第二格式的文件从主体部分读取输入数据的表信息;在第一格式中被忽略的首标部分的开始区域中描述第二格式的跳过区域的首标,在第二格式的跳过区域中描述第一格式的主体部分的首标,并且在第一格式中被忽略的区域中描述通过表生成步骤的处理而生成的表信息以及第二格式的数据区域的首标,其中主体部分包含在数据区域中,以生成首标部分;以及将脚注部分连接到主体部分的末尾,并且将通过首标生成步骤的处理而生成的首标部分连接到主体部分的开头,以生成文件。
根据本发明的第一程序,包括以下步骤:以输入数据生成主体部分;获得输入数据的大小;根据通过获得步骤的处理而获得的大小,生成用来作为第二格式的文件从主体部分读取输入数据的表信息;在第一格式中被忽略的首标部分的开始区域中描述第二格式的跳过区域的首标,在第二格式的跳过区域中描述第一格式的主体部分的首标,并且在第一格式中被忽略的区域中描述通过表生成步骤的处理而生成的表信息以及第二格式的数据区域的首标,其中主体部分包含在数据区域中,以生成首标部分;以及将脚注部分连接到主体部分的末尾,并且将通过首标生成步骤的处理而生成的首标部分连接到主体部分的开头,以生成文件。
根据本发明的第二信息处理设备包括:主体生成装置,用于以输入数据生成主体部分;获得装置,用于获得输入数据的大小;表生成装置,用于根据由获得装置获得的大小,生成用来作为第二格式的文件从主体部分读取输入数据的表信息;首标生成装置,用于在第一格式中被忽略的首标部分的开始区域中描述第二格式的数据区域的首标,其中主体部分包含在数据区域中,并且在数据区域的开始区域中描述第一格式的主体部分的首标,以生成首标部分;以及文件生成装置,用于将脚注部分和由表生成装置生成的表信息连接到主体部分的末尾,并且将首标部分连接到主体部分的开头,以生成文件。
该第一格式是MXF(素材交换格式),并且第二格式是QT(Quick Time)格式。
输入数据可以是比主数据具有更低分辨率的数据。
第二信息处理设备还可以包括:主体记录装置,用于将由主体生成装置生成的主体部分记录到记录介质;脚注记录装置,用于在由主体记录装置记录在记录介质上的主体部分之后记录脚注部分和表信息;以及首标记录装置,用于在由主体记录装置记录在记录介质上的主体部分之前记录首标部分。
第二信息处理设备还可以包括:传送装置,用于通过网络将由文件生成装置生成的文件传送到另一个信息处理设备;接收装置,用于通过网络、根据由传送装置从该另一个信息处理设备传送的文件,接收元数据;以及元数据记录装置,用于将由接收装置接收的元数据记录到记录介质。
根据本发明的第二信息处理方法包括以下步骤:以输入数据生成主体部分;获得输入数据的大小;根据通过获得步骤的处理而获得的大小,生成用来作为第二格式的文件从主体部分读取输入数据的表信息;在第一格式中被忽略的首标部分的开始区域中描述第二格式的数据区域的首标,其中主体部分包含在数据区域中,并且在数据区域的开始区域中描述第一格式的主体部分的首标,以生成首标部分;以及将脚注部分和通过表生成步骤的处理而生成的表信息连接到主体部分的末尾,并且将首标部分连接到主体部分的开头,以生成文件。
根据本发明的第二程序记录介质,在该第二程序记录介质上记录了程序,该程序包括以下步骤:以输入数据生成主体部分;获得输入数据的大小;根据通过获得步骤的处理而获得的大小,生成用来作为第二格式的文件从主体部分读取输入数据的表信息;在第一格式中被忽略的首标部分的开始区域中描述第二格式的数据区域的首标,其中主体部分包含在数据区域中,并且在数据区域的开始区域中描述第一格式的主体部分的首标,以生成首标部分;以及将脚注部分和通过表生成步骤的处理而生成的表信息连接到主体部分的末尾,并且将首标部分连接到主体部分的开头,以生成文件。
根据本发明的第二程序包括以下步骤:以输入数据生成主体部分;获得输入数据的大小;根据通过获得步骤的处理而获得的大小,生成用来作为第二格式的文件从主体部分读取输入数据的表信息;在第一格式中被忽略的首标部分的开始区域中描述第二格式的数据区域的首标,其中主体部分包含在数据区域中,并且在数据区域的开始区域中描述第一格式的主体部分的首标,以生成首标部分;以及将脚注部分和通过表生成步骤的处理而生成的表信息连接到主体部分的末尾,并且将首标部分连接到主体部分的开头,以生成文件。
根据本发明的第一方面,以输入数据生成主体部分。获得输入数据的大小。根据所获得的大小,生成用来作为第二格式的文件从主体部分读取输入数据的表信息。在第一格式中被忽略的首标部分的开始区域中描述第二格式的跳过区域的首标。在第二格式的跳过区域中描述第一格式的主体部分的首标。在第一格式中被忽略的区域中描述第二格式的数据区域的首标。所生成的表信息和主体部分包含在数据区域中。结果,生成了首标部分。将脚注部分连接到主体部分的末尾。将通过首标生成步骤的处理而生成的首标部分连接到主体部分的开头。结果,生成了文件。
根据本发明的第二方面,以输入数据生成主体部分。作为第二格式的文件从主体部分获得输入数据的大小。根据获得的大小,生成用来读取输入数据的表信息。在第一格式中被忽略的首标部分的开始区域中描述第二格式的数据区域的首标。主体部分包含在数据区域中。在数据区域的开始区域中描述第一格式的主体部分的首标。结果,生成了首标部分。将脚注部分和表信息连接到主体部分的末尾。将首标部分连接到主体部分的开头。结果,生成了文件。
附图说明
图1是示出根据本发明的AV网络系统的结构的示例图;
图2是示出画面记录设备的结构的示例方框图;
图3是示出在图1所示的AV网络系统中使用的AV多路复用格式的文件的结构的例子的示意图;
图4是示出AV多路复用格式的文件的结构的另一个例子的示意图;
图5是图4所示的AV多路复用格式的文件首标部分的结构例子示意图;
图6是图5所示的影片原子(movie atom)的结构的例子;
图7是示出图6所示的时间样本原子的结构的例子的示意图;
图8是示出图6所示的同步原子的结构的例子的示意图;
图9是示出图6所示的样本块(chunk)原子的结构的例子的示意图;
图10是示出图6所示的样本大小原子的结构的例子的示意图;
图11是示出图6所示的块偏移原子的结构的例子的示意图;
图12是示出图4所示的AV多路复用格式的文件主体部分的结构的例子的示意图;
图13是图12所示的声音项目的结构的例子的示意图;
图14是示出图4所示的AV多路复用格式的文件主体部分的结构的另一个例子的示意图;
图15是图12所示的画面项目的结构的例子的示意图;
图16是描述传统QT文件的生成处理的示意图;
图17是描述图4所示的AV多路复用格式的文件的生成处理的流程图;
图18是描述在图17所示的步骤S5的文件脚注部分和文件首标部分的生成处理的流程图;
图19是示出图4所示的AV多路复用格式的文件的结构的另一个例子的示意图;
图20是示出图4所示的AV多路复用格式的文件的结构的另一个例子的示意图;
图21是描述图20所示的AV多路复用格式的文件的生成处理的流程图;
图22是示出根据本发明的AV网络系统的结构的另一个例子的示意图;
图23是描述图22所示的AV网络系统的处理的流程图。
具体实施方式
接下来,将描述本发明的实施例。在本专利申请的权利要求和实施例中所述的结构元素之间的关系如下。该关系表示在本专利申请的实施例中描述支持本专利申请的权利要求的例子。这样,即使在这一部分中未描述对应于这些实施例的例子,这些例子也不应当被解释为其不对应于本专利申请的权利要求的结构元素。相反,即使在这一部分中将例子描述为其对应于权利要求的结构元素,这些例子也不应当被解释为其不对应于除了本专利申请的权利要求的结构元素之外的其它结构元素。
另外,这部分的描述并不意味着与在本专利申请的实施例中描述的例子相对应的本发明的所有方面全都被描述在本专利申请的权利要求中。换句话说,本描述并不否定存在已经在本专利申请的实施例中描述但是未在其权利要求中描述的本发明的多个方面的可能性,即存在可以作为分案专利申请提交的本发明的多个方面,或者可以作为修改而被添加的本发明的多个方面的可能性。
本发明的权利要求1是一种生成由首标部分、主体部分和脚注部分组成的第一格式的文件的信息处理设备(例如,图1所示的画面记录设备1),其包括:主体生成装置(例如,图2所示的文件生成部件22,其执行图17所示的步骤S1的处理),用于以输入数据(例如,视频数据或音频数据)生成主体部分(例如,图4所示的文件主体部分);获得装置(例如,图2所示的文件生成部件22,其执行图17所示的步骤S2的处理),用于获得输入数据(例如,视频数据)的大小(例如,帧大小);表(table)生成装置(例如,图2所示的文件生成部件22,其执行图18所示的步骤S26的处理),用于根据由获得装置获得的大小,生成用来作为第二格式的文件从主体部分中读取输入数据的表信息(例如,图4所示的影片原子);首标生成装置(例如,文件生成部件22,其执行图18所示的步骤S24到S26的处理),用于在第一格式中被忽略的首标部分的开始区域(例如,图5所示的插入部分)中描述第二格式的跳过区域(例如图5所示的跳过原子)的首标,在第二格式的跳过区域中描述第一格式的主体部分的首标(例如图5所示的MXF首标),并且在第一格式中被忽略的区域(例如,图5中所示的填充符)中描述第二格式的数据区域(例如,图4中所示的影片数据原子)的首标(例如,图4中所示的mdat首标),其中由表生成装置生成的表信息和主体部分包含在数据区域中,以生成首标部分;以及文件生成装置(例如,图2所示的文件生成部件22,其执行图17所示的步骤S6和S8的处理),用于将脚注部分(例如,图4所示的文件脚注部分)连接到主体部分的末尾,并且将由首标生成装置生成的首标部分(例如,图4所示的文件首标部分)连接到主体部分的开头,以生成文件。
本发明的权利要求4是还包括以下装置的信息处理设备:主体记录装置(例如,图2所示的驱动器23,其执行图17所示的步骤S4的处理),用于将由主体生成装置生成的主体部分记录到记录介质(例如,图1所示的光盘2);脚注记录装置(例如,图2所示的驱动器23,其执行图17所示的步骤S7的处理),用于在由主体记录装置记录在记录介质上的主体部分之后记录脚注部分;以及首标记录装置(例如,图2所示的驱动器23,其执行图17所示的步骤S9的处理),用于在由主体记录装置记录在记录介质上的主体部分之前记录首标部分。
本发明的权利要求5是还包括以下装置的信息处理设备:传送装置(例如,图2所示的通信部件21,其执行图23所示的步骤S102的处理),用于通过网络(例如,图22所示的通信卫星101)将由文件生成装置生成的文件传送到另一个信息处理设备(例如,图22所示的PC 104);接收装置(例如,图2所示的通信部件21,其执行图23所示的步骤S103的处理),用于通过网络、根据传送装置从该另一个信息处理设备传送的文件,接收元数据(例如,编辑列表);以及元数据记录装置(例如,图2所示的驱动器23,其执行图23所示的步骤S104的处理),用于将由接收装置接收的元数据记录到记录介质(例如,图22所示的光盘2)。
根据本发明的第一信息处理方法、第一程序记录介质、以及第一程序包括以下步骤:以输入数据生成主体部分(例如,图17所示的步骤S1);获得输入数据的大小(例如,图17所示的步骤S2);根据通过获得步骤的处理而获得的大小,生成用来作为第二格式的文件从主体部分中读取输入数据的表信息(例如,图18所示的步骤S26);在第一格式中被忽略的首标部分的开始区域中描述第二格式的跳过区域的首标,在第二格式的跳过区域中描述第一格式的主体部分的首标,并且在第一格式中被忽略的区域中描述通过表生成步骤的处理而生成的表信息以及第二格式的数据区域的首标,其中主体部分包含在数据区域中,以生成首标部分(例如,图18所示的步骤S24到S26);以及将脚注部分连接到主体部分的末尾,并且将通过首标生成步骤的处理而生成的首标部分连接到主体部分的开头,以生成文件(例如,图17所示的步骤S6和S8)。
本发明的权利要求9是一种包括以下装置的信息处理设备:主体生成装置(例如,图2所示的文件生成部件22,其执行图21所示的步骤S61的处理),用于以输入数据生成主体部分;获得装置(例如,图2所示的文件生成部件22,其执行图21所示的步骤S62的处理),用于获得输入数据的大小;表生成装置(例如,图2所示的文件生成部件22,其执行图18所示的步骤S26的处理),用于根据由获得装置获得的大小,生成用来作为第二格式的文件从主体部分中读取输入数据的表信息;首标生成装置(例如,文件生成装置22,其执行图18所示的步骤S24到S26的处理),用于在第一格式中被忽略的首标部分的开始区域(例如,图20所示的插入部分)中描述第二格式的数据区域(例如,图20所示的影片数据原子)的首标(例如,图20所示的mdat首标),其中主体部分包含在数据区域中,并且在数据区域的开始区域中描述第一格式的主体部分的首标(例如,图20中示出的MXF首标),以生成首标部分;以及文件生成装置(例如,图2所示的文件生成部件22,其执行图21所示的步骤S66和S68的处理),用于将脚注部分和由表生成装置生成的表信息连接到主体部分的末尾,并且将首标部分连接到主体部分的开头,以生成文件。
本发明的权利要求12是还包括以下装置的信息处理设备:主体记录装置(例如,图2所示的驱动器23,其执行图21所示的步骤S64的处理),用于将由主体生成装置生成的主体部分记录到记录介质(例如,图1所示的光盘2);脚注记录装置(例如,图2所示的驱动器23,其执行图21所示的步骤S67的处理),用于在由主体记录装置记录在记录介质上的主体部分之后记录脚注部分和表信息;以及首标记录装置(例如,图2所示的驱动器23,其执行图21所示的步骤S69的处理),用于在由主体记录装置记录在记录介质上的主体部分之前记录首标部分。
本发明的权利要求13是还包括以下装置的信息处理设备:传送装置(例如,图2所示的通信部件21,其执行图23所示的步骤S102的处理),用于通过网络将由文件生成装置生成的文件传送到另一个信息处理设备;接收装置(例如,图2所示的通信部件21,其执行图23所示的步骤S103的处理),用于通过网络、根据由传送装置从该另一个信息处理设备传送的文件,接收元数据;以及元数据记录装置(例如,图2所示的驱动器23,其执行图23所示的步骤S104的处理),用于将由接收装置接收的元数据记录到记录介质。
根据本发明的第二信息处理方法、第二程序记录介质、以及第二程序包括以下步骤:以输入数据生成主体部分(例如,图21所示的步骤S61);获得输入数据的大小(例如,图21所示的步骤S62);根据通过获得步骤的处理而获得的大小,生成用来作为第二格式的文件从主体部分中读取输入数据的表信息(例如,图18所示的步骤S26);在第一格式中被忽略的首标部分的开始区域中描述第二格式的数据区域的首标,其中主体部分包含在数据区域中,并且在数据区域的开始区域中描述第一格式的主体部分的首标,以生成首标部分(例如图18所示的步骤S24到S26);以及,将脚注部分和通过表生成步骤的处理而生成的表信息连接到主体部分的末尾,并且将首标部分连接到主体部分的开头,以生成文件(例如,图21所示的步骤S66和S68)。
接下来,参照附图,将描述本发明的实施例。
图1示出了根据本发明实施例的AV网络系统(系统是多个设备的逻辑集合,而不管它们是否包含在一个机壳中)的结构的例子。
可以将光盘2装载到画面记录设备1中以及从其中卸载。画面记录设备1以所捕获的对象视频数据和所采集的音频数据生成后面将要描述的AV多路复用格式的文件,并且将所生成的文件记录到所装载的光盘2。
另外,画面记录设备1从所装载的光盘2或者内置的存储部件20(图2)读取AV多路复用格式的文件,并且通过网络5传送AV多路复用格式的文件。
AV多路复用格式的文件是基于例如MXF标准的文件。如将要参照图3详细描述的那样,AV多路复用格式的文件由文件首标部分(File Header-文件首标)、文件主体部分(File Body-文件主体)、以及文件脚注部分(File Footer-文件脚注)组成。由于AV多路复用格式的文件是基于MXF标准的文件,因此,例如,(在NTSC制式的情况下)每次60帧地多路复用作为AV数据的视频数据和音频数据,并且将其放置在文件主体部分处。另外,AV多路复用格式的文件由QT(Quick Time,注册商标)支持,其中QT是一种与平台无关、可以多种方式格式化(variously formatable)、以及可扩展的软件。即使设备不基于MXF标准,但是当该设备安装了QT软件时,该设备也能够再现和编辑AV多路复用格式的文件。换句话说,AV多路复用格式的文件首标部分包含QT再现和编辑基于MXF标准而置于主体中的视频数据和音频数据所用的信息(后面将要参照图6描述的样本表)。
在图1中,可以将光盘2装载到编辑设备3和PC(个人计算机)4中,以及从其中卸载。编辑设备3是基于MXF标准的设备,其可以处理基于MXF标准的文件,并且可以从记录在所装载的光盘2上的AV多路复用格式的文件读取视频数据和音频数据。编辑设备3从AV多路复用格式的文件流式再现和编辑视频数据和音频数据,并且将作为编辑结果的AV多路复用格式的文件的视频数据和音频数据记录到所装载的光盘2。
虽然PC 4不是基于MXF标准的设备,但是PC 4安装了QT软件。这样,PC 4可以从记录在所装载的光盘2上的AV多路复用格式的文件读取视频数据和音频数据。换句话说,PC 4可以根据置于AV多路复用格式的文件首标部分中以及对于采用QT再现和编辑视频数据或音频数据所需的信息,从AV多路复用格式的文件主体部分读取视频数据或音频数据,并且对视频数据或音频数据执行编辑处理和其它处理。
在图1中,连接到网络5的编辑设备6是如同编辑设备3一样可以处理基于MXF标准的文件的基于MXF标准的设备。这样,编辑设备6可以通过网络5从画面记录设备1接收AV多路复用格式的文件。另外,编辑设备6可以通过网络5将AV多路复用格式的文件传送到画面记录设备1。换句话说,画面记录设备1和编辑设备6可以通过网络5交换AV多路复用格式的文件。另外,编辑设备6可以执行诸如流式再现和编辑处理的各种处理。
另一方面,虽然连接到网络5的PC 7如同PC 4一样不是基于MXF标准的设备,但是PC 7安装了QT软件。这样,PC 7可以通过网络5从画面记录设备1接收AV多路复用格式的文件。另外,PC 7可以通过网络5将AV多路复用格式的文件传送到画面记录设备1。换句话说,PC 7可以根据置于AV多路复用格式的文件首标部分中以及对于采用QT再现和编辑视频数据和音频数据所需的信息,从AV多路复用格式的文件主体部分读取视频数据和音频数据,并且对视频数据或音频数据执行编辑处理等。
这样,AV多路复用格式的文件是基于MXF标准的文件。另外,对于采用QT再现和编辑置于基于MXF标准的主体部分中的视频文件和音频文件所需的信息被放置在AV多路复用格式的文件首标部分中。结果,画面记录设备1可以不仅具有与编辑设备3和6的兼容性,还可以具有与通用PC 4和7的兼容性。
换句话说,画面记录设备1、作为基于MXF标准的设备的编辑设备3和6、以及安装了QT软件的PC 4和7可以相互交换AV多路复用格式的文件。
图2示出了根据本发明的画面记录设备1的结构的例子。在图2中,CPU(中央处理单元)11根据存储在ROM(只读存储器)12中的程序或者从存储部件20装载到RAM(随机存取存储器)13的程序,执行各种处理。RAM 13还存储CPU 11执行各种处理所用的数据等。
CPU11、ROM 12、以及RAM 13通过总线14相互连接。视频编码部件15、音频编码部件16、以及输入/输出接口17连接到总线14。
视频编码部件15根据MPEG(运动画面专家组)4制式对从图像捕获部件31输入的视频数据进行编码,并且将编码视频数据提供给存储部件20或文件生成部件22。音频编码部件16根据ITU-T G..711A律制式对从麦克风32输入的音频数据进行编码,并且将编码音频数据提供给存储部件20或文件生成部件22。在这种情况下,视频编码部件15对输入视频数据进行编码,并且输出比输入视频数据具有更低分辨率的视频数据。然而,视频编码部件15可以对输入视频数据进行编码,并且输出其分辨率取决于期望质量、文件容量等的视频数据。同样地,音频编码部件16对输入音频数据进行编码,并且输出比输入音频数据具有更低质量的音频数据。然而,音频编码部件16可以对输入音频数据进行编码,并且输出其质量取决于期望质量、文件容量等的音频数据。
输入部件18、输出部件19、存储部件20、通信部件21、文件生成部件22、以及驱动器23连接到输入/输出接口17,其中输入部件18由捕获对象的图像并输入所捕获图像的视频数据的图像传感器部件31、麦克风32等组成,输出部件19由作为CRT(阴极射线管)、LCD(液晶显示器)等的监视器、扬声器等等组成。
存储部件20由存储器、硬盘等组成。存储部件20存储从视频编码部件15提供的视频数据、以及从音频编码部件16提供的音频数据。另外,存储部件20临时存储后面将要详细描述、从文件生成部件22提供的AV多路复用格式的文件。具体地说,存储部件20在文件生成部件22的控制下,存储从文件生成部件22提供的文件主体部分,将文件脚注部分连接到文件主体部分的末尾,并且将文件首标部分连接到文件主体部分的开头,获得AV多路复用格式的文件,并且存储它。
通信部件21由例如IEEE(电气和电子工程师协会)1394端口、USB(通用串行总线)端口、连接到LAN(局域网)的NIC(网络接口卡)、模拟调制解调器、TA(终端适配器)、DSU(数字服务单元)、ADSL(非对称数字用户线路)调制解调器等组成。通信部件21通过网络5,如因特网或内联网,与编辑设备6和PC 7交换AV多路复用格式的文件。换句话说,通信部件21通过网络5传送由文件生成部件22生成且临时存储在存储部件20中的AV多路复用格式的文件,或者通过网络5接收该文件,并且将该文件提供给输出部件19或存储部件20。
文件生成部件22以从视频编码部件15提供的视频数据以及从音频编码部件16提供的音频数据,连续地生成后面将要详细描述的AV多路复用格式的文件主体部分、文件脚注部分和文件首标部分,并且将它们提供给存储部件20或驱动器23。另外,文件生成部件22以存储在存储部件20中的视频数据和音频数据,连续地生成后面将要详细描述的AV多路复用格式的文件主体部分、文件脚注部分、以及文件首标部分,并且将它们提供给存储部件20或驱动器23。
可以将光盘2装载到驱动器23中,以及从其中卸载。驱动器23驱动所装载的光盘2,以记录从文件生成部件22提供的AV多路复用格式的文件主体部分。具体地说,驱动器23在从文件生成部件22提供的文件主体部分的末尾之后记录文件脚注部分,并且在文件主体部分的开头之前记录文件首标部分,并且将AV多路复用格式的文件记录到光盘2。另外,驱动器23从光盘2读取AV多路复用格式的文件,并且将其提供给输出部件19或存储部件20。
如上所述,画面记录设备1的文件生成部件22以从输入部件18输入的视频数据和音频数据、或者存储在存储部件20中的视频数据和音频数据,连续地生成AV多路复用格式的文件主体部分、文件脚注部分和文件首标部分,并且将它们提供给驱动器23。驱动器23按照从文件生成部件22提供它们的次序,将AV多路复用格式的文件主体部分、文件脚注部分以及文件首标部分连续地记录到所装载的光盘2。
另外,画面记录设备1的文件生成部件22以从输入部件18输入的视频数据和音频数据、或者存储在存储部件20中的视频数据和音频数据,连续地生成AV多路复用格式的文件主体部分、文件脚注部分、以及文件首标部分,并且将它们作为AV多路复用格式的文件临时存储到存储部件20。通信部件21通过网络5传送存储在存储部件20中的AV多路复用格式的文件。
图3示出了AV多路复用格式的例子。
AV多路复用格式的文件基于在前述专利文献中描述的MXF标准。AV多路复用格式的文件由连续排列的文件首标部分(文件首标)、文件主体部分(文件主体)、以及文件脚注部分(文件脚注)组成。
在AV多路复用格式的文件首标部分中,连续地排列了插入部分(Run In)和MXF首标。MXF首标由首标分区包(header partition pack)和首标元数据组成。
插入部分是表示MXF首标以11字节的匹配模式开始的选项。插入部分可被分配多达64千字节。在本例中,插入部分为8字节。在插入部分中,可以放置除了MXF首标的11字节的模式之外的任何数据。在首标分区包中,放置了标识首标的11字节模式、置于文件主体部分中的数据的格式、表示文件格式的信息等。在首标元数据中,放置了对于读取置于组成文件主体部分的要素容器(essence container)中的、作为AV数据的视频数据和音频数据等等所需的信息。
AV多路复用格式的文件主体部分由要素容器组成。在要素容器中,(在NTSC制式的情况下)例如每次60帧地多路复用并且放置作为AV数据的视频数据和音频数据。
AV多路复用格式的文件脚注部分由脚注分区包组成。在脚注分区包中,放置了识别文件脚注部分的数据等。
当提供AV多路复用格式的文件时,基于MXF标准的编辑设备3和6从首标分区包读取11字节的模式,并且获得MXF首标。根据MXF首标的首标元数据,编辑设备3和6可以从要素容器读取作为AV数据的视频数据和音频数据。
图4示出了AV多路复用格式的另一个例子。在图4所示的例子中,上面序列表示参照图3描述的由基于MXF标准的编辑设备3和6识别的AV多路复用格式的文件的例子(以下将该AV多路复用格式的文件称作MXF文件)。下面序列表示由安装了QT软件的PC 4和7识别的AV多路复用格式的文件的例子(以下将该AV多路复用格式的文件称作QT文件)。换句话说,AV多路复用格式既具有QT文件的结构,又具有MXF文件的结构。
如上面序列所示,当AV多路复用格式的文件被视作MXF文件时,AV多路复用格式的文件由文件首标部分、文件主体部分以及文件脚注部分组成。文件首标部分由8字节的插入部分、由首标分区包和首标元数据组成的MXF首标、以及作为填充数据的填充符组成。文件主体部分由要素容器组成。文件脚注部分由脚注分区包组成。
在图4所示的例子中,组成文件主体部分的要素容器由至少一个编辑单元组成。一个编辑单元由(在NTSC制式的情况下)60帧组成。在一个编辑单元中,放置了60帧的AV数据(音频数据和视频数据)等。在一个编辑单元中,根据KLV(键(key)、长度、值)结构对60帧的AV数据(在NTSC制式的情况下)等进行编码。
KLV结构依次具有键、长度和值。键具有基于SMPTE 298M标准并且表示置于该值中的数据的类型的16字节标签。在该长度中,根据BER(基本编码规则:ISO/IEC8821ASN)置于该值中的数据的数据长度(8字节)。在该值中,放置了实际数据,即(在NTSC制式的情况下)60帧的音频数据或视频数据。为了使音频数据和视频数据具有固定长度,作为KLV结构在每个音频数据或视频数据的末尾之后放置了作为填充数据的填充符。
这样,编辑单元由以KLV结构连续排列的音频数据、填充符、视频数据和填充符组成。
如下面序列所示,当AV多路复用格式的文件被视作QT文件时,AV多路复用格式的文件由连续排列的跳过原子(skip atom)、影片原子、空闲空间原子、作为影片数据原子的首标的mdat首标、以及影片数据原子组成。
QT影片资源具有被称作原子的基本数据单元。每个原子具有由4字节的大小和4字节的类型信息组成的首标。
跳过原子是其数据被跳过的原子。如后面将要参照图6描述的那样,影片原子描述样本表等。样本表是用来读取记录在影片数据原子中的AV数据的信息。在影片原子中描述的大部分信息是固定信息。空闲空间原子是形成文件中的空间的原子。由于以一个ECC(纠错码)为单位形成文件首标部分,因此文件主体部分以一个ECC的边界开始。换句话说,空闲空间原子用来调整文件首标部分的ECC的大小。影片数据原子是其中存储了诸如视频数据和音频数据的实际数据的部分。
这样,在图4所示的AV多路复用格式的文件中,在文件的开头(插入部分)描述了QT文件的跳过原子的首标(大小和类型信息),其在MXF文件中被忽略。在跳过原子中描述MXF首标,其在QT文件中被跳过。另外,在填充符中描述影片原子和mdat首标,其在MXF文件中被忽略。换句话说,AV多路复用格式的文件首标部分既满足MXF文件的结构,又满足QT文件的结构。
另外,MXF文件的文件主体部分和文件脚注部分对应于QT文件的影片数据原子。置于QT文件的影片数据原子中的视频数据和音频数据的最小单元被称作样本。作为样本的集合,定义了块(chunk)。换句话说,在QT文件中,置于一个编辑单元中的音频数据和视频数据被识别为一个块。这样,在QT文件中,与编辑单元的音频数据相对应的键(key)和长度被忽略。音频数据的开始位置AC被识别为块的开始位置AC。根据开始位置AC,在影片原子中描述了读取音频数据所需的信息。同样地,与编辑单元的视频数据相对应的键和长度被忽略。视频数据的开始位置VC被识别为块的开始位置VC。根据开始位置VC,在影片原子中描述了读取视频数据所需的信息。
在该文件结构中,不仅基于MXF标准的编辑设备3和6,而且安装了QT软件的PC 4和7识别AV多路复用格式的文件,并且从文件主体部分读取音频数据和视频数据。
换句话说,基于MXF标准的编辑设备3和6忽略插入部分,读取首标分区包的11字节模式,并且获得MXF首标。根据MXF首标的首标元数据,编辑设备3和6可以从要素容器读取作为AV数据的视频数据和音频数据。
另一方面,安装了QT软件的PC 4和7识别跳过原子的首标,跳过所述跳过原子,并且读取影片原子。根据在影片原子中描述的信息(后面将要描述的样本表等),PC 4和7可以读取记录在影片数据原子中的块(音频数据或视频数据)。
这样,画面记录设备1、基于MXF标准的编辑设备3和6、以及安装了QT软件的PC 4和7可以在它们之间相互交换AV多路复用格式的文件。
图5详细示出了AV多路复用格式的MXF文件的首标部分的例子。在图5所示的例子中,上面序列示出了被视作MXF文件的AV多路复用格式的文件的例子,而下面序列示出了被视作QT文件的AV多路复用格式的文件的例子。
在图5所示的例子中,在上面序列中,当AV多路复用格式的文件被视作MXF文件时,MXF文件的文件首标部分由连续排列的插入部分、MXF首标、以及填充符组成。MXF首标由连续排列的首标分区包、填充符、以及首标元数据组成。另一方面,在下面序列中,当AV多路复用格式的文件被视作QT文件时,它由与MXF文件的文件首标部分相对应地连续排列的跳过原子、影片原子、空闲空间原子、以及mdat首标组成。mdat首标是影片数据原子的首标。
在图5所示的例子中,与MXF文件的插入部分相对应,描述了作为QT文件的跳过原子的首标的大小和类型信息。对应于MXF文件的插入部分之后的MXF首标,描述了QT文件的跳过原子。对应于MXF首标之后的填充符,描述了QT文件的影片原子、空闲空间原子、以及影片数据原子的首标。
在该结构中,基于MXF标准的编辑设备3和6可以忽略插入部分,识别MXF首标的首标分区,并且根据MXF首标的首标元数据从文件主体部分读取视频数据和音频数据。另一方面,安装了QT软件的PC 4和7可以识别跳过原子的首标,跳过所述跳过原子,并且根据在影片原子中描述的信息,从影片数据原子的首标之后的文件主体部分(影片数据原子)读取块(视频数据和音频数据)。
接下来,参照图6,将详细描述在影片原子中描述的信息。
图6示出了与图5所示的文件首标部分相对应的QT文件的结构的例子。在图6所示的例子中,上面部分表示文件的开头。如上所述,QT影片资源的基本数据单元被称作原子。在这种情况下,从分级级别1到分级级别8分级排列原子。附图中的最左列是分级级别1,其是最高分级级别。在附图的右侧表示的“V”表示仅当轨道原子(后面将要描述)所涉及的媒体是视频数据时才描述的原子(即,视频数据的轨道原子)(视频轨道原子))。而“A”表示仅当轨道原子所涉及的媒体是音频数据时才描述的原子(即,音频数据的轨道原子)(音频轨道原子))。
在图6所示的例子的情况下,QT文件的QT首标由分级级别1的跳过原子(skip)和影片原子(movv)、以及分级级别2的影片首标原子(mvhd)组成。另一方面,QT文件的尾部由分级级别2的用户定义原子(udta)以及分级级别1的空闲空间原子(free)和作为影片数据原子的首标的mdat首标(mdat)组成。QT文件的视频轨道和音频轨道由分级级别2的轨道原子(track)和分级级别3到分级级别8的原子组成。
作为最高分级级别的分级级别1的QT文件由跳过原子(akip)、影片原子(moov)、空闲空间原子(free)、以及mdat首标(mdat)组成,其中mdat首标(mdat)是与文件首标部分相对应的影片数据原子的首标。换句话说,分级级别1的结构对应于图5所示的文件首标部分。
分级级别2的影片原子由影片首标原子(mvhd)、轨道原子(track)和用户定义原子(udta)组成。
分级级别2的影片首标原子由关于整个影片的信息,如大小、类型信息、时间量程(time scale)、以及长度组成。存在与媒体相对应的轨道原子,如视频轨道原子和音频轨道原子。当存在四个声道的音频数据时,存在两个音频轨道原子。同样地,当存在八个声道的音频数据时,存在四个音频轨道原子。分级级别3的轨道原子由轨道首标原子(tkhd)、编辑原子(edts)、媒体原子(mdia)、以及用户定义原子(udta)组成。
分级级别3的轨道首标原子由影片中的轨道原子的特征信息,如轨道原子的ID号码组成。编辑原子由分级级别4的编辑列表原子(elst)组成。用户定义原子包含与轨道原子相关联的信息。
分级级别3的媒体原子由分级级别4的媒体首标原子(mdhd)、媒体处理器原子(hdlr:媒体处理器参考原子)、以及媒体信息原子(minf)组成,其中媒体首标原子(mdhd)描述关于记录在轨道原子中的媒体(音频数据或视频数据)的信息,媒体处理器原子描述对影片数据(音频数据或视频数据)进行解码的处理器的信息。
当轨道原子是视频轨道原子(在附图的右侧表示的“V”)时,分级级别4的媒体信息原子(minf)由分级级别5的视频媒体首标原子(vmhd)、数据信息原子(dinf)、以及样本表原子(stbl)组成。另一方面,当轨道原子是音频轨道原子(在附图的右侧表示的“A”)时,分级级别4的媒体信息原子(minf)由分级级别5的声音媒体首标原子(smhd)、数据信息原子、以及样本数据原子组成。
分级级别5的数据信息原子由分级级别6的数据参考原子(drf)组成。分级级别6的数据参考原子以分级级别7的alias(别名)描述媒体数据的位置。
样本表原子(stbl)描述用来从影片数据原子读取AV数据的表信息。QT可以根据表信息从影片数据原子读取视频数据和音频数据。如参照图4所述,在QT文件中,记录在影片数据原子中的视频数据和音频数据的最小单元是样本。作为样本的集合,定义了块。
当轨道原子是视频轨道原子(在附图的右侧表示的“V”)时,样本表原子由分级级别6的样本描述原子(stsd)以及分别是时间样本原子(stts:时间到样本原子)、同步样本原子(stss:同步样本原子)、样本块原子(stsc:样本到块原子)、样本大小原子(stsz)、以及块偏移原子(stco)的五个样本表组成。当轨道原子是音频轨道原子(在附图的右侧表示的“A”)时,不描述同步样本原子。
当记录在轨道上的媒体是视频数据(在附图的右侧表示的“V”)时,分级级别6的样本分布原子例如由分级级别7的MPEG数据格式原子(mp4v)和分级级别8的元素流描述原子(esds)组成,其中MPEG数据格式原子(mp4v)描述MPEG4视频数据的格式。元素流描述原子描述对数据进行解码所需的信息。当记录在轨道上的媒体是音频数据(在附图的右侧表示的“A”)时,样本描述原子由分级级别7的A律(a law)数据格式原子组成。A律数据格式原子描述根据ITU-T G.711A律制式的音频数据的格式。
接下来,参照图7到图11,将描述作为用来读取影片原子的音频数据和视频数据的信息的五个样本表。
图7示出了时间样本原子的例子。时间样本原子是表示一个样本(一帧)和轨道原子的时间量程之间的关系的表。
在图7所示的例子中,时间样本原子(stts:time to sample原子)由元素原子大小(atomSize)、原子类型(atomType)、标志(flags)、条目(numEntries)、样本数(sampleCount)、以及样本时间(sampleDuration)组成。元素原子大小表示时间样本原子的大小。元素原子类型表示原子类型是“stts”(时间样本原子)。元素标志的第一字节表示版本,并且元素标志的其余部分表示标志本身。元素条目表示样本数以及样本区间。元素“样本数”表示轨道原子的样本数。元素样本时间表示一个样本的持续时间。
当在时间样本原子中描述的元素样本时间(sampleDuration)是“0x64”(采用十六进制表示法)时,它在轨道原子的时间量程中是100。这样,在这种情况下,假定一秒被设为2997,则一秒为2997/100=29.97个样本(帧)。
图8示出了同步样本原子的例子。同步原子是作为键的帧键帧的表。同步原子描述关于同步的信息。
在图8所示的例子的情况下,同步样本原子(stss:sync sample原子)由元素原子大小(atomSize)、原子类型(atomType)、标志(flags)、条目(numEntries)组成。元素原子大小表示同步样本原子的大小。元素原子类型表示原子类型是“stss”(同步样本原子)。元素标志的第一字节表示版本,并且元素标志的其余部分表示标志本身。元素条目表示视频数据的I帧的样本号表的条目数。
当根据例如MPEG在帧中存在I画面、P画面和B画面时,样本号表是描述I画面帧的样本号的表。当轨道原子是音频轨道原子时,不描述同步样本原子(在附图的右侧表示的“A”)。
图9示出了样本块原子的例子。样本块原子是表示块和组成该块的样本(帧)之间的关系的表。
在图9所示的例子中,样本块原子(stsc:sample to chunk原子)由元素原子大小(atomSize)、原子类型(atomType)、标志(flags)、条目(numEntries)、第一块1(firstChunk1)、块1的样本数(sampePerChunk1)、块1的条目数(sampleDescriptionID1)、第一块2(firstChunk2)、块2的样本数(sampePerChunk2)、以及块2的条目数(sampleDescriptionID2)组成。
元素原子大小表示样本块原子的大小。元素原子类型表示原子类型是“stsc”(样本块原子)。元素标志的第一字节表示版本,并且元素标志的其余部分表示标志本身。元素条目表示数据条目数。
元素第一块1表示块组的第一块号,每个块由相同数目的样本组成。元素“块1的样本数”表示块1的样本数。元素“块1的条目数”表示块1的条目数。当下一块是其样本数不同于块1的样本数的块时,作为关于下一块的信息,如同元素第一块1、元素“块1的样本数”、以及元素“块2的条目数”一样描述元素第一块2、元素“块2的样本数”、以及元素“块2的条目数”。
如上所述,在样本块原子中,在关于由相同数目的样本组成的第一块的信息中描述关于其中每一个由相同数目的样本组成的多个块的信息。
图10示出了样本大小原子的例子。样本大小原子是描述样本与它们的数据大小之间的关系的表。
在图10所示的例子中,样本大小原子(stsz)由元素原子大小(atomSize)、原子类型(atomType)、标志(flags)、样本大小(sampleSize)以及条目数(numEntries)组成。元素原子大小表示样本大小原子的大小。元素原子类型表示原子类型是“stsz”(样本大小原子)。元素标志的第一字节表示版本,并且元素标志的其余部分表示标志本身。元素样本大小表示样本的大小。当所有样本的大小相同时,只需在元素样本大小中描述一个大小。元素“条目数”表示样本大小的条目数。
这样,当对于音频数据,数据大小不变时,在元素样本大小中描述缺省大小。另一方面,当对于视频数据,帧对应于样本,并且对于根据MPEG的I画面和P画面,样本大小随时间而变化时,在元素样本大小中描述所有样本的大小。
图11示出块偏移原子的例子。块偏移原子是表示块与其相对于文件开头的偏移值之间的关系的表。
在图11所示的例子的情况下,块偏移原子(stco)由元素原子大小(atomSize)、原子类型(atomType)、标志(flags)、以及条目数(numEntries)组成。元素原子大小表示样本大小原子的大小。元素原子类型表示原子类型是“stco”(块偏移原子)。元素标志的第一字节表示版本,并且元素标志的其余部分表示标志本身。元素“条目数”表示块的偏移值的条目数。
这样,例如,在图4所示的例子中,作为音频数据块的偏移值,描述了从文件的开头到块开始位置AC的偏移值。作为视频数据块的偏移值,描述了从文件的开头到块开始位置VC的偏移值。
在具有前述结构的影片原子中,QT使与音频数据或视频数据相对应的分级级别4的媒体处理器原子(hdlr:媒体处理器参考原子)访问与预定时间相对应的媒体数据。具体地说,当提供特定样本时间时,媒体处理器原子根据媒体的时间量程来确定时间。由于媒体处理器原子通过分级级别3的编辑原子(edts)的信息而知道每个轨道原子的时间量程中的时间,因此媒体处理器原子根据分级级别6的时间样本原子而获得样本号,并且从分级级别6的块偏移原子获得块相对于文件开头的偏移值。这样,由于媒体处理器原子访问指定的样本,因此QT可以根据时间量程来再现实际数据。
如上所述,影片原子描述了样本表,其是对于从影片数据原子读取视频数据和音频数据所需的信息。这样,当影片原子置于AV多路复用格式的首标部分处时,QT可以识别AV多路复用格式。
图12示出了图4所示的AV多路复用格式的MXF文件的文件主体部分的例子。在图12所示的例子中,示出了一个编辑单元。
在图12所示的例子中,一个编辑单元由声音项目(声音)、画面项目(画面)和填充符组成(以下,该声音项目被称作声音项目组,以便使其与多个声音项目1到4相区分)。
在声音项目组中,与置于画面项目中的视频数据相对应的60帧的视频数据(在NTSC制式的情况下)所对应的音频数据被划分成四个块,这些块具有参照图4所述的前述KLV结构。在图12所示的例子的情况下,根据ITU-TG.711A律制式经过编码的音频数据被置于声音项目组中。
这样,声音项目组由以KLV结构连续排列的声音项目1、填充符、声音项目2、填充符、声音项目3、填充符、声音项目4和填充符组成。一个声音项目以ECC/2为单元组成。作为使声音项目以固定长度且以一个ECC单元为单元来安排的填充数据,安排了填充符。
在声音项目组的音频数据后面的画面项目中,以一个GOP(画面组)为单元并且以KLV结构安排根据MPEG(运动画面专家组)4制式编码的视频数据(基本流(ES))。作为使画面项目以固定长度且以ECC为单元来安排的填充数据,在画面项目的视频数据之后以KLV结构安排了填充符。
如上所述,在AV多路复用格式中,根据MXF标准,每次60帧(在NTSC制式的情况下)地多路复用以KLV结构排列的音频数据的声音项目组和以KLV结构排列的视频数据的画面项目。这样,画面记录设备1的文件生成部件22通过编码数据量来确定KLV结构的键(K)和长度(L),并且生成AV多路复用格式的文件首标部分的MXF首标。这样,基于MXF标准的编辑设备3和6可以根据首标部分的MXF首标而读取以KLV结构排列的音频数据和视频数据。
另一方面,QT将以这种方式排列的音频数据和视频数据定义为一个块。这样,文件生成部件22忽略LKV结构的键(K)和长度(L),将声音项目1、声音项目2、声音项目3、声音项目4、以及画面项目定义为块(多个),获得声音项目1的开始位置AC1的偏移值、声音项目2的开始位置AC2的偏移值、声音项目3的开始位置AC3的偏移值、声音项目4的开始位置AC4的偏移值、以及画面项目的开始位置VC的偏移值,并且生成文件首标部分的影片原子的样本表。这样,安装了QT软件的PC 4和7可以通过文件首标部分的影片原子来读取作为块的音频数据和视频数据。
图13示出了图12所示的声音项目(声音)3的例子。在图13所示的例子中,声音项目3由两个声道,即左和右声道的音频数据组成。
换句话说,通过交替地为每个样本安排两个声道的音频数据,多路复用两个声道的音频数据。这样,根据525/59.94NTSC标准,视频数据由60帧组成。结果,16016个样本的音频数据被安排在声音项目中。根据625/50PAL标准,由于视频数据由50帧组成,因此16000个样本的音频数据被安排在声音项目中。
以这种方式,两个声道的音频数据被安排在声音项目中。这样,接下来,参照图14,将描述四个和八个声道的音频数据被安排在声音项目中的情况。
图14示出了图12所示的AV多路复用格式的主体部分的另一个例子。在图14所示的例子中,声音项目组具有2个ECC的固定长度。画面项目具有n个ECC的固定长度。在这种情况下,上面序列表示八个声道的音频数据的情况下的文件主体部分。下面序列表示四个声道的音频数据的情况下的文件主体部分。
如上面序列所示,在八个声道的音频数据的情况下,声音项目组的第一ECC由连续排列的以下部分组成:24字节的键(K)和长度(L)、为每个样本交替安排声道1的音频数据和声道2的音频数据的声音项目1(S1)、24字节的键和长度、填充符、为每个样本交替安排声道3的音频数据和声道4的音频数据的声音项目2(S2)、24字节的键和长度、以及填充符。声音项目组的第二ECC由连续排列的以下部分组成:24字节的键和长度、为每个样本交替安排声道5的音频数据和声道6的音频数据的声音项目3(S3)、24字节的键和长度、填充符、24字节的键和长度、为每个样本交替安排声道7的音频数据和声道8的音频数据的声音项目4(S4)、24字节的键和长度、以及填充符。
接下来,如下面序列所示,在四个声道音频数据的情况下,声音项目组的第一ECC由连续排列的以下部分组成:24字节的键和长度、为每个样本交替安排声道1的音频数据和声道2的音频数据的声音项目1(S1)、24字节的键和长度、填充符、24字节的键和长度、为每个样本交替安排声道3的音频数据和声道4的音频数据的声音项目2(S2)、24字节的键和长度、以及填充符。声音项目组的第二ECC由连续排列的以下部分组成:24字节的键和长度、无声音频数据的声音项目3(S3)、24字节的键和长度、填充符、24字节的键和长度、为每个样本交替安排无声音频数据的声音项目4(S4)、24字节的键和长度、以及填充符。
如上所述,在八个声道音频数据的情况下,在两个ECC的每一个中安排四个声道的音频数据。在四个声道音频数据的情况下,在第一ECC中安排四个声道的音频数据,而在安排于第二ECC中的四个声道的声音项目中记录无声音频数据。
图15示出了图12所示的画面项目的例子。如上所述,在画面项目中,安排了根据MPEG4制式而编码的60帧(在NTSC制式的情况下)=6个GOP(画面组)的视频数据。具体地说,根据525/59.94NTSC标准,视频数据由60帧组成。这样,在画面项目中,安排了六个GOP,其中每一个由一帧I画面和九帧P画面组成。另一方面,根据625/50PAL标准,由于视频数据由50帧组成,因此在画面项目中安排了五个GOP,其中每一个由一帧I画面和九帧P画面组成。
以这种方式,安排和构造了AV多路复用格式的文件主体部分。在画面记录设备1中,安排并生成了AV多路复用格式的文件主体部分。此后,根据所生成的文件主体部分,生成文件脚注部分和文件首标部分。
接下来,分别参照图16和图17所示的示意图和流程图,将描述生成前述AV多路复用格式的文件的处理。
首先,参照图16,将描述生成常规QT文件的处理。如图16所示,在QT文件中,从特定ECC的边界到该附图的右边记录由音频数据(音频)和视频数据(视频)的块组成的影片数据原子。在QT文件中,在记录了影片数据原子之后,根据影片数据原子的块而生成影片原子,并且从文件的开头记录所生成的影片原子。在已经记录了影片原子之后,记录空闲空间原子和mdat首标,以便mdat首标的末尾匹配ECC的边界。
在QT文件中,在影片数据原子之后,物理地记录了影片原子和空闲空间原子。结果,生成QT文件。在QT文件中,已经记录的文件的开头在逻辑上是附图左侧的影片原子。文件的末尾在逻辑上是附图右侧的影片数据原子的末尾。
根据参照图16所述的生成常规QT文件的处理,基本上执行参照图17所述的生成AV多路复用格式的文件的处理。
画面记录设备1的图像传感器部件31捕获对象的图像,并且将所捕获图像的视频数据提供给视频编码部件15。视频编码部件15根据MPEG4制式对从图像传感器部件31输入的视频数据进行编码,并且将编码数据提供给文件生成部件22。另一方面,麦克风32将所采集的音频数据提供给音频编码部件16。音频编码部件16根据ITU-T G.711A律制式对从麦克风32输入的音频数据进行编码,并且将编码音频数据提供给文件生成部件22。
在步骤S1,文件生成部件22每次针对60帧的视频数据而交替多路复用从视频编码部件15提供的视频数据和从音频编码部件16提供的音频数据(在NTSC制式的情况下)。此后,文件生成部件22生成参照图11到图15所述的AV多路复用格式的文件主体部分。在步骤S2,文件生成部件22获得所生成的文件主体部分的视频数据的帧大小,并且将帧大小存储在内部存储器(未示出)中。此后,该流程前进到步骤S3。
在步骤S3,文件生成部件22将所生成的AV多路复用格式的文件主体部分提供给驱动器23,并且将其记录到存储部件20。此后,该流程前进到步骤S4。此时,文件生成部件22计算对其记录文件首标部分的ECC,并且根据算出的ECC而确定预定ECC的边界作为文件主体部分的记录开始点,并且将从记录开始点开始的文件主体部分记录到存储部件20。
在步骤S4,驱动器23将从文件生成部件22提供的文件主体部分记录到光盘2。此后,该流程前进到步骤S5。具体地说,驱动器23计算对其记录文件首标部分的ECC,根据算出的ECC而确定预定ECC的边界作为文件主体部分的记录开始点,并且将从该记录开始点开始的文件主体部分记录到光盘2。
在步骤S5,文件生成部件22执行生成文件脚注部分和文件首标部分的处理。此后,该流程前进到步骤S6。接下来,将参照图18所示的流程图来描述生成文件脚注部分和文件首标部分的处理。
在图17所示的步骤S3或S4记录文件主体部分所用的参数信息被记录在RAM 13中。该参数信息由标识NTSC或PAL的信息、记录音频数据所用的ECC数目、记录视频数据所用的ECC数目、记录主体部分的持续时间、所记录的帧数、表示第一帧的指针信息等组成。
在图18所示的步骤S21,文件生成部件22从RAM 13获得参数信息。此后,该流程前进到步骤S22。在步骤S22,文件生成部件22根据所获得的参数信息以及在图17所示的步骤S2记录的帧大小而设置内部参数。此后,该流程前进到步骤S23。这些内部参数例如由GOP的大小信息、诸如时间量程的时间信息等组成。
在步骤S23,文件生成部件22根据所设置的内部参数而生成文件脚注部分,并且将文件脚注部分写入到内部存储器。此后,该流程前进到步骤S24。在步骤S24到S26,文件生成部件22生成文件首标部分。
换句话说,在步骤S24,文件生成部件22根据所设置的内部参数而生成文件首标部分的MXF首标,并且将MXF首标写入到内部存储器。此后,该流程前进到步骤S25。在步骤S25,文件生成部件22根据所设置的内部参数而设置影片原子的每个轨道原子的样本表。此后,该流程前进到步骤S26。在步骤S26,文件生成部件22根据每个样本表的设置值而计算原子大小,生成影片原子,并且将其写入到内部存储器。此后,该流程返回到图17所示的步骤S6。
接下来,将具体地描述步骤S26的处理。文件生成部件22生成由图6所示的分级级别1的跳过原子和影片原子以及分级级别2的影片首标原子组成的QT首标,并且将QT首标写入到内部存储器。此后,文件生成部件22生成由分级级别2的轨道原子和分级级别3到分级级别8的原子组成的视频原子,并且将视频原子写入到内部存储器。此后,文件生成部件22生成由分级级别2的轨道原子和分级级别3到分级级别8的原子组成的音频原子,并且将音频原子写入到内部存储器。最后,文件生成部件22生成由分级级别2的用户定义原子和分级级别1的空闲空间原子(free)和mdat首标组成的QT尾部,并且将QT尾部写入到内部存储器。
如上所述,在步骤S24到S26,生成包含MXF首标和影片原子的文件首标部分。
在图17所示的步骤S6,文件生成部件22将在步骤S5生成的文件脚注部分提供给驱动器23,并且将文件脚注部分记录到存储部件20。此后,该流程前进到步骤S7。此时,文件生成部件22将文件脚注部分连接到在步骤S2记录在存储部件20中的文件主体部分的末尾,并且将所得到的数据记录到存储部件20。
在步骤S7,驱动器23将从文件生成部件22提供的文件脚注部分记录到光盘2。此后,该流程前进到步骤S8。具体地说,驱动器23将文件脚注部分连接到在步骤S3记录在光盘2上的文件主体部分的末尾,并且将所得到的数据记录到光盘2。
在步骤S8,文件生成部件22将在步骤S5生成的MXF首标和包含影片原子的文件首标部分提供给驱动器23,并且将它们记录到存储部件20。此后,该流程前进到步骤S9。此时,文件生成部件22将文件首标部分连接到记录在存储部件20中的文件主体部分的开头,并且将所得到的数据记录到存储部件20。结果,生成AV多路复用格式的文件。
在步骤S9,驱动器23将从文件生成部件22提供的MXF首标和包含影片原子的文件首标部分记录到光盘2。结果,完成了文件生成和记录处理。具体地说,驱动器23将文件首标部分连接到记录在光盘2上的主体部分的开头,并且将所得到的数据记录到光盘2。结果,将AV多路复用格式的文件记录在光盘2上。
以这种方式,生成AV多路复用格式的文件。CPU 11控制通信部件21通过网络5将在存储部件20中生成的AV多路复用格式的文件传送到编辑设备6和PC 7。这样,画面记录设备1可以与编辑设备6和PC 7交换AV多路复用格式的文件。
由于以这种方式将AV多路复用格式的文件记录在光盘2上,因此画面记录设备1可以通过光盘2与编辑设备3和PC 4交换AV多路复用格式的文件。
换句话说,画面记录设备1、基于MXF标准的编辑设备3和6、以及安装了QT软件的PC 4和7可以在它们之间相互交换AV多路复用格式的文件。
图19示出了AV多路复用格式的文件的另一个例子。在图19所示的例子中,AV多路复用格式由文件首标部分、文件主体部分以及文件脚注部分组成。文件首标部分由首标分区包(HPP)、影片原子(moov)和填充符(F)组成。文件脚注部分由脚注分区包(FPP)组成。
如上面序列所示,假定文件主体部分包括多个要素容器,例如由声音项目S1和画面项目P1组成的要素容器1、由声音项目S2和画面项目P2组成的要素容器2、由声音项目S3和画面项目P3组成的要素容器3、以及由声音项目S4和画面项目P4组成的要素容器4。
然而,MXF标准将要素容器的数目限于每个剪辑(clip)(编辑单元)一个。这样,当多个要素容器被置于文件主体部分中时,需要安排在每个声音项目前且在每个画面项目后的主体分区包(BPP)。每个主体分区包描述相对于文件开头的偏移值,以及前面主体分区包的偏移值。
这样,如下面序列所示,主体分区包被置于首标部分的填充符、画面项目P1的填充符(未示出)、画面项目P2的填充符(未示出)、画面项目P3的填充符(未示出)以及画面项目P4的填充符(未示出)当中的每一个中。首标部分的主体分区包描述从文件的开头到首标部分的主体分区包的偏移值。画面项目P1的主体分区包描述从文件的开头到画面项目P1的主体分区包的偏移值,以及前面主体分区包的偏移值(即,首标部分的主体分区包的偏移值)。
画面项目P2的主体分区包描述从文件的开头到画面项目P2的主体分区包的偏移值、以及前面主体分区包的偏移值(即,画面项目P1的主体分区包的偏移值)。画面项目P3的主体分区包描述从文件的开头到画面项目P3的主体分区包的偏移值、以及前面主体分区包的偏移值(即,画面项目P2的主体分区包的偏移值)。画面项目P4的主体分区包描述从文件的开头到画面项目P4的主体分区包的偏移值、以及前面主体分区包的偏移值(即,画面项目P3的主体分区包的偏移值)。
如上所述,当描述主体分区包本身的偏移值以及前面分区包的偏移值的主体分区包被置于每个要素容器中时,可以识别每个要素容器的范围。这样,在AV多路复用格式中,多个要素容器可以被置于文件主体部分中。
在前文中,影片原子被置于AV多路复用格式的文件首标部分中。在这种情况下,由于影片原子被置于文件的顶部,因此安装了QT软件的PC 4和7可以容易地读取影片原子的样本表。这样,PC 4和7可以有效地访问记录在影片原子中的视频数据和音频数据。然而,影片原子的样本表的长度随着记录持续时间而变化。
这样,当其长度变化的影片原子被置于AV多路复用格式的文件首标部分中时,虽然应当如参照图19所说明的那样在其中描述从文件的开头到每个主体分区包的偏移值,但是直到末尾才能确定偏移值。换句话说,在影片原子被置于文件首标部分中的AV多路复用格式中,多个要素容器不能被置于文件主体部分中。
为了解决这个问题,参照图20,将描述在AV多路复用格式的文件脚注部分的末尾安排影片原子的例子。
图20示出了AV多路复用格式的另一个例子。在图20所示的例子中,上面序列示出了被视作MXF文件的AV多路复用格式的文件的例子。下面序列示出被视作QT文件的AV多路复用格式的文件的例子。
在图20所示的例子中,如上面序列所示,当AV多路复用格式的文件被视作MXF文件时,AV多路复用格式的文件由文件首标部分、文件主体部分、文件脚注部分以及填充符组成。文件首标部分由8字节的插入部分以及MXF首标组成。文件主体部分由要素容器组成。如下面序列所示,当AV多路复用格式的文件被视作QT文件时,AV多路复用格式的文件由连续排列的mdat首标、影片数据原子(moviedata原子)以及影片原子(movie原子)组成,其中mdat首标是影片数据原子的首标。
换句话说,在图20所示的AV多路复用格式的文件中,在与MXF文件中被忽略的插入部分相对应的开头处描述QT的mdat首标。另外,由于在影片原子的块偏移原子中描述的块的偏移值被设为置于MXF的文件主体部分的要素容器中的AV数据,因此可以在影片原子中描述MXF首标。另外,在文件脚注部分后面的填充符中描述QT的影片原子。该填充符在MXF中被忽略。
在该结构中,基于MXF标准的编辑设备3和6忽略插入部分,找到11字节的模式,并且获得MXF首标。根据MXF首标的首标元数据,编辑设备3和6可以读取置于要素容器中的、作为AV数据的视频数据和音频数据。
另一方面,安装了QT软件的PC 4和7可以读取影片原子,并且根据在影片原子中描述的、用来使用记录在影片数据原子中的信息的信息,读取记录在MXF的文件主体部分中的块(音频数据或视频数据),其中文件主体部分之后为影片原子。
在图20所示的AV多路复用格式中,由于影片原子被置于MXF的文件脚注部分之后,因此即使影片原子的样本表的长度随着记录持续时间而变化,如参照图19所说明的那样要在其中描述的每个主体分区包相对于文件开头的偏移值不变化。这样,在其影片原子被置于文件脚注部分之后的AV多路复用格式中,多个要素容器可以被置于文件脚注部分中。
接下来,参照图21所示的流程图,将描述生成图20所示的AV多路复用格式的文件的处理。由于图21所示的步骤S61到S65的处理基本上相同于图17所示的步骤S1到S5的处理,因此为了防止冗余,将省略其描述。
在步骤S61,文件生成部件22每次针对60帧的视频数据而交替多路复用从视频编码部件15提供的视频数据和从音频编码部件16提供的音频数据(在NTSC制式的情况下),并且生成参照图20描述的AV多路复用格式的文件主体部分。另外,在步骤S62,文件生成部件22获得所生成的文件主体部分的视频数据的帧大小,并且将帧大小存储到内部存储器(未示出)。此后,该流程前进到步骤S63。
在步骤S63,文件生成部件22将所生成的AV多路复用格式的文件主体部分提供给驱动器23,并且将其记录到存储部件20。此后,该流程前进到步骤S64。在步骤S64,驱动器23将从文件生成部件22提供的文件主体部分记录到光盘2。此后,该流程前进到步骤S65。在步骤S65,文件生成部件22执行参照图18所述的用于文件脚注部分和文件首标部分的生成处理。此后,该流程前进到步骤S66。
在步骤S66,文件生成部件22将在步骤S65生成的文件脚注部分和影片原子提供给驱动器23,并且将它们记录到存储部件20。此后,该流程前进到步骤S67。此时,文件生成部件22将文件脚注部分和影片原子连接到在步骤S62记录于存储部件20中的文件主体部分的末尾,并且将所得到的数据记录到存储部件20。
在步骤S67,驱动器23将从文件生成部件22提供的文件脚注部分记录到光盘2。此后,该流程前进到步骤S68。具体地说,在步骤S63,驱动器23将文件脚注部分和影片原子连接到在步骤S63记录在光盘2上的主体部分的末尾,并且将所得到的数据记录到光盘2。
在步骤S68,文件生成部件22将包含在步骤S65生成的MXF首标的文件首标部分提供给驱动器23,并且将文件首标部分记录到存储部件20。此后,该流程前进到步骤S9。此时,文件生成部件22将首标部分连接到记录在存储部件20中的文件主体部分的开头,并且将所得到的数据记录到存储部件20。结果,生成AV多路复用格式的文件。
在步骤S69,驱动器23将从文件生成部件22提供的文件首标部分记录到光盘2。结果,完成了文件生成和记录处理。具体地说,驱动器23将文件首标部分连接到记录在光盘2上的文件主体的开头,并且将所得到的数据记录到光盘2。结果,将AV多路复用格式的文件记录在光盘2上。
以这种方式,生成图20所示的AV多路复用格式的文件。CPU 11控制通信部件21通过网络5将在存储部件20中生成的AV多路复用格式的文件传送到编辑设备6和PC 7。这样,画面记录设备1可以与编辑设备6、PC 7等交换图20所示的AV多路复用格式的文件。
另外,以前述方式,将AV多路复用格式的文件记录在光盘2上。这样,画面记录设备1可以通过光盘2与编辑设备3、PC 4等交换图20所示的AV多路复用格式的文件。
换句话说,基于MXF标准的编辑设备3和6、以及安装了QT软件的PC4和7可以在它们之间相互交换图20所示的AV多路复用格式的文件。
图22示出了根据本发明的AV网络系统的结构的另一个例子。在图22中,与图1所示的AV网络系统相对应的部件以对应的附图标记表示,并且将省略其描述以便防止冗余。
在图22所示的例子中,画面记录设备1具有安装了QT软件的PC 104。画面记录设备1被运送并且安装在报导场所处,以输入声音,捕获画面,并且记录它们。
画面记录设备1的图像传感器部件31捕获对象的图像,并且将所捕获图像的视频数据提供给视频编码部件15。视频编码部件15对从图像传感器部件31输入的视频数据进行编码,获得从广播站广播的高分辨率视频数据和用于通信和编辑的低分辨率视频数据,并且将这两种视频数据提供给文件生成部件22。另一方面,麦克风32将所采集的音频数据提供给音频编码部件16。音频编码部件16对从麦克风32输入的音频数据进行编码,获得从广播站广播的高质量音频数据和用于通信和编辑的低质量音频数据,并且将这两种音频数据提供给文件生成部件22。
文件生成部件22以从视频编码部件15提供的高分辨率和低分辨率视频数据、以及从音频编码部件16提供的高质量和低质量音频数据,生成AV多路复用格式的高质量和低质量文件,并且控制驱动器23将所生成的AV多路复用格式的文件记录到光盘2。编码的视频数据和音频数据在正被采集(捕获)时被记录到光盘2。相反,编码的视频数据和音频数据可以被临时记录到存储部件20。可以从存储部件20读取编码的视频数据和音频数据。此后,可以以编码的视频数据和音频数据生成AV多路复用格式的文件,并且将其记录到光盘2。
另外,在文件生成部件22正在将AV多路复用格式的文件提供给驱动器23时,文件生成部件22以从视频编码部件15提供的低分辨率视频数据和从音频编码部件16提供的低分辨率音频数据,生成AV多路复用格式的低质量文件,并且将所生成的文件临时存储到存储部件20。CPU 11控制通信部件21通过通信卫星101将记录在存储部件20中的AV多路复用格式的低质量文件传送到广播站102。
广播站102具有编辑设备103。广播站102从画面记录设备1接收AV多路复用格式的低质量文件,并且将所接收的AV多路复用格式的低质量文件提供给编辑设备103。
如同图1所示的编辑设备3和6一样,编辑设备103是基于MXF标准的设备。编辑设备103识别从广播站102接收的AV多路复用格式的低质量文件。另外,编辑设备103编辑低质量AV多路复用格式的音频数据和视频数据,使得它们的持续时间匹配于预定的广播持续时间,执行改变场景的画面处理,并且执行创建与脚本等相关联的文本数据的编辑操作。编辑设备103通过通信卫星101将编辑后的低质量AV多路复用格式的音频数据和视频数据的内容作为编辑列表等传送到画面记录设备1。
替换地,画面记录设备1可以将低质量AV多路复用格式的文件传送到PC 104,其中PC 104位于编辑设备的附近,并且允许制作者等在正在检查记录状态时编辑文件。
PC 104具有与图1所示的PC 4和PC 7相同的结构。这样,PC 104安装了QT软件。结果,PC 104可以根据QT检查和编辑从画面记录设备1传送的AV多路复用格式的低分辨率文件。PC 104通过通信卫星101或短距离无线通信,如蓝牙(注册商标),将编辑后的AV多路复用格式的低质量音频数据和视频数据的内容作为编辑列表传送到画面记录设备1。换句话说,即使在报导场所处没有昂贵的专用编辑设备103,作为通用和便携式设备的PC 104可以检查和编辑AV多路复用格式的低分辨率文件。
画面记录设备1的通信部件21从编辑设备103或PC 104接收编辑列表。CPU 11控制驱动器23将从通信部件21提供的编辑列表记录到光盘2。此时,将编辑列表记录到例如文件首标部分的首标元数据。在AV多路复用格式的高质量和低质量文件以及编辑列表已被记录到光盘2之后,将它运送到广播站102。
在广播站102中,编辑设备103从光盘2读取高分辨率视频数据和高质量音频数据,对它们进行解码,并且根据记录在光盘2上的编辑列表而广播(空中)解码数据。
在前述例子中,AV多路复用格式的低质量文件和高质量文件被记录在光盘2上。替换地,一个文件(例如,AV多路复用格式的高质量文件)可以被记录在光盘2上,而另一个文件(例如,AV多路复用格式的低质量文件)可以被记录到另一个记录介质,例如具有半导体存储器的存储卡。
在前述例子中,广播站102具有编辑设备103。替换地,广播站102可以具有PC 104而非编辑设备103。在报导场所处,可以使用编辑设备103而非PC 104。
接下来,参照图23所示的流程图,将描述图22所示的AV网络系统的处理。在图23中,将描述画面记录设备1和PC 104的处理。AV网络系统的处理可以由PC 104而非编辑设备103执行。
画面记录设备1的图像传感器部件31捕获对象的图像,并且将所捕获图像的视频数据提供给视频编码部件15。视频编码部件15对从图像传感器部件31输入的视频数据进行编码,获得高分辨率和低分辨率的编码视频数据,并且将这两种编码的视频数据提供给文件生成部件22。另一方面,麦克风32将所采集的音频数据提供给音频编码部件16。音频编码部件16对从麦克风32输入的音频数据进行编码,获得高质量和低质量的编码音频数据,并且将这两种所获得的编码数据提供给文件生成部件22。
在步骤S101,画面记录设备1的文件生成部件22以视频数据和音频数据,生成AV多路复用格式,并且控制驱动器23将该AV多路复用格式记录到光盘2。另外,文件生成部件22控制驱动器23将所生成的AV多路复用格式记录到存储部件20。此后,该流程前进到步骤S102。
具体地说,文件生成部件22以从视频编码部件15提供的高和低分辨率视频数据、以及从音频编码部件16提供的高质量和低质量音频数据,生成AV多路复用格式的高质量文件和低质量文件,并且控制驱动器23将所生成的AV多路复用格式的文件记录到光盘2。另外,文件生成部件22以从视频编码部件15提供的低分辨率视频数据以及从音频编码部件16提供的低分辨率音频数据,生成AV多路复用格式的低质量文件,并且将AV多路复用格式的低质量文件临时存储到存储部件20。
在步骤S102,画面记录设备1的CPU 11控制通信部件21通过例如短距离无线通信而将记录在存储部件20中的AV多路复用格式的低质量文件传送到PC 104。
另一方面,在步骤S121,PC 104接收AV多路复用格式的低质量文件,并且根据QT编辑AV多路复用格式的低质量音频数据和视频数据。此后,该流程前进到步骤S122。在步骤S122,PC 104通过短距离无线通信而将编辑后的AV多路复用格式的低质量音频数据和视频数据的内容作为编辑列表传送到画面记录设备1。
在步骤S103,画面记录设备1的通信部件21从PC 104接收编辑列表。此后,该流程前进到步骤S104。在步骤S104,PC 104将所接收的编辑列表记录到光盘2。
光盘2被运送到广播站102。在广播站102中,从光盘2读取高分辨率视频数据和高质量音频数据。对高分辨率视频数据和高质量音频数据进行解码。根据记录在光盘2上的编辑列表来广播解码的数据。
如上所述,由于使用AV多路复用格式,因此在报导场所处,即使作为通用和便携式设备的PC 104也可以检查和编辑AV多路复用格式的文件,而无需使用作为昂贵和专用设备的编辑设备103。另外,当使用AV多路复用格式的低质量文件时,可以减轻通信和编辑的负载。
这样,可以缩短在记录数据之后直到广播它们的时间。另外,由于可以使用PC 104,因此可以降低记录数据所需的成本。
根据本发明的本实施例,画面记录设备1从和向光盘2读取和写入AV多路复用格式的文件。替换地,可以从和向诸如磁带的带状记录介质、半导体存储器等读取和写入AV多路复用格式的文件。
可以通过硬件执行前述处理。替换地,可以通过软件执行它们。当通过软件执行它们时,将组成软件的程序从程序存储介质安装到装备有专用硬件的计算机或者可以执行各种功能的通用个人计算机。
存储了被安装到计算机中从而执行的程序的程序存储介质由例如为图2所示的光盘2的封装介质、或者临时或永久存储程序的存储部件20组成。
在本说明书中,描述记录在记录介质上的程序的步骤包括按照时间先后顺序且以所述次序执行的处理、以及不按照时间先后顺序而是并行或独立地执行的处理。
在本说明书中,系统表示由多个设备组成的整个设备。
如上所述,根据本发明,可以在广播设备和个人计算机之间交换文件。

Claims (10)

1.一种信息处理设备,生成由首标部分、主体部分和脚注部分组成的素材交换格式的文件,包括:
主体生成装置,用于利用输入数据生成主体部分;
获得装置,用于获得输入数据的大小;
表生成装置,用于根据由获得装置获得的大小,生成表信息,利用该表信息,作为QT格式的文件从主体部分读取输入数据;
首标生成装置,用于生成首标部分,对于素材交换格式,该首标部分包括第一被忽略区域,素材交换格式首标和第二被忽略部分,其中在素材交换格式的第一被忽略区域中描述QT格式的跳过区域的首标,在QT格式的跳过区域中描述所述素材交换格式首标,并且在素材交换格式的所述第二被忽略部分描述由表生成装置生成的表信息以及QT格式的数据区域的首标,其中主体部分包含在数据区域中;
脚注生成装置,用于生成脚注部分;以及
文件生成装置,用于将脚注部分连接到主体部分的末尾,并且将由首标生成装置生成的首标部分连接到主体部分的开头,以生成文件。
2.如权利要求1所述的信息处理设备,其中输入数据是比主体部分的数据具有更高分辨率的数据。
3.如权利要求1所述的信息处理设备,还包括:
主体记录装置,用于将由主体生成装置生成的主体部分记录到记录介质;
脚注记录装置,用于在由主体记录装置记录在记录介质上的主体部分之后记录脚注部分;以及
首标记录装置,用于在由主体记录装置记录在记录介质上的主体部分之前记录首标部分。
4.如权利要求1所述的信息处理设备,还包括:
传送装置,用于通过网络将由文件生成装置生成的文件传送到另一个信息处理设备;
接收装置,用于通过网络从该另一信息处理设备接收元数据,所述元数据基于由所述传送装置传送的文件;以及
元数据记录装置,用于将由接收装置接收的元数据记录到记录介质。
5.一种信息处理方法,生成由首标部分、主体部分和脚注部分组成的素材交换格式的文件,包括以下步骤:
利用输入数据生成主体部分;
获得输入数据的大小;
根据通过获得步骤的处理而获得的大小,生成表信息,利用该表信息,作为QT格式的文件从主体部分读取输入数据;
生成首标部分,对于素材交换格式,该首标部分包括第一被忽略区域,素材交换格式首标和第二被忽略部分,其中在素材交换格式的所述第一被忽略区域中描述QT格式的跳过区域的首标,在QT格式的跳过区域中描述所述素材交换格式首标,并且在素材交换格式的所述第二被忽略部分描述由表生成装置生成的表信息以及QT格式的数据区域的首标,其中主体部分包含在数据区域中;
生成脚注部分;以及
将脚注部分连接到主体部分的末尾,并且将通过首标生成步骤的处理而生成的首标部分连接到主体部分的开头,以生成文件。
6.一种信息处理设备,生成由首标部分、主体部分和脚注部分组成的素材交换格式的文件,包括:
主体生成装置,用于利用输入数据生成主体部分;
获得装置,用于获得输入数据的大小;
表生成装置,用于根据由获得装置获得的大小,生成表信息,利用该表信息,作为QT格式的文件从主体部分读取输入数据;
首标生成装置,用于在素材交换格式中被忽略的首标部分的开始区域中描述QT格式的数据区域的首标,其中主体部分包含在数据区域中,并且在数据区域的开始区域中描述素材交换格式的主体部分的首标,以生成首标部分;
脚注生成装置,用于生成脚注部分;以及
文件生成装置,用于将脚注部分和由表生成装置生成的表信息连接到主体部分的末尾,并且将首标部分连接到主体部分的开头,以生成文件。
7.如权利要求6所述的信息处理设备,其中输入数据是比主体部分的数据具有更高分辨率的数据。
8.如权利要求6所述的信息处理设备,还包括:
主体记录装置,用于将由主体生成装置生成的主体部分记录到记录介质;
脚注记录装置,用于在由主体记录装置记录在记录介质上的主体部分之后记录脚注部分和表信息;以及
首标记录装置,用于在由主体记录装置记录在记录介质上的主体部分之前记录首标部分。
9.如权利要求6所述的信息处理设备,还包括:
传送装置,用于通过网络将由文件生成装置生成的文件传送到另一个信息处理设备;
接收装置,用于通过网络从该另一个信息处理设备接收元数据,所述元数据基于由所述传送装置传送的文件;以及
元数据记录装置,用于将由接收装置接收的元数据记录到记录介质。
10.一种信息处理方法,生成由首标部分、主体部分和脚注部分组成的素材交换格式的文件,包括以下步骤:
利用输入数据生成主体部分;
获得输入数据的大小;
根据通过获得步骤的处理而获得的大小,生成表信息,利用该表信息,作为QT格式的文件从主体部分读取输入数据;
在素材交换格式中被忽略的首标部分的开始区域中描述QT格式的数据区域的首标,其中主体部分包含在数据区域中,并且在数据区域的开始区域中描述素材交换格式的主体部分的首标,以生成首标部分;
生成脚注部分;以及
将脚注部分和通过表生成步骤的处理而生成的表信息连接到主体部分的末尾,并且将首标部分连接到主体部分的开头,以生成文件。
CNB2004800192129A 2003-05-12 2004-05-12 信息处理设备和方法 Expired - Fee Related CN100563319C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003132504A JP3969656B2 (ja) 2003-05-12 2003-05-12 情報処理装置および方法、プログラム記録媒体、並びにプログラム
JP132504/2003 2003-05-12

Publications (2)

Publication Number Publication Date
CN1817035A CN1817035A (zh) 2006-08-09
CN100563319C true CN100563319C (zh) 2009-11-25

Family

ID=33432166

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800192129A Expired - Fee Related CN100563319C (zh) 2003-05-12 2004-05-12 信息处理设备和方法

Country Status (4)

Country Link
US (1) US20070067468A1 (zh)
JP (1) JP3969656B2 (zh)
CN (1) CN100563319C (zh)
WO (1) WO2004100543A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109561345A (zh) * 2018-12-14 2019-04-02 上海文广科技(集团)有限公司 基于avs+编码格式的数字电影打包方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4391317B2 (ja) 2003-06-10 2009-12-24 ソニー株式会社 放送受信装置、放送受信システム及び放送受信システムにおける操作信号の選択方法
JP4228288B2 (ja) * 2003-06-11 2009-02-25 ソニー株式会社 記録制御装置および方法、プログラム、並びにデータ記録方法
JP3891295B2 (ja) * 2003-07-09 2007-03-14 ソニー株式会社 情報処理装置および方法、プログラム記録媒体、並びにプログラム
JP4251133B2 (ja) 2004-11-29 2009-04-08 ソニー株式会社 画像圧縮装置及び方法
US20080205860A1 (en) * 2005-02-18 2008-08-28 Koninklijke Philips Electronics, N.V. Method Of Live Submitting A Digital Signal
JP4270161B2 (ja) 2005-04-15 2009-05-27 ソニー株式会社 情報記録再生システム、情報記録再生装置及び情報記録再生方法
JP4251149B2 (ja) 2005-04-15 2009-04-08 ソニー株式会社 情報管理システム、情報管理装置及び情報管理方法
JP4172500B2 (ja) * 2006-05-30 2008-10-29 ソニー株式会社 記録装置および方法、プログラム、並びに記録媒体
KR20090017170A (ko) * 2007-08-14 2009-02-18 삼성전자주식회사 미디어 파일 관리 방법 및 장치
JP4679609B2 (ja) * 2008-06-05 2011-04-27 株式会社東芝 映像収録再生装置、映像収録方法及び映像再生方法
JP4686587B2 (ja) * 2008-10-16 2011-05-25 株式会社東芝 映像記録再生装置およびファイル管理方法
JP5259780B2 (ja) * 2010-09-14 2013-08-07 株式会社東芝 映像ファイル作成装置および映像ファイル作成方法
WO2012108919A2 (en) * 2011-02-11 2012-08-16 Intel Corporation Media stream over pass through mechanism
US8688733B2 (en) 2012-03-16 2014-04-01 International Business Machines Corporation Remote inventory manager
US11159327B2 (en) * 2018-08-06 2021-10-26 Tyson York Winarski Blockchain augmentation of a material exchange format MXF file

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7339993B1 (en) * 1999-10-01 2008-03-04 Vidiator Enterprises Inc. Methods for transforming streaming video data
CA2375688A1 (en) * 2000-04-05 2001-10-11 Sony United Kingdom Limited Identifying and processing of audio and/or video material
JP4240757B2 (ja) * 2000-04-10 2009-03-18 ソニー株式会社 プロダクションシステム及びその制御方法
GB2366926A (en) * 2000-09-06 2002-03-20 Sony Uk Ltd Combining material and data
JP4608835B2 (ja) * 2001-09-13 2011-01-12 ソニー株式会社 情報配信システムおよび情報配信方法
FI20011871A (fi) * 2001-09-24 2003-03-25 Nokia Corp Multimediadatan prosessointi
US7149750B2 (en) * 2001-12-19 2006-12-12 International Business Machines Corporation Method, system and program product for extracting essence from a multimedia file received in a first format, creating a metadata file in a second file format and using a unique identifier assigned to the essence to access the essence and metadata file
CN1643605B (zh) * 2002-03-18 2011-05-04 夏普株式会社 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
US8063295B2 (en) * 2002-10-03 2011-11-22 Polyphonic Human Media Interface, S.L. Method and system for video and film recommendation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109561345A (zh) * 2018-12-14 2019-04-02 上海文广科技(集团)有限公司 基于avs+编码格式的数字电影打包方法
CN109561345B (zh) * 2018-12-14 2021-08-03 上海文广科技(集团)有限公司 基于avs+编码格式的数字电影打包方法

Also Published As

Publication number Publication date
JP2004336593A (ja) 2004-11-25
CN1817035A (zh) 2006-08-09
JP3969656B2 (ja) 2007-09-05
WO2004100543A1 (ja) 2004-11-18
US20070067468A1 (en) 2007-03-22

Similar Documents

Publication Publication Date Title
CN100563319C (zh) 信息处理设备和方法
EP2213093B1 (en) Method of recording three-dimensional image data
US8811802B2 (en) Insertion and usage of metadata in digital video
US7062758B2 (en) File conversion method, file converting device, and file generating device
US10356379B2 (en) Image storage apparatus, image reproducing apparatus, method of storing image, method of reproducing an image, recording medium and photographing apparatus
US20050025460A1 (en) Information-processing apparatus, information-processing method, program-recording medium, and program
US8666222B2 (en) Video encoding
CN101142824A (zh) 使用相机参数编码和产生多视点视频的设备和方法以及存储实施该方法的程序的记录介质
US20100169390A1 (en) File transfer method and terminal adapted thereto
JP2007012112A (ja) データ記録装置及びその方法、プログラム、記録媒体
CN104488262A (zh) 文件生成设备、文件生成方法、文件再现设备和文件再现方法
CN103402107A (zh) 记录再现装置和变换装置
CN114007112B (zh) 一种针对MP4视频文件中mdat box数据错误的修复方法
CN100488244C (zh) 图像处理设备、图像拍摄设备以及图像处理方法
CN100542242C (zh) 收发系统、信息处理装置及信息处理方法
JP4719506B2 (ja) 端末装置、コンテンツ再生方法、及びコンピュータプログラム
CN105612756B (zh) 数据处理装置、数据处理方法和计算机可读取的记录介质
KR101051063B1 (ko) 영상 수록 재생 장치, 영상 수록 방법, 영상 재생 방법 및 영상 수록 재생 방법
KR101295377B1 (ko) 파일 포맷을 구성하는 방법과 상기 파일 포맷을 가지는파일을 포함한 방송 신호를 처리하는 장치 및 방법
JP2008199387A (ja) 動画部分配信システム
JP2008060622A (ja) 映像編集システム、映像処理装置、映像編集装置、映像処理方法、映像編集方法、プログラムおよびデータ構造
KR100959534B1 (ko) Maf 파일 포맷을 구성하는 방법 및 이를 이용한 비디오 신호의 디코딩 장치
KR101995270B1 (ko) 비디오 데이터를 재생하는 방법 및 장치
KR20090009833A (ko) 스케일링 가능한 데이터 스트림에 대한 데이터 블록 생성 방법 및 장치
Wilkinson Packetised stream formats for the SDTI

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091125

Termination date: 20100512