CN1417789A - 文件编制方法和数据再现方法 - Google Patents
文件编制方法和数据再现方法 Download PDFInfo
- Publication number
- CN1417789A CN1417789A CN02146968A CN02146968A CN1417789A CN 1417789 A CN1417789 A CN 1417789A CN 02146968 A CN02146968 A CN 02146968A CN 02146968 A CN02146968 A CN 02146968A CN 1417789 A CN1417789 A CN 1417789A
- Authority
- CN
- China
- Prior art keywords
- mentioned
- access unit
- file
- unit data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Time-Division Multiplex Systems (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本发明的文件编制方法和数据再现方法,其中,文件制作装置(201)具有:数据输入部(202),用于输入来自外部的声音数据,输出数字声音数据;编码部(203),其按照全部存取单元的大小均为相同的字节单位的方法来把编码取样集中在一起,制成一个存取单元,并输出到文件输出部(205)内;格式制作部(204),其取得来自编码部(203)的格式信息,制作MP4文件的标题信息,输出到文件输出部(205)内;以及文件输出部(205),其对从编码部203取得的存取单元进行多重化,制作存取单元队列,与从格式制作部(204)取得的标题信息相组合,输出MP4文件。
Description
技术领域
本发明涉及采用G.726等声音编码方式的数据的文件制作方法和数据再现方法。
背景技术
过去,作为通信用编码方式,G.726和G.727等声音编码方式和H.261等动态图像编码方式,已由ITU-T(InternationalTelecommunication Union-Telecommunication Standardization Sector)进行了标准化。利用这种通信用编码方式进行编码的声音数据和动态图像数据,其使用方式像电话通信那样,直接通过通信线路进行传输,一旦把数据作为文件保存,然后,从文件中对声音编码数据进行解码、再现,这种使用方式也有设想。
在本说明书中,利用G.726作为该通信编码方式的一例,进行说明如下。该G.726是一种声音编码方式,它利用编码率为16千位/秒,24千位/秒,32千位/秒,40千位/秒这4种,在一秒内对8000个声音取样进行编码,对每个声音取样,根据各自的编码率依次分配2位、3位、4位、5位的位数。而且,以下把利用G.726编码的声音取样称为G.726取样。
并且,作为文件格式的国际标准方式,已有ISO/IECJTC1/SC29/WG11 MPEG标准化的MP4文件格式。对该MP4文件格式中的数据进行解码处理时的单位称为存取单元,一个存取单元,像MPEG4AAC(Moving Picture Experts Group Phase 4 Advanced AudioCoding)等那样,在采用把多个声音取样集中起来一齐进行编码的帧(frame)结构的编码方式中相当于1帧;像G.726等那样,在不采用帧结构的编码方式的情况下,一个G.726取样相当于一个存取单元。
在此,对过去的文件制作方法加以说明。
首先,按G.726的编码率对数字声音数据进行编码,制成G.726取样,从一个G.726取样制成一个存取单元。这时,在制作MP4文件时,必须按字节单位,即8位的整数倍单位来记录一个存取单元。所以,如上所述,G.726的任一编码率也都是一个G.726取样为2~5位,不能成为8位的整数倍,所以,根据G.726的编码率,增加6~3位的填充数据,使1个存取单元变成8位的整数倍,制成一个存取单元。
然后,若结束上述编码,制成最后的存取单元,则把所有的存取单元进行重叠(多重化),作为存取单元队列,与MP4文件的标题信息相组合,制成MP4文件。
图1表示利用上述过去的文件制作方法制作的MP4文件的结构。如该图所示,MP4文件100由电影逻辑框101和电影数据逻辑框102构成,上述MP4文件的标题信息存放在电影逻辑框101内,上述存取单元队列存放在电影数据逻辑框102内。
电影逻辑框(ボックス)101由存放逻辑框的标题信息的逻辑框标题部103和子逻辑框队列104构成,该子逻辑框队列由存放MP4文件100的格式信息的逻辑框群构成。在此把上述逻辑框标题信息和上述格式信息的组合体称为MP4文件标题信息。
逻辑框标题部103包含在所有的逻辑框内,是存放各逻辑框标题信息的逻辑框,逻辑框标题信息记录在逻辑框大小106、逻辑框型号107等内。
在逻辑框大小106内存放用字节单位表示逻辑框大小的信息,例如,若电影逻辑框101的大小为10KB(千字节),则逻辑框大小106内存放10K信息。
在逻辑框型号107内存放用4个字符的代码来表示逻辑框的种类的信息。例如,在表示电影逻辑框101的种类的情况下,在逻辑框型号107内存放“moov”代码信息,并且,在表示电影数据逻辑框102的种类的情况下,存放“mdat”代码信息。
并且,上述子逻辑框队列104由取样大小逻辑框109,填充位逻辑框110和取样描述逻辑框111等构成。
取样大小逻辑框109是存放存取单元的大小和数量的信息的逻辑框,它由逻辑框标题部103、全取样大小112、取样计数113和取样大小队列114构成。
全取样大小112,在所有的存取单元的大小都是同样的情况下,记录该存取单元的大小。在此情况下,不制作取样大小队列114,并且,在取样计数113中,记录存取单元的总数,在取样大小队列114中即使只有一个大小不同的存取单元的情况下,也记录所有的存取单元的大小。而且,在此情况下,所有取样大小112都设定为零。
填充位逻辑框110是存放填充数据的位信息的逻辑框,该填充数据包括在所有的存取单元内,用于使1个存取单元变成8位的整数倍,该填充位逻辑框110由逻辑框标题部103、取样计数115和填充位队列116构成。
在取样计数115中,与上述取样计数113一样,记录存取单元的总数,在填充位队列116中存放表示包括在存取单元内的填充位的信息,对每个存取单元分别记录填充数据的位信息。
取样描述逻辑框111是存放G.726和G.727等编码方式各不相同的信息的逻辑框,存放编码率等信息。
再者,电影数据逻辑框102由逻辑框标题部103和存取单元队列105构成,存取单元队列105是由存取单元105a进行重叠而构成。并且,一个存取单元105a由G.726取样105b和填充数据105c而制成(参见ISO/IEC JCT1/SC29/WG11 MPEG2001年7月20日发行ISO/IEC14496-1“LSO Media File format specification”)
图2说明利用过去的文件制作方法,使按照G.726的编码率24千位/秒进行编码的G.726取样实现文件化时的文件大小。
MP4文件100如上所述,由电影逻辑框101和电影数据逻辑框102构成,对电影逻辑框101的大小和电影数据逻辑框102的大小进行合计而求出MP4文件100的文件大小。
在此,为了简化说明,根据把16声音取样编码成G.726取样时的文件大小,说明持续60秒编码后的文件大小。并且,对于上述电影逻辑框101内的构成子逻辑框队列104的逻辑框,仅利用取样大小逻辑框109和填充位逻辑框110来进行说明。而且,电影逻辑框101的逻辑框大小,随着取样大小逻辑框109和填充位逻辑框110以外的逻辑框的大小而变化,所以设定为“××××”。
如图所示,取样大小逻辑框109,对逻辑框大小信息等各个项目分别各用4个字节进行记录,合计共20个字节的大小。而且,表示取样大小逻辑框109的种类的4个字符的代码为“stsz”。
再者,填充位逻辑框110,对逻辑框(逻辑单元)大小信息等各个项目分别各用4个字节,也就是说用共16个字节进行记录,并且,附加在G.726取样上的填充数据的位数,对每个存取单元分别进行记录。在此,因为是G.726的编码率24千位/秒,所以,填充数据的位数是5,表示该填充数据的位数为5的信息,对每个存取单元各用4位,也就是说对16个存取单元用64位来进行记录。
所以,填充位逻辑框110,对记录逻辑框大小信息等各个项目的16个字节,加上记录表示上述填充数据位数为5的信息的64位,即8个字节,合计为24个字节的大小。而且,表示填充位逻辑框110的种类的4个字符的代码为“padb”。
另一方面,电影数据逻辑框102,对逻辑框大小信息和逻辑框型号信息各用4个字节,即共用8个字节进行记录。表示该电影数据逻辑框102的种类的4个字符的代码为“mdat”。并且,在记录存取单元时,必须以一个存取单元为字节单位。也就是说,按照编码率24千位/秒把5位的填充数据附加到3位的G.726取样上,所以,在把16声音取样编码成G.726取样的情况下,制成16个存取单元,必须是16个字节的大小。所以,电影数据逻辑框102,对记录上述逻辑框大小信息等的各个项目的8个字节再加上记录16个存取单元的16个字节,共计是24个字节。
再者,在60秒后,480,000声音取样被编码成G.726取样,电影数据逻辑框102的大小变成480,000字节,取样大小逻辑框109的大小变成20个字节,填充位逻辑框110的大小变成240,016字节。
这样,利用过去的文件制作方法,把采用G.726的编码声音数据制作成上述结构的文件,附加上声音数据文件进行发送的带有声音的邮件、或者声音数据文件,放置在网络服务器上,用于下载、保存、再现的互联网分配等。
但是,在利用上述文件制作方法,像G.726那样,把非8位的整数倍的G.726取样作为一个存取单元的情况下,必须在G.726取样上附加填充数据,把一个存取单元制成8位的整数倍,另外,也还需要存放上述填充数据的位信息的填充位逻辑框,所以,出现的问题是:制成的文件的冗余性增强。
并且,存取单元的大小即使只有一个不同,也必须把所在的存取单元的大小都记录在取样大小逻辑框内,因此,出现的问题是:制作的文件的冗余性更加增强。
其结果,又出现的问题是:记录媒体中记录文件的存储区、以及互联网分配时下载所需的时间都将增加,进一步造成通信费用增加。
发明的内容
因此,本发明,鉴于上述问题,其第1目的在于提供一种不增加文件的冗余性,能减小文件大小,减小记录文件所需的存储区,减少文件下载所需的时间的MP4文件制作方法。
再者,本发明的第2目的在于提供一种能从用上述文件制作方法制作的MP4文件中读出、再现数据的数据再现方法。
为达到上述第1目的,本发明是从包括多个编码取样在内的数字编码数据中制作文件的方法,其特征在于包括以下步骤:
存取单元数据制作步,其通过按一定数量对上述多个编码取样进行集中,而生成同样大小的多个存取单元数据;以及
文件输出步,其对在上述存取单元制作步生成的存取单元数据进行重叠,作为文件进行输出。
再者,为达到上述第2目的,本发明作为数据再现方法,按一定数量对多个编码取样进行集中,制成全部存取单元数据的大小均相同的文件,对包含在上述存取单元数据中的上述编码取样进行解码、再现,
该数据再现方法,其特征在于具有以下步骤:
存取单元解析步,其对包含在上述存取单元数据中的上述一定数量加以规定;以及
解码步,其根据上述存取单元解码步的解析结果,对包含在上述存取单元数据中的上述一定数量的上述编码取样进行解码。
这样一来,对多个编码取样进行集中,制成字节为单位,全部存取单元的大小均一样的文件,所以,不需要填充数据的附加和填充数据的位信息,并且能使取样大小逻辑框减到最小,能减小文件大小。
并且,对包含在存取单元内的编码取样数进行解析,进行编码,所以,能读出、正确地解码和再现用上述文件制作方法制作的文件。
附图的简要说明
图1是利用过去的文件制作方法制作的MP4文件的结构图。
图2是利用过去的文件制作方法制作的MP4文件大小说明图。
图3是涉及本发明第1实施方式的文件制作装置的结构方框图。
图4a是利用涉及本发明第1实施方式的文件制作装置进行处理的模式图,该处理是根据按编码率16千位/秒进行编码的G.726取样来制作存取单元。
图4b是利用涉及本发明第1实施方式的文件制作装置进行处理的模式图,该处理是根据按编码率24千位/秒进行编码的G.726取样来制作存取单元。
图4c是利用涉及本发明第1实施方式的文件制作装置进行处理的模式图,该处理是根据按编码率32千位/秒进行编码的G.726取样来制作存取单元。
图4d是利用涉及本发明第1实施方式的文件制作装置进行处理的模式图,该处理是根据按编码率40千位/秒进行编码的G.726取样来制作存取单元。
图5是利用涉及本发明第1实施方式的文件制作装置根据G.726取样来制作存取单元的处理流程图。
图6是利用涉及本发明第1实施方式的文件制作方法制作的MP4文件的结构图。
图7是利用涉及本发明第1实施方式的文件制作方法制作的MP4文件的文件大小说明图。
图8是涉及本发明第2实施方式的数据再现装置的结构方框图。
图9是涉及本发明第2实施方式的数据再现装置的数据解码处理的一部分的流程图。
图10是涉及本发明第1实施方式的文件制作装置和涉及第2实施方式的数据再现装置的使用例图。
发明的具体实施方式
以及参照附图,详细说明本发明的实施方式。
[第1实施方式]
图3是涉及本发明第1实施方式的文件制作装置的结构方框图。
该文件制作装置201是接受声音数据的输入,进行编码,输出MP4文件,写入到存储装置206内的计算机等,其中具有:数据输入部202、编码部203、格式制作部204和文件输出部205。
数据输入部202是接受声音数据输入的处理部,是接受模拟声音数据输入的话筒等和数字声音数据输入的接口等。这里,数据输入部202在接受模拟声音数据输入的情况下,对该模拟声音数据进行取样和量子化,将其变换成数字声音数据。
编码部203是根据从G.726的4种编码率中选出的编码率,对数字声音数据进行编码,制成G.726取样的处理部,其中具有CPU和存储器。并且,该编码部203根据上述编码率,把多个G.726取样集中在一起制成一个存取单元,使存取单元成为8位的整数倍,输出到文件输出部205内。再者,该编码部203把在从G.726取样制成一个存取单元时的格式信息输出到格式制作部204内。
这里,所谓格式信息,是指存取单元的合计数、1个存取单元的大小、1个存取单元内包含的G.726取样数、最后的存取单元内包含的有效取样数和位率等。
格式制作部204是根据上述格式信息来制作MP4文件的标题信息的处理部,其中具有CPU和存储器。并且该格式制作部204进行把上述制成的标题信息输出到文件输出部205内的处理。
文件输出部205是一种处理部,它把上述存取单元重叠起来,制成存取单元队列,把该存取单元队列和上述标题信息组合在一起,制成MP4文件。其中具有CPU和存储器。并且,该文件输出部205进行输出已制作的MP4文件,存储到存储装置206内的处理。
存储装置206是硬盘、CD-R、SD存储卡等记录媒体,用于存储用上述文件制作装置制作的MP4文件。
以下说明采用上述结构的文件制作装置的MP4文件的文件制作方法。
图4(a)是上述文件制作装置201进行制作处理的模式图,这是把按照编码率16位/秒进行编码的G.726取样制作成存取单元。
如图所示,编码部203把8个2位的G.726取样302集合起来,制成16位,即2个字节的存取单元301,并输出到文件输出部205内。这样,编码部203连续进行以下动作;把每8个2位的G.726取样302集合起来制成一个存取单元,把制成的存取单元输出到文件输出部205内。
这里,从文件输入部202输入的数字声音数据的总取样数不是8的倍数的情况下,最后的存取单元303包含1~7个G.726取样302。这时,编码部203进行大小调整,使存取单元的大小成为2个字节。
例如,如图所示,在剩余了5个G.726取样302的情况下,5×2位=10位,为了把存取单元的大小制成2个字节,尚缺少6位,所以,由编码部203附加6位的填充数据305,把最后的存取单元303的大小调整到2个字节。
并且,编码部203在进行这样的大小调整之后,把该最后的存取单元303输出到文件输出部205内。
再者,编码部203若结束最后的存取单元303的制作,则把表示全部存取单元的数量、以及最后的存取单元303内所包含的有效取样304为5个G.726取样等的格式信息输出到格式制作部204内。
图4(b)是上述文件制作装置201进行制作处理的模式图,这是把按照编码率24位/秒进行编码的G.726取样制作成存取单元。
如图所示,编码部203连续进行以下动作:把8个3位的G.726取样302集合起来,制成24位、即3个字节的存取单元301,再把每8个3位的G.726取样302集合起来,制成1个存取单元,把制成的存取单元输出到文件输出部205内。
这里,在从数据输入部202输入的声音数据的总取样数不是8的倍数的情况下最后存取单元303包含1~7个G.726取样302,和上述情况一样,由编码部203进行大小调整,使存取单元的大小变成3个字节。
图4(c)是文件制作装置201进行制作处理的模式图,这是把按照编码率32千位/秒进行编码的G.726取样制成存取单元。
如图所示,编码部203连续进行以下动作:把4个4位的G.726取样302集合起来,制成16位、即2个字节的存取单元301,再把每4个4位的G.726取样302集合起来,制成1个存取单元,把制成的存取单元输出到文件输出部205内。
这里,在从数据输入部202输入的声音数据的总取样数不是4的倍数的情况下最后存取单元303包含1~3个G.726取样302,和上述情况一样,由编码部203进行大小调整,使存取单元的大小变成2个字节。
图4(d)是文件制作装置201进行制作处理的模式图,这是把按照编码率40千位/秒进行编码的G.726取样制成存取单元。
如图所示,编码部203连续进行以下动作:把8个5位的G.726取样302集合起来,制成40位、即5个字节的存取单元301,再把每8个5位的G.726取样302集合起来,制成1个存取单元,把制成的存取单元输出到文件输出部205内。
这里,在从数据输入部202输入的声音数据的总取样数不是8的倍数的情况下最后存取单元303包含1~7个G.726取样302,和上述情况一样,由编码部203进行大小调整,使存取单元的大小变成5个字节。
这样,G.726的任一编码率也都是由编码部203把G.726取样302集合起来,制成一个存取单元301,并使存取单元301的大小变成8位的整数倍,而且是同样的大小。再者,由于从数据输入部202输入的数字声音数据经编码后的G.726取样302总数的关系,在不能使最后的存取单元303的大小与其他存取单元的大小相同的情况下,附加填充数据305,进行大小调整,制成最后的存取单元303。
而且,对G.726取样302进行集中的数量并非仅限于上述的数量,可以选择任意的数X,只要通过对上述G.726取样302进行集中能使1个存取单元301的大小能成为8位的整数倍即可。
但是,也可能出现这样的情况,即上述任意数X的值若设定得很大,则存取的粒度增大,在随机存取再现时不能很准确地找出开头。
例如,若把800个G.726取样302归结起来,制成1个存取单元301,则存取的粒度为1毫秒单位,另一方面,若把8000个G.726取样302归结起来制成1个存取单元301,则存取粒度为1秒单位。这样,由于上述任意数X值增大,而在随机存取再现时寻找开部的精度下降。
再者,如上所述,若把8000个G.726取样302归结起来制成一个存取单元301,则在G.726取样302按编码率24千位/秒进行编码的情况下,集中了上述8000个G.726取样302的一个存取单元301的大小为24,000位、即3000字节。这时,为了使所有的存取单元的大小都一致,附加到最后的存取单元303上的填充数据305的大小,最大时也可能需要23,997位,造成文件冗余性增大。
所以,上述任意数X值以尽量设定得较小为宜。
图5表示从上述G.726取样制作存取单元的处理流程图。
首先,数据输入部202接受声音数据输入(S11)。在此,在上述声音数据为模拟声音数据的情况下,数据输入部202进行取样、量子化,作为数字化处理,将其变换成数字声音数据。并且,数据输入部202把数字声音数据输出到编码部203内。然后,编码部203根据G.702的编码率对从数据输入部202接收的数字声音数据进行编码(S12),制成G.726取样302(S13)。并且,编码部203根据规定的文件化信息,用G.726取样302制作存取单元301。在此,所谓规定的文件化信息,是指对每个上述编码率,分别规了构成1个存取单元301的G.726取样302的个数M,使存取单元301的大小成为8位的整数倍。再者,根据该文件化信息的编码率,可以计算出分配给每1个G.726取样的位数S。
这时,编码部203对结束编码的G.726取样302的个数进行判断(S14),在G.726取样的个数大于上述个数M的情况下,取出M取样,制作一个存取单元301(S15)。然后,在存取单元数C上加1(S16),再次判断G.726取样302的个数(S14),反复进行上述动作。
在此,在G.726取样的个数为上述个数M的情况下,编码部203取出M取样,制成最后的存取单元301(S17)。并且,在G.726取样的个数少于上述个数M的情况下,计算出剩余N个G.726取样上附加的填充数据(S18)。这时,编码部203对从M中减去N后的剩余值乘上S,计算出上述填充数据的位数,在剩余的N个G.726取样上附加上上述计算出的填充数据,制成最后的存取单元301(S19)。
然后,编码部203对存取单元数C加上1,计算出总存取单元数C(S20)。并且,在上述剩余的N个G.726取样上附加上填充数据的情况下,把该个数N作为有效取样,把该总存取单元数C、上述个数M、该有效取样N、上述位数S和上述编码率作为格式信息,输出到格式制作部204内(S21)。
这样,上述文件制作装置201通过数据输入部202来输入数字声音数据,在编码部203进行编码,根据编码率来集中数个G.726取样,作为1个存取单元。并且,把上述存取单元输出到文件输出部205内,进行重叠,作为存取单元队列。
并且,上述文件制作装置201把在编码部203对数字声音数据进行文件化时的格式信息输出到格式制作部204内,在该格式制作部204内,制作对上述格式信息进行记录的取样描述逻辑框和取样大小逻辑框等子逻辑框队列。
再者,上述文件制作装置201在上述格式制作部204制作用于记录各逻辑框的大小信息等的逻辑框标题部,并把记录MP4文件100的标题信息的电影数据逻辑框和电影数据逻辑框的逻辑框标题部输出到文件部205内。
然后,上述文件制作装置201在文件输出部205把包括多重化的存取单元队列在内的逻辑框、以及记录上述MP4文件100的标题信息的电影逻辑框等组合在一起,输出到MP4文件100,把该MP4文件100存储到存储装置206内。
图6是涉及本发明第1实施方式的文件制作装置制作的MP4文件的结构图。
如图所示,该MP4文件400和上述过去的MP4文件100一样,由电影逻辑框401和电影数据逻辑框402构成,形成阶梯化逻辑框结构。
电影逻辑框401是记录MP4文件的标题信息的逻辑框群,在由逻辑框标题部403和子逻辑框队列404构成这一点上,与上述过去的MP4文件100的结构相同,子逻辑框队列404由取样大小逻辑框409和取样描述逻辑框410等构成,在没有填充位逻辑框这一点上,与过去的MP4文件100的结构有很大不同。
并且,取样大小逻辑框409由逻辑框标题部403、记录取样大小的逻辑框411、以及记录总取样数的取样计逻辑框412构成,在没有取样大小队列这一点上,与过去的MP4文件100的结构不同。
再者,存取单元队列405由把多个G.726取样302归结起来而制成的存取单元301构成,在最后的存取单元303由有效取样304和填充数据305构成这一点上,与过去的MP4文件100的结构不同。
并且,取样描述逻辑框410,在记录每一个存取单元的取样数413和最后的存取单元的有效取样数414这一点上,与过去的MP4文件的结构不同。
这样,若采用涉及本发明的文件制作方法,则不需要按照字节单位,即8位的整数倍,来把多个G.726取样302归结起来制成一个存取单元301,对每个存取单元附加填充数据,所以,不需要记录填充数据的位信息的填充位逻辑框。
并且,因为把多个G.726取样302归结在一起制成1个存取单元301,使存取单元301的大小都有完全一样,所以,不使用取样大小队列,能减小取样大小逻辑框409的大小。
再有,对输入的数字声音数据的音取样进行编码,其结果,即使出现G.726取样302的个数不够,如上所述,不能归结成是8位的整数倍,而且大小全都一样的情况下,也可以在最后的存取单元303上附加填充数据305,所以,能使全部存取单元的大小都有一样。
并且,在取样描述逻辑框410内记录每个存取单元的G.726取样数413,并在附加上述填充数据305的情况下,记录最后的存取单元的有效取样数414,所以,在读出MP4文件,进行解码和再现处理时,利用这些信息,即可使数字声音数据复原。
图7是文件化时文件大小说明图,这是利用涉及本发明第1实施方式的文件制作方法来使按G.726编码率24千位/秒进行编码的G.726取样进行文件化。
其中,为了便于和利用过去的文件制作方法制作的文件大小进行比较,和上述过去的文件制作方法一样,根据把16声音取样编码成G.726取样时的文件大小,说明连续60秒编码后的文件大小。并且,同样,对于构成上述电影逻辑框401内的子逻辑框队列404的逻辑框,仅用取样大小逻辑框409进行说明。而且,电影逻辑框401的逻辑框大小随取样大小逻辑框409以外的逻辑框的大小而变动,所以,定为“××××”。
如图所示,取样大小逻辑框409和过去的情况一样,对逻辑框大小信息等各个项目分别用4字节记录,合计为20字节大小。
再者,电影数据逻辑框402和过去的情况一样,对逻辑框大小信息和逻辑框型号信息分别用4字节,即共8字节进行记录。
再有,每当记录存取单元时,在编码率24千位/秒中把8个3位的G.726取样归结起来,制成3字节的存取单元,所以,在把16声音取样编码成G.726取样的情况下,制成2个3字节的存取单元,需要6字节大小。所以,电影数据逻辑框402在记录上述逻辑框大小信息等的各个项目的8个字节上,加上记录2个3字节的存取单元的6字节,合计为14字节。
再有,若采用本发明的文件制作方法,则不需要对每个存取单元附加填充数据;所以不需在记录填充数据的位信息的填充位逻辑框。
并且,在60秒后,480,000声音取样被编码成G.726取样,电影数据逻辑框402的大小变成180,008字节,取样大小逻辑框的大小变成20字节,填充位逻辑框的大小变成0字节。
所以,如果把利用本发明的文件制作方法来制作的文件大小与利用过去的文件制作方法来制作的文件大小进行比较,那么,可以使电影数据逻辑框402的大字减少300,000字节,并且,不需要填充位逻辑框,能减少240,016字节。
[第2实施方式]
以下参照附图,详细说明涉及本发明第2实施方式的数据再现装置。
图8是涉及本发明第2实施方式的数据再现装置的结构方框图。
该数据再现装置501是计算机等,它能对利用上述第1实施方式的文件制作装置来制作,对存储在存储装置502内的MP4文件,进行读出,解码,恢复成声音,进行再现,其中具有:文件读出部503、格式解析部504、解码部505和再现部506。
文件读出部503是从存储装置502中读出MP4文件的CD-ROM驱动器和SD存储卡读出器等。该文件读出部503把MP4文件的标题信息输出到格式解析部504内,把MP4文件存取单元队列每次向解码部505内输出1个存取单元。
格式解析部504具有CPU等,是对MP4文件的标题信息进行解析的处理部,对上述标题信息解析的结果,把获得的格式信息输出到解码部505内。
解码部505是具有CPU和存储器,把MP4文件解码成为声音数据的处理部。该解码部505从上述文件读出部503中一个个地接收存取单元,并且,从上述格式解析部504中接收格式信息,根据该格式信息,把存取单元解码成声音数据,输出到再现部506内。
再现部506是杨声器等外部输出装置,它把声音数据变换成声音进行再现。该再现部506从上述解码部505中接收已解码的声音数据,把该声音数据变换成声音,进行外部输出。
存储装置502是存储用上述第1实施方式的文件制作装置而制作的MP4文件的硬盘、CD-R、SD存储卡等记录媒体。
以下说明采用上述结构的数据再现装置的MP4文件的数据再现方法。
图9是采用涉及本发明第2实施方式的数据再现装置的数据解码处理的一部分的流程图。
首先,文件读出部503读出存储在存储装置502内的MP4文件(S31)。并且,把记录在电影逻辑框401内的MP4文件的标题信息输出到格式解析部504内,从记录在电影数据逻辑框402内的存取单元队列405中,向解码部505中一个个地输出存取单元301。
然后,格式解析部504解析那些记录了MP4文件标题信息的电影数据逻辑框内的取样描述逻辑框和取样大小逻辑框等,计算出:总存取单元数C、构成一个存取单元301的G.726取样302的个数M、最后的存取单元内所包含的G.726取样的个数L、每1个G.726取样的位数S和编码率,作为格式信息输出到解码部505内(S32)。
并且,解码部505若接收上述格式信息和上述1个存取单元301,则根据该格式信息对该1个存取单元301进行解码(S33)。然后,解码部505从存取单元数C中减去1(S34),对构成该1个存取单元301的M个G.726取样进行解码(S34)。
在此,解码部505从上述格式信息中把总存取单元数C记录到内部具有的存储器内,计算出存取单元数C的余数,重复进行上述动作,直到最后一个之前的存取单元为止。
然后,解码部505若从文件读出部503中接收最后的存取单元,则根据上述格式信息来特定最后存取单元内所包含的G.726取样的个数L(S36),对L个G.726取样进行解码(S37)。
在此,解码部505根据取样描述逻辑框410中的最后存取单元的有效取样数414内所记录的信息,对上述个数L进行特定。也就是就,在上述第1实施方式中,如果制作最后的存取单元的G.726取样的个数为M,那么,上述个数L与上述个数M相同;如果制作最后存取单元的G.726取样的个数为N,那么,上述个数L与上述个数N相同,无论在那种情况下,解码部505都能把G.726取样解码成数字声音数据。这样,解码部505对最后的存取单元中所包含的L个G.726取样进行解码后,把该已解码的数字声音数据输出到再现部506内,结束解码处理。
这样,利用涉及本发明第2实施方式的数据再现装置501,可以从利用上述第1实施方式的文件制作装置制作的MP4文件中读出和再现数据。
如前所述,涉本发明各实施方式的文件制作装置和数据再现装置,能减小大小,制成MP4文件,从制作的MP4文件中读出再现数据。在此利用附图,说明本发明的实施方式。
图10表示涉及本发明第1实施方式的文件制作装置和涉及第2实施方式的数据再现装置的使用例。
涉及本发明第1实施方式的文件制作装置和涉及第2实施方式的数据再现装置能用于通过互联网等通信线路来接收或发送MP4文件的音乐和图像分配系统等。
如图所示,该音乐和图像分配系统由便携式电话601、SD存储卡602,音乐和图像分配服务器603、数码相机604、个人计算机605和网络通信网606构成。
在此,便携式电话601、数码相机604和个人计算机605对应于文件制作装置206和数据再现装置501,SD存储卡602对应于存储装置206和存储装置502。并且,音乐和图像分配服务器603通过网络通信网606来分配MP4文件。
例如,利用与文件制作装置201和数据再现装置501相对应的个人计算机,制作记录了音乐数据的MP4文件,通过网络通信网606而上载到音乐和图像分配服务器603内。
并且,利用与文件制作装置201和数据再现装置501相对应的便携式电话601,通过网络通信网606能对上载到上述音乐和图像分配服务器603内的MP4文件进行下载,存储到与存储装置201和存储装置502相对应的SD存储卡602内,能从SD存储卡602中读出上述MP4文件再现上述音乐数据。
再有,利用与文件制作装置201和数据再现装置501相对应的数码相机604,拍摄静止图像或活动图像,制作成记录了静止图像数据或活动图像数据的MP4文件,存放到SD存储卡602内。并且,从数码相机604中取出存有上述MP4文件的SD存储卡602,可以利用个人计算机605或便携式电话606来对其进行再现,或者通过网络通信网606将其上载到音乐和图像分配服务器603内。
这样,本发明,例如是在音乐和图像分配系统中实现的,如果采用该文件制作装置和数据再现装置,那么,能减小制成的MP4文件的大小,所以,能缩短上载和下载时的通信时间,能进一步高效率地使用SD存储卡等存储装置的容量。
以上,根据各实施方式,说明了涉及本发明的文件制作方法和数据再现方法,但本发明并非仅限于这些实施方式。
例如,在上述各实施方式中利用G·726作为通信用编码方式进行了说明,但本发明并非仅限于G·726,而是也可以采用G·727和H·261等其他通信用编码方式。并且,在上述第1实施方式中,关于编码率和构成1个存取单元的G.726取样的关系,按照规定的文件化信息,但也可以在制作文件时动态地设定1个存取单元中所包含的G·726取样数。
再有,在上述第1实施方式中,对最后的存取单元内所包含的有效取样数,直接指定了有效取样数,但为了求出最后的存取单元中所包含的有效取样数,也可以使用其他指标。例如,像number-of-samples那样是G·726取样总数,也能获得同样效果。也就是说,也可以用一个存取单元中所包含的G·726取样数去除G·726取样总数时的余数作为最后的存取单元内所包含的有效取样数。再者,在上述各实施方式中,文件制作装置和数据再现装置与硬盘等存储装置相连接,但也可以通过网络与文件服务器相连接。
再者,本发明也可以用程序化的软件方式来实现,即对涉及上述各实施方式的文件制作装置和数据再现装置中的动作进行程序化。
Claims (18)
1、一种文件制作方法,其是根据包含多个编码取样在内的数字编码数据来制作文件,其特征在于包括以下步骤:
存取单元数据制作步,其通过每次都按一定数量来集中上述多个编码取样来生成同样大小的多个存取单元数据;以及
文件输出步,通过对在上述存取单元数据制作步生成的存取单元数据进行多重化、而作为文件输出。
2.如权利要求1所述的文件制作方法,其特征在于:上述存取单元数据制作步,每次都按一定数量来对上述多个编码取样进行集中,使全部存取单元数据的大小按字节单位是相同的。
3.如权利要求1所述的文件制作方法,其特征在于:
上述文件制作方法还包括格式信息制作步,用于制作附属信息,以表示在上述存取单元数据制作步集中的上述一定数量,
上述文件输出步把在上述格式信息制作部制作的上述附属信息包含在文件内进行输出。
4、如权利要求3所述的文件制作方法,其特征在于:上述文件制作方法还包含模拟取样附加步,其是在最后的存取单元数据中所包含的编码取样的数达不到上述一定数的情况下,附加相当于不足的编码取样数的模拟取样。
5、如权利要求4所述的文件制作方法,其特征在于:上述格式信息制作步,在最后的存取单元数据内所包含的编码取样的数达不到上述一定的数的情况下、制作表示上述最后的存取单元数据内所包含的编码取样的数的附属信息。
6、一种数据再现方法,其取得由多个编码取样按一定数量集合在一起、全部存取单元数据的大小都是一样的文件,对上述存取单元数据内所包含的上述编码取样解码并进行再现,
其特征在于包括以下步骤:
存取单元解析步,其特定上述存取单元数据内所包含的上述一定数;以及
解码步,其根据上述存取单元解析步内的解析结果,对上述存取单元数据内所包含的上述一定数的上述编码取样进行解码。
7、如权利要求6所述的数据再现方法,其特征在于:
上述存取单元解析步,在最后的存取单元数据内附加模拟取样的情况下,对上述最后的存取单元数据中所包括的编码取样的数进行特定,
上述解码步,根据上述存取单元解析步中的解析结果,对附加了上述模拟取样的最后的存取单元数据内所包含的编码取样进行解码。
8、一种文件制作装置,其根据包含多个编码取样的数字编码数据来制作文件,其特征在于具有:
存取单元数据制作装置,其通过每次按一定数量来集中上述多个编码取样、而生成同一数据大小的多个存取单元数据;以及
文件输出装置,其通过对由上述存取单元数据制作装置生成的存取单元数据进行多重化而作为文件输出。
9、如权利要求8所述的文件制作装置,其特征在于:上述存取单元数据制作装置每次都按一定数量对上述多个编码取样进行集中,使全部存取单元数据的大小按字节单位是相同的。
10、如权利要求8所述的文件制作装置,其特征在于:
上述文件制作装置还具有格式信息制作装置,用于制作附属信息,以表示上述存取单元数据制作装置集中的上述一定数量,
上述文件输出装置把由上述格式信息制作装置所制作的上述附属信息包含在文件内进行输出。
11、如权利要求10所述的文件制作装置,其特征在于:上述文件制作装置还具有模拟取样附加装置,用于在最后的存取单元数据中所包含的编码取样的数达不到上述一定的数的情况下,附加相当于缺少的编码取样的数量的模拟取样。
12、如权利要求11所述的文件制作装置,其特征在于:
上述格式信息制作装置,在最后的存取单元数据中所包含的编码取样的数量达不到上述一定数量的情况下,制作附属信息,用于表示上述最后的存取单元数据中所包含的编码取样的数量。
13、一种数据再现装置,其取得由多个编码取样按一定数量进行组合,全部存取单元数据的大小都一样的文件,对上述存取单元数据中所包含的上述编码取样进行解码并进行再现,
其特征在于具有:
存取单元解析装置,其对上述存取单元数据中所包含的上述一定数量进行特定;以及
解码装置,其根据上述存取单元解析装置的解析结果,对上述存取单元数据内所包括的上述一定数量的上述编码取样进行解码。
14、如权利要求13所述的数据再现装置,其特征在于:
上述存取单元解析装置,在最后的存取单元数据内附加模拟取样的情况下,对最后的存取单元数据内所包含的编码取样的数量进行特定,
上述解码装置,对于根据上述存取单元解析装置的解析结果、而附加了上述模拟取样的最后的存取单元数据内所包括的编码取样进行解码。
15、一种程序,用于文件制作装置,其特征在于:
使计算机执行权利要求1所述的文件制作方法中的步骤。
16、一种程序,用于数据再现装置,其特征在于:使计算机执行权利要求6所述的数据再现方法的步骤。
17、一种记录媒体,能用计算机来读取其记录的文件,其特征在于:
上述文件中包括:
多个存取单元数据,其中的多个编码取样按一定数量组合在一起,其全部的大小相同;以及
信息,其表示构成一个存取单元数据的上述编码取样的数量。
18、如权利要求17所述的记录媒体,其特征在于:
在上述多个存取单元数据中,最后的存取单元数据中,有时包含模拟取样,有时不包含模拟取样,
在上述文件中还包含用于表示构成上述最后的存取单元数据的编码取样的数量的信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001330436 | 2001-10-29 | ||
JP330436/2001 | 2001-10-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1417789A true CN1417789A (zh) | 2003-05-14 |
Family
ID=19146157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN02146968A Pending CN1417789A (zh) | 2001-10-29 | 2002-10-29 | 文件编制方法和数据再现方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20030083864A1 (zh) |
EP (1) | EP1309196A3 (zh) |
CN (1) | CN1417789A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101015012B (zh) * | 2004-09-13 | 2010-12-01 | 三星电子株式会社 | 再现av数据的设备 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060087924A1 (en) * | 2004-10-22 | 2006-04-27 | Lance Fried | Audio/video portable electronic devices providing wireless audio communication and speech and/or voice recognition command operation |
US20090006335A1 (en) * | 2006-10-26 | 2009-01-01 | Videokeyhole.Com, Inc. | System And Method For Distributing Multimedia Information |
US20150309998A1 (en) * | 2012-01-12 | 2015-10-29 | Thomson Licensing | Method and apparatus for playing a mp4 file container while generating such a file |
CN104506936B (zh) * | 2014-12-10 | 2017-12-22 | 曙光信息产业(北京)有限公司 | 基于众核平台的音视频数据处理方法及装置 |
JP6771158B2 (ja) * | 2017-07-20 | 2020-10-21 | パナソニックIpマネジメント株式会社 | データ記録制御装置、及び、データ記録制御方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5902115A (en) * | 1995-04-14 | 1999-05-11 | Kabushiki Kaisha Toshiba | Recording medium on which attribute information on the playback data is recorded together with the playback data and a system for appropriately reproducing the playback data using the attribute information |
JP2001506114A (ja) * | 1997-10-17 | 2001-05-08 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | データを一定サイズの伝送パケット内にカプセル化する方法 |
KR100739357B1 (ko) * | 1999-09-30 | 2007-07-18 | 소니 가부시끼 가이샤 | 기록 장치, 기록 방법 및 기록 매체 |
KR100841896B1 (ko) * | 2001-02-27 | 2008-06-26 | 엔엑스피 비 브이 | Mpeg-4 비디오 데이터를 인코딩하는 방법 및 장치 |
EP2204989A1 (en) * | 2001-06-15 | 2010-07-07 | Sharp Kabushiki Kaisha | Data recording method, data editing method and data decoding method and apparatus and recording medium thereon |
-
2002
- 2002-10-25 EP EP02023778A patent/EP1309196A3/en not_active Withdrawn
- 2002-10-28 US US10/281,106 patent/US20030083864A1/en not_active Abandoned
- 2002-10-29 CN CN02146968A patent/CN1417789A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101015012B (zh) * | 2004-09-13 | 2010-12-01 | 三星电子株式会社 | 再现av数据的设备 |
Also Published As
Publication number | Publication date |
---|---|
EP1309196A3 (en) | 2005-07-20 |
US20030083864A1 (en) | 2003-05-01 |
EP1309196A2 (en) | 2003-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9225760B2 (en) | System, method and apparatus of video processing and applications | |
CN1278557C (zh) | 信息传递系统与方法以及信息处理设备与方法 | |
CN103814562B (zh) | 用信号表示片段的特性以用于媒体数据的网络流式传输 | |
CN1115781C (zh) | 编码器 | |
CN1244058C (zh) | 信息分配系统 | |
CN1745382A (zh) | 在实时控制协议(rtcp)消息中嵌入会话描述消息 | |
CN1249612C (zh) | 记录装置、记录方法、程序、记录媒体和摄像装置 | |
TW200830175A (en) | A method and system for media file conversion | |
CN1434386A (zh) | 基于集群视频服务器的节目源分片分布式存储方法 | |
CN101042752A (zh) | 用于电子邮件管理的方法和系统 | |
CN1881452A (zh) | 记录设备、记录方法、程序、记录介质、及数据记录介质 | |
CN1943233A (zh) | 广播节目内容的检索及配送系统 | |
JP2015507780A (ja) | 蓄積メディアの配信のためのメディアサービス及び方法 | |
US20150371426A1 (en) | Motion covers | |
CN1942931A (zh) | 通过树型分层数据结构的有序横向结构描述比特流语法的音频比特流格式 | |
CN101699840A (zh) | 融合通信中智能语音交互系统及其实现方法 | |
CN1417789A (zh) | 文件编制方法和数据再现方法 | |
CN1367618A (zh) | 用于定向内插器节点的编码装置和方法 | |
CN1765128A (zh) | 数据处理装置 | |
CN1706192A (zh) | 音频流匹配与渐进扰频 | |
CN1942927A (zh) | 用于分发用于重放音乐的内容帧的内容分发服务器和终端 | |
CN1263290C (zh) | 图像处理装置和方法 | |
CN1918909A (zh) | 文件记录设备、文件记录方法、文件记录过程的程序、其中存储文件记录过程的程序的存储媒体、文件重放设备、文件重放方法、文件重放过程的程序、以及其中存储文件重放过程的程序的存储媒体 | |
CN1656801A (zh) | 信息处理装置和方法、记录媒体与程序 | |
CN1746800A (zh) | 信息处理设备、信息处理方法以及程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |