CN101335036B - 影像声音再现装置 - Google Patents

影像声音再现装置 Download PDF

Info

Publication number
CN101335036B
CN101335036B CN2008101306112A CN200810130611A CN101335036B CN 101335036 B CN101335036 B CN 101335036B CN 2008101306112 A CN2008101306112 A CN 2008101306112A CN 200810130611 A CN200810130611 A CN 200810130611A CN 101335036 B CN101335036 B CN 101335036B
Authority
CN
China
Prior art keywords
payload
mentioned
bag
video
audio stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101306112A
Other languages
English (en)
Other versions
CN101335036A (zh
Inventor
森田芳治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101335036A publication Critical patent/CN101335036A/zh
Application granted granted Critical
Publication of CN101335036B publication Critical patent/CN101335036B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/162Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
    • H04N7/163Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing by receiver means only
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/44029Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/4425Monitoring of client processing errors or hardware failure

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

提供一种不变更或改造没有设想在一个处理单位中有多个处理块的影像声音流而制作的已有的解码部、而能够对在一个处理单位中有多个处理块的流进行再现的影像声音再现装置及其方法,在对影像声音流进行解码并再现的影像声音再现装置中,具备:再组合单元,对所输入的上述影像声音流的包进行再组合;解码单元,对来自上述再组合单元的上述被再组合的包的影像声音流进行解码;输出单元,输出被解码的影像声音;上述再组合单元在所输入的上述影像声音流的包中包含有多个有效载荷时,再组合上述影像声音流的包,以使其成为在每个包中有一个有效载荷的包。

Description

影像声音再现装置
技术领域
本发明涉及一种影像声音再现装置及其方法,特别涉及再现影像声音流的影像声音再现装置及其方法。
背景技术
近年来,对压缩编码的影像声音流进行再现的影响记录再现装置已有许多商品化并普及。
影像声音流按照某个处理单位、例如包(packet)单位被压缩编码。被压缩编码的影像声音流按照某个处理单位被解码、再现。
例如,在将声音流压缩编码的情况下,将1024个声音样本作为一个处理单位一起压缩编码。被压缩编码的声音流按照处理单位被解码并再现。
此外,在压缩编码中使用的方式例如有MP3(MPEG-1Audio Layer-3)、AAC(Advanced Audio Coding)、WMA(Windows(注册商标)Media Audio)等的声音压缩编码方式、和MPEG-2(Moving Picture Experts Group phase2)、H.264(H.264/MPEG-4AVC、MPEG-4Part10Advanced Video Coding)等的影像压缩编码方式。
以往,编码的影像声音流在一个处理单位中只存在一个处理块。因此,在以往的影像记录再现装置中,使用假设在一个处理单位中只存在一个处理块的影像声音流的解码部。
但是,近来,在某个处理单位之中存在多个处理块的影像声音流不断增加。例如,在某个处理单位,有虽然是相同的声音数据但具有多个不同的比特率的声音数据的处理块、例如有效载荷的声音流等(例如非专利文献1)。
在某个处理单位之中存在多个处理块的声音流中,在一个声音流中可以具有由多个比特率构成的同一内容的声音数据。因此,在声音再现时,可以从由多个比特率构成的同一内容的声音数据之中选择任意的比特率的声音数据进行再现。当然,也可以在一个声音流中具有多个处理块不同的声音数据。
【非专利文献1】Advanced Systems Format(ASF)SpecificationRevision01.20.02Microsoft Corporation June 2004.
但是,通过以往的影像声音再现装置、即具有没有设想在一个处理单位中有多个处理块而制作的解码部的影像声音再现装置,不能对上述非专利文献1所述的在一个处理单位中有多个不同的处理块的影像声音流进行再现。
以往的影像声音再现装置为了进行对应以使其能够再现在一个处理单位中有多个不同的处理块的影像声音流,需要在影像声音再现装置的解码部中进行处理的追加、和与其相伴的存储器容量的增加。或者,还有通过将安装有解码部的结构的LSI替换为追加了能够将在一个处理单位中有多个不同的处理块的影像声音流进行再现的处理并增加了存储器容量的LSI(Large Scale Integration)来应对的方法。不论哪一种方法,存储器等的结构部件都增加、解码部内部的LSI面积都增加。因此,根据影像声音再现装置,还有不能变更或改造影像声音再现装置的解码部的结构,还有不能进行应对以使其能够再现在一个处理单位中有多个不同的处理块的影像声音流的结构。
发明内容
本发明是鉴于上述问题而做出的,目的是提供一种不变更或改造没有设想在一个处理单位中有多个处理块的影像声音流而制作的已有的解码部、而能够将在一个处理单位中有多个处理块的流进行再现的影像声音再现装置及其方法。
为了达到上述目的,有关本发明的影像声音再现装置,是对影像声音流进行解码并再现的影像声音再现装置,其特征在于,具备:再组合单元,对输入的上述影像声音流的包进行再组合;解码单元,对来自上述再组合单元的上述被再组合的包的影像声音流进行解码;输出单元,输出被解码的影像声音;上述再组合单元在输入的上述影像声音流的包包含有多个有效载荷时,对上述影像声音流的包进行再组合,以使其成为在每个包有一个有效载荷的包。
由此,对在一个处理单位中有多个不同的处理块的影像声音流进行再组合,以使其在一个处理单位中有一个处理块,并输出给解码单元,从而能够进行解码单元中的解码。因而,能够实现不变更或改造没有设想在一个处理单位中有多个处理块的影像声音流而制作的解码部、而能够对在一个处理单位中有多个处理块的流进行再现的影像声音再现装置。
此外,上述再组合单元也可以具备:检测单元,从上述影像声音流中检测上述影像声音流的每个包所包含的有效载荷的个数;分割单元,通过将上述影像声音流的包分割为由上述检测单元检测到的个数,再组合上述影像声音流的包。
由此,通过分割多个处理块、并对每一个处理块制作新的处理单位,能够进行再组合以使得在一个处理单位中有一个处理块,所以能够进行通过没有设想在一个处理单位中有多个处理块的影像声音流而制作的解码单元的解码。
此外,也可以是,上述再组合单元具备:检测单元,从上述影像声音流中检测上述影像声音流的每个包所包含的有效载荷的个数;选择单元,从上述影像声音流的包所包含的有效载荷中,选择属于一个影像声音流的有效载荷;变换单元,通过将上述影像声音流的包变换为包括由上述选择单元选择的有效载荷的影像声音流的包,再组合上述影像声音流的包。
由此,从声音流的包的多个有效载荷之中任意地选择需要的有效载荷、并再组合为在一个包中包含有一个有效载荷的声音流的包,从而能够对在一个处理单位中有多个不同的处理块的流进行再现。
进而,通过将包括任意选择的有效载荷并再组合的包以外丢弃,能够减小制作的一个处理单位的尺寸,也能够减小流的尺寸。由此,在具备有不需要的处理块时不能处理的解码部的声音记录再现装置中,能够进行再现。此外,即使是在有不需要的处理块时能够处理的解码部,也能够避免因不需要的处理块持续带来的影像中断或声音中断等。
此外,也可以是,上述再组合单元具备:检测单元,从上述影像声音流中检测上述影像声音流的每个包所包含的有效载荷的个数;选择单元,从上述包所包含的有效载荷中,选择属于一个影像声音流的有效载荷;无效化单元,通过使由上述选择单元所选择的有效载荷以外的有效载荷无效化,再组合上述影像声音流的包。
由此,通过任意地选择需要的有效载荷、并将不需要的有效载荷无效化,能够再组合为在一个包中包含有一个有效载荷的声音流,所以能够对在一个处理单位中有多个不同的处理块的流进行再现。
此外,也可以是,上述选择单元从上述影像声音流中提取上述影像声音流的头信息,并从上述包所包含的有效载荷中,选择所提取的上述影像声音流的头信息指定的、属于一个影像声音流的有效载荷。
由此,能够对作为由影像声音流指定的处理块的有效载荷进行再现。
此外,也可以是,上述选择单元具备:提取部,从上述影像声音流中提取与上述影像声音流的每个包所包含的有效载荷有关的信息;选择基准,用于从上述影像声音流的包所包含的有效载荷中,选择一个有效载荷;选择部,根据由上述提取部提取的上述信息和上述选择基准,选择上述有效载荷。
此时,也可以是,提取的上述信息表示有关有效载荷的比特率的信息;上述选择基准表示要优先选择比特率高的有效载荷的内容(意思);上述选择部根据上述信息和上述选择基准,从上述包所包含的有效载荷中,选择比特率最高的有效载荷。
此外,也可以是,提取的上述信息表示有关有效载荷的压缩编码方式的信息;上述选择基准表示要优先选择设定的压缩编码方式的有效载荷的内容;上述选择部根据上述信息和上述选择基准,从上述包所包含的有效载荷中,选择优先级最高的压缩编码方式的有效载荷。
由此,能够以最好的画质及声音的状态再现影像声音流。
此外,也可以是,提取的上述信息表示有关有效载荷的有效载荷号码的信息;上述选择基准表示要优先选择有效载荷号码小的有效载荷的内容;上述选择部根据上述信息和上述选择基准,从上述包所包含的有效载荷中,选择有效载荷号码最小的有效载荷。
在规定的影像声音记录再现装置中,有在需要认证的场合要求自动地再现有效载荷号码最小的处理的情况,而由此能够自动地再现该场合的有效载荷号码最小的处理。
此外,也可以是,提取的上述信息表示有关有效载荷的比特率的信息;上述选择基准由表示要优先选择比特率高的有效载荷的的内容的第1选择基准、和表示上述解码单元能够解码的条件的第2选择基准构成;上述选择部根据上述信息、上述第2选择基准、和上述第1选择基准,从上述包所包含的有效载荷中,选择在上述第2选择基准表示的条件之中比特率最高的有效载荷。
此外,也可以是,提取的上述信息表示有关有效载荷的压缩编码方式的信息;上述选择基准由通过压缩编码方式设定优先级的第1选择基准、和表示上述解码单元能够解码的条件的第2选择基准构成;上述选择部根据上述信息、上述第2选择基准、和上述第1选择基准,从上述包所包含的有效载荷中,选择在上述第2选择基准表示的条件之中优先级最高的压缩编码方式的有效载荷。
由此,能够在解码单元能够再现的范围内,再现最好的画质及声音的状态的影像声音流。
此外,也可以是,上述无效化单元通过写入由上述选择单元选择的有效载荷以外的有效载荷是伪数据的信息来进行无效化。
由此,例如作为再组合单元进行无效化的处理,例如仅通过将影像声音流的头的有效数据区域等的值改写,就能够再组合只包含有一个有效载荷的包。
此外,也可以是,上述无效化单元复制与由上述选择单元选择的有效载荷的个数相对应的数量的上述包,并对上述复制的包所需要的有效载荷以外的有效载荷无效化。
此外,也可以是,上述无效化单元通过写入上述复制的包所需要的有效载荷以外的有效载荷是伪数据的信息来进行无效化。
另外,本发明不仅作为装置实现,也可以作为具备这样的装置具备的处理单元的电路或集成电路实现、或者作为以构成该装置的处理单元为步骤的方法实现、或者作为使计算机执行这些步骤的程序实现。并且,这些程序也可以经由CD-ROM等的记录介质或因特网等的通信介质来发送。
根据本发明,能够实现不变更或改造没有设想在一个处理单位中有多个处理块的影像声音流而制作的已有的解码部、而能够对在一个处理单位中有多个处理块的流进行再现的影像声音再现装置及其方法。
附图说明
图1是表示本发明的影像声音再现装置的概略结构的框图。
图2是概念性地表示ASF文件的构造的图。
图3是概念性地表示Data Packet的构造的图。
图4是表示本发明的实施方式1的流控制部102的结构的框图。
图5是用来说明本发明的实施方式1的流控制部的处理的流程图。
图6是用来说明本发明的实施方式1的声音流的包含多个有效载荷的包的分割处理的图。
图7是表示本发明的实施方式2的流控制部的结构的框图。
图8是表示本发明的实施方式2的选择部选择的有效载荷的基准信息的一例的表图。
图9是用来说明本发明的实施方式2的流控制部的处理的流程图。
图10是用来说明本发明的实施方式2的声音流的包含多个有效载荷的包被再组合的情况的图。
图11是表示按照本发明的实施方式2的选择基准信息对声音流中的包含多个有效载荷的包进行再组合的例子的图。
图12是本发明的实施方式2的压缩编码方法和比特率的画质及音质的品质表的一例。
图13是表示选择由本发明的实施方式2的声音流的头指定的有效载荷、并再组合包含所选择的有效载荷的包的图。
图14是表示选择本发明的实施方式2中的有效载荷号码小的有效载荷、并再组合包含所选择的有效载荷的包的图。
图15是表示本发明的实施方式3的流控制部的结构的框图。
图16是用来说明本发明的实施方式3的流控制部的处理的流程图。
图17是用来说明再组合本发明的实施方式3的声音流的包含多个有效载荷的包的图。
符号说明
100影像声音再现装置        101输入部        102流控制部
103解码部                  104输出部        105流输入控制部
1021检测部                 1022分割部       1023选择处理部
1024基准                   1025选择部       1026变换部
1027非选择指示部
200、203、204、300、303、304、401、404、408、409、410、411、412包(处理单位)
501、504、508、509、510、602、605、609、610、701、704、708、709、710包(处理单元)
201、202、301、302、402、403、405、406、407有效载荷(处理块)
502、503、505、506、507、603、604、606、607、608、702、703、705、706、707有效载荷(处理块)
601流头801、802ASF Object
803ASF Data Packet
901、902、903、904有效载荷数据
具体实施方式
(实施方式1)
以下,利用附图说明有关本发明的实施方式1。
图1是表示本发明的影像声音再现装置100的概略结构的框图。
影像声音再现装置100是将影像声音流解码并再现的影像声音再现装置,如图1所示,具备输入部101、流控制部102、解码部103和输出部104。
输入部101被输入影像声音流。
流控制部102相当于有关本发明的再组合单元,对输入的上述影像声音流的包进行再组合。具体而言,对输入到输入部101的影像声音流的包进行再组合,并在解码部103能够解码的时刻输出给解码部103。
解码部103相当于有关本发明的解码单元,对来自上述再组合单元的上述再组合的包的影像声音流进行解码。具体而言,对从流控制部102输出的影像声音流进行解码。
输出部104相当于有关本发明的输出单元,输出解码后的影像声音。具体而言,输出由解码部103解码后的影像声音。
在影像声音再现装置100中,流控制部102成为对解码部103输入影像声音流的前级,流控制部102对在一个处理单位中有多个不同的处理块的影像声音流进行再组合以使其在一个处理单位中有一个处理块,并输出给解码部103,由此能够进行解码部103中的解码。
以下,说明对在一个处理单位中有多个不同的处理块的影像声音流进行再组合以使其在一个处理单位中有一个处理块的方法。
这里,设在一个处理单位中有多个不同的处理块的影像声音流为使用ASF(Advanced Systems Format)的文件格式的WMA(Windows(注册商标)Media Audio)的声音流,以下进行说明。
ASF文件若大体划分则由头、数据及索引的三个区域构成。一般,影像和声音的数据交替地存储于相同尺寸的包。根据索引区域的信息,知道要再现的影像、声音数据的位置。此外,即使没有索引区域的信息也能够进行再现。但是,在没有索引区域的信息而进行再现的情况下,有不能向流中途的进行跳跃的情况。
图2是概念性地表示ASF文件的构造的图。
如图2所示,ASF文件由多个对象(object)构成。作为多个对象,有作为流的头的Header Object801、和作为流的数据的Data Object802的区域。Data Object802由多个Data Packet803构成,包括ASF文件的所有数据。
图3是概念性地表示Data Packet的构造的图。
作为影像声音流的数据的Data Packet803基本上为“头+有效载荷”的结构。头包含有为了传送包自身而需要的信息,相对于此,有效载荷包含委托传送的应用软件等实际想要传送的信息。
Data Packet803如图3所示,具有Error Correction Data901、PayloadParsing Information902、Payload Data903、和Padding Data904。
Payload Parsing Information902存储效载荷的信息。Payload ParsingInformation902由于包含有为了传送包括有效载荷的包自身而需要的信息,所以有时也表现为头。
Data Packet803也可以具有多个Payload Data903。在ASF文件中,将在Data Packet803的一个包(对象)中包含多个有效载荷(Payload Data903)的情况称作Multiple payloads(多有效载荷)。此外,在ASF文件中,将在Data Packet803的一个包(对象)中包含一个有效载荷(Payload Data903)的情况称作single payload。
另外,Data Packet803也可以不具有Error Correction Data901和PaddingData904。
以下,在本实施方式1中,设处理单位是数据包(以下记载为包)。此外,设处理块是有效载荷数据(以下记载为有效载荷)。
图4是表示本发明的实施方式1的流控制部102的结构的框图。
流控制部102具备检测部1021和分割部1022。
检测部1021相当于本发明的检测单元,从上述影像声音流中检测上述影像声音流的每个包所包含的有效载荷的个数。具体而言,从来自输入部101的声音流中检测一个包所包含的有效载荷。
分割部1022相当于本发明的分割单元,通过将上述影像声音流的包分割为由上述检测单元检测到的个数,再组合上述影像声音流的包。具体而言,将从输入部101输入的声音流的包含多个有效载荷的包分割为由检测部1021检测到的个数,以使得在一个包中有一个有效载荷。由此,能够再组合为在一个包中包含一个有效载荷的声音流。
图5是用来说明本发明的实施方式1的流控制部102的处理的流程图。
首先,流控制部102的检测部1021检测从输入部101输入的声音流的每个包的有效载荷的个数(S101)。
接着,流控制部102的分割部1022对从输入部101输入的声音流、将声音流的包分割为由检测部1021检测到的有效载荷的个数(S102)。
图6是用来说明本发明的实施方式1的声音流的包含多个有效载荷的包的分割处理的图。
图6中,作为一个声音流的处理单位的包包含作为两个处理块的有效载荷A及有效载荷B。即,声音流的某个第1号包200(包1)包含A的种类的有效载荷201(有效载荷A)、和B的种类的有效载荷202(有效载荷B)。
这里,例如有效载荷A是以128kbps、有效载荷B是以64kbps压缩编码的声音数据。
此外,在包200(包1)中,有包200(包1)的头。在头中,包含有包200(包1)的尺寸、以及装有两个有效载荷等的信息。此外,在有效载荷201(有效载荷A)及有效载荷202(有效载荷B)中也有头,在头中包含有有效载荷201(有效载荷A)及有效载荷202(有效载荷B)的尺寸等的信息。
另外,在图6中,省略了声音流的头(Header Object801)。
如上所述,通过流控制部102的检测部1021及分割部1022,再组合输入的声音流的包,以使得在一个包中有一个有效载荷。如图6所示,通过检测部1021检测有效载荷的个数是两个,在分割部1022制作两个声音流的包,并在其中仅存储一个有效载荷。具体而言,在分割部1022中,将包200(包1)分割为包203(包1′)、和包204(包1″)。在包203(包1′)存储有效载荷201(有效载荷A),在包204(包1″)存储有效载荷202(有效载荷B)。
另外,虽然图示为包203(包1′)与包204(包1″)连续,但也可以在包203(包1′)与包204(包1″)之间存储有无用的数据。
此时,分割部1022改写包203(包1′)及包204(包1″)的头。通过改写包203(包1′)及包204(包1″)的尺寸,形成包203(包1′)和包204(包1″)的有效载荷分别只包含有一个的信息。
在ASF文件中,为了形成只包含有一个有效载荷的信息,例如将作为存储于Payload Parsing Information902的length type Flags所包含的变量的Multiple Payloads Present设为“0”。
此外,在ASF文件中,为了调节包的长度,调节例如存储在PayloadParsing Information902的Packet Length的变量。
另外,在解码部103即使不能改写上述Multiple Payloads Present及Packet Length的值也能够对分割后的包203(包1′)及包204(包1″)进行解码的情况下,可以不改写Multiple Payloads Present及Packet Length的值。
此外,在解码部103通过在包203(包1′)与包204(包1″)之间放入无用的数据而能够对分割后的包203(包1′)及包204(包1″)进行解码的情况下,也可以用填装数据(无用数据)填补包。但是,在此情况下,不仅存储于Payload Parsing Information902的Packet Length,PaddingLength的值也进行调节。
此外,通过流控制部102的分割部1022,使声音流的尺寸及声音流所包含的包数变化。因此,当为在声音流的头中记录有流所包含的包数的声音流的情况下,使头所包含的变量的值变化。所谓的头所包含的的变量的数值,例如在ASF文件中是存储于Header Object801的File Properties Object的Data Packets Count的值、以及存储在Data Object802中的Total DataPackets的值。
由此,能够不变更或改造没有设想在一个包中具有多个有效载荷的影像声音流而制作的解码部,而对在一个包中有一个有效载荷的流进行解码。
另外,作为没有影像声音流的头的编码方法,可以应用在例如在ASF文件中、将通过没有作为流的头的Header Object801的编码方法压缩编码的影像声音流解码的影像声音再现装置。
此外,也可以应用在虽然是不能设想在一个包中存在多个有效载荷的解码部103、但是具备在能够通过包的头等判断为不需要的有效载荷的情况下对判断为不需要的有效载荷可以不进行再现的解码部103的影像声音再现装置。
以上,本发明的实施方式1的影像声音再现装置100通过将多个有效载荷分割、并再组合声音流的包以使得在分割后的每一个有效载荷有一个包,由此能够对在一个处理单位中有多个不同的处理块的声音流进行再现。
由此,通过将多个块分割、并按照各个处理块制作新的处理单位,能够实现不变更或改造没有设想在一个处理单位中有多个不同的处理块的影像声音流而制作的解码部、而对在一个处理单位中有多个不同的处理块的影像声音流进行再现的影像声音再现装置及其方法。
另外,影像声音再现装置100例如是对通过MP3、AAC、WMA等压缩编码的声音流进行解码并再现的声音再现播放器、或将由MPEG或H.264等压缩编码的影像和声音两者进行解码并再现的DVD播放器等的影像声音再现播放器等。但是,影像声音再现装置100并不特别限定于上述例子。
此外,影像声音再现装置100作为影像声音播放器的内部结构,例如也可以将解码部103构成为一个半导体集成电路(LSI)、且将输入部101和流控制部102构成为另外的LSI,也可以将输入部101、流控制部102、解码部103、输出部104、以及发挥其他功能的结构要素构成为一个LSI。
(实施方式2)
在上述实施方式1中,说明了如下的影像声音再现装置100:通过具备具有检测部1021及分割部1022的流控制部102,解码部103能够对由具有多个有效载荷的包构成的流进行再现,所述解码部103不能对具有多个有效载荷的包进行解码。在实施方式2中,说明不能对具有多个有效载荷的包进行解码的解码部103能够对由具有多个有效载荷的包构成的流进行再现的另一影像声音再现装置100。
以下,利用附图对有关本发明的实施方式2进行说明。
图7是表示本发明的实施方式2的流控制部102的结构的框图。
流控制部102具备检测部1021、选择处理部1023和变换部1026。
检测部1021相当于本发明的检测单元,从上述影像声音流中检测上述影像声音流的每个包所包含的有效载荷的个数。具体而言,从来自输入部101的声音流中,检测每一个包所包含的有效载荷的个数。
选择处理部1023相当于本发明的选择单元,从上述影像声音流的包所包含的有效载荷中,选择属于1个影像声音流的有效载荷。具体而言,具备基准1024和选择部1025,根据由检测部1021检测到的个数的信息和来自基准1024的选择基准的信息,选择部1025选择有效载荷。
基准1024相当于本发明的提取部,从上述影像声音流中提取与上述影像声音流的每个包所包含的有效载荷有关的信息。具体而言,提取并保持经由检测部1021输入的声音流所包含的信息。
此外,基准1024具有关于选择部1025要选择的有效载荷的选择基准信息。
基准1024保持提取的信息和选择基准信息。所谓的提取的信息,是记述在声音流的头中的信息、或记述在声音流的包的头中的信息、记述在声音流的包所包含的有效载荷的头中的信息,例如是关于有效载荷的压缩编码方式、尺寸、比特率、有效载荷号码等。
图8是表示基准1024具有的选择部1025选择的有效载荷的基准信息的一例的表图。
选择基准信息相当于本发明的用来从上述影像声音流的包所包含的有效载荷中选择一个有效载荷的选择基准。具体而言,如图8所示,是表示了关于有效载荷的选择基准的表等数据,所述有效载荷是要从声音流的包所包含的多个有效载荷之中选择的。作为选择基准信息,例如有选择有效载荷A、选择有效载荷B、选择比特率高的有效载荷、选择比特率低的有效载荷、选择尺寸小的有效载荷、选择尺寸大的有效载荷、选择画质音质良好的有效载荷、选择有效载荷号码小的有效载荷、以及选择有效载荷号码大的有效载荷等。
基准1024参照选择基准的信息,例如在由用户选择了号码3的情况下,对选择部1025进行指示,以使从声音流的包所包含的多个有效载荷之中选择比特率高的有效载荷。
选择部1025相当于本发明的选择部,根据由上述提取部提取的上述信息和上述选择基准,选择上述有效载荷。具体而言,根据检测部1021检测到的个数和由基准1024保持的信息,从声音流的包所包含的多个有效载荷中,选择规定的有效载荷。
变换部1026对包进行变换,以使选择处理部1023选择的有效载荷成为属于一个声音流的包的有效载荷。
即,变换部1026对声音流的包进行变换,以使由选择部1025选择的有效载荷成为一个有效载荷对应于一个包。
由此,可以从声音流的包的多个有效载荷之中,任意地选择需要的有效载荷,并再组合声音流的包,以使在一个包中含有一个有效载荷。
图9是用来说明本发明的实施方式2的流控制部102的处理的流程图。
首先,流控制部102的检测部1021检测从输入部101输入的声音流的每个包的有效载荷的个数(S201)。
接着,流控制部102的选择部1025从由输入部101输入的声音流的包含多个有效载荷的包中,按照由检测部1021检测到的个数和基准1024保持的信息,选择有效载荷(S202)。
接着,流控制部102的变换部1026对声音流的包进行变换,以使由选择部1025选择的有效载荷分别成为一个有效载荷对应于一个包(S203)。
由此,能够将在一个包中包含多个有效载荷的声音流再组合为,在一个包中包含有一个有效载荷的声音流。
图10是用来说明将声音流的包含多个有效载荷的包的再组合的图。
在图10中,作为声音流的一个处理单位的包包含有作为两个处理块的有效载荷A及有效载荷B。即,声音流的某个1号包401(包1)包含有A种类的有效载荷402(有效载荷A1)、和B种类的有效载荷403(有效载荷B 1)。声音流的某个第2号包404(包2)包含有A种类的有效载荷405(有效载荷A2)、B种类的有效载荷406(有效载荷B2)、和A种类的有效载荷407(有效载荷A3)。
此外,在包401(包1)和包404(包2)中包含有头。在头中,包含有包401(包1)和包404(包2)的尺寸、及有关有效载荷的个数的信息。此外,在有效载荷402(有效载荷A1)、以及有效载荷403(有效载荷B1)中,也包含有有效载荷402(有效载荷A1)、以及有效载荷403(有效载荷B1)的尺寸等的信息。在有效载荷405(有效载荷A2)、有效载荷406(有效载荷B2)、以及有效载荷407(有效载荷A3)中也同样在其头中包含有尺寸等的信息。
另外,在图10中,省略了声音流的头(Header Object801)。
在图10中,如上所述,通过流控制部102的检测部1021、基准1024、选择部1025及变换部1026,从声音流的包的多个有效载荷中任意地选择需要的有效载荷,并再组合声音流的包,以使在一个包中包含有一个有效载荷。
图10(a)是表示为了再现有效载荷A(有效载荷A1~A3)而对声音流中的包含多个有效载荷的包进行再组合的图。
在检测部1021中,检测包401(包1)及包404(包2)所包含的有效载荷的个数。
在选择部1025中,按照由检测部1021检测到的包含在包401(包1)及包404(包2)中的有效载荷的个数、和表示再现基准1024保持的有效载荷A(有效载荷A1~A3)的内容(内容)的选择基准信息,从包401(包1)及包404(包2)中,选择有效载荷402(有效载荷A1)、有效载荷405(有效载荷A2)、以及有效载荷407(有效载荷A3)。
在变换部1026中,对声音流的包401(包1)及包404(包2)进行变换,以使其分别包括各一个由选择部1025选择的有效载荷402(有效载荷A1)、有效载荷405(有效载荷A2)、以及有效载荷407(有效载荷A3)的包。即,包401(包1)被变换为包括有效载荷402(有效载荷A1)的包408(包1′),包404(包2)被变换为包括有效载荷405(有效载荷A2)的包409(包2′)、和包括有效载荷407(有效载荷A3)的包410(包2″)。
由此,能够从声音流的包的多个有效载荷之中任意地选择需要的有效载荷、并再组合声音流的包以使在一个包中包含一个有效载荷。
另外,包含没有被选择部1025选择的有效载荷B1及有效载荷B2的包将被丢弃。
因此,不再需要通过解码部103处理包含有效载荷B1及有效载荷B2的包。
由此,能够降低解码部103中的解码处理的负荷。对于具有处理能力不高的解码部103的影像声音再现装置100是有用的,所述解码部103在不需要对声音流的包所包含的所有的有效载荷进行解码的情况下,解码部也对包含不需要解码的有效载荷的包进行处理时,由于例如包含有效载荷B(有效载荷B1及有效载荷B2)的不需要的包一直继续、需要的包(有效载荷A1~A3)不在需要的时刻到来,因此有可能发生需要的包(有效载荷A1~A3)的处理来不及进行而声音中断等。
此外,对于具有如下的解码部103的影像声音再现装置100是有用的,所述解码部103是不能设想在声音流的一个包存在多个有效载荷的解码部103、并且再现所有的有效载荷、即通过解码部对包括不需要解码的有效载荷的所有包进行处理。
图10(b)是表示为了再现有效载荷B(有效载荷B1、B2)而对声音流的包含多个有效载荷的包进行再组合的图。与图10(a)的情况同样,在图10(b)中,从声音流的包的多个有效载荷中任意地选择需要的有效载荷,并再组合声音流的包,以使在一个包中包含一个有效载荷(有效载荷B)。即,为了仅再现有效载荷B,包401(包1)变换为包括有效载荷403(有效载荷B1)的包411(包1′)。此外,包404(包2)变换为包括有效载荷406(有效载荷B2)的包412(包2′)。
另外,在本实施方式2的方法中,与实施方式1中的方法同样,变换声音流的包,声音流的尺寸及影像声音流所包含的包数变化。因此,在具有头、记录有声音流所包含的包数的声音流的情况下,需要将有关头所包含的包数的值变更。在ASF文件中,例如存储于Header Object801的DataObject File Properties Object所包含的Data Packets Count的值、以及DataObject的Total Data Packets的值被变更。
在图10中,作为任意的选择方法,说明了选择有效载荷A的情况和选择有效载荷B的情况的方法、即按照表示选择规定的有效载荷的内容的选择基准信息、再组合声音流的包、以使其成为包含各一个从声音流的包所包含的多个有效载荷之中选择的有效载荷的包的方法。以下,举例说明选择基准信息。
图11是表示按照选择基准信息再组合声音流的包含多个有效载荷的包的例子的图。
在图11中,声音流的某个第1号包501(包1)包含有A种类的有效载荷502(有效载荷A1)、和B种类的有效载荷503(有效载荷B1)。声音流的第2号包504(包2)包含有A种类的有效载荷505(有效载荷A2)、B种类的有效载荷506(有效载荷B2)、和A种类的有效载荷507(有效载荷A3)。
在图11中,作为任意的选择方法的例子,对通过流控制部102选择画质及音质最好者的方法进行说明。这里,作为用来选择画质及音质最好者的选择基准信息,既可以表示要选择比特率最高的有效载荷的信息的内容,也可以表示要选择使用画质及音质好的编码方法的有效载荷的信息的内容。
在ASF文件中,例如关于有效载荷的比特率,记述在存储于HeaderObject801的stream Properties Object所包含的Average Number of Bytes PerSecond中。此外,关于有效载荷的压缩编码方法,记述在存储于HeaderObject801的stream Properties Object所包含的Codec ID/Format Tag中。
此外,在从多个压缩编码方法和多个比特率混合的有效载荷之中选择画质及音质最好者的情况下,使用例如图12所示的压缩编码方法与比特率的画质及音质的品质表等,来选择有效载荷。
这里,图12是压缩编码方法与比特率的画质及音质的品质表的一例。由图12可以判断,在例如以第1编码方法的128kbps进行压缩编码的有效载荷和以与第1编码方法不同的第3编码方法的96kbps进行压缩编码的有效载荷中,以第3编码方法的96kbps进行压缩编码的有效载荷的画质音质更好。因此,在以第1编码方法的128kbps进行压缩编码的有效载荷和以第3编码方法的96kbps进行压缩编码的有效载荷中,选择以第3编码方法的96kbps进行压缩编码的有效载荷。
在图11中,表示了设比特率越高画质及音质越好、来选择有效载荷的例子。即,表示了从声音流的包所包含的多个有效载荷之中、作为表示“选择画质、声音最好的有效载荷”的内容的选择基准信息而“选择比特率高的有效载荷”的例子。
这里,例如,有效载荷A1~A3是以第3压缩编码方式的96kbps压缩编码的有效载荷的,有效载荷B1及B2是以第1压缩编码方式的128kbps压缩编码的有效载荷的声音数据。
在图11中,包501(包1)被变换为包括有效载荷502(有效载荷A1)的包508(包1′)。包504(包2)被变换为包括有效载荷505(有效载荷A2)的包509(包2′)和包括有效载荷507(有效载荷A3)的包510(包2″)。
另外,不仅设定表示“选择画质、音质最好的有效载荷”的内容的选择基准信息,而且相反可以为“选择画质、音质最差的有效载荷”的选择基准信息。此外,也可以设定例如“选择比特率的上限值以下及规定的压缩编码方式的有效载荷”等的表示选择能够通过解码部103再现的范围的有效载荷的的内容的选择基准信息。
在解码部103中,能够再现的比特率的范围、编码方法被限制的情况较多。因此,由相当于影像声音再现装置100的后级的解码部103设定选择可再现的有效载荷的种类的选择基准信息,由此能够进行通过解码部103的解码。
因此,也可以设定考虑流控制部102与解码部103之间的传送速度的选择基准信息。
此外,也可以考虑流控制部102与解码部103之间的传送速度,来设定“选择比特率低的有效载荷”的选择基准信息。进而,不仅知道在流控制部102与解码部103之间的传送速度,还知道在解码部103与输出部104之间的传送速度的情况下,也可以考虑两者的传送速度来设定选择基准信息。即,不仅是设定“选择比特率低的有效载荷”的选择基准信息,也可以设定“选择能够由解码部103解码的、音质最好的有效载荷”的选择基准信息。由此,在包含在影像声音再现装置100能够处理的包中的有效载荷之中,能够再现画质音质最好的有效载荷。
设定如上述的选择基准信息来再现规定的有效载荷的方法在与能够与声音流的头联合的收费系统组合的情况下也是有用的。即,也可以使得在不付钱而体验音乐等声音的再现的情况下,仅再现声音流的包所包含的最低音质的有效载荷,在支付钱之后再现音质好的有效载荷。
图13是表示选择由声音流的头指定有效载荷、并再组合包含所选择的有效载荷的包的图。图13表示在流的头中记述有应再现哪个有效载荷、且对由流的头指定的有效载荷进行再现的情况的例子。
另外,应再现哪个有效载荷的信息在ASF文件中,例如记述在存储于Header Object801的Stream Properties Object所包含的Stream Number中。
在图13中,在流头601中记述有被进行指定以优先再现有效载荷B(B1及B2)的信息、例如“B是主流”的信息。声音流的某个第1号包602(包1)包括A种类的有效载荷603(有效载荷A1)、和B种类的有效载荷604(有效载荷B1)。声音流的第2号包605(包2)包括A种类的有效载荷606(有效载荷A2)、B种类的有效载荷607(有效载荷B2)、和A种类的有效载荷608(有效载荷A3)。
在图13中,按照流头601的信息,包602(包1)变换为包括有效载荷604(有效载荷B1)的包609(包1′)。包605(包2)变换为包括有效载荷607(有效载荷B2)的包610(包2′)。
图14是表示选择有效载荷号码小的有效载荷、并再组合包含所选择的有效载荷的包的图。图14表示在某个特定的场合下、即使在声音流的头中没有记述有要再现哪个有效载荷的情况下也对有效载荷号码小的有效载荷进行再现的情况的例子。
在图14中,声音流的某个第1号包701(包1)包括A种类的有效载荷702(有效载荷A1)、和B种类的有效载荷703(有效载荷B1)。声音流的第2号包704(包2)包括A种类的有效载荷705(有效载荷A2)、B种类的有效载荷706(有效载荷B2)、和A种类的有效载荷707(有效载荷A3)。
这里,所谓的有效载荷的号码是A及B,假设A比B号码小。
在图14中,包701(包1)变换为包括有效载荷702(有效载荷A1)的包708(包1′)。包704(包2)变换为包括有效载荷705(有效载荷A2)的包709(包2′)、和包括有效载荷707(有效载荷A3)的包710(包2″)。
另外,所谓的某个特定的场合,是为了再现包所包含的有效载荷而需要认证的场合。
此外,在ASF文件中,有效载荷号码是存储于Header Object801的Stream Properties Object所包含的Stream Number。
在声音流中,通常包含有Stream Number为1(在图14中相当于A)的有效载荷。因此,作为有效载荷号码小的有效载荷,也可以选择有效载荷A。
此外,也可以确认在声音流的每个包存在的Stream Number,并在其中选择最小的Stream Number。在此情况下,首先检测包含在声音流的每个包中的有效载荷的个数、和Stream Number的种类。接着,根据检测到的有效载荷的个数和Stream Number的种类,在声音流的包之中选择最小的Stream Number。
Stream Number有存储于Header Object801的Stream Properties Object所包含的Stream Number、或存储于Header Object801的Header ExtensionObject所包含的Extended Stream Properties Object的Stream Number,所以需要如上述那样检测。
此外,也有在Header Object801中包含有没有记述Stream Number的有效载荷的情况。因此,Stream Number,可以是Data Object802中的Stream ID(Stream Number)被检测,而不是存储于Header Object801的streamProperties Object所包含的Stream Number。
以上,本发明的实施方式2的影像声音再现装置100从声音流的包的多个有效载荷之中任意地选择需要的有效载荷、并再组合为在一个包中包含一个有效载荷的声音流的包,由此能够对在一个处理单位中有多个不同的处理块的流进行再现。
由此,能够实现不变更或改造没有设想在一个处理单位中有多个不同的处理块的影像声音流而制作的已有的解码部而能够再现在一个处理单位中有多个不同的处理块的流的影像声音再现装置及其方法。
进而,由于能够使再组合的一个处理单位的尺寸变小,所以也能够减小流的尺寸。
此外,在具有在有不需要的处理块的情况下不能处理的解码部103的影像声音再现装置100中,也能够进行再现。此外,即使是在有不需要的处理块的情况下能够处理的解码部,也能够避免不需要的处理块持续所带来的影像中断或声音中断等。
(实施方式3)
为了实现不能对具有多个有效载荷的包进行解码的解码部103能够对由具有多个有效载荷的包构成的流进行再现的影像声音再现装置100,在上述实施方式1中,对于通过具备具有检测部1021及分割部1022的流控制部102、将包分割并再组合为在一个包中包含一个有效载荷的声音流的包的情况进行了说明。在实施方式2中,对于通过具备具有检测部1021、基准1024、选择部1025及变换部1026的流控制部102、任意地选择需要的有效载荷并再组合为在一个包中包含一个有效载荷的声音流的包的情况进行了说明。
在实施方式3中,对于不能将具有多个有效载荷的包进行解码的解码部103能够对由具有多个有效载荷的包构成的流进行再现的另一影像声音再现装置100进行说明。
以下,利用附图对有关本发明的实施方式3进行说明。
图15是表示本发明的实施方式3的流控制部102的结构的框图。
流控制部102具备检测部1021、非选择指示部1027、和无效化部1028。
检测部1021相当于本发明的检测单元,从上述影像声音流中检测上述影像声音流的每个包所包含的有效载荷的个数。具体而言,从来自输入部101的声音流中,检测每一个包所包含的有效载荷的个数。
非选择指示部1027相当于本发明的选择单元,从上述包所包含的有效载荷中,选择属于1个声音流的有效载荷。具体而言,基于由检测部1021检测到的有效载荷的个数的信息,决定非选择的有效载荷,并对无效化部1028指示无效化的有效载荷。
这里,与实施方式2同样,非选择指示部1027也可以具备基准1024。基准1024具有表示由无效化部1028选择的有效载荷的基准的选择基准信息。非选择指示部1027基于检测部1021检测到的个数和由基准1024保持的选择基准信息,决定非选择的有效载荷,并对无效化部1028指示无效化的有效载荷。
无效化部1028通过使由上述选择单元选择的有效载荷以外的有效载荷无效化来再组合上述影像声音流的包。具体而言,由输入部101输入的声音流的包所包含的多个有效载荷中,使由非选择指示部1027指示的有效载荷无效化。
图16是用来说明本发明的实施方式3的流控制部102的处理的流程图。
首先,流控制部102的检测部1021检测从输入部101输入的声音流的每个包的有效载荷的个数(S301)。
接着,流控制部102的非选择指示部1027基于由检测部1021检测到的有效载荷的个数的信息,指示非选择的有效载荷。即,非选择指示部1027基于由检测部1021检测到的有效载荷的个数的信息,决定非选择的有效载荷,并对无效化部1028指示无效化的有效载荷(S302)。
接着,流控制部102的无效化部1028在从输入部101输入的声音流的包所包含的多个有效载荷中,使由非选择指示部1027指示的有效载荷无效化(S303)。
由此,能够将在一个包中包含有多个有效载荷的声音流的包再组合为在一个包中包含有一个有效载荷的声音流的包。
图17是用来说明再组合声音流的包含多个有效载荷的包的图。
在图17中,作为声音流的一个处理单位的包包含有作为两个处理块的有效载荷A及有效载荷B。即,声音流的某个第1号包300(包1)包含A种类的有效载荷301(有效载荷A)、和B种类的有效载荷302(有效载荷B)。
此外,在包300(包1)中有头,在头中包含有包300(包1)的尺寸、以及包300(包1)所包含的有效载荷的个数等的信息。此外,在有效载荷301(有效载荷A)及有效载荷302(有效载荷B)中也有头,包含有有效载荷301(有效载荷A)及有效载荷302(有效载荷B)的尺寸等的信息。
另外,在图17中,将声音流的头(Header Object801)省略图示。
在图17中,如上所述,通过流控制部102的检测部1021、非选择指示部1027及无效化部1028,从声音流的包的多个有效载荷之中任意地选择需要的有效载荷,并通过将不需要的有效载荷无效化,再组合声音流的包,以使在一个包中包含有一个有效载荷。
图17(a)是表示为了再现有效载荷A而再组合声音流的包含多个有效载荷的包的图。
通过检测部1021检测包含在包300(包1)中的有效载荷的个数。
在非选择指示部1027中,基于由检测部1021检测到的包含在包300(包1)中的有效载荷的个数,决定非选择的有效载荷302(有效载荷B),并对无效化部1028指示无效化的有效载荷302(有效载荷B)。
在无效化部1028中,在由输入部101输入的声音流的包300(包1)所包含的有效载荷301(有效载荷A)及有效载荷302(有效载荷B)中、由非选择指示部1027指示的有效载荷302(有效载荷B)被无效化。
因而,包300(包1)的由非选择指示部1027指示的有效载荷302(有效载荷B)被无效化,而只有有效载荷301(有效载荷A)再组合为有效的包303(包1′)。
图17(b)是表示为了再现有效载荷B而再组合声音流的包含多个有效载荷的包的图。
与图17(a)同样,包含有效载荷301(有效载荷A)及有效载荷302(有效载荷B)的包300(包1)的有效载荷301(有效载荷A)通过无效化部1028被无效化。
因而,包300(包1)的由非选择指示部1027指示的有效载荷301(有效载荷A)被无效化,而只有有效载荷302(有效载荷B)再组合为有效的包304(包1″)。
由此,能够从声音流的包的多个有效载荷之中任意地选择需要的有效载荷,并再组合声音流的包,以使在一个包中只有一个有效载荷是有效的。
另外,作为再组合声音流的包以使在一个包中只有一个有效载荷为有效的其他方法,也可以再复制一个相同的包、不改变包的尺寸而进行无效化以使不存在多个有效载荷。如果利用图17进行说明,则首先,由包300(包1)制作作为拷贝的包303(包1′)和包304(包1″)。接着,使得在包303(包1′)中不存在有效载荷302(有效载荷B),使得在包304(包1″)中不存在有效载荷301(有效载荷A)。接着,将包300(包1)丢弃。
这里,作为使有效载荷不存在的方法,有改写包的头的信息的方法。此外,作为使得不包含如有效载荷301(有效载荷A)那样在包的开头存在的多个有效载荷的方法,有改写有效载荷的开始位置信息的方法。
例如,在ASF文件中,为了形成不包含多个有效载荷的信息,只要将作为存储于Payload Parsing Information902的length type Flags的变量的Multiple Payloads Present的值变更就可以。
此外,在没有有效载荷的开始位置信息的ASF文件中,改写有效载荷的开始位置信息,以使包304(包1″)的开始位置成为有效载荷302(有效载荷B)。这可以通过增大Error Correction Data901的大小来实现。此外,也可以通过增大在Data Object802中位于前面的Data Packet803的PaddingData904来实现。
此外,作为如包303(包1′)那样、使得不存在有效载荷302(有效载荷B)的方法,有使有效载荷302(有效载荷B)例如为装填数据的方法。有时需要随着使将有效载荷302(有效载荷B)为装填数据的动作而改写有效载荷301(有效载荷A)的头。此时,在ASF文件中,例如改写PayloadParsing Information902的Packet Length的变量。
另外,本发明的实施方式3的影像声音再现装置100对于具备不能设想在一个包中存在多个有效载荷的解码部103、但在能够通过包的头等判断为不需要的有效载荷的情况下对被判断为不需要的有效载荷不进行再现的解码部103的影像声音再现装置是适合的。
以上,本发明的实施方式3的影像声音再现装置100能够任意地选择需要的有效载荷,并通过将不需要的有效载荷无效化、再组合为在一个包中包含有一个有效载荷的声音流,所以能够对在一个处理单位中有多个不同的处理块的流进行再现。
由此,能够实现不变更或改造没有设想在一个处理单位中有多个处理块的声音流而制作的解码部、而能够对在一个处理单位中有不同的处理块的流进行再现的影像声音再现装置及其方法。
另外,关于本发明的影像声音再现装置,对于声音流的情况进行了说明,但在影像声音流的情况下也同样。此外,作为处理单位,说明了声音流的包,但并不限于此。作为处理单位,也可以是影像声音流的规定的单位。此外,作为处理块,对包含在声音流的包中的有效载荷进行了说明,但并不限于此。作为处理块,也可以是影像声音流的规定的处理单位的块。
此外,本发明的影像声音再现装置并不限于对声音或影像声音进行再现的装置,只要具有对声音或影像声音进行再现的功能,也可以是记录声音或影像声音的影像声音记录再现装置。
以上,基于实施方式对本发明的影像声音再现装置进行了说明,但本发明并不限于该实施方式。只要不脱离本发明的主旨,将本领域的技术人员想到的各种变形对本实施方式实施的形态、或将不同的实施方式的结构要素组合而构建的形态也包含在本发明的范围内。
本发明能够在影像声音再现装置及其方法中使用,特别是,能够在MP3、AAC、WMA等对压缩编码的声音流进行解码并再现的声音再现播放器、或对由MPEG或H.264等压缩编码的影像和声音两者进行解码并再现的DVD播放器等的影像声音再现播放器等再现影像声音流的影像声音再现装置及其方法中使用。

Claims (17)

1.一种影像声音再现装置,其对影像声音流进行解码并再现,其特征在于,具备:
再组合单元,对所输入的上述影像声音流的包进行再组合;
解码单元,对来自上述再组合单元的上述再组合后的包的影像声音流进行解码;以及
输出单元,输出解码后的影像声音;
上述再组合单元在所输入的上述影像声音流的包中包含有多个有效载荷时,再组合上述影像声音流的包,以使其成为在每个包中有一个有效载荷的包。
2.如权利要求1所述的影像声音再现装置,其特征在于,
上述再组合单元具备:
检测单元,从上述影像声音流中,检测上述影像声音流的每个包所包含的有效载荷的个数;以及
分割单元,通过将上述影像声音流的包分割为由上述检测单元检测到的个数,再组合上述影像声音流的包。
3.如权利要求1所述的影像声音再现装置,其特征在于,
上述再组合单元具备:
检测单元,从上述影像声音流中,检测上述影像声音流的每个包所包含的有效载荷的个数;
选择单元,从上述影像声音流的包所包含的有效载荷中,选择属于一个影像声音流的有效载荷;以及
变换单元,通过将上述影像声音流的包变换为包括由上述选择单元选择的有效载荷的影像声音流的包,再组合上述影像声音流的包。
4.如权利要求1所述的影像声音再现装置,其特征在于,
上述再组合单元具备:
检测单元,从上述影像声音流中,检测上述影像声音流的每个包所包含的有效载荷的个数;
选择单元,从上述包所包含的有效载荷中,选择属于一个影像声音流的有效载荷;以及
无效化单元,通过使由上述选择单元选择的有效载荷以外的有效载荷无效化,再组合上述影像声音流的包。
5.如权利要求3所述的影像声音再现装置,其特征在于,
上述选择单元从上述影像声音流中提取上述影像声音流的头信息,并从上述包所包含的有效载荷中,选择所提取的上述影像声音流的头信息指定的、属于一个影像声音流的有效载荷。
6.如权利要求3所述的影像声音再现装置,其特征在于,
上述选择单元具备:
提取部,从上述影像声音流中,提取与上述影像声音流的每个包所包含的有效载荷有关的信息;
选择基准,用于从上述影像声音流的包所包含的有效载荷中、选择一个有效载荷;以及
选择部,根据由上述提取部提取的上述信息和上述选择基准,选择上述有效载荷。
7.如权利要求6所述的影像声音再现装置,其特征在于,
所提取的上述信息表示有关有效载荷的比特率的信息;
上述选择基准表示要优先选择比特率高的有效载荷的内容;
上述选择部根据上述信息和上述选择基准,从上述包所包含的有效载荷中,选择比特率最高的有效载荷。
8.如权利要求6所述的影像声音再现装置,其特征在于,
所提取的上述信息表示有关有效载荷的压缩编码方式的信息;
上述选择基准表示要优先选择设定的压缩编码方式的有效载荷的内容;
上述选择部根据上述信息和上述选择基准,从上述包所包含的有效载荷中,选择优先级最高的压缩编码方式的有效载荷。
9.如权利要求6所述的影像声音再现装置,其特征在于,
所提取的上述信息表示有关有效载荷的有效载荷号码的信息;
上述选择基准表示要优先选择有效载荷号码小的有效载荷的内容;
上述选择部根据上述信息和上述选择基准,从上述包所包含的有效载荷中,选择有效载荷号码最小的有效载荷。
10.如权利要求6所述的影像声音再现装置,其特征在于,
所提取的上述信息表示有关有效载荷的比特率的信息;
上述选择基准由要优先选择比特率高的有效载荷的内容的第1选择基准、和表示上述解码单元能够解码的条件的第2选择基准构成;
上述选择部根据上述信息、上述第2选择基准、和上述第1选择基准,从上述包所包含的有效载荷中,选择在上述第2选择基准表示的条件之中比特率最高的有效载荷。
11.如权利要求6所述的影像声音再现装置,其特征在于,
所提取的上述信息表示有关有效载荷的压缩编码方式的信息;
上述选择基准由通过压缩编码方式设定优先级的第1选择基准、和表示上述解码单元能够解码的条件的第2选择基准构成;
上述选择部根据上述信息、上述第2选择基准、和上述第1选择基准,从上述包所包含的有效载荷中,选择在上述第2选择基准表示的条件之中优先级最高的压缩编码方式的有效载荷。
12.如权利要求4所述的影像声音再现装置,其特征在于,
上述无效化单元通过写入由上述选择单元选择的有效载荷以外的有效载荷是伪数据的信息来进行无效化。
13.如权利要求4所述的影像声音再现装置,其特征在于,
上述无效化单元,复制与由上述选择单元所选择的有效载荷的个数相应的数量的上述包,并对所复制的上述包所需要的有效载荷以外的有效载荷进行无效化。
14.如权利要求13所述的影像声音再现装置,其特征在于,
上述无效化单元通过写入所复制的上述包所需要的有效载荷以外的有效载荷是伪数据的信息来进行无效化。
15.一种影像声音再现方法,其对影像声音流进行解码并再现,其特征在于,包括:
再组合步骤,对所输入的上述影像声音流的包进行再组合;
解码步骤,对在上述再组合步骤中进行上述再组合后的包的影像声音流进行解码;以及
输出步骤,输出解码后的影像声音;
上述再组合步骤在所输入的上述影像声音流的每个包中包含有多个有效载荷的情况下,对包进行再组合,以使在每个包有一个有效载荷。
16.一种电路,其对影像声音流进行解码并再现,其特征在于,具备:
再组合电路,对所输入的上述影像声音流的包进行再组合;
解码电路,对来自上述再组合电路的上述再组合后的包的影像声音流进行解码;以及
输出电路,输出解码后的影像声音;
上述再组合电路在所输入的上述影像声音流的每个包中包含有多个有效载荷的情况下,对包进行再组合,以使在每个包有一个有效载荷。
17.一种集成电路,其对影像声音流进行解码并再现,其特征在于,具备:
再组合单元,对所输入的上述影像声音流的包进行再组合;
解码单元,对来自上述再组合单元的上述再组合后的包的影像声音流进行解码;以及
输出单元,输出被解码的影像声音;
上述再组合单元在所输入的上述影像声音流的每个包中包含有多个有效载荷的情况下,对包进行再组合,以使在每个包有一个有效载荷。
CN2008101306112A 2007-06-25 2008-06-25 影像声音再现装置 Expired - Fee Related CN101335036B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007167014A JP4750759B2 (ja) 2007-06-25 2007-06-25 映像音声再生装置
JP167014/2007 2007-06-25

Publications (2)

Publication Number Publication Date
CN101335036A CN101335036A (zh) 2008-12-31
CN101335036B true CN101335036B (zh) 2012-01-25

Family

ID=40136595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101306112A Expired - Fee Related CN101335036B (zh) 2007-06-25 2008-06-25 影像声音再现装置

Country Status (3)

Country Link
US (1) US8306406B2 (zh)
JP (1) JP4750759B2 (zh)
CN (1) CN101335036B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN109979472B (zh) 2013-09-12 2023-12-15 杜比实验室特许公司 用于各种回放环境的动态范围控制

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1212570A (zh) * 1997-08-22 1999-03-31 日本电气株式会社 视频数据存储方法
CN1402554A (zh) * 2001-08-18 2003-03-12 三星电子株式会社 压缩图像比特流的变码方法
CN1717047A (zh) * 2003-12-05 2006-01-04 Lg电子株式会社 用于运动图像数据流业务的数据流文件、方法和系统
CN1848958A (zh) * 2005-04-14 2006-10-18 中兴通讯股份有限公司 一种在网络中传输视频流的方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2932886B2 (ja) * 1993-03-10 1999-08-09 松下電器産業株式会社 ディジタル信号記録方法
US6115537A (en) * 1994-02-18 2000-09-05 Matsushita Electric Industrial Co., Ltd. Digital signal recording and reproducing apparatus
JP3097437B2 (ja) * 1994-03-14 2000-10-10 松下電器産業株式会社 圧縮動画像の記録方法と再生装置
JPH11112569A (ja) * 1997-10-07 1999-04-23 Matsushita Electric Ind Co Ltd データ転送システム
AU5758999A (en) * 1998-09-25 2000-04-17 Matsushita Electric Industrial Co., Ltd. Information recording medium, information recording/reproducing method, and information recording/reproducing device
WO2000060872A1 (fr) * 1999-03-31 2000-10-12 Matsushita Electric Industrial Co., Ltd. Procede et dispositif de decodage continu de flux video comprenant des sequences de donnees ayant des frequences de trame differentes
JP4064036B2 (ja) * 1999-03-31 2008-03-19 松下電器産業株式会社 インターレース方式とプログレッシブ方式が混在する映像ストリームのシームレス復号装置
JP3756367B2 (ja) * 1999-12-16 2006-03-15 松下電器産業株式会社 ビデオサーバおよびプログラム記録媒体
JP2003163889A (ja) * 2001-11-26 2003-06-06 Matsushita Electric Ind Co Ltd ストリーム記録再生システム,及びストリーム記録再生装置
JP3544967B2 (ja) * 2001-12-27 2004-07-21 株式会社東芝 システムヘッダを持つ音声情報の処理システム
JP4242613B2 (ja) * 2002-07-31 2009-03-25 パナソニック株式会社 受信システム、デジタル放送システム、および受信方法
CN100444256C (zh) * 2003-02-28 2008-12-17 松下电器产业株式会社 光头及具备它的光记录再生装置
US7483532B2 (en) * 2003-07-03 2009-01-27 Microsoft Corporation RTP payload format
EP1775726A4 (en) 2004-07-22 2009-05-27 Panasonic Corp PLAYING DEVICE, PLAY PROCESS, PROGRAM AND COMPUTER READABLE RECORDING MEDIUM
JP4178521B2 (ja) * 2004-09-06 2008-11-12 日本ビクター株式会社 符号化映像信号の記録方法、及び映像信号符号化装置
JP4676493B2 (ja) * 2005-04-07 2011-04-27 パナソニック株式会社 記録媒体、再生装置、記録方法
JP4481911B2 (ja) * 2005-09-30 2010-06-16 株式会社東芝 記録再生装置
US7609958B2 (en) * 2006-08-01 2009-10-27 Eastman Kodak Company Automatic focus system calibration for image capture systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1212570A (zh) * 1997-08-22 1999-03-31 日本电气株式会社 视频数据存储方法
CN1402554A (zh) * 2001-08-18 2003-03-12 三星电子株式会社 压缩图像比特流的变码方法
CN1717047A (zh) * 2003-12-05 2006-01-04 Lg电子株式会社 用于运动图像数据流业务的数据流文件、方法和系统
CN1848958A (zh) * 2005-04-14 2006-10-18 中兴通讯股份有限公司 一种在网络中传输视频流的方法

Also Published As

Publication number Publication date
CN101335036A (zh) 2008-12-31
JP4750759B2 (ja) 2011-08-17
JP2009005317A (ja) 2009-01-08
US8306406B2 (en) 2012-11-06
US20080317438A1 (en) 2008-12-25

Similar Documents

Publication Publication Date Title
CN103905841B (zh) 自适应网络带宽的多协议多播放器视频播放方法和系统
US7769477B2 (en) Audio file format conversion
CN1643605B (zh) 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
CN104253999A (zh) 用于发送内容的设备和方法
CN102014262A (zh) 一种硬盘录像机、多媒体格式转换的系统及方法
JP2009534696A (ja) 複数のデジタルデータセットを符号化および復号化するための装置および方法
JP4481304B2 (ja) 異なるデータフォーマットを格納する記憶装置
CN101164103B (zh) 复用器和复用方法
KR20010071723A (ko) 고정 및 가변 속도 데이터 스트림용 트랜스코더
CN101335036B (zh) 影像声音再现装置
JP2013528823A5 (zh)
JP2013528823A (ja) 音声データの記憶方法及び装置
US20080147218A1 (en) Recording/reproduction apparatus
US8369456B2 (en) Data processing apparatus and method and encoding device
CN1848939B (zh) 信息管理系统、信息管理装置和信息管理方法
US20070003229A1 (en) Content recording apparatus, content reproducing apparatus, and method for recording parameter information
CN100498951C (zh) 记录方法
JP4649901B2 (ja) 曲の符号化伝送のための方法および装置
KR20140046567A (ko) 파일 변환이 가능한 오디오 시스템 및 방법
JP2008197199A (ja) オーディオ符号化装置及びオーディオ復号化装置
JP2008287792A (ja) 映像音声再生装置及びその信号出力方法
JP2003337596A (ja) オ−ディオデータ処理方法及び装置
WO2009095971A1 (ja) オーディオレジューム再生装置及びオーディオレジューム再生方法
CN102262880A (zh) 一种音频提取装置和方法
KR100871997B1 (ko) 고배속으로 레코딩되는 디지털 오디오 데이터의 실시간재생 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120125

Termination date: 20180625