CN1669309A - 特技模式重放期间的音频数据删除和消音 - Google Patents

特技模式重放期间的音频数据删除和消音 Download PDF

Info

Publication number
CN1669309A
CN1669309A CNA038093189A CN03809318A CN1669309A CN 1669309 A CN1669309 A CN 1669309A CN A038093189 A CNA038093189 A CN A038093189A CN 03809318 A CN03809318 A CN 03809318A CN 1669309 A CN1669309 A CN 1669309A
Authority
CN
China
Prior art keywords
audio
video
playback
silent
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038093189A
Other languages
English (en)
Other versions
CN100429941C (zh
Inventor
R·L·布莱尔
S·林
M·A·舒尔茨
R·W·施米特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
RCA Licensing Corp
Original Assignee
RCA Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RCA Licensing Corp filed Critical RCA Licensing Corp
Publication of CN1669309A publication Critical patent/CN1669309A/zh
Application granted granted Critical
Publication of CN100429941C publication Critical patent/CN100429941C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

本发明涉及用于在快进重放视频特技模式期间的音频节目重放的方法和设备。存储媒体(102)读取器可配置成从存储媒体、如DVD中读取编码数字数据。编码数字数据可以是具有相应格式化的视频和音频帧的视频呈现。音频处理器(122)可在音频帧的所选块中插入静寂帧,以及音频帧的一些部分可被删除以便补偿视频特技模式重放。所得的音频帧可经过连接而为各种视频特技模式重放创建1X音频。

Description

特技模式重放期间的音频数据删除和消音
技术领域
本发明涉及改进的特技模式重放,更具体地讲,涉及与以不同于正常速度的速度重放的视频段相关联的音频节目的特技模式重放的改进。
相关技术描述
DVD特技模式可包括正常重放的加速或者减速,用以搜索盘上的某一具体位置,或者查看在正常速度下通常会遗漏的剪辑的细节。按照惯例,正常重放速度可表示为1X。音频和视频特技模式都是可能的,而且,两者在市面出售的DVD播放器上都可见到。然而,快速或慢速重放音频的传统方法已证明是有问题的。数字信号处理器、特别是现有产品中使用的音频数字信号处理器的进步已经使更复杂的实时处理有可能用于改进的音频特技模式。
使用视频特技模式时存在的一个问题涉及对应于重放视频段的音频的处理。例如,当用户对节目视频段加速或减速时,所重放的相应音频段会失真。典型地,在快速特技模式期间,音频段中的音频样本可变换到较高频率,而在低速特技模式期间,可变换到较低频率。重放速度增大到正常重放速度的大约1.5至3倍的快速特技模式往往导致人话音的音调较高。这种较高音调的音频重放(花鼠效果)可能使人讨厌,而且在许多情况下,收听者可能难以理解。相反地,低频特技模式可产生即便可以听明白、但在听觉上也使人不舒服的低频抖动。
在视频特技模式期间,如本文所述,为了获得最有用的音频重放,也有必要考虑具体特技模式的性质。例如,虽然可能利用各种技术为1.5X或2X特技模式提供可理解音频,但是当特技模式包括5X或者10X重放时,这些技术可能提供不令人满意的结果。在这么高的重放速度下,重放与视频同步的音频声道的任何尝试都可能产生无法理解的话音,因为表达言词时需要的速度太快。
为了避免听到DVD特技模式可能产生的各种各样的音频假信号,传统DVD播放器常常在视频特技模式期间静音。但是,这不是完全令人满意的解决方法,因为这种模式中的声音可能是令人感兴趣的。因此,在视频特技模式期间,如果DVD播放器可通过某种克服先有技术限制并实现所希望的听觉上使人愉悦的音频重放的方式重放音频,这是有利的。
发明概述
本发明涉及用于在视频呈现的快进视频特技模式重放期间播放音频节目的方法和设备。本方法包括:从存储媒体中读取编码数字数据,其中编码数字数据包括用于视频呈现的视频帧和相应的音频帧;定期丢弃音频帧的所选块;以及选取剩余的块集合的至少一部分用于音频重放。为了在连续块之间划界,用于静寂的音频重放时段的剩余的块集合被插入连续块之间。系统产生与用于音频重放的剩余块集合以及静寂时段对应的音频重放信号。为了增强可理解性,用于音频重放的剩余块集合的重放有利地以大约1X到1.5X之间的速率执行,而与视频特技模式重放速度无关。静寂时段被有选择地选择为足够长的,允许听众在为音频重放选择的连续块之间划界。例如,已经发现大约100到500毫秒之间的静寂时段是适用的。更短的静寂时段使得难以感觉连续音频块之间的分隔。更长的静寂时段产生过长的停播时间,这时用户接收不到任何音频信息。
可以通过使用于音频重放的剩余块集合的一部分静音,或者通过插入经典型编码以产生静寂的多个音频帧,插入静寂时段。音频帧的所选块的定期丢弃、音频重放的剩余块集合的选择以及静寂时段的插入最好以对应于视频特技模式的所选速度的速率来执行。但是,用于音频重放的剩余块集合的重放时间可能超出用于音频重放的剩余块集合最初相关联的视频呈现的相应部分的重放。
存储媒体可从包括DVD、磁硬盘、视频CD以及固态存储装置的组中选取。编码数字数据最好可以是MPEG格式,在该情况下,读取步骤还包括对MPEG格式的比特流进行解码以得到音频样本。
附图简介
图1是DVD装置的框图,它可配备根据本发明方案的一个或多个高级操作功能。
图2是流程图,可用于理解以例如图1的装置100的示范媒体播放器实现的本发明方案。
图3是示范框图,可用于理解根据本发明方案的帧的插入和删除。
附图详细说明
本发明可用于执行在录制于任何适当数字数据存储媒体上的任何类型的数字视频的视频特技模式期间的音频节目的正常重放。为方便起见,将在利用传统MPEG-1或MPEG-2格式的DVD媒体的上下文中描述本发明。但是,本领域的技术人员会理解,本发明不限于这个方面。数字数据存储媒体可包括能够存储大量数字数据以便以后检索和重放的任何媒体。本文所用的“存储媒体”可包括但不限于用来存储数据的光学的、磁性的和电子的装置。示范数字存储媒体可包括数字通用光盘(DVD)、磁光盘、磁硬盘、视频CD或常规CD、或者诸如动态随机存取存储器(DRAM)或同步DRAM(SDRAM)等固态存储器。
提供存储媒体读取器,用于从数字数据存储媒体中读取编码数字数据。图1是在其中可实现本发明的示范DVD视频播放器的框图。装置100可具有从数字存储媒体中读取已存储数据的能力。参照图1,存储媒体盘102可以是可重写DVD。装置100可包括机械组件104、控制部分120以及音频/视频(A/V)输出处理部分170。大多数模块到不同部分的分配是显而易见的,而一部分模块的分配是为了方便而作出的,对于理解装置100的操作并不重要。重要的是应该知道,如果数字数据存储媒体是固态装置,则机械组件104不是实施本发明所必需的。在这种情况下,在数字存储媒体中存储的编码数字数据可以由控制CPU 122直接存取并且在轨道缓冲器172中缓存。
尽管如此,机械组件104可包括用于旋转盘102的电动机106以及适合在旋转盘102上移动的拾取部件108。安装在拾取部件108上或者与其相关的激光器可照射存储在轨道上的数据,以便重放视频和/或音频节目数据。为了理解本发明,该盘是否为可记录类型是不相关的。与拾取部件108相关的激光器以及电动机106可由伺服机构110来控制。伺服机构110还可配置成接收表示从DVD盘102上的螺旋轨道读取的数据的输入重放信号。重放信号还可用作纠错电路130的输入,纠错电路130可视为控制部分120的一部分或者A/V输出处理部分170的一部分。
控制部分120可包括控制中央处理器(CPU)122。伺服机构110还可视为控制部分120的一部分。可在存储器中提供适当的软件或固件,用于控制CPU 122执行的传统操作。另外,可提供用于本文所述的高级功能的程序例程,用于控制CPU 122。
用于观众可激活的功能的控制缓冲器132可配置成表明那些当前可用的功能,即播放、倒退、快进、慢放、暂停/播放以及停止。暂停功能类似于大多数盒式磁带录像机(VCR)上常见的暂停操作。暂停功能可具有手动中断预先录制的呈现内容的重放的功能,以便从重放内容中删除不需要的片段,例如广告、预告片等。可提供高级功能缓冲器136,用于实现其它高级重放功能,包括本文所述的特技模式的控制。重放特技模式可包括以标准1X重放速度以外的速度进行的快进和倒退重放。输出处理部分170可包括纠错模块130和轨道缓冲器或输出缓冲器172,在缓冲器172中,从盘中读出的数据可被缓存,再组装成信息包以便进一步处理。条件访问电路174可处理信息包,控制信息包通过多路分离器176进入相应视频和音频处理路径中的传播。视频可由解码器178例如从MPEG-1或MPEG-2格式进行解码,并以诸如ATSC、NTSC、SECAM或PAL等标准电视信号格式编码。音频可由解码器182例如从MPEG-1或MPEG-2格式进行解码,并由音频数/模(D/A)转换器184转换成模拟形式。音频D/A 184可处理从音频解码器182接收的数字音频,并产生模拟输出信号。
音频解码器182最好包括帧缓冲器,用于在解码之前临时存储音频帧。音频解码器182的操作可由控制CPU 122来控制。因此,控制CPU 122可控制音频解码器的操作,其中包括使它有选择地丢弃帧、使某些帧静音、插入仅有静寂的帧以及只对控制CPU122可能指定的所选帧进行解码。这些动作可在音频解码器中执行。但是,应当知道,本发明不限于这个方面,音频帧的这种处理可由插入音频解码器182之前或之后的其它处理单元来处理。最后,这种处理还可直接由控制CPU来执行,其中的通信由适当的系统通信总线、例如总线181来提供。一般来讲,在这方面全部所需的是音频帧缓冲器以及根据将要详细描述的有利方法有选择地消除或修改将被播放、丢弃或消音的帧的能力。
图2是流程图,可用于理解以示范媒体播放器、例如装置100实现的本发明方案。结合快进重放来描述图2所述的过程,因为一般不需要反向特技模式的音频重放。但应该理解,本发明不限于此。本文所述的本发明方案可应用于反向重放特技模式,其中采用类似于图2所示的技术。
参照图2,该过程可在步骤200开始,这时装置100以重放模式工作。在步骤200,在重放模式期间,可从DVD存储媒体102中读取编码数字数据。在步骤205,控制CPU 122可监测来自高级功能缓冲器136的用户输入。在步骤210,控制CPU 122可确定是否已经选择特技模式、例如快进重放速度。如果在步骤210没有选取特技模式,则控制CPU 122返回到步骤200的处理,以及装置100继续从DVD存储媒体102中读取编码数字数据。在选取了特技模式的情况下,控制CPU 122可继续进行用于特技模式音频重放的步骤212到224。
由于控制CPU 122已经处理了例如+2X的示范用户命令,因此特技模式速度在步骤212是已知的,因而所需的音频删除总量等于特技播放速度的倒数,在本例中为1/2,即一半音频数据没有被解码。在214,控制CPU 122可选择或计算一系列有利的音频数据,使得量化成TV帧的持续时间被丢弃、播放或消音,从而得到用于解码的音频数据的所需数量或持续时间,在本例中为重放数据的1/2。一旦计算了这个比率,过程可在步骤215中继续进行:读取下一组编码数字数据,其中包括与特技模式重放相关的音频数据的视频帧和相应的TV帧持续时间间隔。本文所用的TV帧可称作具有大约1/30秒的持续时间的公共视频帧。在一个具有48kHz采样率的示范数字音频系统中,在一个30Hz TV帧的周期内将出现大约1600个音频样本。但是,本发明不限于此,在本发明的范围内,也可采用其它帧频。以下音频处理步骤可直接由控制CPU 122来执行,或者通过利用例如可在播放器100中提供的现有缓冲器和数字音频处理电路来执行。例如,音频解码器182可在控制CPU 122的控制下用于这个目的。
在任何情况下,在步骤216中,对应于从存储媒体中检索的编码数字数据的音频帧块可有选择地根据在步骤214中计算的音频数据的被丢弃、播放和消音的TV帧间隔的比率来处理。选择性处理可通过附加指示标志或首标以表明步骤214中确定的处理类型来执行。这些指示标志或首标在选择性处理期间被剥离。因此,在步骤216,被标记或选择为用于丢弃的音频帧被删除,或者没有从数据流中读取或提取。在步骤218,剩余的音频帧集合的至少一部分按照步骤214中确定的比率被标记为重放或消音。此外,在步骤220,被指定或标记为静寂的帧的所选部分被静音。
重放音频静寂可通过使音频数据处理静音来实现。例如,在数/模转换,该转换可被禁止,或者音频输出在视频帧中所确定的、具有例如5帧或大约166毫秒的持续时间的示范间隔被静音。这些静音方法要求谨慎的实现,以免产生不想要的瞬时音频失真。或者,使选择用于重放的音频数据中所选的一部分静音,表示静寂的音频数据可被转换为重放数据流以产生如步骤214中确定的静寂时段,其中具有TV帧间隔中所需的持续时间。另外,其它技术可用来实现解码音频静寂,例如,音频静寂的所需持续时间可预存在存储器中,并且通过根据步骤214把存储器读取指针从缓存的重放音频流重新定向到所存储的静寂来适当地读取。在另一个方案中,待消音或静音的音频数据可标记为非音频,从而被数/模转换器忽略。但是,这种静音方法要求谨慎的实现,以免在后续音频处理级中产生不想要的瞬时音频失真。在又一个方案中,静音可通过在数/模转换器输入上断言全部零值来实现。消音选项中的任一个可用于步骤220中,只要避免了不想要的音频瞬变,而且静音持续时间与步骤214中所确定的被丢弃、播放和消音的帧持续时间的比率一致。
如果在步骤220中对于使所选帧静音进行了判定,则控制CPU 122可执行静音算法,以便使音频帧的所选块内的连续音频数据静音。静音可按照以上所述来实现,或者通过本领域已知的算法来实现,而且可根据需要以软件或固件来实现。
在步骤222中,特技模式音频重放信号可由控制CPU 122产生。所产生的音频重放信号可由在步骤216之后保留的音频数据集组成,并且可包括所有被消音或静音的音频帧。音频解码器182可连接音频帧的包含剩余音频和静寂表示数据集的块,可在特技模式操作期间从其中形成音频重放信号。
在步骤222产生音频重放信号之后,在步骤224执行测试,以便确定是结束特技播放模式并返回步骤210,还是继续特技模式、例如快进重放速度,并重复步骤215到222。
视频帧的处理可与TV帧大小的音频数据集的处理同时进行。控制CPU 122可配置信息包视频解码器178,以便以nX速度执行特技模式视频重放,其中n等于所选特技模式重放速度与1X的正常重放速度之比。例如,对于为正常速度两倍的重放速度,n=2。有各种方式可将信息包视频解码器178配置成以高于正常速度的速度来提供视频重放。例如,信息包视频解码器178可配置成丢弃某些解码视频帧。例如,可丢弃每隔一个视频帧,从而提供2X重放的情况。但是要理解,其它方法也可用来改变视频重放速度,本发明不限于实现高于正常视频重放速度的任何特定方法。本领域的技术人员应该知道,图2的示范步骤以及其中所述的顺序不是意在限制本发明的范围。因此,各步骤的其它顺序也是可行的,只要没有背离本发明的实质。例如,步骤218、220和222可以在步骤216之前执行。
图3是示范框图,可用于理解根据本发明方案的音频数据的TV帧持续时间集合的插入和删除。如图所示,图3包含四个图形,即3a、3b、3c和3d。图3a是图表,说明以标称每秒30帧(fps)的TV帧频表示的示范选择的8秒连续音频数据块的边界。各连续边界对、例如302和304可表示具有30个TV帧或标称为一秒的持续时间的音频集合的开始和结束。音频数据可排列成集合,其中各集合包含具有30帧的持续时间的数据。这些集合编号为集合1到集合8。电视帧频被用作时基,以便于理解,帧排列成集合以及其顺序编号并不是意在限制本发明,而只是为了帮助理解。图3b、图3c和图3d通过与图3a所示对齐的帧边界和集合来描述。
图3b描述伴随2X视频特技模式、用于再现的示范音频帧序列。根据本发明,图3b说明一种用于实现被播放、删除和消音的帧的比率的可能方案。例如,集合1中的25个连续帧的第一时间间隔可被保留以用于重放,其中5帧的剩余间隔通过上述任何方法来静音。在集合2中,与五个前导静音或消音的帧相邻的下一个30帧的间隔可以被删除,即集合2中的全部帧都可被删除。对于集合3中的前25个连续帧的持续时间,音频数据被保留以用于重放,其中集合3的剩余五帧被静音或消音。与集合3的5个被消音的帧相邻的集合4的下一个间隔30帧可被删除。在集合5中,前25个连续帧的音频数据被标记用于重放,其中集合5的剩余5帧被静音。在帧6中,与集合5的5个静寂帧相邻的全部30帧被删除。对于集合7中的前25帧间隔,音频数据被标记用于重放,其中剩余的5帧持续时间被静音。在集合8中,对于30帧的持续时间,所有音频数据被删除。可通过连接包括所需的被标记的重放音频数据加上被静音或消音的典型音频数据的剩余帧,形成特技模式音频重放。这样,音频数据流可包括集合1、集合3、集合5和集合7。这可被称作25-5-30序列,其中,25帧被保留,随后的5个连续帧可被消音,随后的30个连续帧可被删除。被播放、静音和丢弃的帧的比率是5∶1∶6。因此,对于2X视频重放,25-5-30序列可产生1X音频重放速率,其中在连续的音频数据块之间具有166毫秒的间隙或静寂。本发明的音频处理序列有利地产生重放音频信号,它具有有效的1X播放速度,而且内容的频率的音调不会改变。
具有有效的1X播放速度的重放音频信号的形成在2X实例中是通过删除标称50%音频样本并连接剩余音频数据产生的。数据连接可能妨碍所得音频信号的可理解性。因此,为了防止声音被混合,申请人有利地用静寂或音频静音时段来散布在所选的重放音频样本中。为了在音频的相邻块之间提供足够的间隙或划界,已经发现至少大约100毫秒的静寂是适宜的。这些静寂时段允许听众区分独立的话音块。也可使用更长的静寂,但是已经发现,超过大约500毫秒的静寂时段一般会导致过量的静寂和不必要的听众心理声学疲劳。
图3b所示的音频段的示范描绘说明根据本发明的一种可能方案。但是,已经发现,在图3b中,被播放、静音和丢弃的音频间隔的25-5-30序列可能导致由于重放音频的较短间隔而创建被截短或无意义的词语。图3c说明根据本发明方案排列帧的所选块以产生具有改进的可理解性的1X音频重放速率的另一个实施例。有利的是,图3c所示的音频序列可通过提供采用所产生静寂的短间隔插入或中断的重放音频的更长相连时段,帮助消除无意义词语的创建。
参照图3c,在集合1的30帧间隔期间出现的全部音频数据被保留。在集合2中,最初25帧间隔中出现的音频可被保持,其中剩余的5个连续帧被消音。分别在集合3和集合4的30帧期间出现的全部音频可被删除。在集合5中,30帧间隔内的全部音频被保持。在集合6中,前25帧的时段内的音频被保持,而在5个剩余连续帧间隔中出现的音频被消音。在集合7和集合8中的帧的间隔期间出现的全部音频可被删除。这样,特技模式音频可通过连接可包括集合1、集合2、集合5和集合6的剩余帧来产生。音频静寂和删除的这种顺序可称作55-5-60序列,其中,音频的55帧持续时间被保持,随后5个连续帧的音频被消音,以及对于随后60个连续帧的持续时间,音频被删除。因此,对于示范的2X视频重放,图3c的55-5-60音频处理序列在2X视频特技模式期间产生1X音频重放速率,而且如上所述,与正常播放速度操作期间所产生的相比,音频内容的音调基本上没有改变。
图3d说明根据本发明方案排列音频数据的所选块、以便于3X视频特技模式的音频重放的另一个实施例。有利的是,图3d的方案也可帮助消除被截短的无意义词语的创建。参照图3d,在集合1的全部30帧期间出现的音频数据被保留。在集合2中,前25帧期间的音频被保持,而在5个剩余连续帧中出现的音频被消音。集合3、4、5和6的帧间隔期间出现的音频数据被删除。在集合7中,对于该集合的所有帧保留音频。在集合8中,前25帧期间出现的音频被保持,5个剩余连续帧中出现的音频被消音。虽然图3d中没有示出,但30帧的后4个连续集合均可被删除。特技模式音频重放可再次通过连接可包括在集合1、集合2、集合7和集合8期间所出现的音频的剩余音频数据段来形成。这种选择顺序可称作55-5-120序列,其中,具有55帧持续时间的音频被保持,随后5个连续帧期间的音频数据被消音,以及对于随后120个连续帧的持续时间,音频数据被删除。值得注意的是,在3X视频重放时,55-5-120序列在视频特技模式期间产生1X音频重放,其中音频内容的音调基本上不会改变。
本领域的技术人员会知道,其它顺序是可行的,只要没有违背本发明的实质。重要的是,30fps用作时间参考整体上意在使本领域的技术人员认识到如何实施本发明,而不是意在限制本发明的范围。此外要知道,还存在其它TV帧频,例如在各种ATSC标准中,采用60fps的标称帧频,而在某些国家,采用25fps的帧频,但是,本发明方案同样适用。
对音频帧的有利删除和消音在视频特技模式期间产生1X音频重放。因此,所得音频与视频内容保持密切的时间关系,同时在初始对口型条件与预定最大量的失同步之间循环。因此,这种有利方案可为播放速度音频传输提供基本正常的音调,同时与更高速度特技播放节目传输速率保持循环或密切的周期关系。本发明的音频序列控制在具有有限处理能力的应用中可能极为重要。
值得注意的是,本发明可通过硬件、软件或者硬件和软件的组合来实现。根据本发明的机器可读存储器可在一个计算机系统中以集中方式来实现,例如控制CPU 122,或者以其中不同单元分布在若干互连的计算机系统上的分布方式来实现。适合执行本文所述方法的任何种类的计算机系统或其它设备是可接受的。
具体来讲,虽然本文所述的本发明考虑了图1的控制CPU 122,但硬件和软件的典型组合可以是带有计算机程序的通用计算机系统,当计算机程序被加载并执行时,控制计算机系统和类似于图1所示的DVD播放器系统,使它执行本文所述的方法。本发明还可嵌入计算机程序产品中,计算机程序产品包括能够实现本文所述方法的所有功能,并且在加载到计算机系统中时能够执行这些方法。
本上下文中的计算机程序可意味着指令集以任何语言、代码或符号的任何表达形式,该指令集用于使具有信息处理能力的系统直接执行或者在以下两个步骤之后或其中一个步骤之后执行特定功能:(a)转换到另一种语言、代码或符号;以及(b)以不同的材料形式再现。

Claims (20)

1.一种用于在视频呈现的视频特技模式重放期间播放音频节目的方法,所述方法包括:
读取包含视频帧和相应音频帧的编码数字数据(200);
定期丢弃所述音频帧的所选块(216);以及
在所述丢弃步骤之后剩余的所述块的至少一部分之间散布静寂时段(220),从而形成用于音频重放的信号。
2.如权利要求1所述的方法,其特征在于还包括以下步骤:
控制所述丢弃(214)和所述散布步骤,以便保持大约1X到1.5X之间的音频重放速率。
3.如权利要求1所述的方法,其特征在于还包括以下步骤:
为任何视频特技模式重放速度的大约1X的音频重放控制所述丢弃(214)和所述散布步骤(220)。
4.如权利要求1所述的方法,其特征在于,所述散布步骤(220)包括以下步骤:
通过使音频重放的所述剩余块集合的一部分静音和插入编码成表示静寂的多个音频帧其中至少一种方式来选择所述静寂时段。
5.如权利要求1所述的方法,其特征在于,所述散布步骤(220)还包括产生与所述静寂时段期间音频重放的静寂对应的音频重放信号。
6.如权利要求1所述的方法,其特征在于,所述散布步骤(220)包括:
根据所述视频特技模式的所选速度来选择用于音频重放(222)的所述剩余块集合。
7.如权利要求1所述的方法,其特征在于,所述散布步骤(220)包括:选择预定持续时间的所述静寂时段。
8.如权利要求7所述的方法,其特征在于,在所述散布步骤(220)中选取的所述静寂时段具有至少100毫秒的持续时间。
9.如权利要求1所述的方法,其特征在于,读取步骤(200)的所述存储媒体(102)从由DVD、磁光盘、磁硬盘、视频CD以及固态存储装置组成的组中选取。
10.如权利要求1所述的方法,其特征在于,读取步骤(200)的所述编码数字数据具有MPEG格式,而且所述读取步骤还包括对MPEG格式的比特流进行解码以获得音频样本。
11.一种用于播放伴随视频节目的视频特技模式重放的音频内容的设备,包括:
存储媒体读取器(108),用于从存储媒体(102)中读取编码数字数据,所述编码数字数据表示视频帧和相应的音频数据;以及
控制处理器(122),用于选择要定期丢弃的所述相应音频数据块,并且用于选择为音频重放保留的所述块的至少一部分,而且所述控制处理器以可控方式在用于音频重放的所述剩余块其中一些之间插入静寂时段。
12.如权利要求11所述的设备,其特征在于,所述控制处理器(122)选择为以大约1X到1.5X之间的速率进行的音频重放保留的所述块的一部分,而与所述视频特技模式重放速度无关。
13.如权利要求11所述的设备,其特征在于,所述处理器(122)插入的所述静寂时段是通过使用于音频重放的所述剩余块集合的一部分静音和插入表示静寂的音频数据其中至少一种方式而形成的。
14.如权利要求11所述的设备,其特征在于还包括音频解码器(182)和音频数/模转换器(184),用于产生与用于音频重放的所述剩余块集合以及所述静寂时段对应的音频重放信号。
15.如权利要求11所述的设备,其特征在于,所述控制处理器(122)根据所述视频特技模式的所选速度来控制所述相应音频数据的所述定期丢弃。
16.如权利要求15所述的设备,其特征在于包括其中包含表示静寂的音频数据的存储媒体(102)单元,其中所述控制处理器(122)控制对包含表示预定持续时间的静寂的音频数据的所述存储媒体单元的读取,以便与用于音频重放的所述剩余块集合进行组合。
17.如权利要求11所述的设备,其特征在于,所述静寂时段具有100到300毫秒之间的持续时间。
18.如权利要求11所述的设备,其特征在于,所述存储媒体(102)是从由DVD、磁光盘、磁硬盘、视频CD以及固态存储装置组成的组中选取的。
19.如权利要求11所述的设备,其特征在于,所述编码数字数据为MPEG格式,以及所述存储媒体读取器包括用于MPEG格式的比特流的解码器。
20.一种用于在视频呈现的视频特技模式重放期间播放音频节目的方法,所述方法包括:
从存储媒体(102)中读取编码数字数据(200),所述编码数字数据包括视频帧和相应的音频数据;
定期丢弃所述音频数据中的所选块(216),并选择为音频重放保留的块的至少一部分(218);以及
在用于音频重放的所述一部分剩余块其中一些之间插入表示静寂的音频数据。
CNB038093189A 2002-03-01 2003-02-21 特技模式重放期间的音频数据删除和消音 Expired - Fee Related CN100429941C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/086,984 US7130528B2 (en) 2002-03-01 2002-03-01 Audio data deletion and silencing during trick mode replay
US10/086,984 2002-03-01

Publications (2)

Publication Number Publication Date
CN1669309A true CN1669309A (zh) 2005-09-14
CN100429941C CN100429941C (zh) 2008-10-29

Family

ID=27787517

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038093189A Expired - Fee Related CN100429941C (zh) 2002-03-01 2003-02-21 特技模式重放期间的音频数据删除和消音

Country Status (11)

Country Link
US (1) US7130528B2 (zh)
EP (1) EP1497984A4 (zh)
JP (1) JP4319548B2 (zh)
KR (1) KR100933618B1 (zh)
CN (1) CN100429941C (zh)
AU (1) AU2003217666A1 (zh)
MX (1) MXPA04008425A (zh)
MY (1) MY138991A (zh)
PL (1) PL372272A1 (zh)
TW (1) TWI240248B (zh)
WO (1) WO2003075563A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102387292A (zh) * 2010-09-06 2012-03-21 卡西欧计算机株式会社 运动图像处理装置、运动图像再现装置、运动图像处理方法及运动图像再现方法
CN108885880A (zh) * 2016-03-31 2018-11-23 高通股份有限公司 用于处置音频流中的静默的系统和方法
CN109376266A (zh) * 2018-09-18 2019-02-22 北京小米移动软件有限公司 慢动作视频的处理方法、装置、电子设备和存储介质
CN110164483A (zh) * 2014-10-03 2019-08-23 杜比国际公司 渲染音频节目的方法和系统

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0872120A1 (en) 1995-03-07 1998-10-21 Interval Research Corporation System and method for selective recording of information
US6263507B1 (en) 1996-12-05 2001-07-17 Interval Research Corporation Browser for use in navigating a body of information, with particular application to browsing information represented by audiovisual data
US5893062A (en) 1996-12-05 1999-04-06 Interval Research Corporation Variable rate video playback with synchronized audio
US7155735B1 (en) 1999-10-08 2006-12-26 Vulcan Patents Llc System and method for the broadcast dissemination of time-ordered data
US6757682B1 (en) 2000-01-28 2004-06-29 Interval Research Corporation Alerting users to items of current interest
US7844464B2 (en) * 2005-07-22 2010-11-30 Multimodal Technologies, Inc. Content-based audio playback emphasis
JP2006243128A (ja) * 2005-03-01 2006-09-14 Matsushita Electric Ind Co Ltd 再生装置及び再生方法
KR100632509B1 (ko) * 2005-05-16 2006-10-09 엘지전자 주식회사 동영상 재생 단말기의 오디오 비디오 동기화 방법
US20070019931A1 (en) * 2005-07-19 2007-01-25 Texas Instruments Incorporated Systems and methods for re-synchronizing video and audio data
US8295684B2 (en) * 2007-10-08 2012-10-23 Sony Computer Entertainment America Inc. Method and system for scaling content for playback with variable duration
MY160803A (en) 2010-03-31 2017-03-31 Thomson Licensing Trick playback of video data
JP5745063B2 (ja) * 2010-09-17 2015-07-08 トムソン ライセンシングThomson Licensing ビデオシステムにおけるセマンティックベースのトリックモード再生方法
US8472783B2 (en) * 2010-11-30 2013-06-25 Echostar Technologies L.L.C. Systems and methods for digital video high accuracy fast forward, rewind and skip
US9942593B2 (en) * 2011-02-10 2018-04-10 Intel Corporation Producing decoded audio at graphics engine of host processing platform
US9054920B2 (en) * 2011-03-31 2015-06-09 Alcatel Lucent Managing data file transmission
EP2568471A1 (en) * 2011-09-12 2013-03-13 Alcatel Lucent A method for playing multimedia content, a related system and related playback module
JP5854208B2 (ja) * 2011-11-28 2016-02-09 日本電気株式会社 多段高速再生のための映像コンテンツ生成方法
CN104113778B (zh) * 2014-08-01 2018-04-03 广州猎豹网络科技有限公司 一种视频流解码方法及装置
EP3382706A1 (en) * 2017-03-28 2018-10-03 Advanced Digital Broadcast S.A. System and method for audio/video trick modes
US10726851B2 (en) * 2017-08-31 2020-07-28 Sony Interactive Entertainment Inc. Low latency audio stream acceleration by selectively dropping and blending audio blocks
US20200152212A1 (en) * 2018-11-09 2020-05-14 L3 Technologies, Inc. Systems and methods for compressing audio data for storage and streaming from an aircraft

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4376874A (en) * 1980-12-15 1983-03-15 Sperry Corporation Real time speech compaction/relay with silence detection
JP2737182B2 (ja) 1988-11-29 1998-04-08 ソニー株式会社 オーディオデータの変速再生方法
US5623344A (en) * 1992-09-01 1997-04-22 Hitachi America, Ltd. Digital video recording device with trick play capability
US5787225A (en) * 1993-03-29 1998-07-28 Matsushita Electric Industrial Co., Ltd. Optical disk apparatus for the reproduction of compressed data
KR960005647B1 (ko) 1993-12-22 1996-04-30 엘지전자주식회사 브이씨알(vcr)의 다이제스트 오디오 스킵장치 및 그의 방법
JP3102541B2 (ja) * 1994-09-26 2000-10-23 日本電信電話株式会社 スキップサーチ方法
JP3548245B2 (ja) * 1994-10-04 2004-07-28 キヤノン株式会社 情報記録再生装置、情報再生装置、及び情報再生方法
JPH08288854A (ja) * 1995-04-09 1996-11-01 Sony Corp 伝送装置及び符号化装置並びに符号化方法
EP0837608B1 (en) * 1996-10-15 2005-12-28 Matsushita Electric Industrial Co., Ltd. Video and audio coding method and coding apparatus
US5893062A (en) * 1996-12-05 1999-04-06 Interval Research Corporation Variable rate video playback with synchronized audio
US6154603A (en) * 1997-02-18 2000-11-28 Thomson Licensing S.A. Picture decoding for trick mode operation
JP3861362B2 (ja) * 1997-03-19 2006-12-20 ソニー株式会社 ディジタル信号再生方法及び装置
US6356211B1 (en) * 1997-05-13 2002-03-12 Sony Corporation Encoding method and apparatus and recording medium
KR100224099B1 (ko) * 1997-05-30 1999-10-15 윤종용 오디오/비디오 신호의 동기장치 및 방법
ATE244920T1 (de) * 1997-06-03 2003-07-15 Koninkl Philips Electronics Nv Vorrichtung und verfahren zur wiedergabe eines digitalen audiosignals von einem aufzeichnungsträger
BR9813257B1 (pt) * 1997-10-15 2012-09-04 equipamento de reprodução, e método de reprodução para reproduzir informação armazenada em um disco de armazenagem de informação.
JP2000023105A (ja) 1998-04-30 2000-01-21 Matsushita Electric Ind Co Ltd 再生時間伸縮方法および装置
CN1322376A (zh) 1998-08-07 2001-11-14 株式会社日立制作所 扁平型半导体装置、其制造方法及使用该装置的变换器
US6292454B1 (en) 1998-10-08 2001-09-18 Sony Corporation Apparatus and method for implementing a variable-speed audio data playback system
US6707778B1 (en) * 1999-11-10 2004-03-16 Thomson Licensing S.A. Edit to picture without decoding and re-encoding of MPEG bit stream for recordable DVD
US6678332B1 (en) * 2000-01-04 2004-01-13 Emc Corporation Seamless splicing of encoded MPEG video and audio

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102387292A (zh) * 2010-09-06 2012-03-21 卡西欧计算机株式会社 运动图像处理装置、运动图像再现装置、运动图像处理方法及运动图像再现方法
CN102387292B (zh) * 2010-09-06 2014-04-16 卡西欧计算机株式会社 运动图像处理装置、运动图像再现装置、运动图像处理方法及运动图像再现方法
CN110164483A (zh) * 2014-10-03 2019-08-23 杜比国际公司 渲染音频节目的方法和系统
CN110164483B (zh) * 2014-10-03 2021-03-02 杜比国际公司 渲染音频节目的方法和系统
US11437048B2 (en) 2014-10-03 2022-09-06 Dolby International Ab Methods, apparatus and system for rendering an audio program
US11948585B2 (en) 2014-10-03 2024-04-02 Dolby International Ab Methods, apparatus and system for rendering an audio program
CN108885880A (zh) * 2016-03-31 2018-11-23 高通股份有限公司 用于处置音频流中的静默的系统和方法
CN108885880B (zh) * 2016-03-31 2023-08-04 高通股份有限公司 用于处置音频流中的静默的系统和方法
CN109376266A (zh) * 2018-09-18 2019-02-22 北京小米移动软件有限公司 慢动作视频的处理方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
TW200305856A (en) 2003-11-01
EP1497984A1 (en) 2005-01-19
WO2003075563A1 (en) 2003-09-12
JP4319548B2 (ja) 2009-08-26
EP1497984A4 (en) 2005-10-12
US20030165321A1 (en) 2003-09-04
US7130528B2 (en) 2006-10-31
AU2003217666A1 (en) 2003-09-16
MXPA04008425A (es) 2005-06-08
CN100429941C (zh) 2008-10-29
MY138991A (en) 2009-08-28
KR20050014793A (ko) 2005-02-07
TWI240248B (en) 2005-09-21
JP2005519537A (ja) 2005-06-30
KR100933618B1 (ko) 2009-12-23
PL372272A1 (en) 2005-07-11

Similar Documents

Publication Publication Date Title
CN100429941C (zh) 特技模式重放期间的音频数据删除和消音
CN100420294C (zh) 用于在视频特技模式期间的选通静寂消除的方法和设备
US7149412B2 (en) Trick mode audio playback
KR20050083900A (ko) 남아있는 배터리 용량을 기초로 한 스캐일 가능한 비디오압축
WO2010086912A1 (ja) 記録装置及び記録方法
US7809241B2 (en) Audio frequency scaling during video trick modes utilizing digital signal processing
US7020382B2 (en) Modifying video by inserting shadow intra pictures
CA2451997C (en) Modifying video signals by converting non-intra pictures
JP4630805B2 (ja) 記録装置及び記録方法
KR0132815B1 (ko) 비디오씨디(video-cd) 디스크플레이어의 구동방법
JPH1021646A (ja) オーディオ信号の記録、伝送、再生方式及び再生装置
JP2006196095A (ja) 光ディスク再生装置
KR19990058598A (ko) 비디오 cd 재생장치의 고속 탐색방법
JP2005039496A (ja) 映像信号表示装置及び方法
KR20050056557A (ko) Hdd를 구비한 dvd-rw 장치에서 음성신호 반복재생 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081029

Termination date: 20170221