CN106911941B - 一种自适应视频切片方法 - Google Patents

一种自适应视频切片方法 Download PDF

Info

Publication number
CN106911941B
CN106911941B CN201710121103.7A CN201710121103A CN106911941B CN 106911941 B CN106911941 B CN 106911941B CN 201710121103 A CN201710121103 A CN 201710121103A CN 106911941 B CN106911941 B CN 106911941B
Authority
CN
China
Prior art keywords
video
point
slice
key frame
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710121103.7A
Other languages
English (en)
Other versions
CN106911941A (zh
Inventor
王一
何钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Huandian Information Technology Co Ltd
Original Assignee
Shanghai Huandian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Huandian Information Technology Co Ltd filed Critical Shanghai Huandian Information Technology Co Ltd
Priority to CN201710121103.7A priority Critical patent/CN106911941B/zh
Publication of CN106911941A publication Critical patent/CN106911941A/zh
Application granted granted Critical
Publication of CN106911941B publication Critical patent/CN106911941B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种自适应视频切片方法,确定视频切片点的切片时间范围,从视频关键帧列表中获取在该切片时间范围内的所有视频关键帧,形成切片点候选列表,对切片点候选列表中的视频关键帧进行排序,选择与音频帧时间戳最为匹配的视频关键帧作为切片点。本发明不需要播放器专门适配,能避免播放视频切片交界处的声音毛刺,获得更佳的播放试听体验。

Description

一种自适应视频切片方法
技术领域
本发明涉及一种自适应视频切片方法。
背景技术
目前为了提高服务能力和分发能力,并节约带宽成本,视频网站都会对一部分较长的视频内容做切片处理后输出,即根据视频的封装格式,将一个大的、长的视频文件切成若干个视频分段进行分发和服务。
如图1所示,视频中的声音和图像都是压缩后,盖上时间戳,打包成帧后装在文件中,图像和声音有各自的压缩算法和格式,声音帧和图像帧的时间关系往往是不匹配的。由于声音和图像在播放过程中按照自己的速度前进,故而正常的播放并不会有问题。而播放结束时,这种不匹配就会产生影响。
当视频内容被当成一整个视频被播放时,播放结束时,由于内容结束,并没有后续的播放,故而这种不匹配不会产生任何影响。
传统的基于关键帧图像的切片方法,由于仅仅考虑图像数据的正确性和连续性,完全不考虑声音,在切片的位置,声音和图像的时间戳往往是不匹配的。当视频被切开以后,如图2所示,在切片的交界处,需要停止播放前一个切片,再重新开始播放新切片,而播放新切片时,图像和声音会一同开始,而声音往往应该早于或者晚于图像帧出现,与正确的时间有所差异。这种差异,在观感上即表现为声音的毛刺,对于这类切片,需要播放器对这种时间线的错位进行修正,否则声音的毛刺无法消除。
目前常用的切片方法,根据切片的要求,从整个视频中寻找若干关键帧图像,作为切片点,将视频内容分割开,重新组装成小的视频分段。这种切片方法的实现最为简单,然而,这种切片方法需要专门的播放器适配,使用普通的视频播放器,播放这些切片时,在播放到切片交界处时会出现短暂的声音毛刺,造成视听体验的下降。
发明内容
本发明提供一种自适应视频切片方法,不需要播放器专门适配,能避免播放视频切片交界处的声音毛刺,获得更佳的播放试听体验。
为了达到上述目的,本发明提供一种自适应视频切片方法,选择视频关键帧作为切片点,使切片点的视频帧时间戳无限接近音频帧时间戳。
该方法具体包含以下步骤:
步骤S1、确定视频切片点的切片时间范围;
步骤S2、从视频关键帧列表中获取在该切片时间范围内的所有视频关键帧,形成切片点候选列表;
步骤S3、对切片点候选列表中的视频关键帧进行排序,选择与音频帧时间戳最为匹配的视频关键帧作为切片点。
所述的步骤S1中,确定视频切片点的切片时间范围的方法包含以下步骤:
步骤S1.1、根据业务需求,确定最佳切片点时间戳T;
步骤S1.2、确定实际切片点和最佳切片点的最大误差的容忍范围t;
步骤S1.3、根据最佳切片点时间戳和最大误差容忍范围确定视频切片点的切片时间范围[T-t,T+t]。
所述的步骤S1.1中,所述的最佳切片点时间戳T的选择需要满足条件:分段数目合理、分段后文件大小利于存储和分发调度。
所述的步骤S1.2中,所述的最大误差的容忍范围t根据采用的音频和视频的格式确定,该最大误差的容忍范围t需满足基本条件:在该最大误差的容忍范围t内能找到音频时间戳和视频时间戳完全相同的点。
所述的步骤S1中,所述的步骤S3中,对切片点候选列表中的视频关键帧进行排序选择的方法包含以下步骤:
步骤S3.1、计算切片点候选列表中每一个视频关键帧的时间戳和下一个音频帧的时间戳之间的绝对差值,作为该视频关键帧的得分;
步骤S3.2、按照得分大小对视频关键帧进行排序,选择得分最小的视频关键帧作为切片点,如果得分最小的视频关键帧有多个,则进行步骤S3.3;
步骤S3.3、计算得分相同的视频关键帧的时间戳和最佳切片点时间戳的绝对差值,按照绝对差值的大小对视频关键帧进行排序,选择绝对差值最小的视频关键帧作为切片点。
本发明不需要播放器专门适配,能避免播放视频切片交界处的声音毛刺,获得更佳的播放试听体验。
附图说明
图1是背景技术中视频中声音和图像的时间关系。
图2是背景技术中传统视频切片方法产生声音毛刺的示意图。
图3是本发明提供的一种自适应视频切片方法的流程图。
具体实施方式
以下根据图3具体说明本发明的较佳实施例。
如图3所示,本发明提供一种自适应视频切片方法,保证切片点的视频帧时间戳和音频帧时间戳相等,该方法具体包含以下步骤:
步骤S1、确定视频切片点的切片时间范围;
步骤S2、从视频关键帧列表中获取在该切片时间范围内的所有视频关键帧,形成切片点候选列表;
所述的视频关键帧所在的数据包具有专门的标志标识,用于标识视频关键帧;
步骤S3、对切片点候选列表中的视频关键帧进行排序,选择与音频帧时间戳最为匹配的视频关键帧作为切片点。
所述的步骤S1中,确定视频切片点的切片时间范围的方法包含以下步骤:
步骤S1.1、根据业务需求,确定最佳切片点时间戳T;
所述的最佳切片点时间戳T的选择需要满足条件:分段数目合理、分段后文件大小利于存储和分发调度;
如果分段数目较少,则单个分段文件会较大,这样对存储较为友好,但是不利于分发和服务调度,反之,如果分段数目较大,则单个分段文件会较小,利用分发和服务调度,但不便于存储;
步骤S1.2、确定实际切片点和最佳切片点的最大误差的容忍范围t;
所述的最大误差的容忍范围t根据采用的音频和视频的格式确定,该最大误差的容忍范围t需满足基本条件:在该最大误差的容忍范围t内能找到音频时间戳和视频时间戳完全相同的点,所述的最大误差的容忍范围t在满足基本条件的基础上,越小越好;
步骤S1.3、根据最佳切片点时间戳和最大误差容忍范围确定视频切片点的切片时间范围[T-t,T+t]。
所述的步骤S3中,对切片点候选列表中的视频关键帧进行排序选择的方法包含以下步骤:
步骤S3.1、计算切片点候选列表中每一个视频关键帧的时间戳和下一个音频帧的时间戳之间的绝对差值,作为该视频关键帧的得分;
步骤S3.2、按照得分大小对视频关键帧进行排序,选择得分最小的视频关键帧作为切片点,如果得分最小的视频关键帧有多个,则进行步骤S3.3;
步骤S3.3、计算得分相同的视频关键帧的时间戳和最佳切片点时间戳的绝对差值,按照绝对差值的大小对视频关键帧进行排序,选择绝对差值最小的视频关键帧作为切片点。
针对声音毛刺产生的原因,本发明在切片视频的时候,尽量保证切片点的视频帧时间戳和音频帧时间戳相等,在播放后一个切片时,声音就不会与正确的时间线产生错位,也不需要播放器做专门的适配。
相比于传统的基于关键帧图像的视频切片方法,本发明提出的方法可以无需任何客户端的适配而消除播放切片的声音毛刺,带来更好的视听体验。在实际的使用中,升级客户端意味着大规模升级客户端,非常的繁琐,且不可控制。此外很多常用的播放器,必入页面播放视频所使用Flash和HTML5播放器都无法随意按需修改。本发明所提出的方法,在消除毛刺的同时,让使用者可以完全不受这些问题所困扰。
在则,本发明所提出的方法,拥有更强的适应性。如果业务需求对切片点的选择范围限制很大,本发明即使找不到时间戳完全匹配的切片点,也能找到匹配度最高的切片点(即,切片点的视频帧时间戳无限接近音频帧时间戳),尽可能减少毛刺的时长,优化体验。
本发明的方法相比于传统方法,在算法上和实现成本上增加并不多,而且由于现代处理器对向量计算的优化,性能上的损失也非常小,相比于上述的益处,这些弊端可谓微乎其微。
本发明提供的切片方法已经在www.bilibili.com线上使用,超过半年,根据实测,确定了最长10秒的关键帧距离,最佳切片点时间戳位置为6分钟的整数倍,容忍的误差范围在半分钟内,可以保证每一个切片都发生在匹配位置。产生的视频切片供该网站页面上使用的Flash播放器(无法修改播放内核)播放,上线以来从未发现声音的毛刺或接到类似的反馈。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (5)

1.一种自适应视频切片方法,其特征在于,选择视频关键帧作为切片点,使切片点的视频帧时间戳无限接近音频帧时间戳;
所述的自适应视频切片方法包含以下步骤:
步骤S1、确定视频切片点的切片时间范围;
步骤S2、从视频关键帧列表中获取在该切片时间范围内的所有视频关键帧,形成切片点候选列表;
步骤S3、对切片点候选列表中的视频关键帧进行排序,选择与音频帧时间戳最为匹配的视频关键帧作为切片点。
2.如权利要求1所述的自适应视频切片方法,其特征在于,所述的步骤S1中,确定视频切片点的切片时间范围的方法包含以下步骤:
步骤S1.1、根据业务需求,确定最佳切片点时间戳T;
步骤S1.2、确定实际切片点和最佳切片点的最大误差的容忍范围t;
步骤S1.3、根据最佳切片点时间戳和最大误差容忍范围确定视频切片点的切片时间范围[T-t,T+t]。
3.如权利要求2所述的自适应视频切片方法,其特征在于,所述的步骤S1.1中,所述的最佳切片点时间戳T的选择需要满足条件:分段数目合理、分段后文件大小利于存储和分发调度。
4.如权利要求2所述的自适应视频切片方法,其特征在于,所述的步骤S1.2中,所述的最大误差的容忍范围t根据采用的音频和视频的格式确定,该最大误差的容忍范围t需满足基本条件:在该最大误差的容忍范围t内能找到音频时间戳和视频时间戳完全相同的点。
5.如权利要求2所述的自适应视频切片方法,其特征在于,所述的步骤S3中,对切片点候选列表中的视频关键帧进行排序选择的方法包含以下步骤:
步骤S3.1、计算切片点候选列表中每一个视频关键帧的时间戳和下一个音频帧的时间戳之间的绝对差值,作为该视频关键帧的得分;
步骤S3.2、按照得分大小对视频关键帧进行排序,选择得分最小的视频关键帧作为切片点,如果得分最小的视频关键帧有多个,则进行步骤S3.3;
步骤S3.3、计算得分相同的视频关键帧的时间戳和最佳切片点时间戳的绝对差值,按照绝对差值的大小对视频关键帧进行排序,选择绝对差值最小的视频关键帧作为切片点。
CN201710121103.7A 2017-03-02 2017-03-02 一种自适应视频切片方法 Active CN106911941B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710121103.7A CN106911941B (zh) 2017-03-02 2017-03-02 一种自适应视频切片方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710121103.7A CN106911941B (zh) 2017-03-02 2017-03-02 一种自适应视频切片方法

Publications (2)

Publication Number Publication Date
CN106911941A CN106911941A (zh) 2017-06-30
CN106911941B true CN106911941B (zh) 2019-08-16

Family

ID=59186110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710121103.7A Active CN106911941B (zh) 2017-03-02 2017-03-02 一种自适应视频切片方法

Country Status (1)

Country Link
CN (1) CN106911941B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110401869A (zh) * 2019-07-26 2019-11-01 歌尔股份有限公司 一种视频直播方法、系统及电子设备和存储介质
CN113630643B (zh) * 2020-05-09 2023-10-20 中央电视台 媒体流收录方法、装置及计算机存储介质、电子设备
CN113709412B (zh) * 2020-05-21 2023-05-19 中国电信股份有限公司 直播流处理方法、装置和系统、计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101330622A (zh) * 2008-07-24 2008-12-24 中兴通讯股份有限公司 基于h.264编码的播放系统、方法以及用户设备
CN102118539A (zh) * 2009-12-30 2011-07-06 Tcl集团股份有限公司 一种多媒体播放终端及其文件拖动播放方法和装置
CN102932670A (zh) * 2012-11-29 2013-02-13 百视通网络电视技术发展有限责任公司 一种流媒体切片方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9338523B2 (en) * 2009-12-21 2016-05-10 Echostar Technologies L.L.C. Audio splitting with codec-enforced frame sizes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101330622A (zh) * 2008-07-24 2008-12-24 中兴通讯股份有限公司 基于h.264编码的播放系统、方法以及用户设备
CN102118539A (zh) * 2009-12-30 2011-07-06 Tcl集团股份有限公司 一种多媒体播放终端及其文件拖动播放方法和装置
CN102932670A (zh) * 2012-11-29 2013-02-13 百视通网络电视技术发展有限责任公司 一种流媒体切片方法及系统

Also Published As

Publication number Publication date
CN106911941A (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
US11197036B2 (en) Multimedia stream analysis and retrieval
CN106454493B (zh) 当前播放的电视节目信息查询方法及智能电视
CN106911941B (zh) 一种自适应视频切片方法
US10827231B2 (en) Systems and methods for customized live-streaming commentary
CA3008502C (en) Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
CN104768082B (zh) 一种音视频播放信息处理方法及服务器
US20160314794A1 (en) System and method for continuing an interrupted broadcast stream
KR101727849B1 (ko) 선택된 타임 쉬프팅된 멀티미디어 콘텐츠에 대한 소셜 미디어의 처리
CN104902343B (zh) 一种传输和播放音视频与消息的方法、服务器及终端
US9461759B2 (en) Identification of changed broadcast media items
US10560657B2 (en) Systems and methods for intelligently synchronizing events in visual content with musical features in audio content
CN109194887B (zh) 一种云剪视频录制及剪辑方法和插件
CN107517406B (zh) 一种视频剪辑及翻译的方法
CN104185088B (zh) 一种视频处理方法及装置
CN108259963A (zh) 一种tv端播放器
CN110087116B (zh) 多码率直播视频流剪辑方法、装置、终端及存储介质
CN110933459A (zh) 赛事视频的剪辑方法、装置、服务器以及可读存储介质
CN105282560A (zh) 一种快速播放网络视频的方法及系统
CN108989905A (zh) 媒体流控制方法、装置、计算设备及存储介质
CN107688792A (zh) 一种视频翻译方法及其系统
GB2375907A (en) An automated recognition system
CN111540377B (zh) 广播节目智能碎片化的系统
JP2008130215A (ja) 自動編集装置及び自動編集方法
CN106454547A (zh) 一种实时字幕播出方法及系统
CN116017051A (zh) 场景渲染方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant