CN113965776A - 一种多模式的音视频格式高速转换方法及系统 - Google Patents

一种多模式的音视频格式高速转换方法及系统 Download PDF

Info

Publication number
CN113965776A
CN113965776A CN202111222414.5A CN202111222414A CN113965776A CN 113965776 A CN113965776 A CN 113965776A CN 202111222414 A CN202111222414 A CN 202111222414A CN 113965776 A CN113965776 A CN 113965776A
Authority
CN
China
Prior art keywords
format
audio
target
video
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111222414.5A
Other languages
English (en)
Other versions
CN113965776B (zh
Inventor
何伟生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxia Information Technology Huizhou Co ltd
Original Assignee
Jiangxia Information Technology Huizhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxia Information Technology Huizhou Co ltd filed Critical Jiangxia Information Technology Huizhou Co ltd
Priority to CN202111222414.5A priority Critical patent/CN113965776B/zh
Publication of CN113965776A publication Critical patent/CN113965776A/zh
Application granted granted Critical
Publication of CN113965776B publication Critical patent/CN113965776B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • G06F16/1794Details of file format conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4398Processing of audio elementary streams involving reformatting operations of audio signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440218Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种多模式的音视频格式高速转换方法及系统,包括以下步骤:步骤S1、转换系统获取目标音视频文件以及目标转换格式,并依据所述目标转换格式进行音视频编码器的匹配搜索得到支持所述目标转换格式的音视频编码器作为目标编码器;转换系统根据目标编码器与目标转换格式的匹配状态选择转换模式,并依据选择的转换模式对所述目标音视频文件进行格式转换,以实现为目标音视频文件提供多种转换模式的切换选择提高了所述目标音视频文件转换为目标格式的成功率。本发明提供多种转换模式的切换选择,格式转换的泛用性高、兼容性强,使得所述目标音视频文件转换为目标格式的成功率大幅提高,大幅度提升转换速度。

Description

一种多模式的音视频格式高速转换方法及系统
技术领域
本发明涉及音视频格式转换技术领域,具体涉及一种多模式的音视频格式高速转换方法及系统。
背景技术
在播放音视频时,音视频源设备将所要播放的音视频发送至播放设备,例如机顶盒等,播放设备再将接收到的音视频通过高清晰度多媒体接口(highdefinitionmultimediainterface,HDMI)接口发送至显示器,例如电视机,投影仪等,再由显示器播放所接收到的音视频。
目前,具有HDMI接口的显示器所支持的音视频格式主要有两类,一类是标准动态范围(standarddynamicrange,SDR)类的音视频格式,SDR类的音视频格式包括多种SDR音视频格式,例如,根据色域不同,SDR类的音视频格式包括BT601音视频格式,BT709音视频格式,以及BT2020音视频格式等;另一类是高动态范围(highdynamicrange,HDR)类的音视频格式,同理,HDR类的音视频格式也包括多种HDR音视频格式,例如,HLG(hybridlog-gamma)曲线的HDR音视频格式,PQ(perceptualquantizer)曲线的HDR音视频格式等。
现有的音视频格式转换方案往往需要将数据重新进行转换处理,通常需要将所有的数据重新编码为格式支持的数据,才能完成音视频的格式转换。比如一个用户想要将一个mkv格式转换为mp4格式,则需要将音视频数据先解码为YUV位图数据,再将YUV位图数据编码为h264音视频码流。而音频数据则需要将音频数据解码为pcm数据再编码为aac音频数据。最终再将两个码流数据依次输出到文件中。
上述技术为现阶段的处理方案,虽然泛用性高、兼容性强,但是这种方法存在画质二次受损,音质受损以及处理速度缓慢的问题。因此,对于用户只需要转换格式这一需求是不合理的。
发明内容
本发明的目的在于提供一种多模式的音视频格式高速转换方法及系统,以解决现有技术中存在画质二次受损,音质受损以及处理速度缓慢的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种多模式的音视频格式高速转换方法,包括以下步骤:
步骤S1、转换系统获取目标音视频文件以及目标转换格式,并依据所述目标转换格式进行音视频编码器的匹配搜索得到支持所述目标转换格式的音视频编码器作为目标编码器,其中,所述目标转换格式表征为符合目标音视频文件转换目标的文件格式,所述目标转换格式由音频目标格式和音视频目标格式共同组成,所述目标音视频文件表征为具有转换需求的待转换音视频文件;
步骤S2、转换系统根据目标编码器与目标转换格式的匹配状态选择转换模式,并依据选择的转换模式对所述目标音视频文件进行格式转换,以实现为目标音视频文件提供多种转换模式的切换选择提高了所述目标音视频文件转换为目标格式的成功率。
作为本发明的一种优选方案,依据所述目标转换格式进行音视频编码器的匹配搜索得到目标编码器,包括:
获取音视频编码器的支持解码格式,所述支持解码格式由支持音频解码格式和支持音视频解码格式共同组成,其中,
若支持解码格式中的支持音频解码格式包含目标转换格式中的音频目标格式或支持解码格式中的支持音视频解码格式包含目标转换格式中的音视频目标格式,则将音视频编码器标记为目标编码器;
若支持解码格式中的支持音频解码格式不包含目标转换格式中的音频目标格式且支持解码格式中的支持音视频解码格式不包含目标转换格式中的音视频目标格式,则将音视频编码器标记为非目标编码器。
作为本发明的一种优选方案,所述转换模式包括无损转换模式和有损转换模式,其中,所述无损转换模式包括:
设定包含度,所述包含度表征为目标编码器的支持解码格式对所述目标转换格式的包含程度的衡量指标,其中,
若支持音频解码格式包含音频目标格式且支持音视频解码格式包含音视频目标格式,则包含度为100%;
若所述支持音频解码格式包含所述音频目标格式且所述支持音视频解码格式不包含所述音视频目标格式,以及若支持音频解码格式不包含音频目标格式且支持音视频解码格式包含音视频目标格式,则包含度为50%;
若支持音频解码格式不包含音频目标格式且支持音视频解码格式不包含音视频目标格式,则包含度为0%;
当目标编码器的支持解码格式对所述目标转换格式的包含度为100%时,则将目标音视频文件的数据流文件头取出,按照目标转换格式的规定进行所述数据流文件头输出到对应位置,再将数据流中的数据获取出来,重新按照目标转换格式规定的封装规范进行封装得到格式为目标转换格式的目标音视频文件。
作为本发明的一种优选方案,所述有损转换模式包括:
当目标编码器的支持解码格式对所述目标转换格式的包含度为50%时,则只将目标音视频文件中为所述音视频目标格式/所述音频目标格式的数据流进行编码转换,以实现将所述数据流的所述音视频目标格式/所述音频目标格式转换至包含在支持音视频解码格式/所述支持音频解码格式内,并在重新编码完成后,按照目标转换格式的规定进行所述数据流文件头输出到对应位置,再将数据流中的数据获取出来,重新按照目标转换格式规定的封装规范进行封装得到格式为目标转换格式的目标音视频文件;
当目标编码器的支持解码格式对所述目标转换格式的包含度为0%时,则将目标音视频文件中的数据流进行编码转换,以实现将至所述数据流的所述音视频目标格式和所述音频目标格式均转换至包含在支持音视频解码格式和所述支持音频解码格式内,并在重新编码完成后,按照目标转换格式的规定进行所述数据流文件头输出到对应位置,再将数据流中的数据获取出来,重新按照目标转换格式规定的封装规范进行封装得到格式为目标转换格式的目标音视频文件。
作为本发明的一种优选方案,在所述目标音视频文件完成转换后,还包括对目标音视频文件进行转换格式正确性复核,包括:
将完成转换后的目标音视频文件进行文件格式的提取解析得到目标音视频文件完成转换后的文件格式;
将所述目标音视频文件完成转换后的文件格式与所述目标转换格式进行匹配,其中,
若目标音视频文件完成转换后的文件格式与所述目标转换格式一致,则目标音视频文件已成功转换为目标转换格式;
若目标音视频文件完成转换后的文件格式与所述目标转换格式不一致,则目标音视频文件未成功转换为目标转换格式,提取出目标音视频文件中未转换为目标转换格式的音视频数据作为失效文件块。
作为本发明的一种优选方案,所述失效文件块的获取,包括:
设定格式相似度,所述格式相似度用于作为目标音视频文件中任意两个音视频数据的格式相似程度的衡量指标,将所述目标音视频文件包含的所有音视频数据按相似度分类得到多个格式簇,其中,位于同一格式簇中的音视频数据具有相同的文件格式,位于不同格式簇中的音视频数据具有不同的文件格式,所述相似度的计算公式为:
Figure BDA0003313095810000041
式中,d表征为音视频数据Si和音视频数据Sj的格式相似度,Si、Sj表征为目标音视频文件中第i、j个音视频数据的格式,i、j为计量常数,无实质意义;
设定相似度阈值,所述相似度阈值用于作为判定音视频数据Si和音视频数据Sj是否归属于同一格式簇的阈值指标,其中,
若音视频数据Si和音视频数据Sj的格式相似度高于相似度阈值,则将音视频数据Si和音视频数据Sj归属于同一格式簇;
若音视频数据Si和音视频数据Sj的格式相似度低于相似度阈值,则将音视频数据Si和音视频数据Sj归属于不同格式簇。
作为本发明的一种优选方案,所述失效文件块的获取,还包括:
计算出每个格式簇的簇中心所表征的文件格式,将所述簇中心所表征的文件格式用于表征格式簇的文件格式,所述簇中心所表征的文件格式的计算公式为:
Figure BDA0003313095810000051
式中,Ok表征为第k个格式簇的簇中心所表征的文件格式,nk表征为第k个格式簇的音视频数据总数目,Sx表征为第k个格式簇中第x个音视频数据的格式,x、k为计量常数,无实质含义;
将每个格式簇的簇中心所表征的文件格式作为每个格式簇的文件格式,并依次将每个格式簇的文件格式与所述目标转换格式进行匹配,其中,
若格式簇的文件格式与所述目标转换格式一致,则格式簇中的音视频数据为有效文件块,所述有效文件块表征为目标音视频文件中已成功转换为目标转换格式的数据集合;
若格式簇的文件格式与所述目标转换格式不一致,则格式簇中的音视频数据为失效文件块,所述失效文件块表征为目标音视频文件中未成功转换为目标转换格式的数据集合;
将所述失效文件块返回步骤S2中进行格式的重新转换。
作为本发明的一种优选方案,所述目标音视频文件进行格式转换之前需要进行降噪处理。
作为本发明的一种优选方案,本发明提供了一种根据所述的多模式的音视频格式高速转换方法的转换系统,包括:
编码器筛选单元,用于获取目标音视频文件以及目标转换格式,并依据所述目标转换格式进行音视频编码器的匹配搜索得到支持所述目标转换格式的音视频编码器作为目标编码器,其中,所述目标转换格式表征为目标音视频文件按照用户需求完成转换后的文件格式;
模式选择单元,用于根据目标编码器与目标转换格式的匹配状态选择转换模式;
格式转换单元,用于依据选择的转换模式对所述目标音视频文件进行格式转换以实现以多种模式对目标音视频文件进行格式转换得到目标转换格式。
本发明与现有技术相比较具有如下有益效果:
本发明可以提供多种转换模式的切换选择,格式转换的泛用性高、兼容性强,使得所述目标音视频文件转换为目标格式的成功率大幅提高,大幅度提升转换速度,这种方案不仅可以节省处理时间,同时还能无损转出,达到跟原音视频完全一致的播放效果,可以更好的解决使用者转换格式的使用需求,而且在转换完成后提供了格式复核步骤,进一步保证目标音视频文件的转换成功率。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的音视频格式高速转换方法流程图;
图2为本发明实施例提供的转换系统结构框图。
图中的标号分别表示如下:
1-编码器筛选单元;2-模式选择单元;3-格式转换单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,目前市面主流的音视频编码器,市场占比大的h264。而流行的格式,如avi、mp4、flv、mkv、m2ts等格式都支持这一音视频编码格式,在传统转换流程中,1080p音视频的编码速度往往只有百帧左右,一小时的音视频单转换就需要二三十分钟,同时造成画质二次损失,因此本发明提供了一种多模式的音视频格式高速转换方法,提供多种格式转换模式,实现音视频格式的高速转换。
一种多模式的音视频格式高速转换方法,包括以下步骤:
步骤S1、转换系统获取目标音视频文件以及目标转换格式,并依据所述目标转换格式进行音视频编码器的匹配搜索得到支持所述目标转换格式的音视频编码器作为目标编码器,其中,所述目标转换格式表征为符合目标音视频文件转换目标的文件格式,所述目标转换格式由音频目标格式和音视频目标格式共同组成,所述目标音视频文件表征为具有转换需求的待转换音视频文件;
依据所述目标转换格式进行音视频编码器的匹配搜索得到目标编码器,包括:
获取音视频编码器的支持解码格式,所述支持解码格式由支持音频解码格式和支持音视频解码格式共同组成,其中,
若支持解码格式中的支持音频解码格式包含目标转换格式中的音频目标格式或支持解码格式中的支持音视频解码格式包含目标转换格式中的音视频目标格式,则将音视频编码器标记为目标编码器;
若支持解码格式中的支持音频解码格式不包含目标转换格式中的音频目标格式且支持解码格式中的支持音视频解码格式不包含目标转换格式中的音视频目标格式,则将音视频编码器标记为非目标编码器。
步骤S2、转换系统根据目标编码器与目标转换格式的匹配状态选择转换模式,并依据选择的转换模式对所述目标音视频文件进行格式转换,以实现为目标音视频文件提供多种转换模式的切换选择提高了所述目标音视频文件转换为目标格式的成功率。
所述转换模式包括无损转换模式和有损转换模式,其中,所述无损转换模式包括:
设定包含度,所述包含度表征为目标编码器的支持解码格式对所述目标转换格式的包含程度的衡量指标,其中,
若支持音频解码格式包含音频目标格式且支持音视频解码格式包含音视频目标格式,则包含度为100%;
若所述支持音频解码格式包含所述音频目标格式且所述支持音视频解码格式不包含所述音视频目标格式,以及若支持音频解码格式不包含音频目标格式且支持音视频解码格式包含音视频目标格式,则包含度为50%;
若支持音频解码格式不包含音频目标格式且支持音视频解码格式不包含音视频目标格式,则包含度为0%;
当目标编码器的支持解码格式对所述目标转换格式的包含度为100%时,则将目标音视频文件的数据流文件头取出,按照目标转换格式的规定进行所述数据流文件头输出到对应位置,再将数据流中的数据获取出来,重新按照目标转换格式规定的封装规范进行封装得到格式为目标转换格式的目标音视频文件。
所述有损转换模式包括:
当目标编码器的支持解码格式对所述目标转换格式的包含度为50%时,则只将目标音视频文件中为所述音视频目标格式/所述音频目标格式的数据流进行编码转换,以实现将所述数据流的所述音视频目标格式/所述音频目标格式转换至包含在支持音视频解码格式/所述支持音频解码格式内,并在重新编码完成后,按照目标转换格式的规定进行所述数据流文件头输出到对应位置,再将数据流中的数据获取出来,重新按照目标转换格式规定的封装规范进行封装得到格式为目标转换格式的目标音视频文件;
当目标编码器的支持解码格式对所述目标转换格式的包含度为0%时,则将目标音视频文件中的数据流进行编码转换,以实现将至所述数据流的所述音视频目标格式和所述音频目标格式均转换至包含在支持音视频解码格式和所述支持音频解码格式内,并在重新编码完成后,按照目标转换格式的规定进行所述数据流文件头输出到对应位置,再将数据流中的数据获取出来,重新按照目标转换格式规定的封装规范进行封装得到格式为目标转换格式的目标音视频文件。
目标编码器的支持解码格式对所述目标转换格式的包含度为50%表征为音视频编码器中的支持解码格式仅支持目标音视频文件的音频解码或仅支持视频解码;
目标编码器的支持解码格式对所述目标转换格式的包含度为0%表征为音视频编码器中的支持解码格式均不支持目标音视频文件的音频解码和支持视频解码。
具体的,若仅有目标编码器被明确支持,或者仅有音视频编码器被明确支持,则只将对应不支持的数据流进行编码转换,即仅对对应数据进行部份重新编码。
若目标编码器中音视频编码或音频编码在目标转换格式的规范文档中表明仅支持另外一种数据存储方案,但这两种存储方案可以进行互相转换,则将编码后数据进行互相转换再进行规范封装输出,比如annexb标准跟mp4_hevc、mp4_h264标准的互相转换。
若目标编码器均不被支持,则使用传统转换方案,将数据解码重新进行编码成对应格式支持的数据,再进行数据封装。
在所述目标音视频文件完成转换后,还包括对目标音视频文件进行转换格式正确性复核,包括:
将完成转换后的目标音视频文件进行文件格式的提取解析得到目标音视频文件完成转换后的文件格式;
将所述目标音视频文件完成转换后的文件格式与所述目标转换格式进行匹配,其中,
若目标音视频文件完成转换后的文件格式与所述目标转换格式一致,则目标音视频文件已成功转换为目标转换格式;
若目标音视频文件完成转换后的文件格式与所述目标转换格式不一致,则目标音视频文件未成功转换为目标转换格式,提取出目标音视频文件中未转换为目标转换格式的音视频数据作为失效文件块。
在所述目标音视频文件完成转换后,还包括对目标音视频文件进行转换格式正确性复核,包括:
将完成转换后的目标音视频文件进行文件格式的提取解析得到目标音视频文件完成转换后的文件格式;
将所述目标音视频文件完成转换后的文件格式与所述目标转换格式进行匹配,其中,
若目标音视频文件完成转换后的文件格式与所述目标转换格式一致,则目标音视频文件已成功转换为目标转换格式;
若目标音视频文件完成转换后的文件格式与所述目标转换格式不一致,则目标音视频文件未成功转换为目标转换格式,提取出目标音视频文件中未转换为目标转换格式的音视频数据作为失效文件块。
作为本发明的一种优选方案,所述失效文件块的获取,包括:
设定格式相似度,所述格式相似度用于作为目标音视频文件中任意两个音视频数据的格式相似程度的衡量指标,将所述目标音视频文件包含的所有音视频数据按相似度分类得到多个格式簇,其中,位于同一格式簇中的音视频数据具有相同的文件格式,位于不同格式簇中的音视频数据具有不同的文件格式,所述相似度的计算公式为:
Figure BDA0003313095810000101
式中,d表征为音视频数据Si和音视频数据Sj的格式相似度,Si、Sj表征为目标音视频文件中第i、j个音视频数据的格式,i、j为计量常数,无实质意义;
设定相似度阈值,所述相似度阈值用于作为判定音视频数据Si和音视频数据Sj是否归属于同一格式簇的阈值指标,其中,
若音视频数据Si和音视频数据Sj的格式相似度高于相似度阈值,则将音视频数据Si和音视频数据Sj归属于同一格式簇;
若音视频数据Si和音视频数据Sj的格式相似度低于相似度阈值,则将音视频数据Si和音视频数据Sj归属于不同格式簇。
Si、Sj的格式相似度越高,说明Si、Sj具有相同的格式的概率越高,而Si、Sj相似度越低,说明Si、Sj具有相同的格式的概率越低,一般设定一个阈值,将相似度高于等于阈值的音视频数据视为具有相同的格式,而相似度低于阈值的音视频数据视为具有不同的格式,因此将具有相同格式的所有音视频数据都分类到一个格式簇内,之后只需对格式簇这个整体进行格式匹配,格式簇这个整体的格式就是格式簇内的所有音视频数据所普遍具有的格式,本实施例利用簇中心所表征的文件格式进行代表性表征格式簇这个整体的格式,簇中心所表征的文件格式是由格式簇内的所有音视频数据的格式求均值而得,因此可用于代表格式簇这个整体的格式,就能够实现利用格式簇进行一次格式匹配即对格式簇内的所有音视频数据同步进行格式匹配,无需对所有音视频进行逐一匹配,提高格式匹配效率。
所述失效文件块的获取,还包括:
计算出每个格式簇的簇中心所表征的文件格式,将所述簇中心所表征的文件格式用于表征格式簇的文件格式,所述簇中心所表征的文件格式的计算公式为:
Figure BDA0003313095810000111
式中,Ok表征为第k个格式簇的簇中心所表征的文件格式,nk表征为第k个格式簇的音视频数据总数目,Sx表征为第k个格式簇中第x个音视频数据的格式,x、k为计量常数,无实质含义;
将每个格式簇的簇中心所表征的文件格式作为每个格式簇的文件格式,并依次将每个格式簇的文件格式与所述目标转换格式进行匹配,其中,
若格式簇的文件格式与所述目标转换格式一致,则格式簇中的音视频数据为有效文件块,所述有效文件块表征为目标音视频文件中已成功转换为目标转换格式的数据集合;
若格式簇的文件格式与所述目标转换格式不一致,则格式簇中的音视频数据为失效文件块,所述失效文件块表征为目标音视频文件中未成功转换为目标转换格式的数据集合;
将所述失效文件块返回步骤S2中进行格式的重新转换。
可以实现对转换后的目标音视频文件进行转换格式复核,并筛选出未转换为目标转换格式的音视频文件中的音视频数据,仅对未转换为目标转换格式的音视频文件中的音视频数据重新进行格式转换,可以保证目标音视频文件的转换成功率。
目标音视频文件进行格式转换之前需要进行降噪处理。
如图2所示,基于上述多模式的音视频格式高速转换方法,本发明提供了一种转换系统,包括:
编码器筛选单元1,用于获取目标音视频文件以及目标转换格式,并依据所述目标转换格式进行音视频编码器的匹配搜索得到支持所述目标转换格式的音视频编码器作为目标编码器,其中,所述目标转换格式表征为目标音视频文件按照用户需求完成转换后的文件格式;
模式选择单元2,用于根据目标编码器与目标转换格式的匹配状态选择转换模式;
格式转换单元3,用于依据选择的转换模式对所述目标音视频文件进行格式转换以实现以多种模式对目标音视频文件进行格式转换得到目标转换格式。
本发明可以提供多种转换模式的切换选择,格式转换的泛用性高、兼容性强,使得所述目标音视频文件转换为目标格式的成功率大幅提高,大幅度提升转换速度,这种方案不仅可以节省处理时间,同时还能无损转出,达到跟原音视频完全一致的播放效果,可以更好的解决使用者转换格式的使用需求,而且在转换完成后提供了格式复核步骤,进一步保证目标音视频文件的转换成功率。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (9)

1.一种多模式的音视频格式高速转换方法,其特征在于,包括以下步骤:
步骤S1、转换系统获取目标音视频文件以及目标转换格式,并依据所述目标转换格式进行音视频编码器的匹配搜索得到支持所述目标转换格式的音视频编码器作为目标编码器,其中,所述目标转换格式表征为符合目标音视频文件转换目标的文件格式,所述目标转换格式由音频目标格式和音视频目标格式共同组成,所述目标音视频文件表征为具有转换需求的待转换音视频文件;
步骤S2、转换系统根据目标编码器与目标转换格式的匹配状态选择转换模式,并依据选择的转换模式对所述目标音视频文件进行格式转换,以实现为目标音视频文件提供多种转换模式的切换选择提高了所述目标音视频文件转换为目标格式的成功率。
2.根据权利要求1所述的一种多模式的音视频格式高速转换方法,其特征在于:依据所述目标转换格式进行音视频编码器的匹配搜索得到目标编码器,包括:
获取音视频编码器的支持解码格式,所述支持解码格式由支持音频解码格式和支持音视频解码格式共同组成,其中,
若支持解码格式中的支持音频解码格式包含目标转换格式中的音频目标格式或支持解码格式中的支持音视频解码格式包含目标转换格式中的音视频目标格式,则将音视频编码器标记为目标编码器;
若支持解码格式中的支持音频解码格式不包含目标转换格式中的音频目标格式且支持解码格式中的支持音视频解码格式不包含目标转换格式中的音视频目标格式,则将音视频编码器标记为非目标编码器。
3.根据权利要求2所述的一种多模式的音视频格式高速转换方法,其特征在于:所述转换模式包括无损转换模式和有损转换模式,其中,所述无损转换模式包括:
设定包含度,所述包含度表征为目标编码器的支持解码格式对所述目标转换格式的包含程度的衡量指标,其中,
若支持音频解码格式包含音频目标格式且支持音视频解码格式包含音视频目标格式,则包含度为100%;
若所述支持音频解码格式包含所述音频目标格式且所述支持音视频解码格式不包含所述音视频目标格式,以及若支持音频解码格式不包含音频目标格式且支持音视频解码格式包含音视频目标格式,则包含度为50%;
若支持音频解码格式不包含音频目标格式且支持音视频解码格式不包含音视频目标格式,则包含度为0%;
当目标编码器的支持解码格式对所述目标转换格式的包含度为100%时,则将目标音视频文件的数据流文件头取出,按照目标转换格式的规定进行所述数据流文件头输出到对应位置,再将数据流中的数据获取出来,重新按照目标转换格式规定的封装规范进行封装得到格式为目标转换格式的目标音视频文件。
4.根据权利要求3所述的一种多模式的音视频格式高速转换方法,其特征在于:所述有损转换模式包括:
当目标编码器的支持解码格式对所述目标转换格式的包含度为50%时,则只将目标音视频文件中为所述音视频目标格式/所述音频目标格式的数据流进行编码转换,以实现将所述数据流的所述音视频目标格式/所述音频目标格式转换至包含在支持音视频解码格式/所述支持音频解码格式内,并在重新编码完成后,按照目标转换格式的规定进行所述数据流文件头输出到对应位置,再将数据流中的数据获取出来,重新按照目标转换格式规定的封装规范进行封装得到格式为目标转换格式的目标音视频文件;
当目标编码器的支持解码格式对所述目标转换格式的包含度为0%时,则将目标音视频文件中的数据流进行编码转换,以实现将至所述数据流的所述音视频目标格式和所述音频目标格式均转换至包含在支持音视频解码格式和所述支持音频解码格式内,并在重新编码完成后,按照目标转换格式的规定进行所述数据流文件头输出到对应位置,再将数据流中的数据获取出来,重新按照目标转换格式规定的封装规范进行封装得到格式为目标转换格式的目标音视频文件。
5.根据权利要求4所述的一种多模式的音视频格式高速转换方法,其特征在于:在所述目标音视频文件完成转换后,还包括对目标音视频文件进行转换格式正确性复核,包括:
将完成转换后的目标音视频文件进行文件格式的提取解析得到目标音视频文件完成转换后的文件格式;
将所述目标音视频文件完成转换后的文件格式与所述目标转换格式进行匹配,其中,
若目标音视频文件完成转换后的文件格式与所述目标转换格式一致,则目标音视频文件已成功转换为目标转换格式;
若目标音视频文件完成转换后的文件格式与所述目标转换格式不一致,则目标音视频文件未成功转换为目标转换格式,提取出目标音视频文件中未转换为目标转换格式的音视频数据作为失效文件块。
6.根据权利要求5所述的一种多模式的音视频格式高速转换方法,其特征在于:所述失效文件块的获取,包括:
设定格式相似度,所述格式相似度用于作为目标音视频文件中任意两个音视频数据的格式相似程度的衡量指标,将所述目标音视频文件包含的所有音视频数据按相似度分类得到多个格式簇,其中,位于同一格式簇中的音视频数据具有相同的文件格式,位于不同格式簇中的音视频数据具有不同的文件格式,所述相似度的计算公式为:
Figure FDA0003313095800000031
式中,d表征为音视频数据Si和音视频数据Sj的格式相似度,Si、Sj表征为目标音视频文件中第i、j个音视频数据的格式,i、j为计量常数,无实质意义;
设定相似度阈值,所述相似度阈值用于作为判定音视频数据Si和音视频数据Sj是否归属于同一格式簇的阈值指标,其中,
若音视频数据Si和音视频数据Sj的格式相似度高于相似度阈值,则将音视频数据Si和音视频数据Sj归属于同一格式簇;
若音视频数据Si和音视频数据Sj的格式相似度低于相似度阈值,则将音视频数据Si和音视频数据Sj归属于不同格式簇。
7.根据权利要求6所述的一种多模式的音视频格式高速转换方法,其特征在于,所述失效文件块的获取,还包括:
计算出每个格式簇的簇中心所表征的文件格式,将所述簇中心所表征的文件格式用于表征格式簇的文件格式,所述簇中心所表征的文件格式的计算公式为:
Figure FDA0003313095800000041
式中,Ok表征为第k个格式簇的簇中心所表征的文件格式,nk表征为第k个格式簇的音视频数据总数目,Sx表征为第k个格式簇中第x个音视频数据的格式,x、k为计量常数,无实质含义;
将每个格式簇的簇中心所表征的文件格式作为每个格式簇的文件格式,并依次将每个格式簇的文件格式与所述目标转换格式进行匹配,其中,
若格式簇的文件格式与所述目标转换格式一致,则格式簇中的音视频数据为有效文件块,所述有效文件块表征为目标音视频文件中已成功转换为目标转换格式的数据集合;
若格式簇的文件格式与所述目标转换格式不一致,则格式簇中的音视频数据为失效文件块,所述失效文件块表征为目标音视频文件中未成功转换为目标转换格式的数据集合;
将所述失效文件块返回步骤S2中进行格式的重新转换。
8.根据权利要求1所述的一种多模式的音视频格式高速转换方法,其特征在于,所述目标音视频文件进行格式转换之前需要进行降噪处理。
9.一种根据权利要求1-8任一项所述的多模式的音视频格式高速转换方法的转换系统,其特征在于,包括:
编码器筛选单元(1),用于获取目标音视频文件以及目标转换格式,并依据所述目标转换格式进行音视频编码器的匹配搜索得到支持所述目标转换格式的音视频编码器作为目标编码器,其中,所述目标转换格式表征为目标音视频文件按照用户需求完成转换后的文件格式;
模式选择单元(2),用于根据目标编码器与目标转换格式的匹配状态选择转换模式;
格式转换单元(3),用于依据选择的转换模式对所述目标音视频文件进行格式转换以实现以多种模式对目标音视频文件进行格式转换得到目标转换格式。
CN202111222414.5A 2021-10-20 2021-10-20 一种多模式的音视频格式高速转换方法及系统 Active CN113965776B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111222414.5A CN113965776B (zh) 2021-10-20 2021-10-20 一种多模式的音视频格式高速转换方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111222414.5A CN113965776B (zh) 2021-10-20 2021-10-20 一种多模式的音视频格式高速转换方法及系统

Publications (2)

Publication Number Publication Date
CN113965776A true CN113965776A (zh) 2022-01-21
CN113965776B CN113965776B (zh) 2022-07-05

Family

ID=79464881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111222414.5A Active CN113965776B (zh) 2021-10-20 2021-10-20 一种多模式的音视频格式高速转换方法及系统

Country Status (1)

Country Link
CN (1) CN113965776B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102210160A (zh) * 2008-09-10 2011-10-05 Rgb网络有限公司 用于递送内容的系统和方法
CN105898270A (zh) * 2015-12-27 2016-08-24 乐视致新电子科技(天津)有限公司 一种视频格式区分方法及系统
WO2018076815A1 (zh) * 2016-10-28 2018-05-03 宁德时代新能源科技股份有限公司 格式转换方法及系统
CN108712654A (zh) * 2018-05-18 2018-10-26 网宿科技股份有限公司 一种音视频流的转码方法及设备
WO2020107168A1 (zh) * 2018-11-26 2020-06-04 深圳市欢太科技有限公司 视频解码方法、装置、电子设备、计算机可读存储介质
CN112689197A (zh) * 2019-10-18 2021-04-20 腾讯科技(深圳)有限公司 一种文件格式转换方法、装置、以及计算机存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102210160A (zh) * 2008-09-10 2011-10-05 Rgb网络有限公司 用于递送内容的系统和方法
CN105898270A (zh) * 2015-12-27 2016-08-24 乐视致新电子科技(天津)有限公司 一种视频格式区分方法及系统
WO2018076815A1 (zh) * 2016-10-28 2018-05-03 宁德时代新能源科技股份有限公司 格式转换方法及系统
CN108712654A (zh) * 2018-05-18 2018-10-26 网宿科技股份有限公司 一种音视频流的转码方法及设备
WO2020107168A1 (zh) * 2018-11-26 2020-06-04 深圳市欢太科技有限公司 视频解码方法、装置、电子设备、计算机可读存储介质
CN112689197A (zh) * 2019-10-18 2021-04-20 腾讯科技(深圳)有限公司 一种文件格式转换方法、装置、以及计算机存储介质

Also Published As

Publication number Publication date
CN113965776B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
US9014261B2 (en) Method and system for media file compression
JP5775083B2 (ja) モード情報を符号化、復号化する方法及びその装置
US8538181B2 (en) Image signal encoding apparatus and image signal encoding method
RU2370906C2 (ru) Способ и устройство для редактирования видеофрагментов в сжатой области
US20170034510A1 (en) Encoding or decoding method and apparatus
US20130114687A1 (en) Fixed intra run-level mode for cavlc in hevc
WO2017114016A1 (zh) 图像解码和编码方法、解码和编码装置、解码器及编码器
JP2016226001A (ja) デコーダおよび復号方法
JP2014511138A5 (zh)
JP2014511138A (ja) シーンタイプに基づくビデオストリームのエンコーディング
US10771802B2 (en) Method for color mapping a video signal based on color mapping data and method of encoding a video signal and color mapping data and corresponding devices
US20130114684A1 (en) Electronic devices for selective run-level coding and decoding
CN110574376A (zh) 用于解码高动态范围图像的方法和设备
TW201836354A (zh) 用以編碼和解碼視頻資料之方法、設備及系統
CN108900838A (zh) 一种基于hdr-vdp-2失真准则的率失真优化方法
CN101742330B (zh) 一种图像编码方法及装置
US20110050959A1 (en) Vector embedded graphics coding
CN102196268B (zh) 多媒体数据处理方法、装置和系统
US8355057B2 (en) Joint scalar embedded graphics coding for color images
CN113965776B (zh) 一种多模式的音视频格式高速转换方法及系统
KR20230025879A (ko) 신경 네트워크 기반 인트라 예측 모드에 대한 변환 프로세스의 적응
WO2018120230A1 (zh) 图像滤波方法、装置以及设备
CN103037221B (zh) 一种监控录像文件的解码方法和系统
CN111669590A (zh) 用于嵌入式图像编解码器的基于子块的熵译码
KR102255312B1 (ko) 순환 신경망을 이용한 코덱 분류 시스템 및 코덱 분류 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant