CN113747236A - 一种基于多线程的音频格式高速转换方法及系统 - Google Patents

一种基于多线程的音频格式高速转换方法及系统 Download PDF

Info

Publication number
CN113747236A
CN113747236A CN202111214020.5A CN202111214020A CN113747236A CN 113747236 A CN113747236 A CN 113747236A CN 202111214020 A CN202111214020 A CN 202111214020A CN 113747236 A CN113747236 A CN 113747236A
Authority
CN
China
Prior art keywords
audio
pcm
sampling rate
file
data block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111214020.5A
Other languages
English (en)
Inventor
黄泽杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxia Information Technology Huizhou Co ltd
Original Assignee
Jiangxia Information Technology Huizhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxia Information Technology Huizhou Co ltd filed Critical Jiangxia Information Technology Huizhou Co ltd
Priority to CN202111214020.5A priority Critical patent/CN113747236A/zh
Publication of CN113747236A publication Critical patent/CN113747236A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种基于多线程的音频格式高速转换方法及系统,步骤S1、为音频文件的转换过程创建两条线程;步骤S2、利用所述解码线程将所述音频文件进行分块得到多个文件块,并逐一将所述文件块解码转换为pcm数据块,再对pcm数据块进行重采样得到pcm重采样数据块,将pcm重采样数据块堆入音频转换系统的内存中的缓存队列中;步骤S3、利用所述编码线程在发现缓存队列中存在pcm重采样数据块的同时将pcm重采样数据块取出进行编码以实现将音频文件从现有格式编码转换为目标格式。本发明通过两条线程能够共存匹配实现解码、编码过程的同时进行,解码器和编码器均无需空闲等待,充分利用了系统资源来提高整体的转码效率。

Description

一种基于多线程的音频格式高速转换方法及系统
技术领域
本发明涉及音频格式转换技术领域,具体涉及一种基于多线程的音频格式高速转换方法及系统。
背景技术
现有的音频格式转换的方法的流程为:1.根据源文件的文件头解析出源文件的格式和音频规格参数(采样率,声道数,时长等);2.根据解析到的文件格式去匹配相对格式的解码器(即对应的音频压缩算法);3.使用编码器将源文件的数据解码成pcm数据,并且将pcm数据缓存本地磁盘;4然后根据输出文件的格式匹配相对应的编码器,准备对解码到的pcm数据进行编码;5.编码器将解码时缓存的pcm读取至内存中,将pcm数据的规格转换成编码器能够识别的规格后,再对数据重新编码。
在这个整个流程中,解码器的采样率通常由操作人员根据经验进行设定,采样率决定了音频文件的解码效率和解码品质,仅根据人为经验决定,可靠性低。
发明内容
本发明的目的在于提供一种基于多线程的音频格式高速转换方法及系统,以解决现有技术中解码器的采样率通常由操作人员根据经验进行设定,采样率决定了音频文件的解码效率和解码品质,仅根据人为经验决定,可靠性低的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种基于多线程的音频格式高速转换方法,包括以下步骤:
步骤S1、为音频文件的转换过程创建两条线程,其中,所述两条线程包括解码线程和编码线程,所述解码线程用于音频文件的解码和重采样操作,所述编码线程用于对音频文件进行编码操作;
步骤S2、利用所述解码线程将所述音频文件进行分块得到多个文件块,并逐一将所述文件块解码转换为pcm数据格式的为pcm数据块,再权衡采样品质和采样效率以确定pcm数据块重采样的采样率,使得pcm数据块按所述采样率转化成为的pcm重采样数据块呈现效率和品质的共优特性,同步将pcm重采样数据块堆入音频转换系统的内存中的缓存队列中;
步骤S3、利用所述编码线程对所述缓存队列进行循环监听以发现所述缓存队列中存在pcm重采样数据块与否,并在发现缓存队列中存在pcm重采样数据块的同时将pcm重采样数据块取出进行编码以实现将音频文件从pcm数据格式编码转换为目标格式。
作为本发明的一种优选方案,对所述音频文件进行分块,包括:
获取编码线程中编码操作的最佳编码长度,并将所述最佳编码长度作为音频文件的分块长度,其中,确定所述最佳编码长度的方法包括:
获取编码线程中单次编码操作的文件长度允许范围,并构建编码线程中单次编码操作的文件长度与编码效率的映射关系式:V=F(L);
式中,V表征为编码效率,L表征为文件长度,F表征为文件长度与编码效率的映射函数体;
文件长度L在文件长度允许范围内进行取值,直至使得编码效率V取最大值,则将编码效率V取最大值对应的文件长度L作为最佳编码长度;
将所述音频文件从文件头按照分块长度依次对音频文件进行顺序切割得到多个文件块。
作为本发明的一种优选方案,所述确定pcm数据块重采样的采样率,包括:
设定音频品质峰值和音频最低值,所述音频品质峰值用于表示最优音质的采样率,所述音频最低值表示对音频品质满足实际最低要求的采样率;
从音频品质峰值向音频最低值进行采样评优,以获得评优值,所述评优值表示所述采样品质和采样效率的权衡结果的评价指标;
所述评优值的计算表达式为:
Score(f)=X(f)+Y(f);
式中,Score(f)表征为采样率f的评优值,X(f)表征为采样效率在采样率f时的量化函数,Y(f)表征为采样品质在采样率f时的量化函数;
采样效率在采样率f时的量化函数
Figure BDA0003310000950000031
式中,k1为常数系数,无实质含义;采样品质在采样率f时的量化函数Y(f)=k2*f,式中,k2为常数系数,无实质含义;
设定采样率f的约束条件为f∈[音频最低值,音频品质峰值],并在约束条件内搜索使得Score(f)取得最大值的采样率f作为pcm数据块重采样的采样率。
作为本发明的一种优选方案,所述在约束条件内搜索使得Score(f)取得最大值的采样率f,包括:
以约束条件中音频品质峰值为搜索起点A,音频最低值为搜索终点B,以C为搜索迭代梯度,设定搜索次数i,并初始化i=1;
将采样率f从搜索起点A开始赋值进行首次搜索,并求得采样率f的Score(f),i自加1;
迭代入口:对采样率f按f=f-i*C进行赋值更新,判断采样率f达到搜索终点B与否,其中,
若采样率f等于搜索终点B,则采样率f到达搜索终点B,求得采样率f的Score(f),跳至所述迭代出口;
若采样率f大于搜索终点B,则采样率f未到达搜索终点B,求得采样率f的Score(f),i自加1,返回所述迭代入口;
迭代出口:退出搜索;
在求得的所有Score(f)中选取出最大值,并得到最大值对应的采样率f。
作为本发明的一种优选方案,所述pcm重采样数据块在堆入音频转换系统的内存中的缓存队列中之前还包括对所述pcm重采样数据块进行降噪预处理。
作为本发明的一种优选方案,所述利用所述编码线程对所述缓存队列进行循环监听,包括:
设定监听间隔,编码线程在每隔一个监听间隔的时序上对所述缓存队列进行数据扫描,其中,
若缓存队列中存在数据块,且数据块与pcm重采样数据块相匹配,则判定缓存队列中存在pcm重采样数据块;
若缓存队列中不存在数据块或存在的数据块与pcm重采样数据块不匹配,则判定缓存队列中不存在pcm重采样数据块。
作为本发明的一种优选方案,所述将pcm重采样数据块取出进行编码,包括:
编码线程将缓存队列中的所述pcm重采样数据块读取至内存中,并将pcm重采样数据块的数据规格转换为编码线程能够识别的数据规格;
编码线程将对转换了数据规格的pcm重采样数据块进行数据编码得到格式转换数据块,并将多个格式转换数据块进行首尾链接得到目标格式的音频文件。
作为本发明的一种优选方案,本发明提供了一种根据所述的基于多线程的音频格式高速转换方法的音频转换系统,包括:
解析器,用于对音频文件进行文件头解析得到音频文件的格式和音频规格参数;
解码器,用于执行解码线程对音频文件进行数据解码和重采样得到pcm重采样数据块;
编码器,用于执行编码线程对pcm重采样数据块进行编码得到目标格式的音频文件。
作为本发明的一种优选方案,所述解析器、解码器和编码器通过网络通信协议进行数据交互。
本发明与现有技术相比较具有如下有益效果:
本发明通过创建两条线程进行音频文件的格式转换,无需等待解码器的解码工作完全完成后,编码器才能够开始工作,而且也同时避免在解码器解码的时候,编码器处于空闲状态而导致的编码器在解码过程中没有被得到充分利用,两条线程能够共存匹配实现解码、编码过程的同时进行,解码器和编码器均无需空闲等待,充分利用了系统资源来提高整体的转码效率,从而缩减了音频格式转换的时长,实现高效转换,使得用户在音频转换功能的体验上更加的顺畅,友好,并且在解码器的采样率由采样效率和采样品质进行权衡决定,从而可共同保障音频文件的解码效率和解码品质,实现效率和品质的同时优化呈现共优特性。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的音频格式高速转换方法流程图;
图2为本发明实施例提供的音频转换系统结构框图。
图中的标号分别表示如下:
1-解析器;2-解码器;3-编码器。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,现有的音频格式转换的方法的流程为:1.根据源文件的文件头解析出源文件的格式和音频规格参数(采样率,声道数,时长等);2.根据解析到的文件格式去匹配相对格式的解码器(即对应的音频压缩算法);3.使用编码器将源文件的数据解码成pcm数据,并且将pcm数据缓存本地磁盘;4然后根据输出文件的格式匹配相对应的编码器,准备对解码到的pcm数据进行编码;5.编码器将解码时缓存的pcm读取至内存中,将pcm数据的规格转换成编码器能够识别的规格后,再对数据重新编码。
在这个整个流程中,格式的重新编码需要待解码器的解码工作完全完成后,编码器才能够开始工作。在解码器解码的时候,编码器处于空闲状态,导致编码器在解码过程中没有被得到充分利用。并且由于需要在磁盘中缓存文件,这中间的磁盘的读取也需要时间,因此本发明提供了一种基于多线程的音频格式高速转换方法,充分利用了系统资源来提高整体的转码效率,从而缩减了音频格式转换的时长。
一种基于多线程的音频格式高速转换方法,包括以下步骤:
步骤S1、为音频文件的转换过程创建两条线程,其中,所述两条线程包括解码线程和编码线程,所述解码线程用于音频文件的解码和重采样操作,所述编码线程用于对音频文件进行编码操作;
步骤S2、利用所述解码线程将所述音频文件进行分块得到多个文件块,并逐一将所述文件块解码转换为pcm数据格式的为pcm数据块,再权衡采样品质和采样效率以确定pcm数据块重采样的采样率,使得pcm数据块按所述采样率转化成为的pcm重采样数据块呈现效率和品质的共优特性,同步将pcm重采样数据块堆入音频转换系统的内存中的缓存队列中;
对所述音频文件进行分块,包括:
获取编码线程中编码操作的最佳编码长度,并将所述最佳编码长度作为音频文件的分块长度,其中,确定所述最佳编码长度的方法包括:
获取编码线程中单次编码操作的文件长度允许范围,并构建编码线程中单次编码操作的文件长度与编码效率的映射关系式:V=F(L);
式中,V表征为编码效率,L表征为文件长度,F表征为文件长度与编码效率的映射函数体;
文件长度L在文件长度允许范围内进行取值,直至使得编码效率V取最大值,则将编码效率V取最大值对应的文件长度L作为最佳编码长度;
将所述音频文件从文件头按照分块长度依次对音频文件进行顺序切割得到多个文件块;
确定最佳编码长度可以使得编码线程在编码操作时保持最高效率,从而整体上提高音频文件格式转化的效率。
将音频文件进行分块,是为了能够让已经解码好的数据能够提前交给编码器进行编码,以此让编码器和解码器能够同时工作,降低编码器的空闲时长。
对于解码器而言,采样率越高,音频文件需要处理的数据就会更加庞大,采样品质越好最终获得的音频文件转换质量越好,但也直接导致编码效率降低,同样的,采样率越低,音频文件需要处理的数据量就会较小,采样品质越差最终获得的音频文件转换质量越差,但也直接导致编码效率提高,因此,选择一个合适的采样率,对音频文件的格式转换质量和效率具有重要影响,本实施例将人耳能识别的最高频率作为音频文件的采样率,既能够采样品质,又能够保证采样效率。本实施例提供了一种确定采样频率的方法具体如下:
所述确定pcm数据块重采样的采样率,包括:
设定音频品质峰值和音频最低值,所述音频品质峰值用于表示最优音质的采样率,所述音频最低值表示对音频品质满足实际最低要求的采样率;
从音频品质峰值向音频最低值进行采样评优,以获得评优值,所述评优值表示所述采样品质和采样效率的权衡结果的评价指标;
所述评优值的计算表达式为:
Score(f)=X(f)+Y(f);
式中,Score(f)表征为采样率f的评优值,X(f)表征为采样效率在采样率f时的量化函数,Y(f)表征为采样品质在采样率f时的量化函数;
采样效率在采样率f时的量化函数
Figure BDA0003310000950000071
式中,k1为常数系数,无实质含义;采样品质在采样率f时的量化函数Y(f)=k2*f,式中,k2为常数系数,无实质含义;
设定采样率f的约束条件为f∈[音频最低值,音频品质峰值],并在约束条件内搜索使得Score(f)取得最大值的采样率f作为pcm数据块重采样的采样率。
所述在约束条件内搜索使得Score(f)取得最大值的采样率f,包括:
以约束条件中音频品质峰值为搜索起点A,音频最低值为搜索终点B,以C为搜索迭代梯度,设定搜索次数i,并初始化i=1;
将采样率f从搜索起点A开始赋值进行首次搜索,并求得采样率f的Score(f),i自加1;
迭代入口:对采样率f按f=f-i*C进行赋值更新,判断采样率f达到搜索终点B与否,其中,
若采样率f等于搜索终点B,则采样率f到达搜索终点B,求得采样率f的Score(f),跳至所述迭代出口;
若采样率f大于搜索终点B,则采样率f未到达搜索终点B,求得采样率f的Score(f),i自加1,返回所述迭代入口;
迭代出口:退出搜索;
在求得的所有Score(f)中选取出最大值,并得到最大值对应的采样率f。
音频品质峰值为当前行业内能够达到的最高采样率后较高的高品质音频优选的采样率,一般为192000Hz多少,而音频最低值为当前实际对于定义高品质音频的最低采样率,一般为44100Hz,当然上下浮动也满足高品质音频的要求,分别将192000Hz、44100Hz作为音频品质峰值、音频最低值进行采样率搜索,具体过程如下:
设定采样率f的约束条件为f∈[44100Hz,192000Hz],并在约束条件内搜索使得Score(f)取得最大值的采样率f作为pcm数据块重采样的采样率。
44100Hz,192000Hz为目标比较常用采样率,由于无法直接判定[44100Hz,192000Hz]范围内哪个频率能够使得再提高采样效率同时仍能具有较好的采样品质,因此在[44100Hz,192000Hz]范围内的进行搜索,并以评分函数进行采样效率和采样品质的评价从而实现对采样率的评价,其中,以采样率的评优值越高,则认为采样率在采样效率和采样品质的权衡表现越好,即越适合作pcm数据块重采样的采样率,反之,以采样率的评优值越低,则认为采样率在采样效率和采样品质的权衡表现越差,即越不适合作pcm数据块重采样的采样率。
所述在约束条件内搜索使得Score(f)取得最大值的采样率f的方法包括:
以约束条件中192000Hz为搜索起点A,44100Hz为搜索终点B,以100Hz为搜索迭代梯度,设定搜索次数i,并初始化i=1;
将采样率f从搜索起点A开始赋值进行首次搜索,并求得采样率f的Score(f),i自加1;
迭代入口:对采样率f按f=f-i*C进行赋值更新,判断采样率f达到搜索终点B与否,其中,
若采样率f等于搜索终点B,则采样率f到达搜索终点B,求得采样率f的Score(f),跳至所述迭代出口;
若采样率f大于搜索终点B,则采样率f未到达搜索终点B,求得采样率f的Score(f),i自加1,返回所述迭代入口;
迭代出口:退出搜索;
在求得的所有Score(f)中选取出最大值,并得到最大值对应的采样率f。
搜索迭代梯度C可以根据使用需求进行自定义更改,此处以C=100Hz为例:
首次搜索,采样率f=192000Hz,求得Score(192000),i自加1得到i=2;
第2次搜索,采样率f更新为f=192000Hz-100Hz=191900Hz,191900Hz>44100Hz,求得Score(191900),i自加1得到i=3;
第3次搜索,采样率f更新为f=191900Hz-100Hz=191800Hz,191800Hz>44100Hz,求得Score(191800),i自加1得到i=4;
依此了推,第1479次搜索,采样率f更新为f=44300Hz-100Hz=44200Hz,44200Hz>44100Hz,求得Score(44200),i自加1得到i=1480;
第1480次搜索,采样率f更新为f=44200Hz-100Hz=44100Hz,44100Hz=44100Hz,求得Score(44100),退出搜索;
比较Score(192000)~Score(44100),并得到最大值对应的采样率f。
所述pcm重采样数据块在堆入音频转换系统的内存中的缓存队列中之前还包括对所述pcm重采样数据块进行降噪预处理。
将源数据降噪有两个好处。一是噪音本身则是不需要的数据,所以降噪可以提高声音质量。二是降噪后的pcm重采样数据块,会是整体音波曲线更加平滑,对于大部分音频编码算法中,越平滑的pcm重采样数据块,可以降低编码压缩算法中的计算压力。
对解码后的pcm数据块进行重采样和降噪预处理,以提高编码器的工作效率。之所以会将交给编码器数据进行重采样和降噪预处理,是因为编码所耗费的时间在整个转码流程中暂用80%的比例,因此重采样和降噪预处理会提高了编码器的效率,整体转码的时间也会随之降低。
步骤S3、利用所述编码线程对所述缓存队列进行循环监听以发现所述缓存队列中存在pcm重采样数据块与否,并在发现缓存队列中存在pcm重采样数据块的同时将pcm重采样数据块取出进行编码以实现将音频文件从pcm数据格式编码转换为目标格式。
所述利用所述编码线程对所述缓存队列进行循环监听,包括:
设定监听间隔,编码线程在每隔一个监听间隔的时序上对所述缓存队列进行数据扫描,其中,
若缓存队列中存在数据块,且数据块与pcm重采样数据块相匹配,则判定缓存队列中存在pcm重采样数据块;
若缓存队列中不存在数据块或存在的数据块与pcm重采样数据块不匹配,则判定缓存队列中不存在pcm重采样数据块。
所述步骤S3中,所述pcm重采样数据块的编码方法包括:
编码线程将缓存队列中的所述pcm重采样数据块读取至内存中,并将pcm重采样数据块的数据规格转换为编码线程能够识别的数据规格;
编码线程将对转换了数据规格的pcm重采样数据块进行数据编码得到格式转换数据块,并将多个格式转换数据块进行首尾链接得到目标格式的音频文件。
如图2所示,基于上述基于多线程的音频格式高速转换方法,本发明提供了一种音频转换系统,包括:
解析器1,用于对音频文件进行文件头解析得到音频文件的格式和音频规格参数;
解码器2,用于执行解码线程对音频文件进行数据解码和重采样得到pcm重采样数据块;
编码器3,用于执行编码线程对pcm重采样数据块进行编码得到目标格式的音频文件。
所述解析器、解码器和编码器通过网络通信协议进行数据交互。
本发明通过创建两条线程进行音频文件的格式转换,无需等待解码器的解码工作完全完成后,编码器才能够开始工作,而且也同时避免在解码器解码的时候,编码器处于空闲状态而导致的编码器在解码过程中没有被得到充分利用,两条线程能够共存匹配实现解码、编码过程的同时进行,解码器和编码器均无需空闲等待,充分利用了系统资源来提高整体的转码效率,从而缩减了音频格式转换的时长,实现高效转换,使得用户在音频转换功能的体验上更加的顺畅,友好。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (9)

1.一种基于多线程的音频格式高速转换方法,其特征在于,包括以下步骤:
步骤S1、为音频文件的转换过程创建两条线程,其中,所述两条线程包括解码线程和编码线程,所述解码线程用于音频文件的解码和重采样操作,所述编码线程用于对音频文件进行编码操作;
步骤S2、利用所述解码线程将所述音频文件进行分块得到多个文件块,并逐一将所述文件块解码转换为pcm数据格式的为pcm数据块,再权衡采样品质和采样效率以确定pcm数据块重采样的采样率,使得pcm数据块按所述采样率转化成为的pcm重采样数据块呈现效率和品质的共优特性,同步将pcm重采样数据块堆入音频转换系统的内存中的缓存队列中;
步骤S3、利用所述编码线程对所述缓存队列进行循环监听以发现所述缓存队列中存在pcm重采样数据块与否,并在发现缓存队列中存在pcm重采样数据块的同时将pcm重采样数据块取出进行编码以实现将音频文件从pcm数据格式编码转换为目标格式。
2.根据权利要求1所述的一种基于多线程的音频格式高速转换方法,其特征在于:对所述音频文件进行分块,包括:
获取编码线程中编码操作的最佳编码长度,并将所述最佳编码长度作为音频文件的分块长度,其中,确定所述最佳编码长度的方法包括:
获取编码线程中单次编码操作的文件长度允许范围,并构建编码线程中单次编码操作的文件长度与编码效率的映射关系式:V=F(L);
式中,V表征为编码效率,L表征为文件长度,F表征为文件长度与编码效率的映射函数体;
文件长度L在文件长度允许范围内进行取值,直至使得编码效率V取最大值,则将编码效率V取最大值对应的文件长度L作为最佳编码长度;
将所述音频文件从文件头按照分块长度依次对音频文件进行顺序切割得到多个文件块。
3.根据权利要求1所述的一种基于多线程的音频格式高速转换方法,其特征在于:所述确定pcm数据块重采样的采样率,包括:
设定音频品质峰值和音频最低值,所述音频品质峰值用于表示最优音质的采样率,所述音频最低值表示对音频品质满足实际最低要求的采样率;
从音频品质峰值向音频最低值进行采样评优,以获得评优值,所述评优值表示所述采样品质和采样效率的权衡结果的评价指标;
所述评优值的计算表达式为:
Score(f)=X(f)+Y(f);
式中,Score(f)表征为采样率f的评优值,X(f)表征为采样效率在采样率f时的量化函数,Y(f)表征为采样品质在采样率f时的量化函数;
采样效率在采样率f时的量化函数
Figure FDA0003310000940000021
式中,k1为常数系数,无实质含义;采样品质在采样率f时的量化函数Y(f)=k2*f,式中,k2为常数系数,无实质含义;
设定采样率f的约束条件为f∈[音频最低值,音频品质峰值],并在约束条件内搜索使得Score(f)取得最大值的采样率f作为pcm数据块重采样的采样率。
4.根据权利要求3所述的一种基于多线程的音频格式高速转换方法,其特征在于:所述在约束条件内搜索使得Score(f)取得最大值的采样率f,包括:
以约束条件中音频品质峰值为搜索起点A,音频最低值为搜索终点B,以C为搜索迭代梯度,设定搜索次数i,并初始化i=1;
将采样率f从搜索起点A开始赋值进行首次搜索,并求得采样率f的Score(f),i自加1;
迭代入口:对采样率f按f=f-i*C进行赋值更新,判断采样率f达到搜索终点B与否,其中,
若采样率f等于搜索终点B,则采样率f到达搜索终点B,求得采样率f的Score(f),跳至所述迭代出口;
若采样率f大于搜索终点B,则采样率f未到达搜索终点B,求得采样率f的Score(f),i自加1,返回所述迭代入口;
迭代出口:退出搜索;
在求得的所有Score(f)中选取出最大值,并得到最大值对应的采样率f。
5.根据权利要求1所述的一种基于多线程的音频格式高速转换方法,其特征在于:所述pcm重采样数据块在堆入音频转换系统的内存中的缓存队列中之前还包括对所述pcm重采样数据块进行降噪预处理。
6.根据权利要求1所述的一种基于多线程的音频格式高速转换方法,其特征在于:所述利用所述编码线程对所述缓存队列进行循环监听,包括:
设定监听间隔,编码线程在每隔一个监听间隔的时序上对所述缓存队列进行数据扫描,其中,
若缓存队列中存在数据块,且数据块与pcm重采样数据块相匹配,则判定缓存队列中存在pcm重采样数据块;
若缓存队列中不存在数据块或存在的数据块与pcm重采样数据块不匹配,则判定缓存队列中不存在pcm重采样数据块。
7.根据权利要求6所述的一种基于多线程的音频格式高速转换方法,其特征在于:所述将pcm重采样数据块取出进行编码,包括:
编码线程将缓存队列中的所述pcm重采样数据块读取至内存中,并将pcm重采样数据块的数据规格转换为编码线程能够识别的数据规格;
编码线程将对转换了数据规格的pcm重采样数据块进行数据编码得到格式转换数据块,并将多个格式转换数据块进行首尾链接得到目标格式的音频文件。
8.一种根据权利要求1-7任一项所述的基于多线程的音频格式高速转换方法的音频转换系统,其特征在于,包括:
解析器(1),用于对音频文件进行文件头解析得到音频文件的格式和音频规格参数;
解码器(2),用于执行解码线程对音频文件进行数据解码和重采样得到pcm重采样数据块;
编码器(3),用于执行编码线程对pcm重采样数据块进行编码得到目标格式的音频文件。
9.根据权利要求8所述的一种音频转换系统,其特征在于,所述解析器、解码器和编码器通过网络通信协议进行数据交互。
CN202111214020.5A 2021-10-19 2021-10-19 一种基于多线程的音频格式高速转换方法及系统 Pending CN113747236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111214020.5A CN113747236A (zh) 2021-10-19 2021-10-19 一种基于多线程的音频格式高速转换方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111214020.5A CN113747236A (zh) 2021-10-19 2021-10-19 一种基于多线程的音频格式高速转换方法及系统

Publications (1)

Publication Number Publication Date
CN113747236A true CN113747236A (zh) 2021-12-03

Family

ID=78726848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111214020.5A Pending CN113747236A (zh) 2021-10-19 2021-10-19 一种基于多线程的音频格式高速转换方法及系统

Country Status (1)

Country Link
CN (1) CN113747236A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0376553A2 (en) * 1988-12-30 1990-07-04 AT&T Corp. Perceptual coding of audio signals
CN101281749A (zh) * 2008-05-22 2008-10-08 上海交通大学 可分级的语音和乐音联合编码装置和解码装置
CN103200380A (zh) * 2012-01-10 2013-07-10 北京世纪高蓝科技有限公司 多媒体数据格式转换方法
CN105551512A (zh) * 2015-12-17 2016-05-04 天翼爱音乐文化科技有限公司 音频格式转换方法和装置
CN109243471A (zh) * 2018-09-26 2019-01-18 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
CN111078930A (zh) * 2019-12-13 2020-04-28 集奥聚合(北京)人工智能科技有限公司 音频文件数据处理方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0376553A2 (en) * 1988-12-30 1990-07-04 AT&T Corp. Perceptual coding of audio signals
CN101281749A (zh) * 2008-05-22 2008-10-08 上海交通大学 可分级的语音和乐音联合编码装置和解码装置
CN103200380A (zh) * 2012-01-10 2013-07-10 北京世纪高蓝科技有限公司 多媒体数据格式转换方法
CN105551512A (zh) * 2015-12-17 2016-05-04 天翼爱音乐文化科技有限公司 音频格式转换方法和装置
CN109243471A (zh) * 2018-09-26 2019-01-18 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
CN111078930A (zh) * 2019-12-13 2020-04-28 集奥聚合(北京)人工智能科技有限公司 音频文件数据处理方法及装置

Similar Documents

Publication Publication Date Title
JP6720266B2 (ja) 高帯域励起信号を予測するための方法および装置
RU2740359C2 (ru) Звуковые кодирующее устройство и декодирующее устройство
JP4320033B2 (ja) 音声パケット送信方法、音声パケット送信装置、および音声パケット送信プログラムとそれを記録した記録媒体
JP2011509426A (ja) オーディオエンコーダおよびデコーダ
JP2017062512A (ja) オーディオ・データを処理するための方法、装置、及びシステム
US20240046937A1 (en) Phase reconstruction in a speech decoder
US20100324914A1 (en) Adaptive Encoding of a Digital Signal with One or More Missing Values
WO2023197809A1 (zh) 一种高频音频信号的编解码方法和相关装置
JP2013232013A (ja) 信号を符号化する方法および信号を復号する方法
CN1416561A (zh) 语音解码器和一种语音解码方法
CN113747236A (zh) 一种基于多线程的音频格式高速转换方法及系统
US7363231B2 (en) Coding device, decoding device, and methods thereof
KR20030025092A (ko) 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
EP1187337A1 (en) Speech coder, speech processor, and speech processing method
WO2013123632A1 (en) Component sorting based encoding for 3d mesh compression
JP3262652B2 (ja) 音声符号化装置及び音声復号化装置
CN111381973A (zh) 一种语音数据处理方法、装置及计算机可读存储介质
JP2002366199A (ja) Celp型音声符号化装置
JPH08179800A (ja) 音声符号化装置
WO2020001569A1 (zh) 立体声信号的编码、解码方法、编码装置和解码装置
CN1972132A (zh) 声音处理方式
KR20020035108A (ko) 협대역으로 인코딩된 신호를 송신하기 위한 송신기, 및수신단에서 상기 신호의 대역을 확장하기 위한 수신기
Guo et al. DSP-Based Optimization of the G. 729 Codec: Strategies for Complexity Reduction in Voice Encoding and Decoding
CN111899729A (zh) 一种语音模型的训练方法、装置、服务器和存储介质
KR20050078524A (ko) 오디오 정보 제공 시스템 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211203

RJ01 Rejection of invention patent application after publication