CN105847857A - 倍速播放视频时处理音频的方法及装置 - Google Patents

倍速播放视频时处理音频的方法及装置 Download PDF

Info

Publication number
CN105847857A
CN105847857A CN201610126874.0A CN201610126874A CN105847857A CN 105847857 A CN105847857 A CN 105847857A CN 201610126874 A CN201610126874 A CN 201610126874A CN 105847857 A CN105847857 A CN 105847857A
Authority
CN
China
Prior art keywords
speed
data
audio frequency
packet
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610126874.0A
Other languages
English (en)
Inventor
蔡炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leshi Zhixin Electronic Technology Tianjin Co Ltd
Original Assignee
Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leshi Zhixin Electronic Technology Tianjin Co Ltd filed Critical Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority to CN201610126874.0A priority Critical patent/CN105847857A/zh
Publication of CN105847857A publication Critical patent/CN105847857A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234381Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6373Control signals issued by the client directed to the server or network components for rate control, e.g. request to the server to modify its transmission rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection

Abstract

本发明公开一种倍速播放视频时处理音频的方法,包括以下步骤:设定步骤,设定静音抑制处理的抑制阈值;识别步骤,根据所设定的抑制阈值,对声音信号流进行识别,以区分确定语音数据包和背景噪声数据包,所述语音数据包包括对白数据帧和背景音乐数据帧,而所述背景噪声数据包包括静音数据帧和环境声音数据帧;消除步骤,将背景噪声数据包丢弃,保留语音数据包以供播放。本发明还提供一种倍速播放视频时处理音频的装置本发明通过在倍速播放时采用静音抑制方法使得音频在倍速播放时也能达到非常好的效果,解决了倍速播放时播放音频的问题;而且,还可进一步通过设置动态的抑制阈值保证音频播放能够平滑的按照指定倍数播放。

Description

倍速播放视频时处理音频的方法及装置
技术领域
本发明涉及视频播放技术领域,尤其是指倍速播放视频时处理音频的方法及装置。
背景技术
在视频播放时,时常会涉及到进行倍速播放,在倍速播放过程中,视频帧播放会按照固定的帧间间隔选择一帧视频帧,该帧间间隔的其它视频帧将会丢弃,选择的视频帧会按照原来的帧率进行播放从而达到视频倍速播放的效果。然而,音频却无法按照这种方式处理,如果不做分析地按照固定帧间间隔选择一帧音频帧并丢弃该帧间间隔的其余帧,则会造成吐字不清楚,甚至噪音的效果,这主要原因是影片、视频播放时的声音可以分为静音、背景音乐和对白三部分,其中大部分是静音和背景音乐。在倍速播放过程中,用户主要关心的是对白,其次是背景音乐。然而,采用以上按照固定帧间间距选择音频帧的方式处理时,正常的对白音频往往会被丢弃了,而背景噪声音频却可能又保留下来,由此使得播放出来的音频杂乱无章,用户体验很差。也正因此,目前,在倍速播放时,通常的处理方式是静音,即不播放音频,这种做法的后果是在倍速播放过程中无法听见声音,给用户的观看体验自然会大打折扣。
发明内容
本发明所要解决的技术问题在于,提供一种倍速播放视频时处理音频的方法,以提高倍速播放时声音播放的质量。
本发明另一个所要解决的技术问题在于,提供一种倍速播放视频时处理音频的装置,其能有效提高倍速播放时声音播放的质量。
为解决上述技术问题,本发明提供如下技术方案:一种倍速播放视频时处理音频的方法,包括以下步骤:
设定步骤,设定静音抑制处理的抑制阈值;
识别步骤,根据所设定的抑制阈值,对声音信号流进行识别,以区分确定语音数据包和背景噪声数据包,所述语音数据包包括对白数据帧和背景音乐数据帧,而所述背景噪声数据包包括静音数据帧和环境声音数据帧;
消除步骤,将背景噪声数据包丢弃,保留语音数据包以供播放。
进一步地,所述抑制阈值根据过往的一段时间内PCM编码的平均值以及如下公式计算获得:
其中,N代表过往时间段的大小;x代表噪声系数。
进一步地,识别步骤中,读取声音信号流,并按照预定数据大小形成缓冲数据包依序存入缓冲器,根据抑制阈值判断当前的缓冲数据包是语音数据包还是背景噪声数据包,如果一个缓冲数据包中的所有音频帧的PCM编码值都小于抑制阈值,则判定为背景噪声数据包,否则判定为语音数据包。
进一步地,设定步骤中,还设定静音长度值,相应地,在识别步骤中,当连续出现的PCM值小于抑制阈值的缓冲数据包的数量超过静音长度值时,才将这些连续出现的PCM值小于抑制阈值的缓冲数据包判定为背景噪音数据包进行丢弃。
进一步地,所述方法还包括调整步骤:定期对比丢弃数据包的速度和倍速播放的速度并根据对比结果动态调整噪音系数χ,如果当前丢音频数据包速度小于倍速播放的速度时,则自动增大χ的值;而当丢音频数据包的速度大于倍数播放的速度时,则会自动减少χ的值。
进一步地,所述噪声系数χ的初始值为0.75。
进一步地,调整步骤中,当在一段预定时长的时间内丢包速度与倍速播放速度的差距大于10%,则按照每次10%的比例调整χ,噪音系数χ调整的计算公式如下:
丢包速度< 播放速度时,χ = χ * ( 1 + 10% );
丢包速度 >播放速度时,χ = χ * ( 1 - 10% );
其中,χ为调整后的噪音系数,χ为调整前的噪音系数。
另一方面,本发明还提供一种倍速播放视频时处理音频的装置,其包括:
数据处理模块,用于计算和设定抑制阈值、调整噪音系数、进行数据对比分析判断缓冲数据包是语音数据包还是背景噪音数据包以及确定丢弃背景噪音数据数据包;
数据存储模块,可用于存储系统参数;
数据缓冲器,是用于缓冲存储音频数据包;
读取模块,用于读取音频数据并存入数据缓冲器,同时还获取缓冲数据包的各音频帧的PCM编码值提供给数据处理模块进行数据对比分析判断。
进一步地,所述装置还包括:输入模块,用于进行参数的初始化设定。
采用上述技术方案后,本发明至少具有如下有益效果:本发明通过在倍速播放时采用静音抑制方法使得音频在倍速播放时也能达到非常好的效果,解决了倍速播放时播放音频的问题;而且,还可进一步通过设置动态的抑制阈值保证音频播放能够平滑的按照指定倍数播放。
附图说明
图1是本发明倍速播放视频时处理音频的方法的流程框图。
图2是本发明倍速播放视频时处理音频的方法的处理流程示意图。
图3是音频数据中语音、静音的分布示意图。
图4是本发明倍速播放视频时处理音频的装置的模块结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。
如图1及图2所示,本发明提供一种倍速播放视频时处理音频的方法,其包括以下步骤:
设定步骤,设定静音抑制处理的抑制阈值;
识别步骤,根据所设定的抑制阈值,对声音信号流进行识别,以区分确定语音数据包和背景噪声数据包,所述语音数据包包括对白数据帧和背景音乐数据帧,而所述背景噪声数据包包括静音数据帧和环境声音数据帧;
消除步骤,将背景噪声数据包丢弃,保留语音数据包以供播放。
本发明倍速播放视频时处理音频的方法能在倍速播放过程中通过静音抑制方法有效去掉静音和环境声音,并保留对白和背景音乐,从而可以在倍速播放过程中仍能播放出高质量的语音。
所述静音抑制,又称语音活动侦测,其目的是从声音信号流里识别和消除长时间的静音期和环境噪音。
本发明倍速播放视频时处理音频的方法的基本原理是:当用户选择倍速播放视频时,以两倍速为例进行说明,为实现倍速效果,视频播放系统需要丢弃一半的音频帧。通过分析可以发现,在影片或视频中除了人物对白、背景音乐之外还存在着大量的静音和一些无关紧要的背景噪音,如图3所示,在对白(语音数据)的前后都有大量的静音时间,因此,如果在倍速播放时,能准确地丢弃掉音频中的静音和背景噪声,而保留对白和背景音乐,将不会影响到音频播放的效果。
本发明倍速播放视频时处理音频的方法的关键点即在于如何确定对应的音频帧是否为静音状态或者背景噪声。在对音频数据进行脉冲编码调制(Pulse CodeModulation,缩写为PCM)时,主要包括抽样、量化和编码三个环节。其中,抽样是把连续时间模拟信号转换成离散时间连续幅度的抽样信号;量化是把离散时间连续幅度的抽样信号转换成离散时间离散幅度的数字信号;编码是将量化后的信号编码形成一个二进制码组输出。在这种编码方式下,当语音音量越大时,抽样获取的电平就越高,量化编码的PCM无符号整数也就越大。本发明即利用了语音音量大小与PCM编码值成正比的关系来判断音频帧数据是语音(包括对白和背景音乐)还是背景噪声(包括静音和环境声音)。
为准确地对音频帧数据进行上述判断,本发明方法首先需确定一个抑制阈值(Threshold),从而能够根据抑制阈值判断当前的缓冲数据包(Buffer)是语音数据包还是背景噪声数据包,如果该Buffer中的所有音频帧的PCM编码值都小于阈值,则被认为是背景噪声数据包,否则为语音数据包。
为获得更为优化的处理效果,在具体实施时,所述抑制阈值并未被预先设定成一个固定的值,而是根据当前的噪声环境动态的变化及倍速播放速度决定,抑制阈值根据过往的一段时间内PCM编码的平均值确定。从而,很好地体现了本发明倍速播放视频时处理音频的方法的自适应性。
具体地,抑制阈值(Threshold)可以根据如下公式计算获得:
其中,N代表过往时间段的大小;x代表噪声系数。
经实验表明,当N=80000(10秒内数据),采用率为8K。
噪声系数χ的初始值可设定为0.75,而且,为提升处理的准确度,本发明还可包括一调整步骤:定期对比丢弃数据包的速度和倍速播放的速度并根据对比结果动态调整噪音系数χ从而最终调整抑制阀值。调整的基本原则是:在当前丢音频数据包速度小于倍速播放的速度时,会自动增大χ的值;而当丢音频数据包的速度大于倍数播放速度时,则会自动减少χ的值。具体地,如果在一段时间(通常以10秒为基准时长,当然,根据实际情况,也可以设定为其他的更短或更长的时长,例如:5秒、20秒等)内丢包速度与倍速播放速度的差距大于10%,则按照每次10%的比例调整χ,噪音系数χ调整的计算公式如下:
丢包速度< 播放速度时,χ = χ * ( 1 + 10% );
丢包速度 > 播放速度时,χ = χ * ( 1 - 10% );
其中,χ为调整后的噪音系数,χ为调整前的噪音系数。
由于人在说话过程中,还会带有一些非关键词汇,如助词、副词、语气词等通常会被一带而过,并且通常这些词汇的前后都是音量较高的关键词。为了避免这些非关键词汇被当作静音,在设定步骤中,还有必要设定一个静音长度silence Length,当缓冲数据包的PCM值小于抑制阈值时,可先暂时确定为静音缓冲数据包,只有当连续出现的静音缓冲数据包的数量超过这个数值时,才会将这些连续出现的静音缓冲数据包判定为需要丢弃的背景噪音数据包进行丢弃。这样,即可实现非关键词汇和静音的区别,避免丢弃非关键词汇,影响语音播放质量。
为实现上述倍速播放视频时处理音频的方法,本发明还提供了一种倍速播放视频时处理音频的装置,如图4所示,其包括数据处理模块1、数据存储模块2、数据缓冲器3、读取模块4以及输入模块5。
所述数据处理模块1用于数据处理,包括:动态计算抑制阈值、调整噪音系数、进行数据对比分析判断缓冲数据包是语音数据包还是背景噪音数据包以及确定丢弃背景噪音数据数据包等。
所述数据存储模块2可用于存储抑制阈值、静音长度值等必要的参数。
所述数据缓冲器3是用于缓冲存储音频数据,并以缓冲数据包形式统一进行处理。
所述读取模块4用于读取音频数据并存入数据缓冲器3,同时还获取缓冲数据包的各音频帧的PCM编码值提供给数据处理模块1进行数据对比分析判断。
所述输入模块5用于进行初始化设定,例如:设定静音长度值,噪音系数的初始值等。
在具体工作时,根据噪音系数值等参数预先计算所得并设定抑制阈值,然后再根据所述抑制阈值和静音长度值等必要参数,所述数据处理模块1对缓冲数据包中的声音信号流进行识别判断,以判断确定该缓冲数据包是语音数据包还是背景噪声数据包,并根据判断结果,将背景噪声数据包丢弃。
同时,数据处理模块1还定期对比丢弃数据包的速度和倍速播放的速度,以根据对比结果对抵制阀值进行实时调整。
如果当前丢音频数据包速度小于倍速播放的速度时,则自动增大χ的值;而当丢音频数据包的速度大于倍数播放的速度时,则会自动减少χ的值。
本发明通过在倍速播放时采用静音抑制方法使得音频在倍速播放时也能达到非常好的效果,解决了倍速播放时播放音频的问题;而且,还可进一步通过设置动态的抑制阈值保证音频播放能够平滑的按照指定倍数播放。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。

Claims (9)

1.一种倍速播放视频时处理音频的方法,其特征在于,包括以下步骤:
设定步骤,设定静音抑制处理的抑制阈值;
识别步骤,根据所设定的抑制阈值,对声音信号流进行识别,以区分确定语音数据包和背景噪声数据包,所述语音数据包包括对白数据帧和背景音乐数据帧,而所述背景噪声数据包包括静音数据帧和环境声音数据帧;
消除步骤,将背景噪声数据包丢弃,保留语音数据包以供播放。
2.如权利要求1所述的倍速播放视频时处理音频的方法,其特征在于,所述抑制阈值根据过往的一段时间内PCM编码的平均值以及如下公式计算获得:
其中,N代表过往时间段的大小;x代表噪声系数。
3.如权利要求1所述的倍速播放视频时处理音频的方法,其特征在于,识别步骤中,读取声音信号流,并按照预定数据大小形成缓冲数据包依序存入缓冲器,根据抑制阈值判断当前的缓冲数据包是语音数据包还是背景噪声数据包,如果一个缓冲数据包中的所有音频帧的PCM编码值都小于抑制阈值,则判定为背景噪声数据包,否则判定为语音数据包。
4.如权利要求1或3所述的倍速播放视频时处理音频的方法,其特征在于,设定步骤中,还设定静音长度值,相应地,在识别步骤中,当连续出现的PCM值小于抑制阈值的缓冲数据包的数量超过静音长度值时,才将这些连续出现的PCM值小于抑制阈值的缓冲数据包判定为背景噪音数据包进行丢弃。
5.如权利要求2所述的倍速播放视频时处理音频的方法,其特征在于,所述方法还包括调整步骤:定期对比丢弃数据包的速度和倍速播放的速度并根据对比结果动态调整噪音系数,如果当前丢音频数据包速度小于倍速播放的速度时,则自动增大χ的值;而当丢音频数据包的速度大于倍数播放的速度时,则会自动减少χ的值。
6.如权利要求2所述的倍速播放视频时处理音频的方法,其特征在于,所述噪声系数χ的初始值为0.75。
7.如权利要求5或6所述的倍速播放视频时处理音频的方法,其特征在于,调整步骤中,当在一段预定时长的时间内丢包速度与倍速播放速度的差距大于10%,则按照每次10%的比例调整χ,噪音系数χ调整的计算公式如下:
丢包速度< 播放速度时,χ = χ * ( 1 + 10% );
丢包速度 >播放速度时,χ = χ * ( 1 - 10% );
其中,χ为调整后的噪音系数,χ为调整前的噪音系数。
8.一种倍速播放视频时处理音频的装置,其特征在于,包括:
数据处理模块,用于计算和设定抑制阈值、调整噪音系数、进行数据对比分析判断缓冲数据包是语音数据包还是背景噪音数据包以及确定丢弃背景噪音数据数据包;
数据存储模块,可用于存储系统参数;
数据缓冲器,是用于缓冲存储音频数据包;
读取模块,用于读取音频数据并存入数据缓冲器,同时还获取缓冲数据包的各音频帧的PCM编码值提供给数据处理模块进行数据对比分析判断。
9.如权利要求8所述的倍速播放视频时处理音频的装置,其特征在于,所述装置还包括:
输入模块,用于进行参数的初始化设定。
CN201610126874.0A 2016-03-07 2016-03-07 倍速播放视频时处理音频的方法及装置 Pending CN105847857A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610126874.0A CN105847857A (zh) 2016-03-07 2016-03-07 倍速播放视频时处理音频的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610126874.0A CN105847857A (zh) 2016-03-07 2016-03-07 倍速播放视频时处理音频的方法及装置

Publications (1)

Publication Number Publication Date
CN105847857A true CN105847857A (zh) 2016-08-10

Family

ID=56586944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610126874.0A Pending CN105847857A (zh) 2016-03-07 2016-03-07 倍速播放视频时处理音频的方法及装置

Country Status (1)

Country Link
CN (1) CN105847857A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107731243A (zh) * 2016-08-12 2018-02-23 电信科学技术研究院 一种语音实时变速播放方法及设备
CN109845245A (zh) * 2016-08-19 2019-06-04 韩国斯诺有限公司 动态影像处理装置、动态影像处理方法及计算机程序
CN109963184A (zh) * 2017-12-14 2019-07-02 阿里巴巴集团控股有限公司 一种音视频网络播放的方法、装置以及电子设备
CN112423019A (zh) * 2020-11-17 2021-02-26 北京达佳互联信息技术有限公司 调整音频播放速度的方法、装置、电子设备及存储介质
CN112437339A (zh) * 2020-11-10 2021-03-02 深圳Tcl新技术有限公司 音频输出控制方法及装置、智能电视机、存储介质
CN113496705A (zh) * 2021-08-19 2021-10-12 杭州华橙软件技术有限公司 音频处理方法和装置、存储介质及电子设备
CN114339443A (zh) * 2021-11-17 2022-04-12 腾讯科技(深圳)有限公司 一种音视频倍速播放方法及装置
CN114363713A (zh) * 2022-01-12 2022-04-15 维沃移动通信有限公司 声音调节方法及装置
WO2023024507A1 (zh) * 2021-08-23 2023-03-02 中兴通讯股份有限公司 音频处理方法、装置、终端及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8214066B1 (en) * 2008-03-25 2012-07-03 Marvell International Ltd. System and method for controlling noise in real-time audio signals
CN103259803A (zh) * 2013-06-04 2013-08-21 腾讯科技(深圳)有限公司 一种音频回放方法、装置和系统
CN104867497A (zh) * 2014-02-26 2015-08-26 北京信威通信技术股份有限公司 一种语音降噪方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8214066B1 (en) * 2008-03-25 2012-07-03 Marvell International Ltd. System and method for controlling noise in real-time audio signals
CN103259803A (zh) * 2013-06-04 2013-08-21 腾讯科技(深圳)有限公司 一种音频回放方法、装置和系统
CN104867497A (zh) * 2014-02-26 2015-08-26 北京信威通信技术股份有限公司 一种语音降噪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周安福 等: "一种自适应的静音抑制算法", 《计算机工程》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107731243B (zh) * 2016-08-12 2020-08-07 电信科学技术研究院 一种语音实时变速播放方法及设备
CN107731243A (zh) * 2016-08-12 2018-02-23 电信科学技术研究院 一种语音实时变速播放方法及设备
CN109845245A (zh) * 2016-08-19 2019-06-04 韩国斯诺有限公司 动态影像处理装置、动态影像处理方法及计算机程序
CN109845245B (zh) * 2016-08-19 2021-10-22 韩国斯诺有限公司 动态影像处理方法及计算机可读记录介质
CN109963184B (zh) * 2017-12-14 2022-04-29 阿里巴巴集团控股有限公司 一种音视频网络播放的方法、装置以及电子设备
CN109963184A (zh) * 2017-12-14 2019-07-02 阿里巴巴集团控股有限公司 一种音视频网络播放的方法、装置以及电子设备
CN112437339A (zh) * 2020-11-10 2021-03-02 深圳Tcl新技术有限公司 音频输出控制方法及装置、智能电视机、存储介质
CN112423019A (zh) * 2020-11-17 2021-02-26 北京达佳互联信息技术有限公司 调整音频播放速度的方法、装置、电子设备及存储介质
CN112423019B (zh) * 2020-11-17 2022-11-22 北京达佳互联信息技术有限公司 调整音频播放速度的方法、装置、电子设备及存储介质
CN113496705A (zh) * 2021-08-19 2021-10-12 杭州华橙软件技术有限公司 音频处理方法和装置、存储介质及电子设备
CN113496705B (zh) * 2021-08-19 2024-03-08 杭州华橙软件技术有限公司 音频处理方法和装置、存储介质及电子设备
WO2023024507A1 (zh) * 2021-08-23 2023-03-02 中兴通讯股份有限公司 音频处理方法、装置、终端及计算机可读存储介质
CN114339443A (zh) * 2021-11-17 2022-04-12 腾讯科技(深圳)有限公司 一种音视频倍速播放方法及装置
CN114339443B (zh) * 2021-11-17 2024-03-19 腾讯科技(深圳)有限公司 一种音视频倍速播放方法及装置
CN114363713A (zh) * 2022-01-12 2022-04-15 维沃移动通信有限公司 声音调节方法及装置

Similar Documents

Publication Publication Date Title
CN105847857A (zh) 倍速播放视频时处理音频的方法及装置
US11798575B2 (en) Systems and methods for intelligent voice activation for auto-mixing
JP6896135B2 (ja) ボリューム平準化器コントローラおよび制御方法
KR100974110B1 (ko) 배경 잡음 정보의 불연속 전송 및 정확한 재생을 위한 방법
US9530427B2 (en) Speech processing
EP2936489B1 (en) Audio processing apparatus and audio processing method
CN106228993B (zh) 一种消除噪声的方法和装置以及电子设备
CN109062537B (zh) 一种音频延迟的降低方法、装置、介质及设备
US9671999B2 (en) Methods and apparatus for improving understandability of audio corresponding to dictation
MX2011005782A (es) Metodo y aparato para controlar la reproduccion de datos de video-audio.
US20030165325A1 (en) Trick mode audio playback
JP2003005772A (ja) 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ
CN108540680A (zh) 讲话状态的切换方法及装置、通话系统
JP4714129B2 (ja) 音声/非音声判定補正装置、音声/非音声判定補正方法、音声/非音声判定補正プログラムおよびこれを記録した記録媒体、音声ミキシング装置、音声ミキシング方法、音声ミキシングプログラムおよびこれを記録した記録媒体
US20070192089A1 (en) Apparatus and method for reproducing audio data
US20180082703A1 (en) Suitability score based on attribute scores
JP2013005423A (ja) 映像再生装置、映像再生方法およびプログラム
US20020072902A1 (en) Adoptive storage of audio signals
US20120039397A1 (en) Digital signal reproduction device and digital signal compression device
CN104934040B (zh) 音频信号的时长调整方法和装置
JP2006317768A (ja) 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム
CN112565880A (zh) 一种讲解类视频的播放方法
JP2003259311A (ja) 映像再生方法、映像再生装置、映像再生プログラム
JPH10143193A (ja) 音声信号処理装置
JPH0854895A (ja) 再生装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160810

WD01 Invention patent application deemed withdrawn after publication