CN108491180A - 音频播放方法及装置 - Google Patents

音频播放方法及装置 Download PDF

Info

Publication number
CN108491180A
CN108491180A CN201810220704.8A CN201810220704A CN108491180A CN 108491180 A CN108491180 A CN 108491180A CN 201810220704 A CN201810220704 A CN 201810220704A CN 108491180 A CN108491180 A CN 108491180A
Authority
CN
China
Prior art keywords
data stream
frequency spectrum
noise
voice data
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810220704.8A
Other languages
English (en)
Other versions
CN108491180B (zh
Inventor
李国盛
熊达蔚
史润宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201810220704.8A priority Critical patent/CN108491180B/zh
Publication of CN108491180A publication Critical patent/CN108491180A/zh
Application granted granted Critical
Publication of CN108491180B publication Critical patent/CN108491180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10018Improvement or modification of read or write signals analog processing for digital recording or reproduction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/24Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本公开提供了一种音频播放方法及装置,属于终端技术领域,该方法包括:获取待播放音频的第一音频数据流和外界环境的噪声数据流;对第一音频数据流和噪声数据流进行频谱分析,确定第一音频数据流和噪声数据流的频谱是否符合预设干扰条件;当第一音频数据流和噪声数据流的频谱符合预设干扰条件时,对第一音频数据流进行频谱平移,得到第二音频数据流;播放第二音频数据流。本公开通过对待播放音频的第一音频数据流和外界噪声数据流进行频谱分析,当二者的频谱符合预设干扰条件时,对第一音频数据流进行频谱平移后再播放,使得播放的音频不受噪声干扰,用户能够听清音频的内容,提高了音频播放的有效性和智能性。

Description

音频播放方法及装置
技术领域
本公开涉及终端技术领域,尤其涉及一种音频播放方法及装置。
背景技术
在移动互联网时代,通过移动终端播放音频已经成为司空见惯的行为,比如,通过移动终端收听语音节目、听音乐等。
然而,移动终端在播放音频时很容易受到外界环境噪声的干扰,例如,在洗澡时或者在高速开车时,外界水声或轮胎噪声和播放音频的频谱混淆在一起,使得用户无法区分出播放音频的内容。
发明内容
本公开提供一种音频播放方法及装置,能够解决相关技术中播放音频时会受到环境噪声的干扰的技术问题,所述技术方案如下:
根据本公开实施例的第一方面,提供一种音频播放方法,包括:
获取待播放音频的第一音频数据流和外界环境的噪声数据流;
对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件;
当所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件时,对所述第一音频数据流进行频谱平移,得到所述待播放音频的第二音频数据流;
播放所述第二音频数据流。
在一种可能的实现方式中,所述对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件,包括:
对所述第一音频数据流进行频谱分析,根据所述第一音频数据流的频谱特征,确定所述第一音频数据流所属的频谱类别;
对所述噪声数据流进行频谱分析,根据所述噪声数据流的频谱特征,确定所述噪声数据流所属的频谱类别;
当所述第一音频数据流和所述噪声数据流所属的频谱类别相同时,确定所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件。
在一种可能的实现方式中,所述对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件,包括:
对所述第一音频数据流进行频谱分析,确定所述第一音频数据流的频谱区间;
对所述噪声数据流进行频谱分析,确定所述噪声数据流的频谱区间;
当所述第一音频数据流和所述噪声数据流的频谱区间的重合度高于预设百分比时,确定所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件。
在一种可能的实现方式中,所述对所述第一音频数据流进行频谱平移,包括:根据所述第一音频数据的频谱范围,确定平移方向,所述平移方向包括向高频方向和向低频方向;当所述平移方向为向低频方向时,将所述第一音频数据流向低频方向进行频谱平移;当所述平移方向为向高频方向时,将所述第一音频数据流向高频方向进行频谱平移。
在一种可能的实现方式中,所述获取待播放音频的第一音频数据流和外界环境的噪声数据流,包括:
当读取到所述待播放音频时,对所述待播放音频进行解码,得到所述第一音频数据流;
通过麦克风录制外界环境噪声,得到所述噪声数据流。
在一种可能的实现方式中,所述对所述第一音频数据流和所述噪声数据流进行频谱分析之前,所述方法还包括:
确定所述噪声数据流的分贝值;
当所述分贝值高于预设阈值时,确定外界环境存在噪声,执行所述对所述第一音频数据流和所述噪声数据流进行频谱分析及其后续步骤;
当所述分贝值低于所述预设阈值时,确定外界环境不存在噪声,播放所述第一音频数据流。
在一种可能的实现方式中,所述方法还包括:
当所述第一音频数据流和所述噪声数据流的频谱不符合所述预设干扰条件时,播放所述第一音频数据流。
根据本公开实施例的第二方面,提供一种音频播放装置,包括:
获取模块,用于获取待播放音频的第一音频数据流和外界环境的噪声数据流;
频谱分析模块,用于对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件;
频谱平移模块,用于当所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件时,对所述第一音频数据流进行频谱平移,得到所述待播放音频的第二音频数据流;
播放模块,用于播放所述第二音频数据流。
在一种可能的实现方式中,所述频谱分析模块包括第一音频频谱分析单元和第一噪声频谱分析单元:
所述第一音频频谱分析单元,用于对所述第一音频数据流进行频谱分析,根据所述第一音频数据流的频谱特征,确定所述第一音频数据流所属的频谱类别;
所述第一噪声频谱分析单元,用于对所述噪声数据流进行频谱分析,根据所述噪声数据流的频谱特征,确定所述噪声数据流所属的频谱类别;
所述频谱分析模块,用于当所述第一音频数据流和所述噪声数据流所属的频谱类别相同时,确定所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件。
在一种可能的实现方式中,所述频谱分析模块包括第二音频频谱分析单元和第二噪声频谱分析单元:
所述第二音频频谱分析单元,用于对所述第一音频数据流进行频谱分析,确定所述第一音频数据流的频谱区间;
所述第二噪声频谱分析单元,用于对所述噪声数据流进行频谱分析,确定所述噪声数据流的频谱区间;
所述频谱分析模块,用于当所述第一音频数据流和所述噪声数据流的频谱区间的重合度高于预设百分比时,确定所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件。
在一种可能的实现方式中,所述频谱平移模块用于:根据所述第一音频数据的频谱范围,确定平移方向,所述平移方向包括向高频方向和向低频方向;当所述平移方向为向低频方向时,将所述第一音频数据流向低频方向进行频谱平移;当所述平移方向为向高频方向时,将所述第一音频数据流向高频方向进行频谱平移。
在一种可能的实现方式中,所述获取模块包括音频获取单元和噪声录制单元:
所述音频获取单元,用于当读取到所述待播放音频时,对所述待播放音频进行解码,得到所述第一音频数据流;
所述噪声录制单元,用于通过麦克风录制外界环境噪声,得到所述噪声数据流。
在一种可能的实现方式中,所述装置还包括:
确定模块,用于确定所述噪声数据流的分贝值;
所述频谱分析模块,用于当所述分贝值高于预设阈值时,确定外界环境存在噪声,执行所述对所述第一音频数据流和所述噪声数据流进行频谱分析及其后续步骤;
所述播放模块,用于当所述分贝值低于所述预设阈值时,确定外界环境不存在噪声,播放所述第一音频数据流。
在一种可能的实现方式中,所述播放模块还用于当所述第一音频数据流和所述噪声数据流的频谱不符合所述预设干扰条件时,播放所述第一音频数据流。
根据本公开实施例的第三方面,提供一种音频播放装置,包括:处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取待播放音频的第一音频数据流和外界环境的噪声数据流;对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件;当所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件时,对所述第一音频数据流进行频谱平移,得到所述待播放音频的第二音频数据流;播放所述第二音频数据流。
本公开的实施例提供的技术方案可以包括以下有益效果:
在音频播放的过程中,通过对待播放音频的第一音频数据流和外界噪声数据流进行频谱分析,当二者的频谱符合预设干扰条件时,对第一音频数据流进行频谱平移后再播放,使得播放的音频不受噪声干扰,用户能够听清音频的内容,提高了音频播放的有效性和智能性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种音频播放方法的流程图。
图2是根据一示例性实施例示出的一种音频播放方法的流程图。
图3是根据一示例性实施例示出的一种音频播放装置的框图。
图4是根据一示例性实施例示出的一种音频播放装置的框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种音频播放方法的流程图,如图1所示,该方法用于终端中,包括以下步骤:
在步骤101中,获取待播放音频的第一音频数据流和外界环境的噪声数据流。
在步骤102中,对该第一音频数据流和该噪声数据流进行频谱分析,确定该第一音频数据流和该噪声数据流的频谱是否符合预设干扰条件。
在步骤103中,当该第一音频数据流和该噪声数据流的频谱符合预设干扰条件时,对该第一音频数据流进行频谱平移,得到该待播放音频的第二音频数据流。
在步骤104中,播放该第二音频数据流。
本公开实施例提供的方法,在音频播放的过程中,通过对待播放音频的第一音频数据流和外界噪声数据流进行频谱分析,当二者的频谱符合预设干扰条件时,对第一音频数据流进行频谱平移后再播放,使得播放的音频不受噪声干扰,用户能够听清音频的内容,提高了音频播放的有效性和智能性。
在一种可能的实现方式中,该对该第一音频数据流和该噪声数据流进行频谱分析,确定该第一音频数据流和该噪声数据流的频谱是否符合预设干扰条件,包括:
对该第一音频数据流进行频谱分析,根据该第一音频数据流的频谱特征,确定该第一音频数据流所属的频谱类别;
对该噪声数据流进行频谱分析,根据该噪声数据流的频谱特征,确定该噪声数据流所属的频谱类别;
当该第一音频数据流和该噪声数据流所属的频谱类别相同时,确定该第一音频数据流和该噪声数据流的频谱符合预设干扰条件。
在一种可能的实现方式中,该对该第一音频数据流和该噪声数据流进行频谱分析,确定该第一音频数据流和该噪声数据流的频谱是否符合预设干扰条件,包括:
对该第一音频数据流进行频谱分析,确定该第一音频数据流的频谱区间;
对该噪声数据流进行频谱分析,确定该噪声数据流的频谱区间;
当该第一音频数据流和该噪声数据流的频谱区间的重合度高于预设百分比时,确定该第一音频数据流和该噪声数据流的频谱符合该预设干扰条件。
在一种可能的实现方式中,该对该第一音频数据流进行频谱平移,包括:
根据所述第一音频数据的频谱范围,确定平移方向,所述平移方向包括向高频方向和向低频方向;当所述平移方向为向低频方向时,将所述第一音频数据流向低频方向进行频谱平移;当所述平移方向为向高频方向时,将所述第一音频数据流向高频方向进行频谱平移。
在一种可能的实现方式中,该获取待播放音频的第一音频数据流和外界环境的噪声数据流,包括:
当读取到该待播放音频时,对该待播放音频进行解码,得到该第一音频数据流;
通过麦克风录制外界环境噪声,得到该噪声数据流。
在一种可能的实现方式中,该对该第一音频数据流和该噪声数据流进行频谱分析之前,该方法还包括:
确定该噪声数据流的分贝值;
当该分贝值高于预设阈值时,确定外界环境存在噪声,执行该对该第一音频数据流和该噪声数据流进行频谱分析及其后续步骤;
当该分贝值低于该预设阈值时,确定外界环境不存在噪声,播放该第一音频数据流。
在一种可能的实现方式中,该方法还包括:
当该第一音频数据流和该噪声数据流的频谱不符合预设干扰条件时,播放该第一音频数据流。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图2是根据一示例性实施例示出的一种音频播放方法的流程图,如图2所示,该方法用于终端中,包括以下步骤:
在步骤201中,当读取到待播放音频时,对该待播放音频进行解码,得到该待播放音频的第一音频数据流。
其中,从组成上讲,该待播放音频可以是独立的音频,也可以是视频中包含的音频部分;从播放形式上讲,该待播放音频可以是在线播放的,也可以是离线播放的,本实施例对此不做限定。
在音频播放的过程中,终端实时读取并解码待播放音频,当在线播放时,该待播放音频是指实时加载的一段音频流;当离线播放时,该待播放音频可以是指实时读取的一段音频流,也可以是指整个音频文件,本实施例对此不做限定。
在步骤202中,通过麦克风录制外界环境噪声,得到噪声数据流。
当检测到启动音频播放功能时,终端开启麦克风并启动录音功能,以录制当前的外界环境噪声。
在一种实施方式中,终端获取到第一音频数据流和噪声数据流时,执行步骤203及其后续步骤。
在另一种实施方式中,终端获取到噪声数据流时,确定该噪声数据流的分贝值,当该分贝值低于预设阈值时,确定当前外界环境不存在噪声,直接播放该第一音频数据流。当该分贝值高于预设阈值时,确定当前外界环境存在噪声,执行步骤203及其后续步骤。其中,预设阈值为外界环境是否存在噪声的分界线,当分贝值低于该预设阈值时,说明外界环境没有噪声,当分贝值高于预设阈值时,说明外界环境有噪声。该预设阈值可根据人耳听觉标准预置,也可以由用户根据自己的听觉特征进行调整,本实施例对此不做限定。
在本公开实施例中,上述步骤201和步骤202可以是同时进行的。
在步骤203中,对该第一音频数据流和该噪声数据流进行频谱分析,确定该第一音频数据流和该噪声数据流的频谱是否符合预设干扰条件,当第一音频数据流和噪声数据流的频谱符合预设干扰条件时执行步骤204,否则执行步骤206。
该步骤203可以通过以下两种实施方式实现。
在一种实施方式中,对该第一音频数据流和该噪声数据流进行频谱分析,确定二者的频谱是否符合预设干扰条件的过程包括以下步骤a1至a4:
步骤a1:对该第一音频数据流进行频谱分析,根据该第一音频数据流的频谱特征,确定该第一音频数据流所属的频谱类别。
在本公开实施例中,终端系统中添加了音频频率分析单元,通过该音频频率分析单元对该第一音频数据流进行频谱分析,得到该第一音频数据流的频谱特征,通过该频谱特征可以确定该第一音频数据流的频谱区间;根据该第一音频数据流的频谱区间和预先划分的多个频谱类别,确定该第一音频数据流所属的频谱类别。
其中,终端预先根据声音的频谱特征,划分出多个频谱类别,该过程可以为:终端按照频谱高低顺序,将声音频谱划分成多个频谱区间,每个频谱区间对应一个频谱类别。
其中,确定该第一音频数据流所属的频谱类别的过程为:将该第一音频数据流的频谱区间与预先划分的每个频谱类别对应的频谱区间进行比对;将频谱区间包含该第一音频数据流的频谱区间对应的频谱类别,确定为该第一音频数据流的频谱类别。
例如,人耳能听到的声音频谱范围在20Hz-20000Hz之间,假设按照频率从高到低的顺序,每1000Hz划分为一个频谱区间,可划分出10个频谱类别A-J,其中,频谱类别A对应的频谱区间为(19000Hz,20000Hz)。假设第一音频数据流的频谱区间为(19200Hz,19800Hz),可见该第一音频数据流的频谱区间包含在频谱类别A对应的频谱区间中,因此,该第一音频数据流的频谱类别为频谱类别A。
步骤a2:对该噪声数据流分别进行频谱分析,根据该噪声数据流的频谱特征,确定该噪声数据流所属的频谱类别。
在本公开实施例中,终端系统中添加了噪声频率分析单元,通过该噪声频率分析单元对该噪声数据流进行频谱分析,得到该噪声数据流的频谱特征,通过该频谱特征可以确定该噪声数据流的频谱区间;根据该噪声数据流的频谱区间和预先划分的多个频谱类别,确定该噪声数据流所属的频谱类别。
其中,终端预先划分多个频谱类别的方法与步骤a1中相应过程同理,确定噪声数据流所属的频谱类别的过程与步骤a1中确定第一音频数据流所属频谱类别的过程同理,在此不做赘述。
其中,该步骤a2和步骤a1可同时进行。
步骤a3:当该第一音频数据流和该噪声数据流所属的频谱类别相同时,确定该第一音频数据流和该噪声数据流的频谱符合预设干扰条件。
在本公开实施例中,终端可以针对预先划分的每个频谱类别设置有类别缓存器,在执行步骤a1后,将第一音频数据流的频谱保存入所属频谱类别的类别缓存器中。在执行步骤a2后,将第一音频数据流的频谱保存入所属频谱类别的类别缓存器中。当第一音频数据流的频谱和噪声数据流的频谱均保存到同一个类别缓存器中时,确定该第一音频数据流和该噪声数据流所属的频谱类别相同,从而确定二者的频谱符合预设干扰条件。
例如,该第一音频数据流所属的频谱类别是频谱类别A,该噪声数据流所属的频谱类别也是频谱类别A,终端在检测到第一音频数据流和噪声数据流的频谱均保存到频谱类别A对应的类别缓存器中时,确定二者所属的频谱类别相同,从而确定二者的频谱符合预设干扰条件。
步骤a4:当该第一音频数据流和该噪声数据流所属的频谱类别不相同时,确定该第一音频数据流和该噪声数据流的频谱不符合预设干扰条件。
例如,该第一音频数据流所属的频谱类别是频谱类别A,而该噪声数据流所属的频谱类别是频谱类别B,则终端在检测到第一音频数据流和噪声数据流的频谱分别保存到不同的类别缓存器中时,确定二者所属的频谱类别不相同,从而确定二者的频谱不符合预设干扰条件。
在另一种实施方式中,对该第一音频数据流和该噪声数据流进行频谱分析,确定该第一音频数据流和该噪声数据流的频谱是否符合预设干扰条件的过程包括:对该第一音频数据流进行频谱分析,确定该第一音频数据流的频谱区间;对该噪声数据流进行频谱分析,确定该噪声数据流的频谱区间;当第一频谱区间和第二频谱区间的重合度高于预设百分比时,确定该第一音频数据流和该噪声数据流的频谱符合预设干扰条件,否则,确定该第一音频数据流和该噪声数据流的频谱不符合预设干扰条件。
其中,确定第一频谱区间和第二频谱区间的重合度的方式为:获取第一频谱区间和第二频谱区间的交集,将该交集与第一频谱区间的比值确定为第一频谱区间和第二频谱区间的重合度。其中,该交集与第一频谱区间的比值是指二者对应频谱宽度的比值。例如,第一频谱区间的频谱宽度为1000Hz,交集的频谱宽度为800Hz,则第一频谱区间和第二频谱区间的重合度为80%。
其中,预设百分比由终端系统预先设置或修改,本实施例对此不做限定。
需要说明的是,当第一音频数据流和噪声数据流的频谱符合预设干扰条件时,说明第一音频数据流和噪声数据流频谱极其相似,此时外界环境噪声会对待播放音频造成干扰,此时如果播放第一音频数据流会使得用户无法区分出播放音频的内容;相反,当第一音频数据流和噪声数据流的频谱不符合预设干扰条件时,说明外界环境噪声不会对待播放音频造成干扰。
在步骤204中,当该第一音频数据流和该噪声数据流的频谱符合预设干扰条件时,对该第一音频数据流进行频谱平移,得到该待播放音频的第二音频数据流。
终端对该第一音频数据流进行频谱平移的过程包括:根据第一音频数据的频谱范围,确定平移方向,该平移方向包括向高频方向和向低频方向;当平移方向为向低频方向时,将第一音频数据流向低频方向进行频谱平移;当平移方向为向高频方向时,将第一音频数据流向高频方向进行频谱平移。
其中,根据第一音频数据的频谱范围,确定平移方向的过程包括:当第一音频数据流的频谱范围落入预设多个频谱区间中的最高频谱区间时,确定平移方向为向低频方向;当第一音频数据流的频谱未落入最高频谱区间时,确定平移方向为向高频方向。其中,最高频谱区间是指该多个频谱区间中频率值高于其他频谱区间中频率值的频谱区间。终端预先按照频率从高到低的顺序将声音频谱划分为多个频谱区间,参考步骤a1中的举例,将声音频谱范围20Hz-20000Hz,以1000Hz为步长划分成10个频谱区间,则(19000,20000)这一频谱区间为最高频谱区间。
在实施过程中,终端在确定平移方向之后,可以按照预设步长进行平移。其中,预设步长的确定方式包括以下两种:
在一种实施方式中,该预设步长可以为一个频谱区间所指示频谱宽度的倍数(比如,1000Hz,2000Hz等)。
需要说明的是,该种实施方式中,根据平移方向的不同,该预设步长的取值可以相同也可以不同,例如,在向高频方向平移时,该预设步长为一个频谱区间的频谱宽度;在向低频方向平移时,该预设步长为一个频谱区间的频谱宽度的2倍,本实施例对此不做限定。
在另一种实施方式中,该预设步长可以由第一音频数据流和噪声数据流的频谱区间以及平移方向决定。例如,当平移方向为向低频方向平移时,预设步长为噪声数据流频谱中最低频率值和第一音频数据流频谱中最高频率值的差值的绝对值,使得噪声数据流频谱中最低频率值大于平移后的第二音频数据流频谱中最高频率值。当平移方向为向高频方向平移时,预设步长为噪声数据流频谱中最高频率值和第一音频数据流频谱中最低频率值的差值的绝对值,使得噪声数据流频谱中最高频率值小于平移后的第二音频数据流频谱中最低频率值。
在本公开实施例中,终端通过频谱平移模块对第一音频数据流进行频谱平移,当终端确定需要进行频谱平移时,将经过频谱分析的第一音频数据流输入至频谱平移模块,由频谱平移模块按照预设步长进行频谱平移。
在本公开实施例中,终端可以对待播放音频和外界环境噪声实时地进行频谱分析,这个过程中,待播放音频和外界环境噪声的频谱特征在一段时间内可能都是比较稳定的,例如,用户在同一个环境中收听语言类节目。此时,提高音频播放的智能性、降低终端能耗,终端在频谱分析过程中,如果连续多次确定第一音频数据流和噪声数据流的频谱符合预设干扰条件,则在预设时长内不再执行步骤203频谱分析的步骤,直接将后续读取的待播放音频进行频谱平移;经过预设时长之后,再重新执行步骤203及其后续步骤。其中,预设时长可由终端进行预先设置或修改,本实施例对此不做限定。
在步骤205中,播放该第二音频数据流。
在本公开实施例中,终端在对第一音频数据流进行平移后,将得到的第二音频数据流输出到扬声器进行播放。由于平移后的第二音频数据流与外界环境噪声的频谱不符合预设干扰条件,也即,第二音频数据流不会受到外界环境噪声的干扰,使得用户在收听时能够区分出来,从而听清楚播放音频的内容。
在步骤206中,当该第一音频数据流和该噪声数据流的频谱不符合预设干扰条件时,播放该第一音频数据流。
在本公开实施例中,当该第一音频数据流和该噪声数据流的频谱不符合预设干扰条件时,说明当前外界环境噪声不会对当前播放的音频造成干扰,因此,终端直接播放该第一音频数据流。
本公开实施例提供的方法,在音频播放的过程中,通过对待播放音频的第一音频数据流和外界噪声数据流进行频谱分析,当二者的频谱符合预设干扰条件时,对第一音频数据流进行频谱平移后再播放,使得播放的音频不受噪声干扰,用户能够听清音频的内容,提高了音频播放的有效性和智能性。
图3是根据一示例性实施例示出的一种音频播放装置的框图。参照图3,该装置包括获取模块301,频谱分析模块302,频谱平移模块303和播放模块304。
其中,获取模块301与频谱分析模块302连接,用于获取待播放音频的第一音频数据流和外界环境的噪声数据流;频谱分析模块302与频谱平移模块303连接,用于对该第一音频数据流和该噪声数据流进行频谱分析,确定该第一音频数据流和该噪声数据流的频谱是否符合预设干扰条件;频谱平移模块303与播放模块304连接,用于当该第一音频数据流和该噪声数据流的频谱符合预设干扰条件时,对该第一音频数据流进行频谱平移,得到该待播放音频的第二音频数据流;播放模块304,用于播放该第二音频数据流。
在一种可能的实现方式中,该频谱分析模块包括第一音频频谱分析单元和第一噪声频谱分析单元:
该第一音频频谱分析单元,用于对该第一音频数据流进行频谱分析,根据该第一音频数据流的频谱特征,确定该第一音频数据流所属的频谱类别;
该第一噪声频谱分析单元,用于对该噪声数据流进行频谱分析,根据该噪声数据流的频谱特征,确定该噪声数据流所属的频谱类别;
该频谱分析模块,用于当该第一音频数据流和该噪声数据流所属的频谱类别相同时,确定该第一音频数据流和该噪声数据流的频谱符合该预设干扰条件。
在一种可能的实现方式中,该频谱分析模块包括第二音频频谱分析单元和第二噪声频谱分析单元:
该第二音频频谱分析单元,用于对该第一音频数据流进行频谱分析,确定该第一音频数据流的频谱区间;
该第二噪声频谱分析单元,用于对该噪声数据流进行频谱分析,确定该噪声数据流的频谱区间;
该频谱分析模块,用于当该第一音频数据流和该噪声数据流的频谱区间的重合度高于预设百分比时,确定该第一音频数据流和该噪声数据流的频谱符合该预设干扰条件。
在一种可能的实现方式中,该频谱平移模块用于:根据该第一音频数据的频谱范围,确定平移方向,该平移方向包括向高频方向和向低频方向;当该平移方向为向低频方向时,将该第一音频数据流向低频方向进行频谱平移;当该平移方向为向高频方向时,将该第一音频数据流向高频方向进行频谱平移。
在一种可能的实现方式中,该获取模块包括音频获取单元和噪声录制单元:
该音频获取单元,用于当读取到该待播放音频时,对该待播放音频进行解码,得到该第一音频数据流;
该噪声录制单元,用于通过麦克风录制外界环境噪声,得到该噪声数据流。
在一种可能的实现方式中,该装置还包括:
确定模块,用于确定该噪声数据流的分贝值;
该频谱分析模块,用于当该分贝值高于预设阈值时,确定外界环境存在噪声,执行该对该第一音频数据流和该噪声数据流进行频谱分析及其后续步骤;
该播放模块,用于当该分贝值低于该预设阈值时,确定外界环境不存在噪声,播放该第一音频数据流。
在一种可能的实现方式中,该播放模块还用于当该第一音频数据流和该噪声数据流的频谱不符合该预设干扰条件时,播放该第一音频数据流。
本公开实施例提供的装置,在音频播放的过程中,通过对待播放音频的第一音频数据流和外界噪声数据流进行频谱分析,当二者的频谱符合预设干扰条件时,对第一音频数据流进行频谱平移后再播放,使得播放的音频不受噪声干扰,用户能够听清音频的内容,提高了音频播放的有效性和智能性。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种音频播放装置的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(I/O)接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到装置400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述音频播放方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机可读存储介质,该存储介质中存储有指令,当该存储介质中的指令由终端的处理器执行时,使得终端能够执行上述音频播放方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (15)

1.一种音频播放方法,其特征在于,所述方法包括:
获取待播放音频的第一音频数据流和外界环境的噪声数据流;
对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件;
当所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件时,对所述第一音频数据流进行频谱平移,得到所述待播放音频的第二音频数据流;
播放所述第二音频数据流。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件,包括:
对所述第一音频数据流进行频谱分析,根据所述第一音频数据流的频谱特征,确定所述第一音频数据流所属的频谱类别;
对所述噪声数据流进行频谱分析,根据所述噪声数据流的频谱特征,确定所述噪声数据流所属的频谱类别;
当所述第一音频数据流和所述噪声数据流所属的频谱类别相同时,确定所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件,包括:
对所述第一音频数据流进行频谱分析,确定所述第一音频数据流的频谱区间;
对所述噪声数据流进行频谱分析,确定所述噪声数据流的频谱区间;
当所述第一音频数据流和所述噪声数据流的频谱区间的重合度高于预设百分比时,确定所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件。
4.根据权利要求1所述的方法,其特征在于,所述对所述第一音频数据流进行频谱平移,包括:
根据所述第一音频数据的频谱范围,确定平移方向,所述平移方向包括向高频方向和向低频方向;
当所述平移方向为向低频方向时,将所述第一音频数据流向低频方向进行频谱平移;
当所述平移方向为向高频方向时,将所述第一音频数据流向高频方向进行频谱平移。
5.根据权利要求1所述的方法,其特征在于,所述获取待播放音频的第一音频数据流和外界环境的噪声数据流,包括:
当读取到所述待播放音频时,对所述待播放音频进行解码,得到所述第一音频数据流;
通过麦克风录制外界环境噪声,得到所述噪声数据流。
6.根据权利要求1所述的方法,其特征在于,所述对所述第一音频数据流和所述噪声数据流进行频谱分析之前,所述方法还包括:
确定所述噪声数据流的分贝值;
当所述分贝值高于预设阈值时,确定外界环境存在噪声,执行所述对所述第一音频数据流和所述噪声数据流进行频谱分析及其后续步骤;
当所述分贝值低于所述预设阈值时,确定外界环境不存在噪声,播放所述第一音频数据流。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述第一音频数据流和所述噪声数据流的频谱不符合所述预设干扰条件时,播放所述第一音频数据流。
8.一种音频播放装置,其特征在于,所述装置包括:
获取模块,用于获取待播放音频的第一音频数据流和外界环境的噪声数据流;
频谱分析模块,用于对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件;
频谱平移模块,用于当所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件时,对所述第一音频数据流进行频谱平移,得到所述待播放音频的第二音频数据流;
播放模块,用于播放所述第二音频数据流。
9.根据权利要求8所述的装置,其特征在于,所述频谱分析模块包括第一音频频谱分析单元和第一噪声频谱分析单元:
所述第一音频频谱分析单元,用于对所述第一音频数据流进行频谱分析,根据所述第一音频数据流的频谱特征,确定所述第一音频数据流所属的频谱类别;
所述第一噪声频谱分析单元,用于对所述噪声数据流进行频谱分析,根据所述噪声数据流的频谱特征,确定所述噪声数据流所属的频谱类别;
所述频谱分析模块,用于当所述第一音频数据流和所述噪声数据流所属的频谱类别相同时,确定所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件。
10.根据权利要求8所述的装置,其特征在于,所述频谱分析模块包括第二音频频谱分析单元和第二噪声频谱分析单元:
所述第二音频频谱分析单元,用于对所述第一音频数据流进行频谱分析,确定所述第一音频数据流的频谱区间;
所述第二噪声频谱分析单元,用于对所述噪声数据流进行频谱分析,确定所述噪声数据流的频谱区间;
所述频谱分析模块,用于当所述第一音频数据流和所述噪声数据流的频谱区间的重合度高于预设百分比时,确定所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件。
11.根据权利要求8所述的装置,其特征在于,所述频谱平移模块用于:根据所述第一音频数据的频谱范围,确定平移方向,所述平移方向包括向高频方向和向低频方向;当所述平移方向为向低频方向时,将所述第一音频数据流向低频方向进行频谱平移;当所述平移方向为向高频方向时,将所述第一音频数据流向高频方向进行频谱平移。
12.根据权利要求8所述的装置,其特征在于,所述获取模块包括音频获取单元和噪声录制单元:
所述音频获取单元,用于当读取到所述待播放音频时,对所述待播放音频进行解码,得到所述第一音频数据流;
所述噪声录制单元,用于通过麦克风录制外界环境噪声,得到所述噪声数据流。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:
确定模块,用于确定所述噪声数据流的分贝值;
所述频谱分析模块,用于当所述分贝值高于预设阈值时,确定外界环境存在噪声,执行所述对所述第一音频数据流和所述噪声数据流进行频谱分析及其后续步骤;
所述播放模块,用于当所述分贝值低于所述预设阈值时,确定外界环境不存在噪声,播放所述第一音频数据流。
14.根据权利要求8所述的装置,其特征在于,所述播放模块还用于当所述第一音频数据流和所述噪声数据流的频谱不符合所述预设干扰条件时,播放所述第一音频数据流。
15.一种音频播放装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取待播放音频的第一音频数据流和外界环境的噪声数据流;对所述第一音频数据流和所述噪声数据流进行频谱分析,确定所述第一音频数据流和所述噪声数据流的频谱是否符合预设干扰条件;当所述第一音频数据流和所述噪声数据流的频谱符合所述预设干扰条件时,对所述第一音频数据流进行频谱平移,得到所述待播放音频的第二音频数据流;播放所述第二音频数据流。
CN201810220704.8A 2018-03-16 2018-03-16 音频播放方法及装置 Active CN108491180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810220704.8A CN108491180B (zh) 2018-03-16 2018-03-16 音频播放方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810220704.8A CN108491180B (zh) 2018-03-16 2018-03-16 音频播放方法及装置

Publications (2)

Publication Number Publication Date
CN108491180A true CN108491180A (zh) 2018-09-04
CN108491180B CN108491180B (zh) 2021-05-18

Family

ID=63339781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810220704.8A Active CN108491180B (zh) 2018-03-16 2018-03-16 音频播放方法及装置

Country Status (1)

Country Link
CN (1) CN108491180B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113552568A (zh) * 2020-04-24 2021-10-26 深圳市万普拉斯科技有限公司 超声波接近感应方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1056969A (zh) * 1990-05-28 1991-12-11 中国科学院上海生理研究所 抗噪声语音处理器及其抗噪声方法
CN102411936A (zh) * 2010-11-25 2012-04-11 歌尔声学股份有限公司 语音增强方法、装置及头戴式降噪通信耳机
KR20150011854A (ko) * 2013-06-27 2015-02-03 고려대학교 산학협력단 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템
CN105850154A (zh) * 2013-12-20 2016-08-10 微软技术许可有限责任公司 基于检测到的环境声音来调整音频

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1056969A (zh) * 1990-05-28 1991-12-11 中国科学院上海生理研究所 抗噪声语音处理器及其抗噪声方法
CN102411936A (zh) * 2010-11-25 2012-04-11 歌尔声学股份有限公司 语音增强方法、装置及头戴式降噪通信耳机
KR20150011854A (ko) * 2013-06-27 2015-02-03 고려대학교 산학협력단 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템
CN105850154A (zh) * 2013-12-20 2016-08-10 微软技术许可有限责任公司 基于检测到的环境声音来调整音频

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113552568A (zh) * 2020-04-24 2021-10-26 深圳市万普拉斯科技有限公司 超声波接近感应方法、装置、计算机设备和存储介质
CN113552568B (zh) * 2020-04-24 2024-03-22 深圳市万普拉斯科技有限公司 超声波接近感应方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN108491180B (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN104991754B (zh) 录音方法及装置
CN104918107B (zh) 视频文件的标识处理方法及装置
CN106024033B (zh) 播放控制方法及装置
CN108831508A (zh) 语音活动检测方法、装置和设备
CN104394137B (zh) 一种提醒语音通话的方法及装置
CN107493500A (zh) 多媒体资源播放方法及装置
CN104378715B (zh) 降低耳机pop音的装置和方法
CN108803444A (zh) 智能设备的控制方法、装置及存储介质
CN108038102A (zh) 表情图像的推荐方法、装置、终端及存储介质
CN109087650A (zh) 语音唤醒方法及装置
CN108717542A (zh) 识别文字区域的方法、装置及计算机可读存储介质
CN109599104A (zh) 多波束选取方法及装置
CN108845787A (zh) 音频调节的方法、装置、终端及存储介质
CN108076199A (zh) 麦克风的气密性检测方法及装置
CN106126058A (zh) 提醒方法及装置
CN106782625B (zh) 音频处理方法和装置
CN107135147A (zh) 共享位置信息的方法、装置及计算机可读存储介质
CN107181849A (zh) 录音方法及装置
CN108769769A (zh) 视频的播放方法、装置及计算机可读存储介质
CN109036404A (zh) 语音交互方法及装置
CN108174269A (zh) 可视化音频播放方法及装置
CN108347522A (zh) 调节音量的方法及装置
CN110392334A (zh) 一种麦克风阵列音频信号自适应处理方法、装置及介质
CN108268667A (zh) 音频文件聚类方法及装置
CN108711434A (zh) 车辆降噪方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant