CN109524024B - 一种音频播放方法、介质、装置和计算设备 - Google Patents

一种音频播放方法、介质、装置和计算设备 Download PDF

Info

Publication number
CN109524024B
CN109524024B CN201811323402.XA CN201811323402A CN109524024B CN 109524024 B CN109524024 B CN 109524024B CN 201811323402 A CN201811323402 A CN 201811323402A CN 109524024 B CN109524024 B CN 109524024B
Authority
CN
China
Prior art keywords
audio
playing
progress
decoder
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811323402.XA
Other languages
English (en)
Other versions
CN109524024A (zh
Inventor
魏永振
肖军军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN201811323402.XA priority Critical patent/CN109524024B/zh
Publication of CN109524024A publication Critical patent/CN109524024A/zh
Application granted granted Critical
Publication of CN109524024B publication Critical patent/CN109524024B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10018Improvement or modification of read or write signals analog processing for digital recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephone Function (AREA)

Abstract

本发明的实施方式提供了一种音频播放方法、介质、装置和计算设备。该方法包括:从正在播放的由外部设备投射的第一音频中识别乐纹;基于乐纹匹配到目标音频,并将目标音频作为第二音频;获取第一音频的播放状态;判断播放状态是否符合预设条件;若否,以播放第一音频的当前进度为基础播放第二音频。通过可以在第一音频的播放状态不符合预设条件时,以播放第一音频的当前进度为基础切换播放与第一音频匹配的第二音频,避免了因数据传输速率变化或数据传输稳定性下降而造成的音频播放卡顿,有助于提高音频播放的流畅度,提升用户体验。

Description

一种音频播放方法、介质、装置和计算设备
技术领域
本发明的实施方式涉及音频领域,更具体地,本发明的实施方式涉及一种音频播放方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着技术的快速发展,电子设备的功能愈加完善,绝大多数的电子设备均具有音频播放功能,例如,电视机、台式电脑、智能手机、平板电脑、MP4、MP3、可穿戴设备和头戴显示设备等。当用户在一个电子设备上观看视频或者听音频时,无法将该电子设备上播放的音频投射到其他电子设备上,一旦该电子设备处于没电的状态下,则无法继续观看音频,降低用户体验。另外,一些智能家居的功能相比于移动终端的功能具有更大的优势,例如,音箱相比于移动终端具有更好音效效果,能够为用户带来更好的听觉体验。如果用户想要将移动终端上播放的音频投射到音箱上,只能将待播放的音频全部拷贝到U盘中,再将U盘与者音箱的数据接口连接,进而控制者音箱从U盘中读取音频进行播放,这种将移动终端上播放的音频投射到者音箱上方法过程繁琐,用户体验较低。
内容投射,是指用户可以将原本在智能手机、平板电脑、可穿戴设备和头戴显示设备等外部设备上播放的媒体流数据,通过数字生活网络联盟(Digital Living NetworkAlliance,DLNA)投影协议、空中播放(AirPlay)投射协议、蓝牙(Bluetooth)投射协议等投射协议在智能音响、智能电视、智能娱乐终端等内容分享设备上播放。这种方式可以突破外部设备的功能限制,极大的提高用户的体验。
当前外部设备的内容投射技术方案一般为,外部设备中的投射应用获取媒体流数据的播放地址,基于DLNA、AirPlay或蓝牙(Bluetooth)等投射协议,将播放地址发送给支持投射的设备服务上,这些设备服务通常运行于内容分享设备中,内容分享设备服务获取到媒体流数据的播放地址后,通过自带播放器将根据媒体流数据的播放地址获取到的媒体流数据渲染到内容分享设备进行播放。
目前外部设备进行内容投射时存在传输环境变化、设备故障等问题,这些问题可能导致数据传输速率变化,数据传输稳定性下降,进而使得内容分享设备上的音频播放卡顿,甚至音频播放终止。
发明内容
由于目前外部设备进行内容投射时存在传输环境变化、设备故障等问题,这些问题可能导致数据传输速率变化,数据传输稳定性下降,进而使得内容分享设备上的音频播放卡顿,甚至音频播放终止。因此非常需要一种改进的音频播放的技术方案,以解决上述技术问题。
在本上下文中,本发明的实施方式期望提供一种音频播放方法、装置、介质和计算设备。
在本发明实施方式的第一方面中,提供了一种音频播放方法,包括:从正在播放的由外部设备投射的第一音频中识别乐纹;基于乐纹匹配到目标音频,并将目标音频作为第二音频;获取第一音频的播放状态;判断播放状态是否符合预设条件;若否,以播放第一音频的当前进度为基础播放第二音频。
在本发明的一个实施例中,在播放第二音频时,继续无声播放第一音频。
在本发明的一个实施例中,通过以下步骤无声播放第一音频:通过第一解码器将第一音频解码,断开将解码后的第一音频传输至声卡的传输通道。
在本发明的一个实施例中,若判断播放状态符合预设条件,则在播放第一音频时,以播放第一音频的播放进度为基础无声播放第二音频。
在本发明的一个实施例中,以播放第一音频的播放进度为基础无声播放第二音频的步骤包括:通过第二解码器将获取到的第二音频解码;以播放第一音频的播放进度为基础播放解码后的第二音频,其中,在播放第二音频时,断开将解码后的第二音频传输至声卡的传输通道。
在本发明的一个实施例中,通过第一扬声器播放第一音频,通过第二扬声器播放第二音频。
在本发明的一个实施例中,第一扬声器和第二扬声器为同一个扬声器。
在本发明的一个实施例中,获取第一音频的播放状态的步骤包括:获取第一音频由第一解码器传输至声卡的传输速率;和/或,获取第一解码器传输解码后的第一音频的置信度。
在本发明的一个实施例中,判断播放状态是否符合预设条件的步骤包括:
判断传输速率在预设时间内的延时是否小于预设阈值;和/或
判断第一解码器的传输速率是否大于第二解码器的传输速率;和/或
判断第一解码器传输音频时的置信度是否大于第二解码器传输音频时的置信度。
在本发明的一个实施例中,在以播放第一音频的当前进度为基础播放第二音频之前,还包括:获取播放第一音频的当前进度。
在本发明的一个实施例中,获取播放第一音频的当前进度的步骤,具体包括:根据识别结果获取第一音频的播放进度,获取外部设备投射第一音频的计时进度,基于播放进度和计时进度确定当前进度。
在本发明的一个实施例中,基于播放进度和计时进度确定当前进度的步骤包括:若播放进度与计时进度相同,则确定计时进度为当前进度;若播放进度与计时进度不同,则确定播放进度为当前进度。
在本发明的一个实施例中,基于乐纹匹配到目标音频并将目标音频作为第二音频,包括:判断是否匹配到多个目标音频;若匹配到一个目标音频,则获取目标音频作为第二音频;若匹配到多个目标音频,则从多个目标音频中选取音质最高的作为第二音频。
在本发明实施方式的第二方面中,提供了一种音频播放装置,包括:
音频识别模块,被配置为从正在播放的由外部设备投射的第一音频中识别乐纹;
音频搜索模块,被配置为基于乐纹进行搜索目标音频;
第二音频获取模块,被配置为响应于搜索到目标音频,获取目标音频作为第二音频;
播放状态获取模块,被配置为获取第一音频的播放状态;
判断模块,被配置为判断播放状态是否符合预设条件;
播放模块,被配置为若否,以第一音频的播放进度为基础播放第二音频。
在本发明的一个实施例中,播放模块在播放第二音频时,还用于继续无声播放第一音频。
在本发明的一个实施例中,播放模块在无声播放第一音频时,具体用于:通过第一解码器将第一音频解码,断开将解码后的第一音频传输至声卡的传输通道。
在本发明的一个实施例中,播放模块还用于:若判断模块判断播放状态符合预设条件,则在播放第一音频时,以播放第一音频的播放进度为基础无声播放第二音频。
在本发明的一个实施例中,播放模块在以播放第一音频的播放进度为基础无声播放第二音频时,具体用于:
通过第二解码器将获取到的第二音频解码;
以播放第一音频的播放进度为基础播放解码后的第二音频,其中,在播放第二音频时,断开将解码后的第二音频传输至声卡的传输通道。
在本发明的一个实施例中,通过第一扬声器播放第一音频,通过第二扬声器播放第二音频。
在本发明的一个实施例中,第一扬声器和第二扬声器为同一个扬声器。
在本发明的一个实施例中,播放状态获取模块在获取第一音频的播放状态时,具体用于:
获取第一音频由第一解码器传输至声卡的传输速率;和/或
获取第一解码器传输解码后的第一音频的置信度。
在本发明的一个实施例中,判断模块在判断播放状态是否符合预设条件时,具体用于:
判断传输速率在预设时间内的延时是否小于预设阈值;和/或
判断第一解码器的传输速率是否大于第二解码器的传输速率;和/或
判断第一解码器传输音频时的置信度是否大于第二解码器传输音频时的置信度。
在本发明的一个实施例中,播放状态获取模块还用于:在播放模块以播放第一音频的当前进度为基础播放第二音频之前,获取播放第一音频的当前进度。
在本发明的一个实施例中,播放状态获取模块在获取播放第一音频的当前进度的步骤时,具体用于:根据识别结果获取第一音频的播放进度;获取外部设备投射第一音频的计时进度;基于播放进度和计时进度确定当前进度。
在本发明的一个实施例中,播放状态获取模块在基于播放进度和计时进度确定当前进度时,具体用于:若播放进度与计时进度相同,则确定计时进度为当前进度;若播放进度与计时进度不同,则确定播放进度为当前进度。
在本发明的一个实施例中,第二音频获取模块在响应于搜索到目标音频,获取目标音频作为第二音频时,具体用于:判断是否匹配到多个目标音频;若匹配到一个目标音频,则获取目标音频作为第二音频;若匹配到多个目标音频,则从多个目标音频中选取音质最高的作为第二音频。
在本发明实施方式的第三方面中,提供了一种介质,该介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行第一方面中任一实施例的方法。
在本发明实施方式的第四方面中,提供了一种计算设备,包括处理单元、存储器以及输入/输出(In/Out,I/O)接口;存储器,用于存储处理单元执行的程序或指令;处理单元,用于根据存储器存储的程序或指令,执行第一方面中任一实施例的方法;I/O接口,用于在处理单元的控制下接收或发送数据。
本发明的实施方式提供的技术方案,可以在第一音频的播放状态不符合预设条件时,以播放第一音频的当前进度为基础切换播放与第一音频匹配的第二音频,避免了因数据传输速率变化或数据传输稳定性下降而造成的音频播放卡顿,有助于提高音频播放的流畅度,提升用户体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了根据本发明实施方式的一种内容投射系统的结构示意图;
图2示意性地示出了根据本发明实施例的一种音频播放方法的流程示意图;
图3示意性地示出了根据本发明实施例的另一种音频播放方法的流程示意图;
图4示意性地示出了根据本发明实施例的一种音频播放装置的结构示意图;
图5示意性地示出了根据本发明实施例的一种介质的结构示意图;
图6示意性地示出了根据本发明实施例的一种计算设备的结构示意图;
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种音频播放方法、介质、装置和计算设备。
在本文中,需要理解的是,所涉及的几个概念的含义如下:
蓝牙(Bluetooth):是一种无线技术标准,可实现固定设备、移动设备和楼宇个人域网之间的短距离数据交换(使用2.4—2.485GHz的ISM波段的UHF无线电波)。
空中播放(AirPlay)投射协议:是一种播放技术,可以将iPhone、iPod touch、iPad及Mac(需要OSX Mountain Lion)上的视频镜像传送到支持Airplay的设备(如:音箱、AppleTV)中播放。
数字生活网络联盟(Digital Living Network Alliance,DLNA)投影协议:由索尼、英特尔、微软等发起成立的旨在解决个人PC、消费电器、移动设备之间互联互通的协议。
智能音箱:智能音箱是家庭消费者用语音进行上网的一个工具入口,音箱通过麦克风采集用户的语音指令,并根据语音指令执行具体的动作,如播放音乐,查询天气,设定闹钟等。其中,播放音乐的音频内容可以来自WiFi播放模式和投射播放模式。其中,投射播放模式是指用户通过数据传输协议(如蓝牙、AirPlay、DLNA)将投射源的音频数据投射至智能音箱进行播放。
外部设备:即投射源,允许用户通过投射播放模式将音频内容传输给智能音箱进行播放的第三方设备(例如手机,PC,平板电脑等)。
解码器(Decoder):是一种计算机语言函数,意在将编码字节序列转换为一组字符。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,目前外部设备进行内容投射时存在传输环境变化、设备故障等问题,这些问题可能导致数据传输速率变化,数据传输稳定性下降,进而使得内容分享设备上的音频播放卡顿,甚至音频播放终止。
为了克服技术存在的问题,本发明中提出了一种音频播放方法、介质、装置和计算设备。该方法包括:从正在播放的由外部设备投射的第一音频中识别乐纹,基于该乐纹匹配到目标音频并将该目标音频作为第二音频,获取第一音频的播放状态,然后判断该播放状态是否符合预设条件,若否,则以播放第一音频的当前进度为基础播放第二音频。该方法通过在第一音频的播放状态不符合预设条件时,以播放第一音频的当前进度为基础切换播放与第一音频匹配的第二音频,避免了因数据传输速率变化或因数据传输稳定性下降而造成的音频播放卡顿,有助于提高音频播放的流畅度,提升用户体验。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
本发明实施例可以应用于媒体流切换场景,其中媒体流包括但不限于音频、图像、视频。本发明实施例涉及的媒体流切换场景例如可以是内容投射系统中的音频切换场景,也可以是其他媒体流的切换场景,还可以是其他切换场景,本发明实施例中并不限定。
本发明实施例适用的内容投射系统至少包括外部设备和内容分享设备,如图1所示,其中外部设备和内容分享设备均为支持投射协议的电子设备。本发明实施例中,外部设备包括但不限于以下电子设备:智能手机、平板电脑、MP4、MP3、PC、可穿戴设备和头戴显示设备;外部设备包括但不限于以下电子设备:智能手机、平板电脑、MP4、MP3、PC、可穿戴设备和头戴显示设备。需要理解的是,同一电子设备在不同的内容投射系统中既可以作为外部设备也可以作为内容分享设备。例如,在智能电视与平板电脑组成的内容投射系统中,平板电脑可以作为外部设备,智能电视可以作为内容分享设备;在平板电脑与智能手机组成的内容投射系统中,平板电脑可以作为内容分享设备,智能手机可以作为外部设备。
示例性方法
下面结合应用场景,参考图1来描述根据本发明示例性实施方式的用于音频播放的方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
本发明实施例提供了一种音频播放方法,如图2所示,该方法包括:
S201、从正在播放的由外部设备投射的第一音频中识别乐纹;
S202、基于乐纹匹配到目标音频,并将目标音频作为第二音频;
S203、获取第一音频的播放状态;
S204、判断播放状态是否符合预设条件;
S205、若否,以播放第一音频的当前进度为基础播放第二音频。
通过图2所示的音频播放方法,可以在第一音频的播放状态不符合预设条件时,以播放第一音频的当前进度为基础切换播放与第一音频匹配的第二音频,避免了因数据传输速率变化或数据传输稳定性下降而造成的音频播放卡顿,有助于提高音频播放的流畅度,提升用户体验。
本发明实施例中,可以通过第一扬声器播放第一音频,通过第二扬声器播放第二音频。可选的,第一扬声器和第二扬声器可以为同一个扬声器,也可以为不同扬声器。
S201中将外部设备正在播放的音频作为第一音频,从该第一音频中提取出乐纹,其中乐纹是用于指示音频特征的参数。一种可能的实现方式中,将外部设备正在播放的第一音频的频谱图切分出多个频谱片段,针对这多个频谱片段中每一频谱片段获取多个特征点,这多个特征点组成该频谱片段对应的乐纹,从而得到第一音频对应的多个乐纹。
S202中在音频数据库中对提取出的第一音频的乐纹进行乐纹匹配得到目标音频,并将得到的目标音频作为第二音频,该音频数据库包括至少一个目标音频。
可选的,音频数据库可以是预先设置的。一种实现方式中,在S202之前,建立音频数据库时对存入音频数据库中的全部或部分音频数据提取乐纹,具体过程为:计算每一音频数据的频谱图并将该音频数据的频谱图切分成多个片段,从这多个片段中的每一片段上提取出多个特征点,基于这多个特征点可得到该片段的乐纹;将这些音频数据的乐纹以倒排索引的形式存入音频数据库中。进一步的,建立音频数据库时分别将至少一个目标音频中使用率最高的乐纹存储为对应的目标音频的标识,以便提高乐纹匹配的响应速度。
S202的一种可能的实现方式为:判断乐纹是否匹配到多个目标音频,即将提取出的第一音频的至少一个乐纹与音频数据库中存储的乐纹进行匹配,获取与第一音频的至少一个乐纹相匹配的乐纹对应的音频数据,判断音频数据的数量是否为多个。若匹配到一个目标音频,则说明与该乐纹对应的目标音频数量仅为一个,此情况下获取该目标音频作为第二音频。若匹配到多个目标音频,则说明与该乐纹对应的目标音频数量为多个,此情况下为了提高第二音频的播放质量,可以从这多个目标音频中选取音质最高的作为第二音频。在匹配到多个目标音频的情况下,本发明实施例中并不限定选取第二音频的标准为音质最高,还可以采用其他标准来选取第二音频。例如,从匹配到的多个目标音频中选取与第一音频的总时长最相近的作为第二音频,或者从匹配到的多个目标音频中选取预设音源类型的作为第二音频。
进一步的,当获取到的与第一音频的至少一个乐纹相匹配的乐纹对应的音频数据为多个时,从这多个音频数据中选取与第一音频的至少一个乐纹相匹配的乐纹的数量最多的音频数据作为目标音频。
S203中获取第一音频的播放状态的实现方式为以下之一或组合:一种可能的实现方式是获取第一音频由第一解码器传输至声卡的传输速率,另一种可能的实现方式是获取第一解码器传输解码后的第一音频的置信度。通过上述实现方式可以获取到第一音频的播放状态,以便后续步骤中根据该第一音频的播放状态对匹配到的第二音频进行播放。
本发明实施例涉及的预设条件包括但不限于预设时间内的延时、解码器(Decoder)的传输速率以及置信度。对应于S203的不同实现方式,S204中判断播放状态是否符合预设条件的情况包括以下之一或组合:
情况一:判断传输速率在预设时间内的延时是否小于预设阈值。若是,则说明第一音频的传输速率的延时较小,第一音频的传输较为顺畅,即此情况下判定播放状态符合预设条件;若否,则说明第一音频的传输速率的时延较大,第一音频的传输较不顺畅,即此情况下判定播放状态不符合预设条件。假设预设阈值为100毫秒(ms),预设时间为3秒(s),则判断第一音频的传输速率在3s内的延时是否小于100ms;若是,判定第一音频的传输速率符合预设条件,即判定第一音频的播放状态符合预设条件;若否,则判定第一音频的传输速率不符合预设条件,即判定第一音频的播放状态不符合预设条件。
进一步的,在判断第一音频的传输速率在预设时间内的延时是否小于预设阈值之后,还可以记录判断结果,统计判断结果出现的次数,直到判定第一音频的传输速率在预设时间内的延时不小于预设阈值的次数超过预设次数,则判定播放状态符合预设条件,这样有助于避免频繁切换播放音频,进一步提升音频传输的稳定性。假设预设次数为5次,预设时间为3s,预设阈值为100ms,则判断第一音频的传输速率在3s内的延时是否小于100ms,并记录判断结果以及统计判断结果出现的次数,直到判定第一音频的传输速率在3s内的延时不小于100ms的次数超过5次,即判定播放状态符合预设条件。
情况二:判断第一解码器的传输速率是否大于第二解码器的传输速率。若是,则说明相较于第二音频,第一音频的传输速率较快,第一音频的传输较为顺畅,即此情况下判定播放状态符合预设条件;若否,则说明相较于第一音频,第二音频的传输速率较快,第二音频的传输较为顺畅,即此情况下判定播放状态不符合预设条件。
情况三:判断第一解码器传输音频时的置信度是否大于第二解码器传输音频时的置信度。若是,则说明相较于第二音频,第一音频的置信度较高,第一音频的传输较为顺畅,即此情况下判定播放状态符合预设条件;若否,则说明相较于第一音频,第二音频的置信度较高,第二音频的传输较为顺畅,即此情况下判定播放状态不符合预设条件。
在S205中以播放第一音频的当前进度为基础播放第二音频之前,还可以获取播放第一音频的当前进度。一种实现方式的具体步骤可以为:根据识别结果获取第一音频的播放进度,并获取外部设备投射第一音频的计时进度,基于该播放进度和该计时进度确定第一音频的当前进度。进一步的,基于播放进度和计时进度确定当前进度的步骤包括两种情况:若播放进度与计时进度相同,则确定计时进度为当前进度;若播放进度与计时进度不同,则确定播放进度为当前进度。例如,根据识别结果获取第一音频的播放进度,并指示外部设备上报第一音频的计时进度,根据该播放进度和上报的计时进度确定第一音频的当前进度。本发明实施例中并不限定计时进度的上报方式是实时的、周期性的或是由事件触发的。
S205中若判定第一音频的播放状态不符合预设条件,则通过第二解码器将获取到的第二音频解码,依据于播放第一音频的播放进度,将解码后的第二音频传输至声卡。
在播放第二音频时,还可以继续无声播放第一音频,以便将第一音频作为在需要更换第二音频时的备选音频,从而有助于缩短切换播放的时延,提高音频播放的流畅度,提升用户体验。本发明实施例中无声播放第一音频的方法有多种,例如其中一种方法可以为:通过第一解码器将第一音频解码,断开将解码后的第一音频传输至声卡的传输通道。相应地,在将解码后的第一音频传输至声卡之后,若第一音频的播放状态恢复符合预设条件,并且第二音频的播放状态恢复不符合预设条件,则可以重新连接将解码后的第一音频传输至声卡的传输通道。
若判定第一音频的播放状态符合预设条件,则S205中在播放第一音频时,还可以依据于播放第一音频的播放进度无声播放第二音频,以便将第二音频作为在需要更换第一音频时的备选音频,从而有助于缩短切换播放的时延,提高音频播放的流畅度,提升用户体验。本发明实施例中以播放第一音频的播放进度为基础无声播放第二音频的方法有多种,例如其中一种方法可以是:通过第二解码器将获取到的第二音频解码;以播放第一音频的播放进度为基础获取解码后的第二音频;在播放第二音频时,断开将解码后的第二音频传输至声卡的传输通道,从而实现了依据于播放第一音频的播放进度来对第二音频进行无声播放。
下面将结合图3对上文的音频播放方法进行举例说明。假设第一音频为外部设备投射至智能音响的音频A,则图3所示的音频播放方法包括以下步骤:
S301:通过智能音箱采用投射播放模式来播放由外部设备投射的音频A。
在S301之后,执行S302和S305。需要说明的是,S302也可以在S305之前执行,S302也可以在S305之后执行,S302还可以与S305同时执行,本发明实施例中并不限定S302与S305的执行顺序。下文将对S302和S305进行详细说明。
S302:通过听音识曲模块识别音频A,并获取与音频A相匹配的目标音频a。即通过听音识曲模块对音频A进行乐纹提取,基于提取出的乐纹匹配到音频数据库中存储的目标音频a,并将目标音频a作为第二音频。
需要理解的是,S302与上文S201和S202相似,相似之处参见上文图2对应的实施例中S201和S202这两个步骤的详细描述。尤其是,听音识曲模块的功能与上文S201类似,此处不再赘述。
S303:判断是否获取到目标音频a。若是,则执行S304;若否,则执行S302。
S304:初始化decoder2(即上文图2对应的实施例中的第二解码器),并通过decoder2来解码目标音频a的音频数据。即启动decoder2进行初始化,并通过decoder2对目标音频a进行解码。在S304之后,继续执行S308,下文将详细说明S308的具体步骤。
S305:初始化decoder1(即上文图2对应的实施例中的第一解码器),启动播放计时器获取音频A的当前进度。即启动decoder1进行初始化,并同步启动播放计时器获取音频A的当前进度,该播放计时器用于获取音频A的播放时长作为音频A的当前进度。
S306:通过decoder1来传输音频A的音频数据,即通过decoder1解码音频A的音频数据,并将解码后的音频数据传输至声卡。
S307:判断音频A的播放状态是否不符合预设条件。若是,则执行S308;若否,则执行S306。
需要理解的是,S307与上文S204相似,相似之处参见上文图2对应的实施例中S204的详细描述,此处不再赘述。
S308:判断decoder2是否启动。若是,则执行S309;若否,则执行S306。
S309:断开decoder1,并接通decoder2以音频A的当前进度来传输目标音频a。即断开decoder1与声卡之间的传输通道,并接通decoder2与声卡之间的传输通道,以播放计时器获取到的音频A的当前进度来传输解码后的目标音频a的音频数据。
需要理解的是,S309与上文S205相似,相似之处参见上文图2对应的实施例中S205的详细描述,此处不再赘述。
S310:通过声卡处理传输来的音频数据。
需要说明的是,在执行S306之后继续执行S307和S310,本发明实施例并不限定执行S307和S310的先后顺序,两者可以同时执行,两者也可以先后执行。
S311:判断decoder1或decoder2的数据传输是否结束。若是,则执行S301。
通过上述S301至S311,可以在音频A的播放状态不符合预设条件时,以播放音频A的当前进度为基础切换播放与音频A匹配的目标音频a,避免了因音频A的数据传输速率变化或音频A的数据传输稳定性下降而造成的音频A播放卡顿,有助于提高音频播放的流畅度,提升用户体验。
示例性装置
在介绍了本发明示例性实施方式的方法之后,接下来,介绍本发明提供了示例性实施的装置。本发明提供的音频播放装置可以实现图2对应的实施例提供的方法中任一项执行的方法。参见图4,该音频播放装置至少包括:
音频识别模块,被配置为从正在播放的由外部设备投射的第一音频中识别乐纹;
音频搜索模块,被配置为基于乐纹进行搜索目标音频;
第二音频获取模块,被配置为响应于搜索到目标音频,获取目标音频作为第二音频;
播放状态获取模块,被配置为获取第一音频的播放状态;
判断模块,被配置为判断播放状态是否符合预设条件;
播放模块,被配置为若否,以第一音频的播放进度为基础播放第二音频。
可选的,播放模块在播放第二音频时,还用于继续无声播放第一音频。
可选的,播放模块在无声播放第一音频时,具体用于:通过第一解码器将第一音频解码,断开将解码后的第一音频传输至声卡的传输通道。
可选的,若判断模块判断播放状态符合预设条件,则播放模块还用于:在播放第一音频时,以播放第一音频的播放进度为基础无声播放第二音频。
可选的,播放模块在以播放第一音频的播放进度为基础无声播放第二音频时,具体用于:
通过第二解码器将获取到的第二音频解码;
以播放第一音频的播放进度为基础播放解码后的第二音频,其中,在播放第二音频时,断开将解码后的第二音频传输至声卡的传输通道。
可选的,通过第一扬声器播放第一音频,通过第二扬声器播放第二音频。
可选的,第一扬声器和第二扬声器为同一个扬声器。
可选的,播放状态获取模块在获取第一音频的播放状态时,具体用于:
获取第一音频由第一解码器传输至声卡的传输速率;和/或
获取第一解码器传输解码后的第一音频的置信度。
可选的,播放状态获取模块在判断播放状态是否符合预设条件时,具体用于:
判断传输速率在预设时间内的延时是否小于预设阈值;和/或
判断第一解码器的传输速率是否大于第二解码器的传输速率;和/或
判断第一解码器传输音频时的置信度是否大于第二解码器传输音频时的置信度。
可选的,播放状态获取模块还用于:在播放模块以播放第一音频的当前进度为基础播放第二音频之前,获取播放第一音频的当前进度。
可选的,播放状态获取模块在获取播放第一音频的当前进度的步骤时,具体用于:根据识别结果获取第一音频的播放进度;获取外部设备投射第一音频的计时进度;基于播放进度和计时进度确定当前进度。
可选的,播放状态获取模块在基于播放进度和计时进度确定当前进度时,具体用于:若播放进度与计时进度相同,则确定计时进度为当前进度;若播放进度与计时进度不同,则确定播放进度为当前进度。
可选的,第二音频获取模块在响应于搜索到目标音频,获取目标音频作为第二音频时,具体用于:判断是否匹配到多个目标音频;若匹配到一个目标音频,则获取目标音频作为第二音频;若匹配到多个目标音频,则从多个目标音频中选取音质最高的作为第二音频。
示例性介质
在介绍了本发明示例性实施方式的方法和装置之后,接下来,参考图5,本发明提供了一种示例性介质,该介质存储有计算机可执行指令,该计算机可执行指令可用于使所述计算机执行图2对应的本发明示例性实施方式中任一项所述的方法。
示例性计算设备
在介绍了本发明示例性实施方式的方法、介质和装置之后,接下来,参考图6,介绍本发明提供的一种示例性计算设备60,该计算设备60包括处理单元601、存储器602、总线603、外部设备604、I/O接口605以及网络适配器606,该存储器602包括随机存取存储器(random access memory,RAM)6021、高速缓存存储器6022、只读存储器(Read-OnlyMemory,ROM)6023以及至少一片存储单元6024构成的存储单元阵列6025。其中该存储器602,用于存储处理单元601执行的程序或指令;该处理单元601,用于根据该存储器602存储的程序或指令,执行图2对应的本发明示例性实施方式中任一项所述的方法;该I/O接口605,用于在该处理单元601的控制下接收或发送数据。
应当注意,尽管在上文详细描述中提及了装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (24)

1.一种音频播放方法,包括:
从正在播放的由外部设备投射的第一音频中识别乐纹;
基于所述乐纹匹配到目标音频,并将所述目标音频作为第二音频;
获取所述第一音频的播放状态;
判断所述播放状态是否符合预设条件;
若否,以播放所述第一音频的当前进度为基础播放所述第二音频,在播放所述第二音频时,继续无声播放所述第一音频;
若判断所述播放状态符合预设条件,则在播放所述第一音频时,以播放所述第一音频的播放进度为基础无声播放所述第二音频。
2.如权利要求1所述的方法,其中,通过以下步骤无声播放所述第一音频:
通过第一解码器将所述第一音频解码;
断开将解码后的第一音频传输至声卡的传输通道。
3.如权利要求1所述的方法,其中,以播放所述第一音频的播放进度为基础无声播放所述第二音频的步骤包括:
通过第二解码器将获取到的所述第二音频解码;
以播放所述第一音频的播放进度为基础播放所述解码后的第二音频,其中,在播放所述第二音频时,断开将解码后的第二音频传输至声卡的传输通道。
4.如权利要求1所述的方法,其中,通过第一扬声器播放所述第一音频,通过第二扬声器播放所述第二音频。
5.如权利要求4所述的方法,其中,所述第一扬声器和第二扬声器为同一个扬声器。
6.如权利要求1所述的方法,其中,获取所述第一音频的播放状态的步骤包括:
获取所述第一音频由第一解码器传输至声卡的传输速率;和/或
获取所述第一解码器传输解码后的所述第一音频的置信度。
7.如权利要求6所述的方法,其中,判断所述播放状态是否符合预设条件的步骤包括:
判断所述传输速率在预设时间内的延时是否小于预设阈值;和/或
判断所述第一解码器的传输速率是否大于第二解码器的传输速率;和/或
判断所述第一解码器传输音频时的置信度是否大于第二解码器传输音频时的置信度。
8.如权利要求1所述的方法,其中,在以播放所述第一音频的当前进度为基础播放所述第二音频之前,还包括:
获取播放所述第一音频的当前进度。
9.如权利要求8所述的方法,其中,获取播放所述第一音频的当前进度的步骤,具体包括:
根据识别结果获取所述第一音频的播放进度;
获取所述外部设备投射所述第一音频的计时进度;
基于所述播放进度和所述计时进度确定所述当前进度。
10.如权利要求9所述的方法,其中,基于所述播放进度和所述计时进度确定所述当前进度的步骤包括:
若所述播放进度与所述计时进度相同,则确定所述计时进度为当前进度;
若所述播放进度与所述计时进度不同,则确定所述播放进度为当前进度。
11.如权利要求1所述的方法,其中,基于所述乐纹匹配到目标音频并将所述目标音频作为第二音频,包括:
判断是否匹配到多个所述目标音频;
若匹配到一个目标音频,则获取所述目标音频作为所述第二音频;
若匹配到多个目标音频,则从所述多个目标音频中选取音质最高的作为所述第二音频。
12.一种音频播放装置,其中,包括:
音频识别模块,被配置为从正在播放的由外部设备投射的第一音频中识别乐纹;
音频搜索模块,被配置为基于所述乐纹进行搜索目标音频;
第二音频获取模块,被配置为响应于搜索到所述目标音频,获取所述目标音频作为第二音频;
播放状态获取模块,被配置为获取所述第一音频的播放状态;
判断模块,被配置为判断所述播放状态是否符合预设条件;
播放模块,被配置为若否,以所述第一音频的播放进度为基础播放所述第二音频,继续无声播放所述第一音频;
所述播放模块还用于:若判断所述播放状态符合预设条件,则在播放所述第一音频时,以播放所述第一音频的播放进度为基础无声播放所述第二音频。
13.如权利要求12所述的音频播放装置,所述播放模块在无声播放所述第一音频时,还用于:
通过第一解码器将所述第一音频解码;
断开将解码后的第一音频传输至声卡的传输通道。
14.如权利要求12所述的音频播放装置,所述播放模块在以播放所述第一音频的播放进度为基础无声播放所述第二音频时,具体用于:
通过第二解码器将获取到的所述第二音频解码;
以播放所述第一音频的播放进度为基础播放所述解码后的第二音频,其中,在播放所述第二音频时,断开将解码后的第二音频传输至声卡的传输通道。
15.如权利要求12所述的音频播放装置,其中,通过第一扬声器播放所述第一音频,通过第二扬声器播放所述第二音频。
16.如权利要求15所述的音频播放装置,其中,所述第一扬声器和第二扬声器为同一个扬声器。
17.如权利要求12所述的音频播放装置,所述播放状态获取模块在获取所述第一音频的播放状态时,具体用于:
获取所述第一音频由第一解码器传输至声卡的传输速率;和/或
获取所述第一解码器传输解码后的所述第一音频的置信度。
18.如权利要求17所述的音频播放装置,所述判断模块在判断所述播放状态是否符合预设条件时,具体用于:
判断所述传输速率在预设时间内的延时是否小于预设阈值;和/或
判断所述第一解码器的传输速率是否大于第二解码器的传输速率;和/或
判断所述第一解码器传输音频时的置信度是否大于第二解码器传输音频时的置信度。
19.如权利要求12所述的音频播放装置,所述播放状态获取模块还用于:
在所述播放模块以播放所述第一音频的当前进度为基础播放所述第二音频之前,获取播放所述第一音频的当前进度。
20.如权利要求19所述的音频播放装置,所述播放状态获取模块在获取播放所述第一音频的当前进度时,具体用于:
根据识别结果获取所述第一音频的播放进度;
获取所述外部设备投射所述第一音频的计时进度;
基于所述播放进度和所述计时进度确定所述当前进度。
21.如权利要求20所述的音频播放装置,所述播放状态获取模块在基于所述播放进度和所述计时进度确定所述当前进度时,具体用于:
若所述播放进度与所述计时进度相同,则确定所述计时进度为当前进度;
若所述播放进度与所述计时进度不同,则确定所述播放进度为当前进度。
22.如权利要求12所述的音频播放装置,所述第二音频获取模块基于所述乐纹匹配到目标音频并将所述目标音频作为第二音频时,具体用于:
判断是否匹配到多个所述目标音频;
若匹配到一个目标音频,则获取所述目标音频作为所述第二音频;
若匹配到多个目标音频,则从所述多个目标音频中选取音质最高的作为所述第二音频。
23.一种计算机可读存储介质,存储有程序代码,所述程序代码当被处理器执行时,实现如权利要求1-11之一所述的方法。
24.一种计算设备,包括处理器和存储有程序代码的存储介质,所述程序代码当被处理器执行时,实现如权利要求1-11之一所述的方法。
CN201811323402.XA 2018-11-08 2018-11-08 一种音频播放方法、介质、装置和计算设备 Active CN109524024B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811323402.XA CN109524024B (zh) 2018-11-08 2018-11-08 一种音频播放方法、介质、装置和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811323402.XA CN109524024B (zh) 2018-11-08 2018-11-08 一种音频播放方法、介质、装置和计算设备

Publications (2)

Publication Number Publication Date
CN109524024A CN109524024A (zh) 2019-03-26
CN109524024B true CN109524024B (zh) 2022-07-19

Family

ID=65774247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811323402.XA Active CN109524024B (zh) 2018-11-08 2018-11-08 一种音频播放方法、介质、装置和计算设备

Country Status (1)

Country Link
CN (1) CN109524024B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110755843B (zh) * 2019-10-24 2023-03-14 腾讯科技(深圳)有限公司 游戏音频的处理方法和装置、存储介质及电子装置
CN111552454B (zh) * 2020-04-29 2023-10-27 广州酷狗计算机科技有限公司 音频播放方法、装置、终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103338317A (zh) * 2013-06-24 2013-10-02 广东欧珀移动通信有限公司 根据来电情况控制影音设备的方法及系统
CN104092654A (zh) * 2014-01-22 2014-10-08 腾讯科技(深圳)有限公司 媒体播放方法、客户端及系统
CN106488289A (zh) * 2016-10-08 2017-03-08 广东欧珀移动通信有限公司 音频同步播放方法、装置及系统
CN108200469A (zh) * 2018-01-23 2018-06-22 歌尔科技有限公司 一种音视频投射方法、装置和系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100302001B1 (ko) * 1998-08-03 2001-10-27 구자홍 오디오기록/재생방법및장치
CN103581816A (zh) * 2013-11-18 2014-02-12 广州市花都区中山大学国光电子与通信研究院 基于UPnP协议的无线多房间音乐系统的一种同步机制
CN108093359A (zh) * 2017-11-30 2018-05-29 青岛海尔多媒体有限公司 基于无线传输的多声道播放方法及播放设备和无线音箱
CN108366044B (zh) * 2017-12-30 2023-12-12 深圳市潮流网络技术有限公司 一种VoIP远程音视频共享方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103338317A (zh) * 2013-06-24 2013-10-02 广东欧珀移动通信有限公司 根据来电情况控制影音设备的方法及系统
CN104092654A (zh) * 2014-01-22 2014-10-08 腾讯科技(深圳)有限公司 媒体播放方法、客户端及系统
CN106488289A (zh) * 2016-10-08 2017-03-08 广东欧珀移动通信有限公司 音频同步播放方法、装置及系统
CN108200469A (zh) * 2018-01-23 2018-06-22 歌尔科技有限公司 一种音视频投射方法、装置和系统

Also Published As

Publication number Publication date
CN109524024A (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
US10249303B2 (en) Methods and systems for detecting and processing speech signals
EP2815290B1 (en) Method and apparatus for smart voice recognition
CN104954555B (zh) 一种音量调节方法及系统
EP3535754B1 (en) Improved reception of audio commands
CN109273017B (zh) 编码控制方法、装置以及电子设备
CN109473095B (zh) 一种智能家居控制系统及控制方法
US20210398527A1 (en) Terminal screen projection control method and terminal
US20140359685A1 (en) Video processing method, television dongle, control terminal, and system
CN113407089A (zh) 一种语音控制的分屏显示方法及电子设备
EP3846020A1 (en) Sound effect adjusting method and apparatus, electronic device, and storage medium
US11463776B2 (en) Video playback processing method, terminal device, server, and storage medium
CN109524024B (zh) 一种音频播放方法、介质、装置和计算设备
WO2015149613A1 (en) Volume control methods and devices, and multimedia playback control methods and devices
CN106792048B (zh) 一种识别智能电视用户语音命令的方法和装置
CN106303816B (zh) 一种信息控制方法及电子设备
CN110047497B (zh) 背景音频信号滤除方法、装置及存储介质
US20230186938A1 (en) Audio signal processing device and operating method therefor
CN110769280A (zh) 一种接续播放文件的方法及装置
CN109144642B (zh) 显示控制方法、装置、电子设备及存储介质
CN111462744A (zh) 一种语音交互方法、装置、电子设备及存储介质
CN106331820A (zh) 音视频的同步处理方法和装置
US11580954B2 (en) Systems and methods of handling speech audio stream interruptions
CN116437256A (zh) 音频处理方法、计算机可读存储介质、及电子设备
US11373659B2 (en) Display apparatus and method of controlling the same
KR20210078682A (ko) 전자장치 및 그 제어방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant