CN107656977A

CN107656977A - 多媒体文件的获取及播放方法以及装置

Info

Publication number: CN107656977A
Application number: CN201710794897.3A
Authority: CN
Inventors: 陈琼
Original assignee: JRD Communication Shenzhen Ltd
Current assignee: JRD Communication Shenzhen Ltd; Jiekai Communications Shenzhen Co Ltd
Priority date: 2017-09-05
Filing date: 2017-09-05
Publication date: 2018-02-02
Also published as: WO2019047861A1

Abstract

本发明公开了一种多媒体文件的获取及播放方法以及装置，该方法包括：接收用户触发指令，响应触发指令并采集用户的语音信号指令；按照设定参数对语音信号指令进行配置；将配置后的语音信号指令按照设定格式进行音效处理，并将音效处理后的语音信号指令发送至云端服务器，以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件；接收多媒体文件，通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理；播放处理后的多媒体文件。通过上述方法，提升语音识别的准确率，改善多媒体文件的输出效果，提高用户体验。

Description

多媒体文件的获取及播放方法以及装置

技术领域

本发明涉及智能终端领域，特别是涉及一种多媒体文件的获取及播放方法以及装置。

背景技术

互联网技术以及与电子技术的结合程度越来越高，智能终端的功能越来越多样化，同时用户对智能终端产品智能化、人性化的要求也越来越高，特别是，人们希望能够更方便的搜索到喜欢的音视频，比如各种音频文件，并追求更好的音质效果。

为了达到更好的音质效果，很多产品选择使用性能优质的器件，改善音质，但是此方法设计的产品成本的较高，而且需要耗费大量的人力物力进行音频指标测试。再者，目前业内基本上是把提升音质的器件设置在智能终端设备上，比如，通过智能终端的双喇叭输出，智能终端一般都比较轻薄，使得喇叭的尺寸收到限制，一般薄且小，从而使动圈的材料以及绕线工艺上都有限制，造成功率输出有限，音质不佳；另一方面，声腔结构的设计也受到智能终端的限制，造成了音质效果较差。

另外，为了更方便的搜索到喜欢的音视频，一般会通过文字搜索或语音搜索，当采用语音搜索时，采集到的语音经常会有损失，识别的出错率较高，影响用户体验。

发明内容

本发明主要解决的技术问题是提供一种多媒体文件的获取及播放方法以及装置，提升语音识别的准确率，同时可改善多媒体文件的输出效果，提高用户体验。

为解决上述技术问题，本发明采用的第一个技术方案是：提供一种多媒体文件的获取及播放方法，所述多媒体文件的获取及播放方法包括：接收用户触发指令，响应所述触发指令并采集所述用户的语音信号指令；按照设定参数对所述语音信号指令进行配置；将配置后的语音信号指令按照设定格式进行处理，并将处理后的所述语音信号指令发送至云端服务器，以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件；接收所述多媒体文件，通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理；播放处理后的所述多媒体文件。

为解决上述技术问题，本发明采用的第二个技术方案是：提供一种智能终端，所述智能终端包括存储器、处理器以及存储在所述存储器上的并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现本发明任一所述多媒体文件的获取以及播放方法中的步骤。

为解决上述技术问题，本发明采用的第三个技术方案是：提供一种具有存储功能的装置，其上存储有程序数据，所述程序能够被执行实现本发明任一所述多媒体文件的获取以及播放方法中的步骤。

本发明的有益效果是：本发明基于人工智能和音效处理技术，从云端搜索下载符合语音信号指令的多媒体文件，并对多媒体文件进行相应的音效算法处理，改善多媒体文件的输出效果。同时，可对语音信号指令进行音效算法处理，使采集到的语音信号指令更完整清晰、易于识别，提升语音识别的准确率，提高用户体验。

附图说明

图1是本发明多媒体文件的获取及播放方法一实施方式的流程示意图；

图2是本发明智能终端一实施方式的结构示意图；

图3是本发明具有存储功能的装置一实施方式的结构示意图。

具体实施方式

发明提供一种多媒体文件的获取及播放方法和装置，为使本发明的目的、技术方案和技术效果更加明确、清楚，以下对本发明进一步详细说明，应当理解此处所描述的具体实施条例仅用于解释本发明，并不用于限定本发明。

参阅图1，图1是本发明多媒体文件的获取及播放方法一实施方式的流程示意图。本实施方式的多媒体文件的获取及播放方法包括：

101：接收用户触发指令，响应触发指令并采集用户的语音信号指令。

在一个具体的实施方式中，智能终端接收到用户的触发指令之后，判断确定当前网络是否设置成功，如果当前网络设置成功，则根据用户的触发指令对通信通道和对应的设备参数进行配置，响应触发指令并采集用户的语音信号指令。

其中，智能终端包括智能手机、平板电脑以及其他智能设备，比如智能音箱，在此不做限定。

其中，触发指令为用户通过特定方式发出的操作指令，包括通过交互动作，如特定的物理按键或虚拟按键，触控输入或界面输入发出操作指令。

为了清楚说明本实施方式，在此以长按智能终端的虚拟Home键触发AI(Artificial Intelligence)功能为例解释说明。

在本实施方式中，当智能终端接收到用户启动AI功能的操作指令之后，判断确定当前网络是否可用，如判断确定智能终端的wifi网络或无线数据网络是否可用，如果当前网络可用，则通过特定的总线发送相应的命令，如通过I2C总线发送命令给智能终端的DSP(Digital Signal Processing，数字处理器)进行通信通道配置以及硬件的初始化配置，并通过audio服务启动录音线程。

如果当前网络不可用，则提醒用户当前网络不可用并提示用户设置网络，如弹出对话框提醒用户或语音提醒用户。

进一步地，网络配置成功之后，智能终端响应AI功能，开始采集用户的语音信号指令，比如通过麦克风采集用户的语音信号指令。为了达到更好的录音效果，可以多次采集用户的同一语音信号指令。

102：按照设定参数对语音信号指令进行配置。

在一个具体的实施方式中，智能终端按照设定的参数对采集到的语音信号指令进行配置。其中，设定的参数为对语音信号处理时所设定的参数信息，如信号的格式、信号的频率等。

具体地，采集到的语音信号是模拟信号，需要经过抽样、量化、编码转换为数字信号。如通过PCM(Pulse Code Modulation，脉冲编码调制)对语音信号指令进行处理。即可以通过ADC模数转换处理采集到的语音信号指令，实现模拟信号的数字化。

103：将配置后的语音信号指令按照设定格式进行音效处理，并将音效处理后的语音信号指令发送至云端服务器，以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件。

在一个具体的实施方式中，将配置后的语音信号指令按照设定格式进行处理，并将处理后的语音信号指令发送至云端服务器，以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件。

通常，语音信号指令的频宽一般在1Khz～8Khz之间，在采集语音信号和模数转换语音信号的过程中，相对于原始的语音信号来讲会有信号损失和音质损耗情况的发生。为了使语音信号更完整真实、识别率更高，根据语音信号的特点进行相应的修复。在其中的一个实施方式中，对语音信号指令进行频带拓宽处理，比如将语音信号的带宽从8Khz修复成16KHz,从而可以弥补损失的语音信号。可选地，也可以对语音信号指令进行混音处理。

在本实施方式中，将处理之后的语音信号指令发送至云端服务器，以使云端服务器根据语音信号指令获取与其相匹配的多媒体文件。其中，多媒体文件包括音乐文件、视频文件。

比如，语音信号指令包含歌名或一段歌词或歌手的名字，则云端服务器解析此语音信号指令，根据语音信号指令中的歌名或一段歌词或歌手的名字获取与此语音文件信号指令相匹配的多媒体文件。

104：接收多媒体文件，通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理。

在一个具体的实施方式中，智能终端接收由云端服务器反馈的多媒体文件。具体地，智能终端判断确定当前网络是否可用，如智能终端的wifi网络或无线数据网络是否可用，如果当前网络可用，则通过特定的总线发送相应的命令，如通过I2C总线发送命令给智能终端的DSP(Digital Signal Processing，数字处理器)进行通信通道配置以及硬件的初始化配置，并通过audio服务启动播放线程。

进一步地，为了避免播放多媒体文件过程中出现卡顿的现象，当网络可用时，智能终端接收多媒体文件，并将多媒体文件按照预设条件以及地址进行存储，在多媒体文件完整存储后，再通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理。

在本实施方式中，智能终端通过socket协议将多媒体文件写至指定的内存空间，写完之后会发送提示消息。智能终端从内存空间中读取多媒体文件，同时启动播放线程。

进一步地，不同类型的多媒体文件所对应匹配的音效算法不相同，为了使多媒体文件的音质更生动、视听体验更佳，智能终端根据多媒体文件的类型确定与其匹配的音效算法。

具体地，智能终端对多媒体文件进行解析，从解析得到的特征信息中获取与多媒体文件相匹配的音效参数。其中，音效参数包括多媒体文件的文件格式、采样率、文件大小、数据位数以及频宽中的至少一个。并将多媒体文件对应的音效参数通过特定的方式发送给DSP，如通过I2C总线发送给DSP，DSP根据接收到音效参数确定与多媒体文件对应的音效算法，并智能终端发送调用此音效算法的请求。

智能终端将多媒体文件通过I2C总线烧录到DSP中，加载成功后，通过与多媒体文件对应的音效算法对多媒体文件进行音效处理。

在此，需要说明的是，音效算法存储在智能终端的文件系统中，有多种不同类型的音效算法，具体包括：信号增强、信号频带拓宽、信号降噪、信号混音、信号动态增益控制。智能终端根据多媒体文件的类型选择相匹配的音效算法，从而使音质更佳，提升用户的视听体验。

105：播放处理后的多媒体文件。

在一个具体的实施方式中，智能终端播放处理后的多媒体文件，智能终端将音效算法处理之后的多媒体文件进行模数转换，并通过特定的功放播放模数转换后的多媒体文件。

在本实施方式中，智能终端通过扬声器播放多媒体文件，需要模拟信号驱动扬声器发出声音。而经过音效算法之后处理的多媒体文件为数字信号，则需要将数字化的多媒体文件转换为模拟信号。具体地，智能终端将多媒体文件进行DAC模数转换为模拟信号。

再者，模拟信号的大小满足一定条件时才能够更好的驱动扬声器播放信号。在本实施方式中，可根据扬声器的类型和实际情况选择特定的功放对多媒体文件进行放大，如，为了提高效率，可选择D类功率放大器对多媒体文件进行放大之后，再通过扬声器播放多媒体文件。

区别于现有技术，本实施方式基于人工智能和音效处理技术，从云端搜索下载符合语音信号指令的多媒体文件，并对多媒体文件进行相应的音效算法处理，改善多媒体文件的输出效果。同时，可对语音信号指令进行音效算法处理，使采集到的语音信号指令更完整清晰、易于识别，提升语音识别的准确率，提高用户体验。

参阅图2，图2是本发明智能终端一实施方式的结构示意图。智能终端20包括通信电路21、处理器22和存储器23。其中，通信电路21用于其他终端进行通信，存储器23用于存储处理器22执行的计算机程序以及在执行计算机程序时所产生的中间数据，处理器22执行计算机程序，实现如下任一实施方式中的多媒体文件的获取以及播放方法。

其中，智能终端20包括智能手机、平板电脑以及其他智能设备，比如智能音箱，在此不做限定。

在一个具体的实施方式中，处理器22接收到用户的触发指令之后，判断确定当前网络是否设置成功，如果当前网络设置成功，则根据用户的触发指令对通信通道和对应的设备参数进行配置，响应触发指令并采集用户的语音信号指令。

为了清楚说明本实施方式，在此以长按智能终端20的虚拟Home键触发AI(Artificial Intelligence)功能为例解释说明。

在本实施方式中，当处理器22接收到用户启动AI功能的操作指令之后，判断确定当前网络是否可用，如判断确定智能终端20的wifi网络或无线数据网络是否可用，如果当前网络可用，则通过特定的总线发送相应的命令，如通过I2C总线发送命令给智能终端20的DSP(Digital Signal Processing，数字处理器)进行通信通道配置以及硬件的初始化配置，并通过audio服务启动录音线程。

进一步地，网络配置成功之后，处理器22响应AI功能，开始采集用户的语音信号指令，比如通过麦克风采集用户的语音信号指令。为了达到更好的录音效果，可以多次采集用户的同一语音信号指令。

在一个具体的实施方式中，处理器22按照设定的参数对采集到的语音信号指令进行配置。其中，设定的参数为对语音信号处理时所设定的参数信息，如信号的格式、信号的频率等。

在一个具体的实施方式中，处理器22将配置后的语音信号指令按照设定格式进行处理，并将处理后的语音信号指令发送至云端服务器，以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件。

在一个具体的实施方式中，处理器22接收由云端服务器反馈的多媒体文件。具体地，智能终端20判断确定当前网络是否可用，如智能终端20的wifi网络或无线数据网络是否可用，如果当前网络可用，则通过特定的总线发送相应的命令，如通过I2C总线发送命令给智能终端20的DSP(Digital Signal Processing，数字处理器)进行通信通道配置以及硬件的初始化配置，并通过audio服务启动播放线程。

进一步地，为了避免播放多媒体文件过程中出现卡顿的现象，当网络可用时，处理器22接收多媒体文件，并将多媒体文件按照预设条件以及地址进行存储，在多媒体文件完整存储后，再通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理。

在本实施方式中，处理器22通过socket协议将多媒体文件写至指定的内存空间，写完之后会发送提示消息。处理器22从内存空间中读取多媒体文件，同时启动播放线程。

进一步地，不同类型的多媒体文件所对应匹配的音效算法不相同，为了使多媒体文件的音质更生动、视听体验更佳，处理器22根据多媒体文件的类型确定与其匹配的音效算法。

具体地，处理器22对多媒体文件进行解析，从解析得到的特征信息中获取与多媒体文件相匹配的音效参数。其中，音效参数包括多媒体文件的文件格式、采样率、文件大小、数据位数以及频宽中的至少一个。并将多媒体文件对应的音效参数通过特定的方式发送给DSP，如通过I2C总线发送给DSP，DSP根据接收到音效参数确定与多媒体文件对应的音效算法，并发送调用此音效算法的请求。

处理器22将多媒体文件通过I2C总线烧录到DSP中，加载成功后，通过与多媒体文件对应的音效算法对多媒体文件进行音效处理。

在此，需要说明的是，音效算法存储在智能终端20的文件系统中，有多种不同类型的音效算法，具体包括：信号增强、信号频带拓宽、信号降噪、信号混音、信号动态增益控制。处理器22根据多媒体文件的类型选择相匹配的音效算法，从而使音质更佳，提升用户的视听体验。

在一个具体的实施方式中，处理器22播放处理后的多媒体文件，处理器22将音效算法处理之后的多媒体文件进行模数转换，并通过特定的功放播放模数转换后的多媒体文件。

在本实施方式中，处理器22通过扬声器播放多媒体文件，需要模拟信号驱动扬声器发出声音。而经过音效算法之后处理的多媒体文件为数字信号，则需要将数字化的多媒体文件转换为模拟信号。具体地，智处理器22将多媒体文件进行DAC模数转换为模拟信号。

在上述任一实施方式中，存储器23用于存储处理器22执行上述任一实施方式中的多媒体文件的获取以及播放方法的计算机程序以及在执行该计算机程序时所产生的中间数据。中间数据具体的包括：音效算法等。

参阅图3，图3是具有存储功能的装置的一实施方式的结构示意图。在本实施方式中，具有存储功能的装置30中存储有至少一个程序31。程序31用于执行上述任一实施方式中的多媒体文件的获取及播放方法。

其中，具有存储功能的装置30可以是智能终端中的存储芯片、硬盘或者是移动硬盘或者优盘、光盘等其他可读写存储的工具，还可以是服务器等，在此不做具体限定。

多媒体文件的获取及播放方法前述已详尽描述，在此不再赘谈。

以上所述仅为本发明的实施方式，并非因此限制本发明的专利保护范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种多媒体文件的获取及播放方法，其特征在于，所述多媒体文件的获取及播放方法包括：

接收用户触发指令，响应所述触发指令并采集所述用户的语音信号指令；

按照设定参数对所述语音信号指令进行配置；

将配置后的语音信号指令按照设定格式进行音效处理，并将音效处理后的所述语音信号指令发送至云端服务器，以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件；

接收所述多媒体文件，通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理；

播放处理后的所述多媒体文件。

2.根据权利要求1所述的多媒体文件的获取及播放方法，其特征在于，所述接收所述多媒体文件，通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理的步骤具体包括：

接收所述多媒体文件，对所述多媒体文件进行解析；

从解析得到的特征信息中获取与所述多媒体文件相匹配的音效参数，根据所述音效参数确定与所述多媒体文件对应的音效算法；

通过所述与所述多媒体文件对应的音效算法对所述多媒体文件进行音效处理。

3.根据权利要求2所述的多媒体文件的获取及播放方法，其特征在于，所述音效参数包括所述多媒体文件的文件格式、采样率、文件大小、数据位数以及频宽中的至少一个。

4.根据权利要求1所述的多媒体文件的获取及播放方法，其特征在于，所述将配置后的语音信号按照设定格式进行音效处理，并将音效处理后的所述语音信号指令发送至云端服务器，以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件的步骤具体包括：

将配置后的语音信号指令进行频带拓宽处理；

并将频带拓宽后的所述语音信号指令发送至云端服务器，以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件。

5.根据权利要求1所述的多媒体文件的获取及播放方法，其特征在于，所述接收所述多媒体文件，通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理的步骤具体包括：

所述接收所述多媒体文件，将所述多媒体文件按照预设条件以及地址进行存储；

在所述多媒体文件完整存储后，通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理。

6.根据权利要求1所述的多媒体文件的获取以及播放方法，其特征在于，所述按照设定参数对所述语音信号指令进行配置的步骤具体包括：

将所述语音信号指令进行模数转换。

7.根据权利要求1所述的多媒体文件的获取以及播放方法，其特征在于，所述接收用户触发指令的步骤之后，所述响应所述触发指令并采集所述用户的语音信号指令的步骤之前还包括：

判断确定当前网络是否设置成功；

如果当前网络设置成功，根据所述用户触发指令对通信通道进行配置。

8.根据权利要求1所述的多媒体文件的获取以及播放方法，其特征在于，所述播放处理后的所述多媒体文件的步骤具体包括：

将处理后的所述多媒体文件进行模数转换；

通过特定的功放播放所述模数转换后的多媒体文件。

9.一种智能终端，其特征在于，所述智能终端包括通信电路、存储器以及处理器；

所述通信电路用于与其他终端建立连接；

所述存储器用于存储所述处理器执行的计算机程序以及在执行所述计算机程序时所产生的中间数据；

所述处理器执行所述计算机程序时，实现权利要求1-8中任一所述多媒体文件的获取以及播放方法中的步骤。

10.一种具有存储功能的装置，其上存储有程序数据，其特征在于，所述程序能够被执行实现权利要求1-8中任一所述多媒体文件的获取以及播放方法中的步骤。