WO2019047861A1 - 多媒体文件的获取及播放方法以及装置 - Google Patents
多媒体文件的获取及播放方法以及装置 Download PDFInfo
- Publication number
- WO2019047861A1 WO2019047861A1 PCT/CN2018/104204 CN2018104204W WO2019047861A1 WO 2019047861 A1 WO2019047861 A1 WO 2019047861A1 CN 2018104204 W CN2018104204 W CN 2018104204W WO 2019047861 A1 WO2019047861 A1 WO 2019047861A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- multimedia file
- voice signal
- sound effect
- instruction
- cloud server
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10009—Improvement or modification of read or write signals
- G11B20/10018—Improvement or modification of read or write signals analog processing for digital recording or reproduction
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种多媒体文件的获取及播放方法以及装置,该方法包括:接收用户触发指令,响应触发指令并采集用户的语音信号指令;按照设定参数对语音信号指令进行配置;将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件;接收多媒体文件,通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理;播放处理后的多媒体文件。通过上述方法,提升语音识别的准确率,改善多媒体文件的输出效果,提高用户体验。
Description
本发明涉及智能终端领域,特别是涉及一种多媒体文件的获取及播放方法以及装置。
互联网技术以及与电子技术的结合程度越来越高,智能终端的功能越来越多样化,同时用户对智能终端产品智能化、人性化的要求也越来越高,特别是,人们希望能够更方便的搜索到喜欢的音视频,比如各种音频文件,并追求更好的音质效果。
为了达到更好的音质效果,很多产品选择使用性能优质的器件,改善音质,但是此方法设计的产品成本的较高,而且需要耗费大量的人力物力进行音频指标测试。再者,目前业内基本上是把提升音质的器件设置在智能终端设备上,比如,通过智能终端的双喇叭输出,智能终端一般都比较轻薄,使得喇叭的尺寸收到限制,一般薄且小,从而使动圈的材料以及绕线工艺上都有限制,造成功率输出有限,音质不佳;另一方面,声腔结构的设计也受到智能终端的限制,造成了音质效果较差。
另外,为了更方便的搜索到喜欢的音视频,一般会通过文字搜索或语音搜索,当采用语音搜索时,采集到的语音经常会有损失,识别的出错率较高,影响用户体验。
【发明内容】
本发明主要解决的技术问题是提供一种多媒体文件的获取及播放方法以及装置,提升语音识别的准确率,同时可改善多媒体文件的输出效果,提高用户体验。
为解决上述技术问题,本发明采用的第一个技术方案是:提供一种具有存储功能的装置,其上存储有程序数据,其中,程序能够被执行实现如下操作:接收用户触发指令,响应触发指令并采集用户的语音信号 指令;按照设定参数对语音信号指令进行配置,其中,将语音信号指令进行模数转换;将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件;接收多媒体文件,通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理;播放处理后的多媒体文件,其中,将处理后的多媒体文件进行模数转换,通过特定的功放播放模数转换后的多媒体文件。
为解决上述技术问题,本发明采用的第二个技术方案是:提供一种智能终端,其中,智能终端包括通信电路、存储器以及处理器;通信电路用于与其他终端建立连接;存储器用于存储处理器执行的计算机程序以及在执行计算机程序时所产生的中间数据;处理器执行计算机程序时,实现如下步骤:接收用户触发指令,响应触发指令并采集用户的语音信号指令;按照设定参数对语音信号指令进行配置;将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件;接收多媒体文件,通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理;播放处理后的多媒体文件。
为解决上述技术问题,本发明采用的第三个技术方案是:提供一种多媒体文件的获取及播放方法,所述多媒体文件的获取及播放方法包括:接收用户触发指令,响应所述触发指令并采集所述用户的语音信号指令;按照设定参数对所述语音信号指令进行配置;将配置后的语音信号指令按照设定格式进行处理,并将处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件;接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理;播放处理后的所述多媒体文件。
本发明的有益效果是:本发明基于人工智能和音效处理技术,从云端搜索下载符合语音信号指令的多媒体文件,并对多媒体文件进行相应 的音效算法处理,改善多媒体文件的输出效果。同时,可对语音信号指令进行音效算法处理,使采集到的语音信号指令更完整清晰、易于识别,提升语音识别的准确率,提高用户体验。
图1是本发明多媒体文件的获取及播放方法一实施方式的流程示意图;
图2是本发明智能终端一实施方式的结构示意图;
图3是本发明具有存储功能的装置一实施方式的结构示意图。
本发明提供一种多媒体文件的获取及播放方法和装置,为使本发明的目的、技术方案和技术效果更加明确、清楚,以下对本发明进一步详细说明,应当理解此处所描述的具体实施条例仅用于解释本发明,并不用于限定本发明。
参阅图1,图1是本发明多媒体文件的获取及播放方法一实施方式的流程示意图。本实施方式的多媒体文件的获取及播放方法包括:
101:接收用户触发指令,响应触发指令并采集用户的语音信号指令。
在一个具体的实施方式中,智能终端接收到用户的触发指令之后,判断确定当前网络是否设置成功,如果当前网络设置成功,则根据用户的触发指令对通信通道和对应的设备参数进行配置,响应触发指令并采集用户的语音信号指令。
其中,智能终端包括智能手机、平板电脑以及其他智能设备,比如智能音箱,在此不做限定。
其中,触发指令为用户通过特定方式发出的操作指令,包括通过交互动作,如特定的物理按键或虚拟按键,触控输入或界面输入发出操作指令。
为了清楚说明本实施方式,在此以长按智能终端的虚拟Home键触 发AI(Artificial Intelligence)功能为例解释说明。
在本实施方式中,当智能终端接收到用户启动AI功能的操作指令之后,判断确定当前网络是否可用,如判断确定智能终端的wifi网络或无线数据网络是否可用,如果当前网络可用,则通过特定的总线发送相应的命令,如通过I2C总线发送命令给智能终端的DSP(Digital Signal Processing,数字处理器)进行通信通道配置以及硬件的初始化配置,并通过audio服务启动录音线程。
如果当前网络不可用,则提醒用户当前网络不可用并提示用户设置网络,如弹出对话框提醒用户或语音提醒用户。
进一步地,网络配置成功之后,智能终端响应AI功能,开始采集用户的语音信号指令,比如通过麦克风采集用户的语音信号指令。为了达到更好的录音效果,可以多次采集用户的同一语音信号指令。
102:按照设定参数对语音信号指令进行配置。
在一个具体的实施方式中,智能终端按照设定的参数对采集到的语音信号指令进行配置。其中,设定的参数为对语音信号处理时所设定的参数信息,如信号的格式、信号的频率等。
具体地,采集到的语音信号是模拟信号,需要经过抽样、量化、编码转换为数字信号。如通过PCM(Pulse Code Modulation,脉冲编码调制)对语音信号指令进行处理。即可以通过ADC模数转换处理采集到的语音信号指令,实现模拟信号的数字化。
103:将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件。
在一个具体的实施方式中,将配置后的语音信号指令按照设定格式进行处理,并将处理后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件。
通常,语音信号指令的频宽一般在1Khz~8Khz之间,在采集语音信号和模数转换语音信号的过程中,相对于原始的语音信号来讲会有信号损失和音质损耗情况的发生。为了使语音信号更完整真实、识别率更高, 根据语音信号的特点进行相应的修复。在其中的一个实施方式中,对语音信号指令进行频带拓宽处理,比如将语音信号的带宽从8Khz修复成16KHz,从而可以弥补损失的语音信号。可选地,也可以对语音信号指令进行混音处理。
在本实施方式中,将处理之后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与其相匹配的多媒体文件。其中,多媒体文件包括音乐文件、视频文件。
比如,语音信号指令包含歌名或一段歌词或歌手的名字,则云端服务器解析此语音信号指令,根据语音信号指令中的歌名或一段歌词或歌手的名字获取与此语音文件信号指令相匹配的多媒体文件。
104:接收多媒体文件,通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理。
在一个具体的实施方式中,智能终端接收由云端服务器反馈的多媒体文件。具体地,智能终端判断确定当前网络是否可用,如智能终端的wifi网络或无线数据网络是否可用,如果当前网络可用,则通过特定的总线发送相应的命令,如通过I2C总线发送命令给智能终端的DSP(Digital Signal Processing,数字处理器)进行通信通道配置以及硬件的初始化配置,并通过audio服务启动播放线程。
如果当前网络不可用,则提醒用户当前网络不可用并提示用户设置网络,如弹出对话框提醒用户或语音提醒用户。
进一步地,为了避免播放多媒体文件过程中出现卡顿的现象,当网络可用时,智能终端接收多媒体文件,并将多媒体文件按照预设条件以及地址进行存储,在多媒体文件完整存储后,再通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理。
在本实施方式中,智能终端通过socket协议将多媒体文件写至指定的内存空间,写完之后会发送提示消息。智能终端从内存空间中读取多媒体文件,同时启动播放线程。
进一步地,不同类型的多媒体文件所对应匹配的音效算法不相同,为了使多媒体文件的音质更生动、视听体验更佳,智能终端根据多媒体 文件的类型确定与其匹配的音效算法。
具体地,智能终端对多媒体文件进行解析,从解析得到的特征信息中获取与多媒体文件相匹配的音效参数。其中,音效参数包括多媒体文件的文件格式、采样率、文件大小、数据位数以及频宽中的至少一个。并将多媒体文件对应的音效参数通过特定的方式发送给DSP,如通过I2C总线发送给DSP,DSP根据接收到音效参数确定与多媒体文件对应的音效算法,并智能终端发送调用此音效算法的请求。
智能终端将多媒体文件通过I2C总线烧录到DSP中,加载成功后,通过与多媒体文件对应的音效算法对多媒体文件进行音效处理。
在此,需要说明的是,音效算法存储在智能终端的文件系统中,有多种不同类型的音效算法,具体包括:信号增强、信号频带拓宽、信号降噪、信号混音、信号动态增益控制。智能终端根据多媒体文件的类型选择相匹配的音效算法,从而使音质更佳,提升用户的视听体验。
105:播放处理后的多媒体文件。
在一个具体的实施方式中,智能终端播放处理后的多媒体文件,智能终端将音效算法处理之后的多媒体文件进行模数转换,并通过特定的功放播放模数转换后的多媒体文件。
在本实施方式中,智能终端通过扬声器播放多媒体文件,需要模拟信号驱动扬声器发出声音。而经过音效算法之后处理的多媒体文件为数字信号,则需要将数字化的多媒体文件转换为模拟信号。具体地,智能终端将多媒体文件进行DAC模数转换为模拟信号。
再者,模拟信号的大小满足一定条件时才能够更好的驱动扬声器播放信号。在本实施方式中,可根据扬声器的类型和实际情况选择特定的功放对多媒体文件进行放大,如,为了提高效率,可选择D类功率放大器对多媒体文件进行放大之后,再通过扬声器播放多媒体文件。
区别于现有技术,本实施方式基于人工智能和音效处理技术,从云端搜索下载符合语音信号指令的多媒体文件,并对多媒体文件进行相应的音效算法处理,改善多媒体文件的输出效果。同时,可对语音信号指令进行音效算法处理,使采集到的语音信号指令更完整清晰、易于识别, 提升语音识别的准确率,提高用户体验。
参阅图2,图2是本发明智能终端一实施方式的结构示意图。智能终端20包括通信电路21、处理器22和存储器23。其中,通信电路21用于其他终端进行通信,存储器23用于存储处理器22执行的计算机程序以及在执行计算机程序时所产生的中间数据,处理器22执行计算机程序,实现如下任一实施方式中的多媒体文件的获取以及播放方法。
其中,智能终端20包括智能手机、平板电脑以及其他智能设备,比如智能音箱,在此不做限定。
在一个具体的实施方式中,处理器22接收到用户的触发指令之后,判断确定当前网络是否设置成功,如果当前网络设置成功,则根据用户的触发指令对通信通道和对应的设备参数进行配置,响应触发指令并采集用户的语音信号指令。
其中,触发指令为用户通过特定方式发出的操作指令,包括通过交互动作,如特定的物理按键或虚拟按键,触控输入或界面输入发出操作指令。
为了清楚说明本实施方式,在此以长按智能终端20的虚拟Home键触发AI(Artificial Intelligence)功能为例解释说明。
在本实施方式中,当处理器22接收到用户启动AI功能的操作指令之后,判断确定当前网络是否可用,如判断确定智能终端20的wifi网络或无线数据网络是否可用,如果当前网络可用,则通过特定的总线发送相应的命令,如通过I2C总线发送命令给智能终端20的DSP(Digital Signal Processing,数字处理器)进行通信通道配置以及硬件的初始化配置,并通过audio服务启动录音线程。
如果当前网络不可用,则提醒用户当前网络不可用并提示用户设置网络,如弹出对话框提醒用户或语音提醒用户。
进一步地,网络配置成功之后,处理器22响应AI功能,开始采集用户的语音信号指令,比如通过麦克风采集用户的语音信号指令。为了达到更好的录音效果,可以多次采集用户的同一语音信号指令。
在一个具体的实施方式中,处理器22按照设定的参数对采集到的 语音信号指令进行配置。其中,设定的参数为对语音信号处理时所设定的参数信息,如信号的格式、信号的频率等。
具体地,采集到的语音信号是模拟信号,需要经过抽样、量化、编码转换为数字信号。如通过PCM(Pulse Code Modulation,脉冲编码调制)对语音信号指令进行处理。即可以通过ADC模数转换处理采集到的语音信号指令,实现模拟信号的数字化。
在一个具体的实施方式中,处理器22将配置后的语音信号指令按照设定格式进行处理,并将处理后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与语音信号指令相匹配的多媒体文件。
通常,语音信号指令的频宽一般在1Khz~8Khz之间,在采集语音信号和模数转换语音信号的过程中,相对于原始的语音信号来讲会有信号损失和音质损耗情况的发生。为了使语音信号更完整真实、识别率更高,根据语音信号的特点进行相应的修复。在其中的一个实施方式中,对语音信号指令进行频带拓宽处理,比如将语音信号的带宽从8Khz修复成16KHz,从而可以弥补损失的语音信号。可选地,也可以对语音信号指令进行混音处理。
在本实施方式中,将处理之后的语音信号指令发送至云端服务器,以使云端服务器根据语音信号指令获取与其相匹配的多媒体文件。其中,多媒体文件包括音乐文件、视频文件。
比如,语音信号指令包含歌名或一段歌词或歌手的名字,则云端服务器解析此语音信号指令,根据语音信号指令中的歌名或一段歌词或歌手的名字获取与此语音文件信号指令相匹配的多媒体文件。
在一个具体的实施方式中,处理器22接收由云端服务器反馈的多媒体文件。具体地,智能终端20判断确定当前网络是否可用,如智能终端20的wifi网络或无线数据网络是否可用,如果当前网络可用,则通过特定的总线发送相应的命令,如通过I2C总线发送命令给智能终端20的DSP(Digital Signal Processing,数字处理器)进行通信通道配置以及硬件的初始化配置,并通过audio服务启动播放线程。
如果当前网络不可用,则提醒用户当前网络不可用并提示用户设置网络,如弹出对话框提醒用户或语音提醒用户。
进一步地,为了避免播放多媒体文件过程中出现卡顿的现象,当网络可用时,处理器22接收多媒体文件,并将多媒体文件按照预设条件以及地址进行存储,在多媒体文件完整存储后,再通过与多媒体文件类型相匹配的音效算法对多媒体文件进行音效处理。
在本实施方式中,处理器22通过socket协议将多媒体文件写至指定的内存空间,写完之后会发送提示消息。处理器22从内存空间中读取多媒体文件,同时启动播放线程。
进一步地,不同类型的多媒体文件所对应匹配的音效算法不相同,为了使多媒体文件的音质更生动、视听体验更佳,处理器22根据多媒体文件的类型确定与其匹配的音效算法。
具体地,处理器22对多媒体文件进行解析,从解析得到的特征信息中获取与多媒体文件相匹配的音效参数。其中,音效参数包括多媒体文件的文件格式、采样率、文件大小、数据位数以及频宽中的至少一个。并将多媒体文件对应的音效参数通过特定的方式发送给DSP,如通过I2C总线发送给DSP,DSP根据接收到音效参数确定与多媒体文件对应的音效算法,并发送调用此音效算法的请求。
处理器22将多媒体文件通过I2C总线烧录到DSP中,加载成功后,通过与多媒体文件对应的音效算法对多媒体文件进行音效处理。
在此,需要说明的是,音效算法存储在智能终端20的文件系统中,有多种不同类型的音效算法,具体包括:信号增强、信号频带拓宽、信号降噪、信号混音、信号动态增益控制。处理器22根据多媒体文件的类型选择相匹配的音效算法,从而使音质更佳,提升用户的视听体验。
在一个具体的实施方式中,处理器22播放处理后的多媒体文件,处理器22将音效算法处理之后的多媒体文件进行模数转换,并通过特定的功放播放模数转换后的多媒体文件。
在本实施方式中,处理器22通过扬声器播放多媒体文件,需要模拟信号驱动扬声器发出声音。而经过音效算法之后处理的多媒体文件为 数字信号,则需要将数字化的多媒体文件转换为模拟信号。具体地,智处理器22将多媒体文件进行DAC模数转换为模拟信号。
再者,模拟信号的大小满足一定条件时才能够更好的驱动扬声器播放信号。在本实施方式中,可根据扬声器的类型和实际情况选择特定的功放对多媒体文件进行放大,如,为了提高效率,可选择D类功率放大器对多媒体文件进行放大之后,再通过扬声器播放多媒体文件。
在上述任一实施方式中,存储器23用于存储处理器22执行上述任一实施方式中的多媒体文件的获取以及播放方法的计算机程序以及在执行该计算机程序时所产生的中间数据。中间数据具体的包括:音效算法等。
区别于现有技术,本实施方式基于人工智能和音效处理技术,从云端搜索下载符合语音信号指令的多媒体文件,并对多媒体文件进行相应的音效算法处理,改善多媒体文件的输出效果。同时,可对语音信号指令进行音效算法处理,使采集到的语音信号指令更完整清晰、易于识别,提升语音识别的准确率,提高用户体验。
参阅图3,图3是具有存储功能的装置的一实施方式的结构示意图。在本实施方式中,具有存储功能的装置30中存储有至少一个程序31。程序31用于执行上述任一实施方式中的多媒体文件的获取及播放方法。
其中,具有存储功能的装置30可以是智能终端中的存储芯片、硬盘或者是移动硬盘或者优盘、光盘等其他可读写存储的工具,还可以是服务器等,在此不做具体限定。
多媒体文件的获取及播放方法前述已详尽描述,在此不再赘谈。
区别于现有技术,本实施方式基于人工智能和音效处理技术,从云端搜索下载符合语音信号指令的多媒体文件,并对多媒体文件进行相应的音效算法处理,改善多媒体文件的输出效果。同时,可对语音信号指令进行音效算法处理,使采集到的语音信号指令更完整清晰、易于识别,提升语音识别的准确率,提高用户体验。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变 换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (20)
- 一种具有存储功能的装置,其上存储有程序数据,其中,所述程序能够被执行实现如下操作:接收用户触发指令,响应所述触发指令并采集所述用户的语音信号指令;按照设定参数对所述语音信号指令进行配置,其中,将所述语音信号指令进行模数转换;将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件;接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理;播放处理后的所述多媒体文件,其中,将处理后的所述多媒体文件进行模数转换,通过特定的功放播放所述模数转换后的多媒体文件。
- 根据权利要求1所述的装置,其中,所述程序数据还能够被执行以实现如下操作:接收所述多媒体文件,对所述多媒体文件进行解析;从解析得到的特征信息中获取与所述多媒体文件相匹配的音效参数,根据所述音效参数确定与所述多媒体文件对应的音效算法;通过所述与所述多媒体文件对应的音效算法对所述多媒体文件进行音效处理。
- 根据权利要求2所述的装置,其中,所述音效参数包括所述多媒体文件的文件格式、采样率、文件大小、数据位数以及频宽中的至少一个。
- 根据权利要求1所述的装置,其中,所述程序数据还能够被执行以实现如下操作:将配置后的语音信号指令进行频带拓宽处理;并将频带拓宽后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件。
- 一种智能终端,其中,所述智能终端包括通信电路、存储器以及处理器;所述通信电路用于与其他终端建立连接;所述存储器用于存储所述处理器执行的计算机程序以及在执行所述计算机 程序时所产生的中间数据;所述处理器执行所述计算机程序时,实现如下步骤:接收用户触发指令,响应所述触发指令并采集所述用户的语音信号指令;按照设定参数对所述语音信号指令进行配置;将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件;接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理;播放处理后的所述多媒体文件。
- 根据权利要求5所述的智能终端,其中,所述处理器执行的所述接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理的步骤具体包括:接收所述多媒体文件,对所述多媒体文件进行解析;从解析得到的特征信息中获取与所述多媒体文件相匹配的音效参数,根据所述音效参数确定与所述多媒体文件对应的音效算法;通过所述与所述多媒体文件对应的音效算法对所述多媒体文件进行音效处理。
- 根据权利要求6所述的智能终端,其中,所述音效参数包括所述多媒体文件的文件格式、采样率、文件大小、数据位数以及频宽中的至少一个。
- 根据权利要求5所述的智能终端,其中,所述处理器执行的所述将配置后的语音信号按照设定格式进行音效处理,并将音效处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件的步骤具体包括:将配置后的语音信号指令进行频带拓宽处理;并将频带拓宽后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件。
- 根据权利要求5所述的智能终端,其中,所述处理器执行的所述接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理的步骤具体包括:所述接收所述多媒体文件,将所述多媒体文件按照预设条件以及地址进行 存储;在所述多媒体文件完整存储后,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理。
- 根据权利要求5所述的智能终端,其中,所述处理器执行的所述按照设定参数对所述语音信号指令进行配置的步骤具体包括:将所述语音信号指令进行模数转换。
- 根据权利要求5所述的智能终端,其中,所述处理器执行的所述接收用户触发指令的步骤之后,所述响应所述触发指令并采集所述用户的语音信号指令的步骤之前还包括:判断确定当前网络是否设置成功;如果当前网络设置成功,根据所述用户触发指令对通信通道进行配置。
- 根据权利要求5所述的智能终端,其中,所述处理器执行的所述播放处理后的所述多媒体文件的步骤具体包括:将处理后的所述多媒体文件进行模数转换;通过特定的功放播放所述模数转换后的多媒体文件。
- 一种多媒体文件的获取及播放方法,其中,所述多媒体文件的获取及播放方法包括:接收用户触发指令,响应所述触发指令并采集所述用户的语音信号指令;按照设定参数对所述语音信号指令进行配置;将配置后的语音信号指令按照设定格式进行音效处理,并将音效处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件;接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理;播放处理后的所述多媒体文件。
- 根据权利要求13所述的多媒体文件的获取及播放方法,其中,所述接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理的步骤具体包括:接收所述多媒体文件,对所述多媒体文件进行解析;从解析得到的特征信息中获取与所述多媒体文件相匹配的音效参数,根据所述音效参数确定与所述多媒体文件对应的音效算法;通过所述与所述多媒体文件对应的音效算法对所述多媒体文件进行音效处理。
- 根据权利要求14所述的多媒体文件的获取及播放方法,其中,所述音效参数包括所述多媒体文件的文件格式、采样率、文件大小、数据位数以及频宽中的至少一个。
- 根据权利要求13所述的多媒体文件的获取及播放方法,其中,所述将配置后的语音信号按照设定格式进行音效处理,并将音效处理后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件的步骤具体包括:将配置后的语音信号指令进行频带拓宽处理;并将频带拓宽后的所述语音信号指令发送至云端服务器,以使所述云端服务器根据所述语音信号指令获取与所述语音信号指令相匹配的多媒体文件。
- 根据权利要求13所述的多媒体文件的获取及播放方法,其中,所述接收所述多媒体文件,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理的步骤具体包括:所述接收所述多媒体文件,将所述多媒体文件按照预设条件以及地址进行存储;在所述多媒体文件完整存储后,通过与所述多媒体文件类型相匹配的音效算法对所述多媒体文件进行音效处理。
- 根据权利要求13所述的多媒体文件的获取以及播放方法,其中,所述按照设定参数对所述语音信号指令进行配置的步骤具体包括:将所述语音信号指令进行模数转换。
- 根据权利要求13所述的多媒体文件的获取以及播放方法,其中,所述接收用户触发指令的步骤之后,所述响应所述触发指令并采集所述用户的语音信号指令的步骤之前还包括:判断确定当前网络是否设置成功;如果当前网络设置成功,根据所述用户触发指令对通信通道进行配置。
- 根据权利要求13所述的多媒体文件的获取以及播放方法,其中,所述播放处理后的所述多媒体文件的步骤具体包括:将处理后的所述多媒体文件进行模数转换;通过特定的功放播放所述模数转换后的多媒体文件。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710794897.3 | 2017-09-05 | ||
CN201710794897.3A CN107656977A (zh) | 2017-09-05 | 2017-09-05 | 多媒体文件的获取及播放方法以及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2019047861A1 true WO2019047861A1 (zh) | 2019-03-14 |
Family
ID=61129317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2018/104204 WO2019047861A1 (zh) | 2017-09-05 | 2018-09-05 | 多媒体文件的获取及播放方法以及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107656977A (zh) |
WO (1) | WO2019047861A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112530447A (zh) * | 2019-08-30 | 2021-03-19 | 青岛海信移动通信技术股份有限公司 | 一种语音数据处理方法及通信终端 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107656977A (zh) * | 2017-09-05 | 2018-02-02 | 捷开通讯(深圳)有限公司 | 多媒体文件的获取及播放方法以及装置 |
CN108471542B (zh) * | 2018-03-27 | 2020-11-06 | 南京创维信息技术研究院有限公司 | 基于智能音箱的影视资源播放方法、智能音箱及存储介质 |
CN109739354B (zh) * | 2018-12-28 | 2022-08-05 | 广州励丰文化科技股份有限公司 | 一种基于声音的多媒体交互方法及装置 |
CN110750499A (zh) * | 2019-09-03 | 2020-02-04 | 江苏遨信科技有限公司 | 一种收纳与智能检索播放多媒体文件的管理方法及其系统 |
CN113220913A (zh) * | 2020-02-04 | 2021-08-06 | 阿里巴巴集团控股有限公司 | 多媒体文件处理方法、装置和交互系统 |
CN111863041B (zh) * | 2020-07-17 | 2021-08-31 | 东软集团股份有限公司 | 一种声音信号处理方法、装置及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693722A (zh) * | 2012-05-23 | 2012-09-26 | Tcl集团股份有限公司 | 一种语音识别的方法、装置及数字电视 |
CN102945672A (zh) * | 2012-09-29 | 2013-02-27 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
CN202796043U (zh) * | 2012-09-07 | 2013-03-13 | 四川长虹电器股份有限公司 | 一种语音识别系统 |
CN103648051A (zh) * | 2013-12-23 | 2014-03-19 | 乐视致新电子科技(天津)有限公司 | 搜索智能电视播放的视频文件的方法及装置 |
CN107656977A (zh) * | 2017-09-05 | 2018-02-02 | 捷开通讯(深圳)有限公司 | 多媒体文件的获取及播放方法以及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8340974B2 (en) * | 2008-12-30 | 2012-12-25 | Motorola Mobility Llc | Device, system and method for providing targeted advertisements and content based on user speech data |
CN103902373B (zh) * | 2014-04-02 | 2017-09-29 | 百度在线网络技术(北京)有限公司 | 智能终端控制方法、服务器和智能终端 |
CN104934048A (zh) * | 2015-06-24 | 2015-09-23 | 小米科技有限责任公司 | 音效调节方法及装置 |
CN105719646A (zh) * | 2016-01-22 | 2016-06-29 | 史唯廷 | 语音控制音乐播放方法及语音控制音乐播放装置 |
CN105959438A (zh) * | 2016-07-06 | 2016-09-21 | 惠州Tcl移动通信有限公司 | 一种音频多通路输出扬声器的处理方法、系统及手机 |
-
2017
- 2017-09-05 CN CN201710794897.3A patent/CN107656977A/zh active Pending
-
2018
- 2018-09-05 WO PCT/CN2018/104204 patent/WO2019047861A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693722A (zh) * | 2012-05-23 | 2012-09-26 | Tcl集团股份有限公司 | 一种语音识别的方法、装置及数字电视 |
CN202796043U (zh) * | 2012-09-07 | 2013-03-13 | 四川长虹电器股份有限公司 | 一种语音识别系统 |
CN102945672A (zh) * | 2012-09-29 | 2013-02-27 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
CN103648051A (zh) * | 2013-12-23 | 2014-03-19 | 乐视致新电子科技(天津)有限公司 | 搜索智能电视播放的视频文件的方法及装置 |
CN107656977A (zh) * | 2017-09-05 | 2018-02-02 | 捷开通讯(深圳)有限公司 | 多媒体文件的获取及播放方法以及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112530447A (zh) * | 2019-08-30 | 2021-03-19 | 青岛海信移动通信技术股份有限公司 | 一种语音数据处理方法及通信终端 |
Also Published As
Publication number | Publication date |
---|---|
CN107656977A (zh) | 2018-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019047861A1 (zh) | 多媒体文件的获取及播放方法以及装置 | |
CN109473095B (zh) | 一种智能家居控制系统及控制方法 | |
CN107995360B (zh) | 通话处理方法及相关产品 | |
US11516347B2 (en) | Systems and methods to automatically join conference | |
US9824685B2 (en) | Handsfree device with continuous keyword recognition | |
US8472633B2 (en) | Detection of device configuration | |
JP2020526789A (ja) | ラストマイル等化 | |
BR112017021673B1 (pt) | Método de controle de voz, meio não-transitório legível por computador e terminal | |
CN110265030A (zh) | 图像显示设备及控制图像显示设备的方法 | |
WO2016150316A1 (zh) | 音频输出控制方法及装置 | |
WO2015109971A1 (zh) | 智能电视的语音处理方法、处理系统及智能电视 | |
TWI690895B (zh) | 社交應用中擴展內容來源的方法及系統、用戶端和伺服器 | |
WO2019071808A1 (zh) | 视频画面显示的方法、装置、系统、终端设备及存储介质 | |
WO2020114181A1 (zh) | 网络语音识别方法、网络业务交互方法及智能耳机 | |
JP2017138536A (ja) | 音声処理装置 | |
US9230529B2 (en) | Music reproducing apparatus | |
US20160275077A1 (en) | Method and apparatus for automatically sending multimedia file, mobile terminal, and storage medium | |
JP6817386B2 (ja) | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 | |
CN202289477U (zh) | 一种通过无线网络进行语音播放的语音玩具终端设备 | |
CN108184193B (zh) | 蓝牙播放终端的播放控制方法、蓝牙设备和计算机存储介质 | |
CN111556406B (zh) | 音频处理方法、音频处理装置及耳机 | |
CN106464288B (zh) | 一种实现对讲的方法及智能手环 | |
CN109905792A (zh) | 一种具有去人声功能的无线k歌耳机 | |
CN111145741B (zh) | 多媒体内容的提供方法、装置、电子设备以及存储介质 | |
JP6610195B2 (ja) | 端末装置、通信方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 18853470 Country of ref document: EP Kind code of ref document: A1 |