CN112866770B - 一种设备控制方法、装置、电子设备及存储介质 - Google Patents

一种设备控制方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112866770B
CN112866770B CN202011625269.0A CN202011625269A CN112866770B CN 112866770 B CN112866770 B CN 112866770B CN 202011625269 A CN202011625269 A CN 202011625269A CN 112866770 B CN112866770 B CN 112866770B
Authority
CN
China
Prior art keywords
target
point
information
peak
target peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011625269.0A
Other languages
English (en)
Other versions
CN112866770A (zh
Inventor
刘阳
刘长滔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202011625269.0A priority Critical patent/CN112866770B/zh
Publication of CN112866770A publication Critical patent/CN112866770A/zh
Application granted granted Critical
Publication of CN112866770B publication Critical patent/CN112866770B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams

Abstract

本发明实施例提供了一种设备控制方法、装置、电子设备及存储介质,应用于计算机技术领域,该设备控制方法包括:从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;获取所述目标音频的节奏特征信息;基于所述节奏特征信息,生成所述目标音频对应的控制信息;在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动。本方案在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动,使得多媒体数据的播放形式更加丰富新型。可以解决多媒体数据播放时,用户所能体验的维度较为单一且传统的问题。

Description

一种设备控制方法、装置、电子设备及存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及一种设备控制方法、装置、电子设备及存储介质。
背景技术
通过移动终端播放多媒体数据,例如:通过智能手机播放视频客户端所提供的视频,已成为人们生活中的必不可少的休闲消遣方式。其中,移动终端的类型可以包括智能手机、平板电脑等。
相关技术中,多媒体数据的播放过程,仅能给用户带来视觉和/或听觉上的体验,使得在播放过程中,用户所能体验的维度较为单一且传统,已无法满足用户对于播放体验的需求。
发明内容
本发明实施例的目的在于提供一种设备控制方法、装置、电子设备及存储介质,以解决相关技术中多媒体数据播放时,用户所能体验的维度较为单一且传统的问题。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种设备控制方法,包括:
从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;
获取所述目标音频的节奏特征信息;
基于所述节奏特征信息,生成所述目标音频对应的控制信息;其中,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;
在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动。
可选地,所述控制信息包括至少一个互动时间点和每一互动时间点下待进行的互动事件的参数信息;
所述在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动,包括:在所述移动终端播放所述目标多媒体数据的过程中,当检测到播放至每一互动时间点时,控制所述移动终端按照该互动时间点下待进行的互动事件的参数信息,执行互动事件。
可选地,所述互动事件包括震动事件和/或灯光闪烁事件;所述震动事件的参数信息包括震动时间参数和/或震动方式参数;所述灯光闪烁事件的参数信息包括:闪烁时间参数和/或闪烁方式参数。
可选地,所述获取所述目标音频的节奏特征信息,包括:
对所述目标音频的音频信号进行频域分析,得到频谱信息;
从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点,并将所述至少一个目标峰值点的峰值和对应的频谱信息,作为所述目标音频的节奏特征信息。
可选地,所述基于所述节奏特征信息,生成所述目标音频对应的控制信息,包括:
针对所述节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点,并利用该目标峰值点的指定信息,确定该目标峰值点对应的互动时间点下待进行的互动事件的参数信息;
其中,所述指定信息包括峰值和/或与相邻的下一目标峰值点所间隔的时长,所述与相邻的下一目标峰值点所间隔的时长为利用该目标峰值点对应的频谱信息和所述下一目标峰值点所对应的频谱信息所确定的时长。
可选地,所述利用该目标峰值点的指定信息,确定该目标峰值点对应的互动时间点下待进行的互动事件的参数信息,包括:
从关于峰值点的指定信息和所述互动事件的参数信息的对应关系中,确定与该目标峰值点的指定信息对应的参数信息,作为该目标峰值点对应的互动时间点下待进行的互动事件的参数信息。
可选地,针对所述节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点之前,所述方法还包括:
针对满足预定增设条件的相邻两个目标峰值点,从所述频谱信息的位于该相邻两个目标峰值点之间的峰值点中,确定峰值高于第二预定阈值的峰值点,作为目标峰值点;
其中,所述预定增设条件包括:所间隔的时长大于第一时长阈值,所述第二预定阈值小于所述第一预定阈值。
可选地,针对所述节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点之前,所述方法还包括:
从所确定的目标峰值点中,剔除满足预定剔除条件的目标峰值点;其中,所述预定剔除条件包括:与相邻的上一目标峰值点所间隔的时长小于第二时长阈值,和/或,峰值归一化后的值小于第三预定阈值。
可选地,所述从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点,包括:
采用预设的峰值计算公式,确定所述频谱信息的多个峰值点;
从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点;
所述预设的峰值计算公式包括:
其中,Wk=|k|,Wk为第k个频点对应的频率权重,N为采样点个数,Xk(n)用于表征目标音频的频谱信息。
在本发明实施的第二方面,还提供了一种设备控制装置,包括:
音频提取模块,用于从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;
特征获取模块,用于获取所述目标音频的节奏特征信息;
信息生成模块,用于基于所述节奏特征信息,生成所述目标音频对应的控制信息;其中,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;
互动控制模块,用于在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动。
在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的设备控制方法步骤。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的设备控制方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的设备控制方法。
本发明实施例提供的方案,从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;获取所述目标音频的节奏特征信息;基于所述节奏特征信息,生成所述目标音频对应的控制信息;其中,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动。本方案在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动,使得多媒体数据的播放形式更加丰富新型,且能够给用户带来体感维度的播放体验。可见,本方案可以解决多媒体数据播放时,用户所能体验的维度较为单一且传统的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例中的一种设备控制方法的流程图;
图2为本发明实施例中的目标峰值点对应的时间和峰值的确定过程的流程图;
图3为本发明实施例中的一种设备控制装置的结构示意图;
图4为本发明实施例中的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
需要说明的是,本发明实施例提供的一种设备控制方法应用于电子设备,该电子设备可以为运行有多媒体客户端的任一移动终端,也可以为多媒体客户端对应的服务器。在实际应用中,该移动终端可以为:智能手机、平板电脑等等。
具体而言,该设备控制方法的执行主体可以为设备控制装置。示例性的,当该设备控制方法应用于移动终端时,该设备控制装置可以为运行于移动终端中的多媒体播放客户端,例如:视频客户端、音频客户端等;当然,该设备控制装置也可以为多媒体播放客户端中的插件程序,这都是合理的。示例性的,当该设备控制方法应用于服务器时,该设备控制装置可以为运行于服务器中的计算机程序。
此外,本发明实施例中所涉及的多媒体数据可以包括视频或者音频等等,并且,该多媒体数据可以为移动终端的本地多媒体数据,也可以为在线多媒体数据。此外,该多媒体数据中存在至少一段音乐内容,该至少一段音乐内容中,可以包含至少一个音乐区间,各音乐区间可以为连续的,也可以为间隔一定时长的,每一音乐区间中可以存在一定时长的音乐,该一定时长的音乐可以包括一个或多个音乐节拍。各音乐区间可以由现有的音乐识别软件来确定,也可以根据需要通过人工剪辑确定,在此不做限定。示例性的,假设多媒体数据为一段长度为2小时的视频,在该2小时内,第10-30分钟、第50-75分钟分别存在一段音乐内容,那么,该第10-30分钟和第50-75分钟的两个时间段分别可以被作为该多媒体数据的一个音乐区间。
其中,本发明实施例所提供的一种设备控制方法,包括:
从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;
获取所述目标音频的节奏特征信息;
基于所述节奏特征信息,生成所述目标音频对应的控制信息;其中,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;
在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动。
本发明实施例提供的方案,从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;获取所述目标音频的节奏特征信息;基于所述节奏特征信息,生成所述目标音频对应的控制信息;其中,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动。本方案在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动,使得多媒体数据的播放形式更加丰富新型,且能够给用户带来体感维度的播放体验。可见,本方案可以解决多媒体数据播放时,用户所能体验的维度较为单一且传统的问题。
下面结合图1,对本发明实施例所提供的一种设备控制方法进行详细介绍。
需要说明的是,多媒体数据可以包括一个或多个音乐区间,针对每个音乐区间的处理过程可以相同。下面以一个音乐区间为例,对本发明实施例所提供的一种设备控制方法进行介绍。
如图1所示,本发明实施例所提供的一种设备控制方法,可以包括:
S101,从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;
可以理解的是,多媒体数据可以包括视频和音频等等,该多媒体数据可以包括至少一个音乐区间,为了方便生成该多媒体数据的控制信息,可以对该多媒体数据的音乐区间的音频进行提取,该多媒体数据的每一音乐区间可以提取至少一个音频,那么,从多媒体数据的音乐区间提取出的任一音频均可以作为目标音频。
此外,多媒体数据的音乐区间可以由人为划分,也可以是基于现有的音频识别软件来确定的。针对由人为划分的音乐区间,使用现有的数据截取软件,从多媒体数据中截取人为确定的音乐区间,从而将所确定的音乐区间的区间信息输入至设备控制装置,从而设备控制装置确定出多媒体数据的音乐区间;针对基于现有的音频识别软件确定的音乐区间,该音频识别软件在接收到识别多媒体数据的音乐区间的请求消息后,对多媒体数据的音乐区间进行识别,并将识别出的音乐区间发送至设备控制装置,从而设备控制装置获知多媒体数据的音乐区间。
可以理解的是,为了方便对目标音频进行后续处理,可以将提取出的目标音频进行转码,并且该目标音频可以转码为任一音频文件格式,例如mp3、wave等等。
此外,为了提高用户体验,可以根据用户的需求,来确定是否执行设备控制过程。在一种实现方式中,移动终端可以为用户提供是否开启设备控制功能的功能开关,该功能开关可以在移动终端的设置界面,也可以设置在该多媒体数据的播放界面。针对功能开关设置在设置界面而言,用户可以在设置界面中开启该功能,这样,在该多媒体数据开始播放时,移动终端便可以触发执行S101;针对功能开关设置在设置界面而言,用户可以在设置界面中开启该功能,这样,在该多媒体数据开始播放时,移动终端便可以触发执行S101。
而在另一种实现方式中,移动终端可以通过请求用户授权的方式来实现设备控制过程。例如:移动终端输出用于引导用户进行授权的提示信息,在用户选择授权时,移动终端可以执行设备控制过程,而在用户未选择授权时,移动终端不执行设备控制过程。其中,提示信息的输出时机可以包括但不局限于:用户请求播放多媒体数据时、在多媒体数据播放过程中。
S102,获取目标音频的节奏特征信息;
可以理解的是,在提取出目标音频后,可以进一步对目标音频的节奏特征信息进行提取,目标音频的节奏特征信息可以包括多个,例如:表征目标音频的节拍/律动的时间点、时间间隔、能量等特征信息。
示例性的,在一种实现方式中,获取目标音频的节奏特征信息,可以包括步骤A-B:
步骤A,对目标音频的音频信号进行频域分析,得到频谱信息;
可以理解的是,不同的乐器、人声可以产生不同频率的音频信号,那么,目标音频中可以包含多种不同频率的音频信号,为了方便对目标音频进行分析,可以对该目标音频的音频信号进行频域分析,从而得到该目标音频对应的频谱信息。其中,频谱信息为该目标音频在频域下的表示,包括该目标音频的音频信号的频率分布,以及各频率的幅度及相位等信息。
示例性的,在一种实现方式中,对该目标音频的音频信号进行频域分析,得到频谱信息可以包括:对该目标音频进行预处理,得到预处理后的目标音频;其中,所述预处理包括预加重处理、分帧处理和加窗处理中的至少一种;对该预处理后的目标音频进行频域分析,得到该目标音频的频谱信息。可以理解的是,为了快速准确的实现对目标音频进行频域分析,可以先对该目标音频进行预处理,该预处理中所包含的预加重处理、分帧处理和加窗处理均可以采用现有技术中的任一种对应的实现方式来实现,在此不做限定。
示例性的,在一种实现方式中,对该预处理后的目标音频进行频域分析,得到该目标音频的频谱信息,可以包括:对预处理后的目标音频,进行短时傅里叶变换,得到该目标音频的频谱信息,该短时傅里叶变换的计算公式可以包括:
其中,Xk(n)用于表征该目标音频的频谱信息,w(m)为窗函数,h为相邻两窗的时移长度,N为采样点个数,m为整数,表示时域中离散的采样点,n为自然数,表示频域中的频点,j表示复数中的虚数部分。
步骤B,从频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点,并将该至少一个目标峰值点的峰值和对应的频谱信息,作为该目标音频的节奏特征信息。
可以理解的是,稳态时,音频信号的能量通常集中在低频段,当音频信号发生瞬时变化或者音乐的节奏发生起伏变化时,例如:打击乐器(如鼓)、歌曲的高音部分等,音频信号的能量会在高频段有明显变化,为了配合音乐节奏的起伏变化,可以基于频谱信号,计算能量发生变化时的峰值。
示例性的,在一种实现方式中,当分析每帧信号的频谱信息时,可以针对该频谱信息中各频点的幅值,按照预设的第一计算公式,以一定的比例进行能量加权,当遇到高频能量瞬变时,该帧通常会产生尖锐的峰值。具体而言,从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点,可以包括:采用预设的峰值计算公式,确定所述频谱信息的多个峰值点;从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点;其中,预设的峰值计算公式包括:
其中,Wk=|k|,Wk为第k个频点对应的频率权重,N为采样点个数,Xk(n)用于表征目标音频的频谱信息。
此外,第一预定阈值可以为人为设置的固定阈值,也可以为基于该多个峰值点的峰值确定的。示例性的,针对基于该多个峰值点的峰值确定的第一预定阈值,可以包括:确定该多个峰值点中的最高峰值,并将该最高峰值乘以预设系数,例如:0.3、0.4等等,将乘以预设系数后的最高峰值,作为第一预定阈值。
S103,基于该节奏特征信息,生成该目标音频对应的控制信息;
其中,该控制信息用于指示移动终端按照该目标音频的节奏进行互动。
为了提高用户的播放体验,在获取到目标音频的节奏特征信息后,可以基于该节奏特征信息,生成用于指示移动终端按照该目标音频的节奏进行互动的控制信息。示例性的,所生成的控制信息可以包括至少一个互动时间点以及每一互动时间点下待进行的互动事件的参数信息等等,其中,每一互动时间点可以为待进行互动的起始时间点。
为了方便生成控制信息,可以预先设置关于节奏特征信息与控制信息的对应关系,示例性的,在一种实现方式中,基于该节奏特征信息,生成该目标音频对应的控制信息,可以包括:根据该节奏特征信息,按照预设的关于节奏特征信息与控制信息的对应关系,生成该目标音频对应的控制信息。为了方案清楚和布局完成,后续结合另一实施例,对基于该节奏特征信息,生成该目标音频对应的控制信息的过程进行介绍。
另外,为了减少对同一目标音频进行相同的处理过程的次数,在生成该目标音频对应的控制信息后,可以将该目标音频对应的控制信息记录在指定类型的文件中,该指定类型可以包括但不限于:json、xml等能够被机器识别的类型。
考虑到该多媒体数据可以被多次播放,那么,为了可以快速的进行设备控制过程,提升设备控制的效率,在设备控制装置应用于移动终端时,设备控制装置可以在该多媒体数据首次播放时,执行生成目标音频对应的控制信息的过程,并且将该控制信息进行保存,这样,当移动终端再次播放该多媒体数据时,则可以直接获取目标音频对应的控制信息。而若设备控制装置运行于服务器,则为了可以快速的进行设备控制过程,提升设备控制的效率,设备控制装置可以在播放目标多媒体数据之前,生成目标多媒体数据的目标音频的控制信息,并进行保存,这样,可以在移动终端播放该目标多媒体数据时,将控制信息发送至移动终端;或者,设备控制装置可以在首次接收到目标多媒体数据的播放请求时,生成目标多媒体数据的目标音频的控制信息,向播放请求的发送设备反馈多媒体数据的同时,反馈控制信息,同时,对控制信息进行保存,这样,可以在其他移动终端请求播放该目标多媒体数据时,将控制信息直接发送至其他移动终端。
S104,在移动终端播放该目标多媒体数据的过程中,基于该目标音频对应的控制信息,控制该移动终端进行互动。
在生成目标音频对应的控制信息后,可以在移动终端播放该目标多媒体数据的过程中,基于该目标音频对应的控制信息,控制该移动终端进行互动。考虑到控制信息包括至少一个互动时间点和每一互动时间点下待进行的互动事件的参数信息,示例性的,在一种实现方式中,在移动终端播放该目标多媒体数据的过程中,基于该目标音频对应的控制信息,控制该移动终端进行互动,可以包括:
在移动终端播放该目标多媒体数据的过程中,当检测到播放至每一互动时间点时,控制该移动终端按照该互动时间点下待进行的互动事件的参数信息,执行互动事件。
其中,该互动事件可以包括震动事件和/或灯光闪烁事件,当然并不局限于此。也就是说,控制信息用于指示在移动终端播放该目标多媒体数据的过程中,可以按照多媒体数据的音乐区间的节奏的起伏,进行与该起伏相匹配的震动事件和/或灯光闪烁事件。
针对震动事件,可以为移动终端中具备震动功能的器件所实现的,例如马达,也可以为与该移动终端连接且具备震动功能的智能家居设备所实现,也就是说,移动终端可以通过控制具备震动功能的智能家居设备完成震动事件。例如,智能手机可以与智能座椅通信连接,当用户通过智能手机观看视频节目时,智能座椅可以配合视频节目中的音乐区间的播放而震动;针对灯光闪烁事件,可以为移动终端中具备灯光闪烁功能的器件所实现,例如手电筒,也可以为与该移动终端连接且具备灯光闪烁功能的智能家居设备所实现,例如,智能手机可以与智能灯通信连接,当用户通过智能手机观看视频节目时,智能灯可以配合视频节目中的音乐区间的播放进行灯光闪烁。
可以理解的是,多媒体数据在播放时,用户可以根据需要将多媒体数据进行拖放或者回退,也就是说,多媒体数据的起播的时间点可以是任一时间点。示例性的,当多媒体数据的起播的时间点位于该互动时间点与下一相邻时间点之间时,检测是否播放至该互动时间点可以包括:若检测到起播的时间点超过该互动时间点,且起播的时间点与该互动时间点的时间间隔小于该互动时间点的互动时长,则为检测到播放至该互动时间点,其中互动时长为互动事件的参数信息中所包括的震动时长和/或闪烁时间。例如:当起播时间点为8分05秒,该互动时间点为8分00秒,该互动时间点的互动时长为6秒,则认为检测到播放至该互动时间点。
在检测到播放至每一互动时间点时,移动终端可以按照该互动时间点下待进行的互动事件的参数信息,执行相应的互动事件。示例性的,可以按照该互动时间点下待进行的震动事件的参数信息,在该时间点进行震动,或者,按照该互动时间点下待进行的灯光闪烁事件的参数信息,在该时间点进行灯光闪烁。
为了方案清楚和布局清晰,后续结合另一实施例,对互动事件的参数信息进行介绍。
本发明实施例提供的方案,从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;获取所述目标音频的节奏特征信息;基于所述节奏特征信息,生成所述目标音频对应的控制信息;其中,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动。本方案在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动,使得多媒体数据的播放形式更加丰富新型,且能够给用户带来体感维度的播放体验。可见,本方案可以解决多媒体数据播放时,用户所能体验的维度较为单一且传统的问题。
可选地,在本发明的另一实施例中,互动事件包括震动事件和/或灯光闪烁事件;该震动事件的参数信息包括震动时间参数和/或震动方式参数;该灯光闪烁事件的参数信息包括:闪烁时间参数和/或闪烁方式参数。
其中,该震动时间参数包括:震动起止时间和震动时长中的至少一种;该震动方式参数包括:类型、强度、锐度和频率中的至少一种。
该闪烁时间参数包括闪烁起止时间和闪烁时长中的至少一种;该闪烁方式参数包括:类型和频率中的至少一种。
在所述多媒体数据的播放过程中,移动终端可以按照每一互动时间点下待进行的互动事件的参数信息,执行相应的互动事件,该互动事件的参数信息可以为人为设置的参数信息,也可以为基于专门的音频识别软件来确定的。
为了方便理解,下面对上述各个参数进行介绍。
当震动时间参数包括震动起止时间时,可以按照时间先后的顺序,将相邻的两个互动时间点分别作为起止时间点,也可以将相邻两个互动时间点中靠前的时间点作为起始时间点,将位于相邻两个互动时间点之间的任一时间点作为终止时间点。那么,震动时长可以小于或者等于相邻两个互动时间点之间的间隔时长。示例性的,假设互动时间点A和互动时间点B之间间隔5秒,互动时间点A的时间点为20分05秒,互动时间点B的时间点为20分10秒,那么,互动时间点A的震动起止时间可以分别为20分05秒和20分10秒,或者,也可以为20分05秒和20分08秒等等,震动时长可以为5秒或者4秒等等。
震动方式参数中的类型可以包括短震类型或长震类型;震动方式参数中的强度体现为触觉的幅度和力度;震动方式参数中的锐度又可以称为尖锐度或震动清晰度,能够确定触觉体验的特征,震动方式参数中的频率能够体现触觉的频次,并且,震动方式参数中的强度、锐度和频次均可以为一固定的值,例如强度为1,锐度为2,频率为10次/秒等。
本实施例在多媒体数据的播放过程中,能够在播放至每一互动时间点时,按照震动事件和/或灯光闪烁事件的参数信息,如:震动时间参数和/或震动方式参数,以及闪烁时间参数和/或闪烁方式参数,执行关于该互动时间点的互动事件,使得多媒体数据的播放形式更加丰富新型,且能够给用户带来体感维度的播放体验。可见,本方案可以解决多媒体数据播放时,用户所能体验的维度较为单一且传统的问题。
可选地,在本发明的另一实施例中,基于该节奏特征信息,生成该目标音频对应的控制信息,包括:
针对节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的该目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点,并利用该目标峰值点的指定信息,确定该目标峰值点对应的互动时间点下待进行的互动事件的参数信息;
其中,该指定信息包括峰值和/或与相邻的下一目标峰值点所间隔的时长,该与相邻的下一目标峰值点所间隔的时长为利用该目标峰值点对应的频谱信息和该下一目标峰值点所对应的频谱信息所确定的时长。
可以理解的是,目标音频的频谱信息中包含有频率和幅值,那么,根据频谱信息计算的每一目标峰值点均对应一帧时域信号,从而可以根据该帧时域信号,计算出相应的时间点即目标峰值点对应的多媒体数据的播放时间点。
示例性的,在一种实现方式中,利用该目标峰值点的指定信息,确定该目标峰值点对应的互动时间点下待进行的互动事件的参数信息,可以包括:
从关于峰值点的指定信息和所述互动事件的参数信息的对应关系中,确定与该目标峰值点的指定信息对应的参数信息,作为该目标峰值点对应的互动时间点下待进行的互动事件的参数信息。
其中,关于峰值点的指定信息和该互动事件的参数信息的对应关系可以为人为设置的对应关系,也可以为基于指定信息所确定的对应关系。示例性的,关于峰值点的指定信息和震动事件的参数信息的对应关系,可以包括:
针对指定信息中的峰值,可以将处于一定峰值范围的峰值匹配指定类型、强度、锐度或频率的震动;针对指定信息中的与相邻的下一目标峰值点所间隔的时长,可以将一定时间范围内的时长,匹配指定震动起止时间或震动时长的震动。例如,80-100范围内的峰值,可以匹配强度为2,或者锐度为2的震动,与相邻的下一目标峰值点所间隔的时长在2-4s内时,匹配震动时长为2s的震动等等。
示例性的,针对关于峰值点的指定信息和灯光闪烁事件的参数信息的对应关系,可以包括:
针对指定信息中的峰值,可以将处于一定峰值范围的峰值,匹配指定类型或频率的灯光闪烁;针对指定信息中的与相邻的下一目标峰值点所间隔的时长,可以将一定时间范围内的时长,匹配指定闪烁起止时间和闪烁时长的灯光闪烁。例如,80-100范围内的峰值,可以匹配10次/秒的灯光闪烁,与相邻的下一目标峰值点所间隔的时长在2-3s内时,匹配2s的闪烁时等等。
本方案基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的该目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点,并利用该目标峰值点的指定信息,确定该目标峰值点对应的互动时间点下待进行的互动事件的参数信息。使得生成的控制信息,可以指示移动终端在多媒体数据的播放过程中,能够在播放至每一互动时间点时,执行关于该互动时间点的互动事件,使得多媒体数据的播放形式更加丰富新型,且能够给用户带来体感维度的播放体验。可见,本方案可以解决多媒体数据播放时,用户所能体验的维度较为单一且传统的问题。
可选地,在本发明的另一实施例中,针对节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点之前,该方法还可以包括:
针对满足预定增设条件的相邻两个目标峰值点,从该频谱信息的位于该相邻两个目标峰值点之间的峰值点中,确定峰值高于第二预定阈值的峰值点,作为目标峰值点;
其中,该预定增设条件包括:所间隔的时长大于第一时长阈值,该第二预定阈值小于所述第一预定阈值。
可以理解的是,当相邻两个目标峰值点间隔较大时,该相邻两个目标峰值点对应的互动时间点的时间间隔则较长,为了提高用户的播放体验维度,可以从频率信息的位于该相邻两个目标峰值点之间的峰值点中,确定峰值高于第二预定阈值的峰值点,作为目标峰值点,以缩短互动时间点之间的时间间隔,并且,可以将第二预定阈值设置为小于第一预定阈值。
此外,为了方便确定峰值高于第二预定阈值的峰值点,还可以采用预设的第二计算公式,计算频谱信息中的多个峰值点的峰值,并确定峰值高于第二预定阈值的峰值点,作为目标峰值点。示例性的,在一种实现方式中,该预设的第二计算公式可以包括:
其中,N为采样点数,Xk(n)用于表征目标音频的频谱信息。
可见,本实施例,从频谱信息的位于该相邻两个目标峰值点之间的峰值点中,确定峰值高于第二预定阈值的峰值点,作为目标峰值点,保证了互动时间点之间的间隔不会间隔过大,使得最终确定出的互动时间点能够与音乐区间的节奏的起伏相匹配,从而可以提高用户的播放体验。
可选地,在本发明的另一实施例中,针对节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的该目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点之前,该方法还可以包括:
从所确定的目标峰值点中,剔除满足预定剔除条件的目标峰值点;其中,所述预定剔除条件包括:与相邻的上一目标峰值点所间隔的时长小于第二时长阈值,和/或,峰值归一化后的值小于第三预定阈值。
可以理解的是,为了加快处理速度,当相邻两个目标峰值点之间的时间间隔过小,或者峰值归一化后的值小于第三预定阈值时,可以对满足该预定剔除条件的目标峰值点进行剔除,以提高后续的处理效率。此外,峰值归一化的实现方式可以采用现有技术中的任一种归一化方式实现,在此不做赘述。
可见,本实施例,通过剔除满足预定剔除条件的目标峰值点,保证了互动时间点之间的间隔不会过密,使得最终确定出的互动时间点能够与音乐区间的节奏的起伏相匹配,从而可以提高用户的播放体验。
为了方案清楚,下面结合图2,对本发明实施例中的目标音频的多个目标峰值点对应的时间和峰值的确定过程进行说明。
如图2所示,目标音频的目标峰值点对应的时间和峰值的确定过程可以包括如下步骤S201-S205:
S201:对目标音频进行预处理,得到预处理后的目标音频;其中,所述预处理包括预加重处理、分帧处理和加窗处理中的至少一种;
S202:对预处理后的目标音频,进行短时傅里叶变换(Short-time FourierTransform,STFT),得到该目标音频的频谱信息;
S203:计算多个峰值点对应的峰值;
S204:确定峰值高于第一预定阈值的至少一个目标峰值点;
S205:确定目标峰值点对应的互动时间点。
该实施例中的步骤S201-S205与上述实施例中的步骤S101-S102的内容相同,在此不做赘述。
相对于上述方法实施例,如图3所示,本发明实施例提供了一种设备控制装置,包括:
音频提取模块310,用于从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;
特征获取模块320,用于获取所述目标音频的节奏特征信息;
信息生成模块330,用于基于所述节奏特征信息,生成所述目标音频对应的控制信息;其中,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;
互动控制模块340,用于在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动。
本发明实施例提供的方案,从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;获取所述目标音频的节奏特征信息;基于所述节奏特征信息,生成所述目标音频对应的控制信息;其中,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动。本方案在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动,使得多媒体数据的播放形式更加丰富新型,且能够给用户带来体感维度的播放体验。可见,本方案可以解决多媒体数据播放时,用户所能体验的维度较为单一且传统的问题。
可选地,本发明的另一实施例中,所述控制信息包括至少一个互动时间点和每一互动时间点下待进行的互动事件的参数信息;
所述互动控制模块340具体用于:在所述移动终端播放所述目标多媒体数据的过程中,当检测到播放至每一互动时间点时,控制所述移动终端按照该互动时间点下待进行的互动事件的参数信息,执行互动事件。
可选地,本发明的另一实施例中,所述互动事件包括震动事件和/或灯光闪烁事件;所述震动事件的参数信息包括震动时间参数和/或震动方式参数;所述灯光闪烁事件的参数信息包括:闪烁时间参数和/或闪烁方式参数。
可选地,本发明的另一实施例中,所述特征获取模块320包括:
频域分析子模块,用于对所述目标音频的音频信号进行频域分析,得到频谱信息;
峰值确定子模块,用于从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点,并将所述至少一个目标峰值点的峰值和对应的频谱信息,作为所述目标音频的节奏特征信息。
可选地,本发明的另一实施例中,所述信息生成模块330包括:
时间确定子模块,用于针对所述节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点,并利用该目标峰值点的指定信息,确定该目标峰值点对应的互动时间点下待进行的互动事件的参数信息;
其中,所述指定信息包括峰值和/或与相邻的下一目标峰值点所间隔的时长,所述与相邻的下一目标峰值点所间隔的时长为利用该目标峰值点对应的频谱信息和所述下一目标峰值点所对应的频谱信息所确定的时长。
可选地,本发明的另一实施例中,所述时间确定子模块,具体用于:从关于峰值点的指定信息和所述互动事件的参数信息的对应关系中,确定与该目标峰值点的指定信息对应的参数信息,作为该目标峰值点对应的互动时间点下待进行的互动事件的参数信息。
可选地,本发明的另一实施例中,所述装置还包括:
峰值增设模块,用于在所述时间确定子模块之前,针对满足预定增设条件的相邻两个目标峰值点,从所述频谱信息的位于该相邻两个目标峰值点之间的峰值点中,确定峰值高于第二预定阈值的峰值点,作为目标峰值点;
其中,所述预定增设条件包括:所间隔的时长大于第一时长阈值,所述第二预定阈值小于所述第一预定阈值。
可选地,本发明的另一实施例中,所述装置还包括:
峰值剔除模块,用于在所述时间确定子模块之前,从所确定的目标峰值点中,剔除满足预定剔除条件的目标峰值点;其中,所述预定剔除条件包括:与相邻的上一目标峰值点所间隔的时长小于第二时长阈值,和/或,峰值归一化后的值小于第三预定阈值。
可选地,本发明的另一实施例中,所述峰值确定子模块具体用于:
采用预设的峰值计算公式,确定所述频谱信息的多个峰值点;
从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点;
所述预设的峰值计算公式包括:
其中,Wk=|k|,Wk为第k个频点对应的频率权重,N为采样点个数,Xk(n)用于表征目标音频的频谱信息。
本发明实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现任一设备控制方法的步骤。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的设备控制方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的设备控制方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设置及存储介质等实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (8)

1.一种设备控制方法,其特征在于,包括:
从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;
对所述目标音频的音频信号进行频域分析,得到频谱信息;
从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点,并将所述至少一个目标峰值点的峰值和对应的频谱信息,作为所述目标音频的节奏特征信息;
针对所述节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点,并利用该目标峰值点的指定信息,确定该目标峰值点对应的互动时间点下待进行的互动事件的参数信息,将所述互动时间点和所述参数信息作为所述目标音频对应的控制信息,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;其中,所述指定信息包括峰值和/或与相邻的下一目标峰值点所间隔的时长,所述与相邻的下一目标峰值点所间隔的时长为利用该目标峰值点对应的频谱信息和所述下一目标峰值点所对应的频谱信息所确定的时长;
在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动;
在针对所述节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点之前,所述方法还包括:
针对满足预定增设条件的相邻两个目标峰值点,从所述频谱信息的位于该相邻两个目标峰值点之间的峰值点中,确定峰值高于第二预定阈值的峰值点,作为目标峰值点,其中,所述预定增设条件包括:所间隔的时长大于第一时长阈值,所述第二预定阈值小于所述第一预定阈值;
以及,从所确定的目标峰值点中,剔除满足预定剔除条件的目标峰值点;其中,所述预定剔除条件包括:与相邻的上一目标峰值点所间隔的时长小于第二时长阈值,和/或,峰值归一化后的值小于第三预定阈值。
2.根据权利要求1所述的方法,其特征在于,所述在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动,包括:
在所述移动终端播放所述目标多媒体数据的过程中,当检测到播放至每一互动时间点时,控制所述移动终端按照该互动时间点下待进行的互动事件的参数信息,执行互动事件。
3.根据权利要求2所述的方法,其特征在于,所述互动事件包括震动事件和/或灯光闪烁事件;所述震动事件的参数信息包括震动时间参数和/或震动方式参数;所述灯光闪烁事件的参数信息包括:闪烁时间参数和/或闪烁方式参数。
4.根据权利要求1所述的方法,其特征在于,所述利用该目标峰值点的指定信息,确定该目标峰值点对应的互动时间点下待进行的互动事件的参数信息,包括:
从关于峰值点的指定信息和所述互动事件的参数信息的对应关系中,确定与该目标峰值点的指定信息对应的参数信息,作为该目标峰值点对应的互动时间点下待进行的互动事件的参数信息。
5.根据权利要求1所述的方法,其特征在于,所述从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点,包括:
采用预设的峰值计算公式,确定所述频谱信息的多个峰值点;
从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点;
所述预设的峰值计算公式包括:
其中,Wk=|k|,Wk为第k个频点对应的频率权重,N为采样点个数,Xk(n)用于表征目标音频的频谱信息。
6.一种设备控制装置,其特征在于,包括:
音频提取模块,用于从目标多媒体数据中提取包含音乐区间的音频,作为目标音频;
特征获取模块,用于对所述目标音频的音频信号进行频域分析,得到频谱信息;从所述频谱信息的多个峰值点中,确定峰值高于第一预定阈值的至少一个目标峰值点,并将所述至少一个目标峰值点的峰值和对应的频谱信息,作为所述目标音频的节奏特征信息;
信息生成模块,用于针对所述节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点,并利用该目标峰值点的指定信息,确定该目标峰值点对应的互动时间点下待进行的互动事件的参数信息,将所述互动时间点和所述参数信息作为所述目标音频对应的控制信息,所述控制信息用于指示移动终端按照所述目标音频的节奏进行互动;其中,所述指定信息包括峰值和/或与相邻的下一目标峰值点所间隔的时长,所述与相邻的下一目标峰值点所间隔的时长为利用该目标峰值点对应的频谱信息和所述下一目标峰值点所对应的频谱信息所确定的时长;
互动控制模块,用于在所述移动终端播放所述目标多媒体数据的过程中,基于所述目标音频对应的控制信息,控制所述移动终端进行互动;
所述装置还包括:
峰值增设模块,用于在信息生成模块针对所述节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点之前,针对满足预定增设条件的相邻两个目标峰值点,从所述频谱信息的位于该相邻两个目标峰值点之间的峰值点中,确定峰值高于第二预定阈值的峰值点,作为目标峰值点,其中,所述预定增设条件包括:所间隔的时长大于第一时长阈值,所述第二预定阈值小于所述第一预定阈值;
以及,峰值剔除模块,用于在信息生成模块针对所述节奏特征信息的每一目标峰值点,基于该目标峰值点对应的频谱信息,确定该目标峰值点对应的所述目标多媒体数据的播放时间点,作为该目标峰值点对应的互动时间点之前,从所确定的目标峰值点中,剔除满足预定剔除条件的目标峰值点;其中,所述预定剔除条件包括:与相邻的上一目标峰值点所间隔的时长小于第二时长阈值,和/或,峰值归一化后的值小于第三预定阈值。
7.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法。
CN202011625269.0A 2020-12-31 2020-12-31 一种设备控制方法、装置、电子设备及存储介质 Active CN112866770B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011625269.0A CN112866770B (zh) 2020-12-31 2020-12-31 一种设备控制方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011625269.0A CN112866770B (zh) 2020-12-31 2020-12-31 一种设备控制方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112866770A CN112866770A (zh) 2021-05-28
CN112866770B true CN112866770B (zh) 2023-12-05

Family

ID=75999437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011625269.0A Active CN112866770B (zh) 2020-12-31 2020-12-31 一种设备控制方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112866770B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113721821A (zh) * 2021-09-04 2021-11-30 北京字节跳动网络技术有限公司 音乐播放方法及设备
CN114630140A (zh) * 2022-03-17 2022-06-14 阿里巴巴(中国)有限公司 基于音频数据的信息设置方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003218757A (ja) * 2002-01-23 2003-07-31 Mitsubishi Electric Corp 無線受信装置及びその有効パス選択方法
CN107103917A (zh) * 2017-03-17 2017-08-29 福建星网视易信息系统有限公司 音乐节奏检测方法及其系统
CN110688518A (zh) * 2019-10-12 2020-01-14 广州酷狗计算机科技有限公司 节奏点的确定方法、装置、设备及存储介质
CN112040290A (zh) * 2020-09-11 2020-12-04 北京奇艺世纪科技有限公司 一种多媒体播放方法、装置、设备及系统
CN112086080A (zh) * 2020-09-11 2020-12-15 北京奇艺世纪科技有限公司 音乐节奏反馈方法、装置、电子设备及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI484473B (zh) * 2009-10-30 2015-05-11 Dolby Int Ab 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003218757A (ja) * 2002-01-23 2003-07-31 Mitsubishi Electric Corp 無線受信装置及びその有効パス選択方法
CN107103917A (zh) * 2017-03-17 2017-08-29 福建星网视易信息系统有限公司 音乐节奏检测方法及其系统
CN110688518A (zh) * 2019-10-12 2020-01-14 广州酷狗计算机科技有限公司 节奏点的确定方法、装置、设备及存储介质
CN112040290A (zh) * 2020-09-11 2020-12-04 北京奇艺世纪科技有限公司 一种多媒体播放方法、装置、设备及系统
CN112086080A (zh) * 2020-09-11 2020-12-15 北京奇艺世纪科技有限公司 音乐节奏反馈方法、装置、电子设备及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于相位特征的音乐音符起点检测;张秋月;《天津大学硕士学位论文》;20101231;第17页 *
张秋月.基于相位特征的音乐音符起点检测.天津大学硕士论文库.2010,第17页. *

Also Published As

Publication number Publication date
CN112866770A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
RU2743315C1 (ru) Способ классификации музыки и способ детектирования долей музыкального такта, носитель данных и компьютерное устройство
CN109670074B (zh) 一种节奏点识别方法、装置、电子设备及存储介质
US20200257722A1 (en) Method and apparatus for retrieving audio file, server, and computer-readable storage medium
WO2019109787A1 (zh) 音频分类方法、装置、智能设备和存储介质
CN110265064B (zh) 音频爆音检测方法、装置和存储介质
CN104123938A (zh) 语音控制系统、电子装置及语音控制方法
CN107147618A (zh) 一种用户注册方法、装置及电子设备
CN112866770B (zh) 一种设备控制方法、装置、电子设备及存储介质
CN110223680A (zh) 语音处理方法、识别方法及其装置、系统、电子设备
CN109348274B (zh) 一种直播互动方法、装置及存储介质
US11511200B2 (en) Game playing method and system based on a multimedia file
CN104657438A (zh) 信息处理方法及电子设备
CN110136729B (zh) 模型生成方法、音频处理方法、装置及计算机可读存储介质
CN112216294B (zh) 音频处理方法、装置、电子设备及存储介质
CN110688518A (zh) 节奏点的确定方法、装置、设备及存储介质
CN110047497B (zh) 背景音频信号滤除方法、装置及存储介质
US11282514B2 (en) Method and apparatus for recognizing voice
CN109509472A (zh) 基于语音平台识别背景音乐的方法、装置及系统
CN112399247A (zh) 一种音频处理方法、音频处理设备及可读存储介质
CN112420015A (zh) 一种音频合成方法、装置、设备及计算机可读存储介质
CN106448637A (zh) 一种发送音频数据的方法和装置
CN108322770A (zh) 视频节目识别方法、相关装置、设备和系统
CN106531202A (zh) 一种音频处理方法及装置
CN112037739B (zh) 一种数据处理方法、装置、电子设备
CN109756628A (zh) 一种功能按键音效的播放方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant