CN110347864A - 一种智能调节音频参数的方法及系统 - Google Patents

一种智能调节音频参数的方法及系统 Download PDF

Info

Publication number
CN110347864A
CN110347864A CN201910647194.7A CN201910647194A CN110347864A CN 110347864 A CN110347864 A CN 110347864A CN 201910647194 A CN201910647194 A CN 201910647194A CN 110347864 A CN110347864 A CN 110347864A
Authority
CN
China
Prior art keywords
audio
played
parameter
obtains
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910647194.7A
Other languages
English (en)
Inventor
姚旭新
朱向军
钟宇文
陆开中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201910647194.7A priority Critical patent/CN110347864A/zh
Publication of CN110347864A publication Critical patent/CN110347864A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing
    • G11B19/022Control panels
    • G11B19/025'Virtual' control panels, e.g. Graphical User Interface [GUI]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing
    • G11B19/027Remotely controlled
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10481Improvement or modification of read or write signals optimisation methods
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种智能调节音频参数的方法及系统,其方法包括:建立音频类别和音频参数的参数映射表;获取用户操作指令,根据所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别;通过所述参数映射表获取所述目标音频类别的目标音频参数,根据所述目标音频参数播放所述待播放音频。本发明自动识别待播放音频的音频类别,然后根据音频类别自动调节最佳音频参数,减少用户调节音频参数的烦恼;以最适合的音频参数播放当前音频,给以用户最舒适的聆听感受,使用户获得更好的使用体验。

Description

一种智能调节音频参数的方法及系统
技术领域
本发明涉及音效调节技术领域,尤指一种智能调节音频参数的方法及系统。
背景技术
随着生活水平的提高,耳机、音响等音频类消费电子产品越来越受到市场和用户的欢迎。与此同时,用户也要求这些音频类消费电子产品的功能越来越完善和强大。其中,一个典型的功能需求便是,用户希望这类产品在播放不同类型的音频时能够按照各自的特点选择最优地音频参数进行播放,而不是都选择使用同样的音频参数进行播放。
目前的机器没有自动调节音频参数功能,用户只能通过预设的音频场景手动设置或者自行手动调节音频参数,但对于普通用户来说准确调节音频参数比较困难,也比较麻烦,从而影响音乐聆听感受。
发明内容
本发明的目的是提供一种智能调节音频参数的方法及系统,实现自动识别待播放音频的音频类别,然后根据音频类别自动调节最佳音频参数,减少用户调节音频参数的烦恼;以最适合的音频参数播放当前音频,给以用户最舒适的聆听感受,使用户获得更好的使用体验。
本发明提供的技术方案如下:
本发明提供一种智能调节音频参数的方法,包括:
根据音频类别和对应的音频参数建立参数映射表;
获取用户操作指令,根据所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别;
通过所述参数映射表获取所述目标音频类别对应的目标音频参数,根据所述目标音频参数播放所述待播放音频。
进一步的,建立音频类别和音频参数的参数映射表之前包括:
基于深度学习识别本地音乐中所有的音乐音频的音频类别;
根据所述音乐音频对应的音频类别进行分类得到多个音频分组,每个音频分组以相应的音频类别命名标记;
获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别具体包括:
当所述音频获取方式为本地音乐获取时,获取所述待播放音频,并根据所述音频分组识别对应的目标音频类别。
进一步的,获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别还包括:
当所述音频获取方式为网络点播获取时,获取所述待播放音频以及相应的音频信息,所述音频信息包含音频名称、创作者、音频评价;
基于深度学习根据所述音频信息识别所述待播放音频的所述目标音频类别。
进一步的,获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别还包括:
当所述音频获取方式为蓝牙共享获取时,根据所述用户操作指令与目标终端建立蓝牙数据连接;
建立蓝牙数据连接之后,获取所述待播放音频;
基于深度学习分析所述待播放音频的前段预设时长音频识别所述待播放音频的所述目标音频类别;
通过所述参数映射表获取所述目标音频类别对应的目标音频参数,根据所述目标音频参数播放所述待播放音频具体包括:
通过所述参数映射表获取所述目标音频类别的目标音频参数,根据所述目标音频参数播放所述待播放音频的剩余时长音频,所述剩余时长音频为所述待播放音频中除所述前段预设时长音频之外的音频。
进一步的,通过所述参数映射表获取所述目标音频类别对应的目标音频参数,根据所述目标音频参数播放所述待播放音频之后还包括:
获取用户对于所述待播放音频的评价信息,识别所述评价信息中的有效评价信息;
分析所述有效评价信息,对所述参数映射表中音频类别对应的音频参数进行调整。
本发明还提供一种智能调节音频参数的系统,其特征在于,包括:
映射表建立模块,根据音频类别和对应的音频参数建立参数映射表;
指令获取模块,获取用户操作指令;
方式获取模块,根据所述指令获取模块获取的所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
音频获取模块,获取待播放音频,并结合所述方式获取模块获取的所述音频获取方式识别所述待播放音频的目标音频类别;
音频播放模块,通过所述映射表建立模块建立的所述参数映射表,获取所述音频获取模块获取的所述目标音频类别对应的目标音频参数,根据所述目标音频参数播放所述待播放音频。
进一步的,还包括:
类别识别模块,基于深度学习识别本地音乐中所有的音乐音频的音频类别;
处理模块,根据所述类别识别模块确定所述音乐音频对应的音频类别进行分类得到多个音频分组,每个音频分组以相应的音频类别命名标记;
所述音频获取模块具体包括:
类别识别单元,当所述方式获取模块获取的所述音频获取方式为本地音乐获取时,获取所述待播放音频,并根据所述处理模块确定的所述音频分组识别对应的目标音频类别。
进一步的,所述音频获取模块还包括:
信息获取单元,当所述方式获取模块获取的所述音频获取方式为网络点播获取时,获取所述待播放音频以及相应的音频信息,所述音频信息包含音频名称、创作者、音频评价;
所述类别识别单元,基于深度学习根据所述信息获取单元获取所述音频信息识别所述待播放音频的所述目标音频类别。
进一步的,所述音频获取模块还包括:
数据连接单元,当所述音频获取方式为蓝牙共享获取时,根据所述用户操作指令与目标终端建立蓝牙数据连接;
音频获取单元,所述数据连接单元建立蓝牙数据连接之后,获取所述待播放音频;
所述类别识别单元,基于深度学习分析所述音频获取单元获取所述待播放音频的前段预设时长音频识别所述待播放音频的所述目标音频类别;
所述音频播放模块具体包括:
参数获取单元,通过所述映射表建立模块建立的所述参数映射表获取所述类别识别单元识别的所述目标音频类别对应的目标音频参数;
音频播放单元,根据所述参数获取单元获取的所述目标音频参数播放所述待播放音频的剩余时长音频,所述剩余时长音频为所述待播放音频中除所述前段预设时长音频之外的音频。
进一步的,还包括:
评价获取模块,获取用户对于所述待播放音频的评价信息;
评价识别模块,识别所述评价获取模块获取的所述评价信息中的有效评价信息;
参数调整模块,分析所述评价识别模块确定所述有效评价信息,对所述映射表建立模块建立的所述参数映射表中音频类别对应的音频参数进行调整。
通过本发明提供的一种智能调节音频参数的方法及系统,能够带来以下至少一种有益效果:
1、本发明中,自动识别待播放音频的音频类别,然后根据音频类别自动调节最佳音频参数,减少用户调节音频参数的烦恼;以最适合的音频参数播放当前音频,给以用户最舒适的聆听感受,使用户获得更好的使用体验。
2、本发明中,对于终端中存储的音乐音频,提前分析识别其音频类别,如果用户选取的是本地音乐获取,则可以快速准确的确定其对应的音频类别,提高系统反应速度。
3、本发明中,设置有用户对于播放的音频的评价模块,并且识别所有的评价信息中的有效评价信息,并根据有效评价信息对相应的音频参数进行调整,使得最终的音效更加符合用户的喜好,提高用户使用体验。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种智能调节音频参数的方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种智能调节音频参数的方法的一个实施例的流程图;
图2是本发明一种智能调节音频参数的方法的另一个实施例的流程图;
图3是本发明一种智能调节音频参数的方法的另一个实施例的流程图;
图4是本发明一种智能调节音频参数的方法的另一个实施例的流程图;
图5是本发明一种智能调节音频参数的方法的另一个实施例的流程图;
图6是本发明一种智能调节音频参数的系统的一个实施例的结构示意图;
图7是本发明一种智能调节音频参数的系统的另一个实施例的结构示意图。
附图标号说明:
100智能调节音频参数的系统
110映射表建立模块 120指令获取模块 130方式获取模块
140音频获取模块 141类别识别单元 142信息获取单元 143数据连接单元 144音频获取单元
150音频播放单元 151参数获取单元 152音频播放单元
160类别识别单元 170处理模块 180评价获取模块
185评价识别模块 190参数调整模块
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘出了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
具体实现中,本申请实施例中描述的终端设备包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机、家教机或平板计算机之类的其他便携式设备。还应当理解的是,在某些实施例中,所述终端设备并非便携式通信设备,而是具有触摸敏感表面(例如:触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端设备。然而,应当理解的是,终端设备可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其他物理用户接口设备。
终端设备支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、网络创建应用程序、文字处理应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄像机应用程序、Web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端设备上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
本发明的一个实施例,如图1所示,一种智能调节音频参数的方法,包括:
S100根据音频类别和对应的音频参数建立参数映射表;
具体的,首先根据当前市场上已有的音乐音频确定相应的音频类别,例如可以分为语音故事、儿歌、人声演唱曲和乐器纯音乐等音频类别,其中各个类别还可以继续细分,例如人声演唱曲分为民谣、摇滚、爵士等各个细分类别。每种音频类别对应的音乐都有其各自的特点,应当尽可能地全面地划分类别,然后针对各个类别确定其最优的音频参数,从而使用户能够感受到更好的音效。另外,对于同一段音频,演唱者的演唱方式不同,也可能属于不同音频类别。
另外,对于每个音频类别对应的音频参数,可以通过服务器进行分析,判断使用不同的音频参数播放同一类别的音频所形成的音效,选取其中音效最优地音频参数作为参数映射表中相应音频类别对应的音频参数。
S200获取用户操作指令,根据所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
具体的,获取用户操作指令,其中,用户操作指令是用户通过按键,或者直接触摸点击,又或者通过语音进行操作。然后根据用户操作指令获取用户选取的音频获取方式,音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取。
其中,本地音乐获取指用户已经缓存下载到终端内存中存储的音频获取方式,对于此类获取方式,终端可以不与网络以及其余的终端建立联系就获取到音频。网络点播获取则是用户在网络或者云端数据库实时获取音频,需要依靠网络进行下载,因此终端必须建立网络连接。蓝牙共享获取则是与提供音频的终端建立蓝牙数据传输连接,然后将待播放的音频通过蓝牙进行传输。
S300获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别;
具体的,获取待播放音频,由于不同的音频获取方式会导致对于待播放音频的目标音频类别的识别方式不同。例如,对于本地音乐获取,由于待播放音频已经存储在终端中,那么在将待播放音频存储至终端中的时候,以及基于深度学习技术对音频的音频类别进行了分析识别,那么,当用户选择播放待播放音频时,只需要直接获取对应的音频类别,不需要实时进行分析,提高分析速度。反而对于网络点播获取和蓝牙共享获取这两种方式,终端无法提前对音频的音频类别进行识别,则需要当时实时分析识别。因此,需要结合音频获取方式选择相应的手段识别待播放音频的目标音频类别。
S400通过所述参数映射表获取所述目标音频类别的目标音频参数,根据所述目标音频参数播放所述待播放音频。
具体的,将目标音频类别与参数映射表中的所有的音频类别一一进行比对,如果其中有比对相符的,则将相应的音频参数作为目标音频参数,然后按照目标音频参数进行设置,播放待播放音频。
但是,每一个用户各自的喜好不同,因此对于部分用户而言,可能并不认可终端分析认定的每一种音频类别对应的音频参数,在终端按照目标音频参数播放待播放音频之后,用户可以发出调整指令,终端根据调整指令对目标音频参数进行个性化调整得到更新音频参数,并且在每次调整之后,询问用户是否进行保存,如果用户第一次确认信息为进行保存,再次询问将更新音频参数仅作为待播放音频对应的音频参数,还是作为待播放音频所属音频类别对应的音频参数,获取用户第二次确认信息,然后进行相应的保存。
本实施例中,自动识别待播放音频的音频类别,然后根据音频类别自动调节最佳音频参数,减少用户调节音频参数的烦恼;以最适合的音频参数播放当前音频,给以用户最舒适的聆听感受,使用户获得更好的使用体验。
本发明的另一个实施例,是上述的实施例的优化实施例,如图2所示,包括:
S010基于深度学习识别本地音乐中所有的音乐音频的音频类别;
具体的,首先根据当前市场上已有的音乐音频确定相应的音频类别,例如可以分为语音故事、儿歌、人声演唱曲和乐器纯音乐等音频类别,其中各个类别还可以继续细分,例如人声演唱曲分为民谣、摇滚、爵士等各个细分类别。每种音频类别对应的音乐都有其各自的特点,应当尽可能地全面地划分类别,然后针对各个类别确定其最优的音频参数,从而使用户能够感受到更好的音效。另外,对于同一段音频,演唱者的演唱方式不同,也可能属于不同音频类别。
然后,对于终端已经获取到并且存储在终端本地的音乐音频,在存储之后就进行音频类别的识别,基于深度学习分别将存储的音乐音频划分至上述划分的音频类别中,便于后续用户在选择播放本地的音乐音频能够快速准确地获取到对应的音频类别,以便选择相应的音频参数进行播放。
如果出现某一段音乐音频没有已划分的音频类别,则根据系统预设规则自行命名或者提示用户,用户可以选择手动将其划分至某一音频类别,也可以自行划分另一个新的音频类别。
其中,终端中存储的音乐音频的获取方式有多种,可以是从网络上下载至本地,也可以是其余的终端通过蓝牙等共享手段传输至本终端,本终端将传输过来的音乐音频下载保存在本地。
S020根据所述音乐音频对应的音频类别进行分类得到多个音频分组,每个音频分组以相应的音频类别命名标记;
具体的,对于终端本地存储的音乐音频,用户在存储时,可能已经根据自身的喜好或者其它因素将音乐音频进行分类。但是为了便于后续播放本地的音乐音频能够快速获取其对应的音频类别,终端后台对所有的音乐音频按照音频类别进行分类,并且以相应的音频类别进行命名和标记。
S100根据音频类别和对应的音频参数建立参数映射表;
S200获取用户操作指令,根据所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
S300获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别;
S310当所述音频获取方式为本地音乐获取时,获取所述待播放音频,并根据所述音频分组识别对应的目标音频类别;
具体的,当用户选择的音频获取方式为本地音乐获取时,首先识别用户的选取指令,选取指令包括触摸指令和语音指令,选取指令中至少包含待播放音频的信息。例如名称、演唱者等。识别其中的关键词,判断音频获取方式以及待播放音频。如果识别出是为本地音乐获取,则获取所述待播放音频,并根据音频分组识别对应的目标音频类别。
例如,当用户说“播放本地歌曲小星星”,识别出其中包含关键词“本地歌曲”和“小星星”,判定用户选择的是本地音乐获取,因此从本地获取待播放音频“小星星”,终端中“小星星”对应的音频类别为“儿歌”,则相应的目标音频类别为“儿歌”。
其次,当用户的选取指令没有明确说明终端的音频获取方式,可以终端自行进行分析判断,终端分析选取指令得到待播放音频,然后在终端存储的本地音乐中进行搜索识别,如果终端本地有该待播放音频,则选择本地音乐获取,如果终端本地没有待播放音频,则选择网络点播获取。
例如,当用户说“播放小星星”,识别出其中包含关键词“小星星”,判定用户选择的待播放音频是“小星星”,首先在终端本地存储的音频中查询是否有音频“小星星”,如果有,则选择本地音乐获取,从本地获取待播放音频“小星星”,终端中“小星星”对应的音频类别为“儿歌”,则相应的目标音频类别为“儿歌”。如果没有,则从选择网络点播获取。
S400通过所述参数映射表获取所述目标音频类别的目标音频参数,根据所述目标音频参数播放所述待播放音频。
本实施例中,对于终端中存储的音乐音频,提前分析识别其音频类别,如果用户选取的是本地音乐获取,则可以快速准确的确定其对应的音频类别,提高系统反应速度。
本发明的另一个实施例,是上述的实施例的优化实施例,如图3所示,包括:
S100根据音频类别和对应的音频参数建立参数映射表;
S200获取用户操作指令,根据所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
S300获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别;
S320当所述音频获取方式为网络点播获取时,获取所述待播放音频以及相应的音频信息,所述音频信息包含音频名称、创作者、音频评价;
S330基于深度学习根据所述音频信息识别所述待播放音频的所述目标音频类别;
具体的,当音频获取方式为网络点播获取时,获取待播放音频以及相应的音频信息。首先识别用户的选取指令,选取指令包括触摸指令和语音指令,选取指令中至少包含待播放音频的信息。例如名称、演唱者等。识别其中的关键词,判断音频获取方式以及待播放音频。如果用户指令中明确说明音频获取方式为网络点播获取,则选择网络点播获取。如果用户指令中没有明确说明音频获取方式,则终端自行根据关键词识别分析识别音频获取方式。
例如,当用户说“播放网络点播歌曲小星星”,识别出其中包含关键词“网络点播”和“小星星”,判定用户选择的是网络点播获取,因此从网络上获取待播放音频“小星星”。
例如,当用户说“播放小星星”,识别出其中包含关键词“小星星”,判定用户选择的待播放音频是“小星星”,首先在终端本地存储的音频中查询是否有音频“小星星”,如果有,则选择本地音乐获取,从本地获取待播放音频“小星星”。如果没有,则从选择网络点播获取。
其次,对于网络点播获取方式获取的音频,由于网络上的音频众多,不可能预先分析出所有的音频的音频类别并进行保存,因此需要在识别出待播放音频的同时,对其音频类别进行识别。
因此,为了不影响对待播放音频的播放效果,获取待播放音频相应的音频信息用于分析其音频类别。其中,音频信息包含音频名称、创作者、音频评价,但实际上音频信息还可能包含音频演唱者、演唱场景等信息,此处仅做距离说明,可以根据自身的分析模块的需要进行相应的获取。
然后,基于深度学习根据获取的音频信息识别获取到的待播放音频对应的目标音频类别。
S400通过所述参数映射表获取所述目标音频类别的目标音频参数,根据所述目标音频参数播放所述待播放音频。
本实施例中,对于用户选取网络点播获取方式获取的待播放音频,同时获取相应的音频信息,便于终端基于深度学习分析识别相应的音频类别,同时不影响音频的播放效果。
本发明的另一个实施例,是上述的实施例的优化实施例,如图4所示,包括:
S100根据音频类别和对应的音频参数建立参数映射表;
S200获取用户操作指令,根据所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
S300获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别;
S340当所述音频获取方式为蓝牙共享获取时,根据所述用户操作指令与目标终端建立蓝牙数据连接;
具体的,当音频获取方式为蓝牙共享获取时,根据用户操作指令与目标终端建立蓝牙数据连接。终端可以是当前根据用户操作指令与目标终端建立蓝牙连接,也可以是终端与目标终端之前已经进行了绑定,当终端开启蓝牙,则直接与目标终端建立蓝牙连接。
S350建立蓝牙数据连接之后,获取所述待播放音频;
S360基于深度学习分析所述待播放音频的前段预设时长音频识别所述待播放音频的所述目标音频类别;
具体的,终端与目标终端建立蓝牙数据连接之后,目标终端直接将待播放音频通过蓝牙传输给终端,因此终端获取的是待播放音频本身,终端无法预先识别待播放音频的音频类别。
因此,终端选取获取的待播放音频的前段预设时长音频作为深度学习的样本进行分析,从而得出待播放音频的音频类别。其中前段预设时长音频的时长取决于深度学习的需要,并且不同音频所需要的前段预设时长音频的时长可能相同,也可能不相同。
S400通过所述参数映射表获取所述目标音频类别的目标音频参数,根据所述目标音频参数播放所述待播放音频;
S410通过所述参数映射表获取所述目标音频类别的目标音频参数;
S420根据所述目标音频参数播放所述待播放音频的剩余时长音频,所述剩余时长音频为所述待播放音频中除所述前段预设时长音频之外的音频。
具体的,将目标音频类别与参数映射表中的所有的音频类别一一进行比对,如果其中有比对相符的,则将相应的音频参数作为目标音频参数。
由于终端需要通过待播放音频的前段预设时长音频分析其目标音频类别,而终端通过蓝牙获取音频是获取之后直接进行播放,因此待播放音频的前段预设时长音频并没有按照其目标音频类别进行播放。而是终端按照目标音频参数播放待播放音频的剩余时长音频,剩余时长音频为所述待播放音频中除所述前段预设时长音频之外的音频。
本实施例中,对于用户选取为蓝牙共享获取方式获取的待播放音频,由于终端在从目标终端获取待播放音频的同时直接实时进行播放,因此基于待播放音频的前段预设时长音频进行分析,得到其目标音频参数,然后按照目标音频参数播放待播放音频的剩余时长音频,最大程度使用户感受到最优地音效。
本发明的另一个实施例,是上述的实施例的优化实施例,如图5所示,包括:
S100根据音频类别和对应的音频参数建立参数映射表;
S200获取用户操作指令,根据所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
S300获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别;
S400通过所述参数映射表获取所述目标音频类别的目标音频参数,根据所述目标音频参数播放所述待播放音频;
S500获取用户对于所述待播放音频的评价信息,识别所述评价信息中的有效评价信息;
具体的,获取用户对于待播放音频的音效的评价信息,用户可以根据自身的感受以及想法选择在播放中或者播放之后针对音效进行评价,为了辅助用户进行评价,终端可以显示预设评价参数供用户打分评价。
识别所有的评价信息中的有效评价信息,即评价信息中包含有对音频参数点评的评价信息被认定为有效评价信息。例如,文字评论“好听”、“不好听”等完全不涉及音频参数的则不是有效评价信息
S600分析所述有效评价信息,对所述参数映射表中音频类别对应的音频参数进行调整。
具体的,分析有效评价信息,对参数映射表中音频类别对应的音频参数进行调整。选择是否对音频参数进行调整的预设标准为某一项音频参数的评价次数达到预设次数或者预设比例时,对相应的音频参数进行调整。
例如,如果15条有效评价信息都评论儿歌音频类别的音调过高,超过预设次数10次,则将儿歌音频类别的音调调低预设幅度。
参数调整之后,当被采纳的有效评价信息对应的用户再次播放调整的相应类别的音频时,语音提示用户,根据该用户相应的有效评价信息已经做出调整,再次获取其对调整之后的评价信息。
本实施例中,设置有用户对于播放的音频的评价模块,并且识别所有的评价信息中的有效评价信息,并根据有效评价信息对相应的音频参数进行调整,使得最终的音效更加符合用户的喜好,提高用户使用体验。
本发明的一个实施例,如图6所示,一种智能调节音频参数的系统100,包括:
映射表建立模块110,根据音频类别和对应的音频参数建立参数映射表;
指令获取模块120,获取用户操作指令;
方式获取模块130,根据所述指令获取模块120获取的所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
音频获取模块140,获取待播放音频,并结合所述方式获取模块130获取的所述音频获取方式识别所述待播放音频的目标音频类别;
音频播放模块150,通过所述映射表建立模块110建立的所述参数映射表,获取所述音频获取模块140获取的所述目标音频类别的目标音频参数,根据所述目标音频参数播放所述待播放音频。
本实施例中的各个模块的具体操作方式在上述对应的方法实施例中已经进行了详细描述,因此不再一一进行赘述。
本发明的另一个实施例,是上述的实施例的优化实施例,如图7所示,包括:
类别识别模块160,基于深度学习识别本地音乐中所有的音乐音频的音频类别;
处理模块170,根据所述类别识别模块160确定所述音乐音频对应的音频类别进行分类得到多个音频分组,每个音频分组以相应的音频类别命名标记;;
映射表建立模块110,根据音频类别和对应的音频参数建立参数映射表;
指令获取模块120,获取用户操作指令;
方式获取模块130,根据所述指令获取模块120获取的所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
音频获取模块140,获取待播放音频,并结合所述方式获取模块130获取的所述音频获取方式识别所述待播放音频的目标音频类别;;
所述音频获取模块140具体包括:
类别识别单元141,当所述方式获取模块130获取的所述音频获取方式为本地音乐获取时,获取所述待播放音频,并根据所述处理模块170确定的所述音频分组识别对应的目标音频类别;
信息获取单元142,当所述方式获取模块130获取的所述音频获取方式为网络点播获取时,获取所述待播放音频以及相应的音频信息,所述音频信息包含音频名称、创作者、音频评价;
所述类别识别单元141,基于深度学习根据所述信息获取单元142获取所述音频信息识别所述待播放音频的所述目标音频类别;
数据连接单元143,当所述音频获取方式为蓝牙共享获取时,根据所述用户操作指令与目标终端建立蓝牙数据连接;
音频获取单元144,所述数据连接单元143建立蓝牙数据连接之后,获取所述待播放音频;
所述类别识别单元141,基于深度学习分析所述音频获取单元144获取所述待播放音频的前段预设时长音频识别所述待播放音频的所述目标音频类别;
音频播放模块150,通过所述映射表建立模块110建立的所述参数映射表,获取所述音频获取模块140获取的所述目标音频类别的目标音频参数,根据所述目标音频参数播放所述待播放音频;
所述音频播放模块150具体包括:
参数获取单元151,通过所述映射表建立模块110建立的所述参数映射表获取所述类别识别单元141识别的所述目标音频类别的目标音频参数;
音频播放单元152,根据所述参数获取单元151获取的所述目标音频参数播放所述待播放音频的剩余时长音频,所述剩余时长音频为所述待播放音频中除所述前段预设时长音频之外的音频;
还包括:
评价获取模块180,所述音频播放模块150播放所述待播放音频之后,获取用户对于所述待播放音频的评价信息;
评价识别模块185,识别所述评价获取模块180获取的所述评价信息中的有效评价信息;
参数调整模块190,分析所述评价识别模块185确定所述有效评价信息,对所述映射表建立模块110建立的所述参数映射表中音频类别对应的音频参数进行调整。
本实施例中的各个模块的具体操作方式在上述对应的方法实施例中已经进行了详细描述,因此不再一一进行赘述。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种智能调节音频参数的方法,其特征在于,包括:
根据音频类别和对应的音频参数建立参数映射表;
获取用户操作指令,根据所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别;
通过所述参数映射表获取所述目标音频类别对应的目标音频参数,根据所述目标音频参数播放所述待播放音频。
2.根据权利要求1所述的智能调节音频参数的方法,其特征在于,建立音频类别和音频参数的参数映射表之前包括:
基于深度学习识别本地音乐中所有的音乐音频的音频类别;
根据所述音乐音频对应的音频类别进行分类得到多个音频分组,每个音频分组以相应的音频类别命名标记;
获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别具体包括:
当所述音频获取方式为本地音乐获取时,获取所述待播放音频,并根据所述音频分组识别对应的目标音频类别。
3.根据权利要求1所述的智能调节音频参数的方法,其特征在于,获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别还包括:
当所述音频获取方式为网络点播获取时,获取所述待播放音频以及相应的音频信息,所述音频信息包含音频名称、创作者、音频评价;
基于深度学习根据所述音频信息识别所述待播放音频的所述目标音频类别。
4.根据权利要求1所述的智能调节音频参数的方法,其特征在于,获取待播放音频,并结合所述音频获取方式识别所述待播放音频的目标音频类别还包括:
当所述音频获取方式为蓝牙共享获取时,根据所述用户操作指令与目标终端建立蓝牙数据连接;
建立蓝牙数据连接之后,获取所述待播放音频;
基于深度学习分析所述待播放音频的前段预设时长音频,识别所述待播放音频的所述目标音频类别;
通过所述参数映射表获取所述目标音频类别对应的目标音频参数,根据所述目标音频参数播放所述待播放音频具体包括:
通过所述参数映射表获取所述目标音频类别的目标音频参数;
根据所述目标音频参数播放所述待播放音频的剩余时长音频,所述剩余时长音频为所述待播放音频中除所述前段预设时长音频之外的音频。
5.根据权利要求1-4任意一项所述的智能调节音频参数的方法,其特征在于,通过所述参数映射表获取所述目标音频类别对应的目标音频参数,根据所述目标音频参数播放所述待播放音频之后还包括:
获取用户对于所述待播放音频的评价信息,识别所述评价信息中的有效评价信息;
分析所述有效评价信息,对所述参数映射表中音频类别对应的音频参数进行调整。
6.一种智能调节音频参数的系统,其特征在于,包括:
映射表建立模块,根据音频类别和对应的音频参数建立参数映射表;
指令获取模块,获取用户操作指令;
方式获取模块,根据所述指令获取模块获取的所述用户操作指令获取用户选取的音频获取方式,所述音频获取方式包括本地音乐获取、网络点播获取和蓝牙共享获取;
音频获取模块,获取待播放音频,并结合所述方式获取模块获取的所述音频获取方式识别所述待播放音频的目标音频类别;
音频播放模块,通过所述映射表建立模块建立的所述参数映射表,获取所述音频获取模块获取的所述目标音频类别对应的目标音频参数,根据所述目标音频参数播放所述待播放音频。
7.根据权利要求6所述的智能调节音频参数的系统,其特征在于,还包括:
类别识别模块,基于深度学习识别本地音乐中所有的音乐音频的音频类别;
处理模块,根据所述类别识别模块确定所述音乐音频对应的音频类别进行分类得到多个音频分组,每个音频分组以相应的音频类别命名标记;
所述音频获取模块具体包括:
类别识别单元,当所述方式获取模块获取的所述音频获取方式为本地音乐获取时,获取所述待播放音频,并根据所述处理模块确定的所述音频分组识别对应的目标音频类别。
8.根据权利要求6所述的智能调节音频参数的系统,其特征在于,所述音频获取模块还包括:
信息获取单元,当所述方式获取模块获取的所述音频获取方式为网络点播获取时,获取所述待播放音频以及相应的音频信息,所述音频信息包含音频名称、创作者、音频评价;
所述类别识别单元,基于深度学习根据所述信息获取单元获取所述音频信息识别所述待播放音频的所述目标音频类别。
9.根据权利要求6所述的智能调节音频参数的系统,其特征在于,所述音频获取模块还包括:
数据连接单元,当所述音频获取方式为蓝牙共享获取时,根据所述用户操作指令与目标终端建立蓝牙数据连接;
音频获取单元,所述数据连接单元建立蓝牙数据连接之后,获取所述待播放音频;
所述类别识别单元,基于深度学习分析所述音频获取单元获取所述待播放音频的前段预设时长音频识别所述待播放音频的所述目标音频类别;
所述音频播放模块具体包括:
参数获取单元,通过所述映射表建立模块建立的所述参数映射表获取所述类别识别单元识别的所述目标音频类别的对应的目标音频参数;
音频播放单元,根据所述参数获取单元获取的所述目标音频参数播放所述待播放音频的剩余时长音频,所述剩余时长音频为所述待播放音频中除所述前段预设时长音频之外的音频。
10.根据权利要求6-9任一项所述的智能调节音频参数的系统,其特征在于,还包括:
评价获取模块,获取用户对于所述待播放音频的评价信息;
评价识别模块,识别所述评价获取模块获取的所述评价信息中的有效评价信息;
参数调整模块,分析所述评价识别模块确定所述有效评价信息,对所述映射表建立模块建立的所述参数映射表中音频类别对应的音频参数进行调整。
CN201910647194.7A 2019-07-18 2019-07-18 一种智能调节音频参数的方法及系统 Pending CN110347864A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910647194.7A CN110347864A (zh) 2019-07-18 2019-07-18 一种智能调节音频参数的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910647194.7A CN110347864A (zh) 2019-07-18 2019-07-18 一种智能调节音频参数的方法及系统

Publications (1)

Publication Number Publication Date
CN110347864A true CN110347864A (zh) 2019-10-18

Family

ID=68176672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910647194.7A Pending CN110347864A (zh) 2019-07-18 2019-07-18 一种智能调节音频参数的方法及系统

Country Status (1)

Country Link
CN (1) CN110347864A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113556594A (zh) * 2020-04-26 2021-10-26 阿里巴巴集团控股有限公司 音频、视频信号播放方法、信息展示方法、设备及介质
CN113986183A (zh) * 2021-09-30 2022-01-28 青岛海尔科技有限公司 智能家居设备的音量调节方法及装置
CN116994608A (zh) * 2023-09-28 2023-11-03 中国传媒大学 母带声处理方法、系统及设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104735528A (zh) * 2015-03-02 2015-06-24 青岛海信电器股份有限公司 一种音效匹配方法及装置
CN107332994A (zh) * 2017-06-29 2017-11-07 深圳传音控股有限公司 一种调音效果自匹配方法及系统
WO2018103028A1 (zh) * 2016-12-08 2018-06-14 深圳市汇顶科技股份有限公司 一种音频播放装置、系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104735528A (zh) * 2015-03-02 2015-06-24 青岛海信电器股份有限公司 一种音效匹配方法及装置
WO2018103028A1 (zh) * 2016-12-08 2018-06-14 深圳市汇顶科技股份有限公司 一种音频播放装置、系统及方法
CN107332994A (zh) * 2017-06-29 2017-11-07 深圳传音控股有限公司 一种调音效果自匹配方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐霞等: "基于深度学习的音乐情感识别", 《电脑知识与技术》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113556594A (zh) * 2020-04-26 2021-10-26 阿里巴巴集团控股有限公司 音频、视频信号播放方法、信息展示方法、设备及介质
CN113986183A (zh) * 2021-09-30 2022-01-28 青岛海尔科技有限公司 智能家居设备的音量调节方法及装置
CN113986183B (zh) * 2021-09-30 2024-03-22 青岛海尔科技有限公司 智能家居设备的音量调节方法及装置
CN116994608A (zh) * 2023-09-28 2023-11-03 中国传媒大学 母带声处理方法、系统及设备和存储介质
CN116994608B (zh) * 2023-09-28 2024-05-17 中国传媒大学 母带声处理方法、系统及设备和存储介质

Similar Documents

Publication Publication Date Title
US10333876B2 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
CN111785238B (zh) 音频校准方法、装置及存储介质
WO2017067148A1 (zh) 多媒体海报生成方法及终端
CN110347864A (zh) 一种智能调节音频参数的方法及系统
US9281793B2 (en) Systems, methods, and apparatus for generating an audio signal based on color values of an image
US20210027800A1 (en) Method for processing audio, electronic device and storage medium
CN101449538A (zh) 媒体文件的文本-语法改进
EP3382707B1 (en) Audio file re-recording method, device and storage medium
CN110599989B (zh) 音频处理方法、装置及存储介质
CN102567447A (zh) 信息处理装置和方法、信息处理系统及程序
CN107241511B (zh) 一种音乐播放方法、装置、存储介质和终端
CN110675848B (zh) 音频处理方法、装置及存储介质
CN104751847A (zh) 一种基于声纹识别的数据获取方法及系统
CN110808019A (zh) 一种歌曲生成方法及电子设备
CN105824895A (zh) 一种ktv点歌方法和系统
CN111105776A (zh) 有声播放装置及其播放方法
CN110111795B (zh) 一种语音处理方法及终端设备
CN105278684B (zh) 一种智能播放方法及装置
JP2010078926A (ja) デュエット相手抽出システム
CN107562745A (zh) 一种音频播放列表的生成方法、系统及一种音频播放系统
CN110660376B (zh) 音频处理方法、装置及存储介质
CN207966489U (zh) 一种歌曲点播系统
JP5057511B2 (ja) カラオケシステム
JP2013160890A (ja) 情報処理プログラム、情報処理装置、歌詞表示方法、及び通信システム
JP5457791B2 (ja) カラオケ採点システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191018

RJ01 Rejection of invention patent application after publication