CN106445964B - 音频信息处理的方法和装置 - Google Patents
音频信息处理的方法和装置 Download PDFInfo
- Publication number
- CN106445964B CN106445964B CN201510489037.XA CN201510489037A CN106445964B CN 106445964 B CN106445964 B CN 106445964B CN 201510489037 A CN201510489037 A CN 201510489037A CN 106445964 B CN106445964 B CN 106445964B
- Authority
- CN
- China
- Prior art keywords
- audio
- information
- score
- display information
- reference information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种音频信息处理的方法,包括:获取预设音频和与所述预设音频对应的参考信息,所述参考信息对应于多个展示信息,并播放所述预设音频;获取对应于所述预设音频的输入音频,并根据所述预设音频对所述输入音频进行评估,并显示所述评估结果;根据评估结果,从所述参考信息对应的展示信息中查找与所述评估结果匹配的展示信息;显示所述展示信息。本发明还公开了一种音频信息处理的装置。本发明的音频应用不仅可以通过评估结果对用户输入音频进行评估,还可以通过形象的展示信息来清楚、直观、准确的反映出输入音频的水准,使用户能够更加直观的了解自己的演唱水平。
Description
技术领域
本发明涉及到计算机技术领域,特别涉及到音频信息处理的方法和装置。
背景技术
随着音频应用越来越盛行,人们无须专门跑到KTV去唱歌,只需要在智能手机、平板电脑、笔记本电脑、台式电脑、一体机等智能终端上安装音频应用,或在浏览器上打开网页版本的音频应用,就能够实现随时随地K歌的目的。目前,音频应用可以通过智能终端的喇叭播放歌曲的伴奏,通过智能终端的话筒录制用户的歌声,并将用户歌声与歌曲伴奏融合,产生类似于在KTV唱歌的效果。同时,音频应用还可以对用户演唱的节奏、音准等进行评估,可在用户演唱完整首歌后进行评估,还可以在用户演唱每一小节歌词后进行评估,用打分的方式实现音频应用与用户之间的互动。但是,采用分数进行评估的方式并不是很准确,用户无法确定自己所得到的分数到底属于什么水平,现有的评估方式无法清楚、直观的反映出用户录入音频的水准。
发明内容
本发明实施例提供一种音频信息处理的方法和装置,能够清楚、直观、准确的反映出输入音频的水准。
本发明实施例提出一种音频信息处理的方法,包括步骤:
获取预设音频和与所述预设音频对应的参考信息,所述参考信息对应于多个展示信息,并播放所述预设音频;
获取对应于所述预设音频的输入音频,并根据所述预设音频对所述输入音频进行评估,并在所述音频应用的界面上显示所述评估结果;
根据评估结果,从所述参考信息对应的展示信息中查找与所述评估结果匹配的展示信息;
在所述音频应用的界面上显示所述展示信息。
本发明实施例还提出一种音频信息处理的装置,包括:
播放模块,用于获取预设音频和与所述预设音频对应的参考信息,所述参考信息对应于多个展示信息,并播放所述预设音频;
评估模块,用于获取对应于所述预设音频的输入音频,并根据所述预设音频对所述输入音频进行评估;
显示模块,用于在所述音频应用的界面上显示所述评估结果;
匹配模块,用于根据评估结果,从所述参考信息对应的展示信息中查找与所述评估结果匹配的展示信息;
所述显示模块还用于,在所述音频应用的界面上显示所述展示信息。
本发明实施例的音频应用根据对用户输入音频的评估结果,在参考信息的展示信息库中查找与评估结果一一匹配对应的展示信息,不同的评估结果对应不同的展示信息,用户在通过音频应用演唱歌曲时,音频应用不仅可以通过评估结果对用户输入音频进行评估,还可以通过形象的展示信息来清楚、直观、准确的反映出输入音频的水准,使用户能够更加直观的了解自己的演唱水平。
附图说明
图1为本发明实施例中音频信息处理的装置所在系统的总线图;
图2为本发明音频信息处理的方法的第一实施例的流程图;
图3为本发明音频信息处理的方法的第二实施例的流程图;
图4为本发明音频信息处理的方法的第三实施例的流程图;
图5为本发明音频信息处理的方法的第四实施例的流程图;
图6为本发明音频信息处理的方法的第五实施例的流程图;
图7为本发明音频信息处理的装置的第一实施例的模块示意图;
图8为本发明音频信息处理的装置的第二实施例的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供的音频信息处理的装置可以是音频应用,包括安装在终端上的客户端和服务器上的数据库。音频信息处理的装置所在的终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、一体机等智能终端,终端与音频应用的服务器通过网络连接,从服务器中获取预设音频的参考信息,例如歌曲的网络地址、歌手信息、专辑名称等,还可从服务器直接下载预设音频文件。
参照图1,图1为本发明实施例中音频信息处理的装置所在系统的总线图,该系统可以包括:至少一个处理器101,例如CPU,至少一个网络接口104,用户接口103,存储器105,至少一个通信总线102。其中,通信总线102用于实现这些组件之间的连接通信。其中,用户接口103可以包括显示屏(Display)、键盘(Keyboard),还可以包括标准的有线接口、无线接口。网络接口104可以包括标准的有线接口、无线接口(如WIFI接口)。存储器105可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器105还可以是至少一个位于远离前述处理器101的存储装置。作为一种计算机存储介质的存储器105中可以包括操作系统、网络通信模块、用户接口模块以及音频信息处理程序。
在图1所示的音频信息处理的装置所在系统中,网络接口104主要用于连接其他服务器或终端,与其他服务器或终端进行数据通信;而用户接口103主要用于接收用户指令,并与用户进行交互;而处理器101可以用于调用存储器105中存储的音频信息处理程序,并执行以下操作:
通过网络模块140获取预设音频和与预设音频对应的参考信息,并通过用户接口103播放播放预设音频;
通过用户接口103获取对应于预设音频的输入音频,并根据预设音频对输入音频进行评估,并通过用户接口103在音频应用的界面上显示评估结果;
根据评估结果,在终端本地数据库或通过网络接口104从参考信息对应的展示信息中查找与评估结果匹配的展示信息;
通过用户接口103在音频应用的界面上显示展示信息。
在一个实施例中,处理器101调用存储器105中存储的音频信息处理程序还可以执行以下操作:
将预设音频划分为多个小节;
通过用户接口103分别获取每一小节预设音频对应的输入音频;
根据预设音频对每一小节输入音频进行评估;
通过用户接口103在音频应用的界面上实时显示每一小节输入音频对应的评估结果。
在一个实施例中,处理器101调用存储器105中存储的音频信息处理程序还可以执行以下操作:
在当前小节输入音频完成评估后,获取当前小节输入音频的评估结果以及当前小节输入音频之前的n小节输入音频的评估结果,n为正整数;
在终端本地数据库或通过网络接口104在参考信息的展示信息库的映射表中,查找当前小节和之前的n小节输入音频的评估结果满足的分值条件;
在终端本地数据库或通过网络接口104从参考信息的展示信息库中查找与满足的分值条件对应的参考信息的展示信息。
在一个实施例中,处理器101调用存储器105中存储的音频信息处理程序还可以执行以下操作:
在当前小节和之前的n小节输入音频的评估结果都大于或等于第一分值时,在终端本地数据库或通过网络接口104从参考信息的展示信息库中查找第一分值对应的参考信息的展示信息;
在当前小节和之前的n小节输入音频的评估结果都小于第二分值时,在终端本地数据库或通过网络接口104从参考信息的展示信息库中查找第二分值对应的参考信息的展示信息;第二分值小于第一分值。
在一个实施例中,处理器101调用存储器105中存储的音频信息处理程序还可以执行以下操作:
在当前小节之前的n小节输入音频的评估结果小于第三分值,当前小节输入音频的评估结果大于或等于第三分值时,在终端本地数据库或通过网络接口104从用户所选歌曲的参考信息对应的展示信息库中查找第三分值对应的参考信息的展示信息。
在一个实施例中,处理器101调用存储器105中存储的音频信息处理程序还可以执行以下操作:
在数据库中,针对一个参考信息建立一个展示信息库;
针对一个参考信息,通过用户接口103接收录入的分值条件、以及参考信息的多个展示信息;
将参考信息的多个展示信息一一对应存储至参考信息的展示信息库中;
将分值条件与参考信息的展示信息的存储地址一一对应建立映射关系,生成参考信息的展示信息库的映射表。
本实施例图1所描述的音频信息处理的装置及其所在系统,根据对用户输入音频的评估结果,在参考信息的展示信息库中查找与评估结果一一匹配对应的展示信息,不同的评估结果对应不同的展示信息,用户在通过音频应用演唱歌曲时,音频应用不仅可以通过评估结果对用户输入音频进行评估,还可以通过形象的展示信息来清楚、直观、准确的反映出输入音频的水准,使用户能够更加直观的了解自己的演唱水平。
如图2所示,图2为本发明音频信息处理的方法的第一实施例的流程图。本实施例提到的音频信息处理的方法,包括:
步骤S10,获取预设音频和与预设音频对应的参考信息,参考信息对应于多个展示信息,并播放预设音频;
本实施例针对音频应用,包括在手机、电脑等智能终端上安装的音频应用的客户端和在服务器中的数据库。用户打开音频应用客户端,进入音频选择界面,选择所需的预设音频,例如选取自己想要演唱的歌曲,想要演奏的音乐等。以演唱歌曲为例,将歌曲的伴奏音频作为本实施例的预设音频,歌手、歌词、专辑名等作为参考信息,歌手的头像和文案信息等作为展示信息。客户端将用户所选歌曲的获取请求上报给服务器,服务器根据获取请求,从服务器数据库的歌曲库中获取用户所选歌曲的伴奏音频,以及该歌曲的歌手信息,还可同时获取该歌曲的其他信息,例如歌词、专辑名等,并下发给客户端。如果服务器的数据库中找不到该歌曲的音频源文件,服务器还可到网络中查找该歌曲,并获取该歌曲的链接地址,将链接地址发送给客户端,客户端根据链接地址获取该歌曲的音频文件。客户端在终端上播放用户所选歌曲的伴奏音频,还可同时在交互界面上显示所选歌曲的歌词。
步骤S20,获取对应于预设音频的输入音频,并根据预设音频对输入音频进行评估,并在音频应用的界面上显示评估结果;
在以演唱歌曲为例的实施例中,用户根据终端播放的伴奏音频和终端屏幕上显示的歌词进行演唱,音频应用通过终端的麦克风录制用户演唱的音频,将录制的用户演唱音频作为输入音频,并根据歌曲原唱的音调、节奏等信息来分析输入音频的音准、节奏的准确度等,得出一个分数值或分数段。进一步的,本实施例可将预设音频划分为多个小节,分别获取每一小节预设音频对应的输入音频,并根据预设音频对每一小节输入音频进行评估,在音频应用的界面上实时显示每一小节输入音频对应的评估结果。例如演唱歌曲为例的实施例中,在评估时可按照歌曲的歌词的断小节来将输入音频划分为多小节,音频应用每录制一小节输入音频,就立即对这一小节输入音频评估,例如获得一个分数,并实时显示在音频应用的界面上指定的区域。评估也可以是在唱完一整首歌曲后给出的一个总的评估结果。
步骤S30,根据评估结果,从参考信息对应的展示信息中查找与评估结果匹配的展示信息;
除了显示评估外,本实施例的音频应用还根据评估的分数高低,显示对应匹配的展示信息,例如当前歌曲的原唱歌手的头像以及文案信息。在服务器的数据库中包括有多个原唱歌手的展示信息库,展示信息库中存储有原唱歌手的多个头像和多种文案信息。原唱歌手的各个头像采用了原唱歌手的不同表情、不同动作、不同造型等进行区分。文案信息则根据原唱歌手的说话习惯进行编辑。在展示信息库中,将原唱歌手的头像、文案信息以及分数值或分数段一一对应。例如,在歌手A的展示信息库中,微笑表情的歌手A头像与文案信息“继续加油哦”对应于分数段70-80分,惊讶表情的歌手A头像与文案信息“唱得不错哦”对应于分数段80-90分,大笑表情的歌手A头像与文案信息“唱得太棒了”对应于分数段90-100分。音频应用的客户端可将每一小节演唱音频的评分结果上报给音频应用的服务器,由服务器根据评分结果查询展示信息库。音频应用的客户端还可以预先从服务器的数据库下载当前歌曲的歌手展示信息库,并保存到客户端所在终端存储器中,音频应用的客户端根据评分结果在终端本地查询展示信息库,不再上传到服务器进行查询。当一小节演唱音频评分结果为75分时,对应分数段70-80分,则匹配的原唱歌手的头像和文案信息为微笑表情的歌手A头像与文案信息“继续加油哦”。
步骤S40,在音频应用的界面上显示展示信息。
音频应用的客户端获得查询到的与评估结果匹配的展示信息后,将其显示在音频应用的界面上指定区域,该区域可以是单独的一个区域,在分数显示区域中显示一小节输入音频的评估结果的同时,还在文案显示区域中显示这一小节输入音频的评估结果匹配的展示信息。此外,也可以是在分数显示区域中按照预设的时间显示一小节输入音频的评估结果,计时到达后,立即显示这一小节输入音频的评估结果匹配的展示信息,显示评估结果的预设时间应少于下一小节输入音频的时长,这样才有足够的时间显示展示信息。
本实施例的音频应用根据对用户输入音频的评估结果,在参考信息的展示信息库中查找与评估结果一一匹配对应的展示信息,不同的评估结果对应不同的展示信息,用户在通过音频应用演唱歌曲时,音频应用不仅可以通过评估结果对用户输入音频进行评估,还可以通过形象的展示信息来清楚、直观、准确的反映出输入音频的水准,使用户能够更加直观的了解自己的演唱水平。
如图3所示,图3为本发明音频信息处理的方法的第二实施例的流程图。本实施例包括图1所示实施例的步骤,其中的步骤S30包括:
步骤S31,在当前小节输入音频完成评估后,获取当前小节输入音频的评估结果以及当前小节输入音频之前的n小节输入音频的评估结果,n为正整数;
步骤S32,在参考信息的展示信息库的映射表中,查找当前小节和之前的n小节输入音频的评估结果满足的分值条件;
步骤S33,从参考信息的展示信息库中查找与满足的分值条件对应的参考信息的展示信息。
本实施例的音频应用可以不在每一小节输入音频完成后都更换显示的参考信息展示信息,可在连续几小节输入音频的评估结果满足一个分值条件后,再更换显示的内容。例如在以演唱歌曲为例的实施例中,在歌手的展示信息库中,可预先设置一映射表,该映射表中存储有多个分值条件以及分别与各个分值条件一一对应的映射地址,一个映射地址指向当前歌手展示信息库中的一个歌手头像和一个文案信息。音频应用在对当前小节输入音频评估后,获取当前小节输入音频的评估结果,还获取之前的几小节输入音频的评估结果,获取的评估结果数量与分值条件中的设置的数量值一致。
例如,分值条件B为“连续3小节得分大于90分”,对应展示信息库中的大笑表情的歌手A头像与文案信息“唱得太棒了”的存储地址,分值条件C为“连续2小节得分小于60分”,对应展示信息库中的张大嘴巴的歌手A头像与文案信息“加油加油”的存储地址;音频应用在对第一小节和第二小节评估后,比较第一小节和第二小节的评估是否小于60分;如果是,则音频应用从展示信息库的映射表中获取分值条件C对应的存储地址,并根据存储地址在展示信息库的中找到张大嘴巴的歌手A头像与文案信息“加油加油”,将其显示在音频应用的界面上;如果否,则音频应用继续录制第三小节,并对第三小节评估,在比较第一小节、第二小节和第三小节的评估是否都大于90分;如果是,则音频应用从展示信息库的映射表中获取分值条件B对应的存储地址,并根据存储地址在展示信息库的中找到大笑表情的歌手A头像与文案信息“唱得太棒了”,将其显示在音频应用的界面上;如果否,则音频应用还比较第二小节和第三小节的评估是否小于60分;如果仍然否,则继续录制下一小节。
本实施例的音频应用在连续几小节输入音频的评估结果满足一个分值条件后,再更换显示的展示信息,避免了因频繁的查找和更换显示内容而影响终端或服务器的处理速度,同时,由于该文案信息是针对连续的几个评估结果得到的,音频应用不会因为偶然一小节分数较高给出较高评价的文案信息,因此能够更好的针对用户演唱的总体水平给出客观的文案信息,提高音频应用的实用性。
如图4所示,图4为本发明音频信息处理的方法的第三实施例的流程图。本实施例包括图3所示实施例的步骤,其中的步骤S33包括:
步骤S331,在当前小节和之前的n小节输入音频的评估结果都大于或等于第一分值时,从参考信息的展示信息库中查找第一分值对应的参考信息的展示信息;
步骤S332,在当前小节和之前的n小节输入音频的评估结果都小于第二分值时,从参考信息的展示信息库中查找第二分值对应的参考信息的展示信息;第二分值小于第一分值。
本实施例的分值条件评出了演唱水平普遍较好的情况和演唱水平普遍较差的情况。当连续几小节输入音频的评估结果都能够达到第一分值时,则认为该用户当前演唱水平普遍较好;当连续几小节输入音频的评估结果都低于第二分值时,则认为该用户当前演唱水平普遍较差,需要鼓励一下。
例如,第一分值为90分,对应展示信息库中的大笑表情的歌手A头像与文案信息“唱得太棒了”,第二分值为60分,对应展示信息库中的张大嘴巴的歌手A头像与文案信息“加油加油”;音频应用在对第一小节和第二小节评估后,比较第一小节和第二小节的评估是否小于60分;如果是,则显示张大嘴巴的歌手A头像与文案信息“加油加油”;如果否,则音频应用继续录制第三小节,并对第三小节评估,在比较第一小节、第二小节和第三小节的评估是否都大于90分;如果是,则显示大笑表情的歌手A头像与文案信息“唱得太棒了”;如果否,则音频应用还比较第二小节和第三小节的评估是否小于60分;如果是,则显示60分对应的头像和文案;如果仍然否,则继续录制下一小节。
本实施例采用大于或等于第一分值评出了演唱水平普遍较好的情况,采用小于第二分值评出了演唱水平普遍较差的情况,针对不同的演唱水平,采用不同的文案内容,有针对性的显示互动文案,进一步提高了音频应用与用户之间互动方式的多样性,能够更好的针对用户演唱的总体水平给出客观的文案信息,同时还避免了因频繁的查找和更换显示内容而影响终端或服务器的处理速度,有利于提高音频应用的响应速度。
如图5所示,图5为本发明音频信息处理的方法的第四实施例的流程图。本实施例包括图3所示实施例的步骤,其中的步骤S33还包括:
步骤S333,在当前小节之前的n小节输入音频的评估结果小于第三分值,当前小节输入音频的评估结果大于或等于第三分值时,从用户所选歌曲的参考信息对应的展示信息库中查找第三分值对应的参考信息的展示信息。
本实施例中,可设置第三分值,当之前连续多小节的评估都较低,当前小节的评估较高时,则表示演唱水平有明显进步。例如,第三分值为70分,对应展示信息库中的竖大拇指的歌手A头像与文案信息“进步很大哦”;音频应用在对第一小节至第四小节评估后,比较第一小节至第三小节的评估是否小于70分,第四小节的评估是否大于或等于70分;如果是,则显示竖大拇指的歌手A头像与文案信息“进步很大哦”;如果否,则继续录制下一小节。由于本实施例采用第三分值作为分界线,判断出演唱水平有明显进步的情况,有针对性的显示互动文案,进一步提高了音频应用与用户之间互动方式的多样性,能够更好的针对用户演唱的总体水平给出客观的文案信息,同时还避免了因频繁的查找和更换显示内容而影响终端或服务器的处理速度,有利于提高音频应用的响应速度。
如图6所示,图6为本发明音频信息处理的方法的第五实施例的流程图。本实施例针对图2至5所示实施例中的展示信息库,采用以下步骤建立展示信息库:
步骤S51,在数据库中,针对一个参考信息建立一个展示信息库;
步骤S52,针对一个参考信息,接收录入的分值条件、以及参考信息的多个展示信息;
步骤S53,将参考信息的多个展示信息一一对应存储至参考信息的展示信息库中;
步骤S54,将分值条件与参考信息的展示信息的存储地址一一对应建立映射关系,生成参考信息的展示信息库的映射表。
本实施例针对音频应用的服务器建立展示信息库。首先在数据库中,针对每一个参考信息建立对应的展示信息库。在该参考信息的展示信息库中录入至少一个分值条件,还录入参考信息的多个展示信息。以演唱歌曲为例的实施例中,原唱歌手的各个头像采用了原唱歌手的不同表情、不同动作、不同造型等进行区分。文案信息则根据原唱歌手的说话习惯进行编辑。在展示信息库中,将原唱歌手的头像、文案信息一一对应存储,一个头像和一个文案信息对应于一个存储地址。展示信息库中还可预先设置一映射表,该映射表中存储有多个分值条件以及分别与各个分值条件一一对应的映射地址,一个映射地址指向当前歌手展示信息库中的一个歌手头像和一个文案信息,即一个映射地址与一个存储地址相等或存在映射关系。本实施例在展示信息库中采用映射表建立分值条件与参考信息的展示信息的存储地址一一对应的映射关系,方便评估结果在满足分值条件后查找对应的展示信息进行显示;同时,用户在通过音频应用演唱歌曲时,音频应用可以通过形象的歌手头像和语言来与用户交互,使用户在演唱歌曲时就像是与参考信息在沟通一样,有利于提高音频应用与用户之间互动方式的多样性。
如图7所示,图7为本发明音频信息处理的装置的第一实施例的模块示意图。本实施例提出的音频信息处理的装置,包括:
播放模块110,用于获取预设音频和与预设音频对应的参考信息,参考信息对应于多个展示信息,并播放预设音频;
评估模块120,用于获取对应于预设音频的输入音频,并根据预设音频对输入音频进行评估;
显示模块140,用于在音频应用的界面上显示评估结果;
匹配模块130,用于根据评估结果,从参考信息对应的展示信息中查找与评估结果匹配的展示信息;
显示模块140还用于,在音频应用的界面上显示展示信息。
本实施例针对音频应用,包括在手机、电脑等智能终端上安装的音频应用的客户端和在服务器中的数据库。用户打开音频应用客户端,进入音频选择界面,选择所需的预设音频,例如选取自己想要演唱的歌曲,想要演奏的音乐等。以演唱歌曲为例,将歌曲的伴奏音频作为本实施例的预设音频,歌手、歌词、专辑名等作为参考信息,歌手的头像和文案信息等作为展示信息。客户端将用户所选歌曲的获取请求上报给服务器,服务器根据获取请求,从服务器数据库的歌曲库中获取用户所选歌曲的伴奏音频,以及该歌曲的歌手信息,还可同时获取该歌曲的其他信息,例如歌词、专辑名等,并下发给客户端。如果服务器的数据库中找不到该歌曲的音频源文件,服务器还可到网络中查找该歌曲,并获取该歌曲的链接地址,将链接地址发送给客户端,客户端根据链接地址获取该歌曲的音频文件。客户端在终端上播放用户所选歌曲的伴奏音频,还可同时在交互界面上显示所选歌曲的歌词。
在以演唱歌曲为例的实施例中,用户根据终端播放的伴奏音频和终端屏幕上显示的歌词进行演唱,音频应用通过终端的麦克风录制用户演唱的音频,将录制的用户演唱音频作为输入音频,并根据歌曲原唱的音调、节奏等信息来分析输入音频的音准、节奏的准确度等,得出一个分数值或分数段。
进一步的,评估模块120还用于,将预设音频划分为多个小节;分别获取每一小节预设音频对应的输入音频;根据预设音频对每一小节输入音频进行评估;显示模块140还用于,在音频应用的界面上实时显示每一小节输入音频对应的评估结果。例如演唱歌曲为例的实施例中,在评估时可按照歌曲的歌词的断小节来将输入音频划分为多小节,音频应用每录制一小节输入音频,就立即对这一小节输入音频评估,例如获得一个分数,并实时显示在音频应用的界面上指定的区域。评估也可以是在唱完一整首歌曲后给出的一个总的评估结果。
除了显示评估外,本实施例的音频应用还根据评估的分数高低,显示对应匹配的展示信息,例如当前歌曲的原唱歌手的头像以及文案信息。在服务器的数据库中包括有多个原唱歌手的展示信息库,展示信息库中存储有原唱歌手的多个头像和多种文案信息。原唱歌手的各个头像采用了原唱歌手的不同表情、不同动作、不同造型等进行区分。文案信息则根据原唱歌手的说话习惯进行编辑。在展示信息库中,将原唱歌手的头像、文案信息以及分数值或分数段一一对应。例如,在歌手A的展示信息库中,微笑表情的歌手A头像与文案信息“继续加油哦”对应于分数段70-80分,惊讶表情的歌手A头像与文案信息“唱得不错哦”对应于分数段80-90分,大笑表情的歌手A头像与文案信息“唱得太棒了”对应于分数段90-100分。音频应用的客户端可将每一小节演唱音频的评分结果上报给音频应用的服务器,由服务器根据评分结果查询展示信息库。音频应用的客户端还可以预先从服务器的数据库下载当前歌曲的歌手展示信息库,并保存到客户端所在终端存储器中,音频应用的客户端根据评分结果在终端本地查询展示信息库,不再上传到服务器进行查询。当一小节演唱音频评分结果为75分时,对应分数段70-80分,则匹配的原唱歌手的头像和文案信息为微笑表情的歌手A头像与文案信息“继续加油哦”。
音频应用的客户端获得查询到的与评估结果匹配的展示信息后,将其显示在音频应用的界面上指定区域,该区域可以是单独的一个区域,在分数显示区域中显示一小节输入音频的评估结果的同时,还在文案显示区域中显示这一小节输入音频的评估结果匹配的展示信息。此外,也可以是在分数显示区域中按照预设的时间显示一小节输入音频的评估结果,计时到达后,立即显示这一小节输入音频的评估结果匹配的展示信息,显示评估结果的预设时间应少于下一小节输入音频的时长,这样才有足够的时间显示展示信息。
本实施例的音频应用根据对用户输入音频的评估结果,在参考信息的展示信息库中查找与评估结果一一匹配对应的展示信息,不同的评估结果对应不同的展示信息,用户在通过音频应用演唱歌曲时,音频应用不仅可以通过评估结果对用户输入音频进行评估,还可以通过形象的展示信息来清楚、直观、准确的反映出输入音频的水准,使用户能够更加直观的了解自己的演唱水平。
进一步的,匹配模块130还用于:
在当前小节输入音频完成评估后,获取当前小节输入音频的评估结果以及当前小节输入音频之前的n小节输入音频的评估结果,n为正整数;
在参考信息的展示信息库的映射表中,查找当前小节和之前的n小节输入音频的评估结果满足的分值条件;
从参考信息的展示信息库中查找与满足的分值条件对应的参考信息的展示信息。
本实施例的音频应用可以不在每一小节输入音频完成后都更换显示的参考信息展示信息,可在连续几小节输入音频的评估结果满足一个分值条件后,再更换显示的内容。例如在以演唱歌曲为例的实施例中,在歌手的展示信息库中,可预先设置一映射表,该映射表中存储有多个分值条件以及分别与各个分值条件一一对应的映射地址,一个映射地址指向当前歌手展示信息库中的一个歌手头像和一个文案信息。音频应用在对当前小节输入音频评估后,获取当前小节输入音频的评估结果,还获取之前的几小节输入音频的评估结果,获取的评估结果数量与分值条件中的设置的数量值一致。
例如,分值条件B为“连续3小节得分大于90分”,对应展示信息库中的大笑表情的歌手A头像与文案信息“唱得太棒了”的存储地址,分值条件C为“连续2小节得分小于60分”,对应展示信息库中的张大嘴巴的歌手A头像与文案信息“加油加油”的存储地址;音频应用在对第一小节和第二小节评估后,比较第一小节和第二小节的评估是否小于60分;如果是,则音频应用从展示信息库的映射表中获取分值条件C对应的存储地址,并根据存储地址在展示信息库的中找到张大嘴巴的歌手A头像与文案信息“加油加油”,将其显示在音频应用的界面上;如果否,则音频应用继续录制第三小节,并对第三小节评估,在比较第一小节、第二小节和第三小节的评估是否都大于90分;如果是,则音频应用从展示信息库的映射表中获取分值条件B对应的存储地址,并根据存储地址在展示信息库的中找到大笑表情的歌手A头像与文案信息“唱得太棒了”,将其显示在音频应用的界面上;如果否,则音频应用还比较第二小节和第三小节的评估是否小于60分;如果仍然否,则继续录制下一小节。
本实施例的音频应用在连续几小节输入音频的评估结果满足一个分值条件后,再更换显示的展示信息,避免了因频繁的查找和更换显示内容而影响终端或服务器的处理速度,同时,由于该文案信息是针对连续的几个评估结果得到的,音频应用不会因为偶然一小节分数较高给出较高评价的文案信息,因此能够更好的针对用户演唱的总体水平给出客观的文案信息,提高音频应用的实用性。
进一步的,匹配模块130还用于:
在当前小节和之前的n小节输入音频的评估结果都大于或等于第一分值时,从参考信息的展示信息库中查找第一分值对应的参考信息的展示信息;
在当前小节和之前的n小节输入音频的评估结果都小于第二分值时,从参考信息的展示信息库中查找第二分值对应的参考信息的展示信息;第二分值小于第一分值。
本实施例的分值条件评出了演唱水平普遍较好的情况和演唱水平普遍较差的情况。当连续几小节输入音频的评估结果都能够达到第一分值时,则认为该用户当前演唱水平普遍较好;当连续几小节输入音频的评估结果都低于第二分值时,则认为该用户当前演唱水平普遍较差,需要鼓励一下。
例如,第一分值为90分,对应展示信息库中的大笑表情的歌手A头像与文案信息“唱得太棒了”,第二分值为60分,对应展示信息库中的张大嘴巴的歌手A头像与文案信息“加油加油”;音频应用在对第一小节和第二小节评估后,比较第一小节和第二小节的评估是否小于60分;如果是,则显示张大嘴巴的歌手A头像与文案信息“加油加油”;如果否,则音频应用继续录制第三小节,并对第三小节评估,在比较第一小节、第二小节和第三小节的评估是否都大于90分;如果是,则显示大笑表情的歌手A头像与文案信息“唱得太棒了”;如果否,则音频应用还比较第二小节和第三小节的评估是否小于60分;如果是,则显示60分对应的头像和文案;如果仍然否,则继续录制下一小节。
本实施例采用大于或等于第一分值评出了演唱水平普遍较好的情况,采用小于第二分值评出了演唱水平普遍较差的情况,针对不同的演唱水平,采用不同的文案内容,有针对性的显示互动文案,进一步提高了音频应用与用户之间互动方式的多样性,能够更好的针对用户演唱的总体水平给出客观的文案信息,同时还避免了因频繁的查找和更换显示内容而影响终端或服务器的处理速度,有利于提高音频应用的响应速度。
进一步的,匹配模块130还用于:在当前小节之前的n小节输入音频的评估结果小于第三分值,当前小节输入音频的评估结果大于或等于第三分值时,从用户所选歌曲的参考信息对应的展示信息库中查找第三分值对应的参考信息的展示信息。
本实施例中,可设置第三分值,当之前连续多小节的评估都较低,当前小节的评估较高时,则表示演唱水平有明显进步。例如,第三分值为70分,对应展示信息库中的竖大拇指的歌手A头像与文案信息“进步很大哦”;音频应用在对第一小节至第四小节评估后,比较第一小节至第三小节的评估是否小于70分,第四小节的评估是否大于或等于70分;如果是,则显示竖大拇指的歌手A头像与文案信息“进步很大哦”;如果否,则继续录制下一小节。由于本实施例采用第三分值作为分界线,判断出演唱水平有明显进步的情况,有针对性的显示互动文案,进一步提高了音频应用与用户之间互动方式的多样性,能够更好的针对用户演唱的总体水平给出客观的文案信息,同时还避免了因频繁的查找和更换显示内容而影响终端或服务器的处理速度,有利于提高音频应用的响应速度。
如图8所示,图8为本发明音频信息处理的装置的第二实施例的模块示意图。本实施例包括图7所示实施例中的模块,还包括建立模块150,用于:
在数据库中,针对一个参考信息建立一个展示信息库;
针对一个参考信息,接收录入的分值条件、以及参考信息的多个展示信息;
将参考信息的多个展示信息一一对应存储至参考信息的展示信息库中;
将分值条件与参考信息的展示信息的存储地址一一对应建立映射关系,生成参考信息的展示信息库的映射表。
本实施例针对音频应用的服务器建立展示信息库。首先在数据库中,针对每一个参考信息建立对应的展示信息库。在该参考信息的展示信息库中录入至少一个分值条件,还录入参考信息的多个展示信息。以演唱歌曲为例的实施例中,原唱歌手的各个头像采用了原唱歌手的不同表情、不同动作、不同造型等进行区分。文案信息则根据原唱歌手的说话习惯进行编辑。在展示信息库中,将原唱歌手的头像、文案信息一一对应存储,一个头像和一个文案信息对应于一个存储地址。展示信息库中还可预先设置一映射表,该映射表中存储有多个分值条件以及分别与各个分值条件一一对应的映射地址,一个映射地址指向当前歌手展示信息库中的一个歌手头像和一个文案信息,即一个映射地址与一个存储地址相等或存在映射关系。本实施例在展示信息库中采用映射表建立分值条件与参考信息的展示信息的存储地址一一对应的映射关系,方便评估结果在满足分值条件后查找对应的展示信息进行显示;同时,用户在通过音频应用演唱歌曲时,音频应用可以通过形象的歌手头像和语言来与用户交互,使用户在演唱歌曲时就像是与参考信息在沟通一样,有利于提高音频应用与用户之间互动方式的多样性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语小节“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (9)
1.一种音频信息处理的方法,其特征在于,包括步骤:
获取预设音频和与所述预设音频对应的参考信息,所述参考信息对应于多个展示信息,并播放所述预设音频,所述展示信息包括所述预设音频原唱歌手的头像和文案信息,其中,将所述预设音频划分为多个小节;
获取对应于所述预设音频的输入音频,其中,所述输入音频包括多个小节,分别获取每一小节预设音频对应的输入音频;
根据所述预设音频对所述输入音频的每一小节输入音频进行评估,得到与每一小节输入音频相对应的评估结果;
根据评估结果,从所述参考信息对应的多个展示信息中查找与所述评估结果匹配的与所述预设音频原唱歌手的头像和文案信息对应的展示信息;
在音频应用的界面上实时显示每一小节输入音频对应的评估结果和与所述评估结果匹配的与所述预设音频原唱歌手的头像和文案信息对应的展示信息,其中,在当前小节输入音频完成评估后,获取当前小节输入音频的评估结果以及当前小节输入音频之前的n小节输入音频的评估结果,n为正整数,在所述参考信息的展示信息库的映射表中,查找当前小节和之前的n小节输入音频的评估结果满足的分值条件,从所述参考信息的展示信息库中查找与所述满足的分值条件对应的所述参考信息的展示信息。
2.如权利要求1所述的音频信息处理的方法,其特征在于,所述从所述参考信息对应的展示信息库中查找与所述满足的分值条件对应的所述参考信息的展示信息的步骤包括:
在当前小节和之前的n小节输入音频的评估结果都大于或等于第一分值时,从所述参考信息的展示信息库中查找所述第一分值对应的所述参考信息的展示信息;
在当前小节和之前的n小节输入音频的评估结果都小于第二分值时,从所述参考信息的展示信息库中查找所述第二分值对应的所述参考信息的展示信息;所述第二分值小于所述第一分值。
3.如权利要求1或2所述的音频信息处理的方法,其特征在于,所述从所述参考信息对应的展示信息库中查找与所述满足的分值条件对应的所述参考信息的展示信息的步骤还包括:
在当前小节之前的n小节输入音频的评估结果小于第三分值,当前小节输入音频的评估结果大于或等于所述第三分值时,从用户所选歌曲的参考信息对应的展示信息库中查找所述第三分值对应的所述参考信息的展示信息。
4.如权利要求1所述的音频信息处理的方法,其特征在于,所述展示信息库采用以下步骤建立:
在数据库中,针对一个参考信息建立一个展示信息库;
针对一个参考信息,接收录入的分值条件、以及所述参考信息的多个展示信息;
将所述参考信息的多个展示信息一一对应存储至所述参考信息的展示信息库中;
将所述分值条件与所述参考信息的展示信息的存储地址一一对应建立映射关系,生成所述参考信息的展示信息库的映射表。
5.一种音频信息处理的装置,其特征在于,包括:
播放模块,用于获取预设音频和与所述预设音频对应的参考信息,所述参考信息对应于多个展示信息,并播放所述预设音频,所述展示信息包括所述预设音频原唱歌手的头像和文案信息,其中,将所述预设音频划分为多个小节;
评估模块,用于获取对应于所述预设音频的输入音频,并根据所述预设音频对所述输入音频的每一小节输入音频进行评估,得到与每一小节输入音频相对应的评估结果,其中,所述输入音频包括多个小节,分别获取每一小节预设音频对应的输入音频;
显示模块,用于在音频应用的界面上显示所述评估结果;
匹配模块,用于根据评估结果,从所述参考信息对应的多个展示信息中查找与所述评估结果匹配的与所述预设音频原唱歌手的头像和文案信息对应的展示信息;
所述显示模块还用于,在所述音频应用的界面上实时显示每一小节输入音频对应的评估结果和与所述评估结果匹配的与所述预设音频原唱歌手的头像和文案信息对应的展示信息;
所述匹配模块还用于,在当前小节输入音频完成评估后,获取当前小节输入音频的评估结果以及当前小节输入音频之前的n小节输入音频的评估结果,n为正整数,在所述参考信息的展示信息库的映射表中,查找当前小节和之前的n小节输入音频的评估结果满足的分值条件,从所述参考信息的展示信息库中查找与所述满足的分值条件对应的所述参考信息的展示信息。
6.如权利要求5所述的音频信息处理的装置,其特征在于,所述匹配模块还用于:
在当前小节和之前的n小节输入音频的评估结果都大于或等于第一分值时,从所述参考信息的展示信息库中查找所述第一分值对应的所述参考信息的展示信息;
在当前小节和之前的n小节输入音频的评估结果都小于第二分值时,从所述参考信息的展示信息库中查找所述第二分值对应的所述参考信息的展示信息;所述第二分值小于所述第一分值。
7.如权利要求5或6所述的音频信息处理的装置,其特征在于,所述匹配模块还用于:
在当前小节之前的n小节输入音频的评估结果小于第三分值,当前小节输入音频的评估结果大于或等于所述第三分值时,从用户所选歌曲的参考信息对应的展示信息库中查找所述第三分值对应的所述参考信息的展示信息。
8.如权利要求5所述的音频信息处理的装置,其特征在于,还包括建立模块,用于:
在数据库中,针对一个参考信息建立一个展示信息库;
针对一个参考信息,接收录入的分值条件、以及所述参考信息的多个展示信息;
将所述参考信息的多个展示信息一一对应存储至所述参考信息的展示信息库中;
将所述分值条件与所述参考信息的展示信息的存储地址一一对应建立映射关系,生成所述参考信息的展示信息库的映射表。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序可被终端设备或计算机运行时执行所述权利要求1至4任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510489037.XA CN106445964B (zh) | 2015-08-11 | 2015-08-11 | 音频信息处理的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510489037.XA CN106445964B (zh) | 2015-08-11 | 2015-08-11 | 音频信息处理的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106445964A CN106445964A (zh) | 2017-02-22 |
CN106445964B true CN106445964B (zh) | 2021-05-14 |
Family
ID=58093314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510489037.XA Active CN106445964B (zh) | 2015-08-11 | 2015-08-11 | 音频信息处理的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106445964B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108806730B (zh) * | 2018-06-29 | 2020-11-24 | 广州酷狗计算机科技有限公司 | 音频处理方法、装置及计算机可读存储介质 |
CN110265051A (zh) * | 2019-06-04 | 2019-09-20 | 福建小知大数信息科技有限公司 | 应用于基础音乐视唱教育的视唱音频智能评分建模方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3598598B2 (ja) * | 1995-07-31 | 2004-12-08 | ヤマハ株式会社 | カラオケ装置 |
CN101707679A (zh) * | 2009-10-30 | 2010-05-12 | 深圳创维-Rgb电子有限公司 | 一种电视机及其卡拉ok评分系统和方法 |
CN102340482A (zh) * | 2010-07-21 | 2012-02-01 | 崔信奎 | 基于网络的练歌房服务系统及利用该服务系统的用户终端 |
JP5747562B2 (ja) * | 2010-10-28 | 2015-07-15 | ヤマハ株式会社 | 音響処理装置 |
EP2573761B1 (en) * | 2011-09-25 | 2018-02-14 | Yamaha Corporation | Displaying content in relation to music reproduction by means of information processing apparatus independent of music reproduction apparatus |
CN103165119B (zh) * | 2013-01-31 | 2015-12-09 | 华为技术有限公司 | K歌方法及系统 |
JP6165619B2 (ja) * | 2013-12-13 | 2017-07-19 | 株式会社東芝 | 情報処理装置、情報処理方法、および情報処理プログラム |
-
2015
- 2015-08-11 CN CN201510489037.XA patent/CN106445964B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN106445964A (zh) | 2017-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2760014B1 (en) | Interactive score curve for adjusting audio parameters of a user's recording. | |
CN103137167B (zh) | 播放音乐的方法及音乐播放器 | |
CN105810211B (zh) | 一种音频数据的处理方法及终端 | |
US9064484B1 (en) | Method of providing feedback on performance of karaoke song | |
US10580394B2 (en) | Method, client and computer storage medium for processing information | |
CN106688035B (zh) | 声音合成装置及声音合成方法 | |
EP2461259A2 (en) | Information processing device and method, information processing system, and program | |
EP3839938B1 (en) | Karaoke query processing system | |
US20240220558A1 (en) | Systems and methods for recommending collaborative content | |
CN105243093A (zh) | 一种演唱者推荐方法及装置 | |
CN106445964B (zh) | 音频信息处理的方法和装置 | |
US20140122606A1 (en) | Information processing device, information processing method, and program | |
JP2011133882A (ja) | 音声付映像合成システム及び音声付映像合成方法 | |
KR20120129015A (ko) | 어학 컨텐츠 생성 방법 및 이를 위한 단말기 | |
CN104681048A (zh) | 多媒体读取控制装置、曲线获取装置、电子设备、曲线提供装置及方法 | |
KR101713242B1 (ko) | 악보 기반 검색 서비스 제공 장치 및 이를 이용한 방법 | |
KR101547525B1 (ko) | 사용자의 입력을 반영한 자동 음악 선곡 장치 및 방법 | |
JP5296813B2 (ja) | 楽曲レコメンド装置、方法及びプログラム | |
JP4916945B2 (ja) | 楽曲情報付与サーバ、端末、及び楽曲情報付与システム | |
JP6630628B2 (ja) | カラオケシステム、推奨楽曲提示プログラム | |
KR101054904B1 (ko) | 음악지도 생성 시스템 및 방법 | |
US20140142932A1 (en) | Method for Producing Audio File and Terminal Device | |
JP2012247558A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP6176934B2 (ja) | 歌唱採点順位表示システム | |
KR20170058504A (ko) | 악보 구현 및 음원 재생 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |