CN107871012A - 音频处理方法、装置、存储介质及终端 - Google Patents

音频处理方法、装置、存储介质及终端 Download PDF

Info

Publication number
CN107871012A
CN107871012A CN201711172096.XA CN201711172096A CN107871012A CN 107871012 A CN107871012 A CN 107871012A CN 201711172096 A CN201711172096 A CN 201711172096A CN 107871012 A CN107871012 A CN 107871012A
Authority
CN
China
Prior art keywords
audio
rhythm
target
character
pending
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711172096.XA
Other languages
English (en)
Inventor
白伟民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kugou Computer Technology Co Ltd
Original Assignee
Guangzhou Kugou Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kugou Computer Technology Co Ltd filed Critical Guangzhou Kugou Computer Technology Co Ltd
Priority to CN201711172096.XA priority Critical patent/CN107871012A/zh
Publication of CN107871012A publication Critical patent/CN107871012A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本发明公开了一种音频处理方法、装置、存储介质及终端,属于多媒体技术领域。所述方法包括:在接收到音频处理指令后,获取与待处理音频匹配的多媒体提示字符;对所述多媒体字符进行分词处理,得到目标分词结果;获取所述待处理音频的目标节奏类型;根据所述目标节奏类型指示的节奏以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到待播放的目标音频。由于上述音频处理方式完全无需依赖于具有相关专业知识的专业人员,即使普通用户也可实现,不存在技术门槛,所以更为便捷与智能化。

Description

音频处理方法、装置、存储介质及终端
技术领域
本发明涉及多媒体技术领域,特别涉及一种音频处理方法、装置、存储介质及终端。
背景技术
在驾车出行、聚餐宴会、放松消遣以及学习工作等场景下,播放音乐无疑成为了越来越多人的选择。针对不同的人群来说,通常情况下喜欢的音频类型也是不同的。比如有的人喜欢摇滚音乐、有的人喜欢rap音乐、有的人喜欢乡村音乐、有的人喜欢民谣音乐、有的人喜欢流行音乐。
为了满足不同人群的需求,时下具有相关音乐知识的专业人员通常会对音频进行各种不同节奏的变换处理,以制作同一歌曲的不同曲风版本。例如,将原版的流行歌曲转换为rap歌曲。
由于上述音频处理方式完全依赖于具有相关音乐知识的专业人员,普通用户基本无法实现,所以存在较高的技术门槛,不够便捷与智能化。
发明内容
本发明实施例提供了一种音频处理方法、装置、存储介质及终端,解决了相关技术在进行音频处理时不够便捷与智能化的问题。所述技术方案如下:
第一方面,提供了一种音频处理方法,所述方法包括:
在接收到音频处理指令后,获取与待处理音频匹配的多媒体提示字符;
对所述多媒体字符进行分词处理,得到目标分词结果;
获取所述待处理音频的目标节奏类型;
根据所述目标节奏类型指示的节奏以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到待播放的目标音频。
在另一个实施例中,所述根据所述目标节奏类型指示的节奏以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到待播放的目标音频,包括:
获取所述多媒体提示字符的时间轴信息;
显示所述时间轴信息;
接收用户输入的节奏调节位置,所述节奏调节位置由所述用户基于所述时间轴信息确定;
根据所述目标节奏类型指示的节奏、所述节奏调节位置以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到所述目标音频。
在另一个实施例中,所述根据所述目标节奏类型指示的节奏、所述节奏调节位置以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到所述目标音频,包括:
根据所述节奏调节位置,在所述目标分词结果中确定第一多媒体提示字符,所述第一多媒体提示字符为待添加所述节奏的字符;
根据所述目标节奏类型指示的节奏,为所述第一多媒体提示字符进行节奏添加处理,得到第一子音频;
将与第二多媒体提示字符匹配的第二子音频与所述第一子音频进行合成,得到所述目标音频;
其中,所述第二多媒体提示字符为除了所述第一多媒体提示字符以外的其他字符。
在另一个实施例中,所述获取所述待处理音频的目标节奏类型,包括:
在接收到所述音频处理指令后,显示用于展示节奏类型的节奏样本列表;
在检测到用户对所述节奏样本列表中任一个节奏类型的选中操作后,将被选中的节奏类型确定为所述目标节奏类型。
在另一个实施例中,所述方法还包括:
显示用于启动音频处理功能的功能启动选项;
在检测到用户对所述功能启动选项的选中操作后,显示音频列表界面;
获取用户在所述音频列表界面上选中的音频,将被选中的音频确定为所述待处理音频,并显示音频处理选项;
在检测到所述用户对所述音频处理选项的选中操作后,确定接收到所述音频处理指令,执行对所述待处理音频进行节奏变换处理的步骤。
第二方面,提供了一种音频处理装置,所述装置包括:
第一获取模块,用于在接收到音频处理指令后,获取与待处理音频匹配的多媒体提示字符;
第一处理模块,用于对所述多媒体字符进行分词处理,得到目标分词结果;
第二获取模块,用于获取所述待处理音频的目标节奏类型;
第二处理模块,用于根据所述目标节奏类型指示的节奏以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到待播放的目标音频。
在另一个实施例中,所述第二处理模块,用于获取所述多媒体提示字符的时间轴信息;显示所述时间轴信息;接收用户输入的节奏调节位置,所述节奏调节位置由所述用户基于所述时间轴信息确定;根据所述目标节奏类型指示的节奏、所述节奏调节位置以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到所述目标音频。
在另一个实施例中,所述第二处理模块,用于根据所述节奏调节位置,在所述目标分词结果中确定第一多媒体提示字符,所述第一多媒体提示字符为待添加所述节奏的字符;根据所述目标节奏类型指示的节奏,为所述第一多媒体提示字符进行节奏添加处理,得到第一子音频;将与第二多媒体提示字符匹配的第二子音频与所述第一子音频进行合成,得到所述目标音频;其中,所述第二多媒体提示字符为除了所述第一多媒体提示字符以外的其他字符。
在另一个实施例中,所述第二获取模块,用于在接收到所述音频处理指令后,显示用于展示节奏类型的节奏样本列表;在检测到用户对所述节奏样本列表中任一个节奏类型的选中操作后,将被选中的节奏类型确定为所述目标节奏类型。
在另一个实施例中,所述装置还包括:
显示模块,用于显示用于启动音频处理功能的功能启动选项;
所述显示模块,还用于在检测到用户对所述功能启动选项的选中操作后,显示音频列表界面;
所述第一获取模块,用于获取用户在所述音频列表界面上选中的音频,将被选中的音频确定为所述待处理音频;
所述显示模块,还用于显示音频处理选项;
所述第二处理模块,用于在检测到所述用户对所述音频处理选项的选中操作后,确定接收到所述音频处理指令,执行对所述待处理音频进行节奏变换处理的步骤。
第三方面,提供了一种存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上述第一方面所述的音频处理方法。
第四方面,提供了一种用于音频处理的终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述第一方面所述的音频处理方法。
本发明实施例提供的技术方案带来的有益效果是:
终端在接收到音频处理指令后,首先获取待处理音频的多媒体提示字符并对这一多媒体字符进行分词处理,之后终端进一步地获取待处理音频的目标节奏类型,并根据目标节奏类型指示的节奏以及得到的目标分词结果,实现对待处理音频的节奏变换处理,由于上述音频处理方式完全无需依赖于具有相关专业知识的专业人员,即使普通用户也可实现,不存在技术门槛,所以更为便捷与智能化。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种音频处理方法的流程图;
图2是本发明实施例提供的第一种界面显示示意图;
图3是本发明实施例提供的第二种界面显示示意图;
图4是本发明实施例提供的第三种界面显示示意图;
图5是本发明实施例提供的第四种界面显示示意图;
图6是本发明实施例提供的一种音频处理装置的结构示意图;
图7是本发明实施例提供的一种用于音频处理的终端的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在对本发明实施例进行详细地解释之前,先对本发明实施例涉及的一些名词进行一下解释说明。
音频:在本发明实施例中指代歌曲,一项音频即为一首歌曲。
多媒体提示字符:在本发明实施例中指代歌曲的歌词(Lyric)。
节奏:指代音乐运动中音的长短和强弱。节奏在音乐中与节拍并存,二者以音的长短、强弱及其相互关系的固定性和准确性来组织音乐。
其中,依据音乐节奏的不同,歌曲可划分为多种曲风,比如爵士、摇滚、乡村、民谣、流行、rap等等,本发明实施例对此不进行具体限定。
本发明实施例提供的音频处理方法用于实现对音频的节奏变换,使得一项音频可以由原始曲风转换为其他类型的曲风,比如从流行歌曲改编为rap歌曲。
另外,需要说明的第一点是,本发明实施例提供的音频处理方法的执行主体为终端。换一种表达方式,在任意一种能够进行音频播放的终端上均可以实施该方法。其中,终端种类包括但不限于手机、平板电脑、笔记本电脑、台式电脑等。
需要说明的第二点是,上述音频处理方法可为终端上已安装的音频播放应用所提供的一项功能。比如,本文所述的音频处理功能作为一项小工具植入在音频播放应用中,用户利用该音频播放应用收听歌曲的过程中,便可以启动该项功能,通过对歌词重新进行节奏添加,实现歌曲曲风的改变。或者,上述音频处理功能还可作为一个独立的桌面小工具或应用出现,本发明实施例对此不进行限定。
总结来说,本发明实施例提供的音频处理方法,实现了即使不懂相关音乐知识的普通用户也可完成对音频的节奏转换,该种方式更加便捷与智能化。更为详尽地解释说明请参见下述实施例。
图1是本发明实施例提供的一种音频处理方法的流程图。参见图1,本发明实施例提供的方法流程包括:
101、在接收到音频处理指令后,获取与待处理音频匹配的多媒体提示字符。
本发明实施例以这一音频处理功能为音频播放应用提供的一项功能进行举例说明。参见图2,在音频播放应用的设置界面上可显示这一音频处理功能的操作入口。如图2所示,音频播放应用的设置界面上显示有一个专用于启动音频处理功能的功能启动选项。当终端检测到用户对该功能启动选项的选中操作后,便启动音频处理功能。
具体地,在执行音频处理流程时,终端首先显示一个诸如图3所示的音频列表界面,以供用户进行音频选择。如图3所示,用户进行音频选择的范围包括但不限于本地歌曲以及网络歌曲。此外,若当前页面上未显示或者本地未存储用户想要进行节奏转换的音频,则本发明实施例还支持用户在图3示出的搜索框体中进行音频搜索。而终端在将用户搜索的音频下载到本地后,便可以开始进行节奏转换。
换一种表达方式,终端获取到用户在音频列表界面上选中的音频后,会将被选中的音频确定为需进行节奏转换的待处理音频。同时,如图4所示,终端还可向用户显示一个音频处理选项,以由用户确定是否触发针对待处理音频的音频处理操作。而终端在检测到用户对该音频处理选项的选中操作后,确定接收到音频处理指令,执行下述对待处理音频进行节奏变换处理的步骤。
当然,终端也可不进行这一音频处理选项的显示,而在确定待处理音频后,直接执行后续步骤,本发明实施例对此不具体限定。
另外,需要说明的第一点是,上述图2至图4仅对功能启动选项、音频列表界面以及音频处理选项的显示方式进行举例说明,其并不构成对三者的显示方式的限定。即,功能启动选项、音频列表界面以及音频处理选项还可具有其他显示方式,本发明实施例对此不进行具体限定。
需要说明的第二点是,在本发明实施例中用户仅需通过触发按键或者进行简单点选操作,便可触发针对某一项音频的音频处理过程,完全无需用户再额外执行其他跟相关音乐知识关联的操作,降低了歌曲的节奏转换的实现难度。
102、对待处理音频的多媒体字符进行分词处理,得到目标分词结果。
在本发明实施例中,终端可从本地存储的歌词文件库中获取待处理音频的歌词,或者现从网络上下载待处理音频的歌词,本发明实施例对此不进行具体限定。而为了实现对歌词重新添加节奏,终端还需先对待处理音频的多媒体字符进行分词处理。
其中,针对于采用不同语言来演唱的歌曲,一般还需采取不同措施来有针对性地进行分词处理。比如,针对中文分词来说,由于词语之间没有分隔,因此各个词之间没有一个形式上的分界符,所以时下通常基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法这三种来实现中文分词。而针对英文来说,由于单词之间是以空格作为自然分界符的,因此基于分解符便可完成分词。
103、获取待处理音频的目标节奏类型。
本发明实施例可预先设置一个节奏样本库,专用于进行各种类型节奏的存储。这样,在对待处理音频进行节奏转换时,终端便可显示一个用于展示节奏类型的节奏样本列表,以供用户进行选择。
而当终端检测到用户对该节奏样本列表中任一个节奏类型的选中操作后,便将被选中的节奏类型确定为目标节奏类型,进而依据目标节奏类型对待处理音频进行节奏转换。比如,待处理音频的原始版本为流行歌曲,而用户选择的节奏类型为rap,则终端会将这流行歌曲转换为rap歌曲。
104、根据目标节奏类型指示的节奏以及目标分词结果,对待处理音频进行节奏变换处理,得到待播放的目标音频。
在本发明实施例中,终端在获取到待处理音频的分词结果以及目标节奏类型后,便可直接根据目标节奏类型指示的节奏,为上述分词结果添加节奏,实现对待处理音频进行节奏变换处理。其中,在得到转换后的目标音频后,这一目标音频可供用户进行试听、保存、分享给其他用户等,本发明实施例对此不进行具体限定。
在另一个实施例中,在对待处理音频进行节奏转换时,终端还可获取待处理音频的时间轴信息并将其进行显示。其中,时间轴信息如图5所示,具体展示了每一句歌词的演唱时间。用户在看到这一时间轴信息后,可基于时间轴信息进行节奏调整。比如,用户可选择哪一段时长需要进行节奏的转换,而哪一些时长无需进行节奏的转换。即,用户可自行决定节奏调节位置。
换一种表达方式,终端可接收用户输入的节奏调节位置,并根据目标节奏类型指示的节奏、节奏调节位置以及目标分词结果,对待处理音频进行节奏变换处理。比如,待处理音频的演唱时长为三分钟,而用户选择了将开头一分钟作为节奏调整位置,则终端便将开头一分钟的音频进行节奏转换处理,而剩余的两分钟音频不进行处理。
详细来讲,终端首先会根据用户输入的节奏调节位置,在待处理音频的目标分词结果中确定第一多媒体提示字符。其中,第一多媒体提示字符为待添加节奏的字符。比如,第一多媒体提示字符为待处理音频开头一分钟所演唱的歌词。接下来,终端根据目标节奏类型指示的节奏,为第一多媒体提示字符进行节奏添加处理,得到第一子音频。
之后,终端将与第二多媒体提示字符匹配的第二子音频与第一子音频进行合成,得到目标音频。其中,第二多媒体提示字符为除了第一多媒体提示字符以外的其他字符。比如,第二多媒体提示字符为待处理音频最后两分钟所演唱的歌词。
在另一个实施例中,为了简化用户操作,终端在启动上述音频处理功能后,若用户选择完毕待处理音频,则后续可无需用户再执行任何操作,而由终端直接完成节奏转换。比如,目标节奏类型的选择可采取终端默认设置,或者由用户预先进行统一设置等,本发明实施例对此不进行具体限定。
本发明实施例提供的方法,终端在接收到音频处理指令后,首先获取待处理音频的多媒体提示字符并对这一多媒体字符进行分词处理,之后终端进一步地获取待处理音频的目标节奏类型,并根据目标节奏类型指示的节奏以及得到的目标分词结果,实现对待处理音频的节奏变换处理,由于上述音频处理方式完全无需依赖于具有相关专业知识的专业人员,即使普通用户也可实现,不存在技术门槛,所以更为便捷与智能化。
图6是本发明实施例提供的一种音频处理装置的结构示意图。参见图6,该装置包括:
第一获取模块601,用于在接收到音频处理指令后,获取与待处理音频匹配的多媒体提示字符;
第一处理模块602,用于对所述多媒体字符进行分词处理,得到目标分词结果;
第二获取模块603,用于获取所述待处理音频的目标节奏类型;
第二处理模块604,用于根据所述目标节奏类型指示的节奏以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到待播放的目标音频。
本发明实施例提供的装置,终端在接收到音频处理指令后,首先获取待处理音频的多媒体提示字符并对这一多媒体字符进行分词处理,之后终端进一步地获取待处理音频的目标节奏类型,并根据目标节奏类型指示的节奏以及得到的目标分词结果,实现对待处理音频的节奏变换处理,由于上述音频处理方式完全无需依赖于具有相关专业知识的专业人员,即使普通用户也可实现,不存在技术门槛,所以更为便捷与智能化。
在另一个实施例中,所述第二处理模块,用于获取所述多媒体提示字符的时间轴信息;显示所述时间轴信息;接收用户输入的节奏调节位置,所述节奏调节位置由所述用户基于所述时间轴信息确定;根据所述目标节奏类型指示的节奏、所述节奏调节位置以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到所述目标音频。
在另一个实施例中,所述第二处理模块,用于根据所述节奏调节位置,在所述目标分词结果中确定第一多媒体提示字符,所述第一多媒体提示字符为待添加所述节奏的字符;根据所述目标节奏类型指示的节奏,为所述第一多媒体提示字符进行节奏添加处理,得到第一子音频;将与第二多媒体提示字符匹配的第二子音频与所述第一子音频进行合成,得到所述目标音频;其中,所述第二多媒体提示字符为除了所述第一多媒体提示字符以外的其他字符。
在另一个实施例中,所述第二获取模块,用于在接收到所述音频处理指令后,显示用于展示节奏类型的节奏样本列表;在检测到用户对所述节奏样本列表中任一个节奏类型的选中操作后,将被选中的节奏类型确定为所述目标节奏类型。
在另一个实施例中,该装置还包括:
显示模块,用于显示用于启动音频处理功能的功能启动选项;
所述显示模块,还用于在检测到用户对所述功能启动选项的选中操作后,显示音频列表界面;
所述第一获取模块,用于获取用户在所述音频列表界面上选中的音频,将被选中的音频确定为所述待处理音频;
所述显示模块,还用于显示音频处理选项;
所述第二处理模块,用于在检测到所述用户对所述音频处理选项的选中操作后,确定接收到所述音频处理指令,执行对所述待处理音频进行节奏变换处理的步骤。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的音频处理装置在进行音频处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的音频处理装置与音频处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图7示出了本发明一个示例性实施例提供的终端700的结构框图。该终端700可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio LayerIV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端700包括有:处理器701和存储器702。
处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器701所执行以实现本申请中方法实施例提供的音频处理方法。
在一些实施例中,终端700还可选包括有:外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。具体地,外围设备包括:射频电路704、触摸显示屏705、摄像头706、音频电路707、定位组件708和电源709中的至少一种。
外围设备接口703可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器701和存储器702。在一些实施例中,处理器701、存储器702和外围设备接口703被集成在同一芯片或电路板上;在一些其他实施例中,处理器701、存储器702和外围设备接口703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路704用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路704将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路704包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路704可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路704还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏705用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏705是触摸显示屏时,显示屏705还具有采集在显示屏705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏705可以为一个,设置终端700的前面板;在另一些实施例中,显示屏705可以为至少两个,分别设置在终端700的不同表面或呈折叠设计;在再一些实施例中,显示屏705可以是柔性显示屏,设置在终端700的弯曲表面上或折叠面上。甚至,显示屏705还可以设置成非矩形的不规则图形,也即异形屏。显示屏705可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件706用于采集图像或视频。可选地,摄像头组件706包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理,或者输入至射频电路704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器701或射频电路704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路707还可以包括耳机插孔。
定位组件708用于定位终端700的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件708可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源709用于为终端700中的各个组件进行供电。电源709可以是交流电、直流电、一次性电池或可充电电池。当电源709包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端700还包括有一个或多个传感器710。该一个或多个传感器710包括但不限于:加速度传感器711、陀螺仪传感器712、压力传感器713、指纹传感器714、光学传感器715以及接近传感器716。
加速度传感器711可以检测以终端700建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器711可以用于检测重力加速度在三个坐标轴上的分量。处理器701可以根据加速度传感器711采集的重力加速度信号,控制触摸显示屏705以横向视图或纵向视图进行用户界面的显示。加速度传感器711还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器712可以检测终端700的机体方向及转动角度,陀螺仪传感器712可以与加速度传感器711协同采集用户对终端700的3D动作。处理器701根据陀螺仪传感器712采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器713可以设置在终端700的侧边框和/或触摸显示屏705的下层。当压力传感器713设置在终端700的侧边框时,可以检测用户对终端700的握持信号,由处理器701根据压力传感器713采集的握持信号进行左右手识别或快捷操作。当压力传感器713设置在触摸显示屏705的下层时,由处理器701根据用户对触摸显示屏705的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器714用于采集用户的指纹,由处理器701根据指纹传感器714采集到的指纹识别用户的身份,或者,由指纹传感器714根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器701授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器714可以被设置终端700的正面、背面或侧面。当终端700上设置有物理按键或厂商Logo时,指纹传感器714可以与物理按键或厂商Logo集成在一起。
光学传感器715用于采集环境光强度。在一个实施例中,处理器701可以根据光学传感器715采集的环境光强度,控制触摸显示屏705的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏705的显示亮度;当环境光强度较低时,调低触摸显示屏705的显示亮度。在另一个实施例中,处理器701还可以根据光学传感器715采集的环境光强度,动态调整摄像头组件706的拍摄参数。
接近传感器716,也称距离传感器,通常设置在终端700的前面板。接近传感器716用于采集用户与终端700的正面之间的距离。在一个实施例中,当接近传感器716检测到用户与终端700的正面之间的距离逐渐变小时,由处理器701控制触摸显示屏705从亮屏状态切换为息屏状态;当接近传感器716检测到用户与终端700的正面之间的距离逐渐变大时,由处理器701控制触摸显示屏705从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图7中示出的结构并不构成对终端700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种音频处理方法,其特征在于,所述方法包括:
在接收到音频处理指令后,获取与待处理音频匹配的多媒体提示字符;
对所述多媒体字符进行分词处理,得到目标分词结果;
获取所述待处理音频的目标节奏类型;
根据所述目标节奏类型指示的节奏以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到待播放的目标音频。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标节奏类型指示的节奏以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到待播放的目标音频,包括:
获取所述多媒体提示字符的时间轴信息;
显示所述时间轴信息;
接收用户输入的节奏调节位置,所述节奏调节位置由所述用户基于所述时间轴信息确定;
根据所述目标节奏类型指示的节奏、所述节奏调节位置以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到所述目标音频。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标节奏类型指示的节奏、所述节奏调节位置以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到所述目标音频,包括:
根据所述节奏调节位置,在所述目标分词结果中确定第一多媒体提示字符,所述第一多媒体提示字符为待添加所述节奏的字符;
根据所述目标节奏类型指示的节奏,为所述第一多媒体提示字符进行节奏添加处理,得到第一子音频;
将与第二多媒体提示字符匹配的第二子音频与所述第一子音频进行合成,得到所述目标音频;
其中,所述第二多媒体提示字符为除了所述第一多媒体提示字符以外的其他字符。
4.根据权利要求1所述的方法,其特征在于,所述获取所述待处理音频的目标节奏类型,包括:
在接收到所述音频处理指令后,显示用于展示节奏类型的节奏样本列表;
在检测到用户对所述节奏样本列表中任一个节奏类型的选中操作后,将被选中的节奏类型确定为所述目标节奏类型。
5.根据权利要求1至4中任一权利要求所述的方法,其特征在于,所述方法还包括:
显示用于启动音频处理功能的功能启动选项;
在检测到用户对所述功能启动选项的选中操作后,显示音频列表界面;
获取用户在所述音频列表界面上选中的音频,将被选中的音频确定为所述待处理音频,并显示音频处理选项;
在检测到所述用户对所述音频处理选项的选中操作后,确定接收到所述音频处理指令,执行对所述待处理音频进行节奏变换处理的步骤。
6.一种音频处理装置,其特征在于,所述装置包括:
第一获取模块,用于在接收到音频处理指令后,获取与待处理音频匹配的多媒体提示字符;
第一处理模块,用于对所述多媒体字符进行分词处理,得到目标分词结果;
第二获取模块,用于获取所述待处理音频的目标节奏类型;
第二处理模块,用于根据所述目标节奏类型指示的节奏以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到待播放的目标音频。
7.根据权利要求6所述的装置,其特征在于,所述第二处理模块,用于获取所述多媒体提示字符的时间轴信息;显示所述时间轴信息;接收用户输入的节奏调节位置,所述节奏调节位置由所述用户基于所述时间轴信息确定;根据所述目标节奏类型指示的节奏、所述节奏调节位置以及所述目标分词结果,对所述待处理音频进行节奏变换处理,得到所述目标音频。
8.根据权利要求7所述的装置,其特征在于,所述第二处理模块,用于根据所述节奏调节位置,在所述目标分词结果中确定第一多媒体提示字符,所述第一多媒体提示字符为待添加所述节奏的字符;根据所述目标节奏类型指示的节奏,为所述第一多媒体提示字符进行节奏添加处理,得到第一子音频;将与第二多媒体提示字符匹配的第二子音频与所述第一子音频进行合成,得到所述目标音频;其中,所述第二多媒体提示字符为除了所述第一多媒体提示字符以外的其他字符。
9.根据权利要求6所述的装置,其特征在于,所述第二获取模块,用于在接收到所述音频处理指令后,显示用于展示节奏类型的节奏样本列表;在检测到用户对所述节奏样本列表中任一个节奏类型的选中操作后,将被选中的节奏类型确定为所述目标节奏类型。
10.根据权利要求6至9中任一权利要求所述的装置,其特征在于,所述装置还包括:
显示模块,用于显示用于启动音频处理功能的功能启动选项;
所述显示模块,还用于在检测到用户对所述功能启动选项的选中操作后,显示音频列表界面;
所述第一获取模块,用于获取用户在所述音频列表界面上选中的音频,将被选中的音频确定为所述待处理音频;
所述显示模块,还用于显示音频处理选项;
所述第二处理模块,用于在检测到所述用户对所述音频处理选项的选中操作后,确定接收到所述音频处理指令,执行对所述待处理音频进行节奏变换处理的步骤。
11.一种存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至5中任一权利要求所述的音频处理方法。
12.一种用于音频处理的终端,其特征在于,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至5中任一权利要求所述的音频处理方法。
CN201711172096.XA 2017-11-22 2017-11-22 音频处理方法、装置、存储介质及终端 Pending CN107871012A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711172096.XA CN107871012A (zh) 2017-11-22 2017-11-22 音频处理方法、装置、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711172096.XA CN107871012A (zh) 2017-11-22 2017-11-22 音频处理方法、装置、存储介质及终端

Publications (1)

Publication Number Publication Date
CN107871012A true CN107871012A (zh) 2018-04-03

Family

ID=61754467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711172096.XA Pending CN107871012A (zh) 2017-11-22 2017-11-22 音频处理方法、装置、存储介质及终端

Country Status (1)

Country Link
CN (1) CN107871012A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108831425A (zh) * 2018-06-22 2018-11-16 广州酷狗计算机科技有限公司 混音方法、装置及存储介质
CN110516103A (zh) * 2019-08-02 2019-11-29 平安科技(深圳)有限公司 基于分类器的歌曲节奏生成方法、设备、存储介质及装置
CN111506765A (zh) * 2020-04-03 2020-08-07 咪咕音乐有限公司 控制乐曲播放节奏的方法、装置、电子设备及存储介质
CN113053339A (zh) * 2021-03-10 2021-06-29 百果园技术(新加坡)有限公司 节奏调整方法、装置、设备和存储介质
CN113709548A (zh) * 2021-08-09 2021-11-26 北京达佳互联信息技术有限公司 基于图像的多媒体数据合成方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04241388A (ja) * 1991-01-16 1992-08-28 Canon Inc 情報処理装置
CN1728770A (zh) * 2004-07-28 2006-02-01 乐金电子(惠州)有限公司 卡拉ok系统的视频及音频同步化装置
CN104281432A (zh) * 2014-09-18 2015-01-14 小米科技有限责任公司 调节音效的方法及装置
CN106775568A (zh) * 2017-01-12 2017-05-31 珠海格力电器股份有限公司 一种音效调节方法、装置及移动终端
CN107124624A (zh) * 2017-04-21 2017-09-01 腾讯科技(深圳)有限公司 视频数据生成的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04241388A (ja) * 1991-01-16 1992-08-28 Canon Inc 情報処理装置
CN1728770A (zh) * 2004-07-28 2006-02-01 乐金电子(惠州)有限公司 卡拉ok系统的视频及音频同步化装置
CN104281432A (zh) * 2014-09-18 2015-01-14 小米科技有限责任公司 调节音效的方法及装置
CN106775568A (zh) * 2017-01-12 2017-05-31 珠海格力电器股份有限公司 一种音效调节方法、装置及移动终端
CN107124624A (zh) * 2017-04-21 2017-09-01 腾讯科技(深圳)有限公司 视频数据生成的方法和装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108831425A (zh) * 2018-06-22 2018-11-16 广州酷狗计算机科技有限公司 混音方法、装置及存储介质
CN108831425B (zh) * 2018-06-22 2022-01-04 广州酷狗计算机科技有限公司 混音方法、装置及存储介质
US11315534B2 (en) 2018-06-22 2022-04-26 Guangzhou Kugou Computer Technology Co., Ltd. Method, apparatus, terminal and storage medium for mixing audio
CN110516103A (zh) * 2019-08-02 2019-11-29 平安科技(深圳)有限公司 基于分类器的歌曲节奏生成方法、设备、存储介质及装置
CN110516103B (zh) * 2019-08-02 2022-10-14 平安科技(深圳)有限公司 基于分类器的歌曲节奏生成方法、设备、存储介质及装置
CN111506765A (zh) * 2020-04-03 2020-08-07 咪咕音乐有限公司 控制乐曲播放节奏的方法、装置、电子设备及存储介质
CN111506765B (zh) * 2020-04-03 2023-09-05 咪咕音乐有限公司 控制乐曲播放节奏的方法、装置、电子设备及存储介质
CN113053339A (zh) * 2021-03-10 2021-06-29 百果园技术(新加坡)有限公司 节奏调整方法、装置、设备和存储介质
CN113053339B (zh) * 2021-03-10 2024-04-02 百果园技术(新加坡)有限公司 节奏调整方法、装置、设备和存储介质
CN113709548A (zh) * 2021-08-09 2021-11-26 北京达佳互联信息技术有限公司 基于图像的多媒体数据合成方法、装置、设备及存储介质
CN113709548B (zh) * 2021-08-09 2023-08-25 北京达佳互联信息技术有限公司 基于图像的多媒体数据合成方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN107871012A (zh) 音频处理方法、装置、存储介质及终端
CN107978323A (zh) 音频识别方法、装置及存储介质
CN108008930A (zh) 确定k歌分值的方法和装置
CN109874312A (zh) 播放音频数据的方法和装置
CN110491358A (zh) 进行音频录制的方法、装置、设备、系统及存储介质
CN109300482A (zh) 音频录制方法、装置、存储介质以及终端
CN109379643A (zh) 视频合成方法、装置、终端及存储介质
CN108922506A (zh) 歌曲音频生成方法、装置和计算机可读存储介质
CN109729297A (zh) 在视频中添加特效的方法和装置
CN108090210A (zh) 搜索音频的方法和装置
CN109033335A (zh) 音频录制方法、装置、终端及存储介质
CN110209871A (zh) 歌曲评论发布方法及装置
CN108965757A (zh) 视频录制方法、装置、终端及存储介质
CN109346111A (zh) 数据处理方法、装置、终端及存储介质
CN109147757A (zh) 歌声合成方法及装置
CN108039184A (zh) 歌词添加方法及装置
CN109192218A (zh) 音频处理的方法和装置
CN110266982A (zh) 在录制视频时提供歌曲的方法和系统
CN109587549A (zh) 视频录制方法、装置、终端及存储介质
CN108320756A (zh) 一种检测音频是否是纯音乐音频的方法和装置
CN109144346A (zh) 歌曲分享方法、装置及存储介质
CN108922562A (zh) 演唱评价结果显示方法及装置
CN107958672A (zh) 获取基音波形数据的方法和装置
CN107862093A (zh) 文件属性识别方法及装置
CN109743461A (zh) 音频数据处理方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180403

RJ01 Rejection of invention patent application after publication