CN106155470B - 一种音频文件生成方法及装置 - Google Patents

一种音频文件生成方法及装置 Download PDF

Info

Publication number
CN106155470B
CN106155470B CN201510191731.3A CN201510191731A CN106155470B CN 106155470 B CN106155470 B CN 106155470B CN 201510191731 A CN201510191731 A CN 201510191731A CN 106155470 B CN106155470 B CN 106155470B
Authority
CN
China
Prior art keywords
audio
file
tag
subfile
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510191731.3A
Other languages
English (en)
Other versions
CN106155470A (zh
Inventor
屈黎黎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510191731.3A priority Critical patent/CN106155470B/zh
Publication of CN106155470A publication Critical patent/CN106155470A/zh
Application granted granted Critical
Publication of CN106155470B publication Critical patent/CN106155470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请公开了一种音频文件生成方法及装置,方法为即时通讯应用程序或短音频广播程序等需要快速录制音频的应用程序运行过程中,若需要进行语音录制,则在语音录制过程中,将用户指示添加的音频标签标识对应的音频标签文件添加至录音文件的指定位置中,进而生成音频文件。采用本申请技术方案,在音频录制操作界面中设置音频文件生成操作区,用户可以在该指示区中指示添加任意一音频标签文件,进而生成音频文件,无须启动第三方音频文件编辑应用程序,即时性得到了有效提高;并且,相较于音频文件编辑应用程序,对音频文件生成操作区的操作简单快捷,复杂度低。

Description

一种音频文件生成方法及装置
技术领域
本申请涉及音频数据处理领域,尤其涉及一种音频文件生成方法及装置。
背景技术
随着科技的飞速发展,电子产品进入智能化时代,如智能手机,ipad等。智能化电子产品具有独立的操作系统,可由用户根据自己的需要自行安装各种第三方服务商提供的应用程序,通过此类应用程序,可以扩展智能化电子产品的功能。智能化电子产品的开放性及可操作性强等特性决定了其应用范围广泛。
目前,电子产品能够在本地运行各种即时通讯应用程序实现即时通讯,当用户通过电子产品进行实时语音通信时,语音通信界面仅包含语音录制功能,即用户通过该即时通讯工具仅可以实现录制语音信息的目的;当用户需要将在录制的语音信息中添加其他音频信息时,需要借助专门的音频文件编辑应用程序来实现。
现有的音频文件编辑软件拥有音频格式转换,音频合并等强大的功能,但是对于用户来说,采用音频文件编辑软件对音频文件进行编辑的操作较为复杂;并且,在即时通讯时需要调用该音频文件编辑软件才能实现音频文件的生成,在电子产品中任意一应用软件的启动和运行,均将增加信息处理时长,从而导致即时通讯时效性差的问题。
由此可见,目前在音频文件生成的过程中,存在操作复杂度高,以及时效性差的问题。
发明内容
本申请实施例提供一种音频文件生成方法及装置,用以解决目前在音频文件生成的过程中,存在操作复杂度高,以及时效性差的问题。
本申请实施例提供的具体技术方案如下:
一种音频文件生成方法,包括:在音频录制过程中,当检测到用户在音频文件生成操作区中输入的音频标签添加指示时,获取所述音频标签添加指示中包含的音频标签标识和添加音频标签文件的指定位置;其中,所述音频文件生成操作区位于音频录制操作界面中;获取所述音频标签标识对应的音频标签文件;根据用户指示,将音频标签文件添加到录音文件中的指定位置,生成音频文件。
可选的,在本地查找所述音频标签标识;当本地包含所述音频标签标识时,从本地获取所述音频标签标识对应的音频标签文件;当本地不包含所述音频标签标识时,若检测本地能够获取网络资源,则启动搜索引擎,从网络资源中获取所述音频标签标识对应的音频标签文件;若检测本地不能够获取网络资源,则启动联网功能,并在网络连接成功后,从网络资源中获取所述音频标签标识对应的音频标签文件。
进一步的,将音频标签文件添加到录音文件中的指定位置之前,当检测到用户在音频录制操作界面中输入的播放指示时,播放所述音频标签标识对应的音频文件。
可选的,当所述录音文件和所述音频标签文件的格式相同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件作为第二音频子文件;当所述录音文件和所述音频标签文件的格式不同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件进行格式转换,生成与所述录音文件格式相同的音频标签文件,并格式转换后的音频标签文件作为第二音频子文件;将所述第二音频子文件添加至所述第一音频子文件的指定位置,生成音频文件。
进一步的,所述生成音频文件之前,当所述第二音频子文件中包含语音信息时,获取所述第一音频子文件中包含的语音信息;其中,所述语音信息中包含音色;将所述第二音频子文件包含的音色转换为所述第一音频子文件中包含的音色。
可选的,所述生成音频文件之后,为生成的所述音频文件设置文件属性;其中,所述文件属性为所述音频标签文件的音频标签。
进一步的,所述生成音频文件之后,接收用户在音频录制操作界面中输入的编辑指示;其中,所述编辑指示中包含待编辑的音频子文件标识和编辑类型;当所述编辑类型为删除指示类型时,将所述待编辑的音频子文件标识对应的音频子文件进行删除;当所述编辑类型为修改指示类型时,获取所述编辑指示中包含的时间段,保留所述待编辑的音频子文件标识对应的音频子文件中所述时间段内的部分;当所述编辑类型为替换指示类型时,获取所述编辑指示中包含的替换音频标签标识,将所述待编辑的音频子文件标识对应的音频子文件替换为所述替换音频标签标识对应的音频标签文件。
一种音频文件生成装置,包括:音频标签标识获取单元,用于在音频录制过程中,当检测到用户在音频文件生成操作区中输入的音频标签添加指示时,获取所述音频标签添加指示中包含的音频标签标识;其中,所述音频文件生成操作区位于音频录制操作界面中;音频标签文件获取单元,用于获取所述音频标签标识对应的音频标签文件;音频文件生成单元,用于根据用户指示,将音频标签文件添加到录音文件中的指定位置,生成音频文件。
可选的,所述音频标签文件获取单元,具体用于:在本地查找所述音频标签标识;当本地包含所述音频标签标识时,从本地获取所述音频标签标识对应的音频标签文件;当本地不包含所述音频标签标识时,若检测本地能够获取网络资源,则启动搜索引擎,从网络资源中获取所述音频标签标识对应的音频标签文件;若检测本地不能够获取网络资源,则启动联网功能,并在网络连接成功后,从网络资源中获取所述音频标签标识对应的音频标签文件。
进一步的,还包括播放单元,用于:将音频标签文件添加到录音文件中的指定位置之前,当检测到用户在音频录制操作界面中输入的播放指示时,播放所述音频标签标识对应的音频文件。
可选的,所述音频文件生成单元,具体用于:当所述录音文件和所述音频标签文件的格式相同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件作为第二音频子文件;当所述录音文件和所述音频标签文件的格式不同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件进行格式转换,生成与所述录音文件格式相同的音频标签文件,并格式转换后的音频标签文件作为第二音频子文件;将所述第二音频子文件添加至所述第一音频子文件的指定位置,生成音频文件。
进一步的,还包括音色转换单元,用于:生成音频文件之前,当所述第二音频子文件中包含语音信息时,获取所述第一音频子文件中包含的语音信息;其中,所述语音信息中包含音色;将所述第二音频子文件包含的音色转换为所述第一音频子文件中包含的音色。
可选的,所述音频文件生成单元,还用于:生成音频文件之后,为生成的所述音频文件设置文件属性;其中,所述文件属性为所述音频标签文件的音频标签。
进一步的,还包括编辑单元,用于:生成音频文件之后,接收用户在音频录制操作界面中输入的编辑指示;其中,所述编辑指示中包含待编辑的音频子文件标识和编辑类型;当所述编辑类型为删除指示类型时,将所述待编辑的音频子文件标识对应的音频子文件进行删除;当所述编辑类型为修改指示类型时,获取所述编辑指示中包含的时间段,保留所述待编辑的音频子文件标识对应的音频子文件中所述时间段内的部分;当所述编辑类型为替换指示类型时,获取所述编辑指示中包含的替换音频标签标识,将所述待编辑的音频子文件标识对应的音频子文件替换为所述替换音频标签标识对应的音频标签文件。
本申请实施例中,快速音频文件生成场景中,若需要进行音频录制,则在音频录制过程中,将用户指示添加的音频标签标识对应的音频标签文件添加至录音文件中的指定位置,进而生成音频文件。采用本申请技术方案,在音频录制操作界面中设置音频文件生成操作区,该音频文件生成操作区中包含音频标签文件添加选项,在音频录制过程中,终端可以响应用户在该音频文件生成操作区的操作进而在录音文件中添加任意一音频标签文件,从而实现了边录音边添加音频标签文件的过程,无须启动第三方音频文件编辑应用程序,即时性得到了有效提高;并且,相较于音频文件编辑应用程序,对音频文件生成操作区的操作简单快捷,复杂度低。
附图说明
图1为本申请实施例中音频文件生成流程图;
图2a至图2d为本申请实施例中音频文件编辑示意图;
图3a至图3c为本申请实施例中具体应用场景下即时通讯工具的音频录制操作界面;
图4为本申请实施例中具体应用场景下音频文件的生成流程图;
图5a至图5c为本申请实施例中具体应用场景下音频文件生成操作区示意图;
图6a为本申请实施例中具体应用场景下录音选项示意图;
图6b为本申请实例中具体应用场景下音频标签标识示意图;
图7为本申请实施例中音频文件生成装置结构示意图。
具体实施方式
为了解决目前在音频文件生成的过程中,存在操作复杂度高,以及时效性差的问题。本申请实施例中,快速音频文件生成场景中,若需要进行音频录制,则在语音录制过程中,将用户指示添加的音频标签标识对应的音频标签文件添加至录音文件中的指定位置,进而生成音频文件。采用本申请技术方案,在音频录制操作界面中设置音频文件生成操作区,该音频文件生成操作区中包含音频标签文件添加选项,在音频录制过程中,终端可以响应用户在该音频文件生成操作区中的操作添加任意一音频标签文件,进而实现了边录音边添加音频标签文件的过程,无须启动第三方音频文件编辑应用程序,即时性得到了有效提高;并且,相较于音频文件编辑应用程序,对音频文件生成操作区的操作简单快捷,复杂度低。
下面结合附图对本申请优选的实施方式进行详细说明。
参阅图1所示,本申请实施例中生成音频文件的过程包括:
步骤100:在音频录制过程中,当检测到用户在音频文件生成操作区中输入的音频标签添加指示时,获取该音频标签添加指示中包含的音频标签标识和添加音频标签文件的指定位置;其中,上述音频文件生成操作区位于音频录制操作界面中。
本申请实施例中,电子产品包含具备音频录制功能的应用程序,在该具备音频录制功能的应用程序中添加音频文件生成功能,当电子产品运行该具备音频录制功能的应用程序时,在电子产品的屏幕上呈现该音频录制操作界面;当电子产品检测到用户在该音频录制操作界面中输入音频文件生成触发指示时,电子产品启动音频文件生成功能,即在音频录制操作界面中呈现音频文件生成操作区;该音频文件生成操作区中至少包含音频标签添加选项;此外,该音频文件生成操作区中还可以包括音频文件编辑选项,以及音频文件进度条;上述具备音频录制功能的应用程序可以为即时通讯工具,录音机等。
可选的,上述音频文件生成触发指示可以为用户在上述音频录制操作界面中输入的音频录制指示,如用户在音频录制操作界面中选中音频录制选项。当电子产品检测到用户在该音频录制操作界面中输入音频文件生成触发指示时,启动麦克风应用程序,由麦克风应用程序接收用户输入的音频信息,并在本地保存上述音频信息;以及启动计时器,记录音频录制时间长度,并在上述音频文件进度条中显示音频录制时长。
为了保证添加的音频标签文件中的声音不受外界声音的影响,较佳的,在添加音频标签文件之前,应当关闭电子产品的麦克风应用程序,具体为:当电子产品检测到用户在音频录制操作界面中输入音频录制暂停指示时,电子产品关闭麦克风应用程序;当检测到用户在音频文件生成操作区中选中音频标签添加选项时,电子产品获取待添加的音频标签标识,每一个音频标签标识对应一个音频标签文件。其中,电子产品可以在音频录制操作界面中呈现输入框,并接收用户输入的音频标签标识,该音频标签标识可以是用户希望搜索的音频标签标识,此外,电子产品可以根据本地包含的音频标签文件生成音频标签标识列表,当电子产品检测到用户选中输入框时,还可以在用户交互界面中呈现电子产品本地包含的音频标签标识列表,用户可以在输入框中输入该音频标签标识列表中包含的任意一音频标签标识;或者,当检测到用户在音频文件生成操作区中选中音频标签添加选项时,电子产品获取用户在该音频标签列标识表中选中的音频标签标识。
可选的,上述音频标签标识列表中除包含本地保存的所有音频标签文件的标识外,还可以包含网络资源中搜索热度最高的预设数目个音频标签标识。此外,上述音频标签文件均拥有自身的音频标签,该音频标签用于表征该音频标签文件的文件属性,该音频标签文件的文件属性包含音频标签所述类别,音频标签的来源等等。
采用上述技术方案,当需要在音频录制过程中添加音频标签文件时,仅需要在具备语音录制功能的应用程序操作界面中,呈现音频文件生成操作区,并通过检测用户在该音频文件生成操作区的操作,在录音文件中添加音频标签文件,避免了电子产品在启动录音软件的同时,启动第三方音频编辑软件,减轻了电子产品的负担,缩短了生成音频文件的时长;此外,在音频录制操作界面中划分音频文件生成操作区,使用户无须在录音软件和第三方音频编辑软件之间进行切换来生成音频文件,从而保证了音频文件的生成过程简单快捷。
步骤110:获取上述音频标签标识对应的音频标签文件。
本申请实施例中,若电子产品的音频录制操作界面中包含输入框,则电子产品根据用户在输入框中输入的音频标签标识,查找该音频标签标识对应的音频标签文件;若电子产品的音频录制操作界面中包含音频标签标识列表,则电子产品根据用户选中的音频标签标识,查找该音频标签标识对应的音频标签文件。
进一步的,电子产品查找该音频标签标识对应的音频标签文件的过程,具体包括:电子产品在本地查找上述音频标签标识;当本地包含该音频标签标识时,从本地获取该音频标签标识对应的音频标签文件;当本地不包含上述音频标签标识时,若检测电子产品能够获取网络资源,则启动搜索引擎,从网络资源中获取上述音频标签标识对应的音频标签文件;若检测本地不能够获取网络资源,则启动联网功能,并在网络连接成功后,从网络资源中获取上述音频标签标识对应的音频标签文件。
进一步的,当电子产品检测本地不能够获取网络资源,启动联网功能之前,可以在音频录制操作界面中呈现启动联网功能提示框;当电子产品检测到用户在该提示框中输入允许启动联网功能时,启动联网功能;当电子产品检测到用户在该提示框中输入拒绝启动联网功能时,电子产品在音频录制操作界面中,提示无法查找到与音频标签标识相匹配的音频标签文件。
采用上述技术方案,电子产品根据用户输入的音频标签标识,在本地查找该音频标签标识,当电子产品本地保存有上述音频标签标识对应的音频标签文件时,即无须通过在网络资源中搜索该音频标签标识对应的音频标签文件,能够有效提高获取音频标签标识对应的音频标签文件的速度,从而进一步缩短了音频文件的生成时长,提高了时效性。
步骤120:根据用户指示,将获取的音频标签文件添加到录音文件中的指定位置,生成音频文件。
本申请实施例中,电子产品的音频录制操作界面中还可以包含音频播放选项,当电子产品获取到音频标签文件时,若电子产品检测到用户选中上述音频播放选项,则播放上述音频标签文件,并在音频录制操作界面中显示该音频标签文件的播放进度;待上述音频标签文件播放完毕后,将该音频标签文件添加至录音文件的指定位置。此外,电子产品还可以不对上述音频标签文件进行播放,直接将该音频标签文件添加至上述录音文件的指定位置。其中,上述录音文件为基于音频录制过程生成的文件。
可选的,音频播放选项还具备音频播放暂停功能;当在电子产品播放过程中,检测到用户选中音频播放暂停选项时,暂停上述音频标签文件的播放。因此,在将该音频标签文件添加至上述录音文件的指定位置之前,电子产品还可以检测是否接收到用户输入的确认添加指示,当电子产品检测到用户输入的确认添加指示时,将上述音频标签文件添加至上述录音文件中的指定位置。
由于音频标签文件包含多种格式,为了便于对不同格式音频文件的合并,本申请实施例中,当录音文件和音频标签文件的格式相同时,将该录音文件作为第一音频子文件,以及将该音频标签文件作为第二音频子文件;当上述录音文件和上述音频标签文件的格式不同时,将该录音文件作为第一音频子文件,以及将该音频标签文件进行格式转换,生成与上述录音文件格式相同的音频标签文件,并格式转换后的音频标签文件作为第二音频子文件。例如,第一音频子文件格式为mp4格式,而音频标签文件的格式为wav格式,此时,需要将音频标签文件的wav格式转换为mp4格式,并将转换为mp4格式的音频标签文件作为第二音频子文件。特殊地,当电子产品已经规定最终生成的音频文件的格式,该音频文件格式与录音文件格式和音频标签文件的格式均不相同,此时,需要将录音文件的格式转换为音频文件的格式,并将音频标签文件的格式转换为音频文件的格式,将格式转换后的录音文件作为第一音频子文件,以及将格式转换后的音频标签文件作为第二音频子文件。
采用上述技术方案,在将音频标签文件添加至录音文件之前,需要检测上述两个文件的格式,仅对拥有相同格式的文件进行合并,避免了根据不同格式文件生成音频文件时造成的音频文件生成错误的问题,保证了生成的音频文件的准确性。
可选的,将获取的音频标签文件添加到录音文件中的指定位置,具体包括:将第二音频子文件添加至第一音频子文件之后,生成音频文件;或者,将第二音频子文件添加至第一音频子文件之前,生成音频文件;或者,将第二音频子文件添加至第一音频子文件之中,生成音频文件。
进一步的,在生成音频文件之后,电子产品为生成的音频文件设置文件属性;其中,该文件属性为音频标签文件的音频标签;当一个音频文件中包含多个音频标签文件时,可以将上述多个音频标签文件的音频标签均设置为该音频文件的文件属性。
采用上述技术方案,为生成的音频文件设置其包含的音频标签文件的音频标签,用户可以通过对音频标签进行检索,获取文件属性为该音频标签的所有音频文件,相对于现有技术中需要人工对所有音频文件进行一一试听来查找任意一种文件属性的音频文件,本申请实施例中能够快速获取任意一种文件属性的音频文件,有效节约了人力资源,以及提高了检索得到音频文件的效率。
进一步的,电子产品分别对上述第一音频子文件和第二音频子文件进行解析,以判断该第一音频子文件和第二音频子文件中是否包含语音信息;当第二音频子文件中包含语音信息时,获取第一音频子文件的语音信息中包含的音色;将第二音频子文件的语音信息中包含的音色转换为第一音频子文件的语音信息中包含的音色。例如,第一音频子文件中包含用户A自身的语音信息;第二音频子文件中包含歌手B的歌曲a时,从第二音频子文件中获取该歌手B的语音信息,并根据用户A的音色,对该第二音频子文件中包含的歌手B的音色进行转换,将歌手B的音色转换为用户A的音色,使最终生成的第二音频子文件中是用户A演唱歌曲a。
可选的,音频文件生成操作区中还包含人名信息列表;该人名信息列表中包含通讯录中的人名信息,或者网络搜索热度最高的人名信息;电子产品检测到用户选中人名信息列表中的任意一人名信息时,判断该任意一人名信息是否为通讯录中的人名信息,若是,则检测本地是否包含该任意一人名信息对应的语音信息,当电子产品本地包含该任意一人名信息对应的语音信息时,获取该任意一人名信息对应的音色,并将音频标签文件包含的音色转换为上述任意一人名信息对应的音色;否则,从本地或者网络资源中获取该任意一人名信息对应的音色,并将音频标签文件包含的音色转换为上述任意一人名信息对应的音色。
采用上述技术方案,在电子产品的音频文件生成操作区中,能够实现不同音色的转换,使生成的多媒体信息具备多样性。
可选的,电子产品在所有音频录制完毕之后,在录音文件的指定位置添加音频标签文件;或者,电子产品在在音频录制过程中,在已经录制完毕的录音文件的指定位置添加音频标签文件,当在录音文件中添加音频标签文件之后,电子产品根据用户输入的音频录制取消暂停指示,继续音频录制过程,直至检测到用户输入的音频录制结束指示,从而根据多个录音文件和音频标签文件,生成最终的音频文件。
基于上述技术方案,电子产品根据用户指示,可以交替进行语音录制以及音频标签文件的添加,将该包含至少一个录音文件和至少一个音频标签文件的文件作为音频文件;可选的,在音频文件进度条中每一段音频子文件均采用不同形式显示,该不同形式包括采用不同颜色显示,采用不同填充格式显示等。此外,音频文件进度条中进度条总长度根据电子产品屏幕宽度相匹配,且每一个音频子文件对应于音频文件进度条的长度与该音频子文件的时长相匹配。例如,进度条总长度为S,单位时长进度条长度为A,音频文件总时长为T,则S=A*T,录音文件对应的进度条长度=A*(录音文件占用时长/T),音频标签文件对应的进度条长度=A*(音频标签文件占用总时长/T)。
进一步的,生成音频文件之后,若电子产品接收到用户在通过音频文件编辑选项输入的编辑指示,则对该编辑指示进行解析;其中,该编辑指示中包含待编辑的音频子文件标识和编辑类型,编辑类型包括删除指示类型,修改指示类型,以及替换指示类型,其中:
当编辑类型为删除指示类型时,将编辑指示中包含的待编辑的音频子文件标识对应的音频子文件进行删除;例如,参阅图2a所示,电子产品检测到用户在音频进度条中选中音频子文件1时,电子产品在音频录制操作界面中呈现编辑类型选项,当电子产品确定用户选中删除指示类型时,删除该音频子文件1,删除该音频子文件1之后的音频进度条参阅图2b所示。
当编辑类型为修改指示类型时,获取该编辑指示中包含的时间段,保留编辑指示中包含的待编辑的音频子文件标识对应的音频子文件中时间段内的部分;例如,参阅图2a所示,电子产品检测到用户在音频进度条中选中音频子文件1时,电子产品在音频录制操作界面中呈现编辑类型选项,当电子产品确定用户选中修改指示类型时,电子产品在音频录制操作界面中呈现时间段输入框,参阅图2c所示;电子产品根据在时间段输入框中输入的时间段(如1分12秒-2分20秒),仅保留音频文件1中1分12秒-2分20秒部分的音频数据。
当编辑指示为替换指示时,获取所述音频子文件修改指示中包含的替换音频标签标识,将待编辑的音频子文件标识对应的音频子文件替换为替换音频标签标识对应的音频标签文件;例如,参阅图2a所示,电子产品检测到用户在音频进度条中选中音频子文件1时,电子产品在音频录制操作界面中呈现编辑类型选项,当电子产品确定用户选中替换指示类型时,电子产品在音频录制操作界面中呈现输入框或者音频标签标识列表,若用户选中音频标签文件a为待替换的音频标签文件,则电子产品获取音频标签文件5,并将该音频标签文件5进行格式转换后生成音频子文件5,添加至音频子文件1的位置(参阅图2d所示)。
基于上述技术方案,以下结合具体应用场景,详细描述音频文件生成过程。
本申请实施例可以应用在即时通讯应用程序运行过程中,也可以应用在短音频广播应用程序等各种需要快速录制音频的应用场景中。当电子产品运行即时通讯工具时,参阅图3a所示,为本申请实施例中即时通讯工具的音频录制操作界面(或应用界面),在该音频录制操作界面处于初始状态时,音频录制操作界面中仅包含已经发送完毕的音频文件,以及录音选项;当电子产品检测到用户输入的音频文件生成触发指示时,即呈现图3b所示的音频录制操作界面,该音频录制操作界面中包含音频文件生成操作区(参阅图3b中虚线部分),该音频文件生成操作区包括音频标签添加选项,取消录音选项,以及音频文件进度条;当音频文件生成完毕后,关闭音频文件生成操作区,并发送生成的音频文件,呈现如图3c所示的音频录制操作界面。
参阅图4所示,在上述即时通讯过程中,生成音频文件的方法包括:
步骤400:电子产品检测到用户激活录音选项时,显示音频文件生成操作区。
本申请实施例中,参阅图5a所示,为电子产品显示的音频文件生成操作区;该音频文件生成区中包含音频标签标识列表,该音频标签标识列表可以采用图5a所示的环形显示,也可以采用级联菜单形式等多种方式显示。
可选的,上述录音选项可以采用按钮形式呈现,其包含三种状态,分别为未激活状态,激活状态,以及暂停状态,参阅图6a所示;当录音选项为未激活状态时,表示电子产品不会呈现音频文件生成操作区;当录音选项为激活状态时,表示电子产品正在录制音频文件;当录音选项为暂停状态时,表示电子产品暂停生成音频文件。
步骤410:电子产品启动麦克风应用程序,接收用户输入的语音信息,并将该语音信息保存为第一录音文件;以及启动定时器,对录音时间进行统计,并将统计得到的时间显示在音频文件进度条中。
步骤420:电子产品检测到用户再次选中录音选项时,关闭麦克风应用程序,进入录音暂停状态。
步骤430:当电子产品检测到用户选中音频标签标识时,播放该音频标签标识对应的音频标签文件。
本申请实施例中,用户可以在音频文件生成操作区中,通过将录音选项拖拽至待添加的音频标签标识的形式选中音频标签标识,参阅图5a和图5b所示。
步骤440:在音频标签标识对应的音频标签文件播放完毕时,将该音频标签文件与上述第一录音文件的指定位置。
本申请实施例中,参阅图5c所示,当音频标签标识对应的音频标签文件播放完毕时,若检测到用户将该音频标签文件标识拖拽至录音选项,则将该音频标签文件添加上述已经第一录音文件的指定位置。
步骤450:电子产品检测到用户再次选中录音选项时,启动麦克风应用程序,以及计时器,继续语音录制过程,并将录制的语音保存为第二录音文件。
步骤460:电子产品检测到用户输入的录音结束指示时,将上述插入音频标签文件的第一录音文件和第二录音文件,生成音频文件,并将音频标签文件的音频标签设置为生成的音频文件的文件属性。
可选的,在音频标签标识选项中,可以显示每一个音频标签的播放进度,参阅图6b所示。
本申请实施例中,仅以音频标签标识、录音选项均为按钮形式为例进行介绍,除此之外,上述音频标签标识、录音选项还可以以文字形式,或者其他图标形式呈现,在此不再赘述。
基于上述技术方案,参阅图7所示,本申请实施例提供一种音频文件生成装置,包括音频标签标识获取单元70,音频标签文件获取单元71,音频文件生成单元72,其中:
音频标签标识获取单元70,用于在音频录制过程中,当检测到用户在音频文件生成操作区中输入的音频标签添加指示时,获取所述音频标签添加指示中包含的音频标签标识和添加音频标签文件的指定位置;其中,所述音频文件生成操作区位于音频录制操作界面中;
音频标签文件获取单元71,用于获取所述音频标签标识对应的音频标签文件;
音频文件生成单元72,用于根据用户指示,将音频标签文件添加到录音文件中的指定位置,生成音频文件。
可选的,所述音频标签文件获取单元71,具体用于:在本地查找所述音频标签标识;当本地包含所述音频标签标识时,从本地获取所述音频标签标识对应的音频标签文件;当本地不包含所述音频标签标识时,若检测本地能够获取网络资源,则启动搜索引擎,从网络资源中获取所述音频标签标识对应的音频标签文件;若检测本地不能够获取网络资源,则启动联网功能,并在网络连接成功后,从网络资源中获取所述音频标签标识对应的音频标签文件。
进一步的,还包括播放单元73,用于:将音频标签文件添加到录音文件中的指定位置之前,当检测到用户在音频录制操作界面中输入的播放指示时,播放所述音频标签标识对应的音频文件。
可选的,所述音频文件生成单元72,具体用于:当所述录音文件和所述音频标签文件的格式相同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件作为第二音频子文件;当所述录音文件和所述音频标签文件的格式不同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件进行格式转换,生成与所述录音文件格式相同的音频标签文件,并格式转换后的音频标签文件作为第二音频子文件;将所述第二音频子文件添加至所述第一音频子文件的指定位置,生成音频文件。
进一步的,还包括音色转换单元74,用于:生成音频文件之前,当所述第二音频子文件中包含语音信息时,获取所述第一音频子文件中包含的语音信息;其中,所述语音信息中包含音色;将所述第二音频子文件包含的音色转换为所述第一音频子文件中包含的音色。
可选的,所述音频文件生成单元,具体用于:生成音频文件之后,为生成的所述音频文件设置文件属性;其中,所述文件属性为所述音频标签文件的音频标签。
进一步的,还包括编辑单元75,用于:生成音频文件之后,接收用户在音频录制操作界面中输入的编辑指示;其中,所述编辑指示中包含待编辑的音频子文件标识和编辑类型;当所述编辑类型为删除指示类型时,将所述待编辑的音频子文件标识对应的音频子文件进行删除;当所述编辑类型为修改指示类型时,获取所述编辑指示中包含的时间段,保留所述待编辑的音频子文件标识对应的音频子文件中所述时间段内的部分;当所述编辑类型为替换指示类型时,获取所述编辑指示中包含的替换音频标签标识,将所述待编辑的音频子文件标识对应的音频子文件替换为所述替换音频标签标识对应的音频标签文件。
综上所述,本申请实施例中,在语音录制过程中,当检测到用户在音频文件生成操作区中输入的音频标签添加指示时,获取该音频标签添加指示中包含的音频标签标识和添加音频标签文件的指定位置;其中,上述音频文件生成操作区位于音频录制操作界面中;获取上述音频标签标识对应的音频标签文件;将上述音频标签文件添加至录音文件的指定位置,生成音频文件,并将音频标签文件的音频标签设置为生成的音频文件的文件属性。采用本申请技术方案,在音频录制操作界面中设置音频文件生成操作区,该音频文件生成操作区中包含音频标签文件添加选项,在音频录制过程中,终端可以响应用户在该音频文件生成操作区的操作进而在录音文件中添加任意一音频标签文件,从而实现了边录音边添加音频标签文件的过程,无须启动第三方音频文件编辑应用程序,即时性得到了有效提高;并且,相较于音频文件编辑应用程序,对音频文件生成操作区的操作简单快捷,复杂度低;此外,为生成的音频文件设置其包含的音频标签文件的音频标签,用户可以通过对音频标签进行检索,获取文件属性为该音频标签的所有音频文件,相对于现有技术中需要人工对所有音频文件进行一一试听来查找任意一种文件属性的音频文件,本申请实施例中能够快速获取任意一种文件属性的音频文件,有效节约了人力资源,以及提高了检索得到音频文件的效率。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全应用程序实施例、或结合应用程序和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (12)

1.一种音频文件生成方法,其特征在于,包括:
在音频录制过程中,当检测到用户在音频文件生成操作区中输入的音频标签添加指示时,获取所述音频标签添加指示中包含的音频标签标识和添加音频标签文件的指定位置;其中,所述音频文件生成操作区位于音频录制操作界面中,所述音频录制操作界面还包括音频播放选项;
获取所述音频标签标识对应的音频标签文件;
将所述音频标签文件中语音信息的音色转换为录音文件中的用户音色;
当检测到用户选中所述音频播放选项,则播放所述音频标签文件,并在音频录制操作界面中显示该音频标签文件的播放进度;
并根据用户指示,将获取的所述音频标签文件添加到录音文件中的指定位置,生成音频文件。
2.如权利要求1所述的方法,其特征在于,获取所述音频标签标识对应的音频标签文件,具体包括:
在本地查找所述音频标签标识;
当本地包含所述音频标签标识时,从本地获取所述音频标签标识对应的音频标签文件;
当本地不包含所述音频标签标识时,若检测本地能够获取网络资源,则启动搜索引擎,从网络资源中获取所述音频标签标识对应的音频标签文件;若检测本地不能够获取网络资源,则启动联网功能,并在网络连接成功后,从网络资源中获取所述音频标签标识对应的音频标签文件。
3.如权利要求1所述的方法,其特征在于,将音频标签文件添加到录音文件中的指定位置,生成音频文件,具体包括:
当所述录音文件和所述音频标签文件的格式相同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件作为第二音频子文件;当所述录音文件和所述音频标签文件的格式不同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件进行格式转换,生成与所述录音文件格式相同的音频标签文件,并格式转换后的音频标签文件作为第二音频子文件;
将所述第二音频子文件添加至所述第一音频子文件的指定位置,生成音频文件。
4.如权利要求3所述的方法,其特征在于,所述生成音频文件之前,还包括:
当所述第二音频子文件中包含语音信息时,获取所述第一音频子文件中包含的语音信息;其中,所述语音信息中包含音色;
将所述第二音频子文件包含的音色转换为所述第一音频子文件中包含的音色。
5.如权利要求3所述的方法,其特征在于,所述生成音频文件之后,还包括:
为生成的所述音频文件设置文件属性;其中,所述文件属性为所述音频标签文件的音频标签。
6.如权利要求3-5任一项所述的方法,其特征在于,所述生成音频文件之后,还包括:
接收用户在音频录制操作界面中输入的编辑指示;其中,所述编辑指示中包含待编辑的音频子文件标识和编辑类型;
当所述编辑类型为删除指示类型时,将所述待编辑的音频子文件标识对应的音频子文件进行删除;
当所述编辑类型为修改指示类型时,获取所述编辑指示中包含的时间段,保留所述待编辑的音频子文件标识对应的音频子文件中所述时间段内的部分;
当所述编辑类型为替换指示类型时,获取所述编辑指示中包含的替换音频标签标识,将所述待编辑的音频子文件标识对应的音频子文件替换为所述替换音频标签标识对应的音频标签文件。
7.一种音频文件生成装置,其特征在于,包括:
音频标签标识获取单元,用于在音频录制过程中,当检测到用户在音频文件生成操作区中输入的音频标签添加指示时,获取所述音频标签添加指示中包含的音频标签标识和添加音频标签文件的指定位置;其中,所述音频文件生成操作区位于音频录制操作界面中,所述音频录制操作界面还包括音频播放选项;
音频标签文件获取单元,用于获取所述音频标签标识对应的音频标签文件;
音色转换单元,将所述音频标签文件中语音信息的音色转换为录音文件中的用户音色;
播放单元,用于当检测到用户选中所述音频播放选项,则播放所述音频标签文件,并在音频录制操作界面中显示该音频标签文件的播放进度;
音频文件生成单元,用于根据用户指示,将音频标签文件添加到录音文件中的指定位置,生成音频文件。
8.如权利要求7所述的装置,其特征在于,所述音频标签文件获取单元,具体用于:
在本地查找所述音频标签标识;当本地包含所述音频标签标识时,从本地获取所述音频标签标识对应的音频标签文件;当本地不包含所述音频标签标识时,若检测本地能够获取网络资源,则启动搜索引擎,从网络资源中获取所述音频标签标识对应的音频标签文件;若检测本地不能够获取网络资源,则启动联网功能,并在网络连接成功后,从网络资源中获取所述音频标签标识对应的音频标签文件。
9.如权利要求8所述的装置,其特征在于,所述音频文件生成单元,具体用于:
当所述录音文件和所述音频标签文件的格式相同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件作为第二音频子文件;当所述录音文件和所述音频标签文件的格式不同时,将所述录音文件作为第一音频子文件,以及将所述音频标签文件进行格式转换,生成与所述录音文件格式相同的音频标签文件,并格式转换后的音频标签文件作为第二音频子文件;将所述第二音频子文件添加至所述第一音频子文件的指定位置,生成音频文件。
10.如权利要求9所述的装置,其特征在于,还包括音色转换单元,用于:
生成音频文件之前,当所述第二音频子文件中包含语音信息时,获取所述第一音频子文件中包含的语音信息;其中,所述语音信息中包含音色;将所述第二音频子文件包含的音色转换为所述第一音频子文件中包含的音色。
11.如权利要求9所述的装置,其特征在于,所述音频文件生成单元,还用于:
生成音频文件之后,为生成的所述音频文件设置文件属性;其中,所述文件属性为所述音频标签文件的音频标签。
12.如权利要求9-11任一项所述的装置,其特征在于,还包括编辑单元,用于:
生成音频文件之后,接收用户在音频录制操作界面中输入的编辑指示;其中,所述编辑指示中包含待编辑的音频子文件标识和编辑类型;当所述编辑类型为删除指示类型时,将所述待编辑的音频子文件标识对应的音频子文件进行删除;当所述编辑类型为修改指示类型时,获取所述编辑指示中包含的时间段,保留所述待编辑的音频子文件标识对应的音频子文件中所述时间段内的部分;当所述编辑类型为替换指示类型时,获取所述编辑指示中包含的替换音频标签标识,将所述待编辑的音频子文件标识对应的音频子文件替换为所述替换音频标签标识对应的音频标签文件。
CN201510191731.3A 2015-04-21 2015-04-21 一种音频文件生成方法及装置 Active CN106155470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510191731.3A CN106155470B (zh) 2015-04-21 2015-04-21 一种音频文件生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510191731.3A CN106155470B (zh) 2015-04-21 2015-04-21 一种音频文件生成方法及装置

Publications (2)

Publication Number Publication Date
CN106155470A CN106155470A (zh) 2016-11-23
CN106155470B true CN106155470B (zh) 2019-09-17

Family

ID=58057859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510191731.3A Active CN106155470B (zh) 2015-04-21 2015-04-21 一种音频文件生成方法及装置

Country Status (1)

Country Link
CN (1) CN106155470B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729441B (zh) * 2017-09-30 2022-04-08 北京酷我科技有限公司 一种音频文件的处理方法及系统
CN108124059B (zh) * 2017-12-21 2020-03-03 维沃移动通信有限公司 一种录音方法及移动终端
CN108766409A (zh) * 2018-05-25 2018-11-06 中国传媒大学 一种戏曲合成方法、装置和计算机可读存储介质
CN109165197B (zh) * 2018-08-29 2021-07-27 江苏奇异点网络有限公司 一种文件处理方法、终端及服务器
CN109147831A (zh) * 2018-09-26 2019-01-04 深圳壹账通智能科技有限公司 一种语音连接播放方法、终端设备及计算机可读存储介质
CN109949792B (zh) * 2019-03-28 2021-08-13 优信拍(北京)信息科技有限公司 多音频的合成方法及装置
CN112837709B (zh) * 2021-02-24 2022-07-22 北京达佳互联信息技术有限公司 一种音频文件拼接的方法及装置
CN116700537A (zh) * 2023-04-26 2023-09-05 合芯科技(苏州)有限公司 文件管理方法、装置、计算机设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020075641A (ko) * 2001-03-26 2002-10-05 이토스템 주식회사 통신망을 이용한 자동 맞춤 짝 서비스를 제공하는 방법 및시스템
CN101211557A (zh) * 2006-12-27 2008-07-02 三星电子株式会社 对音频信号进行后处理的方法和设备
CN102821067A (zh) * 2012-08-17 2012-12-12 上海量明科技发展有限公司 即时通信中音效转换加载图像的方法、客户端及系统
CN102830977A (zh) * 2012-08-21 2012-12-19 上海量明科技发展有限公司 即时通信录制中添加插入型数据的方法、客户端及系统
CN103530320A (zh) * 2013-09-18 2014-01-22 中兴通讯股份有限公司 多媒体文件处理方法、装置及终端
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN104144097A (zh) * 2013-05-07 2014-11-12 百度在线网络技术(北京)有限公司 语音消息传输系统、发送端、接收端及语音消息传输方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020075641A (ko) * 2001-03-26 2002-10-05 이토스템 주식회사 통신망을 이용한 자동 맞춤 짝 서비스를 제공하는 방법 및시스템
CN101211557A (zh) * 2006-12-27 2008-07-02 三星电子株式会社 对音频信号进行后处理的方法和设备
CN102821067A (zh) * 2012-08-17 2012-12-12 上海量明科技发展有限公司 即时通信中音效转换加载图像的方法、客户端及系统
CN102830977A (zh) * 2012-08-21 2012-12-19 上海量明科技发展有限公司 即时通信录制中添加插入型数据的方法、客户端及系统
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN104144097A (zh) * 2013-05-07 2014-11-12 百度在线网络技术(北京)有限公司 语音消息传输系统、发送端、接收端及语音消息传输方法
CN103530320A (zh) * 2013-09-18 2014-01-22 中兴通讯股份有限公司 多媒体文件处理方法、装置及终端

Also Published As

Publication number Publication date
CN106155470A (zh) 2016-11-23

Similar Documents

Publication Publication Date Title
CN106155470B (zh) 一种音频文件生成方法及装置
CN111526242B (zh) 音频处理方法、装置和电子设备
CN105120304B (zh) 信息显示方法、装置及系统
US10097884B2 (en) Media playback method, client and system
US20070261537A1 (en) Creating and sharing variations of a music file
US20090177300A1 (en) Methods and apparatus for altering audio output signals
JP2005506602A (ja) 文書に注釈をつける方法および装置
CN104934048A (zh) 音效调节方法及装置
WO2004054254A1 (ja) 容易にマルチメディアコンテンツを作成できるマルチメディアデータ処理装置
CN104869467A (zh) 媒体播放中的信息输出方法、装置和系统
JP2007304933A (ja) 情報処理システム、端末装置、情報処理方法、プログラム
CN107609034A (zh) 一种智能音箱的音频播放方法、音频播放装置及存储介质
CN108744521A (zh) 游戏语音生成的方法及装置、电子设备、存储介质
CN104185088B (zh) 一种视频处理方法及装置
CN102737690B (zh) 音乐应用启动的方法及终端
CN104916298A (zh) 编解码方法、编解码装置、电子设备及有声图片生成方法
KR101727587B1 (ko) 디지털 녹취 파일 녹취록 생성 방법
CN110139164A (zh) 一种语音评论播放方法、装置,终端设备及存储介质
CN102377692A (zh) 即时通信中声音信息映射性输出的方法、终端和系统
KR20110053397A (ko) 검색 키워드를 이용한 멀티미디어 파일 검색 방법 및 그 휴대기기
TW200824408A (en) Methods and systems for information retrieval during communication, and machine readable medium thereof
CN114792522A (zh) 音频信号处理、会议记录与呈现方法、设备、系统及介质
TWI297123B (en) Interactive entertainment center
CN109688430A (zh) 一种法院庭审文件回放方法、系统及存储介质
JP2005274992A (ja) 楽曲識別用情報検索システム、楽曲購入システム、楽曲識別用情報取得方法、楽曲購入方法、オーディオ信号処理装置およびサーバ装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200922

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200922

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Advanced innovation technology Co.,Ltd.

Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox

Patentee before: Alibaba Group Holding Ltd.