CN114639392A - 音频处理方法、装置、电子设备及存储介质 - Google Patents
音频处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114639392A CN114639392A CN202210239161.0A CN202210239161A CN114639392A CN 114639392 A CN114639392 A CN 114639392A CN 202210239161 A CN202210239161 A CN 202210239161A CN 114639392 A CN114639392 A CN 114639392A
- Authority
- CN
- China
- Prior art keywords
- terminal
- audio data
- audio
- target audio
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 181
- 238000000034 method Methods 0.000 claims abstract description 96
- 230000008569 process Effects 0.000 claims description 51
- 230000002452 interceptive effect Effects 0.000 claims description 48
- 238000006243 chemical reaction Methods 0.000 claims description 42
- 238000005070 sampling Methods 0.000 claims description 34
- 230000004044 response Effects 0.000 claims description 10
- 238000012952 Resampling Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 15
- 238000012795 verification Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 230000003993 interaction Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000003999 initiator Substances 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种音频处理方法、装置、电子设备及存储介质,应用于音频处理系统,该系统包括相互连接的第一终端和第二终端,以及与所述第一终端相连的处理终端。通过在第一终端中根据预先获取的用于表示第二终端的音频属性的预设音频参数将用户的原始音频数据转换为目标音频数据,即使第一终端与第二终端的音频属性不一致,也可以实现语音通话,并且通过调整预设音频参数还可以使第一终端与支持任意音频属性的第二终端进行语音通话,因此在处理终端对语音通话的过程进行预设处理时,可以实现对不同音频属性的通话终端之间语音通话过程的分析和处理,不仅丰富了语音通话的使用场景,还提升了语音通话调试和验证的灵活性。
Description
技术领域
本申请涉及音频技术领域,更具体地,涉及一种音频处理方法、装置、电子设备及存储介质。
背景技术
在对语音通话过程中产生的语音数据进行分析处理时,需要对分析处理的程序进行调试和验证。此时,往往需要在不同的通话终端之间产生一则语音通话进行调试或验证,若此时仅仅对固定语音参数和语音格式的通话终端进行调试或验证,无疑令语音通话的场景受到了限制,使得语音通话的调试和验证缺乏了灵活性。
发明内容
鉴于上述问题,本申请提出了一种音频处理方法、装置、电子设备及存储介质,能解决上述问题。
第一方面,本申请实施例提供了一种音频处理方法,应用于第一终端,所述第一终端与第二终端相连,所述方法包括:响应于用户的交互操作,获取所述用户的原始音频数据;按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性;基于所述交互操作,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;在将所述目标音频数据发送给处理终端的过程中,将所述目标音频数据发送给所述第二终端,以使所述第二终端将所述目标音频数据转换为可播放音频并播放所述可播放音频。
可选地,所述将所述目标音频数据发送给所述第二终端,包括:将所述目标音频数据划分为预设大小的目标音频数据后,将数据划分后的所述目标音频数据发送给所述第二终端。
可选地,所述预设音频参数包括音频采样频率,所述按照预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,包括:若所述音频采样频率与所述原始音频数据的采样频率不同,基于所述音频采样频率对所述原始音频数据进行重采样,得到所述目标音频数据。
第二方面,本申请实施例提供了一种音频处理方法,应用于第二终端,所述第二终端与第一终端相连,所述方法包括:获取目标音频数据,所述目标音频数据为所述第一终端按照预先获取的预设音频参数对原始音频数据进行数据转换而得到,所述预设音频参数用于表示所述第二终端的音频属性,所述原始音频数据为所述第一终端响应于用户的交互操作而获取得到,其中,所述交互操作用于指示所述第一终端在将所述目标音频数据发送给第二终端的过程中,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;将所述目标音频数据转换为可播放音频,播放所述可播放音频。
可选地,所述获取目标音频数据之前,还包括:建立与所述第一终端的语音通话连接,所述目标音频数据为所述语音通话产生的音频数据。
可选地,所述方法还包括:若检测到所述目标音频数据为空白音频,中断与所述第一终端的语音通话连接。
可选地,所述将所述目标音频数据转换为可播放音频,包括:基于所述预设音频参数确定所述第二终端的音频格式要求;根据所述音频格式要求对所述目标音频数据进行格式转换,得到所述可播放音频。
第三方面,本申请实施例提供了一种音频处理系统,该系统包括相互连接的第一终端和第二终端,以及与所述第一终端相连的处理终端,所述系统包括:所述第一终端用于响应于用户的交互操作,获取所述用户的原始音频数据;所述第一终端还用于按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性;所述第一终端还用于基于所述交互操作,将所述目标音频数据发送给处理终端;所述第一终端还用于在将所述目标音频数据发送给处理终端的过程中,将所述目标音频数据发送给所述第二终端;所述处理终端用于接收所述目标音频数据,所述处理终端还用于对所述目标音频数据进行预设处理操作;所述第二终端用于接收所述目标音频数据,所述第二终端还用于将所述目标音频数据转换为可播放音频并播放所述可播放音频。
第四方面,本申请实施例提供了一种音频处理装置,应用于第一终端,所述第一终端与第二终端相连,所述装置包括:第一获取模块、数据转换模块、第一发送模块以及第二发送模块。其中,第一获取模块,用于响应于用户的交互操作,获取所述用户的原始音频数据;数据转换模块,用于按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性;第一发送模块,用于基于所述交互操作,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;第二发送模块,用于在将所述目标音频数据发送给处理终端的过程中,将所述目标音频数据发送给所述第二终端,以使所述第二终端将所述目标音频数据转换为可播放音频并播放所述可播放音频。
第五方面,本申请实施例提供了一种音频处理装置,应用于第二终端,所述第二终端与所述第一终端相连,所述装置包括:第二获取模块及音频播放模块。其中,第二获取模块,用于获取目标音频数据,所述目标音频数据为所述第一终端按照预先获取的预设音频参数对原始音频数据进行数据转换得到,所述预设音频参数用于表示所述第二终端的音频属性,所述原始音频数据为所述第一终端响应于用户的交互操作而获取得到,其中,所述交互操作用于指示所述第一终端在将所述目标音频数据发送给第二终端的过程中,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;音频播放模块,用于将所述目标音频数据转换为可播放音频,播放所述可播放音频。
第六方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述第一方面或第二方面的方法。
第七方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面或第二方面的方法。
第八方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品中存储有指令,当其在计算机上运行时,使得计算机实现上述第一方面或第二方面的方法。
本申请提供的音频处理方法、装置、电子设备及存储介质,应用于音频处理系统,该系统包括相互连接的第一终端和第二终端,以及与所述第一终端相连的处理终端。第一终端在响应用户的交互操作时,获取到用户的原始音频数据后,可以在第一终端中根据预先获取的预设音频参数对原始音频数据进行数据转换,通过数据转换将原始音频数据处理为目标音频数据,并且预设音频参数表示第二终端的音频属性。接着,第一终端才会将数据转换之后得到的目标音频数据发送给处理终端进行预设处理操作,并且发送给第二终端,使第二终端将目标音频数据转换为可播放音频再播放该可播放音频。通过在第一终端中根据预先获取的用于表示第二终端的音频属性的预设音频参数将用户的原始音频数据转换为目标音频数据,即使第一终端与第二终端的音频属性不一致,也可以实现语音通话,并且通过调整预设音频参数还可以使第一终端与支持任意音频属性的第二终端进行语音通话,因此在处理终端对语音通话的过程进行预设处理时,可以实现对不同音频属性的通话终端之间语音通话过程的分析和处理,不仅丰富了语音通话的使用场景,还提升了语音通话调试和验证的灵活性。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一实施例提供的音频处理方法的一种应用环境示意图;
图2示出了本申请一实施例提供的第一终端的音频处理方法的流程示意图;
图3示出了本申请另一实施例提供的第一终端的音频处理方法的流程示意图;
图4示出了本申请一实施例提供的第二终端的音频处理方法的流程示意图;
图5示出了本申请又一实施例提供的音频处理系统的音频处理方法的流程示意图;
图6示出了本申请一实施例提供的音频处理装置的模块框图;
图7示出了本申请另一实施例提供的音频处理装置的模块框图;
图8示出了本申请一实施例提供的电子设备的结构框图;
图9示出了本申请一实施例提供的计算机可读存储介质的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
在语音通话的场景下,通话双方所支持的音频参数和音频格式往往是固定不变的,不同的音频参数与音频格式的终端很难适配,语音通话的使用场景受限,灵活性不高。
经过仔细研究,发明人发现,特别是在对语音通话过程中产生的语音进行分析处理时,需要对分析处理的程序进行调试和验证。此时,往往需要在不同的通话终端之间产生一则语音通话进行调试或验证,若此时仅仅对固定语音参数和语音格式的通话终端进行调试或验证,无疑令语音通话的场景受到了限制,使得语音通话的调试和验证缺乏了灵活性。
为解决上述问题,本申请发明人投入研发,在对第一终端和第二终端之间的语音通话进行调试和验证时,可以在第一终端中根据预先获取的用于表示第二终端的音频属性的预设音频参数,接着将用户的原始音频数据转换为目标音频数据,即使第一终端与第二终端的音频属性不一致,也可以实现语音通话,并且通过调整预设音频参数还可以使第一终端与支持任意音频属性的第二终端进行语音通话,因此,在处理终端对语音通话的过程进行预设处理时,可以实现对支持不同音频参数的通话终端的分析和处理,不仅丰富了语音通话的使用场景,还提升了语音通话调试和验证的灵活性。
为了更好理解本申请实施例提供的一种音频处理方法、装置、电子设备及存储介质,下面先对适用于本申请实施例的应用环境进行描述。
请参阅图1,图1示出了本申请一实施例提供的音频处理方法的一种应用环境示意图,本申请实施例提供的音频处理方法、装置、电子设备及存储介质可以应用于如图1所示的音频处理系统100。音频处理系统100包括第一终端110、第二终端120以及处理终端130,第一终端110与第二终端120通信连接,第一终端110还与处理终端130通信连接。其中,第一终端110、第二终端120以及处理终端130均可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴式电子设备或服务器等。需要说明的是,第一终端110、第二终端120以及处理终端130可以是相同类型的电子设备,第一终端110、第二终端120以及处理终端130也可以是不同类型的电子设备,本申请实施例对此不做限制。具体地,电子设备还可以具有数据输入的功能,数据输入可以是基于电子设备所配置的语音模块输入语音、字符输入模块输入字符、图像输入模块输入图像、视频输入模块输入视频等,还可以是基于电子设备所配置的手势识别模块,使得用户可以实现手势输入等交互方式。电子设备内可以安装有多个应用程序,用户可以使用多个应用程序实现不同的功能、用途。
可选地,若第一终端110、第二终端120或者处理终端130为服务器,则服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。另外,服务器可以是云端服务器,还可以是传统机房服务器,在此不作具体限定。
在一些实施例中,通过第一终端110可以在语音通话过程中获取用户的音频数据,例如可以通过第一终端自身的麦克风或者外接的麦克风等等获取用户的音频数据,接着通过本申请实施例所示的方法对音频数据进行相应处理后,将处理后的音频数据发送给第二终端120和处理终端130。可选地,在第一终端与第二终端的语音通话过程中,第二终端也可以获取第二终端的用户的音频数据,接着通过本申请实施例所示的方法对音频数据进行相应处理后,将处理后的音频数据发送给第一终端110和处理终端130。
其中,第一终端110和第二终端120为语音通话的两个通话终端,而处理终端130则通过预设处理操作对第一终端110和第二终端120所产生的音频数据进行处理,从而实现对音频处理系统的调试或验证。
上述应用环境仅为方便理解所作的示例,可以理解的是,本申请实施例不仅局限于上述应用环境。
下面将通过具体实施例对本申请实施例提供的音频处理方法、装置、电子设备及存储介质进行详细说明。
请参阅图2,其示出了本申请一实施例提供的第一终端的音频处理方法的流程示意图,应用于第一终端,第一终端与第二终端相连。下面将针对图2所示的流程进行详细的阐述,所述音频处理方法具体可以包括如下步骤:
步骤S210:响应于用户的交互操作,获取所述用户的原始音频数据。
在本申请的一些实施例中,第一终端可以是语音通话的发起方,第二终端可以是语音通话的接收方。此时用户的交互操作可以用于向第二终端发起语音通话请求,第二终端在接收到语音通话请求之后选择接受该语音通话请求,或者拒绝该语音通话请求。若第二终端接受该语音通话请求,则第二终端可以在接受该语音通话请求后建立与第一终端的语音通话连接。可选地,用户的交互操作可以为语音拨号操作。
在本申请的另一些实施例中,第一终端可以是语音通话的接收方,而第二终端可以是语音通话的发起方。此时用户的交互操作可以用于接受第二终端向第一终端发起语音通话请求并根据该语音通话请求与第二终端建立语音通话连接。可选地,当第一终端接收到第二终端发送的语音通话请求之后,可以在第一终端的显示界面显示来电提醒信息,当检测到用户在显示界面提交的交互操作后,第一终端将接受该语音通话请求并与第二终端建立语音通话连接。可选地,用户的交互操作可以为来电接收操作。
可以理解的是,当第一终端与第二终端的语音通话连接建立之后,第一终端的用户与第二终端的用户可以进行语音通话。此时,响应于用户的交互操作,第一终端可以获取用户的原始音频数据。可选地,第一终端可以通过自身的麦克风或者外接的麦克风等等获取用户的原始音频数据。需要说明的是,用户的原始音频数据可以是第一终端通过录音所获取的未经过音频处理的用户语音。
步骤S220:按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性。
在一些实施方式中,可以根据第二终端的音频属性对第一终端获取的原始音频数据进行数据转换。具体地,预设音频参数可以用于表示第二终端的音频属性,并且可以第一终端获取原始音频数据之前预先获取得到。示例性地,可以在第一终端与第二终端建立语音通话连接后,立即获取第二终端的音频属性,并且将获取到的各个音频属性的属性值保存为预设音频参数。可选地,第二终端的音频属性例如可以包括采样位数、采样率、声道。
经过数据转换,第一终端可以将原始音频数据的音频属性转换为第二终端的音频属性,得到目标音频数据。由于目标音频数据的音频属性与第二终端所支持的音频属性一致,因此第二终端在接收到目标音频数据之后,可以将目标音频数据转换为可播放音频即可,无需再对目标音频数据的音频属性进行转换。
其中,由于原始音频参数的音频属性进行数据转换的过程是在第一终端,即语音的发送端实现的,因此,通过调整预设音频参数或者预先获取第二终端的音频属性,则可以使第一终端与支持任意音频属性的第二终端进行语音通话。
步骤S230:基于所述交互操作,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作。
在本申请的实施例中,为了实现对第一终端和第二终端的语音通话过程的调试和验证,可以根据该用户的交互操作,将目标音频数据发送给处理终端,使得处理终端可以对目标音频数据进行预设处理操作。示例性地,若第一终端可以是语音通话的发起方,第二终端可以是语音通话的接收方,则在第二终端接收到第一终端基于交互操作发送的语音通话请求并建立与第一终端的语音通话连接,且第一终端确定与第二终端的该语音通话连接已经建立后,第一终端可以将获取到的原始音频数据按照预设音频参数转换为目标音频数据,并且将该目标音频数据发送给处理终端;若第一终端可以是语音通话的接收方,而第二终端可以是语音通话的发起方,则在第一终端基于交互操作接受了第二终端发送的语音通话请求并建立与第二终端的语音通话连接后,第一终端可以将获取到的原始音频数据按照预设音频参数转换为目标音频数据,并且将该目标音频数据发送给处理终端。
可选地,处理终端在接收到目标音频数据后,可以对目标音频数据进行预设处理操作。处理终端可以通过预设处理操作实现对第一终端和第二终端的语音通话过程的调试和验证。基于此,预设处理操作可以包括将目标音频数据转换为可播放音频并播放可播放音频,对目标音频数据进行语音识别,以及根据用户需求所确定的处理操作等其中一个或多个操作,本申请实施例对此不作限制。
需要说明的是,在第一终端将目标音频数据发送给处理终端之前,第一终端可以建立与处理终端之间的通信连接。
步骤S240:在将所述目标音频数据发送给处理终端的过程中,将所述目标音频数据发送给所述第二终端,以使所述第二终端将所述目标音频数据转换为可播放音频并播放所述可播放音频。
可以理解的是,处理终端是用于实现对第一终端和第二终端的语音通话过程的调试和验证,因此,在第一终端将目标音频数据发送给处理终端的过程中,同时也将目标音频数据发送给第二终端,并且第二终端在接收到目标音频数据后可以将目标音频数据转换为可播放音频,并播放该可播放音频。
其中,终端对音频进行录音后,得到的音频数据是不可播放的。即是说,在本申请的实施例中,当第二终端接收到目标音频数据后,需要将目标音频数据转换为可播放音频,才可在第二终端中播放可播放音频。
在一些实施方式中,可以根据预设音频参数确定第二终端的音频格式要求,接着在根据该音频格式要求对目标音频数据进行格式转换,得到可播放音频。其中,第二终端的音频格式要求包括了第二终端所支持的音频格式。因此,作为一种实施例,在根据该音频格式要求对目标音频数据进行格式转换,得到可播放音频使,可以对目标音频数据添加该预设音频参数对应的音频格式要求的文件头标志来得到可播放音频。其中,音频格式要求可以是第二终端所支持的一种或多种音频格式,例如MP3格式、WAB格式等等。
可选地,若第二终端在播放时需要播放双声道音频,而第一终端录音时所获取的原始音频数据为单声道音频,可以理解的是,目标音频数据也为单声道音频,因此,第二终端在将目标音频数据转换为可播放音频时,还可以对目标音频数据进行双声道处理,从而使最终得到的可播放音频为双声道音频。
综上所述,本实施例提供的音频处理方法,应用于第一终端,该第一终端与第二终端相连,通过在第一终端中根据预先获取的用于表示第二终端的音频属性的预设音频参数将用户的原始音频数据转换为目标音频数据,即使第一终端与第二终端的音频属性不一致,也可以实现语音通话,并且通过调整预设音频参数还可以使第一终端与支持任意音频属性的第二终端进行语音通话,因此当处理终端对语音通话的过程执行预设处理操作时,可以实现对不同音频属性的通话终端之间语音通话过程的分析和处理,不仅丰富了语音通话的使用场景,还提升了语音通话调试和验证的灵活性。
可选地,本实施例在上述实施例的基础上,提供一种音频处理方法,第一终端可以通过分片录音的方式将目标音频数据发送给第二终端。具体地,请参阅图3,其示出了本申请另一实施例提供的第一终端的音频处理方法的流程示意图,应用于第一终端,第一终端与第二终端相连。所述音频处理方法具体可以包括如下步骤:
步骤S310:响应于用户的交互操作,获取所述用户的原始音频数据。
具体地,步骤S310的具体描述请参阅前述实施例中的步骤S210,在此不再赘述。
步骤S320:按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性。
具体地,步骤S320的具体描述请参阅前述实施例中的步骤S220。
可选地,在一些实施方式中,预设音频参数包括音频采样频率,此时,在按照预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据时,可以首先确定该音频采样频率与原始音频数据的采样频率是否相同,若该音频采样频率与原始音频数据的采样频率不同,则基于该音频采样频率对原始音频数据进行重采样,得到目标音频数据。可以理解的是,经过重采样后,目标音频数据的采样频率与该音频采样频率一致。
示例性地,若第一终端通过耳机对用户的语音进行录音得到原始音频数据。由耳机的硬件特性得到该原始音频数据的采样频率为48kHz,而第二终端所支持的音频采样频率是16kHz,即预设音频参数中的音频采样频率为16kHz,两者不同,则为了第一终端与第二终端之间可以进行语音通话,可以按照预设音频参数中的音频采样频率对原始音频数据进行重采样,经过重采样后,可以将原始音频数据的采样频率48kHz压缩为16kHz,得到目标音频数据。
这样,通过预先获取第二终端的音频采样频率,并且当第二终端的音频采样频率与第一终端所获取的原始音频数据的采样频率不一致时,根据第二终端的音频采样频率对原始音频数据进行重采样,经过重采样可以将与第二终端的音频采样频率不一致的原始音频数据转换为与第二终端的音频采样频率一致的目标音频数据,可使第二终端在接收到目标音频数据后可顺利将其转换为可播放音频,由此实现两个不同采样频率的设备间的语音通话。
此外,预设音频参数还可以包括采样位数、声道,以及根据第二终端的音频属性所确定的属性值,通过调整预设音频参数或者预先获取第二终端的音频属性,则可以使第一终端与支持任意音频属性的第二终端进行语音通话。
步骤S330:基于所述交互操作,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作。
作为一种实施方式,第一终端可以基于交互操作将目标音频数据发送给处理终端,处理终端在接收到目标音频数据后可以对目标音频数据进行预设处理操作。具体地,步骤S310的具体描述请参阅前述实施例中的步骤S210,在此不再赘述。
在一些实施方式中,在第一终端将目标音频数据发送给处理终端的过程中,还可以同时将目标音频数据发送给第二终端。可选地,在一些实施方式中,第一终端可以实时地获取到的原始音频数据转换成目标音频数据,并且实时地将目标音频数据发送给第二终端和处理终端。
具体地,第一终端可以通过分片录音的方式将目标音频数据发送给第二终端。可选地,第一终端也可以通过分片录音的方式将目标音频数据发送给第二终端。其中,分片录音的方式可以参考下述实施例的内容。
步骤S340:在将所述目标音频数据发送给处理终端的过程中,将所述目标音频数据划分为预设大小的目标音频数据后,将数据划分后的所述目标音频数据发送给所述第二终端,以使所述第二终端将所述目标音频数据转换为可播放音频并播放所述可播放音频。
在本申请的实施例中,第一终端在将目标音频数据发送给第二终端时,可以将目标音频数据划分成预设大小的目标音频数据,接着将数据划分之后的目标音频数据逐个发送给第二终端。可以理解的是,相对于直接传输完整的目标音频数据,将目标音频数据划分为预设大小,然后逐个传输预设大小的目标音频数据可以使提升传输速率。示例性地,此时的预设大小可以基于第一终端与第二终端之间的网络状态而确定,例如可以随着第一终端与第二终端之间的网络传输速率而变化等等。此外,预设大小也可以手动指定,本申请实施例对此不做限制。预设大小的一个典型值为10bit。
若第一终端以上述分片录音的方式将目标音频数据划分成预设大小的目标音频数据再发送给第二终端,则第二终端在接受到这些预设大小的目标音频数据之后,可以将这些预设大小的目标音频数据组合为完整的目标音频数据。其中,为了时组合后得到的目标音频数据与第一终端数据划分前的目标音频数据一致,在第一终端进行数据划分时,可以对每个预设大小的目标音频数据添加一个音频标记,该音频标记可以用于指示当前这个预设大小的目标音频数据在完整的目标音频数据中所处的位置。接着,在第二终端接收到带有音频标记的这些预设大小的目标音频数据后,可以根据每个预设大小的目标音频数据对应的音频标记确定当前这个预设大小的目标音频数据在完整的目标音频数据中所处的位置,并基于该位置将所有预设大小的目标音频数据组合为完成的目标音频数据。最后第二终端再将完整的目标音频数据转换为可播放数据并进行播放。
可选地,第一终端在将目标音频数据发送给处理终端时,也可以将目标音频数据划分为预设大小的目标音频数据后,再将数据划分后的目标音频数据发送给处理终端。可选地,此时的预设大小可以根据基于第一终端与处理终端之间的网络状态而确定,例如可以随着第一终端与处理终端之间的网络传输速率而变化等等。此外,第一终端与处理终端之间传输的预设大小也可以手动指定,第一终端与处理终端之间传输的预设大小还可以与第一终端与第二终端之间传输的预设大小一致,本申请实施例对此不作限制。
类似地,若第一终端以上述分片录音的方式将目标音频数据划分成预设大小的目标音频数据再发送给处理终端,则处理终端在接受到这些预设大小的目标音频数据之后,可以将这些预设大小的目标音频数据组合为完整的目标音频数据。可以理解的是,在第一终端进行数据划分时,也可以对每个预设大小的目标音频数据添加一个音频标记,该音频标记可以用于指示当前这个预设大小的目标音频数据在完整的目标音频数据中所处的位置。接着在处理终端接收到带有音频标记的这些预设大小的目标音频数据后,可以根据每个预设大小的目标音频数据对应的音频标记确定当前这个预设大小的目标音频数据在完整的目标音频数据中所处的位置,并基于该位置将所有预设大小的目标音频数据组合为完成的目标音频数据。最后处理终端再对完整的目标音频数据进行预设处理操作。
可选地,请参阅图4,图4示出了本申请一实施例提供的第二终端的音频处理方法的流程示意图,应用于第二终端,所述第二终端与第一终端相连。所述音频处理方法具体可以包括如下步骤:
步骤S410:获取目标音频数据,所述目标音频数据为所述第一终端按照预先获取的预设音频参数对原始音频数据进行数据转换得到,所述预设音频参数用于表示所述第二终端的音频属性,所述原始音频数据为所述第一终端响应于用户的交互操作而获取得到,其中,所述交互操作用于指示所述第一终端在将所述目标音频数据发送给第二终端的过程中,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作。
在本申请的实施例中,第二终端可以接收由第一终端发送的目标音频数据。其中,目标音频数据是第一终端按照预先获取的预设音频参数对原始音频数据进行数据转换而得到的。而预设音频参数用于表示第二终端的音频属性,原始音频数据为第一终端响应于用户的交互操作而获取到的用户的音频数据。并且,用户的交互操作可以用于指示第一终端在将目标音频数据发送给第二终端的过程中,还将目标音频数据发送给处理终端,以使处理终端对目标音频数据进行预设操作。也就是说,用户的交互操作不仅仅可以用于指示第一终端与第二终端进行语音通话,还可以指示第一终端将第一终端与第二终端语音通话过程中产生的目标音频数据发送给处理终端,由此使处理终端可以通过预设处理操作实现对第一终端和第二终端的语音通话过程的调试和验证。
具体地,第一终端确定目标音频数据的过程,以及第一终端将目标音频数据发送个第二终端的过程可以参考任一方法实施例中的对应内容,本申请实施例对此不再赘述。
步骤S420:将所述目标音频数据转换为可播放音频,播放所述可播放音频。
第二终端在接收到目标音频数据之后,可以将目标音频数据转换为可播放音频,并且播放该可播放音频。可选地,第二终端可以对目标音频数据添加预设格式的文件头标志来得到可播放音频。
可选地,若第二终端在播放时需要播放双声道音频,而第一终端录音时所获取的原始音频数据为单声道音频,可以理解的是,目标音频数据也为单声道音频,因此,第二终端在将目标音频数据转换为可播放音频时,还可以对目标音频数据进行双声道处理,从而使最终得到的可播放音频为双声道音频。
综上所述,本实施例提供的音频处理方法,应用于第二终端,该第二终端与第一终端相连,第二终端可以接收由第一终端发送的目标音频数据。其中,目标音频数据是第一终端按照预先获取的预设音频参数对原始音频数据进行数据转换而得到的。而预设音频参数用于表示第二终端的音频属性,原始音频数据为第一终端响应于用户的交互操作而获取到的用户的音频数据。并且,用户的交互操作可以用于指示第一终端在将目标音频数据发送给第二终端的过程中,还将目标音频数据发送给处理终端,以使处理终端对目标音频数据进行预设操作。也就是说,用户的交互操作不仅仅可以用于指示第一终端与第二终端进行语音通话,还可以指示第一终端将第一终端与第二终端语音通话过程中产生的目标音频数据发送给处理终端,由此使处理终端可以通过预设处理操作实现对第一终端和第二终端的语音通话过程的调试和验证,不仅丰富了语音通话的使用场景,还提升了语音通话调试和验证的灵活性。
在本申请的实施例中,第二终端在获取目标音频数据之前,可以先建立与第一终端的语音通话连接,可以理解的是,目标音频数据可以是该语音通话所产生的音频数据。
其中,若第一终端为语音通话的发起方,第二终端为语音通话的接收方。此时第一终端可以基于用户的交互操作向第二终端发起语音通话请求,第二终端在接收到语音通话请求之后可以选择接受该语音通话请求,或者拒绝该语音通话请求。若第二终端接受该语音通话请求,则第二终端可以在接受该语音通话请求后建立与第一终端的语音通话连接。可选地,此时的用户的交互操作可以为语音拨号操作。
若第一终端为语音通话的接收方,而第二终端为语音通话的发起方。此时第二终端可以向第一终端发起语音通话请求,而第一终端在接收到第二终端的语音通话请求之后,第一终端可以基于用户的交互操作接受该语音通话请求,并且第一终端可以根据该语音通话请求与第二终端建立语音通话连接。可选地,此时的用户的交互操作可以为来电接收操作。
可以理解的是,当第二终端与第一终端的语音通话连接建立之后,第二终端的用户与第一终端的用户可以进行语音通话。此时,第二终端可以接收由第一终端发送的目标音频数据,该目标音频数据的确定过程可以参考前述实施例中的内容,本申请实施例对此不作限制。
在一些实施方式中,在第二终端与第一终端的语音通话过程中,,当第一终端未获取到用户的音频数据时,可以产生一个空白音频,该空白音频用于提示第二终端当前第一终端无人说话,因此,若第二终端检测到目标音频数据为空白音频,此时第二终端可以中断与第一终端的语音通话连接。由此可以在用户误拨语音时自动结束该语音通话。
在一些典型的实施方式中,可以在第一终端和第二终端之间,以及第一终端和处理终端之间分别建立socketIO连接。第一终端可以通过socketIO将目标语音数据转发至处理终端的接口地址,当处理终端接收到目标语音数据后可以通过预设处理操作对目标语音数据进行分析和处理。在第一终端通过socketIO将目标语音数据转发至处理终端的过程中,第一终端还可以通过socketIO将目标语音数据转发至第二终端,第二终端接收到目标语音数据后再对目标语音数据添加文件头标志生成可播放音频并播放该可播放音频。
在一些实施方式中,当第一终端和第二终端之间建立语音通话的socketIO连接后,可以实现socketIO的单例维护,包括但不限于socketIO的心跳检测、异常错误处理手段、通话状态的捕获处理、socketIO的断线重连以及socketIO的状态钩子处理等其中一个或多个维护操作。
请参考图5,其示出了本申请又一实施例提供的音频处理系统的音频处理方法的流程示意图,其中,该系统包括相互连接的第一终端和第二终端,以及与所述第一终端相连的处理终端。该方法包括:S510至S550。
步骤S510:响应于用户的交互操作,第一终端获取所述用户的原始音频数据。
在本申请的实施方式中,无论第一终端为语音通话的发起方还是接收方,只要第一终端与第二终端建立了语音通话连接,并且第一终端与处理终端相连接,即可在检测到用户的交互操作时,获取用户原始音频数据。
步骤S520:第一终端按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性。
在本申请的实施例中,第一终端可以按照前述实施例中的对应内容,根据预设音频参数对原始音频数据进行数据转换,得到目标音频数据。由此,通过调整预设音频参数或者预先获取第二终端的音频属性,则可以使第一终端与支持任意音频属性的第二终端进行语音通话。
步骤S530:基于所述交互操作,第一终端将所述目标音频数据发送给处理终端。
在本申请的实施例中,第一终端可以根据该交互操作,将目标音频数据发送给处理终端。
步骤S540:在将所述目标音频数据发送给处理终端的过程中,第一终端将所述目标音频数据发送给所述第二终端。
在第一终端将目标音频数据发送给处理终端的过程中,第一终端还可以将目标音频数据发送给第二终端。
步骤S550:处理终端接收所述目标音频数据,对所述目标音频数据进行预设处理操作。
在本申请的实施例中,处理终端可以接收由第一终端发送的目标音频数据,并且对目标音频数据进行预设处理操作,以此来实现对第一终端和第二终端的语音通话过程中产生的目标语音数据的分析和处理。
步骤S560:第二终端接收所述目标音频数据,将所述目标音频数据转换为可播放音频并播放所述可播放音频。
同时,第二终端在接收到目标音频数据之后,可以将目标音频数据转换为可播放音频并播放该可播放音频。
其中,步骤S540-步骤S560的具体描述请参阅前述实施例中的对应内容,在此不再赘述。
在一些实施方式中,该音频处理系统中第一终端、第二终端以及处理终端各自实现的方法封装到电子设备的应用程序(Application,APP)中,通过在各个电子设备中安装该APP,即可实现各个电子设备之间的语音通话。其中,该音频处理系统不仅能够兼容电脑与移动终端,若将该音频处理系统部署上服务器,还能够实现在语音通话的调试和验证时,提供多设备兼容的场景验证展示。
综上所述,本申请实施例提供了一种音频处理系统,该系统包括相互连接的第一终端和第二终端,以及与所述第一终端相连的处理终端。第一终端在响应用户的交互操作时,获取到用户的原始音频数据后,可以在第一终端中根据预先获取的预设音频参数对原始音频数据进行数据转换,通过数据转换将原始音频数据处理为目标音频数据,并且预设音频参数表示第二终端的音频属性。接着,第一终端才会将数据转换之后得到的目标音频数据发送给处理终端进行预设处理操作,并且发送给第二终端,使第二终端将目标音频数据转换为可播放音频再播放该可播放音频。通过在第一终端中根据预先获取的用于表示第二终端的音频属性的预设音频参数将用户的原始音频数据转换为目标音频数据,即使第一终端与第二终端的音频属性不一致,也可以实现语音通话,并且通过调整预设音频参数还可以使第一终端与支持任意音频属性的第二终端进行语音通话,因此在处理终端对语音通话的过程进行预设处理时,可以实现对不同音频属性的通话终端之间语音通话过程的分析和处理,不仅丰富了语音通话的使用场景,还提升了语音通话调试和验证的灵活性。
请参阅图6,示出了本申请一实施例提供的音频处理装置的模块框图。具体地,该装置应用于第一终端,所述第一终端与第二终端相连,该装置包括:第一获取模块610、数据转换模块620、第一发送模块630以及第二发送模块640。
其中,第一获取模块610,用于响应于用户的交互操作,获取所述用户的原始音频数据;数据转换模块620,用于按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性;第一发送模块630,用于基于所述交互操作,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;第二发送模块640,用于在将所述目标音频数据发送给处理终端的过程中,将所述目标音频数据发送给所述第二终端,以使所述第二终端将所述目标音频数据转换为可播放音频并播放所述可播放音频。
可选地,上述第二发送模块640可以包括:数据分片模块,用于将所述目标音频数据划分为预设大小的目标音频数据后,将数据划分后的所述目标音频数据发送给所述第二终端。
可选地,上述数据转换模块620可以包括:重采样模块,用于若所述音频采样频率与所述原始音频数据的采样频率不同,基于所述音频采样频率对所述原始音频数据进行重采样,得到所述目标音频数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
请参阅图7,示出了本申请另一实施例提供的音频处理装置的模块框图。具体地,该装置应用于第二终端,所述第二终端与所述第一终端相连,该装置包括:第二获取模块710以及音频播放模块720。
其中,第二获取模块710,用于获取目标音频数据,所述目标音频数据为所述第一终端按照预先获取的预设音频参数对原始音频数据进行数据转换得到,所述预设音频参数用于表示所述第二终端的音频属性,所述原始音频数据为所述第一终端响应于用户的交互操作而获取得到,其中,所述交互操作用于指示所述第一终端在将所述目标音频数据发送给第二终端的过程中,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;音频播放模块720,用于将所述目标音频数据转换为可播放音频,播放所述可播放音频。
可选地,所述音频处理装置还可以包括:通话建立模块,用于建立与所述第一终端的语音通话连接,所述目标音频数据为所述语音通话产生的音频数据。
可选地,所述音频处理装置还可以包括:误拨检测模块,用于若检测到所述目标音频数据为空白音频,中断与所述第一终端的语音通话连接。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置中模块/单元/子单元/组件的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,所显示或讨论的模块相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请参阅图8,其示出了本申请一实施例提供的电子设备的结构框图,具体地,所述电子设备一个或多个如下部件:处理器810、存储器820以及一个或多个应用程序。一个或多个应用程序可以被存储在存储器820中并被配置为由一个或多个:处理器810执行,一个或多个应用程序配置用于执行如前述应用于第一终端或应用于第二终端中的任一种方法实施例所描述的方法。
电子设备可以为移动、便携式并执行无线通信的各种类型的计算机系统设备中的任何一种。具体的,电子设备可以为移动电话或智能电话(例如,基于iPhone TM,基于Android TM的电话)、便携式游戏设备(例如Nintendo DS TM,PlayStation Portable TM,Gameboy Advance TM,iPhone TM)、膝上型电脑、PDA、便携式互联网设备、音乐播放器、服务器以及数据存储设备,其他手持设备以及诸如智能手表、智能手环、耳机、吊坠等,电子设备还可以为其他的可穿戴设备(例如,诸如电子眼镜、电子衣服、电子手镯、电子项链、电子纹身、电子设备或头戴式设备(HMD))。
电子设备还可以是多个电子设备中的任何一个,多个电子设备包括但不限于蜂窝电话、智能电话、智能手表、智能手环、其他无线通信设备、个人数字助理、音频播放器、其他媒体播放器、音乐记录器、录像机、照相机、其他媒体记录器、收音机、医疗设备、车辆运输仪器、计算器、可编程遥控器、寻呼机、膝上型计算机、台式计算机、打印机、上网本电脑、个人数字助理(PDA)、便携式多媒体播放器(PMP)、运动图像专家组(MPEG-1或MPEG-2)音频层3(MP3)播放器,便携式医疗设备以及数码相机及其组合。
在一些情况下,电子设备可以执行多种功能(例如,播放音乐,显示视频,存储图片以及接收和发送电话呼叫)。如果需要,电子设备可以是诸如蜂窝电话、媒体播放器、其他手持设备、腕表设备、吊坠设备、听筒设备或其他紧凑型便携式设备。
处理器810可以包括一个或者多个处理核。处理器810利用各种接口和线路连接整个电子设备内的各个部分,通过运行或执行存储在存储器820内的指令、应用程序、代码集或指令集,以及调用存储在存储器820内的数据,执行电子设备的各种功能和处理数据。可选地,处理器810可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器810可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器810中,单独通过一块通信芯片进行实现。
存储器820可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器820可用于存储指令、应用程序、代码、代码集或指令集。存储器820可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等),用于执行上述应用于第一终端和应用于第二终端中的任一种方法实施例所描述的方法。存储数据区还可以存储电子设备在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的电子设备的处理器810、存储器820的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
请参考图9,其示出了本申请一实施例提供的计算机可读存储介质的结构框图。该计算机可读存储介质900中存储有程序代码,所述程序代码可被处理器调用执行上述任一方法实施例中所描述的方法。
计算机可读存储介质900可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质900包括非易失性计算机可读存储介质(non-transitory computer-readable storage medium)。计算机可读存储介质900具有执行上述方法中的任何方法步骤的程序代码910的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码910可以例如以适当形式进行压缩。其中,计算机可读存储介质900可以是如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、SSD、带电可擦可编程只读存储器(Electrically Erasable Programmable readonly memory,简称EEPROM)或快闪存储器(Flash Memory,简称Flash)等。
在一些实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、SSD、Flash)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例的方法。
综上所述,本申请提供的音频处理方法、装置、电子设备及存储介质,应用于音频处理系统,该系统包括相互连接的第一终端和第二终端,以及与所述第一终端相连的处理终端。第一终端在响应用户的交互操作时,获取到用户的原始音频数据后,可以在第一终端中根据预先获取的预设音频参数对原始音频数据进行数据转换,通过数据转换将原始音频数据处理为目标音频数据,并且预设音频参数表示第二终端的音频属性。接着,第一终端才会将数据转换之后得到的目标音频数据发送给处理终端进行预设处理操作,并且发送给第二终端,使第二终端将目标音频数据转换为可播放音频再播放该可播放音频。通过在第一终端中根据预先获取的用于表示第二终端的音频属性的预设音频参数将用户的原始音频数据转换为目标音频数据,即使第一终端与第二终端的音频属性不一致,也可以实现语音通话,并且通过调整预设音频参数还可以使第一终端与支持任意音频属性的第二终端进行语音通话,因此在处理终端对语音通话的过程进行预设处理时,可以实现对不同音频属性的通话终端之间语音通话过程的分析和处理,不仅丰富了语音通话的使用场景,还提升了语音通话调试和验证的灵活性。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (16)
1.一种音频处理方法,其特征在于,应用于第一终端,所述第一终端与第二终端相连,所述方法包括:
响应于用户的交互操作,获取所述用户的原始音频数据;
按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性;
基于所述交互操作,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;
在将所述目标音频数据发送给处理终端的过程中,将所述目标音频数据发送给所述第二终端,以使所述第二终端将所述目标音频数据转换为可播放音频并播放所述可播放音频。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标音频数据发送给所述第二终端,包括:
将所述目标音频数据划分为预设大小的目标音频数据后,将数据划分后的所述目标音频数据发送给所述第二终端。
3.根据权利要求1所述的方法,其特征在于,所述预设音频参数包括音频采样频率,所述按照预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,包括:
若所述音频采样频率与所述原始音频数据的采样频率不同,基于所述音频采样频率对所述原始音频数据进行重采样,得到所述目标音频数据。
4.一种音频处理方法,其特征在于,应用于第二终端,所述第二终端与第一终端相连,所述方法包括:
获取目标音频数据,所述目标音频数据为所述第一终端按照预先获取的预设音频参数对原始音频数据进行数据转换得到,所述预设音频参数用于表示所述第二终端的音频属性,所述原始音频数据为所述第一终端响应于用户的交互操作而获取得到,其中,所述交互操作用于指示所述第一终端在将所述目标音频数据发送给第二终端的过程中,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;
将所述目标音频数据转换为可播放音频,播放所述可播放音频。
5.根据权利要求4所述的方法,其特征在于,所述获取目标音频数据之前,还包括:
建立与所述第一终端的语音通话连接,所述目标音频数据为所述语音通话产生的音频数据。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若检测到所述目标音频数据为空白音频,中断与所述第一终端的语音通话连接。
7.根据权利要求4所述的方法,其特征在于,所述将所述目标音频数据转换为可播放音频,包括:
基于所述预设音频参数确定所述第二终端的音频格式要求;
根据所述音频格式要求对所述目标音频数据进行格式转换,得到所述可播放音频。
8.一种音频处理系统,其特征在于,该系统包括相互连接的第一终端和第二终端,以及与所述第一终端相连的处理终端,所述系统包括:
所述第一终端用于响应于用户的交互操作,获取所述用户的原始音频数据;
所述第一终端还用于按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性;
所述第一终端还用于基于所述交互操作,将所述目标音频数据发送给处理终端;
所述第一终端还用于在将所述目标音频数据发送给处理终端的过程中,将所述目标音频数据发送给所述第二终端;
所述处理终端用于接收所述目标音频数据,所述处理终端还用于对所述目标音频数据进行预设处理操作;
所述第二终端用于接收所述目标音频数据,所述第二终端还用于将所述目标音频数据转换为可播放音频并播放所述可播放音频。
9.一种音频处理装置,其特征在于,应用于第一终端,所述第一终端与第二终端相连,所述装置包括:
第一获取模块,用于响应于用户的交互操作,获取所述用户的原始音频数据;
数据转换模块,用于按照预先获取的预设音频参数对所述原始音频数据进行数据转换,得到目标音频数据,所述预设音频参数用于表示所述第二终端的音频属性;
第一发送模块,用于基于所述交互操作,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;
第二发送模块,用于在将所述目标音频数据发送给处理终端的过程中,将所述目标音频数据发送给所述第二终端,以使所述第二终端将所述目标音频数据转换为可播放音频并播放所述可播放音频。
10.一种音频处理装置,其特征在于,应用于第二终端,所述第二终端与所述第一终端相连,所述装置包括:
第二获取模块,用于获取目标音频数据,所述目标音频数据为所述第一终端按照预先获取的预设音频参数对原始音频数据进行数据转换得到,所述预设音频参数用于表示所述第二终端的音频属性,所述原始音频数据为所述第一终端响应于用户的交互操作而获取得到,其中,所述交互操作用于指示所述第一终端在将所述目标音频数据发送给第二终端的过程中,将所述目标音频数据发送给处理终端,以使所述处理终端对所述目标音频数据进行预设处理操作;
音频播放模块,用于将所述目标音频数据转换为可播放音频,播放所述可播放音频。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行如权利要求1-3中任意一项所述的方法。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行如权利要求4-7中任意一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-3中任意一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求4-7中任意一项所述的方法。
15.一种包含指令的计算机程序产品,其特征在于,所述计算机程序产品中存储有指令,当其在计算机上运行时,使得计算机实现如权利要求1-3中任意一项所述的方法。
16.一种包含指令的计算机程序产品,其特征在于,所述计算机程序产品中存储有指令,当其在计算机上运行时,使得计算机实现如权利要求4-7中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210239161.0A CN114639392A (zh) | 2022-03-11 | 2022-03-11 | 音频处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210239161.0A CN114639392A (zh) | 2022-03-11 | 2022-03-11 | 音频处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114639392A true CN114639392A (zh) | 2022-06-17 |
Family
ID=81948347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210239161.0A Pending CN114639392A (zh) | 2022-03-11 | 2022-03-11 | 音频处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114639392A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116013334A (zh) * | 2023-01-28 | 2023-04-25 | 荣耀终端有限公司 | 音频数据处理方法、电子设备及存储介质 |
-
2022
- 2022-03-11 CN CN202210239161.0A patent/CN114639392A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116013334A (zh) * | 2023-01-28 | 2023-04-25 | 荣耀终端有限公司 | 音频数据处理方法、电子设备及存储介质 |
CN116013334B (zh) * | 2023-01-28 | 2023-08-18 | 荣耀终端有限公司 | 音频数据处理方法、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109246672B (zh) | 数据传输方法、装置、系统及蓝牙耳机 | |
CN109445740B (zh) | 音频播放方法、装置、电子设备及存储介质 | |
EP4027238B1 (en) | Card rendering method and electronic device | |
CN109274405B (zh) | 数据传输方法、装置、电子设备及计算机可读介质 | |
CN111078448B (zh) | 一种处理音频异常的方法及电子设备 | |
US20170083494A1 (en) | Electronic device and operation control method therefor | |
CN106098056B (zh) | 一种语音新闻的处理方法、新闻服务器及系统 | |
US11893359B2 (en) | Speech translation method and terminal when translated speech of two users are obtained at the same time | |
CN109104662B (zh) | 操作执行方法、操作响应方法、终端及耳机设备 | |
CN112394895A (zh) | 画面跨设备显示方法与装置、电子设备 | |
KR20110054609A (ko) | 블루투스 디바이스의 원격 제어 방법 및 장치 | |
CN108124172B (zh) | 云投影的方法、装置及系统 | |
WO2019071808A1 (zh) | 视频画面显示的方法、装置、系统、终端设备及存储介质 | |
CN111277697B (zh) | 音频处理方法、装置、存储介质及电子设备 | |
KR20200124948A (ko) | 전자 장치 및 전자 장치의 제어 방법 | |
CN110602683B (zh) | 蓝牙控制方法、装置、移动终端及存储介质 | |
CN114639392A (zh) | 音频处理方法、装置、电子设备及存储介质 | |
US11580954B2 (en) | Systems and methods of handling speech audio stream interruptions | |
CN109194998A (zh) | 数据传输方法、装置、电子设备及计算机可读介质 | |
CN111556406B (zh) | 音频处理方法、音频处理装置及耳机 | |
CN114710482A (zh) | 文件检测方法、装置、电子设备及存储介质 | |
CN113836424A (zh) | 数据获取方法、装置、电子设备及存储介质 | |
KR100501169B1 (ko) | 멀티미디어 콘텐츠 처리용 이동통신 단말기 및 이이동통신 단말기에서의 멀티미디어 콘텐츠 처리 방법 | |
US20050153689A1 (en) | Portable storage device and method for controlling cellular phone thereof | |
US20230297324A1 (en) | Audio Control Method, System, and Electronic Device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |