CN112015365A - 音量调整方法、装置及电子设备 - Google Patents

音量调整方法、装置及电子设备 Download PDF

Info

Publication number
CN112015365A
CN112015365A CN202010880651.XA CN202010880651A CN112015365A CN 112015365 A CN112015365 A CN 112015365A CN 202010880651 A CN202010880651 A CN 202010880651A CN 112015365 A CN112015365 A CN 112015365A
Authority
CN
China
Prior art keywords
volume
target
sound
sound type
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010880651.XA
Other languages
English (en)
Inventor
杜霆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202010880651.XA priority Critical patent/CN112015365A/zh
Publication of CN112015365A publication Critical patent/CN112015365A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了一种音量调整方法、装置及电子设备,属于音频处理技术领域。所述方法包括:在录制音频的过程中,获取多种声音对应的多种目标声音类型,及所述多种声音对应的多个初始音量;根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量;将每种目标声音类型对应的初始音量调整至所述目标音量。本申请可以降低音频录制时的噪音音量,提高音频录制的音频效果,提高了用户的使用体验。

Description

音量调整方法、装置及电子设备
技术领域
本申请属于音频处理技术领域,具体涉及一种音量调整方法、装置及电子设备。
背景技术
随着科学技术的不断发展,电子设备(如手机、平板电脑等)已经逐渐成为人们生活工作中的一种不可或缺的工具。
在生活工作中,用户经常使用电子设备进行音频录制,例如,用户使用电子设备进行语音聊天,或者录制短视频等,而在音频录制过程中,如果录制的环境中噪音比较大,此时想要录下某个人的清楚的说话声音,难度较大,而且声音会被其它噪声覆盖,或使用手机录制视频的时候,如果有多人同时说话,多人说话声音互相影响,当想要录下其中一个人的清晰的说话声音时,这个人的声音会被其他人的声音干扰,录制的视频中该人的说话声音也不会清晰。
发明内容
本申请实施例的目的是提供一种音量调整方法、装置及电子设备,能够解决现有技术中在进行音频录制的过程中录制音量会被噪音干扰,导致录制音量不清晰的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种音量调整方法,该方法包括:
在录制音频的过程中,获取多种声音对应的多种目标声音类型,及所述多种声音对应的多个初始音量;
根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量;
将每种所述目标声音类型对应的初始音量调整至所述目标音量。
第二方面,本申请实施例提供了一种音量调整装置,该装置包括:
初始音量获取模块,用于在录制音频的过程中,获取多种声音对应的多种目标声音类型,及所述多种声音对应的多个初始音量;
目标音量确定模块,用于根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量;
初始音量调整模块,用于将每种所述目标声音类型对应的初始音量调整至所述目标音量。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的音量调整方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的音量调整方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的音量调整方法。
在本申请实施例中,通过在录制音频的过程中,获取多种声音对应的多种目标声音类型,及多种声音对应的多个初始音量,根据声音类型与音量之间的目标对应关系,确定每种目标声音类型对应的目标音量,并将每种目标声音类型对应的初始音量调整至目标音量。本申请实施例通过对录制音频过程中的声音进行分类,并对不同类型声音的音量进行自动控制,可以降低音频录制时的噪音音量,提高音频录制的音频效果,提高了用户的使用体验。
附图说明
图1为本申请实施例提供的一种音量调整方法的步骤流程图;
图2为本申请实施例提供的一种显示音量控制条的示意图;
图3为本申请实施例提供的一种调整后的音量控制条的示意图;
图4为本申请实施例提供的另一种显示音量控制条的示意图;
图5为本申请实施例提供的另一种调整后的音量控制条的示意图;
图6为本申请实施例提供的一种会议场景下显示音量控制条的示意图;
图7为本申请实施例提供的一种会议场景下显示调整后的音量控制条的示意图;
图8为本申请实施例提供的另一种会议场景下显示调整后的音量控制条的示意图;
图9为本申请实施例提供的又一种会议场景下显示调整后的音量控制条的示意图;
图10为本申请实施例提供的一种音量调整装置的结构示意图;
图11为本申请实施例提供的一种电子设备的结构示意图;
图12为本申请实施例提供的另一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的音量调整方案进行详细地说明。
参照图1,示出了本申请实施例提供的一种音量调整方法的步骤流程图,如图1所示,该音量调整方法具体可以包括如下步骤:
步骤101:在录制音频的过程中,获取多种声音对应的多种目标声音类型,及所述多种声音对应的多个初始音量。
本申请实施例可以对录制音频过程中不同类型声音的音量进行调整的场景中。
录制的音频可以为在进行视频录制过程中进行的录制音频,也可以为单纯的音频录制过程,具体地,可以根据业务需求而定,本实施例对此不加以限制。
目标声音类型是指音频录制过程中录制的多种声音的声音类型,在本实施例中,目标声音类型可以包括音乐类型、噪音类型、用户类型等,具体地,可以根据实际情况而定。
初始音量是指在录制音频的过程中,获取的多种声音所对应的的音量,在具体实现中,声音的音量可以用户分贝(db)进行表示,例如,多种声音可以包括用户A的声音A,用户B的声音B,汽车的声音C,其中,检测的声音A的音量为10db,声音B的音量为20db,声音C的音量为30db,则将这三种声音对应的音量分别作为这三种声音的初始音量。
在本示例中,一种声音对应于一种目标声音类型,每种目标声音类型均对应于一个初始音量,例如,在录制音频的过程中,获取的多种声音包括用户A的声音,用户B的声音,汽车的声音,那么,用户A的声音对应于第一用户声音类型,用户B的声音对应于第二用户声音类型,汽车的声音对应于噪音类型,且第一用户声音类型对应于一个初始音量,第二用户声音类型对应于一个初始音量,噪音类型也对应于一个初始音量。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
在电子设备(如手机、平板电脑等)系统中可以预先设置智能音频分类功能,在开始录制音频之后,可以由系统自动启动智能音频分类功能,或由用户手动启动智能音频分类功能,此时,可以智能识别出多种声音并进行声音分类,同时获取多种声音所对应的初始音量,例如,在音频录制过程中,识别出的声音类型包括有:音乐声、人类说话声、风声、汽车噪音、其他噪音等,进而,可以识别出每种声音类型所对应的初始音量。
在识别出每种声音类型和每种声音类型的初始音量之后,可以在电子设备的音频录制页面内显示各种声音类型和各种声音类型的声音对应的初始音量,如图2所示,在音频录制过程中,识别出的声音类型包括:音乐声、汽车噪音、其他噪音和说话声音四种,在该页面内可以显示每种声音类型的音量控制条,在每个音量控制条上显示的圆形光标可以指示每种声音类型的声音的初始音量。
在获取到多种声音对应的多种目标声音类型,及多种声音对应的多个初始音量之后,执行步骤102。
步骤102:根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量。
目标音量是指每一种目标声音类型所对应的声音所需调整到的音量。
在电子设备系统中可以预先保存每种声音类型与音量之间的目标对应关系,在获取多种声音的目标声音类型之后,可以根据上述目标对应关系每种获取目标声音类型所对应的目标音量。
可以理解地,不同的声音类型所对应的目标音量是不相同的。在多种声音类型包含一种用户声音类型和其它声音类型时,此时,可以设置一种用户声音类型对应的目标音量为高音量,而其它声音类型对应的目标音量为低音量。在多种声音类型包含多种用户声音类型时,此时可以设置多种用户声音类型的目标用户声音类型(即需要录制的用户声音的声音类型)对应的目标音量为高音量,其他用户声音类型对应的目标音量为低音量等等。
在获取到多种声音对应的多种目标声音类型,及多种声音对应的多个初始音量之后,可以根据声音类型与音量之间的目标对应关系,确定出每种目标声音类型对应的目标音量,进而,执行步骤103。
步骤103:将每种所述目标声音类型对应的初始音量调整至所述目标音量。
在获取每种目标声音类型对应的目标音量之后,则可以将每种目标声音类型对应的初始音量调整至目标音量。
本申请实施例通过对音频录制过程中的声音进行分类,并对不同类型声音的音量进行自动控制,可以降低音频录制时的噪音音量,提高音频录制的音频效果。
对于音量调整过程可以结合具体地声音类型进行如下描述。
在本申请的一种具体实现方式中,在多种目标声音类型包括一种用户声音类型和至少一种其它声音类型时,上述步骤102可以包括:
子步骤S1:根据声音类型与音量之间的目标对应关系,确定所述用户声音类型对应的第一目标音量,及所述其它声音类型对应的第二目标音量。
上述步骤103可以包括:
子步骤M1:将所述用户声音类型对应的初始音量提高至所述第一目标音量,并将所述其它声音类型对应的初始音量降低至所述第二目标音量。
在本申请实施例中,第一目标音量是指用户声音类型的声音音量所需调整到的音量。例如,在用户声音类型的声音音量为10db,而第一目标音量为20db时,此时,需要将用户声音类型的音量从10db调整至20db。
第二目标音量是指其它声音类型的声音音量所需调整到的音量,例如,在其它声音类型的音量为20db,而第二目标音量为10db时,此时,需要将其它声音类型的音量从20db调整至10db。
在目标声音类型包括一种用户声音类型和至少一种其它声音类型时,可以根据声音类型与音量之间的目标对应关系,获取用户声音类型对应的第一目标音量及其它声音类型对应的第二目标音量,其中,第一目标音量大于第二目标音量。
在根据上述对应关系确定用户声音类型对应的第一目标音量,及其它声音类型对应的第二目标音量之后,可以将用户声音类型对应的初始音量提高第一目标音量,并将其它声音类型对应的初始音量降低至第二目标音量,如图2和图3所示,用户声音类型对应的声音即为说话声音,其它声音类型对应的声音即为音乐声、汽车噪音和其他噪音。用户声音类型和其他声音类型对应的初始音量可以如图2所示,在确定用户声音类型和其它声音类型分别对应的第一目标音量和第二目标音量之后,可以将用户声音类型的声音对应的初始音量提高至第一目标音量,并将其它声音类型的声音对应的初始音量降低至第二目标音量,音量调整后的示意图如图3所示。
本申请实施例通过在音频录制过程中,在音乐声音或者噪音影响到了视频的说话声音的录制音量效果,就可以使用“声音智能识别控制”的功能,分别对识别出来的这几种声音进行录制音量大小的调节,分别调小或者屏蔽掉音乐声音、汽车噪音、其他噪音,调大说话声音,这里录制的视频的声音效果里面就只能听清楚说话声音了,屏蔽了其它不想要录制的声音,对声音音量的调节操作如图3所示。
当然,在本实施例中,对各种类型声音的音量调整可以是由系统自动调整的,也可以是由用户调整的,在由用户调整各种类型的声音的音量进行调整时,可以根据系统获取的各种类型的声音的目标音量,将目标音量显示于如图2所示的音量控制条上显示目标音量所处的节点,并提示用户将各种类型的声音的初始音量调整至对应的目标音量的节点处。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
在本申请的另一种具体实现方式中,在多种目标声音类型包括多种用户声音类型时,上述步骤102可以包括:
子步骤S2:获取当前所需录制的所述多种用户声音类型中的第一用户声音类型;
子步骤S3:根据声音类型与音量之间的目标对应关系,确定所述第一用户声音类型对应的第三目标音量,及所述多种用户声音类型中除所述第一用户声音类型之外的第二用户声音类型对应的第四目标音量。
上述步骤103可以包括:
子步骤M2:将所述第一用户声音类型对应的初始音量提高至所述第三目标音量,并将所述第二用户声音类型对应的初始音量降低至所述第四目标音量。
在本实施例中,第一用户声音类型是指需要进行音频录制的用户说话声音的类型,第二用户声音类型是指影响录制用户说话声音的其他用户说话的声音的类型。
第三目标音量是指第一用户声音类型对应的初始音量所需调整到的音量。例如,在第一用户声音类型的声音音量为10db,而第三目标音量为20db时,此时,需要将第一用户声音类型的音量从10db调整至20db。
第四目标音量是指第二用户声音类型对应的初始音量所需调整到的音量。例如,在第二用户声音类型的音量为20db,而第四目标音量为10db时,此时,需要将第二用户声音类型的音量从20db调整至10db。
在多种目标声音类型包括多种用户声音类型时,首先可以获取多种用户声音类型中需要进行音频录制的第一用户声音类型,以及多种用户声音类型中不需要进行音频录制的第二用户声音类型,进而,可以根据声音类型与音量之间的目标对应关系,获取第一用户声音类型对应的第三目标音量及第二用户声音类型对应的第四目标音量,其中,第三目标音量大于第四目标音量。
在根据上述目标对应关系确定第一用户声音类型对应的第三目标音量,及第二用户声音类型对应的第四目标音量之后,可以将第一用户声音类型对应的初始音量提高至第三目标音量,并将第二用户声音类型对应的初始音量降低至第四目标音量,如图4所示,在音频录制过程中,包含有A说话声和B说话声,其中,A说话声为第二用户声音类型的声音,B说话声为第一用户声音类型的声音,在确定第一用户声音类型对应的第三目标音量和第二用户声音类型对应的第四目标音量之后,可以将B说话声的音量调整至第三目标音量,并将A说话声的音量调整至第四目标音量,调整完的音量可以如图5所示。本申请实施例通过在音频录制过程中,在只想录下B说话声音,可以使用“声音智能识别控制”的功能,对识别出来的几种声音进行录制音量大小的调节。分别调小音乐声音、其他噪音、A说话声音的音量,调大B说话声音的音量,达到想要的录制效果,对声音音量的调节操作如图5所示。
本申请实施例通过在进行音频录制的过程中,存在多种用户声音类型时,获取所需进行音频录制的用户声音类型,提高该用户声音类型的音量,并降低其他用户声音类型的音量,以避免其他用户说话的声音对录制声音的干扰,提高了音频录制的效果。
在本实施例中,还可以结合音频录制场景预先设置声音类型与音量之间的对应关系,并根据具体地音频录制场景对录制的不同声音类型的初始音量进行调整,具体地,可以结合下述具体实现方式进行详细描述。
在本申请的另一种具体实现方式中,上述步骤102还可以包括:
子步骤N1:获取与音频录制场景关联的所述声音类型与音量之间的对应关系。
在本申请实施例中,音频录制场景是指录制音频时所处的场景,如会议场景、音乐场景、室外场景、室内场景、自然场景等,具体地,可以根据实际情况而定,本实施例对此不加以限制。
在具体实现中,还可以预先设置不同音频录制场景所对应的声音类型与音量之间的对应关系。
对应关系是指在当前音频录制场景下的声音类型与音量之间的对应关系。
在进行音频录制时,可以获取音频录制时的场景即音频录制场景,在获取音频录制场景之后,可以获取该音频录制场景对应的声音类型与音量之间的对应关系。
在获取与音频录制场景关联的声音类型与音量之间的对应关系之后,执行子步骤N2。
子步骤N2:根据所述对应关系,确定每种所述目标声音类型对应的目标音量。
在获取对应关系之后,可以结合该对应关系确定每种目标声音类型所对应的目标音量。进而可以结合每种目标声音类型的目标音量对目标声音类型对应的初始音量进行调整。例如,如图2和图6所示,各种目标声音类型的声音对应的音量可以如图2所示,在给出多种预设的音频智能分类的音量控制场景,比如会议场景、音乐场景、室外场景、室内场景、自然场景等,对这些场景中的各种声音对象的录制音量大小进行了预设,不需要在手工进行调节。比如在使用手机进行录像时,选择音频录制的会议场景,音频录制会根据当前场景的预设好的各种声音音量大小进行录制,不需要在进行手工的调节各个声音对象的音量大小,如果不能满足需求,也可以进行手工调节,如图6所示。
本申请实施例中,音量自动控制功能也可以配合各种音频录制场景使用,可以使得音量调整的效果更加贴合具体的音频录制场景,能够进一步提高音频录制的效果。
在本实施例中,可以预先设定智能调音的规则,具体如下:
1、设定说话声音舒适音量是50分贝,范围是上下浮动10%,如果音量大小超过该范围,触发智能调音功能,调节录制音量的大小;
2、设定背景音乐舒适音量是20分贝,范围是上下浮动10%,如果音量大小超过该范围,触发智能调音功能,调节录制音量的大小;
3、设定允许噪音音量是10分贝,范围是上下浮动20%,如果音量大小超过该范围,触发智能调音功能,调节录制音量的大小。
智能调音当识别到一个或者多个声音对象超过设定的音量大小范围时候,就会启动对一个或者多个声音对象的录制音量大小进行调节,确保录制音频效果。
音量自动控制功能也可以配合各种音频录制场景使用,效果更好。比如选择会议场景时,并且开启音量自动控制,如图7所示。如果突然有手机铃声响了,这个时候调音会识别到“音乐声音”突然变大,自动调节“音乐声音”的录制控制音量变小,不会干扰到正常的说话声音录制,如图8所示。
智能调音功能,还可以同时对识别的多种声音对象的录制音量进行调节,比如会议场景,并开启智能调音,如果有手机铃声响,同时人的说话声音也变小时候,智能调音会同时调节“音乐声音”的录制控制音量变小,调节“说话声音”的录制控制音量变大,使录制的音频音量保持稳定,如图9所示。
本申请实施例通过对不同类型的声音进行分离控制,能够有效降低录制音频时的噪音,提高音频录制效果。
在本实施例中,在智能调整的音量无法满足用户的需求时,还可以由用户手动对音量进行调整,具体地,可以结合下述具体实现方式进行详细描述。
在本申请的另一种具体实现方式中,在上述步骤103之后,还可以包括:
步骤H1:显示每种所述目标声音类型对应的音量控制条。
在本实施例中,在录制音频的过程中,可以显示获取的每种目标声音类型对应的音量控制条,如图2所示,获取的目标声音类型包括音乐声类型、汽车噪音类型、其他噪音类型和说话声音类型,此时,可以显示每种声音类型对应的音量控制条,如图2所示。
当然,音量控制条可以是在获取到目标声音类型之后显示于音频录制界面的,也可以是在对目标声音类型对应的初始音量进行调整之后,显示于音频录制界面的控制条等,对于音量控制条的显示时机可以根据业务需求而定,本实施例对此不加以限制。
在显示每种目标声音类型对应的音量控制条之后,执行步骤H2。
步骤H2:接收用户对所述音量控制条中的目标控制条的第一输入。
目标控制条是指用户执行第一输入的控制条,例如,如图2所示,显示的音量控制条分别为音乐声类型对应的音量控制条、汽车噪音类型对应的音量控制条、其他噪音类型对应的音量控制条和说话声音类型对应的音量控制条,在用户对说话声音类型对应的音量控制条执行第一输入时,则将说话声音类型对应的音量控制条视为目标控制条。
第一输入是指用户对目标控制条执行的用于调整目标控制条对应的目标声音类型的音量的输入。
在某些示例中,第一输入可以为用户对目标控制条上显示的音量控制圆点执行的拖动操作形成的输入,如图2所示,在每个音量控制条上均显示有一个圆点,在用户需要对目标控制条对应的目标声音类型的音量进行调整时,则可以由用户拖动目标控制条上的圆点,以形成第一输入。
在某些示例中,第一输入可以为用户对目标控制条执行的点击操作形成的输入,例如,在用户需要对目标控制条对应的目标声音类型的音量进行调整时,可以点击目标控制条上的某个位置,以将目标控制条对应的目标声音类型的音量调整至该位置对应的音量,则用户对目标控制条执行的点击操作即形成了第一输入。
可以理解地,上述示例仅是为了更好地理解本申请实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
在显示每种目标声音类型对应的音量控制条之后,可以接收由用户对音量控制条中的目标控制条的第一输入,进而,执行步骤H3。
步骤H3:响应于所述第一输入,根据所述第一输入的输入参数,将所述目标控制条对应的目标声音类型的目标音量调整至第五目标音量。
第五目标音量是指根据第一输入的输入参数确定的目标控制条对应的目标声音类型的声音所需调整到的音量。
在接收到用户对目标控制条的第一输入之后,可以响应该第一输入,根据第一输入的输入参数,将目标控制条对应的目标声音类型的目标音量调整至第五目标音量。例如,在第一输入为点击操作形成的输入时,此时可以将用户在目标控制条上点击的位置视为输入参数,并根据该点击位置可以确定第五目标音量,然后,可以将目标控制条对应的目标声音类型的目标音量调整至第五目标音量。
本申请实施例在将每种目标声音类型对应的初始音量调整至目标音量之后,还可以显示每种目标声音类型对应的音量控制条,在调整的目标音量不满足音频录制需求时,可以由用户通过对音量控制条的控制,实现目标声音类型对应的音量调节,能够进一步满足音频录制需求,提高音频录制效果。
本申请实施例提供的音量调整方法,通过在录制音频的过程中,获取多种声音对应的多种目标声音类型,及多种声音对应的多个初始音量,根据声音类型与音量之间的目标对应关系,确定每种目标声音类型对应的目标音量,并将每种目标声音类型对应的初始音量调整至目标音量。本申请实施例通过对音频录制过程中的声音进行分类,并对不同类型声音的音量进行自动控制,可以降低音频录制时的噪音音量,提高音频录制的音频效果,提高了用户的使用体验。
需要说明的是,本申请实施例提供的音量调整方法,执行主体可以为音量调整装置,或者该音量调整装置中的用于执行音量调整方法的控制模块。本申请实施例中以音量调整装置执行音量调整方法为例,说明本申请实施例提供的音量调整装置。
参照图10,示出了本申请实施例提供的一种音量调整装置的结构示意图,如图10所示,该音量调整装置1000具体可以包括如下模块:
初始音量获取模块1010,用于在录制音频的过程中,获取多种声音对应的多种目标声音类型,及所述多种声音对应的多个初始音量;
目标音量确定模块1020,用于根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量;
初始音量调整模块1030,用于将每种所述目标声音类型对应的初始音量调整至所述目标音量。
可选地,在所述多种目标声音类型包括一种用户声音类型和至少一种其它声音类型时,所述目标音量确定模块1020包括:
第一音量确定单元,用于根据声音类型与音量之间的目标对应关系,确定所述用户声音类型对应的第一目标音量,及所述其它声音类型对应的第二目标音量;
所述初始音量调整模块1030包括:
第一音量调整单元,用于将所述用户声音类型对应的初始音量提高至所述第一目标音量,并将所述其它声音类型对应的初始音量降低至所述第二目标音量;
其中,所述第一目标音量大于所述第二目标音量。
可选地,在所述多种目标声音类型包括多种用户声音类型时,所述目标音量确定模块1020包括:
第一类型获取单元,用于获取当前所需录制的所述多种用户声音类型中的第一用户声音类型;
第二音量确定单元,用于根据声音类型与音量之间的目标对应关系,确定所述第一用户声音类型对应的第三目标音量,及所述多种用户声音类型中除所述第一用户声音类型之外的第二用户声音类型对应的第四目标音量;
所述初始音量调整模块1030包括:
第二音量调整单元,用于将所述第一用户声音类型对应的初始音量提高至所述第三目标音量,并将所述第二用户声音类型对应的初始音量降低至所述第四目标音量;
其中,所述第三目标音量大于所述第四目标音量。
可选地,所述目标音量确定模块1020包括:
对应关系获取单元,用于获取与音频录制场景关联的所述声音类型与音量之间的对应关系;
第三音量确定单元,用于根据所述对应关系,确定每种所述目标声音类型对应的目标音量。
可选地,还包括:
音量控制条显示模块,用于显示每种所述目标声音类型对应的音量控制条;
第一输入接收模块,用于接收用户对所述音量控制条中的目标控制条的第一输入;
第五音量调整模块,用于响应于所述第一输入,根据所述第一输入的输入参数,将所述目标控制条对应的目标声音类型的目标音量调整至第五目标音量。
本申请实施例提供的音量调整装置,通过在录制音频的过程中,获取多种声音对应的多种目标声音类型,及多种声音对应的多个初始音量,根据声音类型与音量之间的目标对应关系,确定每种目标声音类型对应的目标音量,并将每种目标声音类型对应的初始音量调整至目标音量。本申请实施例通过对音频录制过程中的声音进行分类,并对不同类型声音的音量进行自动控制,可以降低音频录制时的噪音音量,提高音频录制的音频效果,提高了用户的使用体验。
本申请实施例中的音量调整装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的音量调整装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的音量调整装置能够实现图1方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选地,如图11所示,本申请实施例还提供一种电子设备1100,包括处理器1101,存储器1102,存储在存储器1102上并可在所述处理器1101上运行的程序或指令,该程序或指令被处理器1101执行时实现上述音量调整方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图12为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备1200包括但不限于:射频单元1201、网络模块1202、音频输出单元1203、输入单元1204、传感器1205、显示单元1206、用户输入单元1207、接口单元1208、存储器1209、以及处理器1210等部件。
本领域技术人员可以理解,电子设备1200还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1210逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图12中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器1210,用于在录制音频的过程中,获取多种声音对应的多种目标声音类型,及所述多种声音对应的多个初始音量;根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量;将每种所述目标声音类型对应的初始音量调整至所述目标音量。
本申请实施例通过对音频录制过程中的声音进行分类,并对不同类型声音的音量进行自动控制,可以降低音频录制时的噪音音量,提高音频录制的音频效果,提高了用户的使用体验。
可选地,处理器1210,还用于根据声音类型与音量之间的目标对应关系,确定所述用户声音类型对应的第一目标音量,及所述其它声音类型对应的第二目标音量;将所述用户声音类型对应的初始音量提高至所述第一目标音量,并将所述其它声音类型对应的初始音量降低至所述第二目标音量;其中,所述第一目标音量大于所述第二目标音量。
可选地,处理器1210,还用于获取当前所需录制的所述多种用户声音类型中的第一用户声音类型;根据声音类型与音量之间的目标对应关系,确定所述第一用户声音类型对应的第三目标音量,及所述多种用户声音类型中除所述第一用户声音类型之外的第二用户声音类型对应的第四目标音量;将所述第一用户声音类型对应的初始音量提高至所述第三目标音量,并将所述第二用户声音类型对应的初始音量降低至所述第四目标音量;其中,所述第三目标音量大于所述第四目标音量。
可选地,处理器1210,还用于获取与音频录制场景关联的所述声音类型与音量之间的对应关系;根据所述对应关系,确定每种所述目标声音类型对应的目标音量。
可选地,处理器1210,还用于显示每种所述目标声音类型对应的音量控制条;接收用户对所述音量控制条中的目标控制条的第一输入;响应于所述第一输入,根据所述第一输入的输入参数,将所述目标控制条对应的目标声音类型的目标音量调整至第五目标音量。
本申请实施例还可以根据不同的音频录制场景设置声音类型与音量之间的对应关系,结合音频录制的场景调节各种声音类型的声音音量的大小,从而可以进一步提高音频录制的效果,提高了用户的体验。
应理解的是,本申请实施例中,输入单元1204可以包括图形处理器(GraphicsProcessing Unit,GPU)12041和麦克风12042,图形处理器12041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1206可包括显示面板12061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板12061。用户输入单元1207包括触控面板12071以及其他输入设备12072。触控面板12071,也称为触摸屏。触控面板12071可包括触摸检测装置和触摸控制器两个部分。其他输入设备12072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器1209可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器1210可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1210中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述音量调整方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述音量调整方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (12)

1.一种音量调整方法,其特征在于,包括:
在录制音频的过程中,获取多种声音对应的多种目标声音类型,及所述多种声音对应的多个初始音量;
根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量;
将每种所述目标声音类型对应的初始音量调整至所述目标音量。
2.根据权利要求1所述的方法,其特征在于,在所述多种目标声音类型包括一种用户声音类型和至少一种其它声音类型时,所述根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量,包括:
根据声音类型与音量之间的目标对应关系,确定所述用户声音类型对应的第一目标音量,及所述其它声音类型对应的第二目标音量;
所述将每种所述目标声音类型对应的初始音量调整至所述目标音量,包括:
将所述用户声音类型对应的初始音量提高至所述第一目标音量,并将所述其它声音类型对应的初始音量降低至所述第二目标音量;
其中,所述第一目标音量大于所述第二目标音量。
3.根据权利要求1所述的方法,其特征在于,在所述多种目标声音类型包括多种用户声音类型时,所述根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量,包括:
获取当前所需录制的所述多种用户声音类型中的第一用户声音类型;
根据声音类型与音量之间的目标对应关系,确定所述第一用户声音类型对应的第三目标音量,及所述多种用户声音类型中除所述第一用户声音类型之外的第二用户声音类型对应的第四目标音量;
所述将每种所述目标声音类型对应的初始音量调整至所述目标音量,包括:
将所述第一用户声音类型对应的初始音量提高至所述第三目标音量,并将所述第二用户声音类型对应的初始音量降低至所述第四目标音量;
其中,所述第三目标音量大于所述第四目标音量。
4.根据权利要求1所述的方法,其特征在于,所述根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量,包括:
获取与音频录制场景关联的所述声音类型与音量之间的对应关系;
根据所述对应关系,确定每种所述目标声音类型对应的目标音量。
5.根据权利要求1所述的方法,其特征在于,在所述将每种所述目标声音类型对应的初始音量调整至所述目标音量之后,还包括:
显示每种所述目标声音类型对应的音量控制条;
接收用户对所述音量控制条中的目标控制条的第一输入;
响应于所述第一输入,根据所述第一输入的输入参数,将所述目标控制条对应的目标声音类型的目标音量调整至第五目标音量。
6.一种音量调整装置,其特征在于,包括:
初始音量获取模块,用于在录制音频的过程中,获取多种声音对应的多种目标声音类型,及所述多种声音对应的多个初始音量;
目标音量确定模块,用于根据声音类型与音量之间的目标对应关系,确定每种所述目标声音类型对应的目标音量;
初始音量调整模块,用于将每种所述目标声音类型对应的初始音量调整至所述目标音量。
7.根据权利要求6所述的装置,其特征在于,在所述多种目标声音类型包括一种用户声音类型和至少一种其它声音类型时,所述目标音量确定模块包括:
第一音量确定单元,用于根据声音类型与音量之间的目标对应关系,确定所述用户声音类型对应的第一目标音量,及所述其它声音类型对应的第二目标音量;
所述初始音量调整模块包括:
第一音量调整单元,用于将所述用户声音类型对应的初始音量提高至所述第一目标音量,并将所述其它声音类型对应的初始音量降低至所述第二目标音量;
其中,所述第一目标音量大于所述第二目标音量。
8.根据权利要求6所述的装置,其特征在于,在所述多种目标声音类型包括多种用户声音类型时,所述目标音量确定模块包括:
第一类型获取单元,用于获取当前所需录制的所述多种用户声音类型中的第一用户声音类型;
第二音量确定单元,用于根据声音类型与音量之间的目标对应关系,确定所述第一用户声音类型对应的第三目标音量,及所述多种用户声音类型中除所述第一用户声音类型之外的第二用户声音类型对应的第四目标音量;
所述初始音量调整模块包括:
第二音量调整单元,用于将所述第一用户声音类型对应的初始音量提高至所述第三目标音量,并将所述第二用户声音类型对应的初始音量降低至所述第四目标音量;
其中,所述第三目标音量大于所述第四目标音量。
9.根据权利要求6所述的装置,其特征在于,所述目标音量确定模块包括:
对应关系获取单元,用于获取与音频录制场景关联的所述声音类型与音量之间的对应关系;
第三音量确定单元,用于根据所述对应关系,确定每种所述目标声音类型对应的目标音量。
10.根据权利要求6所述的方法,其特征在于,还包括:
音量控制条显示模块,用于显示每种所述目标声音类型对应的音量控制条;
第一输入接收模块,用于接收用户对所述音量控制条中的目标控制条的第一输入;
第五音量调整模块,用于响应于所述第一输入,根据所述第一输入的输入参数,将所述目标控制条对应的目标声音类型的目标音量调整至第五目标音量。
11.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的音量调整方法的步骤。
12.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的音量调整方法的步骤。
CN202010880651.XA 2020-08-27 2020-08-27 音量调整方法、装置及电子设备 Pending CN112015365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010880651.XA CN112015365A (zh) 2020-08-27 2020-08-27 音量调整方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010880651.XA CN112015365A (zh) 2020-08-27 2020-08-27 音量调整方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN112015365A true CN112015365A (zh) 2020-12-01

Family

ID=73503822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010880651.XA Pending CN112015365A (zh) 2020-08-27 2020-08-27 音量调整方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112015365A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112309449A (zh) * 2020-10-26 2021-02-02 维沃移动通信(深圳)有限公司 音频录制方法及装置
CN113079332A (zh) * 2021-03-16 2021-07-06 青岛海信移动通信技术股份有限公司 移动终端及其录屏方法
WO2023025004A1 (zh) * 2021-08-24 2023-03-02 维沃移动通信有限公司 视频拍摄方法、装置、电子设备和可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126177A (zh) * 2016-06-21 2016-11-16 中国农业大学 一种目标声音的音量调节系统及方法
CN106782625A (zh) * 2016-11-29 2017-05-31 北京小米移动软件有限公司 音频处理方法和装置
CN110097872A (zh) * 2019-04-30 2019-08-06 维沃移动通信有限公司 一种音频处理方法及电子设备
CN111370018A (zh) * 2020-02-28 2020-07-03 维沃移动通信有限公司 音频数据的处理方法、电子设备及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126177A (zh) * 2016-06-21 2016-11-16 中国农业大学 一种目标声音的音量调节系统及方法
CN106782625A (zh) * 2016-11-29 2017-05-31 北京小米移动软件有限公司 音频处理方法和装置
CN110097872A (zh) * 2019-04-30 2019-08-06 维沃移动通信有限公司 一种音频处理方法及电子设备
CN111370018A (zh) * 2020-02-28 2020-07-03 维沃移动通信有限公司 音频数据的处理方法、电子设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112309449A (zh) * 2020-10-26 2021-02-02 维沃移动通信(深圳)有限公司 音频录制方法及装置
CN113079332A (zh) * 2021-03-16 2021-07-06 青岛海信移动通信技术股份有限公司 移动终端及其录屏方法
WO2023025004A1 (zh) * 2021-08-24 2023-03-02 维沃移动通信有限公司 视频拍摄方法、装置、电子设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN112015365A (zh) 音量调整方法、装置及电子设备
CN107817939B (zh) 一种图像处理方法及移动终端
US20150229756A1 (en) Device and method for authenticating a user of a voice user interface and selectively managing incoming communications
CN111010608B (zh) 视频播放的方法及电子设备
CN112383817B (zh) 音量调节方法及装置
CN108196482B (zh) 功耗控制方法、装置、存储介质及电子设备
CN110855921B (zh) 一种视频录制控制方法及电子设备
CN111949239B (zh) 一种屏幕共享方法、装置、存储介质及终端
CN111767012A (zh) 投屏方法及装置
CN112394901A (zh) 音频输出模式调整方法、装置及电子设备
CN110572704A (zh) 一种控制弹幕播放速度的方法、装置、设备及介质
CN113194450B (zh) 蓝牙设备管理方法及装置
CN112291672B (zh) 扬声器的控制方法、控制装置以及电子设备
CN112702468A (zh) 一种通话控制方法及其装置
CN113709629A (zh) 频响参数调节方法、装置、设备及存储介质
CN112309449A (zh) 音频录制方法及装置
CN108900706B (zh) 一种通话语音调整方法及移动终端
CN113660512B (zh) 音频处理方法、装置、服务器和计算机可读存储介质
CN113115179B (zh) 工作状态调节方法和装置
CN114327714A (zh) 应用程序控制方法、装置、设备及介质
CN112698806A (zh) 参数调整方法、装置、电子设备和可读存储介质
CN111045637A (zh) 音量调节方法和电子设备
CN113038333B (zh) 蓝牙耳机控制方法、装置、电子设备及可读存储介质
CN114520949B (zh) 音量控制方法、装置、设备及介质
CN111338789B (zh) 资源调配方法和装置、电子设备以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination