CN110119264B - 音效调整方法、装置及存储介质 - Google Patents

音效调整方法、装置及存储介质 Download PDF

Info

Publication number
CN110119264B
CN110119264B CN201910423803.0A CN201910423803A CN110119264B CN 110119264 B CN110119264 B CN 110119264B CN 201910423803 A CN201910423803 A CN 201910423803A CN 110119264 B CN110119264 B CN 110119264B
Authority
CN
China
Prior art keywords
information
model
microphone
live
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910423803.0A
Other languages
English (en)
Other versions
CN110119264A (zh
Inventor
李刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910423803.0A priority Critical patent/CN110119264B/zh
Publication of CN110119264A publication Critical patent/CN110119264A/zh
Application granted granted Critical
Publication of CN110119264B publication Critical patent/CN110119264B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本公开是关于一种音效调整方法、装置及存储介质,属于互联网技术领域。方法包括:接收主播终端发送的第一直播信息,所述第一直播信息包括图像信息和第一音频信息,所述第一音频信息由所述主播终端通过麦克风采集得到;获取所述麦克风的型号,根据所述型号获取匹配的音效调整参数;按照所述音效调整参数对所述第一音频信息进行音效调整,得到第二音频信息;将包括所述图像信息和所述第二音频信息的第二直播信息发布于所述主播终端的直播间中。本公开实施例提供了一种根据麦克风的型号进行音效调整的方案,对于任一型号的麦克风均可采用本方案进行音效调整,无需使用具有音效调整功能的麦克风,节省了设备成本,不受麦克风功能的限制,具有普适性。

Description

音效调整方法、装置及存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种音效调整方法、装置、设备及存储介质。
背景技术
随着互联网技术的发展和直播行业的兴起,直播功能得到了广泛应用。主播用户在进行直播时,通常会利用麦克风采集主播用户的音频信息。但是,不同型号的麦克风采集到的音频信息的播放效果不同,当使用的麦克风采集到的音频信息的播放效果不能满足要求时,需要对音频信息进行音效调整。
相关技术中提供了一种具有音效调整功能的麦克风,当用户使用麦克风采集音频信息时,麦克风会根据用户控制麦克风的手势或对麦克风上按键的动作,生成相应的音效调整指令,根据该音效调整指令对采集到的音频信息进行音效调整。
上述方案在对音频信息进行音效调整时,必须使用具有音效调整功能的麦克风,耗费过多的设备成本,而且对麦克风的功能造成限制,不具有普适性。
发明内容
本公开提供了一种音效调整方法、装置及存储介质,可以克服相关技术中存在的不具有普适性问题。
根据本公开实施例的第一方面,提供一种音效调整方法,所述方法包括:
接收主播终端发送的第一直播信息,所述第一直播信息包括图像信息和第一音频信息,所述第一音频信息由所述主播终端通过麦克风采集得到;
获取所述麦克风的型号,根据所述型号获取匹配的音效调整参数;
按照所述音效调整参数对所述第一音频信息进行音效调整,得到第二音频信息;
将包括所述图像信息和所述第二音频信息的第二直播信息发布于所述主播终端的直播间中。
在一种可能实现的方式中,所述获取所述麦克风的型号,包括:
对所述图像信息进行麦克风识别,得到所述图像信息中麦克风的特征信息;
根据预先设置的第一对应关系,获取所述特征信息对应的第一型号,所述第一对应关系中包括至少一种麦克风的特征信息与型号之间的对应关系。
在另一种可能实现的方式中,所述根据预先设置的第一对应关系,获取所述特征信息对应的第一型号之后,所述方法还包括:
向所述主播终端发送所述第一型号,所述主播终端用于显示所述第一型号和修改按钮,当检测到对所述修改按钮的确认操作时,获取主播用户输入的第二型号;
接收所述主播终端发送的所述第二型号,将所述第二型号确定为所述麦克风的型号。
在另一种可能实现的方式中,所述获取所述麦克风的型号,包括:
接收所述主播终端发送的所述型号,所述主播终端用于在直播界面中显示型号设置区域,获取主播用户在所述型号设置区域中输入的所述型号。
在另一种可能实现的方式中,所述获取所述麦克风的型号,根据所述型号获取匹配的音效调整参数,包括:
获取所述麦克风的型号和所述第一直播信息对应的直播类型;
根据所述型号和所述直播类型,获取与所述型号和所述直播类型匹配的音效调整参数。
在另一种可能实现的方式中,所述获取所述第一直播信息对应的直播类型,包括以下至少一项:
对所述图像信息进行分类,得到所述图像信息所属的类型,作为所述直播类型;
对所述第一音频信息进行分类,得到所述第一音频信息所属的类型,作为所述直播类型。
在另一种可能实现的方式中,所述根据所述型号和所述直播类型,获取与所述型号和所述直播类型匹配的音效调整参数,包括:
根据预先设置的第二对应关系,获取所述型号和所述直播类型对应的音效调整参数,所述第二对应关系中包括至少一种麦克风的型号、直播类型与匹配的音效调整参数之间的对应关系。
根据本公开实施例的第二方面,提供一种音效调整装置,所述装置包括:
接收单元,被配置为接收主播终端发送的第一直播信息,所述第一直播信息包括图像信息和第一音频信息,所述第一音频信息由所述主播终端通过麦克风采集得到;
获取单元,被配置为获取所述麦克风的型号,根据所述型号获取匹配的音效调整参数;
调整单元,被配置为按照所述音效调整参数对所述第一音频信息进行音效调整,得到第二音频信息;
发布单元,被配置为将包括所述图像信息和所述第二音频信息的第二直播信息发布于所述主播终端的直播间中。
在一种可能实现的方式中,所述获取单元,包括:
识别子单元,被配置为对所述图像信息进行麦克风识别,得到所述图像信息中麦克风的特征信息;
第一获取子单元,被配置为根据预先设置的第一对应关系,获取所述特征信息对应的第一型号,所述第一对应关系中包括至少一种麦克风的特征信息与型号之间的对应关系。
在另一种可能实现的方式中,所述获取单元,还包括:
发送子单元,被配置为向所述主播终端发送所述第一型号,所述主播终端用于显示所述第一型号和修改按钮,当检测到对所述修改按钮的确认操作时,获取主播用户输入的第二型号;
第二获取子单元,被配置为接收所述主播终端发送的所述第二型号,将所述第二型号确定为所述麦克风的型号。
在另一种可能实现的方式中,所述获取单元,还包括:
第三获取子单元,被配置为接收所述主播终端发送的所述型号,所述主播终端用于在直播界面中显示型号设置区域,获取主播用户在所述型号设置区域中输入的所述型号。
在另一种可能实现的方式中,所述获取单元,还包括:
型号获取子单元,被配置为获取所述麦克风的型号;
类型获取子单元,被配置为获取所述第一直播信息对应的直播类型;
参数获取子单元,被配置为根据所述型号和所述直播类型,获取与所述型号和所述直播类型匹配的音效调整参数。
在另一种可能实现的方式中,所述类型获取子单元,还被配置为执行以下至少一项:
对所述图像信息进行分类,得到所述图像信息所属的类型,作为所述直播类型;
对所述第一音频信息进行分类,得到所述第一音频信息所属的类型,作为所述直播类型。
在另一种可能实现的方式中,所述参数获取子单元,还被配置为根据预先设置的第二对应关系,获取所述型号和所述直播类型对应的音效调整参数,所述第二对应关系中包括至少一种麦克风的型号、直播类型与匹配的音效调整参数之间的对应关系。
根据本公开实施例的第三方面,提供一种音效调整装置,所述装置包括:
处理器;
用于存储处理器可执行命令的存储器;
其中,所述处理器被配置为执行第一方面所述的音效调整方法。
根据本公开实施例提供的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行第一方面所述的音效调整方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,当所述计算机程序产品中的指令由服务器的处理器执行时,使得服务器能够执行第一方面所述的音效调整方法。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开实施例提供的方法、装置及存储介质,通过接收主播终端发送的第一直播信息,第一直播信息中包括的第一音频信息由主播终端通过麦克风采集得到,获取麦克风的型号,根据型号获取匹配的音效调整参数,按照音效调整参数对第一音频信息进行音效调整,得到第二音频信息;将包括图像信息和第二音频信息的第二直播信息发布于主播终端的直播间中。本公开实施例提供了一种根据麦克风的型号进行音效调整的方案,对于任一型号的麦克风均可采用本公开实施例提供的方案进行音效调整,无需使用具有音效调整功能的麦克风,节省了设备成本,不会受到麦克风功能的限制,具有普适性。
并且,在进行音效调整的过程中还会考虑第一直播信息所属的直播类型,从而根据麦克风的型号和直播类型获取匹配的音效调整参数,以使音效调整的效果与直播类型相匹配,更具有针对性。即使主播用户更换了直播类型,采用本公开实施例提供的方法仍然可以动态地进行音效调整,自动切换为新的音效。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种实施环境的框图;
图2是根据一示例性实施例示出的一种音效调整方法的流程图;
图3是根据一示例性实施例示出的另一种音效调整方法的流程图;
图4是根据一示例性实施例示出的一种音效调整装置的框图;
图5是根据一示例性实施例示出的另一种音效调整装置的框图;
图6是根据一示例性实施例示出的一种服务器的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种实施环境的框图,如图1所示,该实施环境包括服务器101、主播终端102和至少一个观众终端103。服务器101分别与主播终端102和观众终端103建立通信连接,通过建立的通信连接进行交互。
主播终端102和观众终端103均可登录服务器101,服务器101能够为主播终端102创建直播间,主播终端102获取直播信息,发送至服务器101,服务器101将直播信息发布于直播间中,即将直播信息转发给直播间中的主播终端102和观众终端103,供主播终端102和观众终端103播放直播信息。
图2是根据一示例性实施例示出的一种音效调整方法的流程图,如图2所示,该方法应用于服务器中,该方法包括:
在步骤201中,接收主播终端发送的第一直播信息,第一直播信息包括图像信息和第一音频信息,第一音频信息由主播终端通过麦克风采集得到。
在步骤202中,获取麦克风的型号,根据型号获取匹配的音效调整参数。
在步骤203中,按照音效调整参数对第一音频信息进行音效调整,得到第二音频信息。
在步骤204中,将包括图像信息和第二音频信息的第二直播信息发布于主播终端的直播间中。
本公开实施例提供的方法,通过接收主播终端发送的第一直播信息,第一直播信息中包括的第一音频信息由主播终端通过麦克风采集得到,获取麦克风的型号,根据型号获取匹配的音效调整参数,按照音效调整参数对第一音频信息进行音效调整,得到第二音频信息;将包括图像信息和第二音频信息的第二直播信息发布于主播终端的直播间中。本公开实施例提供了一种根据麦克风的型号进行音效调整的方案,对于任一型号的麦克风均可采用本公开实施例提供的方案进行音效调整,无需使用具有音效调整功能的麦克风,节省了设备成本,不会受到麦克风功能的限制,具有普适性。
在一种可能实现方式中,获取麦克风的型号,包括:
对图像信息进行麦克风识别,得到图像信息中麦克风的特征信息;
根据预先设置的第一对应关系,获取特征信息对应的第一型号,第一对应关系中包括至少一种麦克风的特征信息与型号之间的对应关系。
在另一种可能实现方式中,根据预先设置的第一对应关系,获取特征信息对应的第一型号之后,方法还包括:
向主播终端发送第一型号,主播终端用于显示第一型号和修改按钮,当检测到对修改按钮的确认操作时,获取主播用户输入的第二型号;
接收主播终端发送的第二型号,将第二型号确定为麦克风的型号。
在另一种可能实现方式中,获取麦克风的型号,包括:
接收主播终端发送的型号,主播终端用于在直播界面中显示型号设置区域,获取主播用户在型号设置区域中输入的型号。
在另一种可能实现方式中,获取麦克风的型号,根据型号获取匹配的音效调整参数,包括:
获取麦克风的型号和第一直播信息对应的直播类型;
根据型号和直播类型,获取与型号和直播类型匹配的音效调整参数。
在另一种可能实现方式中,获取第一直播信息对应的直播类型,包括以下至少一项:
对图像信息进行分类,得到图像信息所属的类型,作为直播类型;
对第一音频信息进行分类,得到第一音频信息所属的类型,作为直播类型。
在另一种可能实现方式中,根据型号和直播类型,获取与型号和直播类型匹配的音效调整参数,包括:
根据预先设置的第二对应关系,获取型号和直播类型对应的音效调整参数,第二对应关系中包括至少一种麦克风的型号、直播类型与匹配的音效调整参数之间的对应关系。
图3是根据一示例性实施例示出的另一种音效调整方法的流程图,如图3所示,本公开实施例的交互主体包括服务器、主播终端和观众终端,包括以下步骤:
在步骤301中,主播终端通过摄像头拍摄图像信息,通过麦克风采集第一音频信息,向服务器发送包括图像信息和第一音频信息的第一直播信息。
本公开实施例中,主播终端基于主播用户标识登录服务器,该主播用户标识可以为主播用户的用户账号、电话号码、用户昵称等。服务器可以为主播终端创建直播间,供主播终端在直播间中发布直播信息。
观众终端基于观众用户标识登录服务器,该观众用户标识可以为观众用户的用户账号、电话号码、用户昵称等。观众终端可以进入服务器创建的直播间中,播放直播间中发布的直播信息。
其中,主播终端和观众终端可以为手机、计算机、平板电脑等多种类型的设备。
主播终端可以通过摄像头拍摄图像信息,通过麦克风采集第一音频信息,将图像信息和第一音频信息构成第一直播信息,发送给服务器。
其中,该摄像头可以为主播终端上设置的摄像头,或者与主播终端连接的摄像头,且该摄像头可以为任一种型号的摄像头。该麦克风可以为主播终端连接的麦克风,且可以为任一种型号的麦克风。
需要说明的是,该图像信息为在主播终端所处的场景中拍摄得到的图像信息,可以包括主播终端所处的场景,该第一音频信息为在主播终端所处的场景中采集得到的音频信息,可以包括该场景中的多个声音源发出的声音,如主播用户发出的声音、其他电子设备播放的声音或其他声音。
在一种可能实现方式中,主播终端可以显示服务器提供的直播界面,主播用户在直播界面中触发开始直播指令,主播终端接收到该开始直播指令时,开始进行直播。直播过程中,主播终端通过摄像头拍摄图像信息,通过麦克风采集第一音频信息,从而得到第一直播信息。并且,主播终端还会在直播界面中播放第一直播信息,供主播用户观看。
在另一种可能实现方式中,主播终端可以实时地通过摄像头拍摄图像信息,实时地通过麦克风采集第一音频信息。
另外,除第一直播信息之外,主播终端还可以在直播界面中显示观众终端登录的观众用户标识、观众终端发布的评论信息、观众终端赠送给主播用户的礼物信息等。
在步骤302中,服务器接收到第一直播信息时,获取麦克风的型号。
本公开实施例中,麦克风可以包括多种型号,如不同品牌的麦克风具有不同的型号,同一品牌的麦克风也可以具有不同的型号。为了自动地进行音效调整且保证音效调整效果,当服务器接收到第一直播信息时,可以获取麦克风的型号,从而根据麦克风的型号进行音效调整。
在一种可能实现方式中,获取麦克风的型号可以包括以下步骤3021-3023中的任一步骤:
3021、对图像信息进行麦克风识别,得到图像信息中麦克风的特征信息,根据预先设置的第一对应关系,获取特征信息对应的第一型号。
不同型号的麦克风的特征信息不同,根据麦克风的特征信息可以确定麦克风的型号,而进行直播的过程中,为了便于拍摄图像信息及采集音频信息,主播用户通常会将摄像头对准自己并将麦克风放置在面前,则麦克风会处于摄像头的拍摄范围内,通过摄像头拍摄到的图像信息中可以包括麦克风。
因此,服务器可以对图像信息进行麦克风识别,从而得到图像信息中麦克风的特征信息。其中,该麦克风的特征信息可以包括麦克风的颜色、麦克风的形状、麦克风上标注的型号和麦克风的生产商标志等信息项。
在一种可能实现方式中,服务器将麦克风作为目标物体,采用物体识别算法,识别图像信息中的麦克风所处的图像区域,采用特征提取算法,对该图像区域进行特征提取,得到麦克风的特征信息。
其中,该物体识别算法可以为SIFT(Scale-Invariant feature transform,尺度不变特征变换)算法、SSD(Single shot multibox detector,单次检测器)等,该特征提取算法可以为HOG(Histogram of Oriented Gradient,方向梯度直方图)特征提取算法、LBP(Local Binary Patterns,线性反投影算法)特征提取算法等。
并且,服务器会预先设置第一对应关系,第一对应关系中包括至少一种麦克风的特征信息与型号之间的对应关系。当服务器通过识别得到麦克风的特征信息之后,根据该特征信息查询第一对应关系,获取特征信息对应的第一型号,即可作为麦克风的型号。
在一种可能实现方式中,每种麦克风的特征信息包括多个信息项,在根据麦克风的特征信息查询第一对应关系时,可以将该特征信息中的多个信息项与第一对应关系中每个特征信息中的多个信息项分别进行对比,确定每个特征信息与该特征信息的相同信息项的数量,将相同信息项数量最多的特征信息对应的型号作为该特征信息对应的第一型号。
在另一种可能实现方式中,在根据麦克风的特征信息查询第一对应关系时,可以计算该特征信息与第一对应关系中每个特征信息的相似度,将相似度最大的特征信息对应的型号作为该特征信息对应的第一型号。
需要说明的是,服务器可以实时地对图像信息进行麦克风识别,也即是每次接收到主播终端发送的图像信息时,会对该图像信息进行麦克风识别。或者服务器也可以周期性地对图像信息进行麦克风识别,也即是每隔预设时长,对主播终端发送的图像信息进行麦克风识别。该预设时长可以由服务器预先设置,可以为0.1秒、1秒或其他时长。
在进行直播的过程中,主播用户可以更换麦克风,即使在更换麦克风之后,服务器采用上述麦克风识别的方式仍然可以识别出更换后的麦克风的型号。
3022、服务器对图像信息进行麦克风识别,得到图像信息中麦克风的特征信息,根据预先设置的第一对应关系,获取特征信息对应的第一型号,向主播终端发送第一型号,接收主播终端发送的第二型号,将第二型号确定为麦克风的型号。
其中,服务器获取第一型号的方式与步骤3021类似,在此不再赘述。
获取到第一型号时,服务器并未将第一型号直接作为麦克风的型号,而是向主播终端发送第一型号,主播终端接收到该第一型号时,在直播界面中显示第一型号和修改按钮,主播用户可以查看该第一型号,当确定第一型号正确时,可以不进行修改操作,而当确定第一型号错误时,可以触发对修改按钮的确认操作,主播终端检测到对修改按钮的确认操作时,获取主播用户输入的第二型号,发送给服务器。服务器接收该第二型号,将第二型号确定为麦克风的型号。
其中,主播终端检测到对修改按钮的确认操作时,可以在直播界面中显示输入栏和确定按钮,主播用户在该输入栏输入第二型号,对确定按钮进行确认操作,则该主播终端获取第二型号。或者主播终端还可以弹出输入窗口,该输入窗口中包括输入栏和确定按钮,主播用户在该输入栏输入第二型号,对确定按钮进行确认操作,则该主播终端获取第二型号。
当图像信息中麦克风的特征信息较少时,服务器识别到的型号可能为错误型号,而采用上述步骤3022的方案,可以保证在识别到的第一型号错误的情况下由用户手动输入正确的第二型号,提高了准确性。
需要说明的是,上述步骤3021和3022可以结合,即服务器获取到第一型号时,将第一型号确定为麦克风的型号,根据该型号进行音效调整,并且还会向主播终端发送第一型号,如果后续接收到主播终端发送的第二型号时,再将第二型号确定为麦克风的型号,根据第二型号进行音效调整。
3023、主播终端在直播界面中显示型号设置区域,直播用户在该型号设置区域输入麦克风的型号,主播终端获取该型号,发送至服务器,服务器接收该型号。
例如,主播终端开始进行直播时,即可直接在直播界面中显示型号设置区域,主播用户可在该型号设置区域中输入麦克风的型号。或者,当主播终端向服务器发送的图像信息中不包括麦克风特征或包含的特征较少,导致服务器通过该图像信息获取麦克风型号失败时,服务器向主播终端发送识别失败通知,主播终端接收到识别失败通知时,在直播界面中显示型号设置区域,主播用户可在该型号设置区域中输入麦克风的型号。
其中,显示型号设置区域时,可以直接在直播界面中进行显示,或者还可以弹出提示窗口,在提示窗口中进行显示。
在步骤303中,服务器获取第一直播信息对应的直播类型。
直播信息可以包括多种类型,如唱歌直播类型、户外直播类型、跳舞直播类型、游戏直播类型等,针对不同类型的直播信息可以采用不同的音效。因此,本公开实施例中,服务器可以获取第一直播信息对应的直播类型,后续可以根据直播类型进行音效调整。
在一种可能实现方式中,该步骤303可以包括以下步骤3031和3032中的至少一项:
3031、对图像信息进行分类,得到图像信息所属的类型,作为直播类型。
在一种可能实现方式中,服务器预先获取多种直播类型的图像信息对应的图像特征,对获取到的图像信息进行特征提取,得到该图像信息对应的图像特征,计算该图像特征与每种直播类型对应的图像特征之间的相似度,将与该图像特征的相似度最大的图像特征所属的直播类型确定为图像信息所属的直播类型。
例如,该图像信息为游戏画面时,服务器通过进行特征提取,确定该图像信息对应的图像特征与游戏类的图像特征较为相似,因此确定该图像信息所属的类型为游戏直播类型。
在另一种可能实现方式中,服务器预先训练出用于对多种直播类型进行划分的分类模型,将图像信息输入至分类模型,基于该分类模型对图像信息进行分类,得到图像信息所属的直播类型。
3032、对第一音频信息进行分类,得到第一音频信息所属的类型,作为直播类型。
在一种可能实现方式中,服务器预先获取多种直播类型的音频信息对应的音频特征,对获取到的第一音频信息进行特征提取,得到该第一音频信息对应的音频特征,计算该音频特征与每种直播类型对应的音频特征之间的相似度,将与该音频特征的相似度最大的音频特征所属的直播类型确定为第一音频信息所属的直播类型。
例如,第一音频信息为主播用户唱的歌曲时,服务器通过进行特征提取,确定第一音频信息对应的音频特征属于旋律特征,因此确定该第一音频信息所属的类型为唱歌直播类型。
在另一种可能实现方式中,服务器预先训练出用于对多种直播类型进行划分的分类模型,将第一音频信息输入至分类模型,基于该分类模型对第一音频信息进行分类,得到第一音频信息所属的直播类型。
需要说明的是,服务器可以实时地获取第一直播信息的直播类型,或者也可以周期性地获取第一直播信息的直播类型。在进行直播的过程中,主播用户可以更换为不同直播类型的第一直播信息,即使在更换第一直播信息之后,服务器采用上述获取方式仍然可以获取到更换后的第一直播信息对应的直播类型。
在步骤304中,服务器根据型号和直播类型,获取与型号和直播类型匹配的音效调整参数。
由于不同型号的麦克风采集到的音频信息具有不同的特点,不同直播类型的直播信息中所包含的音频信息也具有不同的特点,因此,为了提高针对性,服务器可以根据麦克风的型号和第一直播信息所属的直播类型,获取与型号和直播类型匹配的音效调整参数,以便根据该音效调整参数进行音效调整。
其中,该音效调整参数用于确定音频信息的调整方式,音频信息中可以包括高音、中音、低音、混响和延迟等,相应的,音效调整参数可以包括高音的调整参数、中音的调整参数、低音的调整参数、混响的调整参数和延迟的调整参数等。例如,音效调整参数为高音降低1个音调,或低音升高2个音调。
在一种可能实现方式中,该步骤303可以包括:服务器预先设置第二对应关系,该第二对应关系包括至少一种麦克风的型号、直播类型与匹配的音效调整参数之间的对应关系,根据第二对应关系,获取型号和直播类型对应的音效调整参数。
需要说明的是,步骤303和304为可选步骤,在另一实施例中,还可以不考虑直播类型,在执行步骤302获取麦克风的型号后,直接根据麦克风的型号获取匹配的音效调整参数。
在一种可能实现方式中,服务器预先设置第三对应关系,该第三对应关系包括至少一种麦克风的型号与匹配的音效调整参数之间的对应关系,根据第三对应关系,获取该型号对应的音效调整参数。
在另一实施例中,进行音效调整时还可以考虑直播内容,例如服务器可以获取麦克风的型号和该第一音频信息中包括的音频内容,根据该型号和该音频内容获取匹配的音效调整参数。
例如,该第一音频信息属于唱歌直播类型,服务器获取到第一音频信息时,识别第一音频信息中包括的歌曲,根据该型号和该歌曲获取匹配的音效调整参数。而当主播用户更换了演唱的歌曲时,服务器还可以识别更换后的歌曲,根据该型号和该更换后的歌曲获取匹配的音效调整参数,从而实现了更加精细地音效调整。
在步骤305中,服务器按照音效调整参数对第一音频信息进行音效调整,得到第二音频信息。
例如,音效调整参数为将高音的音调调高特定值的参数,服务器将第一音频信息中的高音的音调调高该特定值,得到音效调整后的第二音频信息。
在步骤306中,服务器向主播终端的直播间中的每个终端发送包括图像信息和第二音频信息的第二直播信息。
在步骤307中,直播间中的每个终端接收到第二直播信息时,播放该第二直播信息。
服务器获取到第二音频信息时,即可将图像信息和第二音频信息构成第二直播信息,将第二直播信息发布于主播终端的直播间中。
由于该直播间中包括主播终端和至少一个观众终端,因此将第二直播信息发布于直播间中包括:向该直播间中的每个终端发送第二直播信息,由接收到该第二直播信息的每个终端播放该第二直播信息。
本公开实施例提供的方法,通过接收主播终端发送的第一直播信息,第一直播信息中包括的第一音频信息由主播终端通过麦克风采集得到,获取麦克风的型号,根据型号获取匹配的音效调整参数,按照音效调整参数对第一音频信息进行音效调整,得到第二音频信息;将包括图像信息和第二音频信息的第二直播信息发布于主播终端的直播间中。本公开实施例提供了一种根据麦克风的型号进行音效调整的方案,对于任一型号的麦克风均可采用本公开实施例提供的方案进行音效调整,提高了直播效果,无需使用具有音效调整功能的麦克风,节省了设备成本,不会受到麦克风功能的限制,无论是具有音效调整功能的麦克风,还是不具有音效调整的麦克风,均可以采用本公开实施例提供的方法进行音效调整,因此该方法具有普适性,解决了音效调整对麦克风的适应性问题。即使主播用户更换了麦克风,采用本公开实施例提供的方法仍然可以进行音效调整,自动切换为新的音效。
并且,在进行音效调整的过程中还会考虑第一直播信息所属的直播类型,从而根据麦克风的型号和直播类型获取匹配的音效调整参数,以使音效调整的效果与直播类型相匹配,更具有针对性。即使主播用户更换了直播类型,采用本公开实施例提供的方法仍然可以动态地进行音效调整,自动切换为新的音效。
图4是根据一示例性实施例示出的一种音效调整装置的框图。如图4所示,该装置包括接收单元401、获取单元402、调整单元403和发布单元404。
接收单元401,被配置为接收主播终端发送的第一直播信息,第一直播信息包括图像信息和第一音频信息,第一音频信息由主播终端通过麦克风采集得到;
获取单元402,被配置为获取麦克风的型号,根据型号获取匹配的音效调整参数;
调整单元403,被配置为按照音效调整参数对第一音频信息进行音效调整,得到第二音频信息;
发布单元404,被配置为将包括图像信息和第二音频信息的第二直播信息发布于主播终端的直播间中。
本公开实施例提供的装置,通过接收主播终端发送的第一直播信息,第一直播信息中包括的第一音频信息由主播终端通过麦克风采集得到,获取麦克风的型号,根据型号获取匹配的音效调整参数,按照音效调整参数对第一音频信息进行音效调整,得到第二音频信息;将包括图像信息和第二音频信息的第二直播信息发布于主播终端的直播间中。本公开实施例提供了一种根据麦克风的型号进行音效调整的方案,对于任一型号的麦克风均可采用本公开实施例提供的方案进行音效调整,无需使用具有音效调整功能的麦克风,节省了设备成本,不会受到麦克风功能的限制,具有普适性。
在一种可能实现的方式中,如图5所示,获取单元402包括:
识别子单元4021,被配置为对图像信息进行麦克风识别,得到图像信息中麦克风的特征信息;
第一获取子单元4022,被配置为根据预先设置的第一对应关系,获取特征信息对应的第一型号,第一对应关系中包括至少一种麦克风的特征信息与型号之间的对应关系。
在另一种可能实现的方式中,如图5所示,获取单元402还包括:
发送子单元4023,被配置为向主播终端发送第一型号,主播终端用于显示第一型号和修改按钮,当检测到对修改按钮的确认操作时,获取主播用户输入的第二型号;
第二获取子单元4024,被配置为接收主播终端发送的第二型号,将第二型号确定为麦克风的型号。
在另一种可能实现的方式中,如图5所示,获取单元402还包括:
第三获取子单元4025,被配置为接收主播终端发送的型号,主播终端用于在直播界面中显示型号设置区域,获取主播用户在型号设置区域中输入的型号。
在另一种可能实现的方式中,如图5所示,获取单元402还包括:
型号获取子单元4026,被配置为获取麦克风的型号;
类型获取子单元4027,被配置为获取第一直播信息对应的直播类型;
参数获取子单元4028,被配置为根据型号和直播类型,获取与型号和直播类型匹配的音效调整参数。
在另一种可能实现的方式中,类型获取子单元4027,还被配置为执行以下至少一项:
对图像信息进行分类,得到图像信息所属的类型,作为直播类型;
对第一音频信息进行分类,得到第一音频信息所属的类型,作为直播类型。
在另一种可能实现的方式中,参数获取子单元4028,还被配置为根据预先设置的第二对应关系,获取型号和直播类型对应的音效调整参数,第二对应关系中包括至少一种麦克风的型号、直播类型与匹配的音效调整参数之间的对应关系。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,在此不再赘述。
图6是根据一示例性实施例示出的一种服务器的结构示意图,该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)601和一个或一个以上的存储器602,其中,存储器602中存储有至少一条指令,至少一条指令由处理器601加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种非临时性计算机可读存储介质,当存储介质中的指令由服务器的处理器执行时,使得服务器能够执行上述实施例所示的音效调整方法。
在示例性实施例中,还提供了一种计算机程序产品,当计算机程序产品中的指令由服务器的处理器执行时,使得服务器能够执行上述实施例所示的音效调整方法。
本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种音效调整方法,其特征在于,由服务器执行,所述方法包括:
接收主播终端发送的第一直播信息,所述第一直播信息包括图像信息和第一音频信息,所述第一音频信息由所述主播终端通过麦克风采集得到;
对所述图像信息进行麦克风识别,得到所述图像信息中麦克风的特征信息,所述特征信息包括多个信息项;
将所述麦克风的特征信息包含的多个信息项与第一对应关系中每个特征信息包含的多个信息项分别进行比对,确定所述第一对应关系中所述每个特征信息与所述麦克风的特征信息的相同信息项数量,将所述第一对应关系中相同信息项数量最多的特征信息对应的型号,确定为所述麦克风的特征信息对应的第一型号;或者,确定所述麦克风的特征信息与所述第一对应关系中所述每个特征信息之间的相似度,将所述第一对应关系中相似度最大的特征信息对应的型号,确定为所述麦克风的特征信息对应的第一型号,所述第一对应关系中包括至少一种麦克风的特征信息与型号之间的对应关系;
向所述主播终端发送所述第一型号,所述主播终端用于显示所述第一型号和修改按钮,当确定第一型号正确时不进行修改操作,当检测到对所述修改按钮的确认操作时,获取主播用户输入的第二型号;
在所述主播终端未对所述第一型号修改的情况下,将所述第一型号确定为所述麦克风的型号;或者,接收所述主播终端发送的所述第二型号,将所述第二型号确定为所述麦克风的型号;
获取所述第一直播信息对应的直播类型;
根据所述麦克风的型号和所述直播类型,获取与所述麦克风的型号和所述直播类型匹配的音效调整参数;
按照所述音效调整参数对所述第一音频信息进行音效调整,得到第二音频信息;
将包括所述图像信息和所述第二音频信息的第二直播信息发布于所述主播终端的直播间中,由所述直播间中的每个终端接收到所述第二直播信息时,播放所述第二直播信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收所述主播终端发送的所述麦克风的型号,所述主播终端用于在直播界面中显示型号设置区域,获取主播用户在所述型号设置区域中输入的所述麦克风的型号。
3.根据权利要求1所述的方法,其特征在于,所述获取所述第一直播信息对应的直播类型,包括以下至少一项:
对所述图像信息进行分类,得到所述图像信息所属的类型,作为所述直播类型;
对所述第一音频信息进行分类,得到所述第一音频信息所属的类型,作为所述直播类型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述麦克风的型号和所述直播类型,获取与所述麦克风的型号和所述直播类型匹配的音效调整参数,包括:
根据预先设置的第二对应关系,获取所述麦克风的型号和所述直播类型对应的音效调整参数,所述第二对应关系中包括至少一种麦克风的型号、直播类型与匹配的音效调整参数之间的对应关系。
5.一种音效调整装置,其特征在于,所述装置包括:
接收单元,被配置为接收主播终端发送的第一直播信息,所述第一直播信息包括图像信息和第一音频信息,所述第一音频信息由所述主播终端通过麦克风采集得到;
获取单元,被配置为对所述图像信息进行麦克风识别,得到所述图像信息中麦克风的特征信息,所述特征信息包括多个信息项;将所述麦克风的特征信息包含的多个信息项与第一对应关系中每个特征信息包含的多个信息项分别进行比对,确定所述第一对应关系中所述每个特征信息与所述麦克风的特征信息的相同信息项数量,将所述第一对应关系中相同信息项数量最多的特征信息对应的型号,确定为所述麦克风的特征信息对应的第一型号;或者,确定所述麦克风的特征信息与所述第一对应关系中所述每个特征信息之间的相似度,将所述第一对应关系中相似度最大的特征信息对应的型号,确定为所述麦克风的特征信息对应的第一型号,所述第一对应关系中包括至少一种麦克风的特征信息与型号之间的对应关系;向所述主播终端发送所述第一型号,所述主播终端用于显示所述第一型号和修改按钮,当确定第一型号正确时不进行修改操作,当检测到对所述修改按钮的确认操作时,获取主播用户输入的第二型号;在所述主播终端未对所述第一型号修改的情况下,将所述第一型号确定为所述麦克风的型号;或者,接收所述主播终端发送的所述第二型号,将所述第二型号确定为所述麦克风的型号;获取所述第一直播信息对应的直播类型;根据所述麦克风的型号和所述直播类型,获取与所述麦克风的型号和所述直播类型匹配的音效调整参数;
调整单元,被配置为按照所述音效调整参数对所述第一音频信息进行音效调整,得到第二音频信息;
发布单元,被配置为将包括所述图像信息和所述第二音频信息的第二直播信息发布于所述主播终端的直播间中,由所述直播间中的每个终端接收到所述第二直播信息时,播放所述第二直播信息。
6.根据权利要求5所述的装置,其特征在于,所述获取单元,还被配置为接收所述主播终端发送的所述麦克风的型号,所述主播终端用于在直播界面中显示型号设置区域,获取主播用户在所述型号设置区域中输入的所述麦克风的型号。
7.根据权利要求5所述的装置,其特征在于,所述类型获取子单元,还被配置为执行以下至少一项:
对所述图像信息进行分类,得到所述图像信息所属的类型,作为所述直播类型;
对所述第一音频信息进行分类,得到所述第一音频信息所属的类型,作为所述直播类型。
8.根据权利要求5所述的装置,其特征在于,所述参数获取子单元,还被配置为根据预先设置的第二对应关系,获取所述麦克风的型号和所述直播类型对应的音效调整参数,所述第二对应关系中包括至少一种麦克风的型号、直播类型与匹配的音效调整参数之间的对应关系。
9.一种音效调整装置,其特征在于,所述装置包括:
处理器;
用于存储处理器可执行命令的存储器;
其中,所述处理器被配置为执行如权利要求1-4任一项权利要求所述的音效调整方法。
10.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如权利要求1-4任一项权利要求所述的音效调整方法。
CN201910423803.0A 2019-05-21 2019-05-21 音效调整方法、装置及存储介质 Active CN110119264B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910423803.0A CN110119264B (zh) 2019-05-21 2019-05-21 音效调整方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910423803.0A CN110119264B (zh) 2019-05-21 2019-05-21 音效调整方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110119264A CN110119264A (zh) 2019-08-13
CN110119264B true CN110119264B (zh) 2023-03-31

Family

ID=67522939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910423803.0A Active CN110119264B (zh) 2019-05-21 2019-05-21 音效调整方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110119264B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112272170B (zh) * 2020-10-19 2023-01-10 广州博冠信息科技有限公司 语音通信方法及装置、电子设备、存储介质
CN114666706B (zh) * 2021-11-30 2024-05-14 北京达佳互联信息技术有限公司 音效增强方法、装置及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008080912A1 (en) * 2007-01-04 2008-07-10 International Business Machines Corporation Systems and methods for intelligent control of microphones for speech recognition applications
CN204087431U (zh) * 2014-09-11 2015-01-07 姚淑青 一种适用于幼儿园的光启动报警器
CN108260248A (zh) * 2018-01-12 2018-07-06 广东小天才科技有限公司 一种用于智能终端外置麦克风的提醒方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010013754A1 (ja) * 2008-07-30 2010-02-04 ヤマハ株式会社 オーディオ信号処理装置、オーディオ信号処理システム、およびオーディオ信号処理方法
TW201225689A (en) * 2010-12-03 2012-06-16 Yare Technologies Inc Conference system capable of independently adjusting audio input
CN103856871B (zh) * 2012-12-06 2016-08-10 华为技术有限公司 麦克风阵列采集多声道声音的装置及其方法
CN104065798B (zh) * 2013-03-21 2016-08-03 华为技术有限公司 声音信号处理方法及设备
CN103731722A (zh) * 2013-11-27 2014-04-16 乐视致新电子科技(天津)有限公司 一种自适应调节音效的方法及装置
CN105228050B (zh) * 2015-10-23 2018-07-17 广东欧珀移动通信有限公司 终端上耳机音质的调整方法以及装置
CN105872897A (zh) * 2016-03-31 2016-08-17 乐视控股(北京)有限公司 一种音质调整方法和终端
CN105872253B (zh) * 2016-05-31 2020-07-07 腾讯科技(深圳)有限公司 一种直播声音处理方法及移动终端
CN106535021A (zh) * 2016-12-07 2017-03-22 王昊 一种耳机及其按键控制方法
CN108462895A (zh) * 2017-02-21 2018-08-28 阿里巴巴集团控股有限公司 音效处理方法、装置和机器可读介质
CN206728217U (zh) * 2017-05-05 2017-12-08 江西创成微电子有限公司 跨直播平台的语音连麦系统
CN108307268A (zh) * 2017-12-12 2018-07-20 深圳依偎控股有限公司 一种基于多麦克风的直播方法及直播设备
CN109348274B (zh) * 2018-09-12 2021-03-23 咪咕音乐有限公司 一种直播互动方法、装置及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008080912A1 (en) * 2007-01-04 2008-07-10 International Business Machines Corporation Systems and methods for intelligent control of microphones for speech recognition applications
CN204087431U (zh) * 2014-09-11 2015-01-07 姚淑青 一种适用于幼儿园的光启动报警器
CN108260248A (zh) * 2018-01-12 2018-07-06 广东小天才科技有限公司 一种用于智能终端外置麦克风的提醒方法及装置

Also Published As

Publication number Publication date
CN110119264A (zh) 2019-08-13

Similar Documents

Publication Publication Date Title
CN109388367B (zh) 音效调整方法、装置、电子设备以及存储介质
US10555047B2 (en) Remote engagement system
CN112218103A (zh) 直播间互动方法、装置、电子设备和存储介质
CN110119264B (zh) 音效调整方法、装置及存储介质
CN110012210A (zh) 拍照方法、装置、存储介质及电子设备
CN110121082B (zh) 显示直播间排名信息的方法、装置、设备和可读存储介质
CN105100831A (zh) 电视机播放模式的调整方法、电视播放系统和电视机
CN109616090B (zh) 多音轨序列生成方法、装置、设备及存储介质
CN111479119A (zh) 直播中反馈信息的收集方法、装置、系统及存储介质
CN113676668A (zh) 视频拍摄方法、装置、电子设备和可读存储介质
CA3161441A1 (en) Cloud-based media synchronization system for generating a synchronization interface and performing media synchronization
US20240057234A1 (en) Adjusting light effects based on adjustments made by users of other systems
CN112019890B (zh) 直播分发方法、装置、服务器及介质
CN111182317B (zh) 直播信息提示方法、装置、电子设备及存储介质
CN106407353B (zh) 一种播放动画的方法和装置
WO2019114582A1 (zh) 视频图像处理方法及计算机存储介质、终端
CN114449301B (zh) 物品发送方法、装置、电子设备和计算机可读存储介质
CN116708853A (zh) 直播中的互动方法、装置和电子设备
CN107071552B (zh) 播放设备的设置方法、装置、播放设备及控制终端
JP5550593B2 (ja) カラオケ装置
CN111179984B (zh) 音频数据处理方法、装置及终端设备
CN114390304A (zh) 直播变声方法、装置、电子设备及存储介质
CN112313962B (zh) 内容发布服务器、内容发布系统、内容发布方法及程序
CN109064416B (zh) 图像处理方法、装置、存储介质及电子设备
CN113986183B (zh) 智能家居设备的音量调节方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant