CN117037753A - K歌方法、系统、车辆及存储介质 - Google Patents
K歌方法、系统、车辆及存储介质 Download PDFInfo
- Publication number
- CN117037753A CN117037753A CN202311159912.9A CN202311159912A CN117037753A CN 117037753 A CN117037753 A CN 117037753A CN 202311159912 A CN202311159912 A CN 202311159912A CN 117037753 A CN117037753 A CN 117037753A
- Authority
- CN
- China
- Prior art keywords
- song
- sound data
- sound
- data
- accompaniment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000005236 sound signal Effects 0.000 claims abstract description 43
- 230000006870 function Effects 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims description 61
- 238000004590 computer program Methods 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 17
- 230000006978 adaptation Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 8
- 230000000977 initiatory effect Effects 0.000 claims description 7
- 230000001960 triggered effect Effects 0.000 claims description 4
- 230000004807 localization Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 9
- 230000003321 amplification Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 102100026436 Regulator of MON1-CCZ1 complex Human genes 0.000 description 1
- 101710180672 Regulator of MON1-CCZ1 complex Proteins 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明公开了一种K歌方法、系统、车辆及存储介质,其中,K歌方法应用于车辆,车辆设有至少两个麦克风,麦克风具有声源定位功能,K歌方法包括:响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据,其中,每个麦克风仅采集一个声源的目标声音数据,K歌模式是控制车辆为用户提供K歌功能的模式;根据K歌模式启动指令,确定K歌伴奏;对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据;将混音数据转换为音频信号进行输出。本发明解决了车内多人想共同K歌,需要依赖多个精品麦克风和多个USB的插口,会给用户带来较高的成本的技术问题。
Description
技术领域
本发明属于车辆领域,具体而言,涉及一种K歌方法、系统、车辆及存储介质。
背景技术
车载K歌已经成为各家车厂主推的功能,备受用户喜爱,目前车载K歌是借助USB外接的精品麦克风来实现录音、混音、噪声处理、调音及伴奏音等以达成用户K歌的功能,精品麦克风需用户付费购买。目前市场上是通过外接一个麦克风的方式,可以支持一个用户K歌,但是如果车内多人想共同K歌,需要依赖多个精品麦克风和多个USB的插口,会给用户带来较高的成本。
发明内容
本发明实施例提供了一种K歌方法、系统、车辆及存储介质,以至少解决车内多人想共同K歌,需要依赖多个精品麦克风和多个USB的插口,会给用户带来较高的成本的技术问题。
根据本发明实施例的第一个方面,提供了一种K歌方法,应用于车辆,车辆设有至少两个麦克风,麦克风具有声源定位功能,包括:响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据,其中,每个麦克风仅采集一个声源的目标声音数据,K歌模式是控制车辆为用户提供K歌功能的模式;根据K歌模式启动指令,确定K歌伴奏;对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据;将混音数据转换为音频信号进行输出。
可选的,响应于K歌模式启动指令,控制多个麦克风接收多个声源的声音数据包括:响应于K歌模式启动指令,控制多个麦克风接收多个声源的初始声音数据;对多个声源的初始声音数据进行降噪和回声消除处理,得到多个声源的目标声音数据。
可选的,根据K歌模式启动指令,确定K歌伴奏包括:根据K歌模式启动指令,确定初始选定伴奏;获取升降调指令;根据升降调指令对初始选定伴奏进行升降调处理,得到K歌伴奏。
可选的,对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据包括:对K歌伴奏进行采样率适配,得到待混音K歌伴奏;对多个声源的目标声音数据进行人声效果处理,得到待混音目标声音数据,其中,人声效果处理包括混响处理;对待混音K歌伴奏和待混音目标声音数据进行混音处理,得到混音数据。
可选的,对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据包括:获取音量调节信号;根据音量调节信号,对每个声源的目标声音数据进行音量调节;将调节后的多个声源的目标声音数据进行混音处理,得到混音数据。
可选的,将混音数据转换为音频数据进行输出包括:利用声卡将混音数据转换为音频信号;利用功放设备将音频信号进行放大,得到放大音频信号;利用扬声器将放大音频信号输出。
可选的,K歌模式启动指令通过用户语音、车载按键或与车辆绑定的移动设备触发。
根据本发明实施例的第二方面,还提供一种K歌系统,包括:
控制模块,用于响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据,其中,每个麦克风仅采集一个声源的目标声音数据,K歌模式是控制车辆为用户提供K歌功能的模式;确定模块,用于根据K歌模式启动指令,确定K歌伴奏;混音模块,用于对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据;输出模块,用于将混音数据转换为音频信号进行输出。
可选的,控制模块还用于:响应于K歌模式启动指令,控制多个麦克风接收多个声源的初始声音数据;对多个声源的初始声音数据进行降噪和回声消除处理,得到多个声源的目标声音数据。
可选的,确定模块还用于:根据K歌模式启动指令,确定初始选定伴奏;获取升降调指令;根据升降调指令对初始选定伴奏进行升降调处理,得到K歌伴奏。
可选的,混音模块还用于:对K歌伴奏进行采样率适配,得到待混音K歌伴奏;对多个声源的目标声音数据进行人声效果处理,得到待混音目标声音数据,其中,人声效果处理包括混响处理;对待混音K歌伴奏和待混音目标声音数据进行混音处理,得到混音数据。
可选的,混音模块还用于:获取音量调节信号;根据音量调节信号,对每个声源的目标声音数据进行音量调节;将调节后的多个声源的目标声音数据进行混音处理,得到混音数据。
可选的,输出模块还用于:利用声卡将混音数据转换为音频信号;利用功放设备将音频信号进行放大,得到放大音频信号;利用扬声器将放大音频信号输出。
根据本发明实施例的第三方面,还提供了一种车辆,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述第一方面任一实施例中所述的K歌方法。
根据本发明实施例的第四方面,还提供了一种非易失性存储介质,非易失性存储介质中存储有计算机程序,其中,计算机程序被设置为在计算机或处理器上运行时,执行上述第一方面任一实施例中所述的K歌方法。
在本发明实施例中,响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据,其中,每个麦克风仅采集一个声源的目标声音数据,K歌模式是控制车辆为用户提供K歌功能的模式;根据K歌模式启动指令,确定K歌伴奏;对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据;将混音数据转换为音频信号进行输出。本申请通过利用车辆搭载的支持声源定位的车载语音麦克风进行,当接收到K歌模式的指令后,通过车载麦克风进行不同声源的声音数据进行采集,然后将多个声源的目标声音数据和K歌伴奏进行混音后输出,基于车辆硬件基础,实现多人K歌,进而可以解决车内多人想共同K歌,需要依赖多个精品麦克风和多个USB的插口,会给用户带来较高的成本的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明其中一实施例的K歌方法的流程图;
图2是根据本发明其中一实施例的K歌系统的架构示意图;
图3是根据本发明其中一实施例的K歌系统的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种K歌方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在包含至少一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
该方法实施例还可以在包含存储器和处理器的电子装置、类似的控制装置或者云端中执行。以电子装置为例,电子装置可以包括一个或多个处理器和用于存储数据的存储器。可选地,上述电子装置还可以包括用于通信功能的通信设备以及显示设备。本领域普通技术人员可以理解,上述结构描述仅为示意,其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比上述结构描述更多或者更少的组件,或者具有与上述结构描述不同的配置。
处理器可以包括一个或多个处理单元。例如:处理器可以包括中央处理器(central processing unit,CPU)、图形处理器(graphics processing unit,GPU)、数字信号处理(digital signal processing,DSP)芯片、微处理器(microcontroller unit,MCU)、可编程逻辑器件(field-programmable gate array,FPGA)、神经网络处理器(neural-network processing unit,NPU)、张量处理器(tensor processing unit,TPU)、人工智能(artificial intelligent,AI)类型处理器等的处理装置。其中,不同的处理单元可以是独立的部件,也可以集成在一个或多个处理器中。在一些实例中,电子装置也可以包括一个或多个处理器。
存储器可用于存储计算机程序,例如存储本发明实施例中的K歌方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而实现上述的K歌方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至电子装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
通信设备用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,通信设备包括一个网络适配器(network interface controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,通信设备可以为射频(radio frequency,RF)模块,其用于通过无线方式与互联网进行通讯。在本方案的一些实施例中,通信设备用于与手机、平板等移动设备连接,可以通过移动设备向电子装置发送指令。
显示设备可以为触摸屏式的液晶显示器(liquid crystal display,LCD)和触摸显示器(也被称为“触摸屏”或“触摸显示屏”)。该液晶显示器可使得用户能够与电子装置的用户界面进行交互。在一些实施例中,上述电子装置具有图形用户界面(graphical userinterface,GUI),用户可以通过触摸触敏表面上的手指接触和/或手势来与GUI进行人机交互,用于执行上述人机交互功能的可执行指令被配置/存储在一个或多个处理器可执行的计算机程序产品或可读存储介质中。
图1是根据本发明其中一实施例的K歌方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据。
其中,每个麦克风仅采集一个声源的目标声音数据,K歌模式是控制车辆为用户提供K歌功能的模式。
具体的,应用本方法的车辆中,设置有至少两个具有声源定位功能的麦克风,具有声源定位功能的麦克风可以识别并接受对应位置的声源的声音数据。
示例性的,主驾驶和副驾驶位置分别设置一个具有声源定位功能的麦克风,当接收到K歌模式启动指令,且主驾驶的用户和副驾驶的用户同时发出声音时,控制主驾驶位置和副驾驶位置对应的麦克风启动,其中,主驾驶位置的麦克风仅采集主驾驶位置的用户发出的声音,副驾驶位置的麦克风仅采集副驾驶位置的用户发出的声音。
需要说明的是,在本发明的一些实施例中,车辆中每个座位都对应设置有一个具有声源定位功能的麦克风。
步骤S102,根据K歌模式启动指令,确定K歌伴奏。
具体的,车辆在获取到K歌模式启动指令后,会提示用户进行伴奏选择,然后获取到用户的选择数据,进而确定K歌伴奏。
可选的,在本发明的一些实施例中,K歌模式启动指令中包括K歌伴奏,即发送指令的模块在发送K歌模式启动指令的同时,同时会获取K歌伴奏。
步骤S103,对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据。
具体的,当获取到K歌伴奏和多个声源的目标声音数据后,对K个伴奏和多个目标声音数据进行混音处理,得到混音后的混音数据,其中,混音可以采用混音器进行。
步骤S104,将混音数据转换为音频信号进行输出。
具体的,得到混音数据后,将混音数据转换为可以输出的音频信号进行输出。
可以理解的是,车辆上多个用户进行K歌时,每个用户对应一个目标声音数据,最后的混音数据是每个用户对应的目标声音数据加上K歌伴奏,将混音数据转换为音频信号进行输出可以达到多人在车辆中进行K歌的效果。
在本发明实施例中,响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据,其中,每个麦克风仅采集一个声源的目标声音数据,K歌模式是控制车辆为用户提供K歌功能的模式;根据K歌模式启动指令,确定K歌伴奏;对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据;将混音数据转换为音频信号进行输出。本申请通过利用车辆搭载的支持声源定位的车载语音麦克风进行,当接收到K歌模式的指令后,通过车载麦克风进行不同声源的声音数据进行采集,然后将多个声源的目标声音数据和K歌伴奏进行混音后输出,基于车辆硬件基础,实现多人K歌,进而可以解决车内多人想共同K歌,需要依赖多个精品麦克风和多个USB的插口,会给用户带来较高的成本的技术问题。
可选的,在步骤S101中,响应于K歌模式启动指令,控制多个麦克风接收多个声源的声音数据可以包括如下步骤:
步骤S1011,响应于K歌模式启动指令,控制多个麦克风接收多个声源的初始声音数据。
步骤S1012,对多个声源的初始声音数据进行降噪和回声消除处理,得到多个声源的目标声音数据。
具体的,当控制多个麦克风接收到多个声源的初始声音数据后,需要对多个声源的初始声音数据进行降噪和回声消除处理,其中,降噪可以去除背景噪声,使声音更清晰,减少干扰,回声消除可以消除音频中的回声,使声音更加自然。多个声源的初始声音数据经过降噪和回声消除处理后,得到多个声源的目标声音数据。
可选的,在步骤S102中,根据K歌模式启动指令,确定K歌伴奏可以包括如下步骤:
步骤S1021,根据K歌模式启动指令,确定初始选定伴奏。
步骤S1022,获取升降调指令;根据升降调指令对初始选定伴奏进行升降调处理,得到K歌伴奏。
具体的,当获取到K歌模式启动指令后,首先确定初始选定伴奏,初始选定伴奏即为音乐平台提供的原版伴奏。示例性的,若用户想唱A歌曲,则选定A歌曲的伴奏作为初始选定伴奏。若用户有升降调的需求,可以获取到用户发出的升降调指令,根据获取到的升降调指令,对初始选定伴奏进行升降调处理得到K歌伴奏。
可选的,对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据包括:对K歌伴奏进行采样率适配,得到待混音K歌伴奏;对多个声源的目标声音数据进行人声效果处理,得到待混音目标声音数据,其中,人声效果处理包括混响处理;对待混音K歌伴奏和待混音目标声音数据进行混音处理,得到混音数据。
具体的,确定混音数据时,首先对K歌伴奏进行采样率适配,即将采样率设置为44.1KHz或48KHz,采样率适配后得到待混音K歌伴奏。同时,对采集到的多个声源的目标声音数据进行混响处理得到待混音目标声音数据。最后对待混音K歌伴奏和待混音目标声音数据进行混音处理,得到混音数据。
可以理解的是,对K歌伴奏进行采样率适配可以使得伴奏效果更好。对采集到的多个声源的目标声音数据进行混响可以增加采集到的声音的空间感。
需要说明的是,人声效果处理还包括回声消除和啸叫抑制等。
可选的,在步骤S103中,对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据可以包括如下步骤:
步骤S1031,获取音量调节信号;根据音量调节信号,对每个声源的目标声音数据进行音量调节。
步骤S1032,将调节后的多个声源的目标声音数据进行混音处理,得到混音数据。
具体的,在确定混音数据的过程中,还可以获取到用户发出的音量调节信号,然后根据音量调节信号对每个声源的目标声音数据进行音量调节,最后将音量调节后的多个声源的目标声音数据进行混音处理,得到混音数据。
可以理解的是,通过步骤S1031和步骤S1032的方法,在K歌过程中,可以个性化的设置每个用户的音量,提高用户满意度。
可选的,在步骤S104中,将混音数据转换为音频数据进行输出可以包括如下步骤:
步骤S1041,利用声卡将混音数据转换为音频信号。
步骤S1042,利用功放设备将音频信号进行放大,得到放大音频信号。
步骤S1043,利用扬声器将放大音频信号输出。
具体的,混音数据首先需要通过声卡将混音数据转换为可以输出的音频信号,然后通过功放设备将音频信号进行放大,最后利用扬声器将放大后的音频信号进行输出。
可选的,K歌模式启动指令通过用户语音、车载按键或与车辆绑定的移动设备触发。
示例性的,车载语音系统在监听到用于启动K歌模式的用户语音后,触发K歌模式启动指令,其中,用户语音可以为:“启动K歌模式”、“开始K歌”等用户自定义的触发语音。
示例性的,还可以预设开启K歌模式的车载按键,通过车载按键触发K歌模式启动指令。
示例性的,可以通过与车辆绑定的移动设备上应用程序的触发K歌模式启动指令。其中,应用程序可以用于控制车辆的K歌系统。
参照图2,本发明实施例还提供了一种K歌系统,包括安卓应用层、系统层和驱动层,具体的,安卓应用层中的安卓(Android)应用为KTV应用,KTV应用中包含搜歌、点歌、K歌、评分等功能,支持用户进行界面交互和语音交互。KTV应用中内置播放器,可以对选定的伴奏进行音频解码。系统层中由升降调处理模块对解码后的伴奏音频文件进行接收处理,并进行采样率适配处理。K歌模式模块用于接收KTV应用发送的指令,以控制车辆进入K歌模式,然后K歌模式模块将进入K歌模式的信号发送至混音器。当车辆在K歌模式时,通过麦克风(图2中Mic1、Mic2、Mic3和Mic4表示四个麦克风)录入的声音会和伴奏音通过混合后通过扬声器输出。当在非K歌模式时,麦克风主要服务于语音功能,录入的声音不会通过扬声器输出。音效处理模块负责读取驱动层中录音声卡的多路音频文件并进行混响等人声效果处理。混音器将采样处理后的伴奏音和音效处理后人声进行合并处理为最终的音频文件,写入驱动层的播放声卡,借助功放和扬声器输出混合后的音频。
可以理解的是,KTV应用即用于搜歌、点歌、评分以及触发车辆进入K歌模式的安卓应用程序。
需要说明的是,上文中K歌可以理解为唱歌,本发明提供的方法可以达到多人在车辆上进行合唱的效果。
通过以上实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种K歌系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”为可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是根据本发明其中一实施例的K歌系统200的结构框图,如图3所示,以K歌系统200进行示例,包括:控制模块201,用于响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据,其中,每个麦克风仅采集一个声源的目标声音数据,K歌模式是控制车辆为用户提供K歌功能的模式;确定模块202,用于根据K歌模式启动指令,确定K歌伴奏;混音模块203,用于对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据;输出模块204,用于将混音数据转换为音频信号进行输出。
可选的,控制模块201还用于:响应于K歌模式启动指令,控制多个麦克风接收多个声源的初始声音数据;对多个声源的初始声音数据进行降噪和回声消除处理,得到多个声源的目标声音数据。
可选的,确定模块202还用于:根据K歌模式启动指令,确定初始选定伴奏;获取升降调指令;根据升降调指令对初始选定伴奏进行升降调处理,得到K歌伴奏。
可选的,混音模块203还用于:对K歌伴奏进行采样率适配,得到待混音K歌伴奏;对多个声源的目标声音数据进行人声效果处理,得到待混音目标声音数据,其中,人声效果处理包括混响处理;对待混音K歌伴奏和待混音目标声音数据进行混音处理,得到混音数据。
可选的,混音模块203还用于:获取音量调节信号;根据音量调节信号,对每个声源的目标声音数据进行音量调节;将调节后的多个声源的目标声音数据进行混音处理,得到混音数据。
可选的,输出模块204还用于:利用声卡将混音数据转换为音频信号;利用功放设备将音频信号进行放大,得到放大音频信号;利用扬声器将放大音频信号输出。
本发明的实施例还提供了一种车辆,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述任一实施例中所述的K歌方法。
可选地,在本实施例中,上述车辆中的处理器可以被设置为运行计算机程序以执行以下步骤:
步骤S101,响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据。
步骤S102,根据K歌模式启动指令,确定K歌伴奏。
步骤S103,对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据。
步骤S104,将混音数据转换为音频信号进行输出。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
本发明的实施例还提供了一种非易失性存储介质,非易失性存储介质中存储有计算机程序,其中,计算机程序被设置为在计算机或处理器上运行时,执行上述任一实施例中所述的K歌方法。
可选地,在本实施例中,上述计算机程序可以被设置为存储用于执行以下步骤的计算机程序:
步骤S101,响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据。
步骤S102,根据K歌模式启动指令,确定K歌伴奏。
步骤S103,对K歌伴奏和多个声源的目标声音数据进行混音处理,得到混音数据。
步骤S104,将混音数据转换为音频信号进行输出。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的一些实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述模块的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种K歌方法,应用于车辆,所述车辆设有至少两个麦克风,所述麦克风具有声源定位功能,其特征在于,包括:
响应于K歌模式启动指令,控制多个所述麦克风接收多个声源的目标声音数据,其中,每个所述麦克风仅采集一个声源的目标声音数据,K歌模式是控制车辆为用户提供K歌功能的模式;
根据所述K歌模式启动指令,确定K歌伴奏;
对所述K歌伴奏和所述多个声源的目标声音数据进行混音处理,得到混音数据;
将所述混音数据转换为音频信号进行输出。
2.根据权利要求1所述的K歌方法,其特征在于,所述响应于K歌模式启动指令,控制多个所述麦克风接收多个声源的声音数据包括:
响应于K歌模式启动指令,控制多个所述麦克风接收多个声源的初始声音数据;
对所述多个声源的初始声音数据进行降噪和回声消除处理,得到所述多个声源的目标声音数据。
3.根据权利要求1所述的K歌方法,其特征在于,所述根据所述K歌模式启动指令,确定K歌伴奏包括:
根据所述K歌模式启动指令,确定初始选定伴奏;
获取升降调指令;
根据所述升降调指令对所述初始选定伴奏进行升降调处理,得到所述K歌伴奏。
4.根据权利要求1所述的K歌方法,其特征在于,所述对所述K歌伴奏和所述多个声源的目标声音数据进行混音处理,得到混音数据包括:
对所述K歌伴奏进行采样率适配,得到待混音K歌伴奏;
对所述多个声源的目标声音数据进行人声效果处理,得到待混音目标声音数据,其中,人声效果处理包括混响处理;
对所述待混音K歌伴奏和所述待混音目标声音数据进行混音处理,得到所述混音数据。
5.根据权利要求1所述的K歌方法,其特征在于,所述对所述K歌伴奏和所述多个声源的目标声音数据进行混音处理,得到混音数据包括:
获取音量调节信号;
根据所述音量调节信号,对每个声源的目标声音数据进行音量调节;
将调节后的多个声源的目标声音数据进行混音处理,得到混音数据。
6.根据权利要求1所述的K歌方法,其特征在于,所述将所述混音数据转换为音频数据进行输出包括:
利用声卡将所述混音数据转换为音频信号;
利用功放设备将所述音频信号进行放大,得到放大音频信号;
利用扬声器将所述放大音频信号输出。
7.根据权利要求1所述的K歌方法,其特征在于,所述K歌模式启动指令通过用户语音、车载按键或与所述车辆绑定的移动设备触发。
8.一种K歌系统,其特征在于,包括:
控制模块,用于响应于K歌模式启动指令,控制多个麦克风接收多个声源的目标声音数据,其中,每个所述麦克风仅采集一个声源的目标声音数据,K歌模式是控制车辆为用户提供K歌功能的模式;
确定模块,用于根据所述K歌模式启动指令,确定K歌伴奏;
混音模块,用于对所述K歌伴奏和所述多个声源的目标声音数据进行混音处理,得到混音数据;
输出模块,用于将所述混音数据转换为音频信号进行输出。
9.一种车辆,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述权利要求1至7任一项中所述的K歌方法。
10.一种非易失性存储介质,其特征在于,所述非易失性存储介质中存储有计算机程序,其中,所述计算机程序被设置为在计算机或处理器上运行时,执行上述权利要求1至7任一项中所述的K歌方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311159912.9A CN117037753A (zh) | 2023-09-08 | 2023-09-08 | K歌方法、系统、车辆及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311159912.9A CN117037753A (zh) | 2023-09-08 | 2023-09-08 | K歌方法、系统、车辆及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117037753A true CN117037753A (zh) | 2023-11-10 |
Family
ID=88643254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311159912.9A Pending CN117037753A (zh) | 2023-09-08 | 2023-09-08 | K歌方法、系统、车辆及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117037753A (zh) |
-
2023
- 2023-09-08 CN CN202311159912.9A patent/CN117037753A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11729572B2 (en) | Systems and methods for calibrating speakers | |
JP6377018B2 (ja) | 可搬型メディア再生装置に関するオーディオ・システム等化処理 | |
CN104871566B (zh) | 协作式声音系统 | |
CN105794231B (zh) | 免提波束方向图配置 | |
CN103247294B (zh) | 信号处理设备、方法、系统和通信终端 | |
CN105632508B (zh) | 音频处理方法及音频处理装置 | |
US20110066438A1 (en) | Contextual voiceover | |
US9300795B2 (en) | Voice input state identification | |
CN101162894A (zh) | 音效处理装置及方法 | |
CN105208189A (zh) | 音频处理方法及移动终端 | |
CN103237282A (zh) | 无线音频处理设备、无线音频播放器及其工作方法 | |
CN203313386U (zh) | 无线音频处理设备、无线音频播放器、家庭用卡拉ok系统 | |
CN105323353A (zh) | 移动装置音频指示 | |
CN109658910A (zh) | 一种无线k歌系统 | |
CN104317404A (zh) | 一种声纹控制音频播放设备、控制系统及方法 | |
CN117037753A (zh) | K歌方法、系统、车辆及存储介质 | |
CN108574914B (zh) | 音箱组播放音频文件的调整方法及装置、接收端 | |
CN111556406B (zh) | 音频处理方法、音频处理装置及耳机 | |
CN204229342U (zh) | 一种声纹控制音频播放设备 | |
CN115691456A (zh) | 车载音频播放方法、装置、多媒体主机及存储介质 | |
CN113612881A (zh) | 基于单移动终端的扬声方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |