CN104871565B - 音频处理装置和方法 - Google Patents

音频处理装置和方法 Download PDF

Info

Publication number
CN104871565B
CN104871565B CN201380065234.8A CN201380065234A CN104871565B CN 104871565 B CN104871565 B CN 104871565B CN 201380065234 A CN201380065234 A CN 201380065234A CN 104871565 B CN104871565 B CN 104871565B
Authority
CN
China
Prior art keywords
signal
pseudo
explanation
cheer
centrally oriented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201380065234.8A
Other languages
English (en)
Other versions
CN104871565A (zh
Inventor
野口雅义
高桥直也
藤原真志
白石吾朗
藤下金章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN104871565A publication Critical patent/CN104871565A/zh
Application granted granted Critical
Publication of CN104871565B publication Critical patent/CN104871565B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/12Arrangements for producing a reverberation or echo sound using electronic time-delay networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本技术涉及能够获得具有较强现场感的音频的音频处理装置、方法及程序。解说消除部从作为立体声信号的输入信号中去除解说,添加伪欢呼成分,并且由此生成解说消除信号。在去除解说时生成下述信号:单声道的并且已经去除了解说的中央定向去除信号;以及解说被抑制并且具有立体声现场感的立体声中央抑制信号。通过将中央定向去除信号、立体声中央抑制信号以及伪欢呼信号相加,去除了解说,并且生成了具有现场感的解说消除信号。体育场混响添加部向解说消除信号添加混响。本技术可以应用于体育场效果生成装置。

Description

音频处理装置和方法
技术领域
本技术涉及音频处理装置、方法及程序,并且更具体地,涉及能够获得具有较强现场感(sense of presence)的音频的音频处理装置、方法及程序。
背景技术
迄今为止,已知的技术是通过对体育(如足球和棒球)广播的内容的音频信号执行音频处理来生成具有较强现场感的音频。例如,关于上述技术,提出了能够通过允许用户设置音频的展宽感和距离感来调整音频的现场感的技术(例如参见专利文献1)。
引用列表
专利文献
专利文献1:JP4602204B
发明内容
技术问题
然而,在上述技术中,在对音频信号执行改进现场感的处理的情况下,当播音员和评论员的语音在体育广播期间偏大时,语音变得越发刺耳,并且不能充分地获得现场感。
鉴于上述情况,提出本技术,并且本技术能够获得具有较强现场感的音频。
问题的解决方案
根据本技术的一方面,提供了一种音频处理装置,包括:解说消除部,其被配置成通过从输入信号中去除解说成分来生成解说消除信号;以及混响添加部,其被配置成向解说消除信号添加混响效果,其中,解说消除部可以通过对具有多个声道的输入信号中包括的中央定向成分进行抑制来生成具有多个声道的中央抑制信号,解说消除部可以基于具有多个声道的输入信号来生成已经去除中央定向成分的单声道中央定向去除信号,并且解说消除部可以通过将中央抑制信号和中央定向去除信号相加在一起以作为解说消除信号。
解说消除部可以生成包括伪欢呼成分的解说消除信号。
解说消除部还可以生成作为伪欢呼成分的伪欢呼信号,并且通过将中央抑制信号、中央定向去除信号以及伪欢呼信号相加在一起以作为解说消除信号。
解说消除部可以基于输入信号的水平与中央定向去除信号的水平之间的比较结果来执行伪欢呼信号的水平调整。
输入信号可以是体育相关内容的音频信号。
解说消除部可以基于输入信号来检测得分场景,并且基于对得分场景的检测结果来执行伪欢呼信号的水平调整。
解说消除部可以基于输入信号来检测非欢呼场景,并且基于对非欢呼场景的检测结果来执行伪欢呼信号的水平调整。
根据本技术的另一方面,提供了一种用于使计算机执行处理的程序,所述处理包括:通过从输入信号中去除解说成分来生成解说消除信号,以及向解说消除信号添加混响效果。
根据本技术的另一方面,提供了一种音频处理方法,包括下述步骤:通过从输入信号中去除解说成分来生成解说消除信号,以及向解说消除信号添加混响效果,其中,生成解说消除信号的步骤包括:通过对具有多个声道的输入信号中包括的中央定向成分进行抑制来生成具有多个声道的中央抑制信号,基于具有多个声道的输入信号来生成已经去除中央定向成分的单声道中央定向去除信号,以及通过将中央抑制信号和中央定向去除信号相加在一起来作为解说消除信号。
本发明的有益效果
根据本技术的一方面,可以获得具有较强现场感的音频。
附图说明
[图1]图1是示出体育场效果生成装置的示例性配置的图示。
[图2]图2是示出解说消除部的示例性配置的图示。
[图3]图3是示出立体声中央抑制部的示例性配置的图示。
[图4]图4示出中央定向信号去除部的示例性配置的图示。
[图5]图5是示出降噪部的示例性配置的图示。
[图6]图6是示出进球场景检测部的示例性配置的图示。
[图7]图7是示出欢呼检测部的示例性配置的图示。
[图8]图8是示出伪欢呼生成部的示例性配置的图示。
[图9]图9是示出伪欢呼水平控制器的示例性配置的图示。
[图10]图10是用来描述体育场效果生成处理的流程图。
[图11]图11是用来描述降噪的图示。
[图12]图12是用来描述滤波特性和音调控制的图示。
[图13]图13是用来描述伪欢呼量的确定的图示。
[图14]图14是示出伪欢呼水平控制器的另一示例性配置的图示。
[图15]图15是用来示出体育场效果生成装置的另一示例性配置的图示。
[图16]图16是示出计算机的示例性配置的图示。
具体实施方式
在下文中,将参照附图描述应用本技术的实施方式。
<第一实施方式>
<体育场效果生成装置的示例性配置>
本技术从诸如体育广播的内容的音频信号中去除播音员和评论员的音频,换言之,去除解说音频,并且还向已去除解说的音频信号添加混响(reverberation),以获得具有较强现场感的音频。
应注意,要成为处理对象的内容可以是包括解说的任何内容;然而,在下文中,在将足球广播节目作为处理对象的内容的示例的情况下继续描述。
图1是示出应用本技术的体育场效果生成装置的实施方式的示例性配置的图示。
作为处理对象的内容的足球广播节目的音频信号被供应给体育场效果生成装置11作为输入信号。例如,输入信号是配置有R声道音频信号和L声道音频信号的双声道立体声信号。
在下文中,将在输入信号是L和R双声道立体声信号的情况下继续描述;然而,输入信号可以是单声道信号或者可以是具有三个或更多个声道的多声道信号。此外,在下文中,配置输入信号的R声道音频信号或L声道音频信号还可以被称为R声道输入信号或L声道输入信号。
通过从所供应的输入信号中去除解说并且向已去除解说的信号添加体育场(其是足球比赛场地)的混响,体育场效果生成装置11对输入信号生成体育场效果。因此,从体育场效果生成装置11输出的音频信号变成能够使听者具有仿佛置身于体育场的现场感的音频信号。
体育场效果生成装置11包括解说消除部21、控制器22、选择器23、体育场混响添加部24以及相加部25。
通过从所供应的输入信号中去除解说并且通过向输入信号添加伪欢呼(pseudo-cheer)成分(其是伪欢呼),解说消除部21生成解说消除信号。解说消除信号是主要配置有诸如在从原始音频中去除解说之后留下的观众欢呼的成分以及添加的伪欢呼成分的立体声信号。
解说消除部21向选择器23和体育场混响添加部24供应根据输入信号获得的解说消除信号。
例如,根据用户的输入操作等,控制器22对选择器23的音频信号的输出进行控制。在控制器22的控制下,选择器23向相加部25供应所供应的输入信号和解说消除部21供应的解说消除信号中的任一个。
体育场混响添加部24通过使用滤波器等对解说消除部21供应的解说消除信号执行声学处理,来向解说消除信号的音频添加体育场的混响效果。应注意,对于每个体育场,实现混响效果的滤波器的特性等可以是不同的。
体育场混响添加部24向相加部25和随后的扬声器等中的每一个输出通过向解说消除信号添加混响而获取的前方信号和后方信号。
应注意,前方信号是音频的再现位置(即源位置)处于听者前方的音频信号,而后方信号是音频的再现位置处于听者后方的音频信号。此外,前方信号和后方信号还配置有两个信号,即,R声道和L声道。
相加部25将选择器23供应的输入信号或解说消除信号与体育场混响添加部24供应的前方信号相加,以构成最终的前方信号,并且将最终的前方信号输出给随后的扬声器等。
应注意,文中虽然描述了将通过相加部25中的相加处理获取的信号设定为最终的前方信号的示例,但是在体育场混响添加部24中获取的前方信号也可以被设定为最终的前方信号,并且可以直接从体育场混响添加部24中输出。
<解说消除部的示例性配置>
此外,更详细地,以图2中所示的方式配置图1中的解说消除部21。
解说消除部21包括立体声中央抑制部41、中央定向信号去除部42、降噪部43、相加部44、进球场景(goal scene)检测部45、欢呼检测部46、伪欢呼生成部47以及相加部48。
立体声中央抑制部41对供应的输入信号的R声道和L声道的中央定向成分进行抑制,以生成立体声中央抑制信号,并且将立体声中央抑制信号供应给相加部44。
在立体声中央抑制部41中,输入信号的中央定向成分(即相对于听者来说定向在中央的音频成分)被确定为解说成分,通过对R声道和L声道中的每个声道的输入信号的中央定向成分进行抑制而获取的立体声信号被确定为立体声中央抑制信号。以上述方式获取的立体声中央抑制信号不是完全去除了解说成分的信号;然而,由于立体声中央抑制信号是双声道立体声信号,所以立体声中央抑制信号是具有现场感的音频信号。
基于供应的输入信号,中央定向信号去除部42生成已去除中央定向成分的单声道信号作为中央定向去除信号,并且将中央定向去除信号供应给降噪部43和伪欢呼生成部47。由于以上述方式获取的中央定向去除信号是单声道信号,所以中央定向去除信号不是可以充分地获得现场感的信号;然而,该中央定向去除信号是已充分去除了解说成分的信号。
降噪部43从中央定向信号去除部42供应的中央定向去除信号中去除噪声成分,并且将所得到的信号供应给相加部44。例如,存在着特别地在中央定向去除信号的高范围中包括噪声的情况;因此,降噪部43去除中央定向去除信号的高范围噪声。
相加部44将来自立体声中央抑制部41的立体声中央抑制信号和来自降噪部43的中央定向去除信号相加,并且将所得到的信号供应给相加部48。
进球场景检测部45根据供应的输入信号对足球比赛期间的进球场景(即得分场景)进行检测,并且将指示检测结果的进球场景检测信号供应给伪欢呼生成部47。
应注意,虽然特别地以下述示例给出了描述:在该示例中将进球场景检测作为解说成分的音量变得相对大的内容的独特场景,但是并不限于进球场景,可以对其他场景进行检测。
基于供应的输入信号,欢呼检测部46对发生欢呼的场景(在下文中还被称为欢呼场景)进行检测,并且将指示检测结果的欢呼检测信号供应给伪欢呼生成部47。
伪欢呼生成部47基于所供应的输入信号、来自中央定向信号去除部42的中央定向去除信号、来自进球场景检测部45的进球场景检测信号以及来自欢呼检测部46的欢呼检测信号,来生成伪欢呼信号(其是伪欢呼成分),并且将伪欢呼信号供应给相加部48。
相加部48将从相加部44供应的信号和从伪欢呼生成部47供应的伪欢呼信号相加以生成解说消除信号,并且将解说消除信号供应给选择器23和体育场混响添加部24。
<立体声中央抑制部的示例性配置>
将在下面详细描述构成图2中的解说消除部21的立体声中央抑制部41、中央定向信号去除部42、降噪部43、进球场景检测部45、欢呼检测部46以及伪欢呼生成部47的示例性配置。
例如,更详细地,以图3中所示的方式配置立体声中央抑制部41。
在图3中,立体声中央抑制部41包括中央定向信号检测部71、相减部72、放大部73、相减部74以及放大部75。
基于供应的L声道输入信号和R声道输入信号,中央定向信号检测部71对输入信号的中央定向成分进行检测,并且将检测到的信号供应给相减部72和相减部74。
相减部72从供应的L声道输入信号中减去由中央定向信号检测部71供应的中央定向成分,并且将所获取的信号供应给放大部73作为立体声中央抑制信号的L声道信号。应注意,立体声中央抑制信号的L声道信号还被称为L声道立体声中央抑制信号。
放大部73对相减部72供应的L声道立体声中央抑制信号进行放大,并且将放大的信号供应给相加部44。
相减部74从供应的R声道输入信号中减去由中央定向信号检测部71供应的中央定向成分,并且将所获取的信号供应给放大部75作为立体声中央抑制信号的R声道信号。应注意,立体声中央抑制信号的R声道信号还被称为R声道立体声中央抑制信号。
放大部75对相减部74供应的R声道立体声中央抑制信号进行放大,并且将放大的信号供应给相加部44。
<中央定向信号去除部的示例性配置>
此外,例如,以图4中所示的方式配置中央定向信号去除部42。
中央定向信号去除部42包括相减部101。相减部101从供应的L声道输入信号中减去供应的R声道输入信号,并且将所得到的中央定向去除信号供应给降噪部43和伪欢呼生成部47。
<降噪部的示例性配置>
此外,例如,以图5中所示的方式配置降噪部43。
降噪部43包括高范围成分集中区段检测部131、滤波处理部132、逆滤波处理部133、延迟部134以及内插处理部135。
基于相减部101供应的中央定向去除信号,高范围成分集中区段检测部131对能量集中在中央定向去除信号的高范围中的区段(在下文中称为高范围成分集中区段)进行检测。此外,高范围成分集中区段检测部131将指示检测结果的高范围成分集中区段检测信号供应给滤波处理部132和内插处理部135。
基于高范围成分集中区段检测部131供应的高范围成分集中区段检测信号,滤波处理部132对相减部101供应的中央定向去除信号执行滤波处理,并且将所得到的信号供应给内插处理部135。在滤波处理部132中,中央定向去除信号在高范围成分集中区段中的高范围成分被确定为噪声成分,并且中央定向去除信号在高范围成分集中区段中的高范围成分通过滤波处理被抑制。
逆滤波处理部133使用以下滤波器(在下文中称为逆滤波器)对相减部101供应的中央定向去除信号执行滤波处理:该逆滤波器相对于滤波处理部132中包括的滤波器具有相反的特性,并且逆滤波处理部133将所得到的信号供应给延迟部134。在使用逆滤波器的滤波处理的情况下,中央定向去除信号的低范围成分被去除,以使得仅高范围成分被提取。
延迟部134将逆滤波处理部133供应的音频信号延迟预定时间,并且将音频信号供应给内插处理部135。
基于来自高范围成分集中区段检测部131的高范围成分集中区段检测信号和来自延迟部134的音频信号,内插处理部135对滤波处理部132供应的音频信号执行内插处理,并且将所得到的音频信号供应给相加部44。在内插处理中,已从中央定向去除信号中去除的高范围成分被内插,并且因此,获取已降噪的中央定向去除信号。
应注意,当在降噪部43中降低中央定向去除信号的噪声时,可以使用输入信号。
<进球场景检测部的示例性配置>
此外,例如,以图6中所示的方式配置进球场景检测部45。
在图6中,进球场景检测部45包括相加部161、频谱分析部162、特征量提取部163以及确定部164。
相加部161将供应的L声道输入信号和供应的R声道输入信号相加,并且将所得到的信号供应给频谱分析部162。频谱分析部162对相加部161供应的、并且已对其执行了相加的输入信号执行频谱分析,并且将所得到的频谱供应给特征量提取部163。例如,通过使用带通滤波器(BPF)的滤波处理、通过快速傅立叶变换(FFT)等来执行频谱分析。
特征量提取部163从频谱分析部162供应的频谱中提取特征量,并且将特征量供应给确定部164。
确定部164通过基于特征量提取部163供应的特征量执行线性识别等来从输入信号中检测进球场景。确定部164将指示进球场景的检测结果的进球场景检测信号供应给伪欢呼生成部47。
<欢呼检测部的示例性配置>
此外,例如,以图7中所示的方式配置欢呼检测部46。
在图7中,欢呼检测部46包括频谱分析部191、特征量提取部192以及确定部193。
频谱分析部191对供应的输入信号中的L声道输入信号执行频谱分析,并且将所得到的频谱供应给特征量提取部192。例如,通过使用BPF的滤波处理、通过FFT等来执行频谱分析。
应注意,文中虽然描述了对L声道输入信号执行频谱分析的示例,但是还可以对R声道输入信号执行频谱分析。此外,可以对通过从L声道输入信号中减去R声道输入信号而获取的信号执行频谱分析。
特征量提取部192从频谱分析部191供应的频谱中提取特征量,并且将特征量供应给确定部193。
确定部193通过基于特征量提取部192供应的特征量执行线性识别等来从输入信号中检测欢呼场景,并且将指示检测结果的欢呼检测信号供应给伪欢呼生成部47。
<伪欢呼生成部的示例性配置>
此外,例如,以图8中所示的方式配置图2中的伪欢呼生成部47。
图8中所示的伪欢呼生成部47包括相加部221、滤波处理部222、水平检测部223、低通滤波器(LPF)224、水平检测部225、水平检测部226、LPF 227、水平检测部228、音调控制器229、伪欢呼水平控制器230、随机噪声生成部231、滤波处理部232、放大部233、滤波处理部234、放大部235以及相加部236。
相加部221将供应的L声道输入信号和供应的R声道输入信号相加,并且将所得到的信号供应给滤波处理部222和LPF 224。
滤波处理部222使用滤波器对相加部221供应的输入信号执行滤波处理,以用于去除人的语音,更具体地,去除解说,并且将所得到的信号供应给水平检测部223。
例如,滤波处理部222使用的滤波器是去除输入信号的中间范围成分的BPF,或者是去除人的语音频段的高通滤波器(HPF)。
水平检测部223对滤波处理部222供应的信号的水平(在下文中还被称为检测水平A1)进行检测,并且将检测结果供应给音调控制器229和伪欢呼水平控制器230。在水平检测部223中获取的检测水平A1是与输入信号的中间范围至高范围成分相关联的水平。
LPF 224使用LPF对相加部221供应的输入信号执行滤波处理,并且将所得到的信号供应给水平检测部225。水平检测部225对LPF 224供应的信号的水平(在下文中还被称为检测水平A2)进行检测,并且将检测结果供应给伪欢呼水平控制器230。在水平检测部225中获取的检测水平A2是与输入信号的低范围成分相关联的水平。
水平检测部226对由中央定向信号去除部42中的相减部101供应的中央定向去除信号的水平(在下文中还被称为检测水平B1)进行检测,并且将检测结果供应给伪欢呼水平控制器230。
LPF 227使用LPF对相减部101供应的中央定向去除信号执行滤波处理,并且将所得到的信号供应给水平检测部228。水平检测部228对LPF 227供应的信号的水平(在下文中还被称为检测水平B2)进行检测,并且将检测结果供应给伪欢呼水平控制器230。在水平检测部228中获取的检测水平B2是与中央定向去除信号的低范围成分相关联的水平。
基于来自水平检测部223的检测水平A1和来自进球场景检测部45中的确定部164的进球场景检测信号,音调控制器229控制滤波处理部234的滤波处理。
基于来自水平检测部223的检测水平A1、来自水平检测部226的检测水平B1、来自确定部164的进球场景检测信号、以及来自欢呼检测部46中的确定部193的欢呼检测信号,伪欢呼水平控制器230控制放大部235的放大处理。
此外,基于来自水平检测部225的检测水平A2、来自水平检测部228的检测水平B2、来自确定部164的进球场景检测信号、以及来自确定部193的欢呼检测信号,伪欢呼水平控制器230控制放大部233的放大处理。
随机噪声生成部231生成配置有随机噪声成分的随机噪声信号,并且将随机噪声信号供应给滤波处理部232和滤波处理部234。
滤波处理部232通过使用滤波器(如LPF)对随机噪声生成部231供应的随机噪声信号执行滤波处理来生成伪欢呼信号,并且将伪欢呼信号供应给放大部233。例如,在滤波处理部232中获取的伪欢呼信号是下述音频信号:该音频信号仅包括具有低频率的低范围成分,例如与作为比赛场地的体育场中发出的大地隆隆声相近的声音。
在伪欢呼水平控制器230的控制下,放大部233对滤波处理部232供应的伪欢呼信号进行放大,并且将所得到的信号供应给相加部236。
在音调控制器229的控制下,滤波处理部234改变滤波器,并且使用滤波器对随机噪声生成部231供应的随机噪声信号执行滤波处理,以生成伪欢呼信号,并且将伪欢呼信号供应给放大部235。
例如,通过改变滤波器,滤波处理部234对所生成的伪欢呼信号的音调进行控制。在滤波处理部234中获取的伪欢呼信号是下述音频信号:该音频信号仅包括具有相对较高频率的高范围至中范围成分,例如体育场中发出的观众欢呼。
在伪欢呼水平控制器230的控制下,放大部235对滤波处理部234供应的伪欢呼信号进行放大,并且将所得到的信号供应给相加部236。
相加部236将放大部233供应的伪欢呼信号和放大部235供应的伪欢呼信号相加,并且将所得到的最终的伪欢呼信号供应给解说消除部21中的相加部48。
<伪欢呼水平控制器的示例性配置>
此外,更详细地,例如,以图9中所示的方式配置图8中的伪欢呼水平控制器230。
在图9中,伪欢呼水平控制器230包括进球场景检测区段控制器261、非欢呼检测部262、非欢呼检测区段控制器263、伪欢呼量检测部264、进球场景检测区段控制器265、非欢呼检测区段控制器266以及伪欢呼量检测部267。
基于来自确定部164的进球场景检测信号,进球场景检测区段控制器261对来自水平检测部223的检测水平A1进行水平调整,并且将所得到的检测水平A1供应给非欢呼检测区段控制器263。
基于确定部193供应的欢呼检测信号,非欢呼检测部262将不是欢呼场景的区段检测为非欢呼场景(非欢呼区段),并且将检测结果供应给非欢呼检测区段控制器263和非欢呼检测区段控制器266。
例如,非欢呼检测部262配置有反相器(inverter),并且通过对欢呼检测信号进行反相来生成指示非欢呼场景的非欢呼检测信号。
基于来自非欢呼检测部262的非欢呼检测信号,非欢呼检测区段控制器263对进球场景检测区段控制器261供应的检测水平A1进行水平调整,并且将所得到的检测水平A1供应给伪欢呼量检测部264。
伪欢呼量检测部264通过比较非欢呼检测区段控制器263供应的检测水平A1和水平检测部226供应的检测水平B1来确定伪欢呼量,并且基于伪欢呼量来控制放大部235,该伪欢呼量是伪欢呼信号的放大量。
基于来自确定部164的进球场景检测信号,进球场景检测区段控制器265对来自水平检测部225的检测水平A2进行水平调整,并且将所得到的检测水平A2供应给非欢呼检测区段控制器266。
基于来自非欢呼检测部262的非欢呼检测信号,非欢呼检测区段控制器266对进球场景检测区段控制器265供应的检测水平A2进行水平调整,并且将所得到的检测水平A2供应给伪欢呼量检测部267。
伪欢呼量检测部267通过比较非欢呼检测区段控制器266供应的检测水平A2和水平检测部228供应的检测水平B2来确定伪欢呼量,并且基于伪欢呼量来控制放大部233,该伪欢呼量是伪欢呼信号的放大量。
<体育场效果生成处理的描述>
附带地,当将输入信号供应给体育场效果生成装置11并且发出向输入信号添加体育场效果的命令时,体育场效果生成装置11执行体育场效果生成处理,并且输出前方信号和后方信号。
在下文中,将参照图10中的流程图来描述由体育场效果生成装置11执行的体育场效果生成处理。
在步骤S11中,立体声中央抑制部41基于供应的输入信号生成立体声中央抑制信号。
例如,中央定向信号检测部71将L声道输入信号的水平和相位与R声道输入信号的水平和相位进行比较,并且在声道的输入信号的水平和相位是相同的情况下,中央定向信号检测部71确定中央定向成分包括在输入信号中。然后,中央定向信号检测部71提取L声道输入信号和R声道输入信号中的共同成分作为中央定向成分,并且将中央定向成分供应给相减部72和相减部74。
相减部72和相减部74从供应的L声道输入信号和供应的R声道输入信号中减去来自中央定向信号检测部71的中央定向成分,并且将所得到的立体声中央抑制信号供应给放大部73和放大部75。
放大部73和放大部75对相减部72和相减部74供应的L声道立体声中央抑制信号和R声道立体声中央抑制信号进行水平调整,并且将所得到的信号供应给相加部44。执行上述的水平调整以使得立体声中央抑制信号的水平变成相对于中央定向去除信号的水平是适当的。
在步骤S12中,中央定向信号去除部42基于供应的输入信号生成中央定向去除信号。换言之,相减部101从L声道输入信号中减去R声道输入信号以生成中央定向去除信号,并且将中央定向去除信号供应给降噪部43和伪欢呼生成部47。
在步骤S13中,降噪部43对相减部101供应的中央定向去除信号执行降噪处理,并且将所得到的中央定向去除信号供应给相加部44。
例如,如图11中的箭头A11所指示的,假设噪声包括在中央定向去除信号的部分区段中的高范围成分中。
应注意,在图11中,箭头A11至箭头A16分别指示中央定向去除信号、高范围成分集中区段检测信号、滤波处理部132的输出、逆滤波处理部133的输出、延迟部134的输出以及已执行降噪的中央定向去除信号。此外,在由箭头A11和箭头A13至A16所指示的每个信号中,水平方向指示时间,竖直方向指示频率。此外,由箭头A11和箭头A13至A16所指示的每个信号的区域中的明暗指示在每个时刻的频率功率。区域的功率随着区域密度的增大而增大。
在图11的示例中,在由箭头A11所指示的中央定向去除信号中,由箭头Q11和箭头Q12指示的区域的功率大于其他区域的功率。
例如,通过参照由箭头A11所指示的中央定向去除信号的各频率的功率,高范围成分集中区段检测部131将包括有中央定向去除信号中的箭头Q11和箭头Q12所指示的区域的区段检测为高范围成分集中区段。然后,高范围成分集中区段检测部131将由箭头A12所指示的高范围成分集中区段检测信号作为检测结果供应给滤波处理部132和内插处理部135。
在箭头A12所指示的高范围成分集中区段检测信号中,在附图中在竖直方向上所示的信号的水平被形成为在包括有箭头Q11和箭头Q12所指示的区域的区段中向上突出,并且因此指示该区段是高范围成分集中区段。
应注意,在上述示例中,在高范围成分集中区段检测信号指示每个区段是否是高范围成分集中区段时,高范围成分集中区段检测信号可以是下述值:该值指示每个区段是高范围成分集中区段的可能性程度。
此外,在高范围成分集中区段检测部131供应的高范围成分集中区段检测信号所指示的高范围成分集中区段中,滤波处理部132使用保留在其中的滤波器对来自相减部101的中央定向去除信号执行滤波处理。
通过上述处理,如箭头A13所指示的,中央定向去除信号在高范围成分集中区段中的高范围成分被抑制。换言之,噪声降低。
以上述方式获取的中央定向去除信号被从滤波处理部132供应给内插处理部135。应注意,虽然由箭头A13指示的中央定向去除信号是已降噪的信号,但是不利的是,高范围成分集中区段中的高范围成分的功率变低。因此,对箭头A13所示的中央定向去除信号执行内插处理。
换言之,逆滤波处理部133使用保留在其中的逆滤波器对相减部101供应的中央定向去除信号执行滤波处理,并且将所得到的信号供应给延迟部134。如箭头A14所示,通过使用逆滤波器的滤波处理,中央定向去除信号在每个时刻的低范围成分被去除,使得仅提取高范围成分。
然后,当延迟部134将逆滤波处理部133供应的信号延迟预定时间,并且将信号供应给内插处理部135时,如箭头A15所指示的,获得了下述信号:在该信号中能量集中的高范围部分的区域沿时间方向移位。在以上述方式获取的信号中,由高范围成分集中区段检测信号指示的高范围成分集中区段的高范围区域不是能量集中的区域。换言之,该区域是不包括噪声的信号成分。
然后,内插处理部135通过将来自延迟部134的信号中的高范围成分集中区段的高范围部分的区域添加至由滤波处理部132供应的信号中的高范围成分集中区段检测信号所指示的高范围成分集中区段的高范围部分的区域来执行内插。
通过上述处理,例如,获得由箭头A16指示的信号作为已降噪的中央定向去除信号。内插处理部135将通过内插处理获取的中央定向去除信号供应给相加部44。
相加部44将来自内插处理部135的中央定向去除信号与来自放大部73的L声道立体声中央抑制信号和来自放大部75的R声道立体声中央抑制信号中的每一个相加,并且将所得到的信号供应给相加部48。通过上述处理,已经去除了输入信号的解说的、配置有L声道和R声道的立体声信号被供应给相加部48。
如上所述,通过将尽管没有完全去除解说成分但是具有现场感的立体声中央抑制信号和尽管没有现场感但是已去除了解说的中央定向去除信号相加,可以获取实际上已去除了解说并且具有现场感的信号。
返回到描述图10的流程图,在步骤S14中,基于供应的输入信号,进球场景检测部45对进球场景进行检测。例如,通过从输入信号中对单词“球进了”进行检测来检测进球场景,该单词“球进了”被包括作为解说并且由评论员等发出。
特别地,相加部161将供应的L声道输入信号和供应的R声道输入信号相加,并且将所得到的信号供应给频谱分析部162。通过将L声道输入信号和R声道输入信号相加,中央定向成分变大,换言之,解说成分变大,并且包括在输入信号中作为解说的期望单词的检测准确度可以提高。
此外,频谱分析部162对来自相加部161的输入信号执行频谱分析,并且将所获取的频谱供应给特征量提取部163。
基于频谱分析部162供应的频谱,特征量提取部163对指示频谱形状的变化量和频谱峰值的程度的特征量进行计算,并且将特征量供应给确定部164。
例如,频谱形状在正常解说中急剧变化;然而,当单词“球进了”被包括作为解说时,频谱形状不大改变。此外,当单词“球进了”被包括作为解说时,在频谱中,在单词的说话者所独有的频率中出现尖峰。
鉴于此,进球场景检测部45将频谱形状的变化量和频谱峰值的程度计算作为特征量,并且基于特征量从输入信号检测进球场景。换言之,计算作为进球场景的可能性。
特别地,基于来自特征量提取部163的特征量,确定部164执行线性识别等以检测进球场景,并且将指示检测结果的进球场景检测信号供应给伪欢呼生成部47。
应注意,进球场景检测信号可以是指示是否存在进球场景的可能性的信号;然而,进球场景检测信号可以是指示进球场景的可能性程度的多值信号。
在步骤S15中,欢呼检测部46根据所供应的输入信号对欢呼进行检测。
换言之,频谱分析部191对供应的L声道输入信号执行频谱分析,并且将所得到的频谱供应给特征量提取部192。特征量提取部192从频谱分析部191供应的频谱中提取特征量,并且将特征量供应给确定部193。
例如,将低范围水平相对于整个输入信号的频带水平的比率、高范围水平相对于整个输入信号的频带水平的比率、欢呼频带水平相对于整个输入信号的频带水平的比率、以及峰值在频谱中上升的方式计算作为特征量。
应注意,被计算作为特征量的低范围水平相对于整个频带水平的比率、高范围水平相对于整个频带水平的比率、以及欢呼频带水平相对于整个频带水平的比率中的每一个被用于指定输入信号的频谱形状是否具有欢呼所独有的频谱形状。
例如,当低范围水平和高范围水平相对于整个频带水平较大时,有很大的可能性是基于输入信号的音频是不同于人的欢呼的、具有大声音的音频,如音乐;因此,在这种情况下,输入信号被确定为不具备欢呼场景的可能性。
此外,当欢呼频带水平相对于整个频带水平较大时,有很大的可能性是欢呼包括在基于输入信号的音频中;因此,在这种情况下,输入信号被确定为具有欢呼场景的可能性。然而,当解说包括在输入信号中时,尖峰出现在与解说有关的频率的位置处;因此,在频谱中,将出现尖峰的频率成分排除在欢呼频带水平的计算之外。
此外,出现欢呼的场景的频谱是具有平滑形状而没有任何尖峰的频谱。相反地,在播放音乐如商业消息(CM)的场景中,尖峰出现在频谱中。因此,在计算作为特征量的峰值上升的方式中,当发现多个尖峰出现在频谱中时,确定输入信号不具有欢呼场景的可能性。
确定部193通过基于特征量提取部192供应的特征量执行线性识别等,从输入信号中检测欢呼场景,并且将指示检测结果的欢呼检测信号供应给伪欢呼生成部47。
应注意,在进球场景中,由解说引起的尖峰出现在频谱中,并且在这种场景中,根据被计算作为特征量的峰值上升的方式,换言之,根据峰值的程度,欢呼的可能性程度不利地下降。
因此,确定部193可以通过接收进球场景检测信号并且通过考虑进球场景的检测结果来执行欢呼场景的可能性的辨别。在这种情况下,例如,当欢呼场景的可能性随时间下降并且当确定是进球场景时,防止欢呼场景的可能性下降。
此外,虽然欢呼检测信号可以是指示是否存在欢呼场景的可能性的信号,但是欢呼检测信号可以是指示欢呼场景的可能性程度的多值信号。
在步骤S16中,伪欢呼生成部47对输入信号的水平进行检测。
特别地,相加部221将供应的L声道输入信号和供应的R声道输入信号相加,并且将所得到的信号供应给滤波处理部222和LPF 224。
滤波处理部222对相加部221供应的输入信号执行滤波处理,并且将已去除了解说的输入信号供应给水平检测部223。根据滤波处理部222供应的信号的绝对值的包络,水平检测部223计算检测水平A1,并且将检测水平A1供应给音调控制器229和伪欢呼水平控制器230。
此外,LPF 224使用LPF对相加部221供应的输入信号执行滤波处理,并且将所得到的信号供应给水平检测部225。根据LPF 224供应的信号的绝对值的包络,水平检测部225计算检测水平A2,并且将检测水平A2供应给伪欢呼水平控制器230。
在步骤S17中,伪欢呼生成部47对中央定向去除信号的水平进行检测。
换言之,根据相减部101供应的中央定向去除信号的绝对值的包络,水平检测部226计算检测水平B1,并且将检测水平B1供应给伪欢呼水平控制器230。
此外,LPF 227使用LPF对相减部101供应的中央定向去除信号执行滤波处理,并且将所得到的信号供应给水平检测部228。根据由LPF 227供应的信号的绝对值的包络,水平检测部228计算检测水平B2,并且将检测水平B2供应给伪欢呼水平控制器230。
在步骤S18中,音调控制器229基于来自水平检测部223的检测水平A1和来自确定部164的进球场景检测信号来执行伪欢呼信号的音调控制。
例如,当检测水平A1逐渐增大时,确定在比赛场地中兴奋感增加的音调控制器229提高音调,相反地,当检测水平A1逐渐减小时,音调控制器229降低音调。此外,当进球场景检测信号指示是进球场景时,音调控制器229进一步提高音调。
特别地,通过音调控制器229对滤波处理部234进行控制来实现上述对伪欢呼信号的音调的控制,从而改变在滤波处理部234执行的滤波处理中使用的滤波器的特性。
例如,在生成仅由低范围成分形成的伪欢呼信号的滤波处理部232中,使用具有图12中折线C11所示的特性的滤波器。相反地,在生成仅由中间范围至高范围成分形成的伪欢呼信号的滤波处理部234中,如箭头Q31所示,由折线C12所示的滤波器特性根据音调控制器229的控制而变化。
应注意,在图12中,横坐标的轴线指示频率,纵坐标的轴线指示滤波器在各频率下的输出水平。
在上述示例中,由折线C12指示的滤波器特性的波形沿频率方向移位,并且根据该移位,伪欢呼信号的音调变化。相比于具有折线C11所指示的特性的滤波器,具有折线C12所指示的特性的滤波器具有下述特性:使具有较高频带的成分通过。
在音调控制器229的控制下,滤波处理部234确定在滤波处理中使用的滤波器的特性。
应注意,由音调控制器229执行的对伪欢呼信号的音调控制不限于上述示例,并且可以是任何类型的控制。
在步骤S19中,伪欢呼水平控制器230基于来自水平检测部223的检测水平A1、来自水平检测部225的检测水平A2、来自水平检测部226的检测水平B1、来自水平检测部228的检测水平B2、来自确定部164的进球场景检测信号、以及来自确定部193的欢呼检测信号来检测伪欢呼量。
特别地,进球场景检测区段控制器261对检测水平A1执行水平调整,以使得检测水平A1的水平在进球场景检测信号所指示的进球场景中变得高出固定值,并且将所得到的检测水平A1供应给非欢呼检测区段控制器263。
例如,如图13的上方所示,进球场景检测区段控制器261将折线C21所指示的控制信号水平与检测水平A1相加。应注意,在图13的上方,纵坐标的轴线指示控制信号水平,横坐标的轴线指示时间。
在上述示例中,在进球场景的区段T11中,由折线C21指示的控制信号水平的值比其他区段的控制信号水平的值高出固定值。因此,针对进球场景执行检测水平A1的水平调整,以使得检测水平A1的水平变得高出固定值。
此外,文中描述了检测水平A1的水平被设置成高出固定值的示例;然而,当进球场景检测信号表示用于指示进球场景的可能性的值时,检测水平A1的值可以根据用于指示进球场景的可能性的值而连续增大。换言之,根据用于指示进球场景的可能性的值,检测水平A1的增加值可以不同。
此外,非欢呼检测部262通过对欢呼检测信号进行反相来生成非欢呼检测信号,并且将所得到的信号供应给非欢呼检测区段控制器263和非欢呼检测区段控制器266。
非欢呼检测区段控制器263对由非欢呼检测信号指示的非欢呼场景的检测水平A1执行水平调整,以使得来自进球场景检测区段控制器261的检测水平A1的水平变得低出固定值,并且将所得到的检测水平A1供应给伪欢呼量检测部264。
例如如图13的中部所示,非欢呼检测区段控制器263将折线C22指示的控制信号水平添加至检测水平A1。应注意,在图13的中部,纵坐标的轴线指示控制信号水平,横坐标的轴线指示时间。
在上述示例中,在非欢呼场景的区段T12中,由折线C22指示的控制信号水平的值比其他区段的控制信号水平的值低出固定值。因此,针对非欢呼场景执行检测水平A1的水平调整,以使得检测水平A1的水平变得低出固定值。
应注意,在非欢呼场景中,伪欢呼成分可以不包括在解说消除信号中。此外,文中描述了检测水平A1的水平被设置成低出固定值的示例;然而,当非欢呼检测信号表示用于指示非欢呼场景的可能性的值时,检测水平A1的值可以根据用于指示非欢呼场景的可能性的值而连续减小。
此外,基于来自非欢呼检测区段控制器263的检测水平A1与来自水平检测部226的检测水平B1之间的差,伪欢呼量检测部264确定伪欢呼量,并且基于伪欢呼量对放大部235进行控制。
例如,如图13中的下方的斜线所示,当折线C24所指示的检测水平B1低于直线C23所指示的检测水平A1时,伪欢呼量被设置成大出检测水平A1与检测水平B1之间的差值。应注意,在图13中的下方,横坐标的轴线指示时间,纵坐标的轴线指示检测水平。
一般来说,当播音员等的解说的语音在进球场景处变大时,欢呼的音量变得相对小。在这种情况下,当从音频信号中去除解说成分时,存在进球场景缺乏兴奋感的情况。
因此,当中央定向去除信号的检测水平B1低于原始输入信号的检测水平A1时,伪欢呼量检测部264通过使伪欢呼量增加检测水平B1与检测水平A1之间的差值来增大伪欢呼信号的水平。通过上述处理,例如,解说消除信号的水平变得达到大约原始输入信号的水平,以使得在兴奋的场景如进球场景中,可以通过足够大的欢呼音量来实现现场感和兴奋感。
特别地,在伪欢呼水平控制器230中,对检测水平A1进行调整以使其在进球场景中更高,并且因此检测水平A1与检测水平B1之间的差值变得更大,并且,因此,伪欢呼量也变大。通过上述处理,可以实现以较大欢呼再现的并且具有较强现场感的进球场景中的音频。
相反地,在没有欢呼(如CM)的非欢呼场景中,由于检测水平A1被调整为更低,所以可以防止向解说消除信号不必要地添加伪欢呼成分。通过上述处理,可以获得更自然的音频。
此外,进球场景检测区段控制器265、非欢呼检测区段控制器266以及伪欢呼量检测部267执行与进球场景检测区段控制器261、非欢呼检测区段控制器263以及伪欢呼量检测部264的处理类似的处理,并且确定伪欢呼量。然后,基于所确定的伪欢呼量,伪欢呼量检测部267对放大部233进行控制。
在步骤S20中,伪欢呼生成部47生成伪欢呼信号。
换言之,随机噪声生成部231生成随机噪声信号,并且将随机噪声信号供应给滤波处理部232和滤波处理部234。
滤波处理部232通过对来自随机噪声生成部231的随机噪声信号执行滤波处理来生成伪欢呼信号,并且将伪欢呼信号供应给放大部233。在伪欢呼量检测部267的控制下,放大部233对来自滤波处理部232的伪欢呼信号进行放大,并且将所得到的信号供应给相加部236。
此外,滤波处理部234使用通过音调控制器229的控制而确定的滤波器,并且对来自随机噪声生成部231的随机噪声信号执行滤波处理以生成伪欢呼信号,并且将伪欢呼信号供应给放大部235。
在伪欢呼量检测部264的控制下,放大部235对滤波处理部234供应的伪欢呼信号进行放大,并且将所得到的信号供应给相加部236。
相加部236将放大部233供应的伪欢呼信号和放大部235供应的伪欢呼信号相加以生成最终的伪欢呼信号,并且将最终的伪欢呼信号供应给解说消除部21中的相加部48。
在步骤S21中,相加部48将相加部44供应的信号和相加部236供应的伪欢呼信号相加以生成解说消除信号,并且将解说消除信号供应给选择器23和体育场混响添加部24。例如,伪欢呼信号被添加至从相加部44输出的每个声道的信号,并且形成配置有L声道和R声道的立体声解说消除信号。
此外,在控制器22的控制下,选择器23将供应的输入信号和解说消除部21中的相加部48供应的解说消除信号中的任一个供应给相加部25。
在步骤S22中,体育场混响添加部24通过对解说消除部21提供的解说消除信号执行声学处理来将混响效果添加至解说消除信号。
体育场混响添加部24输出配置有L声道和R声道的后方信号,通过向随后的级添加混响效果而获取该后方信号,并且体育场混响添加部24供应通过添加混响效果而获取的配置有L声道和R声道的前方信号。
在步骤S23中,在每个声道中,相加部25将选择器23供应的信号(即输入信号或解说消除信号)和体育场混响添加部24供应的前方信号相加在一起,以形成最终的前方信号。
当相加部25输出所生成的配置有L声道和R声道的前方信号时,体育场效果生成处理结束。
在上述方式中,体育场效果生成装置11将体育场的混响添加至解说消除信号,该解说消除信号是通过从输入信号中去除解说并且通过向所得到的输入信号添加伪欢呼信号而获取的。
如上所述,通过从输入信号中去除解说并且向所得到的输入信号添加体育场的混响,可以获得具有较强现场感的音频。
例如,在输入信号的音频中,当解说的语音过大时,语音变得更加刺耳,并且不能充分地获得现场感。此外,如果将声音效果添加至解说成分大的输入信号,则展宽感被添加到解说,现场感越发低。
相反地,在体育场效果生成装置11中,由于从输入信号中去除解说并且体育场的混响被添加至所得到的输入信号,所以可以获得更自然且具有现场感的音频。特别地,通过将具有现场感的立体声中央抑制信号和通过去除中央定向成分而获取的单声道中央定向去除信号相加来生成解说消除信号,可以获取具有现场感并且已充分去除解说的信号。
此外,在体育场效果生成装置11中,根据输入信号的水平与中央定向去除信号的水平之间的比较结果、进球场景的检测结果以及非欢呼场景的检测结果,将适当水平的伪欢呼成分添加至解说消除信号。通过上述处理,可以进一步提高现场感。
<修改1>
<伪欢呼水平控制器的示例性配置>
在上文中,应注意,描述了在考虑到进球场景的检测结果和非欢呼场景的检测结果的情况下确定伪欢呼量的情况;然而,可以不使用进球场景的检测结果和非欢呼场景的检测结果来确定伪欢呼量。
在这种情况下,例如,以图14中所示的方式配置伪欢呼水平控制器230。应注意,在图14中,与图9的情况对应的部分被附以相同的附图标记,并且根据需要省略其描述。
图14中所示的伪欢呼水平控制器230包括伪欢呼量检测部264和伪欢呼量检测部267。
伪欢呼量检测部264通过比较来自水平检测部223的检测水平A1和水平检测部226供应的检测水平B1来确定伪欢呼量,并且基于伪欢呼量对放大部235进行控制。
此外,伪欢呼量检测部267通过比较水平检测部225供应的检测水平A2和水平检测部228供应的检测水平B2来确定伪欢呼量,并且基于伪欢呼量对放大部233进行控制。
此外,在图9中所示的伪欢呼水平控制器230中,可以不设置进球场景检测区段控制器261和非欢呼检测区段控制器263,或者可以不设置进球场景检测区段控制器265和非欢呼检测区段控制器266。此外,可以不设置进球场景检测区段控制器261或非欢呼检测区段控制器263中的任一个,或者可以不设置进球场景检测区段控制器265或非欢呼检测区段控制器266中的任一个。
<修改2>
<体育场效果生成装置的示例性配置>
此外,在上文中,描述了从体育场效果生成装置11输出具有双声道的信号和具有双声道的前方信号的示例;然而,可以输出配置有L声道和R声道的立体声信号。
在这种情况下,例如,以图15中所示的方式配置体育场效果生成装置11。应注意,在图15中,与图1的情况对应的部分被附以相同的附图标记,并且根据需要省略其描述。
在图15所示的体育场效果生成装置11中,进一步在图1所示的体育场效果生成装置11中设置了虚拟环绕生成部291,除此之外,以与图1中所示的体育场效果生成装置11的方式相同的方式来配置图15中所示的体育场效果生成装置11。
虚拟环绕生成部291基于体育场混响添加部24供应的配置有L声道和R声道的后方信号和相加部25供应的配置有L声道和R声道的前方信号来生成配置有L声道和R声道的立体声信号,并且输出立体声信号。例如,通过使用头相关传输函数(HRTF)对后方信号和前方信号进行卷积来生成立体声信号。
可以通过硬件但是也可以通过软件执行上述一系列处理。当通过软件执行一系列处理时,构成软件的程序被安装到计算机中。本文中,表述“计算机”包括其中包含专用硬件的计算机和当安装各种程序时能够执行各种功能的通用个人计算机等。
图16是示出使用程序来执行上述一系列处理的计算机的硬件配置示例的框图。
在计算机中,中央处理单元(CPU)501、只读存储器(ROM)502和随机存取存储器(RAM)503通过总线504相互连接。
输入/输出接口505也连接至总线504。输入单元506、输出单元507、记录单元508、通信单元509以及驱动器510连接至输入/输出接口505。
输入单元506由键盘、鼠标、麦克风、成像元件等来配置。输出单元507由显示器、扬声器等来配置。记录单元508由硬盘、非易失性存储器等来配置。通信单元509由网络接口等来配置。驱动器510驱动可移除介质511,如磁盘、光盘、磁光盘、半导体存储器等。
在如上配置的计算机中,例如,CPU 501经由输入/输出接口505和总线504将存储在记录单元508中的程序加载到RAM 503上,并且执行该程序。从而,执行上述一系列处理。
要由计算机(CPU 501)执行的程序以记录在可移除介质511(其是封装介质等)中的方式来提供。此外,可以经由有线或无线传输介质(如局域网、因特网或数字卫星广播)来提供程序。
在计算机中,通过将可移除介质511加载到驱动器510中,程序可以经由输入/输出接口505安装到记录单元508中。还可以使用通信单元509从有线或无线传输介质接收程序,并且将程序安装到记录单元508中。作为另一替选,可以预先将程序安装到ROM 502或记录单元508中。
应注意,由计算机执行的程序可以是根据本说明书中描述的顺序以时间序列处理的程序,或者是并行地处理或在需要的定时处(如调用时)处理的程序。
本公开内容的实施方式不限于上述实施方式,并且在不脱离本公开内容的范围的情况下可以做出各种改变和修改。
例如,本公开内容可以采用云计算的配置,该云计算通过经由网络向多个装置分配一个功能或连接一个功能而进行处理。
此外,可以通过一个装置或通过分配多个装置来执行上述流程图描述的每个步骤。
此外,在多个处理包括在一个步骤中的情况下,可以通过一个装置或通过分配多个装置来执行包括在这一个步骤中的多个处理。
另外,本技术还可以如下配置。
(1)一种音频处理装置,包括:
解说消除部,所述解说消除部被配置成通过从输入信号中去除解说成分来生成解说消除信号;以及
混响添加部,所述混响添加部被配置成向所述解说消除信号添加混响效果。
(2)根据(1)所述的音频处理装置,其中,所述解说消除部生成包括伪欢呼成分的所述解说消除信号。
(3)根据(1)所述的音频处理装置,其中,所述解说消除部通过对具有多个声道的所述输入信号中包括的中央定向成分进行抑制来生成具有多个声道的中央抑制信号,所述解说消除部基于具有多个声道的所述输入信号来生成已经去除所述中央定向成分的单声道中央定向去除信号,并且所述解说消除部通过将所述中央抑制信号和所述中央定向去除信号相加在一起以作为所述解说消除信号。
(4)根据(3)所述的音频处理装置,其中,所述解说消除部还生成作为伪欢呼成分的伪欢呼信号,并且通过将所述中央抑制信号、所述中央定向去除信号以及所述伪欢呼信号相加在一起以作为所述解说消除信号。
(5)根据(4)所述的音频处理装置,其中,所述解说消除部基于所述输入信号的水平与所述中央定向去除信号的水平之间的比较结果来执行所述伪欢呼信号的水平调整。
(6)根据(4)或(5)所述的音频处理装置,其中,所述输入信号是体育相关内容的音频信号。
(7)根据(6)所述的音频处理装置,其中,所述解说消除部基于所述输入信号来检测得分场景,并且基于对所述得分场景的检测结果来执行所述伪欢呼信号的水平调整。
(8)根据(6)或(7)所述的音频处理装置,其中,所述解说消除部基于所述输入信号来检测非欢呼场景,并且基于对非所述欢呼场景的检测结果来执行所述伪欢呼信号的水平调整。
(9)一种音频处理方法,包括下述步骤:
通过从输入信号中去除解说成分来生成解说消除信号;以及
向所述解说消除信号添加混响效果。
(10)一种用于使得计算机执行处理的程序,所述处理包括:
通过从输入信号中去除解说成分来生成解说消除信号;以及
向所述解说消除信号添加混响效果。
附图标记列表
11:体育场效果生成装置
21:解说消除部
24:体育场混响添加部
25:相加部
41:立体声中央抑制部
42:中央定向信号去除部
44:相加部
45:进球场景检测部
46:欢呼检测部
47:伪欢呼生成部

Claims (8)

1.一种音频处理装置,包括:
解说消除部,所述解说消除部被配置成通过从输入信号中去除解说成分来生成解说消除信号;以及
混响添加部,所述混响添加部被配置成向所述解说消除信号添加混响效果,
其中,所述解说消除部通过对具有多个声道的所述输入信号中包括的中央定向成分进行抑制来生成具有多个声道的中央抑制信号,所述解说消除部基于具有多个声道的所述输入信号来生成已经去除所述中央定向成分的单声道中央定向去除信号,并且所述解说消除部通过将所述中央抑制信号和所述中央定向去除信号相加在一起以作为所述解说消除信号。
2.根据权利要求1所述的音频处理装置,其中,所述解说消除部生成包括伪欢呼成分的所述解说消除信号。
3.根据权利要求1所述的音频处理装置,其中,所述解说消除部还生成作为伪欢呼成分的伪欢呼信号,并且通过将所述中央抑制信号、所述中央定向去除信号以及所述伪欢呼信号相加在一起以作为所述解说消除信号。
4.根据权利要求3所述的音频处理装置,其中,所述解说消除部基于所述输入信号的水平与所述中央定向去除信号的水平之间的比较结果来执行所述伪欢呼信号的水平调整。
5.根据权利要求4所述的音频处理装置,其中,所述输入信号是体育相关内容的音频信号。
6.根据权利要求5所述的音频处理装置,其中,所述解说消除部基于所述输入信号来检测得分场景,并且基于对所述得分场景的检测结果来执行所述伪欢呼信号的水平调整。
7.根据权利要求6所述的音频处理装置,其中,所述解说消除部基于所述输入信号来检测非欢呼场景,并且基于对所述非欢呼场景的检测结果来执行所述伪欢呼信号的水平调整。
8.一种音频处理方法,包括下述步骤:
通过从输入信号中去除解说成分来生成解说消除信号;以及
向所述解说消除信号添加混响效果,
其中,生成解说消除信号的步骤包括:通过对具有多个声道的所述输入信号中包括的中央定向成分进行抑制来生成具有多个声道的中央抑制信号,基于具有多个声道的所述输入信号来生成已经去除所述中央定向成分的单声道中央定向去除信号,以及通过将所述中央抑制信号和所述中央定向去除信号相加在一起来作为所述解说消除信号。
CN201380065234.8A 2012-12-19 2013-12-05 音频处理装置和方法 Expired - Fee Related CN104871565B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012-277063 2012-12-19
JP2012277063 2012-12-19
PCT/JP2013/082692 WO2014097893A1 (ja) 2012-12-19 2013-12-05 音声処理装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
CN104871565A CN104871565A (zh) 2015-08-26
CN104871565B true CN104871565B (zh) 2017-03-08

Family

ID=50978228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380065234.8A Expired - Fee Related CN104871565B (zh) 2012-12-19 2013-12-05 音频处理装置和方法

Country Status (4)

Country Link
US (1) US9653065B2 (zh)
JP (1) JP6369331B2 (zh)
CN (1) CN104871565B (zh)
WO (1) WO2014097893A1 (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001069597A (ja) * 1999-06-22 2001-03-16 Yamaha Corp 音声処理方法及び装置
CN101518098A (zh) * 2006-09-14 2009-08-26 Lg电子株式会社 用于对话增强技术的控制器和用户界面
JP2009193031A (ja) * 2008-02-18 2009-08-27 Sharp Corp 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
JP2012019454A (ja) * 2010-07-09 2012-01-26 Sharp Corp 音声信号処理装置、方法、プログラム、及び記録媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0539100U (ja) * 1991-10-25 1993-05-25 株式会社東芝 ステレオ音声再生装置
JP3677924B2 (ja) * 1997-02-17 2005-08-03 株式会社セガ ビデオゲーム装置の表示方法及び制御方法
JP4602204B2 (ja) 2005-08-31 2010-12-22 ソニー株式会社 音声信号処理装置および音声信号処理方法
JP2008164823A (ja) * 2006-12-27 2008-07-17 Toshiba Corp オーディオデータ処理装置
US8515257B2 (en) * 2007-10-17 2013-08-20 International Business Machines Corporation Automatic announcer voice attenuation in a presentation of a televised sporting event
JP2011250100A (ja) * 2010-05-26 2011-12-08 Sony Corp 画像処理装置および方法、並びにプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001069597A (ja) * 1999-06-22 2001-03-16 Yamaha Corp 音声処理方法及び装置
CN101518098A (zh) * 2006-09-14 2009-08-26 Lg电子株式会社 用于对话增强技术的控制器和用户界面
JP2009193031A (ja) * 2008-02-18 2009-08-27 Sharp Corp 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
JP2012019454A (ja) * 2010-07-09 2012-01-26 Sharp Corp 音声信号処理装置、方法、プログラム、及び記録媒体

Also Published As

Publication number Publication date
WO2014097893A1 (ja) 2014-06-26
CN104871565A (zh) 2015-08-26
JP6369331B2 (ja) 2018-08-08
JPWO2014097893A1 (ja) 2017-01-12
US9653065B2 (en) 2017-05-16
US20150325230A1 (en) 2015-11-12

Similar Documents

Publication Publication Date Title
JP6508491B2 (ja) マルチチャネルオーディオ信号内の音声成分を強調するための信号処理装置
US8798992B2 (en) Audio noise modification for event broadcasting
US7974838B1 (en) System and method for pitch adjusting vocals
US9282419B2 (en) Audio processing method and audio processing apparatus
JP6187626B1 (ja) 収音装置及びプログラム
CN106878866A (zh) 音频信号处理方法、装置及终端
CN104078051B (zh) 一种人声提取方法、系统以及人声音频播放方法及装置
US9894455B2 (en) Correction of sound signal based on shift of listening point
US10645513B2 (en) Stereophonic sound reproduction method and apparatus
CN107113496A (zh) 移动设备的环绕声记录
JP5307770B2 (ja) 音声信号処理装置、方法、プログラム、及び記録媒体
TWI478151B (zh) 音頻處理系統與音頻處理方法
JP5690082B2 (ja) 音声信号処理装置、方法、プログラム、及び記録媒体
JP4810621B1 (ja) 音声信号変換装置、方法、プログラム、及び記録媒体
JP5736124B2 (ja) 音声信号処理装置、方法、プログラム、及び記録媒体
EP3220666B1 (en) Signal processing device and signal processing method
CN104871565B (zh) 音频处理装置和方法
US11140506B2 (en) Sound signal processor and sound signal processing method
WO2021089544A1 (en) Electronic device, method and computer program
US20150146897A1 (en) Audio signal processing method and audio signal processing device
CN106328159B (zh) 一种音频流的处理方法及装置
JP2010028663A (ja) 音声レベル調整装置、音声レベル調整方法およびプログラム
US11825264B2 (en) Sound pick-up apparatus, storage medium, and sound pick-up method
Zhu et al. The Conversion from Stereo Signal to Multichannel Audio Signal Based on the DMS System
CN116456263A (zh) 一种音频信号转换方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170308

CF01 Termination of patent right due to non-payment of annual fee