CN108053832B - 音频信号处理方法、装置、电子设备及存储介质 - Google Patents
音频信号处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN108053832B CN108053832B CN201711311543.5A CN201711311543A CN108053832B CN 108053832 B CN108053832 B CN 108053832B CN 201711311543 A CN201711311543 A CN 201711311543A CN 108053832 B CN108053832 B CN 108053832B
- Authority
- CN
- China
- Prior art keywords
- signal
- segment
- signal segment
- fundamental tone
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 176
- 238000012545 processing Methods 0.000 title claims abstract description 68
- 238000003672 processing method Methods 0.000 title abstract description 17
- 238000004364 calculation method Methods 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 63
- 238000001914 filtration Methods 0.000 claims abstract description 14
- 230000004048 modification Effects 0.000 claims abstract description 13
- 238000012986 modification Methods 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims description 36
- 238000004590 computer program Methods 0.000 claims description 8
- 239000003550 marker Substances 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 139
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000002093 peripheral effect Effects 0.000 description 10
- 230000001133 acceleration Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
本发明公开了一种音频信号处理方法、装置、电子设备及存储介质,属于网络技术领域。所述方法包括:确定待处理的音频信号的基音信号;对所述基音信号的多个候选周期进行标记,得到所述基音信号的多个信号分段;基于所述多个信号分段进行相关性计算,确定所述基音信号的多个周期;根据所述基音信号的多个周期,对所述音频信号进行变调处理。本发明通过对待处理的音频信号进行滤波,得到基音信号,通过标记基音信号的候选周期,来对基音信号进行分段,然后对该多个信号分段进行相关性计算,排除伪周期,获得更准确的基音信号的周期,再基于准确的周期对音频信号进行变调处理,可以提高变调处理的精确度。
Description
技术领域
本发明涉及网络技术领域,特别涉及一种音频信号处理方法、装置、电子设备及存储介质。
背景技术
随着网络技术的发展和终端功能的多样化,人们可以通过终端进行录音,并采用音频信号处理方法对录音进行变调处理,产生各种各样的音效。例如,人们可以在终端上录音,通过在该终端上的操作,对该录音进行升调处理,将本来是E调的录音调整为A调的录音。
目前的音频信号处理方法是通过对音频信号进行滤波,得到基音信号,然后直接将基音信号的波形与时间坐标轴的交点作为周期标记点,该交点的信号方向均一致,再根据该音频信号的周期标记点对音频信号进行变调处理,得到变调后的音频信号。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
为了得到音频信号中完整的基音信号,一般会采用带宽足够大的滤波器对音频信号进行滤波,但这样得到的基音信号中可能掺杂有基音信号的谐波信号,则直接将基音信号的波形与时间坐标轴的交点作为周期标记点,标记得到的周期不够准确,导致变调处理不精确。
发明内容
本发明实施例提供了一种音频信号处理方法、装置、电子设备及存储介质,可以解决现有技术中变调处理不精确的问题。所述技术方案如下:
第一方面,提供了一种音频信号处理方法,所述方法包括:
确定待处理的音频信号的基音信号;
对所述基音信号的多个候选周期进行标记,得到所述基音信号的多个信号分段;
基于所述多个信号分段进行相关性计算,确定所述基音信号的多个周期;
根据所述基音信号的多个周期,对所述音频信号进行变调处理。
在一种可能实现方式中,所述确定待处理的音频信号的基音信号,包括:
将待处理的音频信号输入带通滤波器中,由所述带通滤波器对所述音频信号进行滤波处理;
输出频率在预设频率范围内的音频信号,将所述频率在预设频率范围内的音频信号作为基音信号,所述预设频率范围为人的声音频率范围。
在一种可能实现方式中,所述对所述基音信号的多个候选周期进行标记,得到所述基音信号的多个信号分段,包括:
根据所述基音信号的波形,确定所述基音信号的多个候选周期标记点;
将每相邻的两个候选周期标记点之间的基音信号作为所述基音信号的一个信号分段,得到所述基音信号的多个信号分段。
在一种可能实现方式中,所述根据所述基音信号的波形,确定所述基音信号的多个候选周期标记点,包括:
确定所述基音信号的波形与时间坐标轴的多个交点的信号方向,将所述信号方向与预设信号方向相同的多个交点确定为所述基音信号的多个候选周期标记点。
在一种可能实现方式中,所述基于所述多个信号分段进行相关性计算,确定所述基音信号的多个周期,包括:
将所述多个信号分段中的第一个信号分段确定为第一信号分段,将以所述第一信号分段的结束点为起点、时长为所述第一信号分段的时长的基音信号确定为第二信号分段;
计算第一信号分段与第二信号分段之间的相关度;
当所述相关度大于预设阈值时,将所述第一信号分段的时长确定为所述基音信号的一个周期,将所述第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算,直到所述基音信号的多个信号分段均已进行过计算。
在一种可能实现方式中,所述方法还包括:
当所述相关度小于或等于预设阈值时,将所述第一信号分段与所述第一信号分段的下一个信号分段合并为第一信号分段,根据合并后的第一信号分段,确定第二信号分段,继续进行相关性计算,直到计算得到的相关度大于预设阈值时,执行所述将所述第一信号分段的时长确定为所述基音信号的一个周期的步骤。
在一种可能实现方式中,所述方法还包括:
当所述相关度小于或等于预设阈值时,对所述第一信号分段进行合并,继续进行相关性计算,直到所述第一信号分段的时长达到预设时长时,从所述多次合并过程中计算得到的多个相关度中选择最大的相关度,将计算得到所述最大的相关度时的第一信号分段的时长确定为所述基音信号的一个周期,执行所述将所述第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算的步骤,直到所述基音信号的多个信号分段均已进行过计算。
第二方面,提供了一种音频信号处理装置,所述装置包括:
确定模块,用于确定待处理的音频信号的基音信号;
标记模块,用于对所述基音信号的多个候选周期进行标记,得到所述基音信号的多个信号分段;
所述确定模块,还用于基于所述多个信号分段进行相关性计算,确定所述基音信号的多个周期;
处理模块,用于根据所述基音信号的多个周期,对所述音频信号进行变调处理。
在一种可能实现方式中,所述确定模块,用于:
将待处理的音频信号输入带通滤波器中,由所述带通滤波器对所述音频信号进行滤波处理;
输出频率在预设频率范围内的音频信号,将所述频率在预设频率范围内的音频信号作为基音信号,所述预设频率范围为人的声音频率范围。
在一种可能实现方式中,所述标记模块,用于:
根据所述基音信号的波形,确定所述基音信号的多个候选周期标记点;
将每相邻的两个候选周期标记点之间的基音信号作为所述基音信号的一个信号分段,得到所述基音信号的多个信号分段。
在一种可能实现方式中,所述标记模块,用于确定所述基音信号的波形与时间坐标轴的多个交点的信号方向,将所述信号方向与预设信号方向相同的多个交点确定为所述基音信号的多个候选周期标记点。
在一种可能实现方式中,所述确定模块,还用于:
将所述多个信号分段中的第一个信号分段确定为第一信号分段,将以所述第一信号分段的结束点为起点、时长为所述第一信号分段的时长的基音信号确定为第二信号分段;
计算第一信号分段与第二信号分段之间的相关度;
当所述相关度大于预设阈值时,将所述第一信号分段的时长确定为所述基音信号的一个周期,将所述第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算,直到所述基音信号的多个信号分段均已进行过计算。
在一种可能实现方式中,所述确定模块,还用于当所述相关度小于或等于预设阈值时,将所述第一信号分段与所述第一信号分段的下一个信号分段合并为第一信号分段,根据合并后的第一信号分段,确定第二信号分段,继续进行相关性计算,直到计算得到的相关度大于预设阈值时,执行所述将所述第一信号分段的时长确定为所述基音信号的一个周期的步骤。
在一种可能实现方式中,所述确定模块,还用于当所述相关度小于或等于预设阈值时,对所述第一信号分段进行合并,继续进行相关性计算,直到所述第一信号分段的时长达到预设时长时,从所述多次合并过程中计算得到的多个相关度中选择最大的相关度,将计算得到所述最大的相关度时的第一信号分段的时长确定为所述基音信号的一个周期,执行所述将所述第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算的步骤,直到所述基音信号的多个信号分段均已进行过计算。
第三方面,提供了一种电子设备,包括处理器和存储器;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的计算机程序,实现第一方面所述的方法步骤。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法步骤。
本发明实施例提供的技术方案带来的有益效果是:
本发明实施例通过对待处理的音频信号进行滤波,得到基音信号,通过标记基音信号的候选周期,来对基音信号进行分段,然后对该多个信号分段进行相关性计算,排除伪周期,获得更准确的基音信号的周期,再基于准确的周期对音频信号进行变调处理,可以提高变调处理的精确度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种音频信号处理方法流程图;
图2是本发明实施例提供的一种音频信号处理方法流程图;
图3是本发明实施例提供的一种带通滤波器的幅度特性曲线图;
图4是本发明实施例提供的一种基音信号的示意图;
图5是本发明实施例提供的一种待处理的音频信号的示意图;
图6是本发明实施例提供的一种音频信号处理装置的结构示意图;
图7是本发明实施例提供的一种电子设备700的结构框图;
图8是本发明实施例提供的一种音频信号处理装置800的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明实施例提供的一种音频信号处理方法流程图,该音频信号处理方法应用于电子设备中,该电子设备可以是终端,该电子设备也可以是服务器。参见图1,该方法包括:
101、电子设备确定待处理的音频信号的基音信号。
102、电子设备对该基音信号的多个候选周期进行标记,得到该基音信号的多个信号分段。
103、电子设备基于该多个信号分段进行相关性计算,确定该基音信号的多个周期。
104、根据该基音信号的多个周期,电子设备对该音频信号进行变调处理。
本发明实施例通过对待处理的音频信号进行滤波,得到基音信号,通过标记基音信号的候选周期,来对基音信号进行分段,然后对该多个信号分段进行相关性计算,排除伪周期,获得更准确的基音信号的周期,再基于准确的周期对音频信号进行变调处理,可以提高变调处理的精确度。
可选地,该确定待处理的音频信号的基音信号,包括:
将待处理的音频信号输入带通滤波器中,由该带通滤波器对该音频信号进行滤波处理;
输出频率在预设频率范围内的音频信号,将所述频率在预设频率范围内的音频信号作为基音信号,所述预设频率范围为人的声音频率范围。
可选地,该对该基音信号的多个候选周期进行标记,得到该基音信号的多个信号分段,包括:
根据该基音信号的波形,确定该基音信号的多个候选周期标记点;
将每相邻的两个候选周期标记点之间的基音信号作为该基音信号的一个信号分段,得到该基音信号的多个信号分段。
可选地,该根据该基音信号的波形,确定该基音信号的多个候选周期标记点,包括:
确定该基音信号的波形与时间坐标轴的多个交点的信号方向,将该信号方向与预设信号方向相同的多个交点确定为该基音信号的多个候选周期标记点。
可选地,该基于该多个信号分段进行相关性计算,确定该基音信号的多个周期,包括:
将该多个信号分段中的第一个信号分段确定为第一信号分段,将以该第一信号分段的结束点为起点、时长为该第一信号分段的时长的基音信号确定为第二信号分段;
计算第一信号分段与第二信号分段之间的相关度;
当该相关度大于预设阈值时,将该第一信号分段的时长确定为该基音信号的一个周期,将该第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算,直到该基音信号的多个信号分段均已进行过计算。
可选地,该方法还包括:
当该相关度小于或等于预设阈值时,将该第一信号分段与该第一信号分段的下一个信号分段合并为第一信号分段,根据合并后的第一信号分段,确定第二信号分段,继续进行相关性计算,直到计算得到的相关度大于预设阈值时,执行该将该第一信号分段的时长确定为该基音信号的一个周期的步骤。
可选地,该方法还包括:
当该相关度小于或等于预设阈值时,对该第一信号分段进行合并,继续进行相关性计算,直到该第一信号分段的时长达到预设时长时,从该多次合并过程中计算得到的多个相关度中选择最大的相关度,将计算得到该最大的相关度时的第一信号分段的时长确定为该基音信号的一个周期,执行该将该第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算的步骤,直到该基音信号的多个信号分段均已进行过计算。
图2是本发明实施例提供的一种音频信号处理方法流程图,该方法应用于电子设备中,该电子设备可以是终端,也可以是服务器。在下述实施例中,仅以终端对音频信号进行处理为例进行说明。参见图2,该方法包括以下步骤:
201、终端获取待处理的音频信号。
终端可以由该终端所配置的声音采集器件来采集声音,生成该待处理的音频信号,也可以通过外接其他声音采集设备采集,并将生成的待处理的音频信号发送至该终端,由该终端对该待处理的音频信号进行处理。且,该终端可以实时采集声音来生成该待处理的音频信号,也可以事先采集声音来生成该待处理的音频信号,并在之后的任意时刻对该音频信号进行处理。
在本发明实施例中,仅以该终端通过所配置的声音采集器件采集声音,并生成音频信号为例进行说明,该终端所配置的声音采集器件可以采集周围的声音,该声音可以人发出的声音,也可以是环境中的其它声音,例如噪声、乐器发出的声音。需要说明的是,该待处理的音频信号是指人发出的声音,该待处理的音频信号为不包括伴奏、噪声等声音。因此,该终端采集到声音,生成音频信号后,需要对该音频信号进行信号放大、噪声识别、信号去噪等处理,得到该音频信号中人的声音,从而获取到该待处理的音频信号。
在一种可能场景中,上述过程的应用场景可以是:该终端的用户对该终端的麦克风进行演唱,由该终端对该用户演唱的声音进行采集以及处理,使得播放时,可以产生用户想要的音效。具体地,该终端的用户可以开启该终端的声音采集功能,以触发该终端所配置的声音采集器件对周围的声音进行采集,上述步骤可以通过用户点击该终端所安装的应用中预设的功能按钮来实现。然后,用户可以在该终端所安装的应用中点击相应的功能按钮来选择播放音效,以触发该终端获取音频信号,并对该音频信号进行处理。
当然,该终端也可以获取已有的音频文件,对该音频文件进行处理,例如,该音频文件可以是一首歌,而不是该终端去采集音频信号,本发明对该待处理的音频信号来源不作具体限定。
202、终端确定待处理的音频信号的基音信号。
人在发声音时,根据声带是否震动可以将人发出的声音分为清音和浊音,人在发清音时声带不震动,人在发浊音时声带震动,清音信号与白噪声同理,没有明显的准周期特性,而浊音信号在时域上明显体现出准周期特性,也即是,该浊音信号为准周期信号。需要说明的是,本发明实施例涉及的基音信号即为浊音信号,除了上述清音信号、基音信号(浊音信号)以外,该音频信号中还可以包括谐波信号。浊音信号的频率对应于音频的音高,因而,需要将音频信号中的清音信号和谐波信号去除,得到基音信号,从而可以基于该音频的音高对该音频信号进行变调处理,使得该音频信号的音高变低或者变高,达到预期的音效。
由于基音信号的频率一般在一定频率范围内,且,该频率范围为中低频范围,可以利用带通滤波器对该音频信号进行滤波处理,得到基音信号。具体地,该滤波过程可以为:将该音频信号输入带通滤波器中,由该带通滤波器对该音频信号进行滤波处理;输出频率在预设频率范围内的音频信号,将该频率在预设频率范围内的音频信号作为基音信号,该预设频率范围为人的声音频率范围。
该带通滤波器的频率范围可以预先设置,以使得只允许该预设频率范围内的音频信号通过该带通滤波器。在具体实施中,该预设频率范围可以为100赫兹(Hz)至600Hz。以上频率取值仅为此举例,当然该预设频率范围的具体取值可以根据实验数据进行分析得出,并预设于该终端的带通滤波器中,本发明对此不作限定。
需要说明的是,在该步骤202中,通过带通滤波器滤除掉的为高次谐波信号和清音信号,得到的音频信号中大部分是基音信号,但还有小部分频率范围在上述预先设置的频率范围内的谐波信号,但是这小部分的谐波信号对该音频信号处理过程的影响程度不大,因而可以将该滤波后得到的音频信号作为基音信号。
例如,图3是本发明实施例提供的一种带通滤波器的幅度特性曲线图,如图3所示,该幅度特性曲线图的横轴为频率,纵轴为幅度,预设频率范围为f1至f2,则可以通过该带通滤波器的音频信号的频率f的频率范围为f1<f<f2。
203、终端对该基音信号的多个候选周期进行标记,得到该基音信号的多个信号分段。
基音信号的音高对应于该基音信号的频率,而该基音信号中不同时间段的频率并不相同,因而可以通过确定该基音信号的多个周期来确定该基音信号的音高。但是在该基音信号中掺杂有小部分的谐波信号,导致该基音信号并不是正弦信号,需要对该基音信号进行分段,得到该基音信号的多个候选周期,然后通过对该基音信号的多个候选周期所对应的信号分段进行计算,来确定候选周期的准确性,从而更准确地确定该基音信号的多个周期。
其中,对该基音信号进行分段的过程可以通过该步骤203实现,在具体实施中,该步骤203可以包括以下步骤:
(1)根据该基音信号的波形,终端确定该基音信号的多个候选周期标记点。
(2)终端将每相邻的两个候选周期标记点之间的基音信号作为该基音信号的一个信号分段,得到该基音信号的多个信号分段。
在一种可能实现方式中,该步骤(1)中确定多个候选周期标记点的具体实现过程可以为:终端确定该基音信号的波形与时间坐标轴的多个交点的信号方向,将该信号方向与预设信号方向相同的多个交点确定为该基音信号的多个候选周期标记点。该多个候选周期标记点用于标记该基音信号的多个候选周期,则每个信号分段即为每个候选周期所对应的基音信号。
例如,图4是本发明实施例提供的一种基音信号的示意图,如图4所示,该坐标系的横轴为时间坐标轴,纵轴为振幅,该基音信号与时间坐标轴有T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,T11,而T1,T3,T5,T7,T9,T11的信号方向相同,都是由负到正,T2,T4,T6,T8,T10的信号方向相同,都是由正到负,可以预先设置预设信号方向,例如,由负到正,将上述信号方向与预设信号方向相同的多个交点确定为该基音信号的多个候选周期标记点,例如,当预设信号方向为由负到正时,T1,T3,T5,T7,T9,T11即为多个候选周期标记点,则该基音信号的多个信号分段即为T1与T3之间的基音信号、T3与T5之间的基音信号和T5与T7之间的基音信号、T7与T9之间的基音信号、T9与T11之间的基音信号。
204、终端基于该多个信号分段进行相关性计算,确定该基音信号的多个周期。
上述多个信号分段是基于候选周期得到的,而该候选周期可能不准确,对于任一个候选周期,终端可以通过对该任一个候选周期对应的信号分段与该信号分段后面与其时长相同的信号进行相关性计算,来确定的候选周期是否准确,如果是,则确定时该基音信号的周期,如果否,则认为该候选周期为伪周期,放弃该候选周期,重新确定该基音信号的真实周期,这样经过相关性计算,可以排除伪周期,得到更准确的基音信号的周期。
具体地,终端可以将该多个信号分段中的第一个信号分段确定为第一信号分段,将以该第一信号分段的结束点为起点、时长为该第一信号分段的时长的基音信号确定为第二信号分段,然后终端可以计算第一信号分段与第二信号分段之间的相关度。当该相关度大于预设阈值时,终端可以将该第一信号分段的时长确定为该基音信号的一个周期,将该第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算,直到该基音信号的多个信号分段均已进行过计算。当该相关度小于或等于预设阈值时,终端可以将该第一信号分段与该第一信号分段的下一个信号分段合并为第一信号分段,根据合并后的第一信号分段,确定第二信号分段,继续进行相关性计算,直到计算得到的相关度大于预设阈值时,执行上述将该第一信号分段的时长确定为该基音信号的一个周期的步骤。
该相关度用来表示该第一信号分段与第二信号分段的相似度,第一信号分段与第二信号分段之间相似度越高,该第一信号分段与第二信号分段的周期性越好,因而该候选周期就越准确。该预设阈值可以由本领域技术人员通过大量实验确定,该相关性计算过程可以采用任一种现有技术中计算两个信号之间的相关度的方式,本发明对此不作限定。
在具体实施中,该预设阈值可以是0.6,当相关度大于0.6是,可以认为相关度比较高,基本可以确定这个候选周期准确,然后就可以去比较后面一个候选周期是否准确。而当相关度小于或等于0.6时,可以认为相关度比较低,认为该候选周期不准确,可能是个伪周期,因而放弃该候选周期,也即是放弃了该第一信号分段的结束点,不再将该结束点作为周期标记点,而是将第一信号分段与它后面的一个信号分段合并为一个信号分段,也即是,将放弃的那个结束点相邻的两个候选周期标记点之间的信号作为第一信号分段,再根据这个重新确定的第一信号分段,重新确定第二信号分段,再次执行上述相关性计算的过程。
例如,如图4所示,该基音信号的多个信号分段分别为T1与T3之间的基音信号、T3与T5之间的基音信号和T5与T7之间的基音信号、T7与T9之间的基音信号、T9与T11之间的基音信号,预设阈值为0.6。首先终端可以将T1与T3之间的基音信号确定为第一信号分段,然后可以确定T3与T3+(T3-T1)之间的基音信号为第二信号分段,该第二信号分段的时长为T3-T1,与第一信号分段的时长相同。然后,终端计算该第一信号分段与第二信号分段之间的相关度,则该相关度可能有两种情况:第一种情况:如果该相关度大于0.6,终端将T3-T1确定为该基音信号的一个周期,然后将T3与T5之间的基音信号作为第一信号分段,将T5与T5+(T5-T3)之间的基音信号确定为第二信号分段,继续进行相关性计算。第二种情况:如果该相关度小于或等于0.6,终端将T1与T3之间的基音信号和T3与T5之间的基音信号进行合并,得到T1与T5之间的基音信号,将T1与T5之间的基音信号作为第一信号分段,再确定T5与T5+(T5-T1)之间的基音信号为第二信号分段,该第二信号分段的时长为T5-T1,与合并后的第一信号分段的时长相同,再进行相关性计算。直到该基音信号的所有信号分段都进行过计算,则可以结束该相关性计算过程,得到了该基音信号的多个周期。
在一种可能实现方式中,由于人能发出的频率是在一定范围内,例如,100Hz至600Hz,则基音信号的周期应该小于一个固定值,例如,10毫秒(ms)。考虑到这点,该终端确定该基音信号的多个周期的过程还可以包括:当该相关度小于或等于预设阈值时,终端可以对该第一信号分段进行合并,继续进行相关性计算,直到该第一信号分段的时长达到预设时长时,终端可以从该多次合并过程中计算得到的多个相关度中选择最大的相关度,将计算得到该最大的相关度时的第一信号分段的时长确定为该基音信号的一个周期,执行该将该第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算的步骤,直到该基音信号的多个信号分段均已进行过计算。该预设阈值的设置,可以限定基音信号的周期范围,可以避免相关性计算过程中将真实周期排除掉的情况,提高了基音信号的周期确定方法的准确性
例如,如图4所示,该基音信号的多个信号分段分别为T1与T3之间的基音信号、T3与T5之间的基音信号和T5与T7之间的基音信号、T7与T9之间的基音信号和T9与T11之间的基音信号,预设阈值为0.6。首先终端可以将T1与T3之间的基音信号确定为第一信号分段,然后可以确定T3与T3+(T3-T1)之间的基音信号为第二信号分段,终端计算该第一信号分段与第二信号分段之间的相关度为0.4,则终端将T1与T3之间的基音信号和T3与T5之间的基音信号进行合并,然后将T1与T5之间的基音信号作为第一信号分段,再确定T5与T5+(T5-T1)之间的基音信号为第二信号分段,再进行相关性计算,得到相关度为0.5。终端继续进行合并,并基于第一信号分段分别为T1与T7之间的基音信号和T1与T9之间的基音信号时继续计算,计算得到相关度分别为0.3,0.2,而终端再进行合并,得到第一信号分段,该第一信号分段为T1与T11之间的基音信号,而该第一信号分段的时长T11-T1大于预设阈值,则终端将相关度为0.5时,也即是第一信号分段为T1与T5之间的基音信号时,该第一信号分段的时长T5-T1作为该基音信号的一个周期。终端可以再以T5与T7之间的基音信号作为第一信号分段,重新确定第二信号分段,继续进行相关性计算,直到该基音信号的所有信号分段都进行过计算,则可以结束该相关性计算过程,得到了该基音信号的多个周期。
205、根据该基音信号的多个周期,终端对该音频信号进行变调处理。
终端确定了基音信号的多个周期,则得到了该多个周期对应的频率,也即是该基音信号的多个音高,终端可以通过调整音频信号的频率来,对该多个音高进行调整,产生各种音效。
在具体实施中,终端可以利用汉明窗对该音频信号进行变调处理,具体处理过程如下:
终端根据基音信号的多个周期,对音频信号进行标记,得到多段的音频信号,设置多个汉明窗与该多个周期相对应,该汉明窗的数量可以等于该基音信号的周期的数量,该多个汉明窗的窗口大小分别设置为多个周期中每个周期的二倍。用该多个汉明窗去截取该音频信号,且每个汉明窗的起始点为每个周期的起始点。终端可以将该多个汉明窗截取到的音频信号进行合成,在合成过程可以调整汉明窗的位置,从而实现对该音频信号的频率的调整,上述步骤204中得到的基音信号的多个周期比较准确,变调处理过程更精确。
例如,图5是本发明实施例提供的一种待处理的音频信号的示意图,如图5所示,经过上述步骤得到该音频信号的多个周期为t1、t2、t3、t4,而该多个周期的周期标记点为T1,T3,T5,T9,T11,终端根据该多个周期对音频信号进行标记,得到图5所示的音频信号波形,终端可以将第一个汉明窗的窗口大小设置为第一个周期t1的二倍,并用该第一个汉明窗去截取音频信号,截取过程中,该第一个汉明窗的起始点为该第一个周期t1的音频信号的起始点T1,第二个汉明窗的窗口大小设置为第二个周期t2的二倍,并用该第二个汉明窗去截取音频信号,截取过程中,该第二个汉明窗的起始点为该第二个周期所对应的音频信号的起始点T3。则终端可以通过调整第二个汉明窗的起始点位置,来将该音频信号的局部信号调整的更稀疏或者更密一些,从而使得该音频信号的频率更低或者更高一些,因而对应地,该音频信号的音高则变得更低或者更高一些。例如,当该终端接收到的设置指令指示将该音频信号的音调调高时,该终端可以将该第二个汉明窗的起始点调整到T3的左边,这样该音频信号的波形变的更密了,频率更高了,反之,当该终端接收到的设置指令指示将该音频信号的音调调低时,该终端可以将该第二个汉明窗的起始点调整到T3的右边,这样该音频信号的波形变的更稀疏了,频率更低了。
以上仅以一种可能变调处理方式为例进行说明,在实际应用中,该变调处理过程可以采用现有技术中任一种变调处理方法来实现,本发明对此不作限定。
上述步骤201至步骤205中,终端自己采集声音,并对该声音转换成的音频信号进行变调处理为例进行说明,在另一种可能实现方式中,该终端还可以采集声音并转换为音频信号,并在联网状态下将该音频信号发送至服务器,由服务器执行与上述步骤202至步骤205同理的步骤来对音频信号进行处理,再将处理后的音频信号发送至终端,从而实现对音频信号的处理过程。
206、终端播放该处理后的音频信号。
终端对待处理的音频信号进行上述变调处理后,可以由该终端所配置的音频播放器件对该处理后的音频信号进行播放,该处理后的音频信号在播放时,处理后的音频信号的音调与处理前音频信号的音调有所不同。例如,音调变高或者音调变低。当然,该终端还可以将该处理后的音频信号发送至音频播放设备,由音频播放设备对该处理后的音频信号进行播放。
在实际实施中,该终端还可以将该处理后的音频信号进行存储,并在后续想要播放该音频信号的时候,可以播放该处理后的音频信号。当然,在存储该处理后的音频信号时,可以将该处理后的音频信号与该处理前的音频信号对应存储,后续既可以播放原音频信号,也可以播放处理后的音频信号。
本发明实施例通过对待处理的音频信号进行滤波,得到基音信号,通过标记基音信号的候选周期,来对基音信号进行分段,然后对该多个信号分段进行相关性计算,排除伪周期,获得更准确的基音信号的周期,再基于准确的周期对音频信号进行变调处理,可以提高变调处理的精确度。进一步地,本发明实施例还通过设置预设阈值,来限定基音信号的周期范围,可以避免相关性计算过程中将真实周期排除掉的情况,提高了基音信号的周期确定方法的准确性。上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
图6是本发明实施例提供的一种音频信号处理装置的结构示意图,参见图6,该装置包括:
确定模块601,用于确定待处理的音频信号的基音信号;
标记模块602,用于对该基音信号的多个候选周期进行标记,得到该基音信号的多个信号分段;
该确定模块601,还用于基于该多个信号分段进行相关性计算,确定该基音信号的多个周期;
处理模块603,用于根据该基音信号的多个周期,对该音频信号进行变调处理。
可选地,该确定模块601,用于:
将待处理的音频信号输入带通滤波器中,由该带通滤波器对该音频信号进行滤波处理;
输出频率在预设频率范围内的音频信号,将所述频率在预设频率范围内的音频信号作为基音信号,所述预设频率范围为人的声音频率范围。
可选地,该标记模块602,用于:
根据该基音信号的波形,确定该基音信号的多个候选周期标记点;
将每相邻的两个候选周期标记点之间的基音信号作为该基音信号的一个信号分段,得到该基音信号的多个信号分段。
可选地,该标记模块602,用于确定该基音信号的波形与时间坐标轴的多个交点的信号方向,将该信号方向与预设信号方向相同的多个交点确定为该基音信号的多个候选周期标记点。
可选地,该确定模块601,还用于:
将该多个信号分段中的第一个信号分段确定为第一信号分段,将以该第一信号分段的结束点为起点、时长为该第一信号分段的时长的基音信号确定为第二信号分段;
计算第一信号分段与第二信号分段之间的相关度;
当该相关度大于预设阈值时,将该第一信号分段的时长确定为该基音信号的一个周期,将该第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算,直到该基音信号的多个信号分段均已进行过计算。
可选地,该确定模块601,还用于当该相关度小于或等于预设阈值时,将该第一信号分段与该第一信号分段的下一个信号分段合并为第一信号分段,根据合并后的第一信号分段,确定第二信号分段,继续进行相关性计算,直到计算得到的相关度大于预设阈值时,执行该将该第一信号分段的时长确定为该基音信号的一个周期的步骤。
可选地,该确定模块601,还用于当该相关度小于或等于预设阈值时,对该第一信号分段进行合并,继续进行相关性计算,直到该第一信号分段的时长达到预设时长时,从该多次合并过程中计算得到的多个相关度中选择最大的相关度,将计算得到该最大的相关度时的第一信号分段的时长确定为该基音信号的一个周期,执行该将该第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算的步骤,直到该基音信号的多个信号分段均已进行过计算。
本发明实施例提供的装置通过对待处理的音频信号进行滤波,得到基音信号,通过标记基音信号的候选周期,来对基音信号进行分段,然后对该多个信号分段进行相关性计算,排除伪周期,获得更准确的基音信号的周期,再基于准确的周期对音频信号进行变调处理,可以提高变调处理的精确度。
需要说明的是:上述实施例提供的音频信号处理装置在处理音频信号时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的音频信号处理装置与音频信号处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图7是本发明实施例提供的一种电子设备700的结构框图。该电子设备700可以被提供为一终端,该电子设备700可以是:智能手机、平板电脑、MP3播放器(Moving PictureExperts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(MovingPicture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。电子设备700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,电子设备700包括有:处理器701和存储器702。
处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器701所执行以实现本发明中方法实施例提供的音频信号处理方法。
在一些实施例中,电子设备700还可选包括有:外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。具体地,外围设备包括:射频电路704、触摸显示屏705、摄像头706、音频电路707、定位组件708和电源709中的至少一种。
外围设备接口703可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器701和存储器702。在一些实施例中,处理器701、存储器702和外围设备接口703被集成在同一芯片或电路板上;在一些其他实施例中,处理器701、存储器702和外围设备接口703中的任意一个或两个可以在单独的芯片或电路板上实现,本发明实施例对此不加以限定。
射频电路704用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路704将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路704包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路704可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路704还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本发明对此不加以限定。
显示屏705用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏705是触摸显示屏时,显示屏705还具有采集在显示屏705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏705可以为一个,设置电子设备700的前面板;在另一些实施例中,显示屏705可以为至少两个,分别设置在电子设备700的不同表面或呈折叠设计;在再一些实施例中,显示屏705可以是柔性显示屏,设置在电子设备700的弯曲表面上或折叠面上。甚至,显示屏705还可以设置成非矩形的不规则图形,也即异形屏。显示屏705可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件706用于采集图像或视频。可选地,摄像头组件706包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理,或者输入至射频电路704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在电子设备700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器701或射频电路704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路707还可以包括耳机插孔。
定位组件708用于定位电子设备700的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件708可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源709用于为电子设备700中的各个组件进行供电。电源709可以是交流电、直流电、一次性电池或可充电电池。当电源709包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,电子设备700还包括有一个或多个传感器710。该一个或多个传感器710包括但不限于:加速度传感器711、陀螺仪传感器712、压力传感器713、指纹传感器714、光学传感器715以及接近传感器716。
加速度传感器711可以检测以电子设备700建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器711可以用于检测重力加速度在三个坐标轴上的分量。处理器701可以根据加速度传感器711采集的重力加速度信号,控制触摸显示屏705以横向视图或纵向视图进行用户界面的显示。加速度传感器711还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器712可以检测电子设备700的机体方向及转动角度,陀螺仪传感器712可以与加速度传感器711协同采集用户对电子设备700的3D动作。处理器701根据陀螺仪传感器712采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器713可以设置在电子设备700的侧边框和/或触摸显示屏705的下层。当压力传感器713设置在电子设备700的侧边框时,可以检测用户对电子设备700的握持信号,由处理器701根据压力传感器713采集的握持信号进行左右手识别或快捷操作。当压力传感器713设置在触摸显示屏705的下层时,由处理器701根据用户对触摸显示屏705的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器714用于采集用户的指纹,由处理器701根据指纹传感器714采集到的指纹识别用户的身份,或者,由指纹传感器714根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器701授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器714可以被设置电子设备700的正面、背面或侧面。当电子设备700上设置有物理按键或厂商Logo时,指纹传感器714可以与物理按键或厂商Logo集成在一起。
光学传感器715用于采集环境光强度。在一个实施例中,处理器701可以根据光学传感器715采集的环境光强度,控制触摸显示屏705的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏705的显示亮度;当环境光强度较低时,调低触摸显示屏705的显示亮度。在另一个实施例中,处理器701还可以根据光学传感器715采集的环境光强度,动态调整摄像头组件706的拍摄参数。
接近传感器716,也称距离传感器,通常设置在电子设备700的前面板。接近传感器716用于采集用户与电子设备700的正面之间的距离。在一个实施例中,当接近传感器716检测到用户与电子设备700的正面之间的距离逐渐变小时,由处理器701控制触摸显示屏705从亮屏状态切换为息屏状态;当接近传感器716检测到用户与电子设备700的正面之间的距离逐渐变大时,由处理器701控制触摸显示屏705从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图7中示出的结构并不构成对电子设备700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图8是本发明实施例提供的一种音频信号处理装置800的框图。例如,音频信号处理装置800可以被提供为一服务器。参照图8,音频信号处理装置800包括处理组件822,其进一步包括一个或多个处理器,以及由存储器832所代表的存储器资源,用于存储可由处理部件822的执行的指令,例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件822被配置为执行指令,以执行上述音频信号处理方法。
音频信号处理装置800还可以包括一个电源组件826被配置为执行音频信号处理装置800的电源管理,一个有线或无线网络接口850被配置为将音频信号处理装置800连接到网络,和一个输入输出(I/O)接口858。音频信号处理装置800可以操作基于存储在存储器832的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种存储有计算机程序的计算机可读存储介质,例如存储有计算机程序的存储器,上述计算机程序被处理器执行时实现上述的音频信号处理方法。例如,该计算机可读存储介质可以是只读内存(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种音频信号处理方法,其特征在于,所述方法包括:
确定待处理的音频信号的基音信号;
对所述基音信号的多个候选周期进行标记,得到所述基音信号的多个信号分段;
基于所述多个信号分段进行相关性计算,确定所述基音信号的多个周期,包括:对于所述多个信号分段中的第一信号分段和第二信号分段,计算第一信号分段与第二信号分段之间的相关度;若所述第一信号分段和第二信号分段的相关度小于或等于预设阈值,将第一信号分段与所述第一信号分段的下一个信号分段合并为第一信号分段,根据合并后的第一信号分段进行相关性计算,确定所述基音信号的多个周期,所述第二信号分段为所述第一信号分段的结束点为起点、时长为所述第一信号分段的时长的基音信号;
根据所述基音信号的多个周期,对所述音频信号进行变调处理;
其中,所述根据合并后的第一信号分段进行相关性计算,确定所述基音信号的多个周期,包括:
根据合并后的第一信号分段,确定第二信号分段,继续进行相关性计算,直到计算得到的相关度大于预设阈值时,将所述第一信号分段的时长确定为所述基音信号的一个周期,将所述第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算,直到所述基音信号的多个信号分段均已进行过计算;或者,
根据合并后的第一信号分段,确定第二信号分段,继续进行相关性计算,直到所述第一信号分段的时长达到预设时长时,从多次合并过程中计算得到的多个相关度中选择最大的相关度,将计算得到所述最大的相关度时的第一信号分段的时长确定为所述基音信号的一个周期,将所述第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算的步骤,直到所述基音信号的多个信号分段均已进行过计算。
2.根据权利要求1所述的方法,其特征在于,所述确定待处理的音频信号的基音信号,包括:
将待处理的音频信号输入带通滤波器中,由所述带通滤波器对所述音频信号进行滤波处理;
输出频率在预设频率范围内的音频信号,将所述频率在预设频率范围内的音频信号作为基音信号,所述预设频率范围为人的声音频率范围。
3.根据权利要求1所述的方法,其特征在于,所述对所述基音信号的多个候选周期进行标记,得到所述基音信号的多个信号分段,包括:
根据所述基音信号的波形,确定所述基音信号的多个候选周期标记点;
将每相邻的两个候选周期标记点之间的基音信号作为所述基音信号的一个信号分段,得到所述基音信号的多个信号分段。
4.根据权利要求3所述的方法,其特征在于,所述根据所述基音信号的波形,确定所述基音信号的多个候选周期标记点,包括:
确定所述基音信号的波形与时间坐标轴的多个交点的信号方向,将所述信号方向与预设信号方向相同的多个交点确定为所述基音信号的多个候选周期标记点。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述多个信号分段中的第一个信号分段确定为第一信号分段;
当所述相关度大于预设阈值时,将所述第一信号分段的时长确定为所述基音信号的一个周期,将所述第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算,直到所述基音信号的多个信号分段均已进行过计算。
6.一种音频信号处理装置,其特征在于,所述装置包括:
确定模块,用于确定待处理的音频信号的基音信号;
标记模块,用于对所述基音信号的多个候选周期进行标记,得到所述基音信号的多个信号分段;
所述确定模块,还用于基于所述多个信号分段进行相关性计算,确定所述基音信号的多个周期,包括:对于所述多个信号分段中的第一信号分段和第二信号分段,计算第一信号分段与第二信号分段之间的相关度;若所述第一信号分段和第二信号分段的相关度小于或等于预设阈值,将第一信号分段与所述第一信号分段的下一个信号分段合并为第一信号分段,根据合并后的第一信号分段进行相关性计算,确定所述基音信号的多个周期,所述第二信号分段为所述第一信号分段的结束点为起点、时长为所述第一信号分段的时长的基音信号;
处理模块,用于根据所述基音信号的多个周期,对所述音频信号进行变调处理;
其中,所述根据合并后的第一信号分段进行相关性计算,确定所述基音信号的多个周期,包括:
根据合并后的第一信号分段,确定第二信号分段,继续进行相关性计算,直到计算得到的相关度大于预设阈值时,将所述第一信号分段的时长确定为所述基音信号的一个周期,将所述第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算,直到所述基音信号的多个信号分段均已进行过计算;或者,
根据合并后的第一信号分段,确定第二信号分段,继续进行相关性计算,直到所述第一信号分段的时长达到预设时长时,从多次合并过程中计算得到的多个相关度中选择最大的相关度,将计算得到所述最大的相关度时的第一信号分段的时长确定为所述基音信号的一个周期,将所述第一信号分段的下一个信号分段确定为第一信号分段,继续进行相关性计算的步骤,直到所述基音信号的多个信号分段均已进行过计算。
7.一种电子设备,其特征在于,包括处理器和存储器;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的计算机程序,实现权利要求1-5任一项所述的方法步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711311543.5A CN108053832B (zh) | 2017-12-11 | 2017-12-11 | 音频信号处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711311543.5A CN108053832B (zh) | 2017-12-11 | 2017-12-11 | 音频信号处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108053832A CN108053832A (zh) | 2018-05-18 |
CN108053832B true CN108053832B (zh) | 2021-02-26 |
Family
ID=62123189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711311543.5A Active CN108053832B (zh) | 2017-12-11 | 2017-12-11 | 音频信号处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108053832B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063652B (zh) * | 2018-08-06 | 2022-02-11 | 高维度(深圳)生物信息智能应用有限公司 | 一种信号处理方法、系统及计算机存储介质 |
CN111326171B (zh) * | 2020-01-19 | 2023-06-23 | 成都潜在人工智能科技有限公司 | 一种基于简谱识别和基频提取的人声旋律提取方法及系统 |
CN113270081B (zh) * | 2020-02-14 | 2024-06-11 | 达发科技股份有限公司 | 调整歌伴奏音的方法及调整歌伴奏音的电子装置 |
CN111583945B (zh) * | 2020-04-30 | 2023-04-25 | 抖音视界有限公司 | 用于处理音频的方法、装置、电子设备和计算机可读介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101499276A (zh) * | 2008-12-25 | 2009-08-05 | 爱唱数码科技(上海)有限公司 | 语音基周标记方法 |
CN101847404B (zh) * | 2010-03-18 | 2012-08-22 | 北京天籁传音数字技术有限公司 | 一种实现音频变调的方法和装置 |
JP6062665B2 (ja) * | 2012-06-13 | 2017-01-18 | 日本放送協会 | 音声のピッチ周期を抽出する信号処理装置及びプログラム |
CN103915099B (zh) * | 2012-12-29 | 2016-12-28 | 北京百度网讯科技有限公司 | 语音基音周期检测方法和装置 |
US9685169B2 (en) * | 2015-04-15 | 2017-06-20 | International Business Machines Corporation | Coherent pitch and intensity modification of speech signals |
CN105304092A (zh) * | 2015-09-18 | 2016-02-03 | 深圳市海派通讯科技有限公司 | 一种基于智能终端的实时变声方法 |
-
2017
- 2017-12-11 CN CN201711311543.5A patent/CN108053832B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108053832A (zh) | 2018-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109033335B (zh) | 音频录制方法、装置、终端及存储介质 | |
CN107978321B (zh) | 音频处理方法及装置 | |
CN109994127B (zh) | 音频检测方法、装置、电子设备及存储介质 | |
CN108538302B (zh) | 合成音频的方法和装置 | |
CN110688082B (zh) | 确定音量的调节比例信息的方法、装置、设备及存储介质 | |
CN108965922B (zh) | 视频封面生成方法、装置和存储介质 | |
CN110931053B (zh) | 检测录音时延、录制音频的方法、装置、终端及存储介质 | |
CN109192218B (zh) | 音频处理的方法和装置 | |
CN108335703B (zh) | 确定音频数据的重音位置的方法和装置 | |
CN109003621B (zh) | 一种音频处理方法、装置及存储介质 | |
CN108053832B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
CN109346111B (zh) | 数据处理方法、装置、终端及存储介质 | |
CN109448761B (zh) | 播放歌曲的方法和装置 | |
CN108831425B (zh) | 混音方法、装置及存储介质 | |
CN107862093B (zh) | 文件属性识别方法及装置 | |
CN111048111B (zh) | 检测音频的节奏点的方法、装置、设备及可读存储介质 | |
CN109243479B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
CN109065068B (zh) | 音频处理方法、装置及存储介质 | |
CN109192223B (zh) | 音频对齐的方法和装置 | |
CN110931048A (zh) | 语音端点检测方法、装置、计算机设备及存储介质 | |
CN111081277B (zh) | 音频测评的方法、装置、设备及存储介质 | |
CN114945892A (zh) | 播放音频的方法、装置、系统、设备及存储介质 | |
CN110867194B (zh) | 音频的评分方法、装置、设备及存储介质 | |
CN111105769B (zh) | 检测音频的中频节奏点的方法、装置、设备和存储介质 | |
CN111933098A (zh) | 伴奏音乐的生成方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |