CN109410980A - 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用 - Google Patents
一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用 Download PDFInfo
- Publication number
- CN109410980A CN109410980A CN201811494641.1A CN201811494641A CN109410980A CN 109410980 A CN109410980 A CN 109410980A CN 201811494641 A CN201811494641 A CN 201811494641A CN 109410980 A CN109410980 A CN 109410980A
- Authority
- CN
- China
- Prior art keywords
- fundamental frequency
- spectrum
- harmonic
- frequency estimation
- harmonic wave
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims abstract description 27
- 230000003595 spectral effect Effects 0.000 claims abstract description 22
- 238000012216 screening Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 11
- 230000000694 effects Effects 0.000 abstract 1
- 238000001831 conversion spectrum Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 9
- 230000009466 transformation Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 210000004704 glottis Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Auxiliary Devices For Music (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本分案申请公开了一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用,属于信号处理领域,为了解决快速、准确提取基频,并减少频谱泄露对高频谱峰的影响的问题,技术要点所述音频谐波信号基频估计算法,用常Q变换实现多分辨率谱估计,基于谐波求和能量定义折叠谐波求和谱,并将其用于初步基频筛选,通过最大后验概率法实现基频估计,效果是减少频谱泄露对高频谱峰的影响。
Description
本申请是申请号201610044926.X,申请日2016-01-22,发明名称“谐波信号基频估计算法及装置”的分案申请。
技术领域
本发明属于信号处理领域,涉及一种谐波信号基频估计算法。
背景技术
目前常用的基频估计算法包括自相关法、倒谱法、小波变换法、谐波求和法等。自相关法具有原理简单、易于实现的优点,但其计算量随着每帧信号长度成平方倍增。倒谱法在语音切换时,由于信噪比减小常导致倒谱峰严重偏离基频。小波变换法通过检测声门闭合时信号特征突变推算出基因周期,但小波变换中的多个阈值难以准确选择。谐波求和方法仅考虑到各次谐波幅度加权求和,而没有考虑到各次谐波频率可能会稍微偏离谐波整数倍,频谱泄露现象导致高频范围内信号的伪峰数量增加,及部分高频分量会被低频分量的旁瓣掩埋。
公开号为CN1342968A的中国发明专利申请公开了一种用于语音识别的高精度高分辨率基频提取方法,并具体记载了基频提取方法中具有信号分割、加窗、确定基频候选、过滤具有过低的Hper值或Rper值的步骤,最后用DP算法求基频路径。其目的是可以在时域上,对候选基频进行相关系数评测。然而,该种做法提取基频候选时,虽然可以减少DP的运算量,但是,该发明属于自相关法,仍具有计算量大,提取速度慢的缺点。
发明内容
为了解决快速、准确提取基频,并减少频谱泄露对高频谱峰的影响的问题,本发明提出了一种谐波信号基频估计算法,以提高基频提取的速度和准确性。
为了实现上述目的,本发明采用的技术方案是:一种谐波信号基频估计算法,包括:S1.对音频谐波信号作常Q变换,得常Q变换谱;S2.使用常Q变换谱计算得折叠谐波求和谱;S3.由折叠谐波求和谱的谱峰初步筛选基频;S4.建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。
有益效果:本发明所述音频谐波信号基频估计算法,用常Q变换实现多分辨率谱估计,基于常Q变换谱定义折叠谐波求和谱,并将其用于初步基频筛选。通过最大后验概率法实现基频估计,其中先验概率由折叠谐波求和谱求出,似然函数由谐波谱峰与观测频谱的匹配度确定。
音频谐波信号基频估计是信号处理领域的一项关键技术,在语音识别、音乐信号处理、水声信号处理等方面具有重要作用,本发明提出的基频估计算法可应用到各类具有谐波结构的信号的基频估计中,提出的方法能够实现频谱多分辨率分析,提出折叠谐波求和谱作为基频的初步筛选,采用最大后验概率法估计基频。该方法充分利用频谱提供的能量、谐波性、谱匹配性等信息,实现基频估计,具有运算速度快,参数少,鲁棒性强的特点。
附图说明
图1是实施例10中的一帧音乐信号图示;
图2是实施例10中的音乐信号的常Q变换谱;
图3是实施例10中的折叠谐波求和谱;
图4是实施例10中的基频后验概率密度谱;
图5是实施例11中的时域信号图示;
图6是实施例11中的常Q变换谱;
图7是实施例11中的折叠谐波求和谱;
图8是实施例11中的基频后验概率密度谱;
图9是本发明所述方法的软件流程图。
具体实施方式
实施例1:一种谐波信号基频估计算法,包括步骤:
S1.对音频谐波信号作常Q变换,得常Q变换谱;
S2.使用常Q变换谱计算得折叠谐波求和谱;
S3.由折叠谐波求和谱的谱峰初步筛选基频;
S4.建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。
本发明所述音频谐波信号基频估计算法,用常Q变换实现多分辨率谱估计,基于谐波求和能量定义折叠谐波求和谱,并将其用于初步基频筛选。通过最大后验概率法实现基频估计,其中先验概率由折叠谐波求和谱求出,似然函数由谐波谱峰与频谱的匹配度确定。
音频谐波信号基频估计是信号处理领域的一项关键技术,在语音识别、音乐信号处理、水声信号处理等方面具有重要作用,本发明提出的基频估计算法可应用到各类具有谐波结构的信号的基频估计中,提出的方法能够实现频谱多分辨率分析,提出折叠谐波求和谱作为基频的初步筛选,采用最大后验概率法估计基频。该方法充分利用频谱提供的能量、谐波性、谱匹配性等信息,实现基频估计,具有运算速度快,参数少,鲁棒性强的特点。
实施例2:具有与实施例1相同的技术方案,更为具体的,常Q变换前,可以先对音频谐波信号进行分频,加窗处理。
在所述步骤S1中,先对输入的非平稳音频谐波信号作分帧处理,然后给短时分帧信号加汉宁窗抑制旁瓣幅度,窗口长度与常Q变换的时间窗宽度一致。
实施例3:具有与实施例1或2相同的技术方案,更为具体的,所述步骤S3中,筛选规则为选取折叠谐波求和谱中的至少前3个极大值对应的频率作为候选基频,本实施例选择前3个极大值作为候选基频,实验中,候选基频数量增加,可以提高准确度,而选取3个,其准确度已经非常高。
实施例4:具有与实施例1或2或3相同的技术方案,更为具体的,步骤S1中,是根据人耳听觉特性,计算对数频率域常Q变换谱,该常Q变换谱为:
(1)式中,Q是品质因子,其为常数,N[k]为常Q变换在第k个频点对应的时间窗宽度,(1)式中,x(l,m)表示第l帧信号中的序号为m的采样点;设x1(n),n=0,1,....M-1表示长度为M,采样率为Fs的音频信号,把该音频信号截断为每段长度为N[k]的帧,若帧移为L,则第l帧信号可以表示为:
x(l,m)=x1(m+lL),m=0,1,...N[k]-1 (2)
(1)式中,wN[k](m)表示长度为N[k]的汉宁窗,即:
实施例5:具有与实施例1或2或3或4相同的技术方案,更为具体的,折叠谐波求和谱定义为:
其中:h为谐波次数,H为最高次谐波,0<α<1,XQ(k,l)为常Q变换谱,round(·)运算结果等于最近的整数,假设每倍频程取Oct个点,常Q变换分析的最低频率分量为fmin,最高频率分量为fmax,则其中ceil(·)运算结果等于正无穷方向最近的整数,常Q变换的第k个频率点对应的频率为:
实施例6:具有与实施例1或2或3或4或5相同的技术方案,更为具体的,基频后验概率密度定义为:
其中:Fi,l为第l帧的第i个基频候选,上式中p(Fi,l)为第l帧第i个基频Fi,l的先验概率,定义p(Fi,l)=Xc(Fi,l,l);上式中p(Xc(fk,l)|Fi,l)量测给定基频Fi,l得到观测常Q频谱的概率。
实施例7:具有与实施例1或2或3或4或5相同的技术方案,更为具体的,定义:
其中:
(8)式中β=0.03,若常Q谱中基频候选Fi,l的第h次谐波是谱峰则γl(h,Fi,l)为1,否则为0,故表征第l帧常Q谱中所包含的前H次谐波分量的数量。类似地,若XQ(k,l)是谱峰则λl(k)为1,否则为0,故表征第l帧常Q谱中Fi,l的前H次谐波频率范围内的所有谱峰数。
折叠谐波求和谱是基频及各次谐波分量的归一化加权和,设基频为F0,则折叠谐波求和谱在F0位置处的函数值为常Q变换在F0,2F0,3F0,...,HF0等处幅度的归一化加权和;折叠谐波求和谱在2F0位置处的函数值为常Q变换在2F0,4F0,6F0,...,2HF0等处幅度的归一化加权和。日常语音、音乐等信号主要能量集中在低频段,故即使常Q变换基频幅度小于二次谐波幅度,其折叠谐波求和谱也能在基频位置处得到较大输出。由折叠谐波求和谱中的前几个峰值得到基频候选,能够实现基频的初步筛选。
最大后验概率密度函数中的第一项定义为p(Fi,l)=Xc(Fi,l,l),即折叠谐波求和谱在Fi,l处的幅度,p(Fi,l)取折叠谐波求和谱而非常Q变换谱是因为有时候某些谐波分量的幅度会超过基频的幅度,而即使谐波幅度高于基频幅度的时候,折叠谐波求和谱在基频位置处的值仍大于高次谐波处的值,进而提高基频估计的准确率,降低误判率。
实施例8:具有与实施例1或2或3或4或5或6或7相同的技术方案,更为具体的,基频估计公式为:
实施例9:一种谐波信号基频估计算法,包括如下步骤:
1.对音频谐波信号作常Q变换,得常Q变换谱,该常Q变换谱为:
(1)式中,Q是品质因子,其为常数,N[k]为常Q变换在第k个频点对应的时间窗宽度,(1)式中,x(l,m)表示第l帧信号中的序号为m的采样点;设x1(n),n=0,1,....M-1表示长度为M,采样率为Fs的音频信号,把该音频信号截断为每段长度为N[k]的帧,若帧移为L,则第l帧信号可以表示为:
x(l,m)=x1(m+lL),m=0,1,...N[k]-1 (2)
(1)式中,wN[k](m)表示长度为N[k]的汉宁窗,即:
2.由常Q变换谱求折叠谐波求和谱,即:
其中:h为谐波次数,H为最高次谐波,0<α<1,XQ(k,l)为常Q变换谱,round(·)运算结果等于最近的整数,假设每倍频程取Oct个点,常Q变换分析的最低频率分量为fmin,最高频率分量为fmax,则其中ceil(·)运算结果等于正无穷方向最近的整数,常Q变换的第k个频率点对应的频率为:
3.从折叠谐波求和谱中得到3个最大峰值对应的频率作为基频候选,然后求各基频候选的后验概率密度,即:
其中:Fi,l为第l帧的第i个基频候选,p(Fi,l)为第l帧第i个基频Fi,l的先验概率,定义为p(Fi,l)=Xc(Fi,l,l),即折叠谐波求和谱在Fi,l处的幅度。p(Xc(fk,l)|Fi,l)量测给定基频Fi,l得到观测常Q频谱的似然函数,该似然函数定义为:
其中:
(8)式中β=0.03,若常Q谱中基频候选Fi,l的第h次谐波是谱峰则γl(h,Fil)为1,否则为0,故表征第l帧常Q谱中所包含的前H次谐波分量的数量。类似地,若XQ(k,l)是谱峰则λl(k)为1,否则为0,故表征第l帧常Q谱中Fi,l的前H次谐波频率范围内的所有谱峰数。
实施例10:本实施例对上述各实施例中的对基频估计的方法,进行实验验证:
本实施例实验是使用了上述实施例基频估计方法,对一帧音乐信号进行了基频估计,并仿真得到图1-图4,本实施例验证的情形是:信号中基频分量的幅度大于二次谐波幅度。
附图1是一帧音乐信号。
附图2是上述音乐信号的常Q变换谱:通过常Q变换谱可见有丰富的谐波分量。各次谐波分量可以清楚的看出来,常Q谱仅在各频率分量处有很窄的谱线,频谱泄露不明显。
附图3是折叠谐波求和谱:折叠谐波求和谱能增加基频和各次谐波分量的差异。从中选出具有最大折叠谐波幅度的三个频率作为候选基频,本图中被选出来的候选基频分别对应原时域信号的基频、二次谐波和三次谐波分量,然后求这三个候选基频的后验概率密度。
附图4是基频后验概率密度谱:把具有最大后验概率密度的候选基频,即181.45Hz频率被选为最终的基频,与事实吻合。
从附图1-附图4可见常Q变换能有效抑制频谱泄露,突出信号中的各个频率分量。本发明步骤(2)-(4)都基于常Q谱,且折叠谐波求和谱中仅取少量(3个)具有较大折叠谐波求和能量的基频候选参与最大后验概率密度计算,具有较少的运算量,计算复杂度低,可快速实现。实验结果表明,由于谐波信号具有良好的谐波性,构建的最大后验概率函数能准确映射出候选基频的各次谐波与观测频谱的匹配关系,能准确筛选出谐波信号的基频。
实施例11:本实施例适用的实验情形是:一帧音乐信号中基频分量的幅度小于二次谐波幅度。
该帧音乐信号时域信号如图5所示;
常Q变换谱如图6所示;
折叠谐波求和谱如图7所示,虽然实际基频分量的幅度小于二次谐波分量的幅度,但折叠谐波求和谱中基频对应的幅度已经被大幅度放大,并超过二次谐波的幅度;
基频后验概率密度谱如图8所示;由上述实验附图可见,在基频幅度小于谐波幅度的情况下,本方法仍能够准确估计出基频。
实施例12:一种谐波信号基频估计装置,包括:常Q变换模块,对音频谐波信号作常Q变换,得常Q变换谱;折叠谐波求和谱计算模块,使用常Q变换谱计算得折叠谐波求和谱;初步筛选基频模块,由折叠谐波求和谱的谱峰初步筛选基频;
谐波信号基频输出模块,建立基频候选的后验概率密度函数,根据最大后验概率准则提取并输出谐波信号基频。本实施例所述的装置,用以执行实施例1-9所述的方法,实施例1-9中的技术方案适用于本实施例。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (4)
1.一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用。
2.如权利要求1所述的应用,其特征在于:所述音频谐波信号基频估计算法,用常Q变换实现多分辨率谱估计,基于谐波求和能量定义折叠谐波求和谱,并将其用于初步基频筛选,通过最大后验概率法实现基频估计。
3.如权利要求2所述的应用,其特征在于:先验概率由折叠谐波求和谱求出,似然函数由谐波谱峰与频谱的匹配度确定。
4.一种基频估计算法在语音识别、音乐信号处理、水声信号处理中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811494641.1A CN109410980A (zh) | 2016-01-22 | 2016-01-22 | 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811494641.1A CN109410980A (zh) | 2016-01-22 | 2016-01-22 | 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用 |
CN201610044926.XA CN105551501B (zh) | 2016-01-22 | 2016-01-22 | 谐波信号基频估计算法及装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610044926.XA Division CN105551501B (zh) | 2016-01-22 | 2016-01-22 | 谐波信号基频估计算法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109410980A true CN109410980A (zh) | 2019-03-01 |
Family
ID=55830649
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610044926.XA Active CN105551501B (zh) | 2016-01-22 | 2016-01-22 | 谐波信号基频估计算法及装置 |
CN201811495768.5A Pending CN109524023A (zh) | 2016-01-22 | 2016-01-22 | 一种对基频估计实验验证的方法 |
CN201811494657.2A Pending CN109493880A (zh) | 2016-01-22 | 2016-01-22 | 一种谐波信号基频初步筛选的方法 |
CN201811494641.1A Pending CN109410980A (zh) | 2016-01-22 | 2016-01-22 | 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610044926.XA Active CN105551501B (zh) | 2016-01-22 | 2016-01-22 | 谐波信号基频估计算法及装置 |
CN201811495768.5A Pending CN109524023A (zh) | 2016-01-22 | 2016-01-22 | 一种对基频估计实验验证的方法 |
CN201811494657.2A Pending CN109493880A (zh) | 2016-01-22 | 2016-01-22 | 一种谐波信号基频初步筛选的方法 |
Country Status (1)
Country | Link |
---|---|
CN (4) | CN105551501B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113933590A (zh) * | 2020-07-14 | 2022-01-14 | 森兰信息科技(上海)有限公司 | 波的频谱的计算方法、系统、介质及装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107122332B (zh) * | 2017-05-02 | 2020-08-21 | 大连民族大学 | 一维信号二维谱变换方法、伪双谱及其应用 |
CN107833581B (zh) * | 2017-10-20 | 2021-04-13 | 广州酷狗计算机科技有限公司 | 一种提取声音的基音频率的方法、装置及可读存储介质 |
CN108363109B (zh) * | 2018-01-12 | 2019-06-21 | 吉林大学 | 地面核磁共振数据的谐波干扰基频快速搜索方法 |
CN111855192B (zh) * | 2020-07-31 | 2021-04-23 | 北京航空航天大学 | 一种用于编码器信号去噪的奇异值分解方法 |
CN112307931A (zh) * | 2020-10-26 | 2021-02-02 | 西安电子科技大学 | 一种基于模板匹配技术的电磁信息泄漏快速检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IN177084B (zh) * | 1991-05-27 | 1996-11-02 | Satake Eng Co Ltd | |
CN1342968A (zh) * | 2000-09-13 | 2002-04-03 | 中国科学院自动化研究所 | 用于语音识别的高精度高分辨率基频提取方法 |
US20080215321A1 (en) * | 2007-03-01 | 2008-09-04 | Microsoft Corporation | Pitch model for noise estimation |
US20100097888A1 (en) * | 2007-04-10 | 2010-04-22 | Exxonmobil Upstream Research Company | Separation and Noise Removal for Multiple Vibratory Source Seismic Data |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3091343B2 (ja) * | 1993-03-01 | 2000-09-25 | 株式会社河合楽器製作所 | 電子楽器 |
FR2853125A1 (fr) * | 2003-03-27 | 2004-10-01 | France Telecom | Procede d'analyse d'informations de frequence fondamentale et procede et systeme de conversion de voix mettant en oeuvre un tel procede d'analyse. |
DE102006008260B3 (de) * | 2006-02-22 | 2007-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Analyse eines Audiodatums |
JP4630980B2 (ja) * | 2006-09-04 | 2011-02-09 | 独立行政法人産業技術総合研究所 | 音高推定装置、音高推定方法およびプログラム |
JP4322283B2 (ja) * | 2007-02-26 | 2009-08-26 | 独立行政法人産業技術総合研究所 | 演奏判定装置およびプログラム |
CN101159136A (zh) * | 2007-11-13 | 2008-04-09 | 中国传媒大学 | 一种低比特率音乐信号编码方法 |
JP2011065041A (ja) * | 2009-09-18 | 2011-03-31 | Brother Industries Ltd | 基本周波数推定装置、採譜装置、及びプログラム |
CN102054480B (zh) * | 2009-10-29 | 2012-05-30 | 北京理工大学 | 一种基于分数阶傅立叶变换的单声道混叠语音分离方法 |
US8716586B2 (en) * | 2010-04-05 | 2014-05-06 | Etienne Edmond Jacques Thuillier | Process and device for synthesis of an audio signal according to the playing of an instrumentalist that is carried out on a vibrating body |
RU2587652C2 (ru) * | 2010-11-10 | 2016-06-20 | Конинклейке Филипс Электроникс Н.В. | Способ и устройство для оценки структуры в сигнале |
EP2685448B1 (en) * | 2012-07-12 | 2018-09-05 | Harman Becker Automotive Systems GmbH | Engine sound synthesis |
CN104036785A (zh) * | 2013-03-07 | 2014-09-10 | 索尼公司 | 语音信号的处理方法和装置、以及语音信号的分析系统 |
JP2014219607A (ja) * | 2013-05-09 | 2014-11-20 | ソニー株式会社 | 音楽信号処理装置および方法、並びに、プログラム |
GB201310861D0 (en) * | 2013-06-18 | 2013-07-31 | Nokia Corp | Audio signal analysis |
CN104538024B (zh) * | 2014-12-01 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 语音合成方法、装置及设备 |
-
2016
- 2016-01-22 CN CN201610044926.XA patent/CN105551501B/zh active Active
- 2016-01-22 CN CN201811495768.5A patent/CN109524023A/zh active Pending
- 2016-01-22 CN CN201811494657.2A patent/CN109493880A/zh active Pending
- 2016-01-22 CN CN201811494641.1A patent/CN109410980A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IN177084B (zh) * | 1991-05-27 | 1996-11-02 | Satake Eng Co Ltd | |
CN1342968A (zh) * | 2000-09-13 | 2002-04-03 | 中国科学院自动化研究所 | 用于语音识别的高精度高分辨率基频提取方法 |
US20080215321A1 (en) * | 2007-03-01 | 2008-09-04 | Microsoft Corporation | Pitch model for noise estimation |
US20100097888A1 (en) * | 2007-04-10 | 2010-04-22 | Exxonmobil Upstream Research Company | Separation and Noise Removal for Multiple Vibratory Source Seismic Data |
Non-Patent Citations (8)
Title |
---|
M. SAITOU: "A control strategy of single-phase active filter using a novel d-q transformation", 《38TH IAS ANNUAL MEETING ON CONFERENCE RECORD OF THE INDUSTRY APPLICATIONS CONFERENCE, 2003.》 * |
万玉龙: "基于非负矩阵分解的钢琴多音符估计", 《网络新媒体技术》 * |
傅林: "微弱信号检测理论技术简介", 《智能仪器理论、设计和应用》 * |
张红等: "一种频域基频提取新方法", 《声学学报(中文版)》 * |
郑贵滨等: "基于谐波结构信息的自动音乐标注方法", 《计算机研究与发展》 * |
郭奕等: "自动音乐标注系统综述", 《计算机应用研究》 * |
金学成等: "修正倒谱和动态规划的基频估计算法", 《声学技术》 * |
钱勇等: "多谐波信号的基频估计", 《桂林电子科技大学学报》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113933590A (zh) * | 2020-07-14 | 2022-01-14 | 森兰信息科技(上海)有限公司 | 波的频谱的计算方法、系统、介质及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109524023A (zh) | 2019-03-26 |
CN105551501B (zh) | 2019-03-15 |
CN105551501A (zh) | 2016-05-04 |
CN109493880A (zh) | 2019-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105551501B (zh) | 谐波信号基频估计算法及装置 | |
CN103854662B (zh) | 基于多域联合估计的自适应语音检测方法 | |
CN106486131B (zh) | 一种语音去噪的方法及装置 | |
Wu et al. | Improved MFCC-based feature for robust speaker identification | |
CN102054480B (zh) | 一种基于分数阶傅立叶变换的单声道混叠语音分离方法 | |
CN111128213B (zh) | 一种分频段进行处理的噪声抑制方法及其系统 | |
CN109256127B (zh) | 一种基于非线性幂变换Gammachirp滤波器的鲁棒语音特征提取方法 | |
CN103594094B (zh) | 自适应谱减法实时语音增强 | |
Jang et al. | A probabilistic approach to single channel blind signal separation | |
TW201108201A (en) | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal | |
Benaroya et al. | Wiener based source separation with HMM/GMM using a single sensor | |
CN111899750B (zh) | 联合耳蜗语音特征和跳变深层神经网络的语音增强算法 | |
CN103021405A (zh) | 基于music和调制谱滤波的语音信号动态特征提取方法 | |
CN106373559A (zh) | 一种基于对数谱信噪比加权的鲁棒特征提取方法 | |
CN112086100A (zh) | 基于量化误差熵的多层随机神经网络的城市噪音识别方法 | |
CN105679321A (zh) | 语音识别方法、装置及终端 | |
Dang et al. | Noise reduction using modified phase spectra and Wiener Filter | |
CN103971697A (zh) | 基于非局部均值滤波的语音增强方法 | |
Hansson-Sandsten et al. | Optimal cepstrum estimation using multiple windows | |
Nasr et al. | Efficient implementation of adaptive wiener filter for pitch detection from noisy speech signals | |
CN106971733A (zh) | 基于语音降噪的声纹识别的方法及系统以及智能终端 | |
Ma et al. | A fast instantaneous frequency estimation for underwater acoustic target feature extraction | |
Sfeclis et al. | Investigating Imaginary Mask Estimation in Complex Masking for Speech Enhancement | |
Xuhong et al. | Speech enhancement using convolution neural network-based spectrogram denoising | |
Yu et al. | A weighted log kurtosis ratio measure for instrumental musical tones assessment in wideband speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190301 |