CN101067928A - 测量语音波形相似度的一种新方法 - Google Patents
测量语音波形相似度的一种新方法 Download PDFInfo
- Publication number
- CN101067928A CN101067928A CNA200710122626XA CN200710122626A CN101067928A CN 101067928 A CN101067928 A CN 101067928A CN A200710122626X A CNA200710122626X A CN A200710122626XA CN 200710122626 A CN200710122626 A CN 200710122626A CN 101067928 A CN101067928 A CN 101067928A
- Authority
- CN
- China
- Prior art keywords
- voice signal
- similarity
- similar
- waveforms
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
一种测量语音波形相似度的新方法,其特点是:完全基于时域实现,计算量小,抗噪声性好,准确度高;其基本思想是:对一段语音信号x(t),首先找出两个相邻的过零点t1和t2(且t1<t2);在区间[t1,t2]上,用平行于横轴的直线将语音信号x(t)切分成互不重叠的N部分,计算每一部分的面积,然后将这N部分的面积按顺序作成一个N维向量;对另一段语音信号也做类似的处理,得到另一个N维向量;计算两个N维向量的距离就可以得到两个语音波形的相似度。如果两个N维向量的对应分量成比例,则可以判断两个语音波形经放大或缩小后相似(即相对相似)。本发明的语音波形相似度测量方法,不仅能测量语音波形的绝对相似度,而且能够测量语音波形的相对相似度(即语音波形经放大或缩小后的相似度),可以用于语音信号的基音检测,语音信号的高质量压缩与还原,非线性特征抽取等方面,对语音信号处理有多方面的影响。
Description
所属技术领域
本发明涉及一种语音信号的处理技术,属于语音信号处理领域。
背景技术
语音信号是一种非平稳的随机信号,可以用随时间变化的一维波形来描述。从语音信号的波形分析,可以大致分为两类:一类是辅音,其波形类似于噪声;另一类是元音,其波形类似于准周期信号。目前,判断两个语音波形是否相似一般采用相关性检测的方法,或者类似的方法。由于语音信号的时变特性,基于相关性检测的方法往往对语音波形的相似性判断准确性不高。另外一类判断两个语音波形是否相似的办法是变换域法,即把时域波形的相似性问题变换为等价的频域的相似性问题。变换域法同样也存在判断准确性不高的问题,同时还带来计算量增加的问题。为了解决上述问题,我们设计实现了一种测量语音波形相似度的新方法,其特点是:完全基于时域实现,计算量小,抗噪声性好,准确度高。本发明的语音波形相似度测量方法,不仅能测量语音波形的绝对相似度,而且能够测量语音波形的相对相似度(即语音波形经放大或缩小后的相似度),可以用于语音信号的基音检测,语音信号的高质量压缩与还原,非线性特征抽取等方面,对语音信号处理有多方面的影响。
发明内容
本发明是一种基于时域的语音信号处理技术,用来测量两个语音波形的相似度,其基本思想是:对一段语音信号x(t),首先找出两个相邻的过零点t1和t2(且t1<t2);在区间[t1,t2]上,用平行于横轴的直线将语音信号x(t)切分成互不重叠的N部分,计算每一部分的面积,然后将这N部分的面积按顺序作成一个N维向量;对另一段语音信号也做类似的处理,得到另一个N维向量;计算两个N维向量的距离就可以得到两个语音波形的相似度。如果两个N维向量的对应分量成比例,则可以判断两个语音波形经放大或缩小后相似(即相对相似)。
本发明的技术方案是:数字化后的语音信号用一个有限序列{x(n)}表示,其中n表示语音样本的序号,x(n)表示第n个样本点的取值。语音信号x(n)的取值有三种情况:正数,负数,零。正数表示波形在时间轴上方,负数表示波形在时间轴下方。语音信号x(n)的过零点有两类情况:一类是x(n)正好为零,那么这是称n为过零点的位置;一类是x(n)和x(n+1)都不为零,但它们的符号相反,这时称在x(n)和x(n+1)之间存在过零点,这个过零点的位置可以通过插值计算近似得到。
对一段离散化的语音信号x(t),首先找出两个相邻的过零点t1和t2(且t1<t2);在区间[t1,t2]上,语音信号x(t)要么全大于0,要么全小于0,不妨设x(t)全大于0;找出语音信号x(t)在区间[t1,t2]上的最大值(如果x(t)全小于0则找出最小值),不妨设最大值为x(t0);在横轴(时间轴)到x(t0)之间,用平行于横轴的直线将语音信号x(t)在区间[t1,t2]上图像分为N部分,每一部分类似于梯形,其上下底边都是直线,但左右边是曲线,对这样的每一部分采用近似算法计算其面积;然后将这N部分的面积按顺序作成一个N维向量;对另一段语音信号也做类似的处理,得到另一个N维向量;然后计算两个N维向量的距离就可以得到两个语音波形的相似度。如果两个N维向量的对应分量成比例,则可以判断两个语音波形经放大或缩小后相似(即相对相似)。
Claims (3)
1.本发明涉及一种测量语音波形相似度的新方法,其特征是:对于两个相邻的过零点之间的语音信号的图像分块计算面积。
2.根据权利要求1,语音信号的图像分块计算面积的技术特征是:语音信号的图像被平行于横轴(时间轴)的直线切分成N部分,每一部分类似于梯形,其上下底边都是直线,但左右边是曲线,对这样的每一部分采用近似算法计算其面积。
3.根据权利要求1和权利要求2,对语音信号的图像分成N块并计算每一块的面积后,可以将这N部分的面积按顺序作成一个N维向量;对另一段语音信号也做类似的处理,得到另一个N维向量;计算两个N维向量的距离就可以得到两个语音波形的相似度。如果两个N维向量的对应分量成比例,则可以判断两个语音波形经放大或缩小后相似(即相对相似)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200710122626XA CN101067928A (zh) | 2007-07-10 | 2007-07-10 | 测量语音波形相似度的一种新方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200710122626XA CN101067928A (zh) | 2007-07-10 | 2007-07-10 | 测量语音波形相似度的一种新方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101067928A true CN101067928A (zh) | 2007-11-07 |
Family
ID=38880460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200710122626XA Pending CN101067928A (zh) | 2007-07-10 | 2007-07-10 | 测量语音波形相似度的一种新方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101067928A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105933761A (zh) * | 2016-06-24 | 2016-09-07 | 中译语通科技(北京)有限公司 | 一种新型视听节目广告投播方法 |
CN111916083A (zh) * | 2020-08-20 | 2020-11-10 | 绍兴市麦芒智能科技有限公司 | 一种通过大数据采集的智能设备语音指令识别算法 |
CN112345978A (zh) * | 2020-10-27 | 2021-02-09 | 云南电网有限责任公司临沧供电局 | 基于配电变压器低压侧两相注入脉冲的接地故障定位方法 |
CN112379178A (zh) * | 2020-10-28 | 2021-02-19 | 国网安徽省电力有限公司合肥供电公司 | 存在延时的两种波形相似度判断方法、系统及存储介质 |
-
2007
- 2007-07-10 CN CNA200710122626XA patent/CN101067928A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105933761A (zh) * | 2016-06-24 | 2016-09-07 | 中译语通科技(北京)有限公司 | 一种新型视听节目广告投播方法 |
CN105933761B (zh) * | 2016-06-24 | 2019-02-26 | 中译语通科技股份有限公司 | 一种新型视听节目广告投播方法 |
CN111916083A (zh) * | 2020-08-20 | 2020-11-10 | 绍兴市麦芒智能科技有限公司 | 一种通过大数据采集的智能设备语音指令识别算法 |
CN111916083B (zh) * | 2020-08-20 | 2023-08-22 | 北京基智科技有限公司 | 一种通过大数据采集的智能设备语音指令识别算法 |
CN112345978A (zh) * | 2020-10-27 | 2021-02-09 | 云南电网有限责任公司临沧供电局 | 基于配电变压器低压侧两相注入脉冲的接地故障定位方法 |
CN112345978B (zh) * | 2020-10-27 | 2024-02-06 | 云南电网有限责任公司临沧供电局 | 基于配电变压器低压侧两相注入脉冲的接地故障定位方法 |
CN112379178A (zh) * | 2020-10-28 | 2021-02-19 | 国网安徽省电力有限公司合肥供电公司 | 存在延时的两种波形相似度判断方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106941008B (zh) | 一种基于静音段的异源音频拼接篡改盲检测方法 | |
CN106653056B (zh) | 基于lstm循环神经网络的基频提取模型及训练方法 | |
CN109545188A (zh) | 一种实时语音端点检测方法及装置 | |
CN108986824B (zh) | 一种回放语音检测方法 | |
CN102116798A (zh) | 一种电网频率测量方法及装置 | |
CN107064629B (zh) | 一种基于频率相对偏差预估的分段综合单频信号频率估计方法 | |
CN101426169B (zh) | 一种快速检测发声体声响应参数的时域跟踪滤波器及系统 | |
CN1151490C (zh) | 用于语音识别的高精度高分辨率基频提取方法 | |
CN106328168B (zh) | 一种语音信号相似度检测方法 | |
CN104616663A (zh) | 一种结合hpss的mfcc-多反复模型的音乐分离方法 | |
CN101373593A (zh) | 语音分析设备、语音分析方法和计算机程序 | |
CN104143324A (zh) | 一种乐音音符识别方法 | |
CN101067928A (zh) | 测量语音波形相似度的一种新方法 | |
Li et al. | Speech endpoint detection method based on TEO in noisy environment | |
CN110568073B (zh) | 一种在噪声环境中拾取击打信号的方法 | |
US10068558B2 (en) | Method and installation for processing a sequence of signals for polyphonic note recognition | |
CN106205637A (zh) | 音频信号的噪声检测方法与装置 | |
KR101483513B1 (ko) | 음원위치추적장치 및 음원위치추적방법 | |
CN105989837B (zh) | 音频匹配方法及装置 | |
CN102737645A (zh) | 一种语音信号的基音周期估计算法 | |
Bouzid et al. | Voice source parameter measurement based on multi-scale analysis of electroglottographic signal | |
Stöter et al. | Refining fundamental frequency estimates using time warping | |
CN107741263A (zh) | 基于频域信息融合的液位估计方法 | |
CN104808055A (zh) | 一种电信号频率的数字化测量方法 | |
CN108830232B (zh) | 一种基于多尺度非线性能量算子的语音信号周期分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
DD01 | Delivery of document by public notice |
Addressee: Zhang Sen Document name: Notification that Application Deemed to be Withdrawn |
|
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20071107 |