CN101067928A - 测量语音波形相似度的一种新方法 - Google Patents

测量语音波形相似度的一种新方法 Download PDF

Info

Publication number
CN101067928A
CN101067928A CNA200710122626XA CN200710122626A CN101067928A CN 101067928 A CN101067928 A CN 101067928A CN A200710122626X A CNA200710122626X A CN A200710122626XA CN 200710122626 A CN200710122626 A CN 200710122626A CN 101067928 A CN101067928 A CN 101067928A
Authority
CN
China
Prior art keywords
voice signal
similarity
similar
waveforms
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200710122626XA
Other languages
English (en)
Inventor
章森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNA200710122626XA priority Critical patent/CN101067928A/zh
Publication of CN101067928A publication Critical patent/CN101067928A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

一种测量语音波形相似度的新方法,其特点是:完全基于时域实现,计算量小,抗噪声性好,准确度高;其基本思想是:对一段语音信号x(t),首先找出两个相邻的过零点t1和t2(且t1<t2);在区间[t1,t2]上,用平行于横轴的直线将语音信号x(t)切分成互不重叠的N部分,计算每一部分的面积,然后将这N部分的面积按顺序作成一个N维向量;对另一段语音信号也做类似的处理,得到另一个N维向量;计算两个N维向量的距离就可以得到两个语音波形的相似度。如果两个N维向量的对应分量成比例,则可以判断两个语音波形经放大或缩小后相似(即相对相似)。本发明的语音波形相似度测量方法,不仅能测量语音波形的绝对相似度,而且能够测量语音波形的相对相似度(即语音波形经放大或缩小后的相似度),可以用于语音信号的基音检测,语音信号的高质量压缩与还原,非线性特征抽取等方面,对语音信号处理有多方面的影响。

Description

测量语音波形相似度的一种新方法
所属技术领域
本发明涉及一种语音信号的处理技术,属于语音信号处理领域。
背景技术
语音信号是一种非平稳的随机信号,可以用随时间变化的一维波形来描述。从语音信号的波形分析,可以大致分为两类:一类是辅音,其波形类似于噪声;另一类是元音,其波形类似于准周期信号。目前,判断两个语音波形是否相似一般采用相关性检测的方法,或者类似的方法。由于语音信号的时变特性,基于相关性检测的方法往往对语音波形的相似性判断准确性不高。另外一类判断两个语音波形是否相似的办法是变换域法,即把时域波形的相似性问题变换为等价的频域的相似性问题。变换域法同样也存在判断准确性不高的问题,同时还带来计算量增加的问题。为了解决上述问题,我们设计实现了一种测量语音波形相似度的新方法,其特点是:完全基于时域实现,计算量小,抗噪声性好,准确度高。本发明的语音波形相似度测量方法,不仅能测量语音波形的绝对相似度,而且能够测量语音波形的相对相似度(即语音波形经放大或缩小后的相似度),可以用于语音信号的基音检测,语音信号的高质量压缩与还原,非线性特征抽取等方面,对语音信号处理有多方面的影响。
发明内容
本发明是一种基于时域的语音信号处理技术,用来测量两个语音波形的相似度,其基本思想是:对一段语音信号x(t),首先找出两个相邻的过零点t1和t2(且t1<t2);在区间[t1,t2]上,用平行于横轴的直线将语音信号x(t)切分成互不重叠的N部分,计算每一部分的面积,然后将这N部分的面积按顺序作成一个N维向量;对另一段语音信号也做类似的处理,得到另一个N维向量;计算两个N维向量的距离就可以得到两个语音波形的相似度。如果两个N维向量的对应分量成比例,则可以判断两个语音波形经放大或缩小后相似(即相对相似)。
本发明的技术方案是:数字化后的语音信号用一个有限序列{x(n)}表示,其中n表示语音样本的序号,x(n)表示第n个样本点的取值。语音信号x(n)的取值有三种情况:正数,负数,零。正数表示波形在时间轴上方,负数表示波形在时间轴下方。语音信号x(n)的过零点有两类情况:一类是x(n)正好为零,那么这是称n为过零点的位置;一类是x(n)和x(n+1)都不为零,但它们的符号相反,这时称在x(n)和x(n+1)之间存在过零点,这个过零点的位置可以通过插值计算近似得到。
对一段离散化的语音信号x(t),首先找出两个相邻的过零点t1和t2(且t1<t2);在区间[t1,t2]上,语音信号x(t)要么全大于0,要么全小于0,不妨设x(t)全大于0;找出语音信号x(t)在区间[t1,t2]上的最大值(如果x(t)全小于0则找出最小值),不妨设最大值为x(t0);在横轴(时间轴)到x(t0)之间,用平行于横轴的直线将语音信号x(t)在区间[t1,t2]上图像分为N部分,每一部分类似于梯形,其上下底边都是直线,但左右边是曲线,对这样的每一部分采用近似算法计算其面积;然后将这N部分的面积按顺序作成一个N维向量;对另一段语音信号也做类似的处理,得到另一个N维向量;然后计算两个N维向量的距离就可以得到两个语音波形的相似度。如果两个N维向量的对应分量成比例,则可以判断两个语音波形经放大或缩小后相似(即相对相似)。

Claims (3)

1.本发明涉及一种测量语音波形相似度的新方法,其特征是:对于两个相邻的过零点之间的语音信号的图像分块计算面积。
2.根据权利要求1,语音信号的图像分块计算面积的技术特征是:语音信号的图像被平行于横轴(时间轴)的直线切分成N部分,每一部分类似于梯形,其上下底边都是直线,但左右边是曲线,对这样的每一部分采用近似算法计算其面积。
3.根据权利要求1和权利要求2,对语音信号的图像分成N块并计算每一块的面积后,可以将这N部分的面积按顺序作成一个N维向量;对另一段语音信号也做类似的处理,得到另一个N维向量;计算两个N维向量的距离就可以得到两个语音波形的相似度。如果两个N维向量的对应分量成比例,则可以判断两个语音波形经放大或缩小后相似(即相对相似)。
CNA200710122626XA 2007-07-10 2007-07-10 测量语音波形相似度的一种新方法 Pending CN101067928A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA200710122626XA CN101067928A (zh) 2007-07-10 2007-07-10 测量语音波形相似度的一种新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA200710122626XA CN101067928A (zh) 2007-07-10 2007-07-10 测量语音波形相似度的一种新方法

Publications (1)

Publication Number Publication Date
CN101067928A true CN101067928A (zh) 2007-11-07

Family

ID=38880460

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200710122626XA Pending CN101067928A (zh) 2007-07-10 2007-07-10 测量语音波形相似度的一种新方法

Country Status (1)

Country Link
CN (1) CN101067928A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105933761A (zh) * 2016-06-24 2016-09-07 中译语通科技(北京)有限公司 一种新型视听节目广告投播方法
CN111916083A (zh) * 2020-08-20 2020-11-10 绍兴市麦芒智能科技有限公司 一种通过大数据采集的智能设备语音指令识别算法
CN112345978A (zh) * 2020-10-27 2021-02-09 云南电网有限责任公司临沧供电局 基于配电变压器低压侧两相注入脉冲的接地故障定位方法
CN112379178A (zh) * 2020-10-28 2021-02-19 国网安徽省电力有限公司合肥供电公司 存在延时的两种波形相似度判断方法、系统及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105933761A (zh) * 2016-06-24 2016-09-07 中译语通科技(北京)有限公司 一种新型视听节目广告投播方法
CN105933761B (zh) * 2016-06-24 2019-02-26 中译语通科技股份有限公司 一种新型视听节目广告投播方法
CN111916083A (zh) * 2020-08-20 2020-11-10 绍兴市麦芒智能科技有限公司 一种通过大数据采集的智能设备语音指令识别算法
CN111916083B (zh) * 2020-08-20 2023-08-22 北京基智科技有限公司 一种通过大数据采集的智能设备语音指令识别算法
CN112345978A (zh) * 2020-10-27 2021-02-09 云南电网有限责任公司临沧供电局 基于配电变压器低压侧两相注入脉冲的接地故障定位方法
CN112345978B (zh) * 2020-10-27 2024-02-06 云南电网有限责任公司临沧供电局 基于配电变压器低压侧两相注入脉冲的接地故障定位方法
CN112379178A (zh) * 2020-10-28 2021-02-19 国网安徽省电力有限公司合肥供电公司 存在延时的两种波形相似度判断方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN106941008B (zh) 一种基于静音段的异源音频拼接篡改盲检测方法
CN106653056B (zh) 基于lstm循环神经网络的基频提取模型及训练方法
CN109545188A (zh) 一种实时语音端点检测方法及装置
CN108986824B (zh) 一种回放语音检测方法
CN102116798A (zh) 一种电网频率测量方法及装置
CN107064629B (zh) 一种基于频率相对偏差预估的分段综合单频信号频率估计方法
CN101426169B (zh) 一种快速检测发声体声响应参数的时域跟踪滤波器及系统
CN1151490C (zh) 用于语音识别的高精度高分辨率基频提取方法
CN106328168B (zh) 一种语音信号相似度检测方法
CN104616663A (zh) 一种结合hpss的mfcc-多反复模型的音乐分离方法
CN101373593A (zh) 语音分析设备、语音分析方法和计算机程序
CN104143324A (zh) 一种乐音音符识别方法
CN101067928A (zh) 测量语音波形相似度的一种新方法
Li et al. Speech endpoint detection method based on TEO in noisy environment
CN110568073B (zh) 一种在噪声环境中拾取击打信号的方法
US10068558B2 (en) Method and installation for processing a sequence of signals for polyphonic note recognition
CN106205637A (zh) 音频信号的噪声检测方法与装置
KR101483513B1 (ko) 음원위치추적장치 및 음원위치추적방법
CN105989837B (zh) 音频匹配方法及装置
CN102737645A (zh) 一种语音信号的基音周期估计算法
Bouzid et al. Voice source parameter measurement based on multi-scale analysis of electroglottographic signal
Stöter et al. Refining fundamental frequency estimates using time warping
CN107741263A (zh) 基于频域信息融合的液位估计方法
CN104808055A (zh) 一种电信号频率的数字化测量方法
CN108830232B (zh) 一种基于多尺度非线性能量算子的语音信号周期分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
DD01 Delivery of document by public notice

Addressee: Zhang Sen

Document name: Notification that Application Deemed to be Withdrawn

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20071107