CN113257278B - 一种带阻尼系数的音频信号瞬时相位的检测方法 - Google Patents
一种带阻尼系数的音频信号瞬时相位的检测方法 Download PDFInfo
- Publication number
- CN113257278B CN113257278B CN202110471221.7A CN202110471221A CN113257278B CN 113257278 B CN113257278 B CN 113257278B CN 202110471221 A CN202110471221 A CN 202110471221A CN 113257278 B CN113257278 B CN 113257278B
- Authority
- CN
- China
- Prior art keywords
- value
- phase
- time slice
- pcm data
- stereo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013016 damping Methods 0.000 title claims abstract description 18
- 230000005236 sound signal Effects 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 title claims abstract description 12
- 230000003247 decreasing effect Effects 0.000 claims abstract description 4
- 238000005070 sampling Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 2
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R25/00—Arrangements for measuring phase angle between a voltage and a current or between voltages or currents
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Stereophonic System (AREA)
Abstract
本发明公开了一种带阻尼系数的音频信号瞬时相位的检测方法,其包括以下步骤:S001、从时间片中按序取出一个立体声PCM数据分离出左右声道;S002、当左右声道音量值至少有一个低于有效音量门限L时,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,否则返回S001;如果左右声道音量值均不低于L,进入步骤S003;S003、当左右声道PCM数值均为正值或均为负值时,同相统计数CS增大1,否则CS减小1;S004、有效音量统计数S增大1,如果当前所处理的为最后一个数据,进入步骤S005,否则返回S001;S005、计算本时间片的相位值。本方案适用于立体声音频信号的瞬时相位检测。
Description
技术领域
本发明涉及数字信号处理领域,尤其是涉及一种带阻尼系数的音频信号瞬时相位的检测方法。
背景技术
在通常的立体声音频信号瞬时相位检测中,通常是不带阻尼系数的,导致的结果是音频信号相位值变化太快且忽高忽低,在有些情况下相位指示器频繁显红,而实际上音频信号并没有很多相位差现象,这给操作人员带来了较大困扰。
发明内容
本发明主要是解决现有技术所存在的在立体声音频信号瞬时相位检测时显示值完全按照当前信号的相位值,变化过于频繁,参考价值较低的技术问题,提供一种变化率更合理、更具有参考价值的带阻尼系数的音频信号瞬时相位的检测方法。
本发明针对上述技术问题主要是通过下述技术方案得以解决的:一种带阻尼系数的音频信号瞬时相位的检测方法,包括以下步骤:
S001、从时间片中按序取出一个立体声PCM数据,将立体声PCM数据分离出左右声道,提取左声道的音量值和右声道的音量值;
S002、当左声道音量值或右声道音量值至少有一个低于有效音量门限L时,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,如果不为最后一个则返回步骤S001提取下一个立体声PCM数据;如果左声道音量值和右声道音量值均不低于有效音量门限值L时,进入步骤S003;
S003、当左声道PCM数值和右声道PCM数值均为正值或均为负值时,同相统计数CS增大1,否则同相统计数CS减小1;进入步骤S004;
S004、有效音量统计数S增大1,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,否则返回步骤S001提取下一个立体声PCM数据;
S005、计算本时间片的相位值。
作为优选,步骤S005中,时间片的相位值CV由以下公式计算得到:
式中,f为阻尼系数,LV为上一个时间片的相位值,如果当前时间片为第一个时间片,则LV为0。
作为优选,步骤S001中,按以下公式计算音量值:
式中,b为PCM数据的精度位数,y(i)为当前处理的PCM数值,也就是左右声道分离之后,当前计算的声道对应的数值,i的取值范围是1至N,N为时间片中的采样点个数。
作为优选,步骤S002中,有效音量门限L为-48dBFS。低于-48dBFS的信号如果参与计算相位则容易误判。
作为优选,阻尼系数f为0.3。
计算得到的相位值可以用于给指示器显示实时相位,指示器的范围是[-100,100],指示器在此范围内来回波动;相位值还可以用于对音频文件或音频实时信号进行反相报警,例如时间片设为24毫秒,连续统计一定持续时长(如15秒)的所有时间片的相位低于-20的百分数比,如果大于40%则判定该文件或信号存在反相。
本发明带来的实质性效果是,可以有效降低误判率,引入阻尼系数有效解决瞬时相位变化太快忽高忽低的弊病,给操作人员带来较为真实的判断。
附图说明
图1是本发明的一种流程图。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。
实施例:本实施例的一种带阻尼系数的音频信号瞬时相位的检测方法,如图1所示,包括以下步骤:
S001、从时间片中按序取出一个立体声PCM数据,将立体声PCM数据分离出左右声道,提取左声道的音量值和右声道的音量值;
S002、当左声道音量值或右声道音量值至少有一个低于有效音量门限L时,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,如果不为最后一个则返回步骤S001提取下一个立体声PCM数据;如果左声道音量值和右声道音量值均不低于有效音量门限值L时,进入步骤S003;
S003、当左声道PCM数值和右声道PCM数值均为正值或均为负值时,同相统计数CS增大1,否则同相统计数CS减小1,进入步骤S004;
S004、有效音量统计数S增大1,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,否则返回步骤S001提取下一个立体声PCM数据;
S005、计算本时间片的相位值。
时间片定义如下:将立体声音频信号采样时间片定义为N个连续的立体声采样点,当N=1152时,刚好是MPEG1的层二和层三音频格式一帧的采样数,对于采样频率为48000HZ、精度b=16位的PCM音频数据,每个立体声采样点分为左右通道两个采样点,每个单通道采样点数值范围[-32768,32767],每时间片为24毫秒,时间片内采样点数值为y(i),i=1,2,...N。
步骤S005中,时间片的相位值CV由以下公式计算得到:
式中,f为阻尼系数,LV为上一个时间片的相位值,如果当前时间片为第一个时间片,则LV为0。
步骤S001中,按以下公式计算音量值:
式中,b为PCM数据的精度位数,y(i)为当前处理的PCM数值,也就是左右声道分离之后,当前计算的声道对应的数值,i的取值范围是1至N,N为时间片中的采样点个数。
步骤S002中,有效音量门限L为-48dBFS。低于-48dBFS的信号如果参与计算相位则容易误判。
阻尼系数f为0.3。
计算得到的相位值可以用于给指示器显示实时相位,指示器的范围是[-100,100],指示器在此范围内来回波动;相位值还可以用于对音频文件或音频实时信号进行反相报警,例如时间片设为24毫秒,连续统计一定持续时长(如15秒)的所有时间片的相位低于-20的百分数比,如果大于40%则判定该文件或信号存在反相。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
尽管本文较多地使用了PCM数据、阻尼系数等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。
Claims (4)
1.一种带阻尼系数的音频信号瞬时相位的检测方法,其特征在于,包括以下步骤:
S001、从时间片中按序取出一个立体声PCM数据,将立体声PCM数据分离出左右声道,提取左声道的音量值和右声道的音量值;
S002、当左声道音量值或右声道音量值至少有一个低于有效音量门限L时,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,如果不为最后一个则返回步骤S001提取下一个立体声PCM数据;如果左声道音量值和右声道音量值均不低于有效音量门限值L时,进入步骤S003;
S003、当左声道PCM数值和右声道PCM数值均为正值或均为负值时,同相统计数CS增大1,否则同相统计数CS减小1,进入步骤S004;
S004、有效音量统计数S增大1,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,否则返回步骤S001提取下一个立体声PCM数据;
S005、计算本时间片的相位值;
步骤S005中,时间片的相位值CV由以下公式计算得到:
式中,f为阻尼系数,LV为上一个时间片的相位值,如果当前时间片为第一个时间片,则LV为0。
3.根据权利要求1所述的一种带阻尼系数的音频信号瞬时相位的检测方法,其特征在于,步骤S002中,有效音量门限L为-48dBFS。
4.根据权利要求1所述的种带阻尼系数的音频信号瞬时相位的检测方法,其特征在于,阻尼系数f为0.3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110471221.7A CN113257278B (zh) | 2021-04-29 | 2021-04-29 | 一种带阻尼系数的音频信号瞬时相位的检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110471221.7A CN113257278B (zh) | 2021-04-29 | 2021-04-29 | 一种带阻尼系数的音频信号瞬时相位的检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113257278A CN113257278A (zh) | 2021-08-13 |
CN113257278B true CN113257278B (zh) | 2022-09-20 |
Family
ID=77222641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110471221.7A Active CN113257278B (zh) | 2021-04-29 | 2021-04-29 | 一种带阻尼系数的音频信号瞬时相位的检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113257278B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5744741A (en) * | 1995-01-13 | 1998-04-28 | Yamaha Corporation | Digital signal processing device for sound signal processing |
US6219635B1 (en) * | 1997-11-25 | 2001-04-17 | Douglas L. Coulter | Instantaneous detection of human speech pitch pulses |
CN1964582A (zh) * | 2005-11-11 | 2007-05-16 | 索尼株式会社 | 音频信号处理装置以及音频信号处理方法 |
CN101051456A (zh) * | 2007-01-31 | 2007-10-10 | 张建平 | 音频相位检测和自动校正设备 |
CN111093143A (zh) * | 2020-01-03 | 2020-05-01 | 天域全感音科技有限公司 | 一种立体声道音频信号处理装置及方法 |
CN112242150A (zh) * | 2020-09-30 | 2021-01-19 | 上海佰贝科技发展股份有限公司 | 一种检测立体声的方法及其系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI540912B (zh) * | 2010-05-25 | 2016-07-01 | 晨星半導體股份有限公司 | 音訊處理裝置及音訊處理方法 |
JP2014513320A (ja) * | 2011-03-21 | 2014-05-29 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | オーディオ信号におけるドミナント周波数を減衰する方法及び装置 |
-
2021
- 2021-04-29 CN CN202110471221.7A patent/CN113257278B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5744741A (en) * | 1995-01-13 | 1998-04-28 | Yamaha Corporation | Digital signal processing device for sound signal processing |
US6219635B1 (en) * | 1997-11-25 | 2001-04-17 | Douglas L. Coulter | Instantaneous detection of human speech pitch pulses |
CN1964582A (zh) * | 2005-11-11 | 2007-05-16 | 索尼株式会社 | 音频信号处理装置以及音频信号处理方法 |
CN101051456A (zh) * | 2007-01-31 | 2007-10-10 | 张建平 | 音频相位检测和自动校正设备 |
CN111093143A (zh) * | 2020-01-03 | 2020-05-01 | 天域全感音科技有限公司 | 一种立体声道音频信号处理装置及方法 |
CN112242150A (zh) * | 2020-09-30 | 2021-01-19 | 上海佰贝科技发展股份有限公司 | 一种检测立体声的方法及其系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113257278A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103152499B (zh) | 回声消除器 | |
CN102044242B (zh) | 语音激活检测方法、装置和电子设备 | |
US7508948B2 (en) | Reverberation removal | |
CN104167209B (zh) | 一种音频失真的检测方法及装置 | |
CN111367874B (zh) | 一种日志处理方法、装置、介质和设备 | |
EP4390923A1 (en) | A method and system for triggering events | |
JP2015537237A (ja) | リアルタイム交通検出 | |
CN110310669A (zh) | 一种检测静音帧的方法及装置及可读存储介质 | |
CN113257278B (zh) | 一种带阻尼系数的音频信号瞬时相位的检测方法 | |
Chen et al. | Scene change detection by audio and video clues | |
Aleinik et al. | Detection of clipped fragments in speech signals | |
CN111859011A (zh) | 音频处理方法、装置、存储介质及电子设备 | |
CN105989834B (zh) | 语音辨识装置及语音辨识方法 | |
JP2001147697A (ja) | 音響データ分析方法及びその装置 | |
CN106782612B (zh) | 一种逆向爆音检测方法及其装置 | |
US7680654B2 (en) | Apparatus and method for segmentation of audio data into meta patterns | |
CN111986696B (zh) | 一种高效处理歌曲音量均衡的方法 | |
CN115670397A (zh) | 一种ppg伪迹识别方法、装置、存储介质及电子设备 | |
GB2609303A (en) | Single-microphone wind detector for audio device | |
CN105989835B (zh) | 语音辨识装置及语音辨识方法 | |
CN108389590A (zh) | 一种时频联合的语音削顶检测方法 | |
CN110349587B (zh) | 一种两人场景下目标个体打呼区分方法 | |
CN110491413B (zh) | 一种基于孪生网络的音频内容一致性监测方法及系统 | |
CN113381996B (zh) | 基于机器学习的c&c通讯攻击检测方法 | |
CN111564162A (zh) | 基于fpga的有效呼吸声去除方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |