CN113257278B - 一种带阻尼系数的音频信号瞬时相位的检测方法 - Google Patents

一种带阻尼系数的音频信号瞬时相位的检测方法 Download PDF

Info

Publication number
CN113257278B
CN113257278B CN202110471221.7A CN202110471221A CN113257278B CN 113257278 B CN113257278 B CN 113257278B CN 202110471221 A CN202110471221 A CN 202110471221A CN 113257278 B CN113257278 B CN 113257278B
Authority
CN
China
Prior art keywords
value
phase
time slice
pcm data
stereo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110471221.7A
Other languages
English (en)
Other versions
CN113257278A (zh
Inventor
彭小光
吕连新
俞振飞
王世为
单雪松
顾江标
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Linker Technology Co ltd
Original Assignee
Hangzhou Linker Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Linker Technology Co ltd filed Critical Hangzhou Linker Technology Co ltd
Priority to CN202110471221.7A priority Critical patent/CN113257278B/zh
Publication of CN113257278A publication Critical patent/CN113257278A/zh
Application granted granted Critical
Publication of CN113257278B publication Critical patent/CN113257278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R25/00Arrangements for measuring phase angle between a voltage and a current or between voltages or currents
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Stereophonic System (AREA)

Abstract

本发明公开了一种带阻尼系数的音频信号瞬时相位的检测方法,其包括以下步骤:S001、从时间片中按序取出一个立体声PCM数据分离出左右声道;S002、当左右声道音量值至少有一个低于有效音量门限L时,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,否则返回S001;如果左右声道音量值均不低于L,进入步骤S003;S003、当左右声道PCM数值均为正值或均为负值时,同相统计数CS增大1,否则CS减小1;S004、有效音量统计数S增大1,如果当前所处理的为最后一个数据,进入步骤S005,否则返回S001;S005、计算本时间片的相位值。本方案适用于立体声音频信号的瞬时相位检测。

Description

一种带阻尼系数的音频信号瞬时相位的检测方法
技术领域
本发明涉及数字信号处理领域,尤其是涉及一种带阻尼系数的音频信号瞬时相位的检测方法。
背景技术
在通常的立体声音频信号瞬时相位检测中,通常是不带阻尼系数的,导致的结果是音频信号相位值变化太快且忽高忽低,在有些情况下相位指示器频繁显红,而实际上音频信号并没有很多相位差现象,这给操作人员带来了较大困扰。
发明内容
本发明主要是解决现有技术所存在的在立体声音频信号瞬时相位检测时显示值完全按照当前信号的相位值,变化过于频繁,参考价值较低的技术问题,提供一种变化率更合理、更具有参考价值的带阻尼系数的音频信号瞬时相位的检测方法。
本发明针对上述技术问题主要是通过下述技术方案得以解决的:一种带阻尼系数的音频信号瞬时相位的检测方法,包括以下步骤:
S001、从时间片中按序取出一个立体声PCM数据,将立体声PCM数据分离出左右声道,提取左声道的音量值和右声道的音量值;
S002、当左声道音量值或右声道音量值至少有一个低于有效音量门限L时,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,如果不为最后一个则返回步骤S001提取下一个立体声PCM数据;如果左声道音量值和右声道音量值均不低于有效音量门限值L时,进入步骤S003;
S003、当左声道PCM数值和右声道PCM数值均为正值或均为负值时,同相统计数CS增大1,否则同相统计数CS减小1;进入步骤S004;
S004、有效音量统计数S增大1,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,否则返回步骤S001提取下一个立体声PCM数据;
S005、计算本时间片的相位值。
作为优选,步骤S005中,时间片的相位值CV由以下公式计算得到:
Figure BDA0003045458210000021
式中,f为阻尼系数,LV为上一个时间片的相位值,如果当前时间片为第一个时间片,则LV为0。
作为优选,步骤S001中,按以下公式计算音量值:
Figure BDA0003045458210000022
式中,b为PCM数据的精度位数,y(i)为当前处理的PCM数值,也就是左右声道分离之后,当前计算的声道对应的数值,i的取值范围是1至N,N为时间片中的采样点个数。
作为优选,步骤S002中,有效音量门限L为-48dBFS。低于-48dBFS的信号如果参与计算相位则容易误判。
作为优选,阻尼系数f为0.3。
计算得到的相位值可以用于给指示器显示实时相位,指示器的范围是[-100,100],指示器在此范围内来回波动;相位值还可以用于对音频文件或音频实时信号进行反相报警,例如时间片设为24毫秒,连续统计一定持续时长(如15秒)的所有时间片的相位低于-20的百分数比,如果大于40%则判定该文件或信号存在反相。
本发明带来的实质性效果是,可以有效降低误判率,引入阻尼系数有效解决瞬时相位变化太快忽高忽低的弊病,给操作人员带来较为真实的判断。
附图说明
图1是本发明的一种流程图。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。
实施例:本实施例的一种带阻尼系数的音频信号瞬时相位的检测方法,如图1所示,包括以下步骤:
S001、从时间片中按序取出一个立体声PCM数据,将立体声PCM数据分离出左右声道,提取左声道的音量值和右声道的音量值;
S002、当左声道音量值或右声道音量值至少有一个低于有效音量门限L时,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,如果不为最后一个则返回步骤S001提取下一个立体声PCM数据;如果左声道音量值和右声道音量值均不低于有效音量门限值L时,进入步骤S003;
S003、当左声道PCM数值和右声道PCM数值均为正值或均为负值时,同相统计数CS增大1,否则同相统计数CS减小1,进入步骤S004;
S004、有效音量统计数S增大1,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,否则返回步骤S001提取下一个立体声PCM数据;
S005、计算本时间片的相位值。
时间片定义如下:将立体声音频信号采样时间片定义为N个连续的立体声采样点,当N=1152时,刚好是MPEG1的层二和层三音频格式一帧的采样数,对于采样频率为48000HZ、精度b=16位的PCM音频数据,每个立体声采样点分为左右通道两个采样点,每个单通道采样点数值范围[-32768,32767],每时间片为24毫秒,时间片内采样点数值为y(i),i=1,2,...N。
步骤S005中,时间片的相位值CV由以下公式计算得到:
Figure BDA0003045458210000031
式中,f为阻尼系数,LV为上一个时间片的相位值,如果当前时间片为第一个时间片,则LV为0。
步骤S001中,按以下公式计算音量值:
Figure BDA0003045458210000041
式中,b为PCM数据的精度位数,y(i)为当前处理的PCM数值,也就是左右声道分离之后,当前计算的声道对应的数值,i的取值范围是1至N,N为时间片中的采样点个数。
步骤S002中,有效音量门限L为-48dBFS。低于-48dBFS的信号如果参与计算相位则容易误判。
阻尼系数f为0.3。
计算得到的相位值可以用于给指示器显示实时相位,指示器的范围是[-100,100],指示器在此范围内来回波动;相位值还可以用于对音频文件或音频实时信号进行反相报警,例如时间片设为24毫秒,连续统计一定持续时长(如15秒)的所有时间片的相位低于-20的百分数比,如果大于40%则判定该文件或信号存在反相。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
尽管本文较多地使用了PCM数据、阻尼系数等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。

Claims (4)

1.一种带阻尼系数的音频信号瞬时相位的检测方法,其特征在于,包括以下步骤:
S001、从时间片中按序取出一个立体声PCM数据,将立体声PCM数据分离出左右声道,提取左声道的音量值和右声道的音量值;
S002、当左声道音量值或右声道音量值至少有一个低于有效音量门限L时,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,如果不为最后一个则返回步骤S001提取下一个立体声PCM数据;如果左声道音量值和右声道音量值均不低于有效音量门限值L时,进入步骤S003;
S003、当左声道PCM数值和右声道PCM数值均为正值或均为负值时,同相统计数CS增大1,否则同相统计数CS减小1,进入步骤S004;
S004、有效音量统计数S增大1,如果当前所处理的为最后一个立体声PCM数据,进入步骤S005,否则返回步骤S001提取下一个立体声PCM数据;
S005、计算本时间片的相位值;
步骤S005中,时间片的相位值CV由以下公式计算得到:
Figure FDA0003771688180000011
式中,f为阻尼系数,LV为上一个时间片的相位值,如果当前时间片为第一个时间片,则LV为0。
2.根据权利要求1所述的一种带阻尼系数的音频信号瞬时相位的检测方法,其特征在于,步骤S001中,按以下公式计算音量值:
Figure FDA0003771688180000012
式中,b为PCM数据的精度位数,y(i)为当前处理的PCM数值,i的取值范围是1至N,N为时间片中的采样点个数。
3.根据权利要求1所述的一种带阻尼系数的音频信号瞬时相位的检测方法,其特征在于,步骤S002中,有效音量门限L为-48dBFS。
4.根据权利要求1所述的种带阻尼系数的音频信号瞬时相位的检测方法,其特征在于,阻尼系数f为0.3。
CN202110471221.7A 2021-04-29 2021-04-29 一种带阻尼系数的音频信号瞬时相位的检测方法 Active CN113257278B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110471221.7A CN113257278B (zh) 2021-04-29 2021-04-29 一种带阻尼系数的音频信号瞬时相位的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110471221.7A CN113257278B (zh) 2021-04-29 2021-04-29 一种带阻尼系数的音频信号瞬时相位的检测方法

Publications (2)

Publication Number Publication Date
CN113257278A CN113257278A (zh) 2021-08-13
CN113257278B true CN113257278B (zh) 2022-09-20

Family

ID=77222641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110471221.7A Active CN113257278B (zh) 2021-04-29 2021-04-29 一种带阻尼系数的音频信号瞬时相位的检测方法

Country Status (1)

Country Link
CN (1) CN113257278B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5744741A (en) * 1995-01-13 1998-04-28 Yamaha Corporation Digital signal processing device for sound signal processing
US6219635B1 (en) * 1997-11-25 2001-04-17 Douglas L. Coulter Instantaneous detection of human speech pitch pulses
CN1964582A (zh) * 2005-11-11 2007-05-16 索尼株式会社 音频信号处理装置以及音频信号处理方法
CN101051456A (zh) * 2007-01-31 2007-10-10 张建平 音频相位检测和自动校正设备
CN111093143A (zh) * 2020-01-03 2020-05-01 天域全感音科技有限公司 一种立体声道音频信号处理装置及方法
CN112242150A (zh) * 2020-09-30 2021-01-19 上海佰贝科技发展股份有限公司 一种检测立体声的方法及其系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI540912B (zh) * 2010-05-25 2016-07-01 晨星半導體股份有限公司 音訊處理裝置及音訊處理方法
JP2014513320A (ja) * 2011-03-21 2014-05-29 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオ信号におけるドミナント周波数を減衰する方法及び装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5744741A (en) * 1995-01-13 1998-04-28 Yamaha Corporation Digital signal processing device for sound signal processing
US6219635B1 (en) * 1997-11-25 2001-04-17 Douglas L. Coulter Instantaneous detection of human speech pitch pulses
CN1964582A (zh) * 2005-11-11 2007-05-16 索尼株式会社 音频信号处理装置以及音频信号处理方法
CN101051456A (zh) * 2007-01-31 2007-10-10 张建平 音频相位检测和自动校正设备
CN111093143A (zh) * 2020-01-03 2020-05-01 天域全感音科技有限公司 一种立体声道音频信号处理装置及方法
CN112242150A (zh) * 2020-09-30 2021-01-19 上海佰贝科技发展股份有限公司 一种检测立体声的方法及其系统

Also Published As

Publication number Publication date
CN113257278A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
CN103152499B (zh) 回声消除器
CN102044242B (zh) 语音激活检测方法、装置和电子设备
US7508948B2 (en) Reverberation removal
CN104167209B (zh) 一种音频失真的检测方法及装置
CN111367874B (zh) 一种日志处理方法、装置、介质和设备
EP4390923A1 (en) A method and system for triggering events
JP2015537237A (ja) リアルタイム交通検出
CN110310669A (zh) 一种检测静音帧的方法及装置及可读存储介质
CN113257278B (zh) 一种带阻尼系数的音频信号瞬时相位的检测方法
Chen et al. Scene change detection by audio and video clues
Aleinik et al. Detection of clipped fragments in speech signals
CN111859011A (zh) 音频处理方法、装置、存储介质及电子设备
CN105989834B (zh) 语音辨识装置及语音辨识方法
JP2001147697A (ja) 音響データ分析方法及びその装置
CN106782612B (zh) 一种逆向爆音检测方法及其装置
US7680654B2 (en) Apparatus and method for segmentation of audio data into meta patterns
CN111986696B (zh) 一种高效处理歌曲音量均衡的方法
CN115670397A (zh) 一种ppg伪迹识别方法、装置、存储介质及电子设备
GB2609303A (en) Single-microphone wind detector for audio device
CN105989835B (zh) 语音辨识装置及语音辨识方法
CN108389590A (zh) 一种时频联合的语音削顶检测方法
CN110349587B (zh) 一种两人场景下目标个体打呼区分方法
CN110491413B (zh) 一种基于孪生网络的音频内容一致性监测方法及系统
CN113381996B (zh) 基于机器学习的c&c通讯攻击检测方法
CN111564162A (zh) 基于fpga的有效呼吸声去除方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant