CN111341335A - 一种声卡的音频处理方法及系统 - Google Patents
一种声卡的音频处理方法及系统 Download PDFInfo
- Publication number
- CN111341335A CN111341335A CN202010153918.5A CN202010153918A CN111341335A CN 111341335 A CN111341335 A CN 111341335A CN 202010153918 A CN202010153918 A CN 202010153918A CN 111341335 A CN111341335 A CN 111341335A
- Authority
- CN
- China
- Prior art keywords
- audio
- sound card
- signal
- audio signal
- filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 230000005236 sound signal Effects 0.000 claims abstract description 63
- 238000001914 filtration Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 21
- 230000000694 effects Effects 0.000 claims abstract description 14
- 230000009466 transformation Effects 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 10
- 238000005311 autocorrelation function Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/0332—Details of processing therefor involving modification of waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种声卡的音频处理方法及系统,包括以下步骤:S1:音频信号的采集;S2:音频信号的处理;S3:音频信号的效果显示;用Matlab对含噪的的音频信号同时在时域和频域进行滤波处理和分析,在MATLAB应用软件下设计一个简单易用的图形用户界面(GUI),来解决一般应用条件下的各种音频信号的处理,能对音频信号进行采集,并对其进行各种处理软件,达到简单的音频信号处理的目的,操作简单,处理后的音频没有噪音。
Description
技术领域
本发明属于直播设备技术领域,特别涉及一种声卡的音频处理方法及系统。
背景技术
随着信息技术的迅猛发展,各种各样的音视频处理装置应运而生,而由于直播方式的盛行,各种应用于直播领域的声卡也受到人们的火热欢迎。
目前市场上常见的直播声卡,主要以有线方式将收音头信号和处理后的信号通过繁杂的连接线连接到各直播智能设备终端上。比较繁琐,而且噪音较多,影响直播效果。
发明内容
本发明的目的是针对现有技术和应用上的不足,提供一种声卡的音频处理方法及系统。
为解决上述技术问题,本发明的声卡的音频处理方法,包括以下步骤:
S1:音频信号的采集
使用声卡设备采集音频信号,并将其保存在声卡设备中;
S2:音频信号的处理
提取:通过图形用户界面上的菜单功能按键采集设备上的一段音频信号,完成音频信号的频率,幅度信息的提取,并得到该音频信号的波形图;
调整:在设计的用户图形界面下对输入的音频信号进行多种变化,以实现对音频信号的调整;
变换:在用户图形界面下对采集的音频信号进行Fourier变换,并画出变换前后的频谱图和变换后的倒谱图;
滤波:滤除音频信号中的噪音部分,并比较各种滤波后的效果;
S3:音频信号的效果显示
通过用户图形界面的输出功能,将处理后的信号的音频进行播放,试听处理后的效果。
优选地,还包括音频信号的时域分析,直接对音频信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数。
优选地,还包括音频信号的频域分析,采用信号的傅立叶表示。
优选地,在所述的S2中,在设计的用户图形界面下对输入的音频信号进行变化,包括变化幅度、改变频率。
优选地,在所述的S2中,信号滤波采用低通滤波、高通滤波、带通滤波和帯阻滤波。
本发明的另一目的在于提供声卡的音频处理系统,包括图形用户界面和Matlab,通过操作界面来控制Matlab对音频信号的时域和频域进行滤波处理和分析。
优选地,所述的Matlab包括音频采集模块、音频提取模块、音频调整模块、音频分析模块、音频变换模块和音频滤波模块。
优选地,所述的Matlab还包括音频输出模块和音频播放模块。
与现有技术相比,本发明的有益效果是:
本发明中,用Matlab对含噪的的音频信号同时在时域和频域进行滤波处理和分析,在MATLAB应用软件下设计一个简单易用的图形用户界面(GUI),来解决一般应用条件下的各种音频信号的处理,能对音频信号进行采集,并对其进行各种处理软件,达到简单的音频信号处理的目的,操作简单,处理后的音频没有噪音。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明的声卡的音频处理方法的原理图;
图2为本发明的声卡的音频处理方法的音频语音波形图;
图3为本发明的声卡的音频处理方法的频率调整后波形图;
图4为本发明的声卡的音频处理方法的幅度调整后波形图;
图5为本发明的声卡的音频处理方法的声音样本波形图、频谱图和倒谱图;
图6为本发明的声卡的音频处理方法的帯阻滤波后波形和频谱的变化图;
图7为本发明的声卡的音频处理系统示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
在本发明实施例中,参照图1,该声卡的音频处理方法,包括以下步骤:
S1:音频信号的采集
使用声卡设备采集音频信号,并将其保存在声卡设备中;系统是以一段简短的的音频信号做为分析样本,通过声卡系统将需要的语音信号保存到到声卡中。
S2:音频信号的处理
提取:通过图形用户界面上的菜单功能按键采集设备上的录入的音频信号,完成音频信号的频率,幅度信息的提取,并得到该音频信号的波形图。
在Matlab中使用Wavread函数,可得出信号的采样频率,并且声音是单声道的。利用Sound函数可以清晰的听到采集的语音,采集数据并画出波形图,其中声音的采样频率Fs=22050Hz,y为采样数据,NBITS表示量化阶数。
提取的语音的波形图如图2所示,整段音频数据中得声音高低起伏与录入的声音信号基本一致,并且可以观察到其中包含部分高频噪声。
调整:在设计的用户图形界面下对输入的音频信号进行多种变化,以实现对音频信号的调整;信号调整包括信号的幅度和频率的任意倍数变化。
语音信号的频率调整:
在本实施例中,可以将语音信号的采样频率提高或降低,来实现语音信号的调整,得到理想的语音信号。例如将采样频率提高一倍,即可得到语音信号频率为原频率2倍新的语音信号。运行Process→Adjust→Frequency,得到如图3的信号波形图,并试听调整后的效果。
与原语音信号相比,经过调整后的信号周期变为原来的1/2,此时的语速明显变快,即实现了信号的2倍频功能。
语音信号的振幅调整:
在本实施例中,可以将语音信号的幅度进行提高或降低操作,来实现语音信号的调整,得到声音音量大小不同的语音信号,例如将原语音信号的幅度提高一倍,得到如图4的信号波形图,可以通过GUI操作界面的输出功能试听调整后的效果。
此时听到的调整后声音声调变高,但不是很明显,可以将幅度的变化值设置的比较大,那样的话就可以得到效果相当明显的语音信号了。
变换:在用户图形界面下对采集的音频信号进行Fourier变换,并画出变换前后的频谱图和变换后的倒谱图;对语音信号进行频谱分析,在Matlab中可以利用函数fft对信号行快速傅里叶变换,得到信号的频谱图,并进行倒谱分析,得到倒谱图,如图5所示。从倒谱图可以看出.当读需要的语音时,所对应的频率大概在200Hz左右。这与人的语音信号频率集中在200Hz到4.5kHz之间是相一致的。而在未发声的时间段内,相对的小高频部分(200500Hz)应该属于背景噪声。
进一步地,还包括音频信号的时域分析和频域分析,直接对音频信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数。
滤波:滤除音频信号中的噪音部分,并比较各种滤波后的效果;信号滤波采用低通滤波、高通滤波、带通滤波和帯阻滤波。
语音信号中包含背景噪声,这些噪声的频率一般较高。所以可以利用MATLAB软件中的滤波器进行滤波处理,得到较为理想的语音信号。
在本实施例中,采用带阻滤波对语音信号进行滤波。
运用切比雪夫—Ⅱ型数字带阻滤波器,对语音信号进行滤波处理后其与原信号的比较图如图6所示,带阻滤波后,声音比较接近原来的声音。从频谱图中我们可以看出声音的能量主要集中在低频(0.2pi即2204.5Hz以内)部分。
S3:音频信号的效果显示
通过用户图形界面的输出功能,将处理后的信号的音频进行播放,试听处理后的效果。还可以将处理后的语音信号保存在电脑上。
本实施例的另一目的在于提供声卡的音频处理系统,参照图7,包括图形用户界面和Matlab,通过操作界面来控制Matlab对音频信号的时域和频域进行滤波处理和分析。
图形用户界面(Graphical User Interface,简称GUI,又称图形用户接口)是指采用图形方式显示的计算机操作用户界面。与早期计算机使用的命令行界面相比,图形界面对于用户来说在视觉上更易于接受。GUI的广泛应用是当今计算机发展的重大成就之一,他极大地方便了非专业用户的使用人们从此不再需要死记硬背大量的命令,取而代之的是可以通过窗口、菜单、按键等方式来方便地进行操作。
本实施例是用Matlab对含噪的的语音信号同时在时域和频域进行滤波处理和分析,在MATLAB应用软件下设计一个简单易用的图形用户界面(GUI),来解决一般应用条件下的各种语音信号的处理。
进一步地,所述的Matlab包括音频采集模块、音频提取模块、音频调整模块、音频分析模块、音频变换模块和音频滤波模块。还包括音频输出模块和音频播放模块。
在MATLAB主窗口中,选择File菜单中的New菜单项,再选择其中的GUI命令,就会显示图形用户界面的设计模板。MATLAB为GUI设计一共准备了4种模板,分别是Blank GUI(默认)、GUI with Uicontrols(带控件对象的GUI模板)、GUI withAxes andMenu(带坐标轴与菜单的GUI模板)与Modal Question Dialog(带模式问话对话框的GUI模板)。
设计语音信号处理系统的用户图形操作界面(GUI)SoundProcess,其中菜单主要包括File、Process和Output三大主要部分,其中File菜单包括输入(Input)、保存(Save)和退出(Quit)等功能;Process菜单主要包括提取(Extract)、调整(Extract)、变换(Transform)和滤波(Filter)菜单,其中调整(Extract)包括幅度调整(Range)和频率调整(Frequency),滤波(Filter)菜单包含低通滤波(LowpassFilter)、高通滤波(HighpassFilter)、带通滤波(BandpassFilter)和帯阻滤波(BandstopFilter)等功能菜单。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。
Claims (8)
1.声卡的音频处理方法,其特征在于,包括以下步骤:
S1:音频信号的采集
使用声卡设备采集音频信号,并将其保存在声卡设备中;
S2:音频信号的处理
提取:通过图形用户界面上的菜单功能按键采集设备上的一段音频信号,完成音频信号的频率,幅度信息的提取,并得到该音频信号的波形图;
调整:在设计的用户图形界面下对输入的音频信号进行多种变化,以实现对音频信号的调整;
变换:在用户图形界面下对采集的音频信号进行Fourier变换,并画出变换前后的频谱图和变换后的倒谱图;
滤波:滤除音频信号中的噪音部分,并比较各种滤波后的效果;
S3:音频信号的效果显示
通过用户图形界面的输出功能,将处理后的信号的音频进行播放,试听处理后的效果。
2.根据权利要求1所述的声卡的音频处理方法,其特征在于,还包括音频信号的时域分析,直接对音频信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数。
3.根据权利要求1所述的声卡的音频处理方法,其特征在于,还包括音频信号的频域分析,采用信号的傅立叶表示。
4.根据权利要求1所述的声卡的音频处理方法,其特征在于,在所述的S2中,在设计的用户图形界面下对输入的音频信号进行变化,包括变化幅度、改变频率。
5.根据权利要求1所述的声卡的音频处理方法,其特征在于,在所述的S2中,信号滤波采用低通滤波、高通滤波、带通滤波和帯阻滤波。
6.一种声卡的音频处理系统,其特征在于,包括图形用户界面和Matlab,通过操作界面来控制Matlab对音频信号的时域和频域进行滤波处理和分析。
7.根据权利要求1所述的一种声卡的音频处理系统,其特征在于,所述的Matlab包括音频采集模块、音频提取模块、音频调整模块、音频分析模块、音频变换模块和音频滤波模块。
8.根据权利要求1所述的一种声卡的音频处理系统,其特征在于,所述的Matlab还包括音频输出模块和音频播放模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010153918.5A CN111341335A (zh) | 2020-03-07 | 2020-03-07 | 一种声卡的音频处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010153918.5A CN111341335A (zh) | 2020-03-07 | 2020-03-07 | 一种声卡的音频处理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111341335A true CN111341335A (zh) | 2020-06-26 |
Family
ID=71182313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010153918.5A Pending CN111341335A (zh) | 2020-03-07 | 2020-03-07 | 一种声卡的音频处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111341335A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105702260A (zh) * | 2016-04-18 | 2016-06-22 | 安徽大学 | 基于matlab的多功能语音测试滤波系统 |
CN107452394A (zh) * | 2017-07-31 | 2017-12-08 | 上海斐讯数据通信技术有限公司 | 一种基于频率特性降低噪音的方法和系统 |
-
2020
- 2020-03-07 CN CN202010153918.5A patent/CN111341335A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105702260A (zh) * | 2016-04-18 | 2016-06-22 | 安徽大学 | 基于matlab的多功能语音测试滤波系统 |
CN107452394A (zh) * | 2017-07-31 | 2017-12-08 | 上海斐讯数据通信技术有限公司 | 一种基于频率特性降低噪音的方法和系统 |
Non-Patent Citations (3)
Title |
---|
刘惠敏等: "语音信号处理系统设计", 《中山大学研究生学刊(自然科学.医学版)》 * |
周建芳等: "基于声卡的虚拟音频分析处理系统", 《通信技术》 * |
张娜等: "含噪语音信号分析与处理", 《商洛学院学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019101123A1 (zh) | 语音活性检测方法、相关装置和设备 | |
CN104992712B (zh) | 能识别音乐自动成谱的方法 | |
CN105989836B (zh) | 一种语音采集方法、装置及终端设备 | |
CN107274911A (zh) | 一种基于声音特征的相似度分析方法 | |
CN108461081B (zh) | 语音控制的方法、装置、设备和存储介质 | |
CN108010512A (zh) | 一种音效的获取方法及录音终端 | |
CN108363530B (zh) | 电子装置、音乐播放方法及相关产品 | |
CN104916288B (zh) | 一种音频中人声突出处理的方法及装置 | |
CN103297590B (zh) | 一种基于音频实现设备解锁的方法和系统 | |
CN109920434A (zh) | 一种基于会议场景的噪声分类去除方法 | |
CN108053822B (zh) | 一种语音信号处理方法、装置、终端设备及介质 | |
CN106952654A (zh) | 机器人降噪方法、装置及机器人 | |
CN101930733A (zh) | 一种用于语音情感识别的语音情感特征提取方法 | |
CN101193384B (zh) | 通过模式识别滤除环境音的方法及手机 | |
CN110853677B (zh) | 歌曲的鼓声节拍识别方法、装置、终端和非临时性计算机可读存储介质 | |
CN103680518A (zh) | 基于虚拟仪器技术的语音性别识别方法及系统 | |
CN104599667A (zh) | 信息处理方法及电子设备 | |
CN109377982B (zh) | 一种有效语音获取方法 | |
Chu et al. | A noise-robust FFT-based auditory spectrum with application in audio classification | |
CN112135235B (zh) | 质量检测方法、系统及计算机可读存储介质 | |
CN111341335A (zh) | 一种声卡的音频处理方法及系统 | |
Noh et al. | Smart home with biometric system recognition | |
TW582024B (en) | Method and system for determining reliable speech recognition coefficients in noisy environment | |
CN105931317A (zh) | 一种实现dtmf拨号音实时解码及声控门锁的检测系统 | |
CN103236255A (zh) | 音频文件转化midi文件 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200626 |