CN106157966B - 语音信号处理装置及语音信号处理方法 - Google Patents
语音信号处理装置及语音信号处理方法 Download PDFInfo
- Publication number
- CN106157966B CN106157966B CN201510177495.XA CN201510177495A CN106157966B CN 106157966 B CN106157966 B CN 106157966B CN 201510177495 A CN201510177495 A CN 201510177495A CN 106157966 B CN106157966 B CN 106157966B
- Authority
- CN
- China
- Prior art keywords
- signal
- frame
- voice signal
- sampled
- subsignal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明提供一种语音信号处理装置及语音信号处理方法。该方法包括将降频后的取样语音信号所包括的各个降频信号框分割为淡入的第一子信号框与淡出的第二子信号框。将相邻且属于不同降频语音信号框的第一子信号框与第二子信号框进行交叠,以产生交叠语音信号。将交叠语音信号与取样语音信号进行合成,以产生输出信号。从而可有效地在不影响其他区段的语音信号的情形下降频语音信号。
Description
技术领域
本发明是有关于一种信号处理装置,且特别是有关于一种语音信号处理装置及语音信号处理方法。
背景技术
一般对于听障人士来说,其往往无法清楚地接收较高频的语音信号,例如子音信号,但对于低频的信号却可以清楚地听到。一般现有技术为通过将高频的语音信号进行降频来解决此问题,然降频的动作将会使语音信号的时间长度变长,因而必须另外再去判断找出字与字间无语音信号的区间,以将整段语音信号进行时间上的平移,并将降频后时间长度变长的语音信号塞到无语音信号的区间,如此才能避免其他区段的语音信号受到干扰。
发明内容
本发明提供一种语音信号处理装置及语音信号处理方法,可有效地在不影响其他区段的语音信号的情形下降频语音信号。
本发明的语音信号处理装置包括处理单元,其降频取样语音信号,以产生包括序列的降频信号框的降频信号,其中各降频信号框不包括混叠的数据段,处理单元还将各降频信号框分割为第一子信号框与第二子信号框,分别对第一子信号框与第二子信号框进行淡入与淡出处理,混叠相邻且属于不同降频语音信号框的第一子信号框与第二子信号框,以产生交叠语音信号,并合成取样语音信号与交叠语音信号,以产生输出信号。
在本发明的一实施例中,上述处理单元还判断取样语音信号是否为子音信号,若取样语音信号为子音信号,降频取样语音信号。
在本发明的一实施例中,上述处理单元依据取样语音信号的频率判断取样语音信号是否为子音信号。
在本发明的一实施例中,上述语音信号处理装置还包括一滤波单元,其耦接处理单元,对原始语音信号进行滤波,以产生滤波信号,处理单元还取样滤波信号以产生取样语音信号,其中取样语音信号包括序列的取样信号框,各取样信号框不包括混叠的数据段。
在本发明的一实施例中,上述滤波单元对原始语音信号进行低通滤波或带通滤波至少其一。
本发明的语音信号处理方法,包括下列步骤。降频取样语音信号,以产生包括序列的降频信号框的降频信号,其中各降频信号框不包括混叠的数据段。将各降频信号框分割为第一子信号框与第二子信号框。分别对第一子信号框与第二子信号框进行淡入与淡出处理。混叠相邻且属于不同降频语音信号框的第一子信号框与第二子信号框,以产生交叠语音信号。合成取样语音信号与交叠语音信号,以产生输出信号。
在本发明的一实施例中,上述语音信号处理方法还包括,判断取样语音信号是否为子音信号,若取样语音信号为子音信号,降频取样语音信号。
在本发明的一实施例中,上述判断取样语音信号是否为子音信号的步骤包括,依据取样语音信号的频率判断取样语音信号是否为子音信号。
在本发明的一实施例中,上述语音信号处理方法还包括下列步骤。对原始语音信号进行滤波,以产生滤波信号。取样滤波信号以产生取样语音信号,其中取样语音信号包括序列的取样信号框,各取样信号框不包括混叠的数据段。
在本发明的一实施例中,上述对原始语音信号进行滤波的步骤包括,对原始语音信号进行低通滤波或带通滤波至少其一。
基于上述,本发明的实施例通过将降频后的取样语音信号所包括的各个降频信号框分割为淡入的第一子信号框与淡出的第二子信号框,并混叠相邻且属于不同降频语音信号框的第一子信号框与第二子信号框,以产生交叠语音信号,并将其与取样语音信号进行合成,以在不干扰其他区段的语音信号的情形下降频语音信号。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。
附图说明
图1为本发明一实施例的语音信号处理装置的示意图;
图2为本发明一实施例的降频信号与交叠语音信号的示意图;
图3为本发明一实施例的语音信号处理方法的流程示意图。
102:滤波单元;
104:处理单元;
S1:原始语音信号;
S2:滤波信号;
SL:降频信号;
SA:交叠语音信号;
W1、W2、W3:降频信号框;
W1-1、W2-1、W3-1:第一子信号框;
W1-2、W2-2、W3-2:第二子信号框;
S302~S318:语音信号处理方法的流程步骤。
具体实施方式
图1为本发明一实施例的语音信号处理装置的示意图,请参照图1。语音信号处理装置包括滤波单元102以及处理单元104,滤波单元102耦接处理单元104,其中滤波单元102可例如以低通滤波器或带通滤波器至少其中之一来实施,而处理单元104则可例如以中央处理单元来实施,然不以此为限。
滤波单元102用以对原始语音信号S1进行滤波,以产生滤波信号S2给处理单元104,其中滤波单元102的滤波方式可例如包括对原始语音信号S1执行低通滤波与带通滤波,亦或执行低通滤波与带通滤波其中之一。处理单元104可取样滤波信号S2而产生取样语音信号,其中取样语音信号包括序列的取样信号框,且各个取样信号框都不包括混叠的数据段。处理单元104可判断取样语音信号是否为子音信号,若取样语音信号为子音信号,则降频取样语音信号,其中取样语音信号是否为子音信号的判断方式可例如依据取样语音信号的频率来判断,例如若取样语音信号高于一预设频率值,则判断取样语音信号为子音信号。
处理单元104降频取样语音信号可产生包括序列的降频信号框的降频信号,由于取样语音信号的各个取样信号框都不包括混叠的数据段,因此降频取样语音信号所得到的降频信号中的各个降频信号框也不会包括混叠的数据段。处理单元104接着可将各个降频信号框分割为一第一子信号框与一第二子信号框,并分别对第一子信号框与第二子信号框进行淡入处理与淡出处理,之后再将相邻且属于不同降频语音信号框的第一子信号框与第二子信号框进行混叠,以产生交叠语音信号。而后,处理单元104再将上述取样语音信号与交叠语音信号合成以产生输出信号。
举例来说,图2为本发明一实施例的降频信号与交叠语音信号的示意图,请参照图2。在本实施例中,降频信号SL包括三个降频信号框W1、W2、W3,各个降频信号框都被分割为第一子信号框与第二子信号框,如图2所示,降频信号框W1被分割为第一子信号框W1-1与第二子信号框W1-2,降频信号框W2被分割为第一子信号框W2-1与第二子信号框W2-2降频信号框W3被分割为第一子信号框W3-1与第二子信号框W3-2。其中第一子信号框W1-1、W2-1、W3-1被进行淡入处理,而第二子信号框W1-2、W2-2、W3-2被进行淡出处理,在各个降频信号框中,第一子信号框为上升部分(亦即淡入部分),而第二子信号框为下降部分(亦即淡出部分)。在本实施例中,进行淡入处理与淡出处理的降频信号框W1~W3的框函数为弦波函数,然不以此为限,在其他实施例中,降频信号框W1~W3的框函数也可为其他函数,例如三角波函数。在进行淡入处理与淡出处理后,相邻且属于不同降频语音信号框的第一子信号框与第二子信号框进行混叠而得到交叠语音信号SA,如图2所示,在交叠语音信号SA中,降频信号框W1的第二子信号框W1-2与降频信号框W2的第一子信号框W2-1进行混叠,以此类推,降频信号框W2的第二子信号框W2-2与降频信号框W3的第一子信号框W3-1也进行混叠。
由于上述实施例处理单元104取样产生的取样语音信号包括序列的取样信号框,且各个取样信号框都不包括混叠的数据段,因此在后续对取样信号框进行降频、分割以及淡入、淡出等处理时,可大幅地减低运算量。此外,由于上述实施例的混叠动作为在对取样语音信号降频后才进行,因此交叠语音信号SA所包括的信号框个数仅会比取样语音信号多一个信号框,亦即最后与取样语音信号进行合成的交叠语音信号SA的时间长度与取样语音信号几乎相同。如此一来,交叠语音信号SA便可直接与取样语音信号进行合成,而不会有干扰到其他区段的语音信号的问题产生。相对地,由于现有技术的混叠动作在对信号进行降频前即已完成,因此现有技术的语音信号处理方式须再去执行判断找出字与字间无语音信号的区间、对语音信号进行时间上的平移,以及将降频后时间长度变长的语音信号塞到无语音信号的区间等动作,才能避免其他区段的语音信号受到干扰。
图3为本发明一实施例的语音信号处理方法的流程示意图,请参照图3。由上述实施例可知,语音信号处理装置的语音信号处理方法可包括下列步骤。首先,对原始语音信号进行滤波,以产生滤波信号(步骤S302),其中对原始语音信号进行滤波的方式可例如为进行低通滤波或带通滤波至少其一。接着,取样滤波信号以产生取样语音信号(步骤S304),其中取样语音信号包括序列的取样信号框,且各取样信号框不包括混叠的数据段。之后,判断取样语音信号是否为子音信号(步骤S306),若取样语音信号为子音信号,则降频取样语音信号,以产生包括序列的降频信号框的降频信号(步骤S308),其中各个降频信号框不包括混叠的数据段,而判断取样语音信号是否为子音信号的方式可例如依据取样语音信号的频率来判断。相反地,若取样语音信号并非为子音信号,则不降频取样语音信号(步骤S310)。在降频取样语音信号后,可接着将各个降频信号框分割为一第一子信号框与一第二子信号框(步骤S312),然后分别对第一子信号框与第二子信号框进行淡入与淡出处理(步骤S314),而后再混叠相邻且属于不同降频语音信号框的第一子信号框与第二子信号框,以产生交叠语音信号(步骤S316)。最后,合成取样语音信号与交叠语音信号,以产生输出信号(步骤S318)。
综上所述,本发明的实施例通过将降频后的取样语音信号所包括的各个降频信号框分割为淡入的第一子信号框与淡出的第二子信号框,并混叠相邻且属于不同降频语音信号框的第一子信号框与第二子信号框,以产生交叠语音信号,并将其与取样语音信号进行合成,如此可大幅地减低信号的运算量且可在不干扰其他区段的语音信号的情形下降频语音信号。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (8)
1.一种语音信号处理装置,其特征在于,包括:
一滤波单元,对一原始语音信号进行滤波,以产生一滤波信号;以及
一处理单元,耦接所述滤波单元,取样所述滤波信号以产生一取样语音信号,降频所述取样语音信号,以产生包括一序列的降频信号框的降频信号,其中各所述降频信号框不包括混叠的数据段,所述处理单元还将各所述降频信号框分割为一第一子信号框与一第二子信号框,分别对所述第一子信号框与所述第二子信号框进行淡入与淡出处理,混叠相邻且属于不同降频语音信号框的第一子信号框与第二子信号框,以产生一交叠语音信号,并合成所述取样语音信号与所述交叠语音信号,以产生一输出信号。
2.根据权利要求1所述的语音信号处理装置,其特征在于,所述处理单元还依据所述取样语音信号的频率判断所述取样语音信号是否为子音信号,若所述取样语音信号为子音信号,降频所述取样语音信号,其中若所述取样语音信号高于一预设频率值,判断所述取样语音信号为所述子音信号。
3.根据权利要求1所述的语音信号处理装置,其特征在于,所述取样语音信号包括一序列的取样信号框,各所述取样信号框不包括混叠的数据段。
4.根据权利要求3所述的语音信号处理装置,其特征在于,所述滤波单元对所述原始语音信号进行低通滤波或带通滤波至少其一。
5.一种语音信号处理方法,其特征在于,包括:
对一原始语音信号进行滤波,以产生一滤波信号;
取样所述滤波信号以产生一取样语音信号;
降频所述取样语音信号,以产生包括一序列的降频信号框的降频信号,其中各所述降频信号框不包括混叠的数据段;
将各所述降频信号框分割为一第一子信号框与一第二子信号框;
分别对所述第一子信号框与所述第二子信号框进行淡入与淡出处理;
混叠相邻且属于不同降频语音信号框的第一子信号框与第二子信号框,以产生一交叠语音信号;以及
合成所述取样语音信号与所述交叠语音信号,以产生一输出信号。
6.根据权利要求5所述的语音信号处理方法,其特征在于,还包括:
依据所述取样语音信号的频率判断所述取样语音信号是否为子音信号,若所述取样语音信号为子音信号,降频所述取样语音信号,其中若所述取样语音信号高于一预设频率值,判断所述取样语音信号为所述子音信号。
7.根据权利要求5所述的语音信号处理方法,其特征在于,所述取样语音信号包括一序列的取样信号框,各所述取样信号框不包括混叠的数据段。
8.根据权利要求7所述的语音信号处理方法,其特征在于,对所述原始语音信号进行滤波的步骤包括:
对所述原始语音信号进行低通滤波或带通滤波至少其一。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510177495.XA CN106157966B (zh) | 2015-04-15 | 2015-04-15 | 语音信号处理装置及语音信号处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510177495.XA CN106157966B (zh) | 2015-04-15 | 2015-04-15 | 语音信号处理装置及语音信号处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106157966A CN106157966A (zh) | 2016-11-23 |
CN106157966B true CN106157966B (zh) | 2019-08-13 |
Family
ID=57336952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510177495.XA Active CN106157966B (zh) | 2015-04-15 | 2015-04-15 | 语音信号处理装置及语音信号处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106157966B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108156307B (zh) * | 2016-12-02 | 2020-09-08 | 塞舌尔商元鼎音讯股份有限公司 | 语音处理的方法以及语音通讯装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5845247A (en) * | 1995-09-13 | 1998-12-01 | Matsushita Electric Industrial Co., Ltd. | Reproducing apparatus |
CN1470051A (zh) * | 2000-10-17 | 2004-01-21 | �����ɷ� | 非话音语音的高性能低比特率编码方法和设备 |
CN101743585A (zh) * | 2008-04-04 | 2010-06-16 | 弗劳恩霍夫应用研究促进协会 | 采用高质量音高校正的音频处理 |
CN102496374A (zh) * | 2011-12-16 | 2012-06-13 | 河海大学常州校区 | 听力补偿方法 |
CN102682782A (zh) * | 2011-03-17 | 2012-09-19 | 索尼公司 | 语音处理装置、方法和程序 |
CN103067840A (zh) * | 2011-10-20 | 2013-04-24 | 杨国屏 | 增进语音即时输出的方法及助听器 |
CN103503061A (zh) * | 2011-02-14 | 2014-01-08 | 弗兰霍菲尔运输应用研究公司 | 在一频谱域中用以处理已解码音频信号的装置及方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7233832B2 (en) * | 2003-04-04 | 2007-06-19 | Apple Inc. | Method and apparatus for expanding audio data |
US7672835B2 (en) * | 2004-12-24 | 2010-03-02 | Casio Computer Co., Ltd. | Voice analysis/synthesis apparatus and program |
JP5127754B2 (ja) * | 2009-03-24 | 2013-01-23 | 株式会社東芝 | 信号処理装置 |
TWI576824B (zh) * | 2013-05-30 | 2017-04-01 | 元鼎音訊股份有限公司 | 處理聲音段之方法及其電腦程式產品及助聽器 |
-
2015
- 2015-04-15 CN CN201510177495.XA patent/CN106157966B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5845247A (en) * | 1995-09-13 | 1998-12-01 | Matsushita Electric Industrial Co., Ltd. | Reproducing apparatus |
CN1470051A (zh) * | 2000-10-17 | 2004-01-21 | �����ɷ� | 非话音语音的高性能低比特率编码方法和设备 |
CN101743585A (zh) * | 2008-04-04 | 2010-06-16 | 弗劳恩霍夫应用研究促进协会 | 采用高质量音高校正的音频处理 |
CN103503061A (zh) * | 2011-02-14 | 2014-01-08 | 弗兰霍菲尔运输应用研究公司 | 在一频谱域中用以处理已解码音频信号的装置及方法 |
CN102682782A (zh) * | 2011-03-17 | 2012-09-19 | 索尼公司 | 语音处理装置、方法和程序 |
CN103067840A (zh) * | 2011-10-20 | 2013-04-24 | 杨国屏 | 增进语音即时输出的方法及助听器 |
CN102496374A (zh) * | 2011-12-16 | 2012-06-13 | 河海大学常州校区 | 听力补偿方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106157966A (zh) | 2016-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019101123A1 (zh) | 语音活性检测方法、相关装置和设备 | |
CN107068161B (zh) | 基于人工智能的语音降噪方法、装置和计算机设备 | |
US11869525B2 (en) | Method and apparatus for processing an audio signal, audio decoder, and audio encoder to filter a discontinuity by a filter which depends on two fir filters and pitch lag | |
CN108335694B (zh) | 远场环境噪声处理方法、装置、设备和存储介质 | |
CN102089809A (zh) | 用于提供改进的音频处理的方法、装置及计算机程序产品 | |
CN109087634A (zh) | 一种基于音频分类的音质设置方法 | |
CN105913854A (zh) | 语音信号级联处理方法和装置 | |
CN104956437A (zh) | 执行增益控制的系统及方法 | |
CN106797526A (zh) | 音频处理装置、方法和程序 | |
CN110503940A (zh) | 语音增强方法、装置、存储介质、电子设备 | |
CN106157966B (zh) | 语音信号处理装置及语音信号处理方法 | |
US20150170659A1 (en) | Method and apparatus for enhancing the modulation index of speech sounds passed through a digital vocoder | |
EP3353786B1 (en) | Processing high-definition audio data | |
US11854571B2 (en) | Method, device and electronic apparatus for transmitting and receiving speech signal | |
CN112599148A (zh) | 一种语音识别方法及装置 | |
EP3048812B1 (en) | Voice signal processing apparatus and voice signal processing method | |
CN101557443B (zh) | 数字电话会议的桥路运算方法 | |
CN110060667B (zh) | 语音信息的批量处理方法、装置、计算机设备及存储介质 | |
US20210287674A1 (en) | Voice recognition for imposter rejection in wearable devices | |
CN112309425A (zh) | 一种声音变调方法、电子设备及计算机可读存储介质 | |
CN111710330A (zh) | 基于深度神经网络的环境噪声消除方法、装置及存储介质 | |
CN110197666A (zh) | 一种基于神经网络的语音识别方法、装置 | |
CN114826303B (zh) | 一种基于高优先级帧的数据解调系统 | |
CN113724728B (zh) | 一种基于gmm模型的音频信号的处理方法 | |
Lin | Deep Learning Based Speech Enhancement and Its Application to Speech Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |