CN113823302A - 一种语言清晰度的优化方法及装置 - Google Patents
一种语言清晰度的优化方法及装置 Download PDFInfo
- Publication number
- CN113823302A CN113823302A CN202010563889.XA CN202010563889A CN113823302A CN 113823302 A CN113823302 A CN 113823302A CN 202010563889 A CN202010563889 A CN 202010563889A CN 113823302 A CN113823302 A CN 113823302A
- Authority
- CN
- China
- Prior art keywords
- value
- language definition
- frequency spectrum
- noise
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000001228 spectrum Methods 0.000 claims abstract description 177
- 230000003595 spectral effect Effects 0.000 claims description 26
- 238000005457 optimization Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明的实施例提供一种语言清晰度的优化方法及装置。所述方法包括:获取噪声的频谱分量;根据预设语言清晰度权重值的最大值,获取语言清晰度权重精度值;根据语言清晰度权重精度值,获取当前语言清晰度值权重值;根据当前语言清晰度值权重值,获得最终的清晰度值;根据目标语言清晰度值,以及所述最终的清晰度值,对噪声的频谱分量进行优化。本发明通过获取噪声的频谱分量和预设的语言清晰度权重值,进而获取语言清晰度权重精度值、频谱组合对应的当前语言清晰度权重值、最终的清晰度值、目标语言清晰度值,能够方便快捷的对噪声的频谱分量进行优化,具有方法操作简单、成本较低的优点。
Description
技术领域
本发明涉及语言清晰度技术领域,特别是指一种语言清晰度的优化方法及装置。
背景技术
语言清晰度是指一个或几个发音人所发的、经过通信系统能被一个或几个听音人所确定的意义不连贯的语言单位百分数。
目前语言清晰度(Articulation Index)分析现状如下:多通过LMS(非学习管理系统)、Head等软件进行计算,得出语言清晰度曲线或平均值;通过滤波器的手段对信号进行滤波,得出部分频率/频带优化后的信号;计算滤波后信号的语言清晰度曲线/平均值。但此方法较为繁琐、易受到信号分析人员的处理方式的影响、且滤波过程中容易影响其相邻频带,频程边界不易控制;并且此方法无法给出特定频程对语言清晰度的权重。
发明内容
本发明要解决的技术问题是提供一种语言清晰度的优化方法及装置,以解决现有语言清晰度方法较为繁琐的问题。
为解决上述技术问题,本发明的技术方案如下:
根据本发明的一个方面,提供一种一种语言清晰度的优化方法,包括:
获取噪声的频谱分量,所述频谱分量包括至少一个能量水平等级,每一能量水平等级对应至少一个频率,一个能量水平等级和一个频率构成的频谱组合,对应一个预设的语言清晰度权重值;
根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值;
根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值;
根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值;
根据目标语言清晰度值,对噪声的频谱分量进行优化。
可选的,根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值,包括:
将所述预设语言清晰度权重值的最大值分成N份,将每份权重值作为语言清晰度权重精度值,所述N大于所述频谱分量包括的能量水平等级的个数。
可选的,根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值,包括:
根据输入的所述噪声的频谱分量的至少一个频谱组合,按照每个频谱组合对应的预设语言清晰度权重值,加上语言清晰度权重精度值,得到所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值。
可选的,根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值,包括:
将所述频谱分量包括的所有频谱组合对应的当前语言清晰度权重值求和,获得最终的语言清晰度值。
可选的,根据目标语言清晰度值,对噪声的频谱分量进行优化,包括:
从所述频谱分量的频谱组合中,选择一部分频谱组合;
对该选择的一部分频谱组合对应的当前语言清晰度权重值,按照目标语言清晰度值,得到优化值;
按照优化值对噪声的频谱分量进行优化。
可选的,按照目标语言清晰度值,得到优化值,包括:
按照所述目标语言清晰度减去当前语言清晰度权重值,得到优化值。
本发明的实施例还提供一种语言清晰度的优化装置,包括:
频谱分量获取模块,用于获取噪声的频谱分量,所述频谱分量包括至少一个能量水平等级,每一能量水平等级对应至少一个频率,一个能量水平等级和一个频率构成的频谱组合,对应一个预设的语言清晰度权重值;
精度值获取模块,用于根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值;
权重值获取模块,用于根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值;
清晰度值获取模块,用于根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值;
优化模块,用于根据目标语言清晰度值,对噪声的频谱分量进行优化。
可选的,精度值获取模块,具体用于:将所述预设语言清晰度权重值的最大值分成N份,将每份权重值作为语言清晰度权重精度值,所述N大于所述频谱分量包括的能量水平等级的个数。
可选的,权重值获取模块,具体用于:根据输入的所述噪声的频谱分量的至少一个频谱组合,按照每个频谱组合对应的预设语言清晰度权重值,加上语言清晰度权重精度值,得到所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值。
可选的,清晰度值获取模块,具体用于:将所述频谱分量包括的所有频谱组合对应的当前语言清晰度权重值求和,获得最终的语言清晰度值。
可选的,优化模块,具体用于:从所述频谱分量的频谱组合中,选择一部分频谱组合;
对该选择的一部分频谱组合对应的当前语言清晰度权重值,按照目标语言清晰度值得到优化值;
按照优化值对噪声的频谱分量进行优化。
可选的,按照目标语言清晰度值,得到优化值,包括:
按照所述目标语言清晰度减去当前语言清晰度权重值,得到优化值。
本发明的上述方案至少包括以下有益效果:
本发明的上述方案,通过获取噪声的频谱分量和预设的语言清晰度权重值,进而获取语言清晰度权重精度值、频谱组合对应的当前语言清晰度权重值、最终的清晰度值、目标语言清晰度值,能够方便快捷的对噪声的频谱分量进行优化,具有方法操作简单、成本较低的优点。
附图说明
图1是本发明的一种语言清晰度的优化方法的步骤图;
图2是本发明的一种语言清晰度的优化装置的器件连接图;
图3是语言区域示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明的实施例提出一种语言清晰度的优化方法,包括:
S1、获取噪声的频谱分量,所述频谱分量包括至少一个能量水平等级,每一能量水平等级对应至少一个频率,一个能量水平等级和一个频率构成的频谱组合,对应一个预设的语言清晰度权重值;
S2、根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值;
S3、根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值;
S4、根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值;
S5、根据目标语言清晰度值,对噪声的频谱分量进行优化。
本发明通过获取噪声的频谱分量和预设的语言清晰度权重值,进而获取语言清晰度权重精度值、频谱组合对应的当前语言清晰度权重值、最终的清晰度值、目标语言清晰度值,能够方便快捷的对噪声的频谱分量进行优化,具有方法操作简单、成本较低的优点。
本发明的一可选实施例中,步骤S2根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值,包括:
将所述预设语言清晰度权重值的最大值分成N份,将每份权重值作为语言清晰度权重精度值,所述N大于所述频谱分量包括的能量水平等级的个数。
方便后续当前语言清晰度权重值的计算,提高方法的工作效率和准确性。
本发明的一可选实施例中,步骤S3根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值,包括:
根据输入的所述噪声的频谱分量的至少一个频谱组合,按照每个频谱组合对应的预设语言清晰度权重值,加上语言清晰度权重精度值,得到所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值。
本发明的一可选实施例中,步骤S4根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值,包括:
将所述频谱分量包括的所有频谱组合对应的当前语言清晰度权重值求和,获得最终的语言清晰度值。
本发明的一可选实施例中,步骤S5根据目标语言清晰度值,以及所述最终的清晰度值,对噪声的频谱分量进行优化,包括:
从所述频谱分量的频谱组合中,选择一部分频谱组合;
对该选择的一部分频谱组合对应的当前语言清晰度权重值,按照目标语言清晰度值,得到优化值;
按照优化值对噪声的频谱分量进行优化。
本发明的一可选实施例中,按照目标语言清晰度值,得到优化值,包括:按照所述目标语言清晰度减去当前语言清晰度权重值,得到优化值。
如图2所示,本发明的实施例提出一种语言清晰度的优化装置,包括:
频谱分量获取模块,用于获取噪声的频谱分量,所述频谱分量包括至少一个能量水平等级,每一能量水平等级对应至少一个频率,一个能量水平等级和一个频率构成的频谱组合,对应一个预设的语言清晰度权重值;
精度值获取模块,用于根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值;
权重值获取模块,用于根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值;
清晰度值获取模块,用于根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值;
优化模块,用于根据目标语言清晰度值,对噪声的频谱分量进行优化。
本发明通过获取噪声的频谱分量和预设的语言清晰度权重值,进而获取语言清晰度权重精度值、频谱组合对应的当前语言清晰度权重值、最终的清晰度值、目标语言清晰度值,能够方便快捷的对噪声的频谱分量进行优化,具有装置结构操作简单、成本较低的优点。
本发明的一可选实施例中,精度值获取模块,具体用于:
将所述预设语言清晰度权重值的最大值分成N份,将每份权重值作为语言清晰度权重精度值,所述N大于所述频谱分量包括的能量水平等级的个数。
方便后续当前语言清晰度权重值的计算,提高方法的工作效率和准确性。
本发明的一可选实施例中,权重值获取模块,具体用于:
根据输入的所述噪声的频谱分量的至少一个频谱组合,按照每个频谱组合对应的预设语言清晰度权重值,加上语言清晰度权重精度值,得到所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值。
本发明的一可选实施例中,清晰度值获取模块,具体用于:
将所述频谱分量包括的所有频谱组合对应的当前语言清晰度权重值求和,获得最终的语言清晰度值。
本发明的一可选实施例中,优化模块,具体用于:
从所述频谱分量的频谱组合中,选择一部分频谱组合;
对该选择的一部分频谱组合对应的当前语言清晰度权重值,按照目标语言清晰度值得到优化值;
按照优化值对噪声的频谱分量进行优化。
本发明的一可选实施例中,按照目标语言清晰度值,得到优化值,包括:按照所述目标语言清晰度减去当前语言清晰度权重值,得到优化值。
需要说明的是,该装置是与上述图1所述的方法对应的装置,所示方法中的所有实现方式均适用于该装置的实施例中,也能达到同样的技术效果。
本发明的实施例的一种语言清晰度的优化方法的工作流程为:获取噪声的频谱分量,所述频谱分量包括至少一个能量水平等级,每一能量水平等级对应至少一个频率,一个能量水平等级和一个频率构成的频谱组合,对应一个预设的语言清晰度权重值;语言清晰度权重值可以通过表1查到:
表1语言清晰度指数图表(简略版)
根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值;清晰度指数AI在NVH(噪声Noise、振动Vibration与声振粗糙度Harshness)行业是0-100%范围内的值。如图3,横轴表示噪声频率,纵轴表示噪声能量水平等级,如果噪声频谱(distrubance speetrum)位于语音区域(speech area)的下部,则交谈只会稍有干扰,清晰度指数达到高值(≈100%);如果噪声谱在语音区域的上部,交流变得更加困难,清晰度指数达到低值(≈0%)。根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值;根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值;根据用户需求,设定目标语言清晰度值,根据目标语言清晰度值,以及所述最终的清晰度值,对噪声的频谱分量进行优化。
本发明的实施例是根据标准规定1/3倍频程法计算语言清晰度值。首先,根据输入的1/3倍频程Level(能量水平等级),对其进行四舍五入,取整小数点后两位数与计算精度相同(计算精度小数位数记为n)。
其次,根据各频带声压级大小计算其对应的语言清晰度指数AI贡献,如表1,公式逻辑如下:
若Level≤Level_min,则AI=AI_max;
若Level≥Level_max,则AI=0;
若Level在Level_min与Level_max之间,则AI计算公式如下:
表2各频噪声频率及其对应的最大/小能量水平等级、最大/小语言清晰度指数
Level_min | AI_max | Level_max | AI_min | |
噪声频率(Hz) | AI-100%(dB) | AI-100%(%) | AI-0%(dB) | AI-0%(%) |
200 | 34 | 1.00 | 64 | 0.00 |
250 | 39 | 2.00 | 69 | 0.00 |
315 | 41 | 3.25 | 71 | 0.00 |
400 | 43 | 4.25 | 73 | 0.00 |
500 | 45 | 4.50 | 75 | 0.00 |
630 | 45 | 5.25 | 75 | 0.00 |
800 | 45 | 6.50 | 75 | 0.00 |
1000 | 44 | 7.25 | 74 | 0.00 |
1250 | 42 | 8.50 | 72 | 0.00 |
1600 | 40 | 11.50 | 70 | 0.00 |
2000 | 37 | 11.00 | 67 | 0.00 |
2500 | 35 | 9.50 | 65 | 0.00 |
3150 | 33 | 9.00 | 63 | 0.00 |
4000 | 30 | 7.75 | 60 | 0.00 |
5000 | 26 | 6.25 | 56 | 0.00 |
6300 | 21 | 2.50 | 51 | 0.00 |
如,通过潜在优化空间分析可知,2500Hz、3150Hz、4000Hz、5000Hz、6300Hz优化潜力接近0%,其5个频带优化至极限后仅能使得总AI提升0.3%,空间小非重点频带,在测试优化时应有限调节其他频带;如为达成80%目标,可假定如下方案:
1、从所述频谱分量的频谱组合中,选择一部分频谱组合;对该选择的一部分频谱组合对应的当前语言清晰度权重值,按照目标语言清晰度值以及所述最终的语言清晰度值,进行优化,得到优化后的语言清晰度权重值;按照优化后的语言清晰度权重值对噪声的频谱分量进行优化。
如优化800Hz、1000Hz、1250Hz、1600Hz;该选择的一部分频谱组合每3dB指数分别为0.65%、0.725%、0.9%、1.15%,每频程优化3dB后即可保证达到80%目标(优化后AI为80.4%);
2、对所有频谱组合对应的当前语言清晰度权重值,按照目标语言清晰度值以及所述最终的语言清晰度值,进行优化,得到优化后的语言清晰度权重值;按照优化后的语言清晰度权重值对噪声的频谱分量进行优化。
如优化200Hz、250Hz、315Hz、400Hz、500Hz、630Hz、800Hz、1000Hz、1250Hz、1600Hz、2000Hz,每频带优化1.5dB后亦可保证达到80%目标(优化后AI为80.3%);
3、如此可假定多种方案,根据频谱特性快速得出所需潜在优化空间结果,给出语音区域在噪声谱下部的优化开展方案。
根据FFT(快速傅里叶变换)频谱特性,评价多种方案组合可行性后可确认频带重要度排序,进而开展下步调校。按照指数分布情况,频谱组合有两种优化方案,最终可以会选择第一种方案进行优化。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种语言清晰度的优化方法,其特征在于,包括:
获取噪声的频谱分量,所述频谱分量包括至少一个能量水平等级,每一能量水平等级对应至少一个频率,一个能量水平等级和一个频率构成的频谱组合,对应一个预设的语言清晰度权重值;
根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值;
根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值;
根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值;
根据目标语言清晰度值,对噪声的频谱分量进行优化。
2.根据权利要求1所述的语言清晰度的优化方法,其特征在于,根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值,包括:
将所述预设语言清晰度权重值的最大值分成N份,将每份权重值作为语言清晰度权重精度值,所述N大于所述频谱分量包括的能量水平等级的个数。
3.根据权利要求2所述的语言清晰度的优化方法,其特征在于,根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值,包括:
根据输入的所述噪声的频谱分量的至少一个频谱组合,按照每个频谱组合对应的预设语言清晰度权重值,加上语言清晰度权重精度值,得到所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值。
4.根据权利要求3所述的语言清晰度的优化方法,其特征在于,根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值,包括:
将所述频谱分量包括的所有频谱组合对应的当前语言清晰度权重值求和,获得最终的语言清晰度值。
5.根据权利要求4所述的语言清晰度的优化方法,其特征在于,根据目标语言清晰度值,对噪声的频谱分量进行优化,包括:
从所述频谱分量的频谱组合中,选择一部分频谱组合;
对该选择的一部分频谱组合对应的当前语言清晰度权重值,按照目标语言清晰度值,得到优化值;
按照优化值对噪声的频谱分量进行优化。
6.根据权利要求5所述的语言清晰度的优化方法,其特征在于,按照目标语言清晰度值,得到优化值,包括:
按照所述目标语言清晰度减去当前语言清晰度权重值,得到优化值。
7.一种语言清晰度的优化装置,其特征在于,包括:
频谱分量获取模块,用于获取噪声的频谱分量,所述频谱分量包括至少一个能量水平等级,每一能量水平等级对应至少一个频率,一个能量水平等级和一个频率构成的频谱组合,对应一个预设的语言清晰度权重值;
精度值获取模块,用于根据所述频谱分量包括的频谱组合对应的预设语言清晰度权重值的最大值,获取语言清晰度权重精度值;
权重值获取模块,用于根据语言清晰度权重精度值,获取所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值;
清晰度值获取模块,用于根据所述噪声的频谱分量的所有频谱组合对应的当前语言清晰度权重值,获得最终的清晰度值;
优化模块,用于根据目标语言清晰度值,对噪声的频谱分量进行优化。
8.根据权利要求7所述的语言清晰度的优化装置,其特征在于,精度值获取模块,具体用于:
将所述预设语言清晰度权重值的最大值分成N份,将每份权重值作为语言清晰度权重精度值,所述N大于所述频谱分量包括的能量水平等级的个数。
9.根据权利要求8所述的语言清晰度的优化装置,其特征在于,权重值获取模块,具体用于:
根据输入的所述噪声的频谱分量的至少一个频谱组合,按照每个频谱组合对应的预设语言清晰度权重值,加上语言清晰度权重精度值,得到所述噪声的频谱分量的至少一个频谱组合对应的当前语言清晰度权重值。
10.根据权利要求9所述的语言清晰度的优化装置,其特征在于,清晰度值获取模块,具体用于:
将所述频谱分量包括的所有频谱组合对应的当前语言清晰度权重值求和,获得最终的语言清晰度值。
11.根据权利要求10所述的语言清晰度的优化装置,其特征在于,优化模块,具体用于:
从所述频谱分量的频谱组合中,选择一部分频谱组合;
对该选择的一部分频谱组合对应的当前语言清晰度权重值,按照目标语言清晰度值得到优化值;
按照优化值对噪声的频谱分量进行优化。
12.根据权利要求11所述的语言清晰度的优化装置,其特征在于,按照目标语言清晰度值,得到优化值,包括:
按照所述目标语言清晰度减去当前语言清晰度权重值,得到优化值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010563889.XA CN113823302A (zh) | 2020-06-19 | 2020-06-19 | 一种语言清晰度的优化方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010563889.XA CN113823302A (zh) | 2020-06-19 | 2020-06-19 | 一种语言清晰度的优化方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113823302A true CN113823302A (zh) | 2021-12-21 |
Family
ID=78911950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010563889.XA Pending CN113823302A (zh) | 2020-06-19 | 2020-06-19 | 一种语言清晰度的优化方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113823302A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1640191A (zh) * | 2002-07-12 | 2005-07-13 | 唯听助听器公司 | 助听器和提高语言清晰度的方法 |
CN106098080A (zh) * | 2016-06-01 | 2016-11-09 | 南方科技大学 | 一种噪声环境下言语识别阈的确定方法及装置 |
CN108882110A (zh) * | 2017-05-09 | 2018-11-23 | 大北欧听力公司 | 基于语音清晰度的听力设备及相关方法 |
CN109671441A (zh) * | 2018-12-20 | 2019-04-23 | 重庆长安汽车股份有限公司 | 识别语言清晰度频带贡献量的方法 |
-
2020
- 2020-06-19 CN CN202010563889.XA patent/CN113823302A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1640191A (zh) * | 2002-07-12 | 2005-07-13 | 唯听助听器公司 | 助听器和提高语言清晰度的方法 |
CN106098080A (zh) * | 2016-06-01 | 2016-11-09 | 南方科技大学 | 一种噪声环境下言语识别阈的确定方法及装置 |
CN108882110A (zh) * | 2017-05-09 | 2018-11-23 | 大北欧听力公司 | 基于语音清晰度的听力设备及相关方法 |
CN109671441A (zh) * | 2018-12-20 | 2019-04-23 | 重庆长安汽车股份有限公司 | 识别语言清晰度频带贡献量的方法 |
Non-Patent Citations (1)
Title |
---|
海德声科: "什么是语言清晰度指数", pages 1, Retrieved from the Internet <URL:https://www.auto-testing.net/news/show-97717.html> * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kawahara et al. | Technical foundations of TANDEM-STRAIGHT, a speech analysis, modification and synthesis framework | |
CN109643554A (zh) | 自适应语音增强方法和电子设备 | |
CN103915103A (zh) | 语音质量增强系统 | |
CN113053350B (zh) | 一种基于噪声主观评价抑制的有源控制误差滤波器设计方法 | |
KR20070000987A (ko) | 음성 신호의 적응성 개선을 위한 시스템 | |
CN108111443B (zh) | 一种确定语音链路参量均衡器调试参数的方法及装置 | |
CN112565981B (zh) | 啸叫抑制方法、装置、助听器及存储介质 | |
EP3258704B1 (en) | Determination method and apparatus for pre-set set parameters of audio equalizer (aeq) | |
DE112007003625T5 (de) | Echounterdrückungsvorrichtung, echounterdrückungssystem, Echounterdrückungsverfahren und Computerprogramm | |
CN110248300B (zh) | 一种基于自主学习的啸叫抑制方法及扩声系统 | |
CN104867499A (zh) | 一种用于助听器的分频段维纳滤波去噪方法和系统 | |
CN103813251A (zh) | 一种可调节去噪程度的助听器去噪装置和方法 | |
CN112036045A (zh) | 一种变电站低频噪声控制限值确定方法、系统及介质 | |
CN101458931A (zh) | 一种消除语音信号中的环境噪声的方法 | |
CN111181516A (zh) | 一种音色均衡方法 | |
CN113823302A (zh) | 一种语言清晰度的优化方法及装置 | |
TW201312551A (zh) | 語音增強方法 | |
EP3158775A1 (en) | Multi-aural mmse analysis techniques for clarifying audio signals | |
CN110168640B (zh) | 用于增强信号中需要分量的装置和方法 | |
CN109635759B (zh) | 一种信号处理方法、装置及计算机可读存储介质 | |
EP3840404A1 (en) | A method for audio rendering by an apparatus | |
CN108877829B (zh) | 一种信号处理的方法和装置 | |
CN112634921A (zh) | 一种语音处理方法、装置和存储介质 | |
CN110366068B (zh) | 音频调节方法、电子设备以及装置 | |
CN116744395B (zh) | 基于不同频率的移动终端控制方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |