CN106098080A - 一种噪声环境下言语识别阈的确定方法及装置 - Google Patents

一种噪声环境下言语识别阈的确定方法及装置 Download PDF

Info

Publication number
CN106098080A
CN106098080A CN201610383429.2A CN201610383429A CN106098080A CN 106098080 A CN106098080 A CN 106098080A CN 201610383429 A CN201610383429 A CN 201610383429A CN 106098080 A CN106098080 A CN 106098080A
Authority
CN
China
Prior art keywords
signal
noise
speech
noise ratio
under
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610383429.2A
Other languages
English (en)
Other versions
CN106098080B (zh
Inventor
陈霏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern University of Science and Technology
Original Assignee
Southern University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern University of Science and Technology filed Critical Southern University of Science and Technology
Priority to CN201610383429.2A priority Critical patent/CN106098080B/zh
Publication of CN106098080A publication Critical patent/CN106098080A/zh
Application granted granted Critical
Publication of CN106098080B publication Critical patent/CN106098080B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种噪声环境下言语识别阈的确定方法及装置。该方法包括:基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数;根据所述语言清晰度指数与所述信噪比的对应关系获取预设语言清晰度指数对应的信噪比;基于预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型确定在所述噪音环境下的言语识别阈。本发明实施例通过采用上述技术方案,无需进行言语识别实验就可以确定不同噪声环境下的言语识别阈,可以有效地减少确定言语识别阈时所需的操作步骤,提高噪声环境下言语识别阈的获取速度,增大言语识别阈确定方法的应用范围。

Description

一种噪声环境下言语识别阈的确定方法及装置
技术领域
本发明涉及声音处理技术领域,尤其涉及一种噪声环境下言语识别阈的确定方法及装置。
背景技术
现实环境中的噪声对人们的言语识别存在极大的影响,噪音环境下的言语识别阈(Speech Reception Threshold)是衡量噪声对于言语识别率影响的一个重要指标。
噪声环境下言语识别阈的含义是受试者能够听懂一半测试语音或者是言语识别率达到50%时的信噪比。传统方法通常需要在噪声环境下进行言语识别实验来测量言语识别阈;或者,由带噪声的语音信号计算得到该带噪声语音信号的清晰度指数,通过语言清晰度指数(Speech Intelligibility Index)衡量单一噪声源对言语识别率的影响。
发明人在实现本发明的过程中发现现有技术存在如下缺陷:在进行言语识别实验的过程中,需要反复调节信噪比的值才能达到受试者听懂一半测试语音的状态,调节过程繁琐耗时;对每个新噪声源都要重新进行言语识别实验才能确定该噪声环境下的言语识别阈;通过语言清晰度指数只能确定单一噪声对言语识别率的影响,无法确定不同噪声源对于言语识别率的影响。
发明内容
有鉴于此,本发明实施例提供一种噪声环境下言语识别阈的确定方法及装置,以解决现有技术中言语识别阈确定过程繁琐耗时,对于不同噪声需要重新进行测试的技术问题。
第一方面,本发明实施例提供了一种噪声环境下言语识别阈的确定方法,包括:
基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数;
根据所述语言清晰度指数与所述信噪比的对应关系获取预设语言清晰度指数对应的信噪比;
基于预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型确定在所述噪音环境下的言语识别阈。
第二方面,本发明实施例还提供了一种噪声环境下言语识别阈的确定装置,包括:
语言清晰度获取模块,用于基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数;
信噪比获取模块,用于根据所述语言清晰度指数与所述信噪比的对应关系获取预设语言清晰度指数对应的信噪比;
言语识别阈确定模块,用于基于预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型确定在所述噪音环境下的言语识别阈。
本发明实施例提供的噪声环境下言语识别阈的确定方案,获取带噪声信号不同信噪比强度时的语言清晰度指数,根据语言清晰度指数与信噪比强度的对应关系计算该带噪声信号当语言清晰度指数为预设语言清晰度指数时的信噪比,根据言语清晰度指数为预设语言清晰度指数时的信噪比与言语识别阈之间 的数学模型确定该噪音环境下的言语识别阈。本发明实施例通过采用上述技术方案,无需进行言语识别实验就可以确定不同噪声环境下的言语识别阈,可以有效地减少确定言语识别阈时所需的操作步骤,提高噪声环境下言语识别阈的获取速度,增大言语识别阈确定方法的应用范围。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例一提供的一种噪声环境下言语识别阈的确定方法的流程示意图;
图2为本发明实施例二提供的一种噪声环境下言语识别阈的确定方法的流程示意图;
图3为本发明实施例三提供的一种优选的噪声环境下言语识别阈的确定方法的流程示意图;
图4A为本发明实施例三提供的一种环境噪声信号的信号幅度示意图;
图4B为本发明实施例三提供的一种无噪声语音信号B1的信号幅度示意图;
图4C为本发明实施例三提供的一种无噪声语音信号B2的信号幅度示意图;
图4D为本发明实施例三提供的一种无噪声语音信号B3的信号幅度示意图;
图5A为本发明实施例三提供的一种带噪声信号C1的信号幅度示意图;
图5B为本发明实施例三提供的一种带噪声信号C2的信号幅度示意图;
图5C为本发明实施例三提供的一种带噪声信号C3的信号幅度示意图;
图6为本发明实施例三提供的一种言语清晰度指数与信噪比的关系曲线;
图7为本发明实施例三提供的一种言语清晰度指数为0.8时的信噪比与言语 识别阈的关系曲线;
图8为本发明实施例四提供的一种噪声环境下言语识别阈的确定装置的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
本发明实施例一提供一种噪声环境下言语识别阈的确定方法。该方法可以由噪声环境下言语识别阈的确定装置执行,其中,该装置可由软件和/或硬件实现。图1是本发明实施例一提供的噪声环境下言语识别阈的确定方法的流程示意图。如图1所示,该确定方法包括:
S110、基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数。
在本实施例中,言语清晰度模型指的是通过带噪声语音信号的声学信息获取该带噪声语音信号的语言清晰度指数的计算模型;言语清晰度指数是指一个或几个发音人/工具所发的、经过通信系统能被一个或几个听音人所确定的意义不连贯的语言单位百分数;信噪比(Signal-to-Noise Ratio,SNR)指的是一个电子设备或电子系统中信号与噪声的比例。
本实施例中,所使用的不同信噪比与所获取的言语清晰度指数一一对应存 储,获取语言清晰度指数时所使用的信噪比的个数(即所得到的语言清晰度指数的个数)可以根据需要灵活设置,例如,可以设置3个或更多个。在此,需要指出的是,考虑到言语清晰度指数与信噪比强度的对应关系,根据信噪比强度获取语言清晰度指数时,优选的,所获取的语言清晰度指数的值应在0和1之间且不等于0或1,以确保后续操作步骤的准确性。
S120、根据所述语言清晰度指数与所述信噪比的对应关系获取预设语言清晰度指数对应的信噪比。
在此,预设语言清晰度指数可以是任意处于0和1之间的语言清晰度指数,只要该语言清晰度指数所对应的信噪比强度与言语识别阈之间存在相关性且其相关性不因噪声或其他因素的改变而改变即可。
S130、基于预设语言清晰度指数对应信噪比与言语识别阈之间的数学模型确定在所述噪音环境下的言语识别阈。
示例性的,预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型可以是表示二者关系的数学关系式,该数学关系式可以是线性关系式,也可以是非线性关系式,只要能够准确地描述带噪声信号预设语言清晰度指数对应的信噪比与该带噪声信号的言语识别阈之间的对应关系即可,一般可以基于经验或实验进行确定。
本发明实施例一提供的噪声环境下言语识别阈的确定方法,计算预设数量带噪声信号的信噪比并基于言语清晰度模型获取该预设数量信噪比分别对应的言语清晰度指数,根据该预设数量信噪比与言语清晰度指数之间的对应关系获取语言清晰度指数为预设语言清晰度指数时的信噪比强度,根据带噪声信号语言清晰度指数为预设语言清晰度指数时的信噪比与语言识别阈之间的数学模型计算该噪声环境下的言语识别阈。本实施例通过采用上述技术方案,无需进行 言语识别实验就可以确定不同噪声环境下的言语识别阈,可以有效地减少确定言语识别阈时所需的操作步骤,提高噪声环境下言语识别阈的获取速度,增大言语识别阈确定方法的应用范围。
实施例二
图2为本发明实施例二提供的一种噪声环境下言语识别阈的确定方法的流程示意图,本实施例在上述实施例的基础上进行优化,进一步的,所述基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数,包括:将无噪声信号和带噪声信号分割成预设数量的频域子信号,并获取各频域子信号的声学信息;计算各无噪声信号频域子信号和带噪声信号频域子信号的声学信息差值;根据所述声学信息差值获取噪声环境下的语言清晰度指数。
进一步的,所述根据所述语言清晰度指数与所述信噪比的对应关系获取预设语言清晰度指数对应的信噪比,包括:根据所述语言清晰度指数与所述信噪比的对应关系拟合在所述噪音环境下的语言清晰度指数与所述信噪比的关系曲线;根据所述关系曲线确定在所述噪音环境下预设语言清晰度指数对应的信噪比。
进一步的,在所述基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数之前,还包括:获取无噪声信号并记录在噪音环境下的环境噪音信号;将所述无噪声信号和所述环境噪音信号叠加形成带噪声信号,并计算所述带噪声信号的信噪比。
相应的,本实施例噪声环境下言语识别阈的确定方法包括:
S210、获取无噪声信号并记录在噪音环境下的环境噪音信号。
本实施例中,,无噪声信号可以直接从电脑等存储设备中获取,环境噪音信 号可以通过在噪声环境下使用麦克风等可以将声音信号转换为电信号的声音记录设备记录获得。示例性的,获取无噪声信号并记录在噪音环境下的环境噪音信号的过程可以为:从存储设备中获取一段无噪声信号;在噪声环境下以与该无噪声信号采样频率相同的采样频率进行采样记录,采样记录环境噪音信号的时间长度优选大于或等于该无噪声信号的时间长度;对记录得到的环境噪音信号的时间长度进行调整以使其时间长度与无噪声信号的时间长度相同。
S220、将所述无噪声信号和所述环境噪音信号叠加形成带噪声信号,并计算所述带噪声信号的信噪比。
示例性的,可以将无噪声信号和环境噪声信号按照时间叠加形成带噪声信号。带噪声语音信号所携带的噪声包括除目标语音信号之外的所有声音,即,除所需要获取的目标语音,其他所有声音都可以称之为噪声,例如,除目标语音之外的其他语音信号、风声、汽车鸣笛声或者呼吸声,等等。带噪声语音信号所携带的噪声可以是单噪声,也可以是多噪声,即,带噪声语音信号可以只携带一个噪声信号,也可以携带多个噪声信号,此处不作限制。
示例性的,某带噪声信号信噪比的计算过程可以为:通过麦克风等采集工具采集某时间段内的噪声得到该时间段内的离散时间噪声信号,并根据声音信号能量与振幅的关系计算该时间段内该噪声信号的能量;采集并计算相同时间段内无噪声语音信号的能量;将无噪声语音信号的能量与噪声信号的能量作比并计算其比值,从而得到该无噪声语音信号携带该噪声信号时的带噪声信号的信噪比强度。
S230、将无噪声信号和带噪声信号分割成预设数量的频域子信号,并获取各频域子信号的声学信息。
示例性的,在将无噪声信号和带噪声信号分割成预设数量的频域子信号之 前,可以首先将得到的时域内的无噪声信号和时域内的带噪声信号转换为频域内的无噪声信号和频域内的带噪声信号。其中,时域和频域是信号的基本性质,时域描述的是数学函数或物理信号对时间的关系,其自变量(横轴)为时间;频域描述的是信号的频率结构及频率与该信号幅度的关系,其自变量(横轴)为频率。在此,将时域内的无噪声信号和时域内的带噪声信号转换为频域内的无噪声信号与频域内的带噪声信号时所采用的方法可以灵活的进行选择,例如,可以使用带通滤波器来实现将时域内的无噪声信号转换为频域内的无噪声信号、将时域内的带噪声信号转换为频域内的带噪声信号。
本实施例中,所选用的无噪声信号和带噪声信号优选为相同时间长度的无噪声信号和带噪声信号,其分割的频域子信号的预设数量优选为相同的预设数量,从而提高后续操作的准确性并降低后续计算的复杂程度。无噪声信号和带噪声信号所分割成的频域子信号的预设数量可以根据需要灵活设置。
示例性的,所获取的各频域子信号的声学信息可以包括各频域子信号的信号幅度和/或相位等声学信息。
S240、计算各无噪声信号频域子信号和带噪声信号频域子信号的声学信息差值。
示例性的,可以采用互相关等计算公式计算各无噪声信号频域子信号和带噪声信号频域子信号的声学信息差值。在此,需要指出的是,该声学信息差值指的是相同频率的无噪声信号频域子信号和带噪声信号频域子信号之间的声学信息差值,而并非无噪声信号的各频域信号或带噪声信号的各频域子信号之间的声学信息差值。
S250、根据所述声学信息差值获取噪声环境下的语言清晰度指数。
S260、根据所述语言清晰度指数与所述信噪比的对应关系拟合在所述噪音 环境下的语言清晰度指数与所述信噪比的关系曲线。
示例性的,可以采用MATLAB等软件对语言清晰度指数与信噪比的关系曲线进行拟合,在此,所拟合出的语言清晰度指数与信噪比的关系虚线可以是直线,也可以是曲线,只要能准确的反应语言清晰度指数与信噪比之间的关系即可。
S270、根据所述关系曲线确定在所述噪音环境下预设语言清晰度指数对应的信噪比。
进一步的,所述预设语言清晰度指数为0.8。发明人在实现本发明的过程中发现,当语言清晰度指数为0.8时,带噪声信号的信噪比与其言语清晰度之间存在较强的相关性,因此,优选的,所述预设语言清晰度指数可以设为0.8。
S280、基于预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型确定在所述噪音环境下的言语识别阈。
示例性的,各不同带噪声信号语言清晰度指数为0.8时的信噪比对应的言语识别阈的值如表1所示(表1中只列出了部分数值),进一步的,当预设语言清晰度指数为0.8时,所述预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型具体为:y=-0.66x+0.66,其中,x为噪音环境下预设语言清晰度指数对应的信噪比,y为所述噪音环境下的言语识别阈。
表1
本发明实施例二提供的噪声环境下言语识别阈的确定方法,获取无噪声信号并记录在噪声环境下的环境噪声信号,将无噪声信号和环境噪声信号叠加形成带噪声信号并计算该带噪声信号的信噪比,将无噪声信号和带噪声信号转换为频域信号并将其分别分割为预设数量的频域子信号,获取各频域子信号的声学信息,计算各无噪声信号频域子信号和带噪声信号频域子信号的声学信息差值并根据该声学信息差值获取噪声环境下带噪声信号的语言清晰度指数,根据带噪声信号语言清晰度指数与信噪比的对应关系拟合在该噪声环境下带噪声信 号的语言清晰度指数与信噪比的关系曲线并根据该关系曲线获取预设语言清晰度指数对应的信噪比,基于语言清晰度指数对应的信噪比与言语识别阈之间的数学模型确定该噪声环境下的言语识别阈。本实施例通过采用上述技术方案,无需进行言语识别实验就可以确定不同噪声环境下的言语识别阈,可以有效地减少确定言语识别阈时所需的操作步骤,提高噪声环境下言语识别阈的获取速度,增大言语识别阈确定方法的应用范围。
实施例三
图3为本发明实施例三提供的一种优选噪声环境下言语识别阈的确定方法的流程示意图,该确定方法可以由噪声环境下言语识别阈的确定装置执行。如图3所示,该确定方法包括:
S310、在噪声环境下,记录一段环境噪声信号,如图4A所示,其中,横坐标为时间,纵坐标为环境噪声信号的信号幅度。
S320、将一段已有的无噪声语音信号B1(如图4B所示)分别增强5dB和衰减5dB形成无噪声语音信号B2(如图4C所示)和无噪声语音信号B3(如图4D所示)。
S330、将所述环境噪音信号分别与无噪声语音信号B1、无噪声语音信号B2和无噪声语音信号B3叠加形成带噪声信号C1(如图5A所示)、带噪声信号C2(如图5B所示)和带噪声信号C3(如图5C所示)。
S340、计算带噪声信号C1的信噪比S1和言语清晰度指数A1、带噪声信号C2的信噪比S2和言语清晰度指数A2以及带噪声信号C3的信噪比S3和言语清晰度指数A3。
S350、将三组数据(S,A1)、(S2,A2)和(S3,A3)进行拟合得到言语 清晰度指数与信噪比的关系曲线(如图6所示),并根据所述关系曲线计算言语清晰度指数为0.8时的信噪比。
示例性的,假设得到的关系曲线为y=ax+b,其中,x为信噪比,y为言语清晰度指数,则可以得出信噪比x=(y-b)/a,此时,令言语清晰度指数y=0.8即可计算出言语清晰度指数为0.8时的信噪比为x=(0.8-b)/a。
S360、根据言语清晰度指数为0.8时的信噪比与言语识别阈之间的数学模型确定在所述噪音环境下的言语识别阈。
优选的,当言语清晰度指数为0.8时的信噪比与言语识别阈之间的数学模型为:y=-0.66x+0.66,其中,x为噪音环境下预设语言清晰度指数对应的信噪比,y为所述噪音环境下的言语识别阈(如图7所示)。示例性的,假设所得到的言语清晰度指数为0.8时的信噪比为x=(0.8-b)/a,则可以计算出该噪声环境下的言语识别阈为:y=-0.66x+0.66=-0.66(0.8-b)/a+0.66。
本发明实施例三提供的噪声环境下的言语识别阈的确定方法,无需进行言语识别实验就可以确定不同噪声环境下的言语识别阈,可以有效地减少确定言语识别阈时所需的操作步骤,提高噪声环境下言语识别阈的获取速度,增大言语识别阈确定方法的应用范围。
实施例四
图8为本发明实施例四提供的一种噪声环境下言语识别阈的确定装置的结构框图。该装置可由软件和/或硬件实现,可通过执行噪声环境下言语识别阈的确定方法来确定噪声环境下的言语识别阈。如图8所示,该装置包括:
语言清晰度获取模块810,用于基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数;
信噪比获取模块820,用于根据所述语言清晰度指数与所述信噪比的对应关系获取预设语言清晰度指数对应的信噪比;
言语识别阈确定模块830,用于基于预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型确定在所述噪音环境下的言语识别阈。
进一步的,所述语言清晰度获取模块810可以包括:声学信息获取单元,用于将无噪声信号和带噪声信号分割成预设数量的频域子信号,并获取各频域子信号的声学信息;差值计算单元,用于计算各无噪声信号频域子信号和带噪声信号频域子信号的声学信息差值;语言清晰度指数获取单元,用于根据所述声学信息差值获取噪声环境下的语言清晰度指数。
进一步的,所述信噪比获取模块820可以包括:关系曲线拟合单元,用于根据所述语言清晰度指数与所述信噪比的对应关系拟合在所述噪音环境下的语言清晰度指数与所述信噪比的关系曲线;信噪比确定单元,用于根据所述关系曲线确定在所述噪音环境下预设语言清晰度指数对应的信噪比。
进一步的,所述预设语言清晰度指数为0.8。
进一步的,所述预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型具体为:y=-0.66x+0.66,其中,x为噪音环境下预设语言清晰度指数对应的信噪比,y为所述噪音环境下的言语识别阈。
进一步的,本实施例提供的噪声环境下言语识别阈的确定装置,还可以包括:声音信号记录模块,用于在基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数之前,获取无噪声信号并记录在噪音环境下的环境噪音信号;信噪比计算模块,用于将所述无噪声信号和所述环境噪音信号叠加形成带噪声信号,并计算所述带噪声信号的信噪比。
本实施例提供的噪声环境下言语识别阈的确定装置可执行本发明任意实施 例所提供的噪声环境下言语识别阈的确定方法,具备执行噪声环境下言语识别阈的确定方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的噪声环境下言语识别阈的确定方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (12)

1.一种噪声环境下言语识别阈的确定方法,其特征在于,包括:
基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数;
根据所述语言清晰度指数与所述信噪比的对应关系获取预设语言清晰度指数对应的信噪比;
基于预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型确定在所述噪音环境下的言语识别阈。
2.根据权利要求1所述的方法,其特征在于,所述基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数,包括:
将无噪声信号和带噪声信号分割成预设数量的频域子信号,并获取各频域子信号的声学信息;
计算各无噪声信号频域子信号和带噪声信号频域子信号的声学信息差值;
根据所述声学信息差值获取噪声环境下的语言清晰度指数。
3.根据权利要求1所述的方法,其特征在于,所述根据所述语言清晰度指数与所述信噪比的对应关系获取预设语言清晰度指数对应的信噪比,包括:
根据所述语言清晰度指数与所述信噪比的对应关系拟合在所述噪音环境下的语言清晰度指数与所述信噪比的关系曲线;
根据所述关系曲线确定在所述噪音环境下预设语言清晰度指数对应的信噪比。
4.根据权利要求1-3任一所述的方法,其特征在于,所述预设语言清晰度指数为0.8。
5.根据权利要求4所述的方法,其特征在于,所述预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型具体为:y=-0.66x+0.66,
其中,x为噪音环境下预设语言清晰度指数对应的信噪比,y为所述噪音环境下的言语识别阈。
6.根据权利要求1所述的方法,其特征在于,在所述基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数之前,还包括:
获取无噪声信号并记录在噪音环境下的环境噪音信号;
将所述无噪声信号和所述环境噪音信号叠加形成带噪声信号,并计算所述带噪声信号的信噪比。
7.一种噪声环境下言语识别阈的确定装置,其特征在于,包括:
语言清晰度获取模块,用于基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数;
信噪比获取模块,用于根据所述语言清晰度指数与所述信噪比的对应关系获取预设语言清晰度指数对应的信噪比;
言语识别阈确定模块,用于基于预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型确定在所述噪音环境下的言语识别阈。
8.根据权利要求7所述的装置,其特征在于,所述语言清晰度获取模块包括:
声学信息获取单元,用于将无噪声信号和带噪声信号分割成预设数量的频域子信号,并获取各频域子信号的声学信息;
差值计算单元,用于计算各无噪声信号频域子信号和带噪声信号频域子信号的声学信息差值;
语言清晰度指数获取单元,用于根据所述声学信息差值获取噪声环境下的语言清晰度指数。
9.根据权利要求7所述的装置,其特征在于,所述信噪比获取模块包括:
关系曲线拟合单元,用于根据所述语言清晰度指数与所述信噪比的对应关系拟合在所述噪音环境下的语言清晰度指数与所述信噪比的关系曲线;
信噪比确定单元,用于根据所述关系曲线确定在所述噪音环境下预设语言清晰度指数对应的信噪比。
10.根据权利要求7-9任一所述的装置,其特征在于,所述预设语言清晰度指数为0.8。
11.根据权利要求10所述的装置,其特征在于,所述预设语言清晰度指数对应的信噪比与言语识别阈之间的数学模型具体为:y=-0.66x+0.66,
其中,x为噪音环境下预设语言清晰度指数对应的信噪比,y为所述噪音环境下的言语识别阈。
12.根据权利要求7所述的装置,其特征在于,还包括:
声音信号记录模块,用于在基于语言清晰度模型获取噪音环境下不同信噪比强度对应的语言清晰度指数之前,获取无噪声信号并记录在噪音环境下的环境噪音信号;
信噪比计算模块,用于将所述无噪声信号和所述环境噪音信号叠加形成带噪声信号,并计算所述带噪声信号的信噪比。
CN201610383429.2A 2016-06-01 2016-06-01 一种噪声环境下言语识别阈的确定方法及装置 Active CN106098080B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610383429.2A CN106098080B (zh) 2016-06-01 2016-06-01 一种噪声环境下言语识别阈的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610383429.2A CN106098080B (zh) 2016-06-01 2016-06-01 一种噪声环境下言语识别阈的确定方法及装置

Publications (2)

Publication Number Publication Date
CN106098080A true CN106098080A (zh) 2016-11-09
CN106098080B CN106098080B (zh) 2019-07-16

Family

ID=57447909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610383429.2A Active CN106098080B (zh) 2016-06-01 2016-06-01 一种噪声环境下言语识别阈的确定方法及装置

Country Status (1)

Country Link
CN (1) CN106098080B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106531183A (zh) * 2016-11-17 2017-03-22 中国传媒大学 一种基于传输系统声学参量的汉语语音清晰度评测算法
CN112420066A (zh) * 2020-11-05 2021-02-26 深圳市卓翼科技股份有限公司 降噪方法、装置、计算机设备和计算机可读存储介质
CN113823302A (zh) * 2020-06-19 2021-12-21 北京新能源汽车股份有限公司 一种语言清晰度的优化方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2381702A2 (en) * 2010-04-22 2011-10-26 Siemens Corporation Systems and methods for own voice recognition with adaptations for noise robustness
CN103578477A (zh) * 2012-07-30 2014-02-12 中兴通讯股份有限公司 基于噪声估计的去噪方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2381702A2 (en) * 2010-04-22 2011-10-26 Siemens Corporation Systems and methods for own voice recognition with adaptations for noise robustness
CN103578477A (zh) * 2012-07-30 2014-02-12 中兴通讯股份有限公司 基于噪声估计的去噪方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
D. ROBERT FRISINA ET AL: "Speech recognition In noise and presbycusis: relations to possible neural mechanisms", 《HEARING RESEARCH》 *
任寸寸 等: "噪声下言语识别能力评估", 《听力学及言语疾病杂志》 *
李丽 等: "背景噪声下言语测听", 《国外医学耳鼻咽喉科学分册》 *
李蓓 等: "言语识别阈测试", 《川北医学院学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106531183A (zh) * 2016-11-17 2017-03-22 中国传媒大学 一种基于传输系统声学参量的汉语语音清晰度评测算法
CN113823302A (zh) * 2020-06-19 2021-12-21 北京新能源汽车股份有限公司 一种语言清晰度的优化方法及装置
CN112420066A (zh) * 2020-11-05 2021-02-26 深圳市卓翼科技股份有限公司 降噪方法、装置、计算机设备和计算机可读存储介质
CN112420066B (zh) * 2020-11-05 2024-05-14 深圳市卓翼科技股份有限公司 降噪方法、装置、计算机设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN106098080B (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
Schädler et al. A simulation framework for auditory discrimination experiments: Revealing the importance of across-frequency processing in speech perception
CN104464722B (zh) 基于时域和频域的语音活性检测方法和设备
JP2004509362A (ja) 電子的信号からノイズを除去するための方法および装置
CN110047470A (zh) 一种语音端点检测方法
CN112700786B (zh) 语音增强方法、装置、电子设备和存储介质
CN111312273A (zh) 混响消除方法、装置、计算机设备和存储介质
CN108847253B (zh) 车辆型号识别方法、装置、计算机设备及存储介质
CN111048061B (zh) 回声消除滤波器的步长获取方法、装置及设备
CN105654955B (zh) 语音识别方法及装置
CN106098080A (zh) 一种噪声环境下言语识别阈的确定方法及装置
Kumar et al. Non-negative matrix based optimization scheme for blind source separation in automatic speech recognition system
CN115426582B (zh) 一种耳机音频处理方法及装置
CN107274892A (zh) 说话人识别方法及装置
Xiong et al. Exploring auditory-inspired acoustic features for room acoustic parameter estimation from monaural speech
CN105869656A (zh) 一种语音信号清晰度的确定方法及装置
Wan et al. Chatter detection for micro milling considering environment noises without the requirement of dominant frequency
BR112014009647B1 (pt) Aparelho de atenuação do ruído e método de atenuação do ruído
US20230386492A1 (en) System and method for suppressing noise from audio signal
CN111862991A (zh) 一种婴儿哭声的识别方法及系统
CN116364108A (zh) 变压器声纹检测方法及装置、电子设备、存储介质
CN114694649A (zh) 一种通用定向语音对抗样本生成方法、系统、介质及设备
CN106710602A (zh) 一种声学混响时间估计方法和装置
CN115206347A (zh) 肠鸣音的识别方法、装置、存储介质及计算机设备
CN113345469A (zh) 语音信号的处理方法、装置、电子设备及存储介质
CN107657962B (zh) 一种语音信号的喉声和气声识别与分离方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant