CN115022767A - 耳机降风噪方法、装置、耳机及计算机可读存储介质 - Google Patents
耳机降风噪方法、装置、耳机及计算机可读存储介质 Download PDFInfo
- Publication number
- CN115022767A CN115022767A CN202210901200.9A CN202210901200A CN115022767A CN 115022767 A CN115022767 A CN 115022767A CN 202210901200 A CN202210901200 A CN 202210901200A CN 115022767 A CN115022767 A CN 115022767A
- Authority
- CN
- China
- Prior art keywords
- wind noise
- voice signal
- voice
- signal
- environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 230000009467 reduction Effects 0.000 title claims abstract description 51
- 230000001603 reducing effect Effects 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000002265 prevention Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 210000000613 ear canal Anatomy 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1083—Reduction of ambient noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1785—Methods, e.g. algorithms; Devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/01—Hearing devices using active noise cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种耳机降风噪方法、装置、耳机及计算机可读存储介质,方法包括:在当前环境为静音环境时,接收输入的第一语音信号并确定第一语音信号的语音声纹模型;在当前环境为风噪环境时,接收输入的第二语音信号;根据语音声纹模型和第二语音信号以得到风噪声纹模型;根据风噪声纹模型,对接收到的实时语音信号进行降风噪,以输出降风噪后的目标语音信号。通过将本发明中的耳机降风噪方法应用于耳机,能够极大地改善耳机降风噪效果。
Description
技术领域
本发明涉及声音处理技术领域,尤其涉及一种耳机降风噪方法、装置、耳机及计算机可读存储介质。
背景技术
随着TWS(True Wireless Stereo,真正无线立体声耳机)耳机功能日趋完善,声透传功能以其便利性、应用场景广泛性,成为TWS耳机的标配功能模式,受到广大消费者普遍认可。通透模式下,前馈通路将外界环境声音放大,以接近不佩戴耳机的状态。但是在有风环境下,前馈通路同时将风噪也进行了放大,使得用户体验直线下降。
目前主流的TWS产品多采用前馈麦克风通路的防风噪设计,结合风噪识别算法,用以改善风噪声的影响,但改善效果仍然不够理想。
发明内容
本发明的主要目的在于提供一种耳机降风噪方法、装置、耳机及计算机可读存储介质,旨在解决现有的TWS耳机降风噪效果不够理想技术问题。
为实现上述目的,本发明提供一种耳机降风噪方法,所述耳机降风噪方法包括以下步骤:
在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型;
在当前环境为风噪环境时,接收输入的第二语音信号;
根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型;
根据所述风噪声纹模型,对接收到的实时语音信号进行降风噪,以输出降风噪后的目标语音信号。
可选地,所述输出降风噪后的目标语音信号的步骤之后,所述方法还包括:
获取基于所述目标语音信号反馈的耳内语音信号,将所述耳内语音信号作为所述第二语音信号,并执行根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤。
可选地,所述在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型的步骤之前,所述方法还包括:
检测当前环境的声音强度是否小于预设的声音阈值;
若所述当前环境的声音强度小于所述声音阈值,则确定所述当前环境为静音环境。
可选地,所述在当前环境为风噪环境时,接收输入的第二语音信号的步骤之前,所述方法还包括:
获取所述当前环境下的声音信息,判断所述声音信息是否包含预设的风噪特征参数;
若所述声音信息包含所述风噪特征参数,则确定所述当前环境为风噪环境。
可选地,所述确定所述第一语音信号的语音声纹模型的步骤,包括:
提取所述第一语音信号中的语音特征并进行频域分析,以得到所述第一语音信号的信号强度和频域信息;
根据所述信号强度和频域信息,确定所述第一语音信号的语音声纹模型。
可选地,所述根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤,包括:
滤除所述第二语音信号中与所述语音声纹模型相同的声纹信息以得到修正后的噪音信号;
提取所述噪音信号中的风噪特征以得到风噪声纹模型。
可选地,所述在当前环境为风噪环境时,接收输入的第二语音信号的步骤之后,所述方法还包括:
判断所述第二语音信号是否包括与所述第一语音信号相同的信号;
若所述第二语音信号不包括与所述第一语音信号相同的信号,则输出重新输入语音的提示;
若所述第二语音信号包括与所述第一语音信号相同的信号,则执行所述根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤。
此外,为实现上述目的,本发明还提供一种耳机降风噪装置,所述耳机降风噪装置,包括:
声音采集模块;用于在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型;在当前环境为风噪环境时,接收输入的第二语音信号;
声音处理模块,用于根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型;
声音输出模块,用于根据所述风噪声纹模型,对接收到的实时语音信号进行降风噪,以输出降风噪后的目标语音信号。
此外,为实现上述目的,本发明还提供一种耳机,包括主芯片、存储单元、以及存储在所述存储单元上的可被所述主芯片执行的耳机降风噪程序,其中,所述耳机降风噪程序被所述主芯片执行时,实现如上所述的耳机降风噪方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有耳机降风噪程序,其中,所述耳机降风噪程序被主芯片执行时,实现如上所述的耳机降风噪方法的步骤。
本发明技术方案中的耳机降风噪方法,通过在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型的步骤,能够将在较为安静的环境下采集到较为纯净的人声,并得到了具有人声特征的声纹信息,目的是为了保证耳机在开启通透(透传)功能的情况下尽可能地在用户耳内只保留外界人声,减少风噪等其他噪声;又通过在当前环境为风噪环境时,接收输入的第二语音信号的步骤,可以在特定风噪较大的环境中得到具有大量风噪特征和少量其他人声特征的语音信号,目的是便于后续更准确地识别到风噪信号并将其滤除;又通过根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤,根据安静环境下的关于人声的语音声纹模型以及特定的风噪环境下主要关于风噪的第二语音信号,容易将第二语音信号中的人声信号过滤掉得到具有大量精确的风噪特征的风噪声纹模型;最后根据所述风噪声纹模型,对接收到的实时语音信号进行降风噪,以输出降风噪后的目标语音信号的步骤,能够利用得到的具有大量精准的风噪特征的风噪声纹模型对实时接收到外界语音信号实时地将外界语音信号中的风噪信号过滤出去,降风噪的效果更加地理想,使得用户耳内只保留纯净的人声,耳机的透传体验更佳。
附图说明
图1为本发明实施例方案涉及的耳机的硬件运行环境的终端结构示意图;
图2为本发明耳机降风噪方法第一实施例的流程示意图;
图3为本发明耳机降风噪方法第一实施例涉及的步骤S10之前的流程示意图;
图4为本发明耳机降风噪方法第一实施例涉及的步骤S10的细化流程示意图;
图5为本发明耳机降风噪方法第一实施例涉及的步骤S20之前的流程示意图;
图6为本发明耳机降风噪方法第一实施例涉及的步骤S30的细化流程示意图;
图7为本发明耳机降风噪方法第二实施例的流程示意图;
图8为本发明耳机降风噪方法涉及的TWS耳机的硬件系统框架结构示意图;
图9为本发明耳机降风噪方法涉及的具体应用整体流程示意图;
图10为本发明耳机降风噪装置的框架结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提出一种耳机。耳机可以包括等任意类型的耳机,在此不做限制。
如图1所示,图1是本发明实施例方案涉及的耳机的硬件运行环境的结构示意图。
如图1所示,该耳机可以包括:主芯片1001,例如CPU,网络接口1004,用户接口1003,存储单元1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示器(Display)、输入单元比如控制面板,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WIFI接口)。存储单元1005可以是高速RAM存储单元,也可以是稳定的存储单元(non-volatile memory),例如磁盘存储单元。存储单元1005可选的还可以是独立于前述主芯片1001的存储装置。作为一种计算机存储介质的存储单元1005中可以包括耳机降风噪程序。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储单元1005可以包括操作系统、用户接口模块、网络通信模块以及耳机降风噪程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而主芯片1001可以调用存储单元1005中存储的耳机降风噪程序,并执行以下各个实施例中的步骤。
基于上述控制器的硬件结构,提出本发明耳机降风噪方法的各个实施例。
为了便于理解以下本发明的各个实施例,在此对本发明技术方案中的实施例按照方案整体进行简要概括:
考虑到风噪声的宽频性、复杂性和时变性的特征,对风噪声的识别和降低也更加困难,已经俨然成为TWS耳机设计的一大难题。
针对该技术难题,本发明主要是通过分别在较为安静的环境中协助用户录制一段语音以及在风噪声较大的环境中协助用户录制一段同样的语音,正是由于录制环境的差异化,通过安静环境中人声和风噪环境中的风噪声+人声就能够得到关于风噪特征的风噪声纹模型,在用户开启或者自动开启耳机的透传功能之后,通过这一风噪声纹模型,就能够实时地将耳机接收到的外界语音信号中的风噪信号进行滤除,从而使得耳机输出播放在用户耳内的声音都是较为纯净的人声,并且在耳机播放用户耳内声音之后,还会录制用户耳内的声音,从而又根据耳内实际的声音不断地更新和迭代优化风噪声纹模型,从而使得用户会得到越来越清晰的外界人声。
本发明实施例提供一种耳机降风噪方法。
请参照图2,图2为本发明耳机降风噪方法第一实施例的流程示意图;在本发明第一实施例中,耳机降风噪方法包括以下步骤:
步骤S10,在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型;
在本实施例中,耳机降风噪方法可以应用于TWS耳机和其他类型的各种耳机,可以参照图8,图8为本发明耳机降风噪方法涉及的TWS耳机的硬件系统框架结构示意图。如图8所示,本发明中的TWS耳机包括了前馈麦克风和反馈麦克风、主芯片、耳机喇叭等硬件,其中的前馈麦克风设置于TWS耳机背离用户耳道的一侧,用于收集外部信号(外部语音信号),其中的反馈麦克风设置于TWS耳机贴近用户耳道的一侧,用于收集耳内信号(耳内语音信号),其中的主芯片包括了信号分析模块、存储单元,前馈麦克风和反馈麦克风将各自收集到的语音信号发送到主芯片中的信号分析模块,使得信号分析模块处理传来的语音信号并得到了关于人声的语音声纹信息和主要关于风噪声的风噪声纹信息,并将语音声纹信息和风噪声纹信息存储在存储单元,以及根据语音声纹信息和风噪声纹信息得到了风噪滤波信号,也就是滤除风噪信号后的语音信号传递到耳机喇叭,从而使得耳机喇叭播放出较为纯净的外界人声。
该TWS耳机或其他类型的耳机可以在确定外界的当前环境为静音环境时,提醒用户或研发技术人员输入一段语音,具体地,TWS耳机可以在用户佩戴好耳机之后,可以通过语音提示的方式提醒用户输入预设的特定语音,该特定语音可以为中文语音或者其他语言的语音,以便于用户高效准确地输入一段较为清晰流畅的语音信号,也就是第一语音信号。在耳机采集到该第一语音信号后可以根据语音的频域信息判断该第一语音信号是否流畅和清晰或者判断第一语音信号是否与预设的特定语音一致,若该第一语音信号不流畅清晰或者与所述特定语音不一致,则提醒用户重新输入第一语音信号,目的是为了避免杂音或者用户不按提示输出了其他含有语音特征少的语音,以获得纯粹的以及包含丰富语音特征的人声信号。
在一实施例中,请参照图3,所述步骤S10之前,所述方法还包括:
步骤S100,检测当前环境的声音强度是否小于预设的声音阈值;
步骤S110,若所述当前环境的声音强度小于所述声音阈值,则确定所述当前环境为静音环境。
需要先说的是,上述实施例提到的静音环境并不是0分贝的环境,而是小于预设声音阈值的环境,因为绝对的静音是很难实现的。
该实施例中的预设的声音阈值可以为30-40分贝区间任意一个分贝值。在TWS耳机开启后的预设时长内,可以先通过TWS耳机中的前馈麦克风采集外界声音的声音强度也就是外界声音的分贝值,在主芯片判断外界当前环境的声音强度小于30-40分贝,就可以确定当前环境为静音环境,从而在静音环境下,通过语音提示提醒用户录制一段特定语音。
通过上述的这一实施例,能够在用户所处的环境符合静音环境的前提下,保证了用户录制的声音是无其他噪音杂音干扰的纯净人声,进而确保最终根据录制好的纯净人声对风噪信号进行滤除得到外界实时传来的纯净人声。
在另一实施例中,请参照图4,所述步骤S10中确定所述第一语音信号的语音声纹模型的步骤,包括:
步骤S11,提取所述第一语音信号中的语音特征并进行频域分析,以得到所述第一语音信号的信号强度和频域信息;
步骤S12,根据所述信号强度和频域信息,确定所述第一语音信号的语音声纹模型。
在前馈麦克风采集得到安静环境下无风噪的第一语音信号之后,主芯片进行第一语音信号中的语音特征提取并进行频域分析,得出第一语音信号的信号强度大小及频域信息,同时根据第一语音信号的信号强度大小和频域信息建立语音声纹模型并存储在对应的存储单元。其中这里的频域信息包括了第一语音信号以正弦波形式存在的正弦波中的频率、周期以及振幅,也就是说,具体地,在该实施例中,根据信号强度、第一语音信号的频率、周期以及振幅等数字化参数,通过将上述多个数字化参数关联起来建立语音声纹模型并存储在对应的存储单元。
通过这一实施例,能够基于信号强度的检测和判断以及频域分析将第一语音信号转化为语音声纹模型,能够以数据化的形式将无风噪的纯净人声存储起来,便于后续对风噪信号的滤除。
步骤S20,在当前环境为风噪环境时,接收输入的第二语音信号;
用户在风噪环境下可以通过主动打开TWS耳机的防风噪模式,也就是当TWS耳机接收到开启防风噪模式指令之后,开始接收输入的第二语音信号。在开启防风噪模式之后,按照耳机喇叭(扬声器)输出的语音提示再次录制一段特定语音音频(与第一语音信号相同语音),作为第二语音信号导入到对应的存储单元,那么这里的第二语音信号主要就是包括了风噪信号和人声信号的混合信号。
在一实施例中,请参照图5,所述步骤S20之前,所述方法还包括:
步骤S200,获取所述当前环境下的声音信息,判断所述声音信息是否包含预设的风噪特征参数;
步骤S210,若所述声音信息包含所述风噪特征参数,则确定所述当前环境为风噪环境。
在该实施例中,通过前馈麦克风采集当前环境下的各种声音的声音信号,并在主芯片中分析该声音信号并解析为参数化的声音信息,判断该声音信息中的各种参数数据是否有与预设的风噪特征参数相匹配的参数数据,如果声音信息中存在预设的风噪特征参数相匹配的参数数据,说明TWS耳机所处的当前环境是风噪环境。其中的风噪特征参数是TWS出厂前预设的包含丰富风噪特征的数字化参数。
通过这一实施例,以数字化参数比较的方式能够准确地确定当前环境是否为风噪环境,从而帮助用户确定合适的风噪环境并录制质量较高既包括风噪信号又包括人声信号的第二语音信号。
步骤S30,根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型;
具体地,请参照图6,所述步骤S30,包括:
步骤S31,滤除所述第二语音信号中与所述语音声纹模型相同的声纹信息以得到修正后的噪音信号;
步骤S32,提取所述噪音信号中的风噪特征以得到风噪声纹模型。
在本实施例中,同样地,可以采取和提取第一语音信号中语音特征一样的方式提取第二语音信号中的语音特征从而形成第二语音信号的总的声纹信息,确定该总的声纹信息中与第一语音信号对应的语音声纹模型相匹配的声纹信息,并从总的声纹信息中滤除该声纹信息,从而得到了修正后的噪音信号,也就是目标声纹信息,再提取目标声纹信息中的风噪特征(包括了风噪的信号强度、频率、振幅等参数)就可以形成关于风噪的风噪声纹模型,将该风噪声纹模型也存储到对应的存储单元。
步骤S40,根据所述风噪声纹模型,对接收到的实时语音信号进行降风噪,以输出降风噪后的目标语音信号。
在得到风噪声纹模型之后,用户可以在风噪环境下根据需要开启透传模式,在开启透传模式后,TWS耳机对实时接收到的实时语音信号利用已有的风噪声纹模型对实时语音信号中的实时风噪信号滤除之后就得到了降风噪后的目标语音信号,该目标语音信号为比较纯净的人声,从而通过耳机喇叭播放该目标语音信号以使用户在透传模式下听到清晰的外界人说话的声音。
此外,需要说明的是,上述的各个过程中需要用户录制输入第一语音信号和第二语音信号可以在产品出厂前由测试等相关技术人员来代为录制从而在出厂前就建立了初步的风噪声纹模型。
在一实施例中,所述步骤S40之后,所述方法还包括:
步骤a,获取基于所述目标语音信号反馈的耳内语音信号,将所述耳内语音信号作为所述第二语音信号,并执行根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤。
TWS耳机在用户的耳道内播放外界的人声信号时,还会通过反馈麦克风采集耳内语音信号,也即目标语音信号在耳道内传播时实际用户感受到的语音信号,并将该耳内语音信号作为第二语音信号,基于语音声纹模型对该耳内语音信号中的人声信号进行过滤以建立新的风噪声纹模型,从而不断再利用新的风噪声纹模型对后续外界人声进行降风噪,使得外界人声传播到用户耳道内会越来越保真和清晰。
本发明技术方案中的耳机降风噪方法,通过在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型的步骤,能够将在较为安静的环境下采集到较为纯净的人声,并得到了具有人声特征的声纹信息,目的是为了保证耳机在开启通透(透传)功能的情况下尽可能地在用户耳内只保留外界人声,减少风噪等其他噪声;又通过在当前环境为风噪环境时,接收输入的第二语音信号的步骤,可以在特定风噪较大的环境中得到具有大量风噪特征和少量其他人声特征的语音信号,目的是便于后续更准确地识别到风噪信号并将其滤除;又通过根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤,根据安静环境下的关于人声的语音声纹模型以及特定的风噪环境下主要关于风噪的第二语音信号,容易将第二语音信号中的人声信号过滤掉得到具有大量精确的风噪特征的风噪声纹模型;最后根据所述风噪声纹模型,对接收到的实时语音信号进行降风噪,以输出降风噪后的目标语音信号的步骤,能够利用得到的具有大量精准的风噪特征的风噪声纹模型对实时接收到外界语音信号实时地将外界语音信号中的风噪信号过滤出去,降风噪的效果更加地理想,使得用户耳内只保留纯净的人声,耳机的透传体验更佳。
请参照图7,图7为本发明耳机降风噪方法第二实施例的流程示意图;进一步地,基于本发明耳机降风噪方法的第一实施例提出本发明耳机降风噪方法的第二实施例,在本实施例中,所述步骤S20之后,所述方法还包括:
步骤S21,判断所述第二语音信号是否包括与所述第一语音信号相同的信号;
步骤S22,若所述第二语音信号不包括与所述第一语音信号相同的信号,则输出重新输入语音的提示;
若所述第二语音信号包括与所述第一语音信号相同的信号,则执行所述步骤S30。
在本实施例中,第二语音信号因为既包括风噪信号也包括人声信号,但人声信号并不一定是用户按照TWS耳机通过语音提示提醒用户输入的特定语音,所以需要判断第二语音信号是否存在着与第一语音信号相同的信号,也即判断用户分别在安静环境和风噪环境两次录制的语音是否一致。
如果第二语音信号不包括与所述第一语音信号相同的信号,说明用户在风噪环境下录制的语音与前一次在安静环境下录制的语音不一致或者因外界包括风噪等噪音的严重影响导致的语音不一致,这时候TWS耳机可以通过耳机喇叭或者振动、灯光频闪等提示方式提示用户重新输入语音,还可以建议用户适当提高音量以减少外界噪音的干扰。
在另一可选的实施例中,所述步骤S20之后,所述耳机降风噪方法还包括:
步骤b,获取所述第一语音信号对应的第一文本信息和所述第二语音信号对应的第二文本信息;
步骤c,判断所述第一文本信息和第二文本信息是否相同;
步骤d,若所述第一文本信息和第二文本信息不同,则输出重新输入语音的提示。
可以通过语音转文本的方式,将第一语音信号转化为第一文本信息,以及将第二文本信号也转化为第二文本信息,并将第一文本信息和第二文本信息进行简单的文字符号比较就能够确定两者是否相同,也就是第二语音信号是否包括了与第一语音信号相同的信号,若否的话,则需要提醒用户重新输入与安静环境下相同的语音。
通过本发明的第二实施例,通过语音信号比较的方式确保用户每次录制的语音都是一致的,进而能够保证在对风噪信号滤除的过程的准确性,也就是保证在实时语音信号中滤除的都为风噪信号,而不会因误判其他的人声信号滤除掉人声信号,使得最终输出的目标语音信号更保真更清晰。
可以将上述的各个实施例结合起来作为本发明的技术方案整体,为了更清楚地理解本发明,请参照图9,图9为本发明耳机降风噪方法涉及的具体应用整体流程示意图。
按照本方案的整体流程顺序,本发明可以简单概括为以下流程:
1、用户在安静环境下录制指定语音信号作为第一参考信号(第一语音信号);
2、分析并建立语音声纹模型;
3、开启防风噪模式,用户在风噪环境下录制指定语音信号作为第二信号(第二语音信号),因为第一语音信号和第二语音信号都是由前馈麦克风采集得到,所以可以通称为前馈信号;
4、分析并去除语音信号(第一语音信号),建立风噪声纹模型;
5、基于风噪声纹模型,录制(采集)实时语音信号并去除其中的风噪信号,通过耳机喇叭发送到人耳;
6、通过反馈麦克风录制耳内的实时信号(耳内语音信号,也可以称为反馈信号),将反馈信号作为第二语音信号回到流程3中。
此外,参照图10,图10为本发明耳机降风噪装置的框架结构示意图。本发明还提出一种耳机降风噪装置装置,所述耳机降风噪装置包括:
声音采集模块A10;用于在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型;在当前环境为风噪环境时,接收输入的第二语音信号;
声音处理模块A20,用于根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型;
声音输出模块A30,用于根据所述风噪声纹模型,对接收到的实时语音信号进行降风噪,以输出降风噪后的目标语音信号。
可选地,声音采集模块A10,还用于:
获取基于所述目标语音信号反馈的耳内语音信号,将所述耳内语音信号作为所述第二语音信号,并执行根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤。
可选地,声音采集模块A10,还用于:
检测当前环境的声音强度是否小于预设的声音阈值;
若所述当前环境的声音强度小于所述声音阈值,则确定所述当前环境为静音环境。
可选地,声音采集模块A10,还用于:
获取所述当前环境下的声音信息,判断所述声音信息是否包含预设的风噪特征参数;
若所述声音信息包含所述风噪特征参数,则确定所述当前环境为风噪环境。
可选地,声音采集模块A10,还用于:
提取所述第一语音信号中的语音特征并进行频域分析,以得到所述第一语音信号的信号强度和频域信息;
根据所述信号强度和频域信息,确定所述第一语音信号的语音声纹模型。
可选地,声音处理模块A20,还用于:
滤除所述第二语音信号中与所述语音声纹模型相同的声纹信息以得到修正后的噪音信号;
提取所述噪音信号中的风噪特征以得到风噪声纹模型。
可选地,声音处理模块A20,还用于:
判断所述第二语音信号是否包括与所述第一语音信号相同的信号;
若所述第二语音信号不包括与所述第一语音信号相同的信号,则输出重新输入语音的提示;
若所述第二语音信号包括与所述第一语音信号相同的信号,则执行所述根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤。
本发明的耳机降风噪装置具体实施方式与上述耳机降风噪方法各实施例基本相同,在此不再赘述。
此外,本发明还提供一种计算机可读存储介质。本发明计算机可读存储介质上存储有耳机降风噪程序,其中,耳机降风噪程序被主芯片执行时,实现如上述的耳机降风噪方法的步骤。
其中,耳机降风噪程序被执行时所实现的方法可参照本发明耳机降风噪方法的各个实施例,此处不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的主芯片以产生一个机器,使得通过计算机或其他可编程数据处理设备的主芯片执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储单元中,使得存储在该计算机可读存储单元中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。
Claims (10)
1.一种耳机降风噪方法,其特征在于,所述耳机降风噪方法包括以下步骤:
在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型;
在当前环境为风噪环境时,接收输入的第二语音信号;
根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型;
根据所述风噪声纹模型,对接收到的实时语音信号进行降风噪,以输出降风噪后的目标语音信号。
2.如权利要求1所述的耳机降风噪方法,其特征在于,所述输出降风噪后的目标语音信号的步骤之后,所述方法还包括:
获取基于所述目标语音信号反馈的耳内语音信号,将所述耳内语音信号作为所述第二语音信号,并执行根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤。
3.如权利要求1所述的耳机降风噪方法,其特征在于,所述在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型的步骤之前,所述方法还包括:
检测当前环境的声音强度是否小于预设的声音阈值;
若所述当前环境的声音强度小于所述声音阈值,则确定所述当前环境为静音环境。
4.如权利要求1所述的耳机降风噪方法,其特征在于,所述在当前环境为风噪环境时,接收输入的第二语音信号的步骤之前,所述方法还包括:
获取所述当前环境下的声音信息,判断所述声音信息是否包含预设的风噪特征参数;
若所述声音信息包含所述风噪特征参数,则确定所述当前环境为风噪环境。
5.如权利要求1所述的耳机降风噪方法,其特征在于,所述确定所述第一语音信号的语音声纹模型的步骤,包括:
提取所述第一语音信号中的语音特征并进行频域分析,以得到所述第一语音信号的信号强度和频域信息;
根据所述信号强度和频域信息,确定所述第一语音信号的语音声纹模型。
6.如权利要求1所述的耳机降风噪方法,其特征在于,所述根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤,包括:
滤除所述第二语音信号中与所述语音声纹模型相同的声纹信息以得到修正后的噪音信号;
提取所述噪音信号中的风噪特征以得到风噪声纹模型。
7.如权利要求1所述的耳机降风噪方法,其特征在于,所述在当前环境为风噪环境时,接收输入的第二语音信号的步骤之后,所述方法还包括:
判断所述第二语音信号是否包括与所述第一语音信号相同的信号;
若所述第二语音信号不包括与所述第一语音信号相同的信号,则输出重新输入语音的提示;
若所述第二语音信号包括与所述第一语音信号相同的信号,则执行所述根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型的步骤。
8.一种耳机降风噪装置,其特征在于,所述耳机降风噪装置,包括:
声音采集模块;用于在当前环境为静音环境时,接收输入的第一语音信号并确定所述第一语音信号的语音声纹模型;在当前环境为风噪环境时,接收输入的第二语音信号;
声音处理模块,用于根据所述语音声纹模型和所述第二语音信号以得到风噪声纹模型;
声音输出模块,用于根据所述风噪声纹模型,对接收到的实时语音信号进行降风噪,以输出降风噪后的目标语音信号。
9.一种耳机,其特征在于,所述耳机包括主芯片、存储单元、以及存储在所述存储单元上的可被所述主芯片执行的耳机降风噪程序,其中,所述耳机降风噪程序被所述主芯片执行时,实现如权利要求1至7中任一项所述的耳机降风噪方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有耳机降风噪程序,其中,所述耳机降风噪程序被主芯片执行时,实现如权利要求1至7中任一项所述的耳机降风噪方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210901200.9A CN115022767A (zh) | 2022-07-28 | 2022-07-28 | 耳机降风噪方法、装置、耳机及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210901200.9A CN115022767A (zh) | 2022-07-28 | 2022-07-28 | 耳机降风噪方法、装置、耳机及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115022767A true CN115022767A (zh) | 2022-09-06 |
Family
ID=83065884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210901200.9A Pending CN115022767A (zh) | 2022-07-28 | 2022-07-28 | 耳机降风噪方法、装置、耳机及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115022767A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116668892A (zh) * | 2022-11-14 | 2023-08-29 | 荣耀终端有限公司 | 音频信号的处理方法、电子设备及可读存储介质 |
-
2022
- 2022-07-28 CN CN202210901200.9A patent/CN115022767A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116668892A (zh) * | 2022-11-14 | 2023-08-29 | 荣耀终端有限公司 | 音频信号的处理方法、电子设备及可读存储介质 |
CN116668892B (zh) * | 2022-11-14 | 2024-04-12 | 荣耀终端有限公司 | 音频信号的处理方法、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8369549B2 (en) | Hearing aid system adapted to selectively amplify audio signals | |
CN103236263B (zh) | 一种改善通话质量的方法、系统及移动终端 | |
CN102124758B (zh) | 助听器、助听系统、步行检测方法和助听方法 | |
TWI527024B (zh) | 傳送語音數據之方法及非暫態電腦可讀取媒體 | |
US9818423B2 (en) | Method of improving sound quality and headset thereof | |
US10825353B2 (en) | Device for enhancement of language processing in autism spectrum disorders through modifying the auditory stream including an acoustic stimulus to reduce an acoustic detail characteristic while preserving a lexicality of the acoustics stimulus | |
US20080189107A1 (en) | Estimating own-voice activity in a hearing-instrument system from direct-to-reverberant ratio | |
US11304016B2 (en) | Method for configuring a hearing-assistance device with a hearing profile | |
US20160239253A1 (en) | Method for audio correction in electronic devices | |
CN105187602B (zh) | 一种终端音量的调节方法和装置 | |
US11882413B2 (en) | System and method for personalized fitting of hearing aids | |
CN111970609B (zh) | 音质调节方法、音质调节系统及计算机可读存储介质 | |
CN111063363B (zh) | 一种语音获取方法、音频设备和具有存储功能的装置 | |
CN115022767A (zh) | 耳机降风噪方法、装置、耳机及计算机可读存储介质 | |
US20240323586A1 (en) | Earphone and audio processing method and apparatus therefor, and storage medium | |
CN110996238A (zh) | 双耳同步信号处理助听系统及方法 | |
US20080175423A1 (en) | Adjusting a hearing apparatus to a speech signal | |
CN111951811A (zh) | 蓝牙耳机控制方法、装置、蓝牙耳机及预设信息导入方法 | |
CN107688451A (zh) | 可根据脸部影像辨识结果调整均衡器设定的电子装置 | |
US11750984B2 (en) | Machine learning based self-speech removal | |
CN112235679B (zh) | 适用于耳机的信号均衡方法、处理器及耳机 | |
CN207518800U (zh) | 脖戴式语音交互耳机 | |
CN106328159B (zh) | 一种音频流的处理方法及装置 | |
CN108932953B (zh) | 一种音频均衡函数确定方法、音频均衡方法及设备 | |
US20220122606A1 (en) | Hearing device system and method for operating same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |