CN110769111A - 一种降噪方法、系统、存储介质以及终端 - Google Patents

一种降噪方法、系统、存储介质以及终端 Download PDF

Info

Publication number
CN110769111A
CN110769111A CN201911048675.2A CN201911048675A CN110769111A CN 110769111 A CN110769111 A CN 110769111A CN 201911048675 A CN201911048675 A CN 201911048675A CN 110769111 A CN110769111 A CN 110769111A
Authority
CN
China
Prior art keywords
noise reduction
terminal
noise
call
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911048675.2A
Other languages
English (en)
Inventor
高杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201911048675.2A priority Critical patent/CN110769111A/zh
Publication of CN110769111A publication Critical patent/CN110769111A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/19Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种降噪方法、系统、存储介质以及终端,涉及语音降噪技术领域,该方法包括:确定终端所处的通话场景;根据所述通话场景,从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型;利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。本发明的有益效果是:不仅能够根据不同的通话场景进行对应的降噪处理,而且能够对上行语音和/或下行语音进行分别降噪,可以使得终端的用户在通话时不被外界噪音影响,使得对端接收到的语音信息清晰、没有噪声,从而提高用户体验。

Description

一种降噪方法、系统、存储介质以及终端
技术领域
本发明涉及语音降噪技术领域,尤其涉及一种降噪方法、系统、存储介质以 及终端。
背景技术
目前,市面上的手机内部基本都适配了一套针对各种场景进行优化的降噪参 数。但是,在复杂的噪声场景下,该通用的模式无法完全兼容各种复杂的噪声场 景,导致用户只能通过调大手机音量来提升通话体验。这就使得在某些特殊的噪 声场景下,给用户的语音通话带来不好的用户体验。
发明内容
本发明正是基于上述技术问题,提出了一种能够根据终端所处的通话场景确 定相匹配的降噪模型的降噪方法、系统、存储介质以及终端,以提高用户体验。
第一方面,本发明实施例提供了一种降噪方法,包括:
确定终端所处的通话场景;
根据所述通话场景,从预设的数据库中获取与所述通话场景的类型相匹配的 降噪模型;
利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。
进一步,确定终端所处的通话场景,包括:
获取所述终端所处的环境的环境噪音;
根据所述环境噪音,确定所述终端所处的通话场景。
进一步,根据所述环境噪音,确定所述终端所处的通话场景,包括:
对所述环境噪音的波形进行分段,并从各段波形上分别提取至少一个特征 点,以根据所述特征点获得所述环境的噪声信号特征向量;
将所述噪声信号特征向量与预设的数据库中的通话场景对应的噪声信号特 征向量进行匹配,并根据匹配结果确定所述终端所处的通话场景。
进一步,确定终端所处的通话场景,包括:
获取语音信息;
对所述语音信息进行语义分析,以获得反映通话场景的关键词;
根据所述关键词,确定终端所处的通话场景。
进一步,所述降噪模型包括上行降噪模型和/或下行降噪模型,其中,所述上 行降噪模型用于对终端发送的语音信号进行降噪处理,所述下行降噪模型用于对 终端接收的语音信号进行降噪处理。
进一步,所述降噪模型通过以下步骤构建:
确定一噪声滤波模型,其中,所述噪声滤波模型用于对语音信号进行降噪处 理;
根据不同类型的通话场景的环境噪音的信号特征,对所述噪声滤波模型的降 噪参数的数值进行调整,以得到不同类型的通话场景对应的降噪模型;其中,所 述降噪参数包括噪声门限参数、噪声抑制参数以及噪声参数的收敛程度中的至少 一种。
进一步,根据所述降噪模型对所述终端接收到的语音进行降噪处理之后,还 包括:
再次确定终端所处的通话场景;
当再次确定到的通话场景与当前使用的降噪模型对应的通话场景不一致时, 获取与所述再次确定到的通话场景对应的降噪模型。
第二方面,本发明实施例还提供了一种降噪系统,包括:
确定模块,其用于确定终端所处的通话场景;
匹配模块,其用于根据所述通话场景,从预设的数据库中获取与所述通话场 景的类型相匹配的降噪模型;
降噪模块,其用于根据所述降噪模型对终端发送和/或接收语音信号进行降噪 处理。
第三方面,本发明实施例还提供了一种存储介质,所述存储介质上存储有程 序代码,所述程序代码被处理器执行时,实现如上述实施例任一项所述的降噪 方法。
第四方面,本发明实施例还提供了一种终端,所述终端包括存储器、处理器, 所述存储器上存储有可在所述处理器上运行的程序代码,所述程序代码被所述处 理器执行时,实现如上述实施例任一项所述的降噪方法。
在本发明实施例提供的一种降噪方法,通过确定通话场景,并匹配与该通话 场景对应的降噪模型,以利用所述降噪模型对终端发送和/或接收的语音信号进行 降噪处理。使得终端能够根据不同的通话场景进行对应的降噪处理,而且可以分 别对上行语音和/或者下行语音进行降噪处理。可见,本发明实施例提供的降噪方 法,不仅能够根据不同的通话场景进行对应的降噪处理,而且能够对上行语音和 /或下行语音进行分别降噪,可以使得终端的用户在通话时不被外界噪音影响,使 得对端接收到的语音信息清晰、没有噪声,从而提高用户体验。
附图说明
通过结合附图阅读下文示例性实施例的详细描述可更好地理解本公开的范 围。其中所包括的附图是:
图1示出了本发明实施例一提出的一种降噪方法的流程示意图;
图2示出了本发明实施例二提出的一种降噪方法的流程示意图;
图3示出了图2所示的步骤220的具体流程示意图;
图4示出了本发明实施例三提出的一种降噪方法的流程示意图;
图5示出了本发明实施例四提出的一种降噪方法的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下将结合附图及实施例来 详细说明本发明的实施方法,借此对本发明如何应用技术手段来解决技术问题, 并达成技术效果的实现过程能充分理解并据以实施。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明 还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并 不受下面公开的具体实施例的限制。
实施例一
根据本发明的实施例,提供了一种降噪方法,图1示出了本发明实施例一提 出的一种降噪方法的流程示意图,如图1所示,该降噪方法可以包括:步骤110 至步骤130。
在步骤110中,确定终端所处的通话场景。
这里,终端所处的通话场景指的是终端建立通话时所处的场景。例如,用户 在车站建立通话,则终端所处的通话场景是车站;若用户在商场建立通话,则终 端所处的通话场景是商场。
在步骤120中,根据所述通话场景,从预设的数据库中获取与所述通话场景 的类型相匹配的降噪模型。
这里,通过获取与所述通话场景的类型相匹配的降噪模型,可以在用户使用 终端建立通话时,使用与用户建立通话时终端所处的通话场景对应的降噪模型对 通话的语音信息进行降噪。
在步骤130中,利用所述降噪模型对终端发送和/或接收的语音信号进行降噪 处理。
这里,终端发送和/或接收的语音信号,终端发送的上行语音和/或终端接收 到的下行语音。其中,上行语音指的是本端发送到对端的链路,包括本端麦克风 采集的语音信息,并通过本端发送到基站的语音信号;下行语音指的是本端接收 到对端的链路,包括本端设备接收到基站发送的对端的语音信号,并将该语音信 号传输至本端的听筒。
由此,通过利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处 理。可以实现对上行语音和/或下行语音进行降噪,可以使得终端的用户在通话时 不被外界噪音影响,同时也能够对上行语音进行降噪,使得对端接收到的语音信 息清晰、没有噪声。
在本实施例中,通过确定通话场景,并匹配与该通话场景对应的降噪模型。 使得终端能够根据不同的通话场景进行对应的降噪处理,从而提高用户的通话体 验。
实施例二
在上述实施例的基础上,本发明的实施例二还可以提供一种降噪方法。图2 示出了本发明实施例二提出的一种降噪方法的流程示意图,如图2所示,该降噪 方法可以包括:步骤210至步骤240。
在步骤210中,获取所述终端所处的环境的环境噪音。
这里,获取终端所处的环境的环境噪音,可以是通过设置在终端上的语音采 集装置来采集所述环境噪音,例如听筒。其中,获取终端所处的环境的环境噪音 的过程,在用户即将建立通话或成功建立通话之后进行。
在步骤220中,根据所述环境噪音,确定所述终端所处的通话场景。
这里,由于特定的场景会有不同的环境噪音,例如车站这一通话场景会有车 站这一场景下独特的环境噪声类型,商场会有商场这一场景下独特的环境噪声类 型。因此,根据所述环境噪音,即可确定所述终端所处的通话场景。
在步骤230中,根据所述通话场景,从预设的数据库中获取与所述通话场景 的类型相匹配的降噪模型。
这里,通过获取与所述通话场景的类型相匹配的降噪模型,可以在用户使用 终端建立通话时,使用与用户建立通话时终端所处的通话场景对应的降噪模型对 通话的语音信息进行降噪。
值得说明的是,从预设的数据库中获取与所述通话场景的类型相匹配的降噪 模型。所述数据库中预设有不同类型的通话场景及对应的降噪模型。
在一个可选的实施方式中,所述降噪模型通过以下步骤构建:
确定一噪声滤波模型,其中,所述噪声滤波模型用于对语音信号进行降噪处 理;
根据不同类型的通话场景的环境噪音的信号特征,对所述噪声滤波模型的降 噪参数的数值进行调整,以得到不同类型的通话场景对应的降噪模型;其中,所 述降噪参数包括噪声门限参数、噪声抑制参数以及噪声参数的收敛程度中的至少 一种。
这里,确定一噪声滤波模型,噪声滤波模型的类型以及使用的算法根据对应 的环境噪音的信号特征确定。再根据该环境噪音的信号特征,对所述噪声滤波模 型的降噪参数的数值进行调整,以得到不同类型的通话场景对应的降噪模型。
以饭店噪声为例,饭店噪声为典型的非稳态噪声。因此,可以通过降低噪声 滤波器的噪声门限参数,以提升噪声检测的灵敏度,同时将噪声抑制参数加强, 噪声参数使能部分的收敛程度同步加强,提升噪声消除效果,从而得到一个对应 饭店通话场景的降噪模型。
在步骤240中,利用所述降噪模型对终端发送和/或接收的语音信号进行降噪 处理。
这里,终端发送和/或接收的语音信号,终端发送的上行语音和/或终端接收 到的下行语音。其中,上行语音指的是本端发送到对端的链路,包括本端麦克风 采集的语音信息,并通过本端发送到基站的语音信号;下行语音指的是本端接收 到对端的链路,包括本端设备接收到基站发送的对端的语音信号,并将该语音信 号传输至本端的听筒。
值得说明的是,所述降噪模型包括上行降噪模型和/或下行降噪模型,其中, 所述上行降噪模型用于对终端发送的语音信号进行降噪处理,所述下行降噪模型 用于对终端接收的语音信号进行降噪处理。
这里,由于采集上行语音和下行语音的装置存在区别,导致针对同一通话场 景,对上行语音和/或下行语音进行降噪,使用的降噪模型会有区别。通过所述上 行降噪模型对终端发送的上行语音进行降噪处理,通过所述下行降噪模型对终端 接收到的下行语音进行降噪处理。可以实现对上行语音和/或下行语音进行分别降 噪处理,可以使得终端的用户在通话时不被外界噪音影响,同时也能够对上行语 音进行降噪,使得对端接收到的语音信息清晰、没有噪声。
在一个可选的实施方式中,图3示出了图2所示的步骤220的具体流程示意 图,如图3所示,步骤220中,根据所述环境噪音,确定所述终端所处的通话场 景,可以包括:步骤221至步骤222。
在步骤221中,对所述环境噪音的波形进行分段,并从各段波形上分别提取 至少一个特征点,以根据所述特征点获得所述环境的噪声信号特征向量。
这里,首先对环境噪音的波形进行分段,该分段可以是均匀间隔分段,也可 以是根据波形的特征进行特定分段。分段的目的是要提取每一段波形上的特征 点,从而反映整个波形的特征类型。通过环境噪音的波形上提取多个特征点,并 根据多个特征点得到噪声信号特征向量,从而将该噪声信号特征向量作为反映通 话场景的类型的依据。
在步骤222中,将所述噪声信号特征向量与预设的数据库中的通话场景对应 的噪声信号特征向量进行匹配,并根据匹配结果确定所述终端所处的通话场景。
这里,在数据库中存储有不同类型的通话场景及对应的噪声信号特征向量, 通过将提取到的噪声信号特征向量与数据库中的噪声信号特征向量进行对比,即 可获得提取到的噪声信号特征向量对应的通话场景,从而确定终端所处的通话场 景。例如,提取到的噪声信号特征向量是A,数据库中存在噪声信号特征向量A 对应通话场景B,则根据提取到的噪声信号特征向量A,确定到的通话场景为B。
在一个可选的实施方式中,在步骤230之后,还可以包括:
再次确定终端所处的通话场景;
当再次确定到的通话场景与当前使用的降噪模型对应的通话场景不一致时, 则获取与所述再次确定到的通话场景对应的降噪模型。
这里,由于在通话过程中,通话场景会发生变化,因此当再次确定到的通话 场景与当前使用的降噪模型对应的通话场景不一致时,则获取与所述再次确定到 的通话场景对应的降噪模型。其中,再次确定终端所处的通话场景的操作可以是 间隔预设时间之后执行。
由此,通过实时判断通话场景是否发生变化,以实时对降噪模型进行调整, 可以提高通话质量,以提高用户体验。
实施例三
在上述实施例的基础上,本发明的实施例三还可以提供一种降噪方法。图4 示出了本发明实施例三提出的一种降噪方法的流程示意图,如图4所示,该降噪 方法可以包括:步骤310至步骤350。
在步骤310中,获取语音信息。
这里,所述语音信息可以是用户输入的语音控制命令。例如,当用户处在车 站时,其在通话前可以输入语音控制命令,以获得对应的降噪模型。
在步骤320中,对所述语音信息进行语义分析,以获得反映通话场景的关键 词。
在步骤330中,根据所述关键词,确定终端所处的通话场景。
这里,对所述语音信息进行语义分析,包括提取用户的语音信息中能反映通 话场景的关键词,进而判断该反映通话场景的关键词能否作为食品的品类信息。 例如,用户输入的语音信息是调用车站降噪模型,从“调用车站降噪模型”的语 音信息中获得的关键词包括“调用”、“车站”“降噪模型”,则“车站”能够 作为反映通话场景。因此,通过用户输入语音信息,可以确定用户需要调用的是 车站这一通话场景对应的降噪模型。
在步骤340中,根据所述通话场景,从预设的数据库中获取与所述通话场景 的类型相匹配的降噪模型。
这里,通过获取与所述通话场景的类型相匹配的降噪模型,可以在用户使用 终端建立通话时,使用与用户建立通话时终端所处的通话场景对应的降噪模型对 通话的语音信息进行降噪。
在步骤350中,利用所述降噪模型对终端发送和/或接收的语音信号进行降噪 处理。
这里,终端发送和/或接收的语音信号,终端发送的上行语音和/或终端接收 到的下行语音。其中,上行语音指的是本端发送到对端的链路,包括本端麦克风 采集的语音信息,并通过本端发送到基站的语音信号;下行语音指的是本端接收 到对端的链路,包括本端设备接收到基站发送的对端的语音信号,并将该语音信 号传输至本端的听筒。
由此,通过利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处 理。可以实现对上行语音和/或下行语音进行降噪,可以使得终端的用户在通话时 不被外界噪音影响,同时也能够对上行语音进行降噪,使得对端接收到的语音信 息清晰、没有噪声。
这里,通过获取与所述通话场景的类型相匹配的降噪模型,可以在用户使用 终端建立通话时,使用与用户建立通话时终端所处的通话场景对应的降噪模型对 通话的语音信息进行降噪。
实施例四
在上述实施例的基础上,本发明的实施例四还可以提供一种降噪方法。图5 示出了本发明实施例四提出的一种降噪方法的流程示意图,如图5所示,该降噪 方法包括以下步骤:
获取环境噪音;
这里,所述环境噪音是指终端建立通话时所处的环境的环境噪音。可以是通 过设置在终端上的语音采集装置来采集所述环境噪音,例如听筒。其中,获取终 端所处的环境的环境噪音的过程,在用户即将建立通话或成功建立通话之后进 行。
对环境噪音进行分析;
这里,对所述环境噪音进行分析,包括对所述环境噪音的波形进行分段,并 分别从各段波形上提取至少一个特征点,以根据所述特征点获得噪声信号特征向 量。其中,在数据库中存储有不同类型的通话场景及对应的噪声信号特征向量, 通过将提取到的噪声信号特征向量与数据库中的噪声信号特征向量进行对比,即 可获得提取到的噪声信号特征向量对应的通话场景,从而确定终端所处的通话场 景。例如,提取到的噪声信号特征向量是A,数据库中存在噪声信号特征向量A 对应通话场景B,则根据提取到的噪声信号特征向量A,确定到的通话场景为B。
确定通话场景;
这里,确定通话场景包括将所述噪声信号特征向量与预设的通话场景对应的 噪声信号特征向量进行匹配,并根据匹配结果确定所述终端所处的通话场景。其 中,在数据库中存储有不同类型的通话场景及对应的噪声信号特征向量,通过将 提取到的噪声信号特征向量与数据库中的噪声信号特征向量进行对比,即可获得 提取到的噪声信号特征向量对应的通话场景,从而确定终端所处的通话场景。例 如,提取到的噪声信号特征向量是A,数据库中存在噪声信号特征向量A对应通 话场景B,则根据提取到的噪声信号特征向量A,确定到的通话场景为B。
匹配降噪模型;
这里,匹配降噪模型包括根据所述通话场景,从预设的数据库中获取与所述 通话场景的类型相匹配的降噪模型。例如,当通话场景为车站时,则匹配到降噪 模型1,当通话场景为饭店时,则匹配到降噪模型2。
值得说明的是,当无法匹配到对应的降噪模型,则使用默认参数进行降噪。 所述默认参数是指任意通话场景都适用的降噪参数。
如图5所示,在另一个实施例中,该降噪方法包括以下步骤:
获取语音信息;
这里,所述语音信息可以是用户输入的语音控制命令。例如,当用户处在车 站时,其在通话前可以输入语音控制命令,以获得对应的降噪模型。
对语音信息进行分析;
这里,对语音信息进行分析,包括对所述语音信息进行语义分析,以获得反 映通话场景的关键词。
确定通话场景;
这里,根据所述关键词,确定终端所处的通话场景。其中,对所述语音信息 进行语义分析,包括提取用户的语音信息中能反映通话场景的关键词,进而判断 该反映通话场景的关键词能否作为食品的品类信息。例如,用户输入的语音信息 是调用车站降噪模型,从“调用车站降噪模型”的语音信息中获得的关键词包括 “调用”、“车站”“降噪模型”,则“车站”能够作为反映通话场景。因此, 通过用户输入语音信息,可以确定用户需要调用的是车站这一通话场景对应的降 噪模型。
匹配降噪模型;
这里,匹配降噪模型包括根据所述通话场景,从预设的数据库中获取与所述 通话场景的类型相匹配的降噪模型。例如,当通话场景为车站时,则匹配到降噪 模型1,当通话场景为饭店时,则匹配到降噪模型2。
值得说明的是,当无法匹配到对应的降噪模型,则使用默认参数进行降噪。 所述默认参数是指任意通话场景都适用的降噪参数。
实施例五
根据本发明的实施例,还提供了一种降噪系统,包括:
确定模块,其用于确定终端所处的通话场景;
匹配模块,其用于根据所述通话场景,从预设的数据库中获取与所述通话场 景的类型相匹配的降噪模型;
降噪模块,其用于根据所述降噪模型对终端发送和/或接收语音信号进行降噪 处理。
实施例六
根据本发明的实施例,还提供了一种存储介质,所述存储介质上存储有程序 代码,所述程序代码被处理器执行时,实现如上述实施例任一项所述的降噪方法。
实施例七
根据本发明的实施例,还提供了一种终端,所述终端包括存储器、处理器, 所述存储器上存储有可在所述处理器上运行的程序代码,所述程序代码被所述处 理器执行时,实现如上述实施例任一项所述的降噪方法。
以上结合附图详细说明了本发明的技术方案,考虑到相关技术中,在复杂的 噪声场景下,该通用的模式无法完全兼容各种复杂的噪声场景,导致用户只能通 过调大手机音量来提升通话体验。本发明提供一种降噪方法、系统、存储介质以 及终端,通过确定通话场景,并匹配与该通话场景对应的降噪模型。使得终端能 够根据不同的通话场景进行对应的降噪处理,而且可以分别对上行语音和/或者下 行语音进行降噪处理。不仅能够根据不同的通话场景进行对应的降噪处理,而且 能够对上行语音和/或下行语音进行分别降噪,可以使得终端的用户在通话时不被 外界噪音影响,使得对端接收到的语音信息清晰、没有噪声,从而提高用户体验。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以 通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如, 单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例 如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略, 或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显 示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分 布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现 本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也 可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元 中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形 式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用 时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术 方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可 以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括 若干指令用以使得一台终端(可以是个人计算机,服务器,或者网络设备等)执 行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移 动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM, Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明 而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人 员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节 上作任何的修改与变化,但本发明的保护范围,仍须以所附的权利要求书所界定 的范围为准。

Claims (10)

1.一种降噪方法,其特征在于,包括:
确定终端所处的通话场景;
根据所述通话场景,从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型;
利用所述降噪模型对终端发送和/或接收的语音信号进行降噪处理。
2.根据权利要求1所述的降噪方法,其特征在于,确定终端所处的通话场景,包括:
获取所述终端所处的环境的环境噪音;
根据所述环境噪音,确定所述终端所处的通话场景。
3.根据权利要求2所述的降噪方法,其特征在于,根据所述环境噪音,确定所述终端所处的通话场景,包括:
对所述环境噪音的波形进行分段,并从各段波形上分别提取至少一个特征点,以根据所述特征点获得所述环境的噪声信号特征向量;
将所述噪声信号特征向量与预设的数据库中的通话场景对应的噪声信号特征向量进行匹配,并根据匹配结果确定所述终端所处的通话场景。
4.根据权利要求1所述的降噪方法,其特征在于,确定终端所处的通话场景,包括:
获取语音信息;
对所述语音信息进行语义分析,以获得反映通话场景的关键词;
根据所述关键词,确定终端所处的通话场景。
5.根据权利要求1所述的降噪方法,其特征在于,所述降噪模型包括上行降噪模型和/或下行降噪模型,其中,所述上行降噪模型用于对终端发送的语音信号进行降噪处理,所述下行降噪模型用于对终端接收的语音信号进行降噪处理。
6.根据权利要求1所述的降噪方法,其特征在于,所述降噪模型通过以下步骤构建:
确定一噪声滤波模型,其中,所述噪声滤波模型用于对语音信号进行降噪处理;
根据不同类型的通话场景的环境噪音的信号特征,对所述噪声滤波模型的降噪参数的数值进行调整,以得到不同类型的通话场景对应的降噪模型;其中,所述降噪参数包括噪声门限参数、噪声抑制参数以及噪声参数的收敛程度中的至少一种。
7.根据权利要求1所述的降噪方法,其特征在于,根据所述降噪模型对所述终端接收到的语音进行降噪处理之后,还包括:
再次确定终端所处的通话场景;
当再次确定到的通话场景与当前使用的降噪模型对应的通话场景不一致时,获取与所述再次确定到的通话场景对应的降噪模型。
8.一种降噪系统,其特征在于,包括:
确定模块,其用于确定终端所处的通话场景;
匹配模块,其用于根据所述通话场景,从预设的数据库中获取与所述通话场景的类型相匹配的降噪模型;
降噪模块,其用于根据所述降噪模型对终端发送和/或接收语音信号进行降噪处理。
9.一种存储介质,所述存储介质上存储有程序代码,其特征在于,所述程序代码被处理器执行时,实现如权利要求1至7中任一项所述的降噪方法。
10.一种终端,其特征在于,所述终端包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的程序代码,所述程序代码被所述处理器执行时,实现如权利要求1至7中任一项所述的降噪方法。
CN201911048675.2A 2019-10-28 2019-10-28 一种降噪方法、系统、存储介质以及终端 Pending CN110769111A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911048675.2A CN110769111A (zh) 2019-10-28 2019-10-28 一种降噪方法、系统、存储介质以及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911048675.2A CN110769111A (zh) 2019-10-28 2019-10-28 一种降噪方法、系统、存储介质以及终端

Publications (1)

Publication Number Publication Date
CN110769111A true CN110769111A (zh) 2020-02-07

Family

ID=69334819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911048675.2A Pending CN110769111A (zh) 2019-10-28 2019-10-28 一种降噪方法、系统、存储介质以及终端

Country Status (1)

Country Link
CN (1) CN110769111A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111294447A (zh) * 2020-02-17 2020-06-16 Oppo广东移动通信有限公司 降噪方法及装置、电子设备、存储介质
CN111323783A (zh) * 2020-02-27 2020-06-23 Oppo广东移动通信有限公司 场景识别方法、装置、存储介质及电子设备
CN111583946A (zh) * 2020-04-30 2020-08-25 厦门快商通科技股份有限公司 一种语音信号增强方法和装置以及设备
CN111613223A (zh) * 2020-04-03 2020-09-01 厦门快商通科技股份有限公司 语音识别方法、系统、移动终端及存储介质
CN111785288A (zh) * 2020-06-30 2020-10-16 北京嘀嘀无限科技发展有限公司 语音增强方法、装置、设备及存储介质
CN112037812A (zh) * 2020-09-01 2020-12-04 深圳爱卓软科技有限公司 音频处理方法
CN113286042A (zh) * 2021-05-18 2021-08-20 号百信息服务有限公司 一种可定制通话背景声音的系统和方法
CN113327626A (zh) * 2021-06-23 2021-08-31 深圳市北科瑞声科技股份有限公司 语音降噪方法、装置、设备及存储介质
CN113628632A (zh) * 2021-07-26 2021-11-09 北京佳讯飞鸿电气股份有限公司 语音降噪方法、装置、设备及存储介质
CN114007157A (zh) * 2021-10-28 2022-02-01 中北大学 一种智能降噪通信耳机
CN114694666A (zh) * 2020-12-28 2022-07-01 北京小米移动软件有限公司 降噪处理方法、装置、终端及存储介质
CN115223582A (zh) * 2021-12-16 2022-10-21 广州汽车集团股份有限公司 一种音频的噪声处理方法、系统、电子装置及介质
WO2022247244A1 (zh) * 2021-05-24 2022-12-01 青岛海尔空调器有限总公司 空调器的语音控制方法及空调器
CN115906732A (zh) * 2022-11-28 2023-04-04 摩尔线程智能科技(北京)有限责任公司 建立场景化cpm模型的方法、装置和机器可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667426A (zh) * 2009-09-23 2010-03-10 中兴通讯股份有限公司 一种消除环境噪声的装置及方法
CN102223428A (zh) * 2011-06-24 2011-10-19 中兴通讯股份有限公司 一种降低噪声的方法及移动终端
CN103051774A (zh) * 2011-10-14 2013-04-17 浪潮乐金数字移动通信有限公司 一种基于多单元扬声器的移动终端
US20130231925A1 (en) * 2010-07-12 2013-09-05 Carlos Avendano Monaural Noise Suppression Based on Computational Auditory Scene Analysis
CN104036786A (zh) * 2014-06-25 2014-09-10 青岛海信信芯科技有限公司 一种语音降噪的方法及装置
CN105845139A (zh) * 2016-05-20 2016-08-10 北方民族大学 一种离线语音控制方法和装置
CN108848472A (zh) * 2018-06-20 2018-11-20 北京奇虎科技有限公司 变声通话的方法及装置
CN109817236A (zh) * 2019-02-01 2019-05-28 安克创新科技股份有限公司 基于场景的音频降噪方法、装置、电子设备和存储介质
CN209358619U (zh) * 2019-02-21 2019-09-06 无锡宇宁智能科技有限公司 通话语音降噪电路和通话终端

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667426A (zh) * 2009-09-23 2010-03-10 中兴通讯股份有限公司 一种消除环境噪声的装置及方法
US20130231925A1 (en) * 2010-07-12 2013-09-05 Carlos Avendano Monaural Noise Suppression Based on Computational Auditory Scene Analysis
CN102223428A (zh) * 2011-06-24 2011-10-19 中兴通讯股份有限公司 一种降低噪声的方法及移动终端
CN103051774A (zh) * 2011-10-14 2013-04-17 浪潮乐金数字移动通信有限公司 一种基于多单元扬声器的移动终端
CN104036786A (zh) * 2014-06-25 2014-09-10 青岛海信信芯科技有限公司 一种语音降噪的方法及装置
CN105845139A (zh) * 2016-05-20 2016-08-10 北方民族大学 一种离线语音控制方法和装置
CN108848472A (zh) * 2018-06-20 2018-11-20 北京奇虎科技有限公司 变声通话的方法及装置
CN109817236A (zh) * 2019-02-01 2019-05-28 安克创新科技股份有限公司 基于场景的音频降噪方法、装置、电子设备和存储介质
CN209358619U (zh) * 2019-02-21 2019-09-06 无锡宇宁智能科技有限公司 通话语音降噪电路和通话终端

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111294447A (zh) * 2020-02-17 2020-06-16 Oppo广东移动通信有限公司 降噪方法及装置、电子设备、存储介质
CN111323783A (zh) * 2020-02-27 2020-06-23 Oppo广东移动通信有限公司 场景识别方法、装置、存储介质及电子设备
CN111613223A (zh) * 2020-04-03 2020-09-01 厦门快商通科技股份有限公司 语音识别方法、系统、移动终端及存储介质
CN111583946A (zh) * 2020-04-30 2020-08-25 厦门快商通科技股份有限公司 一种语音信号增强方法和装置以及设备
CN111785288A (zh) * 2020-06-30 2020-10-16 北京嘀嘀无限科技发展有限公司 语音增强方法、装置、设备及存储介质
CN111785288B (zh) * 2020-06-30 2022-03-15 北京嘀嘀无限科技发展有限公司 语音增强方法、装置、设备及存储介质
CN112037812A (zh) * 2020-09-01 2020-12-04 深圳爱卓软科技有限公司 音频处理方法
CN114694666A (zh) * 2020-12-28 2022-07-01 北京小米移动软件有限公司 降噪处理方法、装置、终端及存储介质
CN113286042A (zh) * 2021-05-18 2021-08-20 号百信息服务有限公司 一种可定制通话背景声音的系统和方法
WO2022247244A1 (zh) * 2021-05-24 2022-12-01 青岛海尔空调器有限总公司 空调器的语音控制方法及空调器
CN113327626A (zh) * 2021-06-23 2021-08-31 深圳市北科瑞声科技股份有限公司 语音降噪方法、装置、设备及存储介质
CN113327626B (zh) * 2021-06-23 2023-09-08 深圳市北科瑞声科技股份有限公司 语音降噪方法、装置、设备及存储介质
CN113628632A (zh) * 2021-07-26 2021-11-09 北京佳讯飞鸿电气股份有限公司 语音降噪方法、装置、设备及存储介质
CN114007157A (zh) * 2021-10-28 2022-02-01 中北大学 一种智能降噪通信耳机
CN115223582A (zh) * 2021-12-16 2022-10-21 广州汽车集团股份有限公司 一种音频的噪声处理方法、系统、电子装置及介质
CN115223582B (zh) * 2021-12-16 2024-01-30 广州汽车集团股份有限公司 一种音频的噪声处理方法、系统、电子装置及介质
CN115906732A (zh) * 2022-11-28 2023-04-04 摩尔线程智能科技(北京)有限责任公司 建立场景化cpm模型的方法、装置和机器可读存储介质

Similar Documents

Publication Publication Date Title
CN110769111A (zh) 一种降噪方法、系统、存储介质以及终端
AU2017327003B2 (en) Channel-compensated low-level features for speaker recognition
CN109326299B (zh) 基于全卷积神经网络的语音增强方法、装置及存储介质
CN103971680B (zh) 一种语音识别的方法、装置
CN103065631B (zh) 一种语音识别的方法、装置
CN109036412A (zh) 语音唤醒方法和系统
CN110600017A (zh) 语音处理模型的训练方法、语音识别方法、系统及装置
CN108597505B (zh) 语音识别方法、装置及终端设备
CN104036786B (zh) 一种语音降噪的方法及装置
CN110556126B (zh) 语音识别方法、装置以及计算机设备
CN110808030A (zh) 语音唤醒方法、系统、存储介质及电子设备
CN110970051A (zh) 语音数据采集方法、终端及可读存储介质
CN111696556A (zh) 一种分析用户对话情绪方法、系统、设备和存储介质
CN104575509A (zh) 语音增强处理方法及装置
EP3516652B1 (en) Channel-compensated low-level features for speaker recognition
CN112420049A (zh) 数据处理方法、装置及存储介质
CN110765868A (zh) 唇读模型的生成方法、装置、设备及存储介质
CN113035176B (zh) 语音数据处理方法、装置、计算机设备及存储介质
CN117457017A (zh) 语音数据的清洗方法及电子设备
CN116564329A (zh) 实时通话声纹降噪方法及电子设备和存储介质
CN116364107A (zh) 一种语音信号检测方法、装置、设备及存储介质
CN115083412A (zh) 语音交互方法及相关装置、电子设备、存储介质
CN109065066B (zh) 一种通话控制方法、装置及设备
CN112599118A (zh) 语音识别方法、装置、电子设备和存储介质
CN114974279B (zh) 音质控制方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200207

RJ01 Rejection of invention patent application after publication