CN110060695A - 信息交互方法、装置、服务器和计算机可读介质 - Google Patents
信息交互方法、装置、服务器和计算机可读介质 Download PDFInfo
- Publication number
- CN110060695A CN110060695A CN201910332137.XA CN201910332137A CN110060695A CN 110060695 A CN110060695 A CN 110060695A CN 201910332137 A CN201910332137 A CN 201910332137A CN 110060695 A CN110060695 A CN 110060695A
- Authority
- CN
- China
- Prior art keywords
- noise
- noise reduction
- voice signal
- signal
- reduced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000011946 reduction process Methods 0.000 claims abstract description 29
- 230000009467 reduction Effects 0.000 claims description 98
- 230000005540 biological transmission Effects 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 10
- 238000001228 spectrum Methods 0.000 claims description 8
- 239000011148 porous material Substances 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 206010008190 Cerebrovascular accident Diseases 0.000 description 2
- 208000006011 Stroke Diseases 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本公开提供一种信息交互方法和智能设备,通过对接收到的语音信号进行降噪处理,以去除其中的噪声,并将降噪处理后的语音信号发送给终端设备,这样,终端设备更加容易识别该语音信号,相应更加容易确定出用户的意图,提高语音控制终端设备的灵敏度和准确度。在驾驶摩托车或电动摩托车的场景下,可以提高驾驶员驾车的安全系数,驾驶员在不影响正常驾驶的前提下,能够使用语音进行导航、拨打电话和欣赏音乐等常用应用。本公开还提供一种服务器和计算机可读介质。
Description
技术领域
本公开涉及人工智能技术领域,具体涉及一种信息交互方法、装置、服务器和计算机可读介质。
背景技术
语音人机交互是指以语音为信息载体与智能设备进行互动。近些年,随着语音识别技术的发展和智能设备的普及,语音人机交互已经成为重要的人机交互方式。
随着语音识别技术的蓬勃发展,手机上很多应用都可以用语音进行操控,但由于摩托车或电动摩托车的车机及行驶路况环境噪声很大,在大部分情况下,通过语音操控手机上的应用效果不好,还是需要驾驶者手动操控,大大降低驾车的安全性。
发明内容
本公开针对现有技术中存在的上述不足,提供一种信息交互方法、装置、服务器和计算机可读介质。
第一方面,本公开实施例提供一种信息交互方法,所述方法包括:
接收语音信号,所述语音信号为带噪语音信号;
对所述语音信号进行降噪处理;
将降噪后的语音信号发送给终端设备,以使所述终端设备识别所述降噪后的语音信号。
优选的,所述对所述语音信号进行降噪处理,具体包括:降低所述语音信号中的风噪和/或环境噪声。
优选的,所述对所述语音信号进行降噪处理,具体包括:
降低所述语音信号中的风噪,得到第一降噪语音信号;
降低所述第一降噪语音信号中的环境噪声。
进一步的,在降低所述语音信号中的风噪之后、降低所述第一降噪语音信号中的环境噪声之前,还包括:降低所述第一降噪语音信号中预设角度范围之外的信号强度;
所述降低所述第一降噪语音信号中的环境噪声,具体包括:针对已降低预设角度范围之外的信号强度的第一降噪语音信号,降低其中的环境噪声。
优选的,所述降低所述第一降噪语音信号中的环境噪声,具体包括:
对各频点第一降噪语音信号的功率谱进行平滑处理;
确定平滑后的第一降噪语音信号各频点的功率最小值,并对所述平滑后的第一降噪语音信号各频点的功率最小值进行非线性跟踪,以估计所述第一降噪语音信号中的环境噪声的功率;
根据所述环境噪声的功率,降低所述第一降噪语音信号中的环境噪声。
优选的,所述根据所述环境噪声的功率,降低所述第一降噪语音信号中的环境噪声,具体包括:将所述环境噪声的功率降低至相应频点的功率最小值。
进一步的,在对所述语音信号进行降噪处理之后、将降噪后的语音信号发送给终端设备之前,还包括:将降噪后的语音信号强度的幅值调整至预设范围;
所述将降噪后的语音信号发送给终端设备,具体包括:将已调整幅值的降噪后的语音信号发送给终端设备。
进一步的,所述方法应用于头戴式智能设备,所述方法还包括:
接收终端设备发送的待显示信息;所述待显示信息包括以下其中之一或任意组合:文字信息、图像信息、视频信息;
将所述待显示信息投射至所述头戴式智能设备上,以供佩戴所述头戴式智能设备的用户查看。
另一方面,本公开实施例还提供一种智能设备,包括:降噪模块、传输模块和至少一个麦克风;
所述麦克风用于,接收语音信号,所述语音信号为带噪语音信号;
所述降噪模块用于,对所述语音信号进行降噪处理;
所述传输模块用于,将降噪后的语音信号发送给终端设备,以使所述终端设备识别所述降噪后的语音信号。
优选的,所述降噪模块包括用于降低所述语音信号中风噪的第一降噪单元和/或用于降低所述语音信号中环境噪声的第二降噪单元。
优选的,所述降噪模块包括第一降噪单元和第二降噪单元;
所述第一降噪单元用于,降低所述语音信号中的风噪,得到第一降噪语音信号;
所述第二降噪单元用于,降低所述第一降噪语音信号中的环境噪声。
进一步的,所述降噪模块还包括拾音模块,所述拾音模块用于,在所述第一降噪单元降低所述语音信号中的风噪之后、所述第二降噪单元降低所述第一降噪语音信号中的环境噪声之前,降低所述第一降噪语音信号中预设角度范围之外的信号强度;
所述第二降噪单元具体用于,针对已降低预设角度范围之外的信号强度的第一降噪语音信号,降低其中的环境噪声。
优选的,所述第二降噪单元具体用于,对各频点第一降噪语音信号的功率谱进行平滑处理;确定平滑后的第一降噪语音信号各频点的功率最小值,并对所述平滑后的第一降噪语音信号各频点的功率最小值进行非线性跟踪,以估计所述第一降噪语音信号中的环境噪声的功率;根据所述环境噪声的功率,降低所述第一降噪语音信号中的环境噪声。
优选的,所述第二降噪单元具体用于,将所述环境噪声的功率降低至相应频点的功率最小值。
进一步的,所述智能设备还包括调整模块,所述调整模块用于,在所述降噪模块对所述语音信号进行降噪处理之后、所述传输模块将降噪后的语音信号发送给终端设备之前,将降噪后的语音信号强度的幅值调整至预设范围;
所述传输模块具体用于,将已调整幅值的降噪后的语音信号发送给终端设备。
优选的,所述智能设备为头戴式智能设备,还包括显示信息接收模块和透明显示器件;
所述显示信息接收模块用于,接收终端设备发送的待显示信息;所述待显示信息包括以下其中之一或任意组合:文字信息、图像信息、视频信息;
所述透明显示器件用于,将所述待显示信息投射至所述头戴式智能设备上,以供佩戴所述头戴式智能设备的用户查看。
进一步的,所述智能设备还包括防风罩,所述防风罩设置在所述至少一个麦克风上,所述防风罩的材料为多孔材料。
又一方面,本公开实施例还提供一种服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前所述的信息交互方法。
再一方面,本公开实施例还提供一种计算机可读介质,其上存储有计算机程序,其中,所述程序被执行时实现如前所述的信息交互方法。
本公开的实施例,通过对接收到的语音信号进行降噪处理,以去除其中的噪声,并将降噪处理后的语音信号发送给终端设备,这样,终端设备更加容易识别该语音信号,相应更加容易确定出用户的意图,提高语音控制终端设备的灵敏度和准确度。在驾驶摩托车或电动摩托车的场景下,可以提高驾驶员驾车的安全系数,驾驶员在不影响正常驾驶的前提下,能够使用语音进行导航、拨打电话和欣赏音乐等常用应用。
附图说明
图1为本公开实施例的系统架构图;
图2为本公开实施例提供的信息交互方法的流程图之一;
图3为本公开实施例提供的信息交互方法的流程图之二;
图4为本公开实施例提供的降噪处理的流程图之一;
图5为本公开实施例提供的降噪处理的流程图之二;
图6为本公开实施例提供的降低环境噪声的流程图;
图7为本公开实施例提供的显示待显示信息的流程图;
图8为本公开实施例提供的智能设备的结构示意图之一;
图9为本公开实施例提供的降噪模块的结构示意图之一;
图10为本公开实施例提供的降噪模块的结构示意图之二;
图11为本公开实施例提供的智能设备的结构示意图之二;
图12为本公开实施例提供的智能设备的结构示意图之三;
图13为本公开实施例提供的智能设备的结构示意图之四。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的无人驾驶车辆控制器测试方案进行详细描述。
在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。
如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或其群组。
本文所述实施例可借助本公开的理想示意图而参考平面图和/或截面图进行描述。因此,可根据制造技术和/或容限来修改示例图示。因此,实施例不限于附图中所示的实施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。
除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
本公开提供一种信息交互方法,该方法应用于如图1所示的系统,所述系统包括智能设备和移动终端,在本公开实施例中,智能设备为头戴式智能设备,例如,可以是头盔、眼镜等。移动终端可以是手机、PAD(portable android device,平板电脑)、智能手表等设备。用户佩戴智能设备并发出语音控制指令,智能设备接收该语音控制指令,去除其中的噪声后转发给用户的终端设备,由终端设备识别该语音控制指令,从而利用智能设备实现语音控制。
本公开的一个实施例提供一种信息交互方法,以下结合图1、2,对所述信息交互方法进行详细说明,如图2所示,该方法包括以下步骤:
步骤1,接收语音信号。
具体的,智能设备接收用户发出的该语音信号,所述语音信号为用于控制终端设备的语音控制指令,其中包括噪声信号,即所述语音信号为带噪语音信号。
步骤2,对语音信号进行降噪处理。
具体的,噪声可以包括风噪和/或环境噪声,相应的,在本步骤中,智能设备降低语音信号中的风噪和/或环境噪声。
在本公开实施例中,以既降低风噪又降低环境噪声为例进行说明,该降噪步骤的具体实现方式后续结合图4再详细说明。
步骤3,将降噪后的语音信号发送给终端设备,以使终端设备识别降噪后的语音信号。
具体的,智能设备可以通过有线传输方式或无线传输方式将降噪后的语音信号发送给终端设备。有线传输方式可以为USB(Universal Serial Bus,通用串行总线)方式等,无线传输方式可以为蓝牙方式等。
通过步骤1-3可以看出,本公开通过对接收到的语音信号进行降噪处理,以去除其中的噪声,并将降噪处理后的语音信号发送给终端设备,这样,终端设备更加容易识别该语音信号,相应更加容易确定出用户的意图,提高语音控制终端设备的灵敏度和准确度。在驾驶摩托车或电动摩托车的场景下,可以提高驾驶员驾车的安全系数,驾驶员在不影响正常驾驶的前提下,能够使用语音进行导航、拨打电话和欣赏音乐等常用应用。
进一步的,如图3所示,在对语音信号进行降噪处理(即步骤2)之后、将降噪后的语音信号发送给终端设备(即步骤3)之前,所述信息交互方法还包括以下步骤:
步骤2’,将降噪后的语音信号强度的幅值调整至预设范围。
具体的,可以采用动态范围控制算法,自动调整降噪后的语音信号的动态范围,动态范围是指信号强度的最大幅值与最小幅值比值的对数,使用dB作为单位。
通过步骤2’,可以将语音控制指令中能量较小的部分调大,并将能量较大的部分调小,从而使得声音更为均匀,终端设备更加容易识别语音信号。
在执行完步骤2’之后,相应的,所述将降噪后的语音信号发送给终端设备(即步骤3),具体包括:将已调整幅值的降噪后的语音信号发送给终端设备。
以下结合图4详细说明对语音信号进行降噪处理步骤的具体实现方式。如图4所示,所述对语音信号进行降噪处理,具体包括以下步骤:
步骤21,降低语音信号中的风噪,得到第一降噪语音信号。
风噪的频率一般是低频,一般在200Hz以下,最高能达到600Hz,主要能量集中在45Hz左右,因此,切除低频信号(例如200Hz以下的信号)能够很好降低风噪带来的影响。
具体的,可以采用高通滤波算法,过滤语音信号中小于200Hz的信号,得到第一降噪语音信号。
步骤22,降低第一降噪语音信号中的环境噪声。
在本公开实施例中,环境噪声为随机平稳加性噪声,且与语音信号不相关,例如,摩托车或电动摩托车的发动机的声音、喇叭声等。
具体的,降低环境噪声的具体实现方式,后续结合图6再详细说明。
需要说明的是,若降噪处理既包括降低风噪的步骤又包括降低环境噪声的步骤,那么降低风噪的步骤和降低环境噪声的步骤的执行顺序不限。由于降低风噪实现简单、效果好,因此,优选的,先降低风噪,然后再降低环境噪声,这样降噪效果更优。
通常,若声源位于麦克风的正前方,则语音信号中的噪声信号较少。为了进一步降低语音信号中的噪声,还可以对麦克风正前方一定角度范围内的语音信号进行拾音处理。相应的,如图5所示,在降低语音信号中的风噪(即步骤21)之后、降低第一降噪语音信号中的环境噪声(即步骤22)之前,还包括以下步骤:
步骤21’,降低第一降噪语音信号中预设角度范围之外的信号强度。
需要说明的是,预设角度范围是指用户佩戴智能设备后,以用户的嘴所在位置为中线,其左右两侧一定角度的范围。例如,从用户的嘴所在位置分别向左、右30°的范围,即60°范围即为该预设角度范围。
具体的,可以采用波束成形算法,降低第一降噪语音信号中预设角度范围之外的信号强度,以弱化噪声信号,可以提高针对来自预设角度范围方向的声音信号(即用户发出的语音控制指令)的敏感度。
相应的,所述降低第一降噪语音信号中的环境噪声(步骤22),具体包括:针对已降低预设角度范围之外的信号强度的第一降噪语音信号,降低其中的环境噪声。
以下结合图6,对降低环境噪声的具体实现方式进行详细说明。在本公开实施例中,先采用连续谱最小值跟踪算法对环境噪声进行估计,然后再对估计出的环境噪声进行降噪处理。连续谱最小值跟踪算法的原理为:带噪语音信号在单个频带的功率通常会衰减到噪声的功率水平。
如图6所示,所述降低第一降噪语音信号中的环境噪声的步骤(即步骤22)包括以下步骤:
步骤221,对各频点第一降噪语音信号的功率谱进行平滑处理。
步骤222,确定平滑后的第一降噪语音信号各频点的功率最小值。
步骤223,对平滑后的第一降噪语音信号各频点的功率最小值进行非线性跟踪,以估计第一降噪语音信号中的环境噪声的功率。
具体的,非线性跟踪会连续对噪声功率进行估计。
步骤224,根据环境噪声的功率,降低第一降噪语音信号中的环境噪声。
具体的,采用非线性滤波算法,将估计出的第一降噪语音信号中的环境噪声的功率降低至相应频点的功率最小值。
优选的,所述智能设备为头戴式智能设备。进一步的,为了实现佩戴智能设备的用户接收终端设备发送的信息,如图7所示,在本公开另一实施例中,所述信息交互方法还包括以下步骤:
步骤41,接收终端设备发送的待显示信息。
优选的,待显示信息可以包括以下其中之一或任意组合:文字信息、图像信息、视频信息,例如,可以为导航路线、来电显示、短消息等。
终端设备可以通过无线方式或有线方式将待显示信息发送给头戴式智能设备。
步骤42,将待显示信息投射至头戴式智能设备上,以供佩戴所述头戴式智能设备的用户查看。
具体的,头戴式智能设备可以内置抬头数字显示仪(HUD),HUD设置在与佩戴者的眼睛相对的位置,若头戴式智能设备为头盔,则HUD可以设置在头盔前方的挡风面罩上;若头戴式智能设备为眼镜,则HUD可以设置在眼镜镜片上。
终端设备发送的待显示信息可以通过HUD投射在头戴式智能设备上,具体投射在焦距无限远距离的位置,佩戴头戴式智能设备的用户透过HUD往前方看时,可以将外界景象与接收到的待显示信息融合在一起,不会影响用户的正常驾驶。这样,快递、外卖送餐人员在驾驶电动摩托车时佩戴本公开的头戴式智能设备,可以在骑行时方便接单、导航、联系客户,也不会影响驾车安全。
基于相同的技术构思,本公开实施例还提供一种智能设备,如图8所示,该智能设备包括降噪模块12、传输模块13和至少一个麦克风11。优选的,包括多个麦克风11,各麦克风11组成麦克风阵列。
麦克风11用于,接收语音信号,所述语音信号为带噪语音信号。
降噪模块12用于,对所述语音信号进行降噪处理。
传输模块13用于,将降噪后的语音信号发送给终端设备,以使所述终端设备识别所述降噪后的语音信号。
优选的,如图8所示,降噪模块12包括用于降低所述语音信号中风噪的第一降噪单元121和/或用于降低所述语音信号中环境噪声的第二降噪单元122。
优选的,如图9所示,降噪模块12包括第一降噪单元121和第二降噪单元122。
第一降噪单元121用于,降低所述语音信号中的风噪,得到第一降噪语音信号。
第二降噪单元122用于,降低所述第一降噪语音信号中的环境噪声。
在本公开又一实施例中,如图10所示,降噪模块12还包括拾音模块123,拾音模块123用于,在第一降噪单元121降低所述语音信号中的风噪之后、第二降噪单元122降低所述第一降噪语音信号中的环境噪声之前,降低所述第一降噪语音信号中预设角度范围之外的信号强度。
第二降噪单元122具体用于,针对已降低预设角度范围之外的信号强度的第一降噪语音信号,降低其中的环境噪声。
优选的,第二降噪单元122具体用于,对各频点第一降噪语音信号的功率谱进行平滑处理;确定平滑后的第一降噪语音信号各频点的功率最小值,并对所述平滑后的第一降噪语音信号各频点的功率最小值进行非线性跟踪,以估计所述第一降噪语音信号中的环境噪声的功率;根据所述环境噪声的功率,降低所述第一降噪语音信号中的环境噪声。
优选的,第二降噪单元122具体用于,将所述环境噪声的功率降低至相应频点的功率最小值。
在本公开再一实施例中,如图11所示,进一步的,所述智能设备还包括调整模块14,调整模块14用于,在降噪模块12对所述语音信号进行降噪处理之后、传输模块13将降噪后的语音信号发送给终端设备之前,将降噪后的语音信号强度的幅值调整至预设范围。
传输模块13具体用于,将已调整幅值的降噪后的语音信号发送给终端设备。
优选的,所述智能设备为头戴式智能设备,如图12所示,还包括显示信息接收模块15和透明显示器件16。
显示信息接收模块15用于,接收终端设备发送的待显示信息;所述待显示信息包括以下其中之一或任意组合:文字信息、图像信息、视频信息。
透明显示器件16用于,将所述待显示信息投射至所述头戴式智能设备上,以供佩戴所述头戴式智能设备的用户查看。
为了提高降噪效果,可以在硬件上进行前期处理,即在麦克风上设置防风罩进行风噪的前期处理。风噪含有很多次低音成分,能量很高,容易造成麦克风拾音信号过载失真。通过后期降噪处理已经失真的信号,也只能是对已经劣化的声音做做补救。因此,降低风噪最好的时机是先在硬件上进行,以降低噪风噪的影响。
进一步,在本公开另一实施例中,如图13所示,所述智能设备还包括防风罩17,防风罩17设置在所述至少一个麦克风11上,防风罩17的材料为多孔材料。优选的,多孔材料可以选用海绵、尼龙、金属网等。风在空气中行进的速度远比语音要快,细密的多孔材料能发散、削弱速度快的风的动能,而对速度慢的语音影响很小。多孔的防风罩17把强风分解成很多个相对小的风,并且减弱强风的能量,如果采用多层不同孔径的材料组成风罩17,降低风噪的效果会更好。
本公开实施例还提供了一种服务器,该服务器包括:一个或多个处理器以及存储装置;其中,存储装置上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如前述各实施例所提供的信息交互方法。
本公开实施例还提供了一种计算机可读介质,其上存储有计算机程序,其中,该计算机程序被执行时实现如前述各实施例所提供的信息交互方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本发明的范围的情况下,可进行各种形式和细节上的改变。
Claims (19)
1.一种信息交互方法,其中,所述方法包括:
接收语音信号,所述语音信号为带噪语音信号;
对所述语音信号进行降噪处理;
将降噪后的语音信号发送给终端设备,以使所述终端设备识别所述降噪后的语音信号。
2.如权利要求1所述的方法,其中,所述对所述语音信号进行降噪处理,具体包括:降低所述语音信号中的风噪和/或环境噪声。
3.如权利要求2所述的方法,其中,所述对所述语音信号进行降噪处理,具体包括:
降低所述语音信号中的风噪,得到第一降噪语音信号;
降低所述第一降噪语音信号中的环境噪声。
4.如权利要求3所述的方法,其中,在降低所述语音信号中的风噪之后、降低所述第一降噪语音信号中的环境噪声之前,还包括:降低所述第一降噪语音信号中预设角度范围之外的信号强度;
所述降低所述第一降噪语音信号中的环境噪声,具体包括:针对已降低预设角度范围之外的信号强度的第一降噪语音信号,降低其中的环境噪声。
5.如权利要求3所述的方法,其中,所述降低所述第一降噪语音信号中的环境噪声,具体包括:
对各频点第一降噪语音信号的功率谱进行平滑处理;
确定平滑后的第一降噪语音信号各频点的功率最小值,并对所述平滑后的第一降噪语音信号各频点的功率最小值进行非线性跟踪,以估计所述第一降噪语音信号中的环境噪声的功率;
根据所述环境噪声的功率,降低所述第一降噪语音信号中的环境噪声。
6.如权利要求5所述的方法,其中,所述根据所述环境噪声的功率,降低所述第一降噪语音信号中的环境噪声,具体包括:将所述环境噪声的功率降低至相应频点的功率最小值。
7.如权利要求1-6任一项所述的方法,其中,在对所述语音信号进行降噪处理之后、将降噪后的语音信号发送给终端设备之前,还包括:将降噪后的语音信号强度的幅值调整至预设范围;
所述将降噪后的语音信号发送给终端设备,具体包括:将已调整幅值的降噪后的语音信号发送给终端设备。
8.如权利要求1-7任一项所述的方法,其中,所述方法应用于头戴式智能设备,所述方法还包括:
接收终端设备发送的待显示信息;所述待显示信息包括以下其中之一或任意组合:文字信息、图像信息、视频信息;
将所述待显示信息投射至所述头戴式智能设备上,以供佩戴所述头戴式智能设备的用户查看。
9.一种智能设备,其中,包括:降噪模块、传输模块和至少一个麦克风;
所述麦克风用于,接收语音信号,所述语音信号为带噪语音信号;
所述降噪模块用于,对所述语音信号进行降噪处理;
所述传输模块用于,将降噪后的语音信号发送给终端设备,以使所述终端设备识别所述降噪后的语音信号。
10.如权利要求9所述的智能设备,其中,所述降噪模块包括用于降低所述语音信号中风噪的第一降噪单元和/或用于降低所述语音信号中环境噪声的第二降噪单元。
11.如权利要求10所述的智能设备,其中,所述降噪模块包括第一降噪单元和第二降噪单元;
所述第一降噪单元用于,降低所述语音信号中的风噪,得到第一降噪语音信号;
所述第二降噪单元用于,降低所述第一降噪语音信号中的环境噪声。
12.如权利要求11所述的智能设备,其中,所述降噪模块还包括拾音模块,所述拾音模块用于,在所述第一降噪单元降低所述语音信号中的风噪之后、所述第二降噪单元降低所述第一降噪语音信号中的环境噪声之前,降低所述第一降噪语音信号中预设角度范围之外的信号强度;
所述第二降噪单元具体用于,针对已降低预设角度范围之外的信号强度的第一降噪语音信号,降低其中的环境噪声。
13.如权利要求11所述的智能设备,其中,所述第二降噪单元具体用于,对各频点第一降噪语音信号的功率谱进行平滑处理;确定平滑后的第一降噪语音信号各频点的功率最小值,并对所述平滑后的第一降噪语音信号各频点的功率最小值进行非线性跟踪,以估计所述第一降噪语音信号中的环境噪声的功率;根据所述环境噪声的功率,降低所述第一降噪语音信号中的环境噪声。
14.如权利要求13所述的智能设备,其中,所述第二降噪单元具体用于,将所述环境噪声的功率降低至相应频点的功率最小值。
15.如权利要求9-14任一项所述的智能设备,其中,还包括调整模块,所述调整模块用于,在所述降噪模块对所述语音信号进行降噪处理之后、所述传输模块将降噪后的语音信号发送给终端设备之前,将降噪后的语音信号强度的幅值调整至预设范围;
所述传输模块具体用于,将已调整幅值的降噪后的语音信号发送给终端设备。
16.如权利要求9-14任一项所述的智能设备,其中,所述智能设备为头戴式智能设备,还包括显示信息接收模块和透明显示器件;
所述显示信息接收模块用于,接收终端设备发送的待显示信息;所述待显示信息包括以下其中之一或任意组合:文字信息、图像信息、视频信息;
所述透明显示器件用于,将所述待显示信息投射至所述头戴式智能设备上,以供佩戴所述头戴式智能设备的用户查看。
17.如权利要求9-15任一项所述的智能设备,其中,还包括防风罩,所述防风罩设置在所述至少一个麦克风上,所述防风罩的材料为多孔材料。
18.一种服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-8任一项所述的信息交互方法。
19.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被执行时实现如权利要求1-8任一项所述的信息交互方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910332137.XA CN110060695A (zh) | 2019-04-24 | 2019-04-24 | 信息交互方法、装置、服务器和计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910332137.XA CN110060695A (zh) | 2019-04-24 | 2019-04-24 | 信息交互方法、装置、服务器和计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110060695A true CN110060695A (zh) | 2019-07-26 |
Family
ID=67320406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910332137.XA Pending CN110060695A (zh) | 2019-04-24 | 2019-04-24 | 信息交互方法、装置、服务器和计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110060695A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110682159A (zh) * | 2019-09-25 | 2020-01-14 | 武汉誉德节能数据服务有限公司 | 一种刀具磨损状态识别方法及装置 |
CN111524518A (zh) * | 2020-04-01 | 2020-08-11 | Oppo广东移动通信有限公司 | 增强现实处理方法及装置、存储介质和电子设备 |
CN113342158A (zh) * | 2020-03-03 | 2021-09-03 | 阿里巴巴集团控股有限公司 | 眼镜设备以及数据处理方法、装置、电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040193411A1 (en) * | 2001-09-12 | 2004-09-30 | Hui Siew Kok | System and apparatus for speech communication and speech recognition |
CN101356849A (zh) * | 2006-07-04 | 2009-01-28 | 日本胜利株式会社 | 麦克风装置 |
CN102549659A (zh) * | 2009-10-01 | 2012-07-04 | 高通股份有限公司 | 抑制音频信号中的噪声 |
CN102930870A (zh) * | 2012-09-27 | 2013-02-13 | 福州大学 | 利用抗噪幂归一化倒谱系数的鸟类声音识别方法 |
CN204317623U (zh) * | 2015-01-07 | 2015-05-13 | 东北林业大学 | 一种具有无线对讲功能的头盔 |
CN205524073U (zh) * | 2016-03-30 | 2016-08-31 | 乐视控股(北京)有限公司 | 一种阵列排布的车载麦克结构 |
CN106205293A (zh) * | 2016-09-30 | 2016-12-07 | 广州音书科技有限公司 | 用于语音识别和手语识别的智能眼镜 |
-
2019
- 2019-04-24 CN CN201910332137.XA patent/CN110060695A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040193411A1 (en) * | 2001-09-12 | 2004-09-30 | Hui Siew Kok | System and apparatus for speech communication and speech recognition |
CN101356849A (zh) * | 2006-07-04 | 2009-01-28 | 日本胜利株式会社 | 麦克风装置 |
CN102549659A (zh) * | 2009-10-01 | 2012-07-04 | 高通股份有限公司 | 抑制音频信号中的噪声 |
CN102930870A (zh) * | 2012-09-27 | 2013-02-13 | 福州大学 | 利用抗噪幂归一化倒谱系数的鸟类声音识别方法 |
CN204317623U (zh) * | 2015-01-07 | 2015-05-13 | 东北林业大学 | 一种具有无线对讲功能的头盔 |
CN205524073U (zh) * | 2016-03-30 | 2016-08-31 | 乐视控股(北京)有限公司 | 一种阵列排布的车载麦克结构 |
CN106205293A (zh) * | 2016-09-30 | 2016-12-07 | 广州音书科技有限公司 | 用于语音识别和手语识别的智能眼镜 |
Non-Patent Citations (2)
Title |
---|
李玲玲: "驾驶环境下低信噪比语音增强与分离算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
靳韡赟: "驾驶环境下的麦克风阵列语音增强算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110682159A (zh) * | 2019-09-25 | 2020-01-14 | 武汉誉德节能数据服务有限公司 | 一种刀具磨损状态识别方法及装置 |
CN113342158A (zh) * | 2020-03-03 | 2021-09-03 | 阿里巴巴集团控股有限公司 | 眼镜设备以及数据处理方法、装置、电子设备 |
CN113342158B (zh) * | 2020-03-03 | 2022-08-30 | 阿里巴巴集团控股有限公司 | 眼镜设备以及数据处理方法、装置、电子设备 |
CN111524518A (zh) * | 2020-04-01 | 2020-08-11 | Oppo广东移动通信有限公司 | 增强现实处理方法及装置、存储介质和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11743627B2 (en) | Acoustic output apparatus and method thereof | |
CN110060695A (zh) | 信息交互方法、装置、服务器和计算机可读介质 | |
US10325614B2 (en) | Voice-based realtime audio attenuation | |
US20200251124A1 (en) | Method and terminal for reconstructing speech signal, and computer storage medium | |
US11412327B2 (en) | Systems and methods for controlling electronic devices | |
CN106950694A (zh) | 一种外接式改善视力头戴vr装置 | |
DE112015002673T5 (de) | Anzeige zur Informationsverwaltung | |
US20210042497A1 (en) | Visual fatigue recognition method, visual fatigue recognition device, virtual reality apparatus and storage medium | |
CN107801045A (zh) | 当播放增强现实场景时自动变焦的方法、设备和系统 | |
US20150098691A1 (en) | Technology for dynamically adjusting video playback speed | |
CN108961681A (zh) | 疲劳驾驶提醒方法、装置及存储介质 | |
US9722562B1 (en) | Signal enhancements for audio | |
CN102043942A (zh) | 目视方向判断方法、影像处理方法及其装置、和显示装置 | |
CN111179880A (zh) | 一种显示屏幕的亮度调节方法、装置、电子设备及系统 | |
CN106302974B (zh) | 一种信息处理的方法及电子设备 | |
CN110070143A (zh) | 获取训练数据的方法、装置、设备及存储介质 | |
CN113038165A (zh) | 确定编码参数组的方法、设备及存储介质 | |
CN109995986A (zh) | 控制智能眼镜拍摄视角移动的方法 | |
US20220121237A1 (en) | Fit adjustment of a head mounted display | |
US11641551B2 (en) | Bone conduction speaker and compound vibration device thereof | |
CN105094304B (zh) | 一种信息处理方法以及电子设备 | |
WO2023001113A1 (zh) | 一种显示方法与电子设备 | |
US20220230657A1 (en) | Voice control method and apparatus, chip, earphones, and system | |
CN209345275U (zh) | 眼镜设备和系统 | |
CN107872619B (zh) | 一种拍照处理方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |