CN111464918B - 耳机及耳机组 - Google Patents
耳机及耳机组 Download PDFInfo
- Publication number
- CN111464918B CN111464918B CN202010161383.6A CN202010161383A CN111464918B CN 111464918 B CN111464918 B CN 111464918B CN 202010161383 A CN202010161383 A CN 202010161383A CN 111464918 B CN111464918 B CN 111464918B
- Authority
- CN
- China
- Prior art keywords
- signal
- pass filter
- headset
- noise
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000001914 filtration Methods 0.000 claims abstract description 36
- 230000009467 reduction Effects 0.000 claims abstract description 20
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 12
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 12
- 230000005236 sound signal Effects 0.000 claims description 25
- 210000000988 bone and bone Anatomy 0.000 claims description 23
- 238000000926 separation method Methods 0.000 claims description 21
- 238000012880 independent component analysis Methods 0.000 claims description 6
- 238000000513 principal component analysis Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 7
- 238000000034 method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1083—Reduction of ambient noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/04—Structural association of microphone with electric circuitry therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/407—Circuits for combining signals of a plurality of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/60—Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles
- H04R25/609—Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles of circuitry
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/01—Noise reduction using microphones having different directional characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/13—Hearing devices using bone conduction transducers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Neurosurgery (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供一种耳机及耳机组。耳机包括处理电路及滤波模块。处理电路取得第一语音讯号,并对第一语音讯号执行前处理操作以产生第二语音讯号。滤波模块包括高通、低通及带通滤波器。处理电路更经配置以:从高通、低通及带通滤波器分别接收第一、第二及第三讯号;对第二及第三讯号执行降噪操作,以产生第四讯号;以及对第一及第四讯号执行讯号合成操作,以将第一及第四讯号合成为输出语音讯号。
Description
技术领域
本发明是有关于一种语音处理装置,且特别是有关于一种耳机及耳机组。
背景技术
随着科技的发展,使用耳机控制智能型装置的语音助理已然成为人们生活中最为常见的行为之一。然而,若仅透过耳机的麦克风接收使用者的语音,将可能因为环境噪音的干扰而影响语音辨识的结果。为了改善耳机的语音辨识表现,各家厂商无不致力于研发相关的技术。
例如,习知一技术可利用加速规讯号辅助声音活动侦测(voice activitydetection,VAD)技术以判定在麦克风的时域讯号中,语音讯号与噪声讯号的分界处,如图1所示。
在图1中,可看出在经由上述技术处理麦克风的时域讯号110(其包括语音成分110a及噪声成分110b)之后,可将时域讯号110区分为多段噪声讯号(例如噪声讯号112)与语音讯号(例如语音讯号114)。然而,由各语音讯号(例如语音讯号114)可看出,其个别仍包括噪声成分110b。换言之,此种作法并无法完全消除噪声成分。
此外,习知有另一技术利用加速规接收本质上不带有环境噪音的骨传导音讯号以隔绝外部噪声,再以此骨传导音讯号取代麦克风讯号的低频部分,借以滤除低频的噪声。然而,由于加速规讯号的采样频率较低,且骨传导音讯号本质上缺乏口腔与鼻腔中的共鸣,故相较于麦克风透过空气所接收到的讯号来的闷且模糊,因而可能导致所合成的语音讯号具有较差的音质。
因此,对于本领域技术人员而言,如何设计一种可提升语音讯号质量的技术方案实为一项重要议题。
发明内容
有鉴于此,本发明提供一种耳机及耳机组,其可用于解决上述技术问题。
本发明提供一种耳机,其包括处理电路及滤波模块。处理电路从至少一麦克风取得一第一语音讯号,并对第一语音讯号执行一前处理操作以产生一第二语音讯号。滤波模块包括一高通滤波器、一低通滤波器及一带通滤波器,其中高通滤波器对第二语音讯号执行一高通滤波操作以产生一第一讯号,低通滤波器对第二语音讯号执行一低通滤波操作以产生一第二讯号,带通滤波器从至少一加速规接收对应于第一语音讯号的一骨传导音讯号,并对骨传导音讯号执行一带通滤波操作以产生一第三讯号。处理电路更经配置以:从高通滤波器、低通滤波器及带通滤波器分别接收第一讯号、第二讯号及第三讯号;对第二讯号及第三讯号执行一降噪操作,以产生一第四讯号;以及对第一讯号及第四讯号执行一讯号合成操作,以将第一讯号及第四讯号合成为一输出语音讯号。
本发明提供一种耳机组,包括第一耳机及第二耳机。第一耳机包括至少一第一麦克风。第二耳机包括至少一第二麦克风、处理电路及滤波模块。至少一第二麦克风与至少一第一麦克风形成一麦克风阵列。处理电路从麦克风阵列取得一第一语音讯号,并对第一语音讯号执行一前处理操作以产生一第二语音讯号。滤波模块包括一高通滤波器、一低通滤波器及一带通滤波器,其中高通滤波器对第二语音讯号执行一高通滤波操作以产生一第一讯号,低通滤波器对第二语音讯号执行一低通滤波操作以产生一第二讯号,带通滤波器从至少一加速规接收对应于第一语音讯号的一骨传导音讯号,并对骨传导音讯号执行一带通滤波操作以产生一第三讯号。处理电路更经配置以:从高通滤波器、低通滤波器及带通滤波器分别接收第一讯号、第二讯号及第三讯号;对第二讯号及第三讯号执行一降噪操作,以产生一第四讯号;以及对第一讯号及第四讯号执行一讯号合成操作,以将第一讯号及第四讯号合成为一输出语音讯号。
基于上述,本发明的耳机及耳机组可提供具更佳音质的输出语音讯号,从而有助于后续的语音辨识操作。
附图说明
图1是示例性技术中结合加速规讯号及VAD技术以消除噪声的示意图。
图2为一实施例中的耳机示意图。
图3是依据图2绘示的耳机内硬件及软件模块的示意图。
图4为一实施例中的耳机组示意图。
其中:
110:时域讯号
110a:语音成分
110b:噪声成分
112:噪声讯号
114:语音讯号
202:滤波模块
202a:高通滤波器
202b:低通滤波器
202c:带通滤波器
204:处理电路
210,411,421:加速规
220,412,422:麦克风
301:前处理模块
301a:切换模块
310b:波束成形模块
302:降噪模块
302a:讯号分离模块
302b:子空间语音增强模块
303:讯号合成模块
400:耳机组
200,410,420:耳机
BT:骨传导音讯号
NS:噪声讯号
OS:输出语音讯号
S1:第一讯号
S2:第二讯号
S3:第三讯号
S4:第四讯号
SS1:第一特定讯号
SS2:第二特定讯号
VO1:第一语音讯号
VO2:第二语音讯号
具体实施方式
请参照图2,其是一实施例中的耳机示意图。如图2所示,耳机200例如是一入耳式耳机,并可包括滤波模块202及处理电路204,其中滤波模块202可接收来自加速规210的骨传导音讯号BT,而滤波模块202及处理电路204可接收来自于麦克风220的第一语音讯号VO1。
在图2中,加速规210及麦克风220可设置于耳机200之外。例如,加速规210及麦克风220可设置于与耳机200属于同一有线/无线耳机组的另一耳机中。在此情况下,上述另一耳机可透过相关的有线/无线通讯协定将骨传导音讯号BT、第一语音讯号VO1及其他的讯号发送至耳机200,但可不限于此。
此外,在一些实施例中,加速规210及麦克风220亦可设置于耳机200中,并如图2所示方式耦接于滤波模块202及处理电路204。另外,在不同的实施例中,麦克风220可包括单一个麦克风,或是由多个麦克风单元形成的麦克风阵列。
在本发明的实施例中,第一语音讯号VO1可对应于骨传导音讯号BT。具体而言,在一实施例中,假设佩戴有上述耳机或耳机组的使用者借由说话等方式而发出/产生人声讯号,而麦克风220可在接收上述人声讯号后相应地将人声讯号转换为第一语音讯号VO1。于此同时,加速规210可撷取使用者在发出上述人声讯号的过程中,因说话所产生的振动以产生骨传导音讯号BT。
基于骨传导音讯号BT及第一语音讯号VO1,本发明耳机200中的滤波模块202及处理电路204可协同进行本发明提出的技术方案,从而提供具较佳音质的输出语音讯号,其相关细节将在之后详述。
在本发明的实施例中,耦接于滤波模块202的处理电路204例如是一般用途处理器、特殊用途处理器、传统的处理器、数位讯号处理器、多个微处理器(microprocessor)、一个或多个结合数位讯号处理器核心的微处理器、控制器、微控制器、特殊应用集成电路(Application Specific Integrated Circuit,ASIC)、现场可程序闸阵列电路(FieldProgrammable Gate Array,FPGA)、任何其他种类的集成电路、状态机、基于进阶精简指令集机器(Advanced RISC Machine,ARM)的处理器以及类似品。
请参照图3,其是依据图2绘示的耳机内硬件及软件模块的示意图。在本发明的实施例中,滤波模块202可包括高通滤波器202a、低通滤波器202b及带通滤波器202c。此外,处理电路204可存取所需的软件模块、程序码来实现本发明提出的技术方案。为使本案技术更易于理解,以下将假设处理电路204所存取的软件模块包括如图3所示的前处理模块301、降噪模块302及讯号合成模块303。应了解的是,图3所示内容并非上述各软件模块与滤波模块202之间的实际耦接关系,而仅是用于便于说明本发明中的讯号传递/处理机制而作如此呈现。
在图3中,处理电路204可从麦克风220取得第一语音讯号VO1,并执行前处理模块301以对第一语音讯号VO1执行前处理操作以产生第二语音讯号VO2。
在本发明的实施例中,用于执行上述前处理操作的前处理模块301可包括切换模块301a及波束成形模块301b,其中切换模块301a可用于判断麦克风220是否仅包括单一麦克风。若是,则切换模块301a可将第一语音讯号VO1作为第二语音讯号VO2而输出至高通滤波器202a及低通滤波器202b。
在另一实施例中,若切换模块301a判定麦克风220未仅包括单一麦克风(即,麦克风220包括一麦克风阵列),则处理电路204可执行波束成形模块301b以对第一语音讯号VO1执行波束成形操作,以产生噪声讯号NS及第一特定讯号SS1,其中第一特定讯号包括第一音讯成分及第一噪声成分。
在一实施例中,第一特定讯号SS1例如是在第一语音讯号VO1中对应于发出第一语音讯号VO1的声源方向的一部分讯号,而噪声讯号NS例如是未对应于上述声源方向的其他部分讯号。从另一观点而言,上述波束成形操作可理解为一种在物理空间上的消噪方式,但可不限于此。之后,波束成形模块301b可将第一特定讯号SS1作为第二语音讯号VO2输出至高通滤波器202a及低通滤波器202b。
简言之,若麦克风220仅包括单一麦克风,则前处理模块301即直接将第一语音讯号VO1输出至高通滤波器202a及低通滤波器202b。另一方面,若麦克风220为麦克风阵列,则处理电路204可将经波束成形操作所取得的第一特定讯号SS1输出至高通滤波器202a及低通滤波器202b。
之后,在取得第二语音讯号VO2之后,高通滤波器202a可对第二语音讯号VO2执行高通滤波操作以产生第一讯号S1,而低通滤波器202b可对第二语音讯号VO2执行低通滤波操作以产生第二讯号S2。在一实施例中,高通滤波器202a与低通滤波器202b的分频点可介于1kHz及2kHz之间。例如,若分频点经设定为1500Hz,则第一讯号S1例如是第二语音讯号VO2中高于1500Hz的讯号成分,而第二讯号例如是第二语音讯号VO2中低于1500Hz的讯号成分。
此外,在从加速规210取得骨传导音讯号BT之后,带通滤波器202c可对骨传导音讯号BT执行带通滤波操作以产生第三讯号S3。在一实施例中,带通滤波器202c的通带可介于20Hz至1000Hz之间,即一般人声讯号的频率范围。
之后,处理电路204可从高通滤波器202a、低通滤波器202b及带通滤波器202c分别接收第一讯号S1、第二讯号S2及第三讯号S3。并且,处理电路204可执行降噪模块302以对第二讯号S2及第三讯号S3执行降噪操作,以产生第四讯号S4。
在一实施例中,降噪模块302可基于第二讯号S2及第三讯号S3产生第二特定讯号SS2,其中第二特定讯号SS2可包括彼此分离的第二音讯成分及第二噪声成分。之后,降噪模块302可再依据噪声讯号NS从第二特定讯号SS2中获取第二音讯成分以作为第四讯号S4。
在图3中,降噪模块302可包括讯号分离模块302a及子空间语音增强模块302b,其中讯号分离模块302a可执行讯号分离操作以基于第二讯号S2及第三讯号S3产生第二特定讯号SS2,而子空间语音增强模块302b可执行子空间语音增强操作以依据噪声讯号NS从第二特定讯号SS2中获取第二音讯成分以作为第四讯号S4。
在一实施例中,讯号分离模块302a可基于独立成分分析(independentcomponents analysis,ICA)的盲讯号分离算法产生第二特定讯号SS2,或是基于主成分分析(principal components analysis,PCA)算法产生第二特定讯号SS2,但可不限于此。上述ICA的相关细节可参照「Alaa Tharwat,Independent component analysis:Anintroduction,Applied Computing and Informatics,2018.」的内容,而PCA的相关细节可参照「Renevey R.Vetter,N.Virag and J.Vesin,“Single channel speech enhancementusing principal component analysis and MDL subspace selection,”in Proceedingsof the 6th European Conference on Speech Communication and Technology(EUROSPEECH’99),1999,vol.5,pp.2411–2414」的内容,于此不另赘述。
详细而言,由于讯号分离模块302a系基于第二讯号S2(其可理解为第二语音讯号VO2中低于分频点的低频成分)及第三讯号S3(其例如是骨传导音讯号BT中介于20Hz至1000Hz之间的低频成分)进行上述讯号分离操作,因此相较于仅使用第二讯号S2进行讯号分离操作的方式可达到更佳的讯号分离效能。从另一观点而言,若仅有第三讯号S3亦无法执行上述讯号分离操作。因此,本案可理解为透过在执行讯号分离操作时同时考虑第二讯号S2及第三讯号S3的方式来改善讯号分离效能。从另一观点而言,上述讯号分离操作可理解为一种统计方法上的消噪方式。
之后,在第一实施例中,若麦克风220包括麦克风阵列,则波束成形模块301b可相应地提供噪声讯号NS至子空间语音增强模块302b。在此情况下,子空间语音增强模块302b可执行子空间语音增强(subspace speech enhancer)算法以依据噪声讯号NS从第二特定讯号SS2中获取第二音讯成分。
从另一观点而言,上述子空间语音增强操作可理解为一种矢量空间上的消噪方式。具体而言,子空间语音增强模块302b可依据噪声讯号NS而将第二特定讯号SS2中含有噪声的子空间消除,借以达到消除环境噪音并保留第二音讯成分的效果。上述子空间语音增强算法的细节可参照「Kris Hermus,Patrick Wambacq,Hugo Van hamme,A Review ofSignal Subspace Speech Enhancement and Its Application to Noise RobustSpeech,EURASIP Journal on Advances in Signal Processing,2006」的内容,于此不另赘述。
此外,在第二实施例中,若麦克风210仅包括单一麦克风,则波束成形模块301b可能无法提供噪声讯号NS至子空间语音增强模块302b。在此情况下,子空间语音增强模块302b仍可执行子空间语音增强算法而直接从第二特定讯号SS2中获取第二音讯成分以作为第四讯号S4。
之后,处理电路204可执行讯号合成模块303以对第一讯号S1及第四讯号S4执行讯号合成操作,以将第一讯号S1及第四讯号S4合成为输出语音讯号OS。在一实施例中,上述讯号合成操作对应的截止频率可介于1kHz及2kHz之间。藉此,可避免上述讯号合成操作对普遍低于1kHz的人声讯号造成衰减。
进一步而言,由于讯号分离模块302a系基于第二讯号S2及第三讯号S3进行上述讯号分离操作,而第二讯号S2及第三讯号S3可理解为对应于使用者所发出的人声讯号中的低频成分,因此讯号分离模块302a及子空间语音增强模块302b所执行的操作可对人声讯号中的低频讯号达到更佳的噪声消除效果。
因此,在将子空间语音增强模块302b提供的第四讯号S4与高通滤波器202a提供的第一讯号S1(其对应于使用者所发出的人声讯号中高于分频点的高频讯号)进行上述讯号合成操作之后,可让输出语音讯号OS的低频讯号具有较低的噪声讯号,又由于高频噪声指向性高,可以透过波束成形模块301b大幅滤除,不需要透过降噪模块302执行降噪,因此降噪模块302仅需要执行低频讯号中的降噪运算,可以有效提升运算的速度,进而有助于进行后续的语音辨识操作。
请参照图4,其是一实施例中的耳机组示意图。在图4中,耳机组400可包括耳机410及420,其中耳机410可包括加速规411、麦克风412、滤波模块202及处理电路204,而耳机420可包括加速规421及麦克风422。应了解的是,为便于理解,图4耳机410中的滤波模块202及处理电路204系以图3所绘示的方式呈现。
在本实施例中,麦克风412及422可耦接于处理电路204。由于麦克风412及422可形成一麦克风阵列,故在处理电路202从此麦克风阵列接收第一语音讯号VO1之后,处理电路204可执行切换模块301a以将来自此麦克风阵列的第一语音讯号VO1提供予波束成形模块301b进行先前实施例中教示的波束成形操作。此外,在带通滤波器202c接收来自加速规411及421的骨传导音讯号BT之后,可依先前实施例教示的内容进行带通滤波操作。之后,滤波模块202及处理电路204可依据先前实施例的教示进行相关的讯号处理,进而产生具较佳音质的输出语音讯号OS,其细节于此不另赘述。
应了解的是,即便麦克风412及422个别仅包括单一个麦克风,麦克风411及421仍可被视为一麦克风阵列,故波束成形模块301b仍可基于第一语音讯号VO1进行波束成形操作。
综上所述,有别于示例性技术中直接以骨传导音讯号取代低频讯号的作法,本发明的耳机系将骨传导音讯号作为执行讯号分离操作时的参考,借以提升讯号分离的效能,并进而改善降噪的效果。借此,本发明可提供具更佳音质的输出语音讯号,从而有助于后续的语音辨识操作。
虽然本发明已以实施例揭露如上,然其并非用以限定本发明,任何所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作些许的更动与润饰,故本发明的保护范围当视后附的申请专利范围所界定者为准。
Claims (19)
1.一种耳机,包括:
一处理电路,其从至少一麦克风取得一第一语音讯号,并对所述第一语音讯号执行一前处理操作以产生一第二语音讯号;以及
一滤波模块,其包括一高通滤波器, 一低通滤波器及一带通滤波器,其中所述高通滤波器对所述第二语音讯号执行一高通滤波操作以产生一第一讯号,所述低通滤波器对所述第二语音讯号执行一低通滤波操作以产生一第二讯号,所述带通滤波器从至少一加速规接收对应于所述第一语音讯号的一骨传导音讯号,并对所述骨传导音讯号执行一带通滤波操作以产生一第三讯号;
其中所述处理电路更经配置以:
从所述高通滤波器, 所述低通滤波器及所述带通滤波器分别接收所述第一讯号, 所述第二讯号及所述第三讯号;
对所述第二讯号及所述第三讯号执行一降噪操作,以产生一第四讯号;以及
对所述第一讯号及所述第四讯号执行一讯号合成操作,以将所述第一讯号及所述第四讯号合成为一输出语音讯号;
其中,所述降噪操作包括:
基于所述第二讯号及所述第三讯号产生一第二特定讯号,其中所述第二特定讯号包括一第二音讯成分及一第二噪声成分;
从所述第二特定讯号中获取所述第二音讯成分以作为所述第四讯号。
2.根据权利要求1所述的耳机,其特征在于,所述处理电路执行的所述前处理操作包括:
响应于判定所述至少一麦克风仅包括单一麦克风,将所述第一语音讯号作为所述第二语音讯号而输出至所述高通滤波器及所述低通滤波器。
3.根据权利要求1所述的耳机,其特征在于,响应于判定所述至少一麦克风形成一麦克风阵列,所述处理电路更经配置以:
对所述第一语音讯号执行一波束成形操作,以产生一噪声讯号及一第一特定讯号,其中所述第一特定讯号包括一第一音讯成分及一第一噪声成分;
将所述第一特定讯号作为所述第二语音讯号输出至所述高通滤波器及所述低通滤波器。
4.根据权利要求3所述的耳机,其特征在于,所述降噪操作更包括:
依据所述噪声讯号从所述第二特定讯号中获取所述第二音讯成分以作为所述第四讯号。
5.根据权利要求4所述的耳机,其特征在于,所述处理电路执行子空间语音增强算法以依据所述噪声讯号从所述第二特定讯号中获取所述第二音讯成分。
6.根据权利要求1所述的耳机,其特征在于,所述处理电路基于独立成分分析的盲讯号分离算法或主成分分析算法产生所述第二特定讯号。
7.根据权利要求1所述的耳机,其特征在于,所述高通滤波器与所述低通滤波器的分频点介于1kHz及2kHz之间。
8.根据权利要求1所述的耳机,其特征在于,所述带通滤波器的通带介于20Hz至1000Hz之间。
9.根据权利要求1所述的耳机,其特征在于,还包括所述至少一麦克风及所述至少一加速规。
10.根据权利要求1所述的耳机,其特征在于,所述耳机为一入耳式耳机。
11.根据权利要求1所述的耳机,其特征在于,所述讯号合成操作对应的截止频率介于1kHz及2kHz之间。
12.一种耳机组,包括:
一第一耳机,其包括至少一第一麦克风;
一第二耳机,其包括:
至少一第二麦克风,其与所述至少一第一麦克风形成一麦克风阵列;
一处理电路,其从所述麦克风阵列取得一第一语音讯号,并对所述第一语音讯号执行一前处理操作以产生一第二语音讯号;以及
一滤波模块,其包括一高通滤波器, 一低通滤波器及一带通滤波器,其中所述高通滤波器对所述第二语音讯号执行一高通滤波操作以产生一第一讯号,所述低通滤波器对所述第二语音讯号执行一低通滤波操作以产生一第二讯号,所述带通滤波器从至少一加速规接收对应于所述第一语音讯号的一骨传导音讯号,并对所述骨传导音讯号执行一带通滤波操作以产生一第三讯号;
其中所述处理电路更经配置以:
从所述高通滤波器, 所述低通滤波器及所述带通滤波器分别接收所述第一讯号, 所述第二讯号及所述第三讯号;
对所述第二讯号及所述第三讯号执行一降噪操作,以产生一第四讯号;以及
对所述第一讯号及所述第四讯号执行一讯号合成操作,以将所述第一讯号及所述第四讯号合成为一输出语音讯号;
其中,所述降噪操作包括:
基于所述第二讯号及所述第三讯号产生一第二特定讯号,其中所述第二特定讯号包括一第二音讯成分及一第二噪声成分;
从所述第二特定讯号中获取所述第二音讯成分以作为所述第四讯号。
13.根据权利要求12所述的耳机组,其特征在于,所述处理电路执行的所述前处理操作包括:
因应于所述麦克风阵列而对所述第一语音讯号执行一波束成形操作,以产生一噪声讯号及一第一特定讯号,其中所述第一特定讯号包括一第一音讯成分及一第一噪声成分;
将所述第一特定讯号作为所述第二语音讯号输出至所述高通滤波器及所述低通滤波器。
14.根据权利要求13所述的耳机组,其特征在于,所述降噪操作更包括:
依据所述噪声讯号从所述第二特定讯号中获取所述第二音讯成分以作为所述第四讯号。
15.根据权利要求14所述的耳机组,其特征在于,所述处理电路基于子空间语音增强算法依据所述噪声讯号从所述第二特定讯号中获取所述第二音讯成分。
16.根据权利要求12所述的耳机组,其特征在于,所述处理电路基于独立成分分析的盲讯号分离算法或主成分分析算法产生所述第二特定讯号。
17.根据权利要求12所述的耳机组,其特征在于,所述高通滤波器与所述低通滤波器的分频点介于1kHz及2kHz之间。
18.根据权利要求12所述的耳机组,其特征在于,所述带通滤波器的通带介于20Hz至1000Hz之间。
19.根据权利要求12所述的耳机组,其特征在于,所述讯号合成操作对应的截止频率介于1kHz及2kHz之间。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109103058A TWI745845B (zh) | 2020-01-31 | 2020-01-31 | 耳機及耳機組 |
TW109103058 | 2020-01-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111464918A CN111464918A (zh) | 2020-07-28 |
CN111464918B true CN111464918B (zh) | 2021-09-10 |
Family
ID=71682707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010161383.6A Active CN111464918B (zh) | 2020-01-31 | 2020-03-10 | 耳机及耳机组 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10972844B1 (zh) |
CN (1) | CN111464918B (zh) |
TW (1) | TWI745845B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11523244B1 (en) * | 2019-06-21 | 2022-12-06 | Apple Inc. | Own voice reinforcement using extra-aural speakers |
US11574645B2 (en) * | 2020-12-15 | 2023-02-07 | Google Llc | Bone conduction headphone speech enhancement systems and methods |
CN114040289A (zh) * | 2021-11-08 | 2022-02-11 | 广州由我科技股份有限公司 | 一种耳机降噪方法及耳机 |
US11978468B2 (en) * | 2022-04-06 | 2024-05-07 | Analog Devices International Unlimited Company | Audio signal processing method and system for noise mitigation of a voice signal measured by a bone conduction sensor, a feedback sensor and a feedforward sensor |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102110443A (zh) * | 2009-12-28 | 2011-06-29 | 英华达股份有限公司 | 噪声消除电路及其电子装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4671303B2 (ja) * | 2005-09-02 | 2011-04-13 | 国立大学法人北陸先端科学技術大学院大学 | マイクロホンアレイ用ポストフィルタ |
US9767817B2 (en) * | 2008-05-14 | 2017-09-19 | Sony Corporation | Adaptively filtering a microphone signal responsive to vibration sensed in a user's face while speaking |
US8107654B2 (en) * | 2008-05-21 | 2012-01-31 | Starkey Laboratories, Inc | Mixing of in-the-ear microphone and outside-the-ear microphone signals to enhance spatial perception |
US8675884B2 (en) * | 2008-05-22 | 2014-03-18 | DSP Group | Method and a system for processing signals |
CN203435060U (zh) * | 2010-07-15 | 2014-02-12 | 艾利佛有限公司 | 无线电话会议的电话系统和电话网关 |
FR2974655B1 (fr) * | 2011-04-26 | 2013-12-20 | Parrot | Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres". |
US9711127B2 (en) * | 2011-09-19 | 2017-07-18 | Bitwave Pte Ltd. | Multi-sensor signal optimization for speech communication |
CN103208291A (zh) * | 2013-03-08 | 2013-07-17 | 华南理工大学 | 一种可用于强噪声环境的语音增强方法及装置 |
US9363596B2 (en) * | 2013-03-15 | 2016-06-07 | Apple Inc. | System and method of mixing accelerometer and microphone signals to improve voice quality in a mobile device |
CN109729454A (zh) * | 2017-10-27 | 2019-05-07 | 北京金锐德路科技有限公司 | 用于脖戴式语音交互耳机的声麦处理装置 |
US10535362B2 (en) * | 2018-03-01 | 2020-01-14 | Apple Inc. | Speech enhancement for an electronic device |
WO2019199706A1 (en) * | 2018-04-10 | 2019-10-17 | Acouva, Inc. | In-ear wireless device with bone conduction mic communication |
US10657950B2 (en) * | 2018-07-16 | 2020-05-19 | Apple Inc. | Headphone transparency, occlusion effect mitigation and wind noise detection |
CN109195042B (zh) * | 2018-07-16 | 2020-07-31 | 恒玄科技(上海)股份有限公司 | 低功耗的高效降噪耳机及降噪系统 |
CN109767783B (zh) * | 2019-02-15 | 2021-02-02 | 深圳市汇顶科技股份有限公司 | 语音增强方法、装置、设备及存储介质 |
-
2020
- 2020-01-31 TW TW109103058A patent/TWI745845B/zh active
- 2020-03-10 CN CN202010161383.6A patent/CN111464918B/zh active Active
- 2020-03-27 US US16/831,829 patent/US10972844B1/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102110443A (zh) * | 2009-12-28 | 2011-06-29 | 英华达股份有限公司 | 噪声消除电路及其电子装置 |
Also Published As
Publication number | Publication date |
---|---|
US10972844B1 (en) | 2021-04-06 |
TW202131706A (zh) | 2021-08-16 |
CN111464918A (zh) | 2020-07-28 |
TWI745845B (zh) | 2021-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111464918B (zh) | 耳机及耳机组 | |
US10535362B2 (en) | Speech enhancement for an electronic device | |
EP3300078B1 (en) | A voice activitity detection unit and a hearing device comprising a voice activity detection unit | |
US7243060B2 (en) | Single channel sound separation | |
US11330358B2 (en) | Wearable audio device with inner microphone adaptive noise reduction | |
EP2882203A1 (en) | Hearing aid device for hands free communication | |
KR102545750B1 (ko) | 헤드셋들을 위한 유연한 음성 캡처 프론트-엔드 | |
US11689869B2 (en) | Hearing device configured to utilize non-audio information to process audio signals | |
CN112399301B (zh) | 耳机及降噪方法 | |
CN113544775A (zh) | 用于头戴式音频设备的音频信号增强 | |
CN112116918A (zh) | 语音信号增强处理方法和耳机 | |
EP4118648A1 (en) | Audio processing using distributed machine learning model | |
WO2020225294A1 (en) | A hearing apparatus with bone conduction sensor | |
CN116360252A (zh) | 听力系统上的音频信号处理方法、听力系统和用于音频信号处理的神经网络 | |
KR101850693B1 (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
CN113038318B (zh) | 一种语音信号处理方法及装置 | |
Rahman et al. | A study on amplitude variation of bone conducted speech compared to air conducted speech | |
US8737652B2 (en) | Method for operating a hearing device and hearing device with selectively adjusted signal weighing values | |
Sehgal et al. | Utilization of two microphones for real-time low-latency audio smartphone apps | |
US11533555B1 (en) | Wearable audio device with enhanced voice pick-up | |
US20230169987A1 (en) | Reduced-bandwidth speech enhancement with bandwidth extension | |
US20220208209A1 (en) | Audio signal generation method and system | |
US20220240026A1 (en) | Hearing device comprising a noise reduction system | |
US20240169987A1 (en) | Hearing device system and method for operating same | |
CN115914927A (zh) | 一种通话降噪方法、装置及降噪耳机 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |