CN108156568A - 助听系统与助听系统的语音撷取方法 - Google Patents
助听系统与助听系统的语音撷取方法 Download PDFInfo
- Publication number
- CN108156568A CN108156568A CN201810018272.2A CN201810018272A CN108156568A CN 108156568 A CN108156568 A CN 108156568A CN 201810018272 A CN201810018272 A CN 201810018272A CN 108156568 A CN108156568 A CN 108156568A
- Authority
- CN
- China
- Prior art keywords
- face image
- possibility
- image
- speech
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000000007 visual effect Effects 0.000 claims abstract description 7
- 230000005236 sound signal Effects 0.000 claims description 61
- 238000004458 analytical method Methods 0.000 claims description 47
- 238000012545 processing Methods 0.000 claims description 12
- 210000005069 ears Anatomy 0.000 claims description 8
- 230000001960 triggered effect Effects 0.000 claims description 3
- 241000209140 Triticum Species 0.000 claims 1
- 235000021307 Triticum Nutrition 0.000 claims 1
- 238000013461 design Methods 0.000 abstract description 7
- 238000001914 filtration Methods 0.000 abstract description 6
- 230000002349 favourable effect Effects 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 7
- 241000406668 Loxodonta cyclotis Species 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/117—Identification of persons
- A61B5/1171—Identification of persons based on the shapes or appearances of their bodies or parts thereof
- A61B5/1176—Recognition of faces
-
- G—PHYSICS
- G02—OPTICS
- G02C—SPECTACLES; SUNGLASSES OR GOGGLES INSOFAR AS THEY HAVE THE SAME FEATURES AS SPECTACLES; CONTACT LENSES
- G02C11/00—Non-optical adjuncts; Attachment thereof
- G02C11/06—Hearing aids
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
- G10L15/25—Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/183—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/407—Circuits for combining signals of a plurality of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/55—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
- H04R25/554—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired using a wireless connection, e.g. between microphone and amplifier or using Tcoils
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/61—Aspects relating to mechanical or electronic switches or control elements, e.g. functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/55—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
- H04R25/558—Remote control, e.g. of amplification, frequency
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Otolaryngology (AREA)
- Signal Processing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Neurosurgery (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Molecular Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Computational Linguistics (AREA)
- Heart & Thoracic Surgery (AREA)
- Human Computer Interaction (AREA)
- Pathology (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Ophthalmology & Optometry (AREA)
- Optics & Photonics (AREA)
- Image Analysis (AREA)
- Studio Devices (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
Abstract
一种助听系统与助听系统的语音撷取方法,该语音撷取方法是先根据使用者前方视野影像中的人脸影像分别相对于使用者的距离与方位,分析出最有可能作为讲话对象的人脸影像后,再通过波束成型方法,将可能性最高的级别内的人脸影像的方位的语音讯号过滤出来。通过影像辅助撷取语音讯号的设计,可大幅提高在人群中成功撷取到讲话对象的语音的成功率,而有助于降低语音干扰,是一种创新的助听系统与助听系统的语音撷取方法设计。
Description
本申请是申请日2014/6/9,申请案号第201410252560.6号,发明名称「助听系统与助听系统的语音撷取方法」的分案申请。
技术领域
本发明涉及一种助听系统与助听系统的语音撷取方法,特别是涉及一种结合影像辅助收音的助听系统与助听系统的语音撷取方法。
背景技术
鸡尾酒会效应(cocktail party effect)是指人的一种听力选择能力,在这种情况下,注意力会集中在某一个人的谈话中,而忽略背景中其他的对话或噪音。使我们可以在吵杂环境中谈话。但是由于听损患者的听力阀值上升,导致这样的听觉选择性倾听的能力大幅降低,以致于目前的助听器使用者在面对众多语言讯号中,如何选取目标语言讯号,而不被其他语言讯号干扰,成了一个很大的挑战。
目前助听器利用声音讯号特性不同,虽然可以有效的区分语音(speech)及噪音(noise),而将噪音讯号滤除,但是在日常生活环境却经常同时存在许多语音讯号,且其中大多数语音讯号是患者不想听的,如鸡尾酒会、市场、餐厅等地方,虽然使用方向性麦克风可以降低来自患者后方及侧面的声音讯号,但是来自患者前方的声音讯号中,除了谈话对象的语音外,可能仍然充斥着其他人的讲话声。
人类的听力系统本来就是双耳功能的加成,是利用声音传至双耳的时间及强度差异来进行声音定位,目前最先进的降低噪音与提高讯杂比的方法,就是双耳配戴助听器,应用无线技术可以使两侧助听器同步处理、互相沟通,这种技术称为耳对耳(ear-to-ear)通讯,保留讯号的双耳线索,并以波束成型法(beamforming)技术,过滤出患者正前方的声音,且提高讯噪比,而达到可在吵杂的环境里与人面对面交谈的目的。
虽然双耳通讯与波束成型的技术可以定位声音的方向,但是面对前方有多个语言讯号时,通常无法得知哪个方向的语音讯号是大脑要的,所以只能保留病患最正面的较强语言讯号,以致于在面临一个人对两个人讲话、一个人对三个人讲话,或者是患者前方有很多人在讲话的场面时,经常无法顺利取得所需的语音讯号。
发明内容
本发明的目的在于提供一种通过影像辅助撷取语音,而有助于降低语音干扰的助听系统及助听系统的语音撷取方法。
本发明助听系统,包含一个助听装置,该助听装置包括一个影像撷取器、一个麦克风阵列单元、一个微处理器与至少一个声音输出器。该影像撷取器能够撷取使用者视野前方的视野影像。该麦克风阵列单元包括多个相间隔并能够撷取声音的麦克风。该微处理器是讯号连接于该影像撷取器与所述麦克风,包括一个影像分析模块,及一个声音处理模块,该影像分析模块能够分析输出该视野影像中的所有人脸影像相对于该使用者的距离与方位,并根据所述人脸影像的距离和方位,对所述人脸影像作为讲话对象的可能性进行分类,而对应输出一个可能性讯号源分类,该可能性讯号源分类规划有多个分别具有不同可能性的级别,该声音处理模块能够根据被分类于一个可能性最高的级别内的所有人脸影像的方位,以及所述麦克风撷取的声音讯号,通过波束成型方法过滤出该可能性最高的级别内的所有人脸影像的方位的语音讯号。该声音输出器是讯号连接于该微处理器,并能够将该微处理器输出的语音讯号输出以供聆听。
本发明所述助听系统,该影像分析模块包括一个能够分析出该视野影像中的所述人脸影像相对于使用者的距离远近的距离分析单元、一个能够分析出所述人脸影像相对于使用者的方位的方位分析单元,及一个内建有一个可能性分类基准的可能性分析单元,该可能性分类基准内建有用于分析运算出该可能性讯号源分类时的人脸影像的距离与方位的运算权重比,该可能性分析单元是根据每一个人脸影像的距离与方位的运算权重比,分析统计输出该可能性讯号源分类。
本发明所述助听系统,该影像分析模块还包括一个能够分析出所述人脸影像相对使用者左右偏转的偏转角度的偏转分析单元,该可能性分类基准还内建有用于分析运算出该可能性讯号源分类时的偏转角度的运算权重比,且该影像分析模块的该可能性分析单元是根据所述人脸影像的距离、方位与偏转角度的运算权重比,分析统计输出关于所述人脸影像的该可能性讯号源分类。
本发明所述助听系统,该影像分析模块还包括一个唇形分析单元,该唇形分析单元能够分析一个分类有至少一个人脸影像且可能性最高的级别内的所有人脸影像的嘴唇是否有开合变形,且会对应每一个嘴唇有开合变形的人脸影像输出一个讲话讯号,该声音处理模块能够被该讲话讯号触发,而过滤出该讲话讯号对应的人脸影像的方位的语音讯号。
本发明所述助听系统,该声音处理模块包括一个能够于分析所述麦克风接收输出的声音讯号中含有语音讯号时,触发启动该影像撷取器开始撷取影像的语音触发单元。
本发明所述助听系统,还包含一个能够配戴于使用者头部的载具,该载具包括一个左右延伸且位于使用者脸部前侧的前载体,及两个左右间隔地安装于该前载体并能够供配戴于双耳的侧载体,该影像撷取器是安装于该前载体,所述麦克风是分别安装于所述侧载体。
本发明所述助听系统,部分麦克风是左右间隔地安装于该前载体。
本发明助听系统的语音撷取方法,包含以下步骤:(a)将一个助听装置配置于使用者身上,该助听装置包括一影像撷取器与一麦克风阵列单元,该麦克风阵列单元包括多个相间隔的麦克风;(b)以该影像撷取器撷取该使用者视野前方的视野影像;(c)使该助听装置自该视野影像中辨识出人脸影像,并判断出所述人脸影像分别相对于该使用者的距离与方位;(d)使该助听装置根据所述人脸影像分别相对于该使用者的距离与方位,对所述人脸影像作为讲话对象的可能性进行级别分类,而对应输出一个可能性讯号源分类;及(e)使该助听装置利用所述麦克风感测输出的声音讯号,并通过波束成型方法,将步骤(d)的可能性讯号源分类中被分类于一个可能性最高的级别内的所有人脸影像的方位的语音讯号过滤出来。
本发明所述助听系统的语音撷取方法,步骤(d)是使该助听装置根据人脸影像偏离该视野影像的一个视野中心的偏离角度来定义出相对该使用者的方位,且针对人脸影像相对于该使用者的距离大小,及方位分别给予不同的运算权重比,并根据所述人脸影像的距离与方位分别对应的运算权重比,分析统计输出关于所述人脸影像作为谈话对象的可能性的可能性讯号源分类。
本发明所述助听系统的语音撷取方法,步骤(c)还使该助听装置分析辨识所述人脸影像相对使用者左右偏转的偏转角度,步骤(d)是使该助听装置针对人脸影像的偏转角度大小分别给予不同的运算权重比,且根据每一个人脸影像的距离、方位与偏转角度分别对应的运算权重比,分析统计输出该可能性讯号源分类。
本发明所述助听系统的语音撷取方法,还包含一个步骤(f)使该助听装置分析一个分类有至少一个人脸影像且可能性最高的级别内的所有人脸影像的嘴唇是否有开合变形,并对应嘴唇有开合变形的人脸影像分别输出一个讲话讯号,步骤(e)是使该助听装置只输出该讲话讯号对应的人脸影像的方位的语音讯号。
本发明所述助听系统的语音撷取方法,步骤(b)该助听装置是于所述麦克风接收的声音讯号中含有语音讯号时,才启动该影像撷取器开始撷取影像。
本发明所述助听系统的语音撷取方法,步骤(a)的助听装置具有一个能够供配戴于使用者头部的载具,该助听装置是配置于使用者头部。
本发明的有益的效果在于:通过先分析一个视野影像中的每一个人脸影像,以找出最可能为讲话对象的人脸影像后,再利用波束成型方法过滤出最可能为讲话对象的方位的语音讯号的设计,可大幅提高在人群中成功撷取到讲话对象的语音的成功率,而有助于降低语音干扰。
附图说明
图1是本发明助听系统的一个较佳实施例的立体示意图;
图2是该较佳实施例的功能方块图;
图3是本发明助听系统的语音撷取方法的较佳实施例的步骤流程图;
图4是该较佳实施例的一个助听装置撷取的视野影像的示意图;
图5是一个俯视示意图,示意说明图4的人脸影像所代表的讲话对象相对于一个视野中心的左右偏离角度。
具体实施方式
下面结合附图及实施例对本发明进行详细说明。
如图1、2、4,本发明助听系统的较佳实施例,适用于配戴在一位听力受损的使用者头部,以协助该使用者撷取讲话对象的语音讯号。该助听系统包含一个可供配戴于使用者头部的助听装置2,及一个与该助听装置2无线讯号连接而可遥控该助听装置2的遥控装置8。
该助听装置2包括一个供配戴于患者头部的载具3,及分别安装于该载具3的一个影像撷取器4、一个麦克风阵列单元5、一个微处理器6与两个声音输出器7。在本实施例中,该载具3是设计成眼镜型式,具有一个位于患者双眼前方且装设有镜片310的镜框状的前载体31,及两个左右间隔安装于该前载体31并供配挂于双耳的镜脚状的侧载体32。
该影像撷取器4是安装于该前载体31的中间区段处,可撷取使用者前方视野的影像,而输出一个视野影像40。
该麦克风阵列单元5包括多个麦克风51,麦克风51是左右成对地分别安装外露于两侧载体32,且前后间隔地分别沿侧载体32长度方向间隔设置,可分别感测周遭声音而输出一个声音讯号。实施时,麦克风可以采用指向性麦克风、全向性麦克风,或者是两种麦克风的组合。
该微处理器6是埋设固定于其中一个侧载体32中,且讯号连接于该影像撷取器4与麦克风51,包括一个影像分析模块61,及一个声音处理模块62。
该影像分析模块61可自该视野影像40中分析找出所有的人脸影像401,并进一步分析出人脸影像401分别相对于配戴此助听装置的使用者的距离与方位,及人脸影像401相对于使用者的左右偏转角度,并根据人脸影像401的距离、方位与偏转角度等参数,分析出人脸影像401作为讲话对象的可能性。该影像分析模块61包括一个距离分析单元611、一个方位分析单元612、一个偏转分析单元613、一个可能性分析单元614,及一个唇形分析单元615。
该距离分析单元611于分析人脸影像401相对于使用者的距离时,其内建有一般人脸影像在各种距离时的参考尺寸基准,会根据该参考尺寸基准来分析评估人脸影像401的尺寸所对应的距离,例如根据人脸影像401在该视野影像40中所占画素面积来进行尺寸分析,并对应输出人脸影像401的距离资料。但是实施时,分析计算出该视野影像40中的人脸影像401相对于该使用者的距离的方法众多,不以上述方法为限。
配合图5,该方位分析单元612于分析人脸影像401分别相对于该使用者的方位时,是以该视野影像40的左右向的视野中心402为基准,在已分析出人脸影像相对于使用者距离后,就可根据人脸影像相对于该视野中心402的左右间距,而进一步分析出人脸影像相对于该使用者视野中心的左右水平偏离夹角,如图5所示的θ1、θ2、θ3,而得出每一个人脸影像相对于使用者的方位,例如位于该视野中心402往右偏离30°处,并对应输出人脸影像401的方位资料。但是实施时,分析计算出该视野影像40中的人脸影像401相对于该视野中心402的方位的方法众多,不以上述方法为限。
该偏转分析单元613于分析人脸影像401的偏转角度时,主要是分析人脸影像401相对于使用者正面的左右偏转角度,并对应输出人脸影像401的偏转角度资料。
该可能性分析单元614内建有一个用于分析人脸影像401作为讲话对象的可能性的可能性分类基准,该可能性分类基准主要是参考一般人面对面进行讲话时的讲话习惯与礼仪,分别就人脸影像401相对于该使用者的距离远近、左右偏离角度大小,以及左右偏转角度大小设定有不同的运算权重比。
一般而言,人与人的讲话距离大致可区分为亲密距离、社交距离、礼仪距离与公共距离等四种,其中,亲密距离约在0.5公尺内,通常用于夫妻、情侣、父母、子女或知心好友等重要人物间;社交距离则在0.5~1.5公尺范围,伸手可握到对方的手,但是不易触碰到对方的身体;礼仪距离则大约在1.5~3公尺范围,适用于表示敬重,以及会议与仪式场合;公共距离则大于3公尺,适用于一般演讲者与听众间,以及不相识的人。基于此,越亲密或越重要的讲话对象通常会越接近使用者,且会越接近使用者的视野中心,同时会尽量面向使用者。
因此,该可能性分析单元614在分析人脸影像401作为讲话对象的可能性时,是以距离为优先考量,距离越近,可能性越高,然后再考量方位,越接近该视野中心402者,表示越接近使用者视野中心,作为谈话对象的可能性越高,最后,再考量人脸影像401的左右偏转角度,偏转角度越小者,表示该人脸影像401越是正面朝向使用者,作为谈话对象的可能性越高。此外,距离使用者越近的运算权重比越大,距离越远则相对越小;越接近该视野中心402,也就是越接近该使用者的视野中心者的运算权重比越大,越偏离该视野中心402的运算权重比越小;偏转角度越小,表示该人脸影像401越是正面面对使用者,其运算权重比越大,反之越小。
该可能性分析单元614于分析人脸影像401作为讲话对象的可能性时,会根据该可能性分类基准所设定的运算权重比,以及人脸影像401分别相对于使用者的距离、方位与偏转角度等参数,对人脸影像401进行作为讲话可能性的统计分析,并对应输出一个可能性讯号源分类,该可能性讯号源分类依据作为讲话对象的可能性高低,分设有多个不同可能性级别,例如最高可能性级别、中度可能性级别,及低可能性级别等,会将人脸影像401的各参数的运算权重比统计分析后,依据各可能性级别所设定的可能性门槛限制,以及人脸影像401的可能性分析结果,将人脸影像401分别分类于对应的可能性级别中。
该唇形分析单元615可于该可能性分析单元614分析输出该可能性讯号源分类后,对被分类有人脸影像401的可能性最高的级别中的所有人脸影像401进行唇形影像分析,嘴唇有开合变形就表示该人脸影像401可能是在讲话,并对应嘴唇有开合变形的每一个人脸影像401分别输出一个讲话讯号。例如先判断是否有人脸影像401被分类于最高可能性级别,若有,则对该最高可能性级别内的所有人脸影像401进行唇形影像分析,若无人脸影像401被分类于该最高可能性级别中,则接着判断是否有人脸影像401被分类于该中度可能性级别,若有,则对该中度可能性级别内的所有人脸影像401进行唇形分析。若中度可能性级别也无人脸影像401时,则停止判断,表示当下视野影像40中的所有人作为讲话对象的可能性非常低。
该声音处理模块62可接收处理麦克风51感测输出的声音讯号,例如进行模拟/数位转换、降噪处理等音源讯号常见的处理作业。该声音处理模块62包括一个语音触发单元621,及一个语音定位单元622。该语音触发单元621可接收分析麦克风51感测输出的使用者正面的声音讯号中是否含有语音讯号,若分析出含有语音讯号时,表示使用者正面有人在讲话,则触发启动该影像撷取器4开始撷取影像,并触发该影像分析模块61开始进行讲话对象的可能性分析。
该语音定位单元622会被该唇形分析单元615输出的所有讲话讯号驱动,而通过波束成型(beamforming)方法,撷取每一个讲话讯号所对应的人脸影像401的方位的声音讯号,也就是排除其他方位的声音讯号,然后,再进一步通过语音提取方法,自所得到的声音讯号中将不需要的噪音降噪滤除,并将语音讯号过滤放大输出,就可得到嘴唇有开合变形的人脸影像401的语音讯号,并将取得的所有语音讯号输出至声音输出器7。
由于通过波束成型(beamforming)方法撷取特定方位的声音讯号,以及自撷取的声音讯号中过滤出语音讯号,并对杂音进行降噪过滤处理等都是现有技术,且方法相当多,也非本发明的改良重点,因此不再详述。
声音输出器7为可供塞装于使用者耳中,可将该声音处理模块62撷取放大的语音讯号输出以供患者聆听。
该遥控装置8可通过无线通讯技术与该助听装置2进行无线通讯与资料传输,可接收显示该助听装置2的视野影像40,所述无线通讯可以是WiFi、ZigBee、NFC(近场通讯,NearField Communication)或蓝牙(Bluetooth)等,但是不以上述类型为限。
该遥控装置8包括一个用于显示所接收的该视野影像40的触控显示模块81,及一个遥控模块82。该触控显示模块81可供触控点选其显示的视野影像40中的人脸影像401,该遥控模块82会对应该触控显示模块81被点选的每一个人脸影像401产生一个点选讯号,该遥控装置8会将所有点选讯号无线发送至该助听装置2,以控制该助听装置2运作。
该语音定位单元622可被该遥控装置8所传送的每一个点选讯号驱动,而撷取放大输出各点选讯号所对应的人脸影像401的方位的语音讯号,并将语音讯号传送至声音输出器7输出。
该遥控装置8为一般常见的行动装置,例如智慧型手机、平板电脑或笔记型电脑等,该遥控模块82是以APP模式程式化建构于该遥控装置8,可于被启动时,使该遥控装置8与该助听装置2无线讯号连结。但是实施时,该遥控装置8类型不以上述行动装置类型为限,且该遥控模块82设置于该遥控装置的型式不以APP方式为限,也可通过电子元件与软体程式建构而成。
如图2、3、4所示,以下接着说明本发明助听系统的语音撷取方法的步骤:该语音撷取方法包含以下步骤:
(一)于使用者头部配设该助听装置2。将该眼镜型式的载具3配置于使用者头部,而当作一般眼镜使用,并将声音输出器7分别塞装于两耳中。
(二)分析辨识语音。当使用者正面无语音讯号的环境时,该影像撷取器4与该影像分析模块61不会运作,只该麦克风阵列单元5会持续感测周遭声音讯号,该语音触发单元621会持续接收分析声音讯号内容,当该语音触发单元621分析出来自使用者正面的声音讯号含有语音讯号时,该语音触发单元621便会触发启动该影像撷取器4与该影像分析模块61。
(三)该影像撷取器4被触发启动而撷取该使用者视野前方的视野影像40。
(四)分析视野影像40中的人脸影像401作为讲话对象的可能性。当该影像撷取器4开始撷取输出该视野影像40时,该影像分析模块61会开始分析该视野影像40,并于分析出该视野影像40中含有人脸影像401时,该距离分析单元611、该方位分析单元612与该偏转分析单元613会分别开始进一步分析每一个人脸影像401相对于使用者距离、方位与偏转角度。然后,该可能性分析单元614会根据该可能性分类基准,统计分析出该视野影像40中的所有人脸影像401作为讲话对象的可能性的可能性讯号源分类。
步骤(五)分析人脸影像401的嘴唇是否开合变形。在该可能性分析单元614分析输出该可能性讯号源分类后,该唇形分析单元615会接续分析被分类有人脸影像401的可能性最高的级别内的所有人脸影像401的嘴唇是否开合变形,并对应嘴唇有开合变形的人脸影像401分别输出一个讲话讯号。当无人脸影像401被分类于该高度可能性级别时,会接着分析该中度可能性级别的人脸影像401的嘴唇开合,以便撷取被分类于该中度可能性级别的人脸影像401方位的语音讯号。
步骤(六)过滤输出嘴唇有开合变形的人脸影像401的方位的语音讯号。该语音定位单元622会被该讲话讯号驱动,而通过波束成型方法过滤出该讲话讯号对应的人脸影像401的方位的语音讯号。
步骤(七)遥控点选预定收音的讲话对象。若使用者想要自己选择要聆听的讲话对象时,可启动该遥控装置8的遥控模块82,使该遥控装置8开始与该助听装置2配对连结,并接收显示出该助听装置2的该视野影像40,并使该遥控装置8于其显示的该视野影像40中的人脸影像401被点选时,对应被点选的该人脸影像401发送一个点选讯号至该助听装置2。
步骤(八)过滤输出被遥控点选的人脸影像401的方位的语音讯号。在该助听装置2与该遥控装置8讯号连结后,该助听装置2会优先接受该遥控装置8的控制。该声音处理模块62会被该点选讯号驱动,通过波束成型方法过滤出被点选的人脸影像401的方位的语音讯号,让使用者自己聆听自己选择的讲话对象的语音。使用者点选人脸影像401时,可点选多个,或者是以圈选方式圈选出一个区域范围内的多个人脸影像401,而可选择聆听多位讲话对象的讲话声。
通过上述语音撷取方法设计,可方便使用者自行选择要通过该影像分析模块61来分析出最可能为讲话对象的人脸影像401后,自动过滤输出前述最可能为讲话对象的人脸影像401方位的语音讯号,或者是要通过该遥控装置8自行点选要过滤输出的人脸影像401方位的语音讯号,可方便使用者根据当下讲话环境的需求,自行选择较合适的语音撷取方式,以准确获得欲进行对话的对象或欲聆听对象的语音讯号。
在本实施例中,该影像分析模块61于对影像撷取器4撷取的视野影像40中的人脸影像401分析输出该可能性讯号源分类后,会再进一步配合分析最高可能性级别或中度可能性级别内的人脸影像401的嘴唇是否开合变形的技术,使得该声音处理模块62可准确地撷取出可能正在讲话的人脸影像401的方位的语音讯号,而可大幅提高在多人环境中取得最可能是讲话对象的语音讯号的成功率。
但是实施时,并不以设置该唇形分析单元615为必要,也就是说,在分析输出该可能性讯号源分类后,不需再进行嘴唇变形分析,若有人脸影像401被分类于最高可能性级别,表示于该最高可能性级别中的这些对象都是相当重要的,为了避免遗漏某位对象的讲话内容,所以可改成直接撷取输出该最高可能性级别内的所有人脸影像401的方位的语音讯号,或者是在无人脸影像401被分类于最高可能性级别时,直接撷取输出该中度可能性级别的所有人脸影像401的方位的语音讯号,若所有人脸影像401都被分类于低可能性级别时,则不对人脸影像进行语音撷取,此时,该助听装置2可进入一般常见的全面性收音模式,或者是只撷取使用者前方的声音的指向性收音模式,由于此两模式为现有助听器收音技术,因此不再详述。
此外,实施时,在分析输出该可能性讯号源分类时,也可不考虑人脸左右偏转的偏转角度的运算权重比,只通过相对于使用者的距离与方位,就足以有效提高在多人环境中取得最可能为讲话对象的语音讯号的成功率。
再者,实施时,该影像撷取器4不以设置在该载具3的前载体31的左右向中心位置为必要,也可设置在该前载体31左右侧,或者是改设在该载具3的其它部位。
综上所述,通过该麦克风阵列单元5所能提供的波束成型技术,并以该影像撷取器4的视野影像40辅助判断最可能的讲话对象的设计,使得该助听装置2可通过该视野影像40中的每一个人脸影像401相对于使用者距离、方位与偏转角度,先自该视野影像40中分析出最可能为讲话对象的人脸影像401后,再进一步利用波束成型方法,过滤出最可能为讲话对象的人脸影像401的方位的语音讯号,可大幅提高在人群中成功撷取到讲话对象的语音的成功率,且可进一步配合辨识人脸影像401的嘴唇是否开合变形,更准确地自最可能为讲话对象的多位对象中过滤输出正在讲话者的语音讯号,可改善目前助听装置2使用上的缺点。并可进一步配合该遥控装置8可供使用者自行选择要撷取语音的对象的设计,可方便使用者通过点选显示于该触控显示模块81的视野影像40中的人脸影像401,选择有兴趣聆听的对象所在方位的语音,可明显提高助听系统的功能性与使用方便性,是一种创新的助听装置2与助听系统设计。因此,确实能达成本发明的目的。
Claims (13)
1.一种助听系统,包含一个助听装置,其特征在于:该助听装置包括一个能够撷取一位使用者前方的视野影像的影像撷取器、一个包括多个相间隔且能够撷取声音的麦克风的麦克风阵列单元、一个讯号连接于该影像撷取器与所述麦克风的微处理器,及至少一个讯号连接于该微处理器的声音输出器,该微处理器包括一个影像分析模块,及一个声音处理模块,该影像分析模块能够分析输出该视野影像中的所有人脸影像相对于该使用者的距离与方位,并根据所述人脸影像的距离和方位,对所述人脸影像作为讲话对象的可能性进行分类,而对应输出一个可能性讯号源分类,该可能性讯号源分类规划有多个分别具有不同可能性的级别,该声音处理模块能够根据被分类于一个可能性最高的级别内的所有人脸影像的方位,以及所述麦克风撷取的声音讯号,通过波束成型方法过滤出该可能性最高的级别内的所有人脸影像的方位的语音讯号,该声音输出器能够将该微处理器输出的语音讯号输出以供聆听。
2.如权利要求1所述的助听系统,其特征在于:该影像分析模块包括一个能够分析出该视野影像中的所述人脸影像相对于使用者的距离远近的距离分析单元、一个能够分析出所述人脸影像相对于使用者的方位的方位分析单元,及一个内建有一个可能性分类基准的可能性分析单元,该可能性分类基准内建有用于分析运算出该可能性讯号源分类时的人脸影像的距离与方位的运算权重比,该可能性分析单元是根据每一个人脸影像的距离与方位的运算权重比,分析统计输出该可能性讯号源分类。
3.如权利要求2所述的助听系统,其特征在于:该影像分析模块还包括一个能够分析出所述人脸影像相对使用者左右偏转的偏转角度的偏转分析单元,该可能性分类基准还内建有用于分析运算出该可能性讯号源分类时的偏转角度的运算权重比,且该影像分析模块的该可能性分析单元是根据所述人脸影像的距离、方位与偏转角度的运算权重比,分析统计输出关于所述人脸影像的该可能性讯号源分类。
4.如权利要求2或3所述的助听系统,其特征在于:该影像分析模块还包括一个唇形分析单元,该唇形分析单元能够分析一个分类有至少一个人脸影像且可能性最高的级别内的所有人脸影像的嘴唇是否有开合变形,且会对应每一个嘴唇有开合变形的人脸影像输出一个讲话讯号,该声音处理模块能够被该讲话讯号触发,而过滤出该讲话讯号对应的人脸影像的方位的语音讯号。
5.如权利要求2或3所述的助听系统,其特征在于:该声音处理模块包括一个能够于分析所述麦克风接收输出的声音讯号中含有语音讯号时,触发启动该影像撷取器开始撷取影像的语音触发单元。
6.如权利要求1所述的助听系统,其特征在于:该助听系统还包含一个能够配戴于使用者头部的载具,该载具包括一个左右延伸且位于使用者脸部前侧的前载体,及两个左右间隔地安装于该前载体并能够供配戴于双耳的侧载体,该影像撷取器是安装于该前载体,所述麦克风是分别安装于所述侧载体。
7.如权利要求6所述的助听系统,其特征在于:部分麦克风是左右间隔地安装于该前载体。
8.一种助听系统的语音撷取方法,其特征在于:该语音撷取方法包含以下步骤:(a)将一个助听装置配置于使用者身上,该助听装置包括一个影像撷取器与一个麦克风阵列单元,该麦克风阵列单元包括多个相间隔的麦克风;(b)以该影像撷取器撷取该使用者视野前方的视野影像;(c)使该助听装置自该视野影像中辨识出人脸影像,并判断出所述人脸影像分别相对于该使用者的距离与方位;(d)使该助听装置根据所述人脸影像分别相对于该使用者的距离与方位,对所述人脸影像作为讲话对象的可能性进行级别分类,而对应输出一个可能性讯号源分类;及(e)使该助听装置利用所述麦克风感测输出的声音讯号,并通过波束成型方法,将步骤(d)的可能性讯号源分类中被分类于一个最高可能性的级别内的所有人脸影像的方位的语音讯号过滤出来。
9.如权利要求8所述的助听系统的语音撷取方法,其特征在于:步骤(d)是使该助听装置根据人脸影像偏离该视野影像的一个视野中心的偏离角度来定义出相对该使用者的方位,且针对人脸影像相对于该使用者的距离大小,及方位分别给予不同的运算权重比,并根据所述人脸影像的距离与方位分别对应的运算权重比,分析统计输出关于所述人脸影像作为谈话对象的可能性的可能性讯号源分类。
10.如权利要求9所述的助听系统的语音撷取方法,其特征在于:步骤(c)还使该助听装置分析辨识所述人脸影像相对使用者左右偏转的偏转角度,步骤(d)是使该助听装置针对人脸影像的偏转角度大小分别给予不同的运算权重比,且根据每一个人脸影像的距离、方位与偏转角度分别对应的运算权重比,分析统计输出该可能性讯号源分类。
11.如权利要求8、9或10所述的助听系统的语音撷取方法,其特征在于:还包含一个步骤(f)使该助听装置分析一个分类有至少一个人脸影像且可能性最高的级别内的所有人脸影像的嘴唇是否有开合变形,并对应嘴唇有开合变形的人脸影像分别输出一个讲话讯号,步骤(e)是使该助听装置只输出该讲话讯号对应的人脸影像的方位的语音讯号。
12.如权利要求8所述的助听系统的语音撷取方法,其特征在于:步骤(b)该助听装置是于所述麦克风接收的声音讯号中含有语音讯号时,才启动该影像撷取器开始撷取影像。
13.如权利要求8所述的助听系统的语音撷取方法,其特征在于:步骤(a)的助听装置具有一个能够供配戴于使用者头部的载具,该助听装置是配置于使用者头部。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW102146946A TWI543635B (zh) | 2013-12-18 | 2013-12-18 | Speech Acquisition Method of Hearing Aid System and Hearing Aid System |
TW102146946 | 2013-12-18 | ||
CN201410252560.6A CN104735598B (zh) | 2013-12-18 | 2014-06-09 | 助听系统与助听系统的语音撷取方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410252560.6A Division CN104735598B (zh) | 2013-12-18 | 2014-06-09 | 助听系统与助听系统的语音撷取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108156568A true CN108156568A (zh) | 2018-06-12 |
CN108156568B CN108156568B (zh) | 2020-10-09 |
Family
ID=51982483
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810018272.2A Active CN108156568B (zh) | 2013-12-18 | 2014-06-09 | 助听系统与助听系统的语音撷取方法 |
CN201410252560.6A Active CN104735598B (zh) | 2013-12-18 | 2014-06-09 | 助听系统与助听系统的语音撷取方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410252560.6A Active CN104735598B (zh) | 2013-12-18 | 2014-06-09 | 助听系统与助听系统的语音撷取方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9491553B2 (zh) |
EP (1) | EP2887697B1 (zh) |
CN (2) | CN108156568B (zh) |
TW (1) | TWI543635B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109948586A (zh) * | 2019-03-29 | 2019-06-28 | 北京三快在线科技有限公司 | 人脸验证的方法、装置、设备及存储介质 |
CN111653281A (zh) * | 2019-02-05 | 2020-09-11 | 西万拓私人有限公司 | 用于对助听器的音频信号进行个性化信号处理的方法 |
CN112995846A (zh) * | 2019-12-16 | 2021-06-18 | 陈筱涵 | 注意力集中辅助系统 |
CN115211144A (zh) * | 2020-01-03 | 2022-10-18 | 奥康科技有限公司 | 助听器系统和方法 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102820032B (zh) * | 2012-08-15 | 2014-08-13 | 歌尔声学股份有限公司 | 一种语音识别系统和方法 |
US20150149169A1 (en) * | 2013-11-27 | 2015-05-28 | At&T Intellectual Property I, L.P. | Method and apparatus for providing mobile multimodal speech hearing aid |
US9881610B2 (en) * | 2014-11-13 | 2018-01-30 | International Business Machines Corporation | Speech recognition system adaptation based on non-acoustic attributes and face selection based on mouth motion using pixel intensities |
US9626001B2 (en) | 2014-11-13 | 2017-04-18 | International Business Machines Corporation | Speech recognition candidate selection based on non-acoustic input |
EP3038383A1 (en) * | 2014-12-23 | 2016-06-29 | Oticon A/s | Hearing device with image capture capabilities |
CN105976829B (zh) * | 2015-03-10 | 2021-08-20 | 松下知识产权经营株式会社 | 声音处理装置、声音处理方法 |
US10499164B2 (en) * | 2015-03-18 | 2019-12-03 | Lenovo (Singapore) Pte. Ltd. | Presentation of audio based on source |
EP3113505A1 (en) * | 2015-06-30 | 2017-01-04 | Essilor International (Compagnie Generale D'optique) | A head mounted audio acquisition module |
CN106817661A (zh) * | 2015-11-30 | 2017-06-09 | 深圳富泰宏精密工业有限公司 | 听力辅助系统及电子装置 |
JP6727825B2 (ja) * | 2016-02-02 | 2020-07-22 | キヤノン株式会社 | 音声処理装置および音声処理方法 |
US9584653B1 (en) * | 2016-04-10 | 2017-02-28 | Philip Scott Lyren | Smartphone with user interface to externally localize telephone calls |
US10075624B2 (en) | 2016-04-28 | 2018-09-11 | Bose Corporation | Wearable portable camera |
US10303929B2 (en) * | 2016-10-27 | 2019-05-28 | Bose Corporation | Facial recognition system |
US10372234B2 (en) * | 2017-05-09 | 2019-08-06 | Lenovo (Singapore) Pte Ltd | Calculating a social zone distance |
EP3422736B1 (en) * | 2017-06-30 | 2020-07-29 | GN Audio A/S | Pop noise reduction in headsets having multiple microphones |
CN109300475A (zh) * | 2017-07-25 | 2019-02-01 | 中国电信股份有限公司 | 麦克风阵列拾音方法和装置 |
CN107404682B (zh) * | 2017-08-10 | 2019-11-05 | 京东方科技集团股份有限公司 | 一种智能耳机 |
US11979716B2 (en) | 2018-10-15 | 2024-05-07 | Orcam Technologies Ltd. | Selectively conditioning audio signals based on an audioprint of an object |
CN113196803A (zh) | 2018-10-15 | 2021-07-30 | 奥康科技有限公司 | 助听器系统和方法 |
CN111314832A (zh) * | 2018-12-12 | 2020-06-19 | 智宇生医股份有限公司 | 穿戴式智能助听装置 |
JP2022514325A (ja) * | 2018-12-21 | 2022-02-10 | ジーエヌ ヒアリング エー/エス | 聴覚デバイスにおけるソース分離及び関連する方法 |
TWI768175B (zh) * | 2019-01-10 | 2022-06-21 | 陳筱涵 | 具收音場景切換功能的助聽系統 |
TWM579809U (zh) * | 2019-01-11 | 2019-06-21 | 陳筱涵 | Communication aid system for severely hearing impaired |
TWI745815B (zh) * | 2019-12-26 | 2021-11-11 | 陳筱涵 | 工安防噪耳機 |
WO2021154822A1 (en) | 2020-01-27 | 2021-08-05 | Starkey Laboratories, Inc. | Use of a camera for hearing device algorithm training |
CN111343554A (zh) * | 2020-03-02 | 2020-06-26 | 开放智能机器(上海)有限公司 | 一种视觉与语音结合的助听方法及系统 |
US11432067B2 (en) * | 2020-03-23 | 2022-08-30 | Orcam Technologies Ltd. | Cancelling noise in an open ear system |
CN111833899B (zh) * | 2020-07-27 | 2022-07-26 | 腾讯科技(深圳)有限公司 | 一种基于多音区的语音检测方法、相关装置及存储介质 |
TWI814651B (zh) * | 2022-11-25 | 2023-09-01 | 國立成功大學 | 整合影像、音訊定位與全方位收音陣列之具警示功能輔聽裝置與方法 |
CN116055972B (zh) * | 2023-03-07 | 2023-12-22 | 深圳市鑫正宇科技有限公司 | 一种助听器的信号处理系统及其方法 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5181248A (en) * | 1990-01-19 | 1993-01-19 | Sony Corporation | Acoustic signal reproducing apparatus |
US20030099370A1 (en) * | 2001-11-26 | 2003-05-29 | Moore Keith E. | Use of mouth position and mouth movement to filter noise from speech in a hearing aid |
CN1460185A (zh) * | 2001-03-30 | 2003-12-03 | 皇家菲利浦电子有限公司 | 用于音频/图像的说话者检测和定位的方法和装置 |
US20060104454A1 (en) * | 2004-11-17 | 2006-05-18 | Siemens Aktiengesellschaft | Method for selectively picking up a sound signal |
CN101300897A (zh) * | 2005-11-01 | 2008-11-05 | 皇家飞利浦电子股份有限公司 | 包括声音跟踪装置的助听器 |
US20100246831A1 (en) * | 2008-10-20 | 2010-09-30 | Jerry Mahabub | Audio spatialization and environment simulation |
US7860262B2 (en) * | 2002-06-14 | 2010-12-28 | Phonak Ag | Method to operate a hearing device and arrangement with a hearing device |
US20110019836A1 (en) * | 2008-03-27 | 2011-01-27 | Yamaha Corporation | Sound processing apparatus |
TW201120469A (en) * | 2009-12-04 | 2011-06-16 | Teco Elec & Machinery Co Ltd | Method, computer readable storage medium and system for localizing acoustic source |
CN102223594A (zh) * | 2010-04-19 | 2011-10-19 | 鸿富锦精密工业(深圳)有限公司 | 麦克风控制装置及方法 |
CN102298443A (zh) * | 2011-06-24 | 2011-12-28 | 华南理工大学 | 结合视频通道的智能家居语音控制系统及其控制方法 |
WO2012001928A1 (ja) * | 2010-06-30 | 2012-01-05 | パナソニック株式会社 | 会話検出装置、補聴器及び会話検出方法 |
CN102375537A (zh) * | 2010-08-09 | 2012-03-14 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
CN103098491A (zh) * | 2010-09-13 | 2013-05-08 | 三星电子株式会社 | 用于执行麦克风波束成型的方法和设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6964023B2 (en) * | 2001-02-05 | 2005-11-08 | International Business Machines Corporation | System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input |
US7760898B2 (en) * | 2003-10-09 | 2010-07-20 | Ip Venture, Inc. | Eyeglasses with hearing enhanced and other audio signal-generating capabilities |
WO2007070508A2 (en) * | 2005-12-13 | 2007-06-21 | Marcio Marc Abreu | Biologically fit wearable electronics apparatus and methods |
WO2011015673A2 (en) * | 2010-11-08 | 2011-02-10 | Advanced Bionics Ag | Hearing instrument and method of operating the same |
EP2503545A1 (en) * | 2011-03-21 | 2012-09-26 | Sony Ericsson Mobile Communications AB | Arrangement and method relating to audio recognition |
-
2013
- 2013-12-18 TW TW102146946A patent/TWI543635B/zh active
-
2014
- 2014-06-09 CN CN201810018272.2A patent/CN108156568B/zh active Active
- 2014-06-09 CN CN201410252560.6A patent/CN104735598B/zh active Active
- 2014-08-20 US US14/464,501 patent/US9491553B2/en active Active
- 2014-11-27 EP EP14195259.8A patent/EP2887697B1/en active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5181248A (en) * | 1990-01-19 | 1993-01-19 | Sony Corporation | Acoustic signal reproducing apparatus |
CN1460185A (zh) * | 2001-03-30 | 2003-12-03 | 皇家菲利浦电子有限公司 | 用于音频/图像的说话者检测和定位的方法和装置 |
US20030099370A1 (en) * | 2001-11-26 | 2003-05-29 | Moore Keith E. | Use of mouth position and mouth movement to filter noise from speech in a hearing aid |
US7860262B2 (en) * | 2002-06-14 | 2010-12-28 | Phonak Ag | Method to operate a hearing device and arrangement with a hearing device |
US20060104454A1 (en) * | 2004-11-17 | 2006-05-18 | Siemens Aktiengesellschaft | Method for selectively picking up a sound signal |
CN101300897A (zh) * | 2005-11-01 | 2008-11-05 | 皇家飞利浦电子股份有限公司 | 包括声音跟踪装置的助听器 |
US20110019836A1 (en) * | 2008-03-27 | 2011-01-27 | Yamaha Corporation | Sound processing apparatus |
US20100246831A1 (en) * | 2008-10-20 | 2010-09-30 | Jerry Mahabub | Audio spatialization and environment simulation |
TW201120469A (en) * | 2009-12-04 | 2011-06-16 | Teco Elec & Machinery Co Ltd | Method, computer readable storage medium and system for localizing acoustic source |
CN102223594A (zh) * | 2010-04-19 | 2011-10-19 | 鸿富锦精密工业(深圳)有限公司 | 麦克风控制装置及方法 |
WO2012001928A1 (ja) * | 2010-06-30 | 2012-01-05 | パナソニック株式会社 | 会話検出装置、補聴器及び会話検出方法 |
CN102375537A (zh) * | 2010-08-09 | 2012-03-14 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
CN103098491A (zh) * | 2010-09-13 | 2013-05-08 | 三星电子株式会社 | 用于执行麦克风波束成型的方法和设备 |
CN102298443A (zh) * | 2011-06-24 | 2011-12-28 | 华南理工大学 | 结合视频通道的智能家居语音控制系统及其控制方法 |
Non-Patent Citations (1)
Title |
---|
崔玮玮: "基于双麦克风的2维平面定位算法", 《信号处理》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111653281A (zh) * | 2019-02-05 | 2020-09-11 | 西万拓私人有限公司 | 用于对助听器的音频信号进行个性化信号处理的方法 |
CN109948586A (zh) * | 2019-03-29 | 2019-06-28 | 北京三快在线科技有限公司 | 人脸验证的方法、装置、设备及存储介质 |
CN109948586B (zh) * | 2019-03-29 | 2021-06-25 | 北京三快在线科技有限公司 | 人脸验证的方法、装置、设备及存储介质 |
CN112995846A (zh) * | 2019-12-16 | 2021-06-18 | 陈筱涵 | 注意力集中辅助系统 |
CN115211144A (zh) * | 2020-01-03 | 2022-10-18 | 奥康科技有限公司 | 助听器系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108156568B (zh) | 2020-10-09 |
EP2887697A2 (en) | 2015-06-24 |
TWI543635B (zh) | 2016-07-21 |
US9491553B2 (en) | 2016-11-08 |
EP2887697A3 (en) | 2015-07-01 |
EP2887697B1 (en) | 2017-12-20 |
CN104735598B (zh) | 2018-04-10 |
CN104735598A (zh) | 2015-06-24 |
US20150172830A1 (en) | 2015-06-18 |
TW201526667A (zh) | 2015-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104735598B (zh) | 助听系统与助听系统的语音撷取方法 | |
US10939193B1 (en) | In-ear detection method for a wireless earphone and a wireless earphone | |
CN101828410B (zh) | 用于无线听力辅助的方法和系统 | |
US20180227658A1 (en) | Headset | |
US20170347348A1 (en) | In-Ear Utility Device Having Information Sharing | |
EP3038383A1 (en) | Hearing device with image capture capabilities | |
US9838771B1 (en) | In-ear utility device having a humidity sensor | |
EP2882203A1 (en) | Hearing aid device for hands free communication | |
CN106464996A (zh) | 用于体育活动的多功能耳机系统 | |
US10045130B2 (en) | In-ear utility device having voice recognition | |
WO2014161309A1 (zh) | 一种移动终端实现声源定位的方法及装置 | |
CN106535027A (zh) | 监测降噪耳机降噪效果的装置和可调节降噪效果的主动降噪耳机 | |
US11689869B2 (en) | Hearing device configured to utilize non-audio information to process audio signals | |
CN105997448B (zh) | 频域投影式超声回波定位导盲仪 | |
CN205584434U (zh) | 一种智能耳机 | |
CN114141230A (zh) | 电子设备及其语音识别方法和介质 | |
US20170347183A1 (en) | In-Ear Utility Device Having Dual Microphones | |
CN107894705A (zh) | 儿童电话手表及基于面部识别分析儿童遇险的方法 | |
JP6290827B2 (ja) | オーディオ信号を処理する方法及び補聴器システム | |
CN111435574A (zh) | 用于重度听障者的沟通辅具系统 | |
CN111429928A (zh) | 具收音场景切换功能的助听系统 | |
TWI725668B (zh) | 注意力集中輔助系統 | |
US11526034B1 (en) | Eyewear with flexible audio and advanced functions | |
CN205830022U (zh) | 头戴式助听器 | |
TW202231077A (zh) | 助聽裝置及用於助聽裝置之聲源擬真處理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |