CN112188341B - 一种耳机唤醒方法、装置、耳机及介质 - Google Patents
一种耳机唤醒方法、装置、耳机及介质 Download PDFInfo
- Publication number
- CN112188341B CN112188341B CN202011017276.2A CN202011017276A CN112188341B CN 112188341 B CN112188341 B CN 112188341B CN 202011017276 A CN202011017276 A CN 202011017276A CN 112188341 B CN112188341 B CN 112188341B
- Authority
- CN
- China
- Prior art keywords
- angle
- earphone
- sound source
- microphone
- wake
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000002618 waking effect Effects 0.000 claims abstract description 20
- 238000005516 engineering process Methods 0.000 claims description 12
- 230000005855 radiation Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 4
- 210000000988 bone and bone Anatomy 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1041—Mechanical or electronic switches, or control elements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
- H04R29/002—Loudspeaker arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
- H04R29/005—Microphone arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/10—Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Headphones And Earphones (AREA)
Abstract
本发明公开了一种耳机唤醒的方法、装置、耳机及介质。其中,方法包括:当监测到预设唤醒词时,计算第一耳机的第一麦克和第二麦克风连线与所述唤醒词的声源位置和所述第一麦克风连线的夹角作为第一声源角度,并判断所述第一声源角度是否是第一目标角度;若是,则计算第二耳机的第一麦克风和和第二麦克风连线与所述声源位置和所述第一麦克风连线的夹角作为所述第二耳机对应的第二声源角度,并判断所述第二声源角度是否为第二目标角度;若是,则判断所述第一目标角度与所述第二目标角度是否符合预设角度关系;若是,则唤醒所述第一耳机和所述第二耳机。本发明实施例解决了耳机配戴者唤醒耳机的问题,提高耳机根据佩戴者语音进行唤醒的准确度。
Description
技术领域
本发明实施例涉及信息处理领域,尤其涉及一种耳机唤醒的方法、装置、耳机及介质。
背景技术
随着语音技术发展,无线耳机设备的语音功能日渐普及,越来越多用户使用耳机接听电话、听音乐、看视频,使得无线耳机的使用给用户的生活带来了极大地便利,无线耳机语音唤醒功能使用户使用耳机操作更加便捷。
目前,对无线耳机语音唤醒,通常是在耳机端额外增加骨传导加速度器,通过骨传导加速度传感器识别佩戴者语音,从而语音唤醒无线耳机。或者,采用声纹识别方法识别用户声音进行耳机的唤醒。
但是,通过耳机端额外增加骨传导加速度器的方式语音唤醒耳机,耳机成本高,且当耳机佩戴者在说话的同时,旁边有人发出唤醒词也会造成误唤醒,影响用户体验。而声纹识别的方法需要使用者多次录入相关的语音注册佩戴者的声纹,过程较为繁琐,同样影响用户体验。
发明内容
本发明提供一种耳机唤醒的方法、装置、耳机及介质,以实现提高耳机根据佩戴者语音进行唤醒的准确度,提升用户体验感。
第一方面,本发明实施例提供了一种耳机唤醒方法,包括:
当监测到预设唤醒词时,计算第一耳机的第一麦克和第二麦克风连线与所述唤醒词的声源位置和所述第一麦克风连线的夹角作为第一声源角度,并判断所述第一声源角度是否是第一目标角度;
若是,则计算第二耳机的第一麦克风和和第二麦克风连线与所述声源位置和所述第一麦克风连线的夹角作为所述第二耳机对应的第二声源角度,并判断所述第二声源角度是否为第二目标角度;
若是,则判断所述第一目标角度与所述第二目标角度是否符合预设角度关系;
若是,则唤醒所述第一耳机和所述第二耳机;
其中,所述第一耳机是主控耳机,所述第二耳机是副耳机,所述第一麦克风是耳机上距离耳道近的麦克风,所述第二麦克风是所述耳机上距离耳道远的麦克风。
可选的,所述判断所述第一目标角度与所述第二目标角度是否符合预设角度关系,包括:
判断所述第一目标角度和所述第二目标角度的角度差值是否小于第一预设差值。
可选的,判断所述第一声源角度是否是第一目标角度,包括:
判断所述第一声源角度是否在预设角度的角度范围内,所述预设角度范围辐射区域对应着耳机佩戴者嘴部区域。
可选的,判断所述第二声源角度是否为第一目标角度,包括:
判断所述第二声源角度是否在所述预设角度的角度范围内。
可选的,在计算第二耳机对应的第二声源角度之前,包括:通过双耳协商机制建立第一耳机与第二耳机之间的通信连接。
可选的,计算第一耳机对应的第一声源角度以及获取第二耳机对应的第二声源角度,包括:
通过声音时间差的声源定位技术获取第一声源角度和第二声源角度以及获取第二耳机对应的第二声源角度。
第二方面,本发明实施例还提供了一种耳机唤醒装置,该装置包括:
第一目标角度判断模块:用于当监测到预设唤醒词时,获取第一耳机对应的第一声源角度,并判断所述第一声源角度是否是第一目标角度;
第二目标角度判断模块:用于当所述第一声源位置是第一目标角度时,获取第二耳机对应的第二声源角度,根据所述第二声源角度判断第二目标角度;
唤醒模块:用于判断所述第一目标角度与所述第二目标角度是否符合预设角度关系,当所述第一目标角度与所述第二目标角度符合预设条件,唤醒所述第一耳机和第二耳机;其中,所述第一耳机是主控耳机,所述第二耳机是副耳机。
可选的,所述唤醒模块,用于判断所述第一目标角度和所述第二目标角度的角度差值是否小于预设差值。
第三方面,本发明实施例还提供了一种耳机,所述耳机包括:
第一麦克风和第二麦克风,用于监测并采集唤醒数据;
蓝牙芯片以及存储在所述蓝牙芯片上并被所述蓝牙芯片执行的耳机唤醒程序,其中,所述耳机唤醒程序被蓝牙芯片执行时,实现如本发明任意实施例提供的耳机唤醒方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例提供的耳机唤醒方法。
本发明实施例通过当监测到预设唤醒词时,判断所述第一声源角度是否是第一目标角度,若是,并判断所述第二声源角度是否为第二目标角度,若是,则判断所述第一目标角度与所述第二目标角度是否符合预设角度关系,若是,则唤醒所述第一耳机和所述第二耳机,解决耳机佩戴者准确唤醒所佩戴耳机的问题,实现提高耳机根据佩戴者语音进行唤醒的准确度,提升用户体验感。
附图说明
图1是本发明实施例一中的一种耳机唤醒方法的流程图;
图2是本发明实施例二中的一种耳机唤醒方法的流程图;
图3是本发明实施例三中的一种耳机唤醒装置功能模块示意图;
图4是本发明实施例四中的一种耳机结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种耳机唤醒方法的流程图,本实施例可适用于耳机佩戴者准确唤醒耳机的情况,该方法可以由耳机唤醒装置来执行,具体包括如下步骤:
S110、当监测到预设唤醒词时,计算第一耳机的第一麦克和第二麦克风连线与所述唤醒词的声源位置和所述第一麦克风连线的夹角作为第一声源角度,并判断所述第一声源角度是否是第一目标角度。
其中,预设唤醒词可以是提前存储在耳机、云端或手机中质量较高的唤醒词。质量较高的唤醒词可以是音节覆盖尽量多,相邻音节尽量要规避,唤醒词还可以是通过大量的实验经过验证得到的唤醒词。第一耳机是主控耳机,第二耳机是副耳机,主控耳机和副耳机是动态设定的,通常初始状态下默认右耳机是主控耳机,例如,初始状态下右耳机是主控耳机,当出现右耳机的电量低于左耳机的电量时,自动调整左耳为主控耳机。每一个耳机上都有两个麦克风,其中,第一麦克风是耳机上距离耳道近的麦克风,第二麦克风是耳机上距离耳道远的麦克风。
唤醒词的声源位置可以是耳机佩戴者发出唤醒词的声源位置,也可以是耳机能够检测到非耳机佩戴者发出唤醒词的声源位置。第一声源角度可以是第一耳机的第一麦克和第二麦克风连线与唤醒词的声源位置和第一麦克风连线之间的夹角,还可以是第一耳机的第一麦克和第二麦克风连线的中点位置与唤醒词的声源位置的连线和该中点与第二麦克风的连线之间的夹角。第一目标角度是满足判断条件的角度,判断条件可以是通过判断角度值以及角度在预设范围内,例如,角度的预设范围可以耳机佩戴者发出唤醒词时对应着的声源区域。
具体的,耳机的第一麦克风和第二麦克风在监测到该耳机对应的唤醒词时,第一耳机通过基于麦克风阵列的声源定位方法计算对应的第一声源角度,其中,基于麦克风阵列的声源定位方法包括,基于最大输出功率的可控波束形成技术、基于高分辨率谱图估计技术和基于声音时间差(time-delay estimation,TDE)的声源定位技术。
在一个实施例中,当耳机第一麦克风和第二麦克风监测到预设唤醒词时,第一耳机通过麦克风声源定位方法计算出第一耳机的第一麦克和第二麦克风连线与唤醒词的声源位置和第一麦克风连线的夹角,并判断出该夹角是否满足第一目标角度判断条件,如果该夹角不满足第一目标角度判断条件,则说明是非耳机佩戴者发出唤醒词,则无法唤醒耳机,继续监测预设唤醒词。例如当非耳机佩戴者在耳机佩戴者的右侧发出唤醒词,第一耳机监测到唤醒词后,计算第一耳机的第一麦克和第二麦克风连线与唤醒词的声源位置和第一麦克风连线的夹角,该夹角不属于预设角度范围,可以确定是非耳机佩戴者本人发出的唤醒词,因此,无法唤醒耳机语音助手,第一麦克风和第二麦克风继续监测预设唤醒词。
S120、若第一声源角度是第一目标角度,则计算第二耳机的第一麦克风和和第二麦克风连线与所述声源位置和所述第一麦克风连线的夹角作为所述第二耳机对应的第二声源角度,并判断所述第二声源角度是否为第二目标角度。
其中,第二声源角度可以是第二耳机的第一麦克风和第二麦克风连线与声源位置和第一麦克风连线的夹角,还可以是第二耳机的第一麦克和第二麦克风连线的中点位置与唤醒词的声源位置的连线和该中点与第二麦克风的连线之间的夹角。第二目标角度可以是满足判断条件的角度,判断条件可以是通过判断角度值以及角度在预设范围内。
具体的,当第一声源角度满足第一目标角度的判断条件时,计算第二声源角度,判断第二声源角度是否满足第二目标角度的条件。
示例性的,当耳机第一麦克风和第二麦克风检测到正确佩戴该耳机的用户发出唤醒该耳机的预设唤醒词,第一耳机通过麦克风声源定位方法计算出第一耳机的第一麦克和第二麦克风连线与所述唤醒词的声源位置和所述第一麦克风连线的夹角,则会判断出该夹角满足第一目标角度判断条件,第一耳机与第二耳机建立通信,然后计算第二声源角度,判断第二声源角度是否满足第二目标角度的条件。
S130、若第二声源角度是第二目标角度,则判断所述第一目标角度与所述第二目标角度是否符合预设角度关系。
其中,预设角度关系可以是第一目标角度与第二目标角度之间的角度差值小于预设角度值范围内,且符合预设角度关系的夹角满足对称分布。
具体的,当第二声源角度满足第二目标角度的判断条件是,根据预设角度关系条件,判断第一目标角度和第二目标角度是否满足预设条件。
S140、若第一目标角度与第二目标角度符合预设角度关系,则唤醒所述第一耳机和所述第二耳机。
具体的,当第一目标角度和第二目标角度满足预设角度关系,则唤醒将第一耳机和第二耳机唤醒。
示例性的,一个用户正确佩戴耳机发出唤醒词“启动”,用户佩戴的第一耳机和第二耳机检测到“启动”唤醒词时,首先通过计算第一耳机对应的第一声源角度,得到第一声源角度为30度,预设角度范围25度至35度,第一声源角度在预设角度范围内,则第一声源角度是第一目标角度,其次,计算第二耳机对应的第二声源角度,得到第二声源角度为30.6度,通过判断,第二声源角度在预设角度范围内,则第二声源角度是第二目标角度,第一目标角度与第二目标角度之间的夹角差值为0.6,预设夹角差值为0至1.3,该差值在预设条件范围内,同时,第一耳机的第一麦克和第二麦克风连线与唤醒词的声源位置和第一耳机第一麦克风连线的夹角,与第二耳机的第一麦克和第二麦克风连线与唤醒词的声源位置和第二耳机第一麦克风连线的夹角,符合对称分布,则唤醒第一耳机和第二耳机。
本实施例的技术方案,通过耳机麦克风监测唤醒词,当第一耳机对应的第一声源角度是第一目标角度,计算第二耳机对应的第二声源角度,并判断第二声源角度是否是第二目标角度,若是,则判断第一目标角度与第二目标角度是否符合预设角度关系,若是,则唤醒第一耳机和第二耳机,解决了耳机误唤醒的问题,提高可耳机根据佩戴者语音进行唤醒的准确度,提升用户体验感。
实施例二
图2为本发明实施例二提供的一种耳机唤醒方法的流程图,在上述实施例的基础上进行了细化,确认耳机唤醒的情况,该方法具体包括如下步骤:
S210、当监测到预设唤醒词时,计算第一耳机的第一麦克和第二麦克风连线与所述唤醒词的声源位置和所述第一麦克风连线的夹角作为第一声源角度,并判断所述第一声源角度是否在预设角度的角度范围内,所述预设角度范围辐射区域对应着耳机佩戴者嘴部区域。
其中,预设角度的角度范围可以是第一麦克风和该佩戴者嘴部区域任一位置连线与第一麦克风和第二麦克风连线的夹角范围。
具体的,当第一麦克风和第二麦克风监测到预设唤醒词时,计算第一耳机的第一麦克风和第二麦克风连线与所述唤醒词的声源位置和所述第一麦克风连线的夹角,并判断该夹角是否在耳机佩戴者嘴部区域范围内。
例如,当非耳机佩戴者、耳机正确佩戴者发出预设唤醒词,计算唤醒词的声源位置和所述第一麦克风连线与第一耳机的第一麦克风和第二麦克风连线的夹角,判断该夹角是否在第一麦克风和正确佩戴耳机用户嘴部区域任一位置连线与第一麦克风和第二麦克风连线的夹角范围内。
S220、当所述第一声源角度是第一目标角度时,计算第二耳机对应的所述第二声源角度,判断所述第二声源角度是否在所述预设角度的角度范围内。
具体的,当第一声源角度满足第一目标角度的判断条件时,计算第二声源角度,判断第二声源角度是否在第一麦克风和正确佩戴耳机用户嘴部区域任一位置连线与第一麦克风和第二麦克风连线的夹角范围内。
S230、若所述第二声源角度在所述预设角度的角度范围内,则判断所述第一目标角度和所述第二目标角度的角度差值是否小于第一预设差值。
其中,第一预设差值是预先设定的角度差值,该角度差值可以是通过多次试验得到的数值。
S240、若所述第一目标角度和所述第二目标角度的角度差值小于第一预设差值,则唤醒所述第一耳机和所述第二耳机。
具体的,如果第一耳机对应的第一目标角度和第二耳机对应的第二目标角度之间的角度差值符合设定的预设差值,将对应的第一耳机和第二耳机被唤醒。
示例性的,当预设差值是0.5度,计算第一耳机对应的第一目标角度和第二耳机对应的第二目标角度之间的角度差,判断角度差值是否小于预设差值0.5度。如果小于预设角度差值0.5度,则唤醒对应的第一耳机和第二耳机,如果大于预设角度差值0.5度,则耳机麦克风继续监测预设唤醒词。
在一个实施例中,当监测到非耳机佩戴者发出唤醒词,计算唤醒词的声源位置和所述第一麦克风连线与第一耳机的第一麦克风和第二麦克风连线的夹角,经过判断该夹角不在第一麦克风连线和正确佩戴耳机用户嘴部区域任一位置连线与第一麦克风和第二麦克风连线的夹角范围内,耳机麦克风继续监测预设唤醒词。
在一个实施例中,当监测到耳机佩戴者发出唤醒词,计算唤醒词的声源位置和第一耳机的第一麦克风连线与第一耳机的第一麦克风和第二麦克风连线的夹角(第一声源角度),经过判断该夹角在第一麦克风连线和正确佩戴耳机用户嘴部区域任一位置连线与第一麦克风和第二麦克风连线的夹角范围内,然后计算唤醒词的声源位置和第二耳机的第一麦克风连线与第一耳机的第一麦克风和第二麦克风连线的夹角,经过判断该夹角(第二声源角度)在第一麦克风连线和正确佩戴耳机用户嘴部区域任一位置连线与第一麦克风和第二麦克风连线的夹角范围内,最后判断第一声源角度与第二声源角度之间的角度差在预设差值范围内,则唤醒第一耳机和第二耳机。
可选的,计算第一耳机对应的第一声源角度以及获取第二耳机对应的第二声源角度,包括:通过声音时间差的声源定位技术获取第一声源角度和第二声源角度以及获取第二耳机对应的第二声源角度。
其中,声源定位技术可以是基于最大输出功率的可控波束形成技术、基于高分辨率谱图估计技术和基于声音时间差(time-delay estimation,TDE)的声源定位技术。
本实施例的技术方案,通过耳机麦克风监测唤醒词,首先,采用声音时间差的声源定位技术计算第一耳机对应的第一声源角度,判断第一声源角度是否在耳机佩戴者嘴部区域对应的预设角度的角度范围内,若是则第一声源角度是第一目标角度,然后采用声音时间差的声源定位技术计算第二耳机对应的第二声源角度,并判断第二声源角度是否在耳机佩戴者嘴部区域对应的预设角度的角度范围内,若是,则第二声源角度是第二目标角度,然后,判断第一目标角度与第二目标角度之间的角度差是否符合预设角度关系,若是,最后,唤醒第一耳机和第二耳机,解决了耳机误唤醒的问题,提高可耳机根据佩戴者语音进行唤醒的准确度,提升用户体验感。
实施例三
图3是本发明实施例三中的一种耳机唤醒装置功能模块示意图,本发明实施例提供了一种耳机唤醒装置,包括:第一目标角度判断模块310、第二目标角度判断模块320和唤醒模块330。
其中,第一目标角度判断模块310用于当监测到预设唤醒词时,获取第一耳机对应的第一声源角度,并判断所述第一声源角度是否是第一目标角度;第二目标角度判断模块320用于当所述第一声源位置是第一目标角度时,获取第二耳机对应的第二声源角度,根据所述第二声源角度判断第二目标角度;唤醒模块330用于判断所述第一目标角度与所述第二目标角度是否符合预设角度关系,当所述第一目标角度与所述第二目标角度符合预设条件,唤醒所述第一耳机和第二耳机;其中,所述第一耳机是主控耳机,所述第二耳机是副耳机。
本实施例的技术方案,通过耳机麦克风监测唤醒词,首先,采用声音时间差的声源定位技术计算第一耳机对应的第一声源角度,判断第一声源角度是否在耳机佩戴者嘴部区域对应的预设角度的角度范围内,若是则第一声源角度是第一目标角度,然后采用声音时间差的声源定位技术计算第二耳机对应的第二声源角度,并判断第二声源角度是否在耳机佩戴者嘴部区域对应的预设角度的角度范围内,若是,则第二声源角度是第二目标角度,然后,判断第一目标角度与第二目标角度之间的角度差是否符合预设角度关系,若是,最后,唤醒第一耳机和第二耳机,解决了耳机误唤醒的问题,提高可耳机根据佩戴者语音进行唤醒的准确度,提升用户体验感。
可选的,唤醒模块330,用于判断所述第一目标角度和所述第二目标角度的角度差值是否小于第一预设差值。
可选的,第一目标角度判断模块310,用于判断所述第一声源角度是否在预设角度的角度范围内,所述预设角度范围辐射区域对应着耳机佩戴者嘴部区域。
可选的,第二目标角度判断模块320,用于判断所述第二声源角度是否在所述预设角度的角度范围内。
可选的,在第二目标角度判断模块320之前,用于通过双耳协商机制建立第一耳机与第二耳机之间的通信连接。
可选的,第一目标角度判断模块310和第二目标角度判断模块320,用于通过声音时间差的声源定位技术获取第一声源角度和第二声源角度以及获取第二耳机对应的第二声源角度。
上述产品可执行本发明任意实施例所提供的耳机唤醒方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四中的一种耳机结构示意图,本实施例可适用于耳机佩戴者本人发出唤醒词唤醒耳机的情况,该耳机至少包括以下结构:
第一麦克风1和第二麦克风2,以及蓝牙芯片3,其中第一麦克风1和第二麦克风2用于监测唤醒词信号,蓝牙芯片3用于根据采集的唤醒词信号判断该唤醒词是否是耳机佩戴者发出的唤醒词,从而唤醒第一耳机和第二耳机。
本发明实施例提供了一种耳机结构示意图,但不限于耳机结构,如图4所示,通过第一麦克风1和第二麦克风2监测唤醒词,首先,蓝牙芯片2计算第一耳机的第一声源角度,即计算第一耳机的第一麦克风1和第二麦克风2连线与所述唤醒词的声源位置和所述第一麦克风1连线的夹角,并判断第一声源角度是否在预设角度的角度范围内,其中,预设角度范围辐射区域对应着耳机佩戴者嘴部区域,如果第一声源角度在预设角度的角度范围内,则第一声源角度是第一目标角度,然后,计算第二耳机对应的第二声源角度,即计算第二耳机的第一麦克风1和和第二麦克风2连线与所述声源位置和第一麦克风1连线的夹角,并判断第二声源角度是否在预设角度的角度范围内,如果第二声源角度在预设角度的角度范围内,则第二声源角度是第二目标角度,最后判断第一目标角度和第二目标角度的角度差值是否小于第一预设差值,如果小于第一预设差值,则唤醒第一耳机和第二耳机。
上述产品可执行本发明任意实施例所提供的耳机唤醒方法,具备执行方法相应的功能模块和有益效果。
实施例五
本实施例五提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的耳机唤醒方法,该方法包括:
当监测到预设唤醒词时,计算第一耳机的第一麦克和第二麦克风连线与所述唤醒词的声源位置和所述第一麦克风连线的夹角作为第一声源角度,并判断所述第一声源角度是否是第一目标角度;
若是,则计算第二耳机的第一麦克风和和第二麦克风连线与所述声源位置和所述第一麦克风连线的夹角作为所述第二耳机对应的第二声源角度,并判断所述第二声源角度是否为第二目标角度;
若是,则判断所述第一目标角度与所述第二目标角度是否符合预设角度关系;
若是,则唤醒所述第一耳机和所述第二耳机;
其中,所述第一耳机是主控耳机,所述第二耳机是副耳机,所述第一麦克风是耳机上距离耳道近的麦克风,所述第二麦克风是所述耳机上距离耳道远的麦克风。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种耳机唤醒方法,其特征在于,包括:
当监测到预设唤醒词时,计算第一耳机的第一麦克风和第二麦克风连线与所述唤醒词的声源位置和所述第一麦克风连线的夹角作为第一声源角度,并判断所述第一声源角度是否是第一目标角度;
若是,则计算第二耳机的第一麦克风和和第二麦克风连线与所述声源位置和所述第一麦克风连线的夹角作为所述第二耳机对应的第二声源角度,并判断所述第二声源角度是否为第二目标角度;
若是,则判断所述第一目标角度与所述第二目标角度是否符合预设角度关系;
若是,则唤醒所述第一耳机和所述第二耳机;
其中,所述第一耳机是主控耳机,所述第二耳机是副耳机,所述第一麦克风是耳机上距离耳道近的麦克风,所述第二麦克风是所述耳机上距离耳道远的麦克风。
2.根据权利要求1所述的方法,其特征在于,所述判断所述第一目标角度与所述第二目标角度是否符合预设角度关系,包括:
判断所述第一目标角度和所述第二目标角度的角度差值是否小于第一预设差值。
3.根据权利要求1所述的方法,其特征在于,判断所述第一声源角度是否是第一目标角度,包括:
判断所述第一声源角度是否在预设角度范围内,所述预设角度范围辐射区域对应着耳机佩戴者嘴部区域。
4.根据权利要求3所述的方法,其特征在于,所述判断所述第二声源角度是否为第二目标角度,包括:
判断所述第二声源角度是否在所述预设角度的角度范围内。
5.根据权利要求1所述的方法,其特征在于,在计算第二耳机对应的第二声源角度之前,包括:
通过双耳协商机制建立第一耳机与第二耳机之间的通信连接。
6.根据权利要求1所述的方法,其特征在于,计算第一耳机对应的第一声源角度以及获取第二耳机对应的第二声源角度,包括:
通过声音时间差的声源定位技术获取第一声源角度和第二耳机对应的第二声源角度。
7.一种耳机唤醒装置,其特征在于,包括:
第一目标角度判断模块:用于当监测到预设唤醒词时,获取第一耳机对应的第一声源角度,并判断所述第一声源角度是否是第一目标角度,其中,所述第一声源角度为所述第一耳机的第一麦克风和第二麦克风连线与所述唤醒词的声源位置和所述第一麦克风连线的夹角;
第二目标角度判断模块:用于当所述第一声源角度是第一目标角度时,获取第二耳机对应的第二声源角度,并判断所述第二声源角度是否为第二目标角度,其中,所述第二声源角度为所述第二耳机的第一麦克风和和第二麦克风连线与所述声源位置和所述第一麦克风连线的夹角;
唤醒模块:用于判断所述第一目标角度与所述第二目标角度是否符合预设角度关系,当所述第一目标角度与所述第二目标角度符合预设条件,唤醒所述第一耳机和第二耳机;其中,所述第一耳机是主控耳机,所述第二耳机是副耳机。
8.根据权利要求7所述的装置,其特征在于,所述唤醒模块,用于判断所述第一目标角度和所述第二目标角度的角度差值是否小于预设差值。
9.一种耳机,其特征在于,包括:
第一麦克风和第二麦克风,用于监测并采集唤醒数据;
蓝牙芯片以及存储在所述蓝牙芯片上并被所述蓝牙芯片执行的耳机唤醒程序,其中,所述耳机唤醒程序被蓝牙芯片执行时,实现如权利要求1-6中任一所述的耳机唤醒方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的耳机唤醒方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011017276.2A CN112188341B (zh) | 2020-09-24 | 2020-09-24 | 一种耳机唤醒方法、装置、耳机及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011017276.2A CN112188341B (zh) | 2020-09-24 | 2020-09-24 | 一种耳机唤醒方法、装置、耳机及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112188341A CN112188341A (zh) | 2021-01-05 |
CN112188341B true CN112188341B (zh) | 2024-03-12 |
Family
ID=73955528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011017276.2A Active CN112188341B (zh) | 2020-09-24 | 2020-09-24 | 一种耳机唤醒方法、装置、耳机及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112188341B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113225662B (zh) * | 2021-05-28 | 2022-04-29 | 杭州国芯科技股份有限公司 | 一种带G-sensor的TWS耳机唤醒测试方法 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104967726A (zh) * | 2015-04-30 | 2015-10-07 | 努比亚技术有限公司 | 语音指令处理方法和装置、移动终端 |
CN105120059A (zh) * | 2015-07-07 | 2015-12-02 | 惠州Tcl移动通信有限公司 | 移动终端及其根据呼吸强弱控制耳机通话降噪的方法 |
CN106847298A (zh) * | 2017-02-24 | 2017-06-13 | 海信集团有限公司 | 一种基于弥漫式语音交互的拾音方法和装置 |
CN107132508A (zh) * | 2017-04-26 | 2017-09-05 | 杭州仁盈科技股份有限公司 | 声源定位方法和装置 |
TW201740744A (zh) * | 2016-05-11 | 2017-11-16 | 宏達國際電子股份有限公司 | 穿戴式電子裝置、虛擬實境系統以及控制方法 |
CN107577449A (zh) * | 2017-09-04 | 2018-01-12 | 百度在线网络技术(北京)有限公司 | 唤醒语音的拾取方法、装置、设备及存储介质 |
CN107948792A (zh) * | 2017-12-07 | 2018-04-20 | 歌尔科技有限公司 | 左右声道确定方法及耳机设备 |
WO2018149074A1 (zh) * | 2017-02-14 | 2018-08-23 | 歌尔股份有限公司 | 降噪耳机以及电子设备 |
CN108648756A (zh) * | 2018-05-21 | 2018-10-12 | 百度在线网络技术(北京)有限公司 | 语音交互方法、装置和系统 |
CN109461449A (zh) * | 2018-12-29 | 2019-03-12 | 苏州思必驰信息科技有限公司 | 用于智能设备的语音唤醒方法及系统 |
CN109710080A (zh) * | 2019-01-25 | 2019-05-03 | 华为技术有限公司 | 一种屏幕控制和语音控制方法及电子设备 |
CN110089130A (zh) * | 2016-11-09 | 2019-08-02 | 伯斯有限公司 | 两用双边麦克风阵列 |
CN110830870A (zh) * | 2019-11-26 | 2020-02-21 | 北京声加科技有限公司 | 一种基于传声器技术的耳机佩戴者语音活动检测系统 |
CN111508515A (zh) * | 2013-12-18 | 2020-08-07 | 思睿逻辑国际半导体有限公司 | 话音命令触发的语音增强 |
CN111599361A (zh) * | 2020-05-14 | 2020-08-28 | 宁波奥克斯电气股份有限公司 | 一种唤醒方法、装置、计算机存储介质及空调器 |
CN111630876A (zh) * | 2019-01-07 | 2020-09-04 | 深圳声临奇境人工智能有限公司 | 音频设备和音频处理方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9282399B2 (en) * | 2014-02-26 | 2016-03-08 | Qualcomm Incorporated | Listen to people you recognize |
US10529331B2 (en) * | 2017-12-12 | 2020-01-07 | Intel Corporation | Suppressing key phrase detection in generated audio using self-trigger detector |
-
2020
- 2020-09-24 CN CN202011017276.2A patent/CN112188341B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111508515A (zh) * | 2013-12-18 | 2020-08-07 | 思睿逻辑国际半导体有限公司 | 话音命令触发的语音增强 |
CN104967726A (zh) * | 2015-04-30 | 2015-10-07 | 努比亚技术有限公司 | 语音指令处理方法和装置、移动终端 |
CN105120059A (zh) * | 2015-07-07 | 2015-12-02 | 惠州Tcl移动通信有限公司 | 移动终端及其根据呼吸强弱控制耳机通话降噪的方法 |
TW201740744A (zh) * | 2016-05-11 | 2017-11-16 | 宏達國際電子股份有限公司 | 穿戴式電子裝置、虛擬實境系統以及控制方法 |
CN110089130A (zh) * | 2016-11-09 | 2019-08-02 | 伯斯有限公司 | 两用双边麦克风阵列 |
WO2018149074A1 (zh) * | 2017-02-14 | 2018-08-23 | 歌尔股份有限公司 | 降噪耳机以及电子设备 |
CN106847298A (zh) * | 2017-02-24 | 2017-06-13 | 海信集团有限公司 | 一种基于弥漫式语音交互的拾音方法和装置 |
CN107132508A (zh) * | 2017-04-26 | 2017-09-05 | 杭州仁盈科技股份有限公司 | 声源定位方法和装置 |
CN107577449A (zh) * | 2017-09-04 | 2018-01-12 | 百度在线网络技术(北京)有限公司 | 唤醒语音的拾取方法、装置、设备及存储介质 |
CN107948792A (zh) * | 2017-12-07 | 2018-04-20 | 歌尔科技有限公司 | 左右声道确定方法及耳机设备 |
CN108648756A (zh) * | 2018-05-21 | 2018-10-12 | 百度在线网络技术(北京)有限公司 | 语音交互方法、装置和系统 |
CN109461449A (zh) * | 2018-12-29 | 2019-03-12 | 苏州思必驰信息科技有限公司 | 用于智能设备的语音唤醒方法及系统 |
CN111630876A (zh) * | 2019-01-07 | 2020-09-04 | 深圳声临奇境人工智能有限公司 | 音频设备和音频处理方法 |
CN109710080A (zh) * | 2019-01-25 | 2019-05-03 | 华为技术有限公司 | 一种屏幕控制和语音控制方法及电子设备 |
CN110830870A (zh) * | 2019-11-26 | 2020-02-21 | 北京声加科技有限公司 | 一种基于传声器技术的耳机佩戴者语音活动检测系统 |
CN111599361A (zh) * | 2020-05-14 | 2020-08-28 | 宁波奥克斯电气股份有限公司 | 一种唤醒方法、装置、计算机存储介质及空调器 |
Non-Patent Citations (3)
Title |
---|
Chanwoo Kim等.Two-microphone source separation algorithm based on statistical modeling of angle distributions.《International Conference on Acoustics,Speech,and Signal Processing》.2012,全文. * |
智能眼镜的设计与功能研究;梁佳博;《中国优秀硕士学位论文全文数据库-信息科技辑》;20180615;全文 * |
智能语音唤醒信息生活;曹祎遐;《上海信息化》;20190310;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112188341A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11294619B2 (en) | Earphone software and hardware | |
US11412333B2 (en) | Interactive system for hearing devices | |
US8781142B2 (en) | Selective acoustic enhancement of ambient sound | |
US9271077B2 (en) | Method and system for directional enhancement of sound using small microphone arrays | |
WO2020228095A1 (zh) | 实时语音唤醒的音频设备、运行方法、装置及存储介质 | |
CN111447539A (zh) | 一种用于听力耳机的验配方法和装置 | |
US20220261468A1 (en) | Ear-based biometric identification | |
US11523231B2 (en) | Methods and systems for assessing insertion position of hearing instrument | |
CN116324969A (zh) | 具有定位反馈的听力增强和可穿戴系统 | |
CN109308900B (zh) | 耳机装置、语音处理系统和语音处理方法 | |
WO2022199405A1 (zh) | 一种语音控制方法和装置 | |
US20220272465A1 (en) | Hearing device comprising a stress evaluator | |
CN112188341B (zh) | 一种耳机唤醒方法、装置、耳机及介质 | |
CN111800699A (zh) | 音量调节提示方法、装置、耳机设备及存储介质 | |
US20220295192A1 (en) | System comprising a computer program, hearing device, and stress evaluation device | |
US20220192541A1 (en) | Hearing assessment using a hearing instrument | |
KR20180018649A (ko) | 청각 장애인용 알림 서비스 제공 넥밴드 | |
CN114302278A (zh) | 耳机佩戴校准方法、电子设备及计算机可读存储介质 | |
CN114745624A (zh) | 无线耳机寻找方法、装置、耳机及存储介质 | |
CN112130664A (zh) | 智能降噪方法、智能唤醒方法及使用该方法的装置 | |
WO2022254834A1 (ja) | 信号処理装置、信号処理方法およびプログラム | |
WO2023193686A1 (zh) | 用于听力辅助设备的监控方法和装置 | |
CN112147801B (zh) | 骨传导发声辅助系统、方法、设备及存储介质 | |
US11968519B2 (en) | Directional audio provision system | |
US10867619B1 (en) | User voice detection based on acoustic near field |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |