CN114420160A - 处理音频信号的方法和装置 - Google Patents
处理音频信号的方法和装置 Download PDFInfo
- Publication number
- CN114420160A CN114420160A CN202011175531.6A CN202011175531A CN114420160A CN 114420160 A CN114420160 A CN 114420160A CN 202011175531 A CN202011175531 A CN 202011175531A CN 114420160 A CN114420160 A CN 114420160A
- Authority
- CN
- China
- Prior art keywords
- user
- audio signal
- sound
- comfort level
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 124
- 238000012545 processing Methods 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 title claims abstract description 94
- 230000015654 memory Effects 0.000 claims description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 25
- 230000009467 reduction Effects 0.000 claims description 24
- 238000010586 diagram Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 6
- 230000036541 health Effects 0.000 abstract description 25
- 230000007613 environmental effect Effects 0.000 description 47
- 238000004891 communication Methods 0.000 description 40
- 230000006854 communication Effects 0.000 description 40
- 230000006870 function Effects 0.000 description 35
- 239000010410 layer Substances 0.000 description 27
- 238000007726 management method Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 16
- 238000010295 mobile communication Methods 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 13
- 238000012544 monitoring process Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 230000002829 reductive effect Effects 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 229910052760 oxygen Inorganic materials 0.000 description 6
- 239000001301 oxygen Substances 0.000 description 6
- 238000013186 photoplethysmography Methods 0.000 description 6
- 230000008878 coupling Effects 0.000 description 5
- 238000010168 coupling process Methods 0.000 description 5
- 238000005859 coupling reaction Methods 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 230000036772 blood pressure Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 210000001367 artery Anatomy 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000003449 preventive effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000011514 reflex Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- 208000007443 Neurasthenia Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 206010003549 asthenia Diseases 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Telephone Function (AREA)
Abstract
本申请提供了一种处理音频信号的方法和装置。该方法包括:获取用户所处环境的音频信号;当所述音频信号的持续时长大于等于时间阈值时,并且,当所述音频信号满足以下两个条件中的一个或两个时,减小拾音频率;条件一为所述音频信号的音量小于等于音量阈值,条件二为所述音频信号的频率处于健康频段内。上述方法可以由智能手表执行。若环境声音满足上述两个条件中一个或两个,则智能手表可以提示用户减小拾音频率,从而可以在不影响用户健康的前提下减小环境声音检测的功耗。
Description
技术领域
本申请涉及电子技术领域,尤其涉及一种处理音频信号的方法和装置。
背景技术
环境声音指的是用户所处的环境中所有声源发出的声音的集合,例如,当用户站在街道上时,汽车轮胎的摩擦声、行人的交谈声、以及店铺的广告声共同构成了环境声音。环境声音对用户的健康存在重要影响,当用户长期暴露于高音量的环境声音中时,听力系统会受到不可逆的损伤。
一种保护用户健康的方法是通过智能手表监测环境声音的音量,当该音量超过临界值时,提示用户当前环境声音的音量,以便于用户进行防护处理。为了保证用户的健康,环境声音的监测功能需要长时间开启,然而智能手表的续航能力有限,如何减小监测环境声音的功耗是当前需要解决的问题。
发明内容
本申请提供了一种处理音频信号的方法,通过对用户所处环境的音频信号进行进行检测分析,根据音频信号的持续时长、音量、频率等改变智能手表等穿戴设备的拾音频率,从而有效降低智能手表等穿戴设备在监测环境声音中的功耗。在此基础上,本申请还提供了一种基于用户生理信息对环境声音进行评测的方法,以便于用户选择舒适的环境,以及,基于环境声音的声源识别的听力改善交互方案。
第一方面,提供了一种处理音频信号的方法,包括:获取用户所处环境的音频信号;当所述音频信号的持续时长大于等于时间阈值时,并且,当所述音频信号满足以下两个条件中的一个或两个时,减小拾音频率;所述音频信号的音量小于等于音量阈值,所述音频信号的频率处于健康频段内。
上述方法可以由智能手表执行。当环境声音的音量在一段时间内小于等于音量阈值时,说明环境声音的音量在未来一段时间内有较大的概率小于音量阈值;当环境声音的频率在一段时间内处于健康频段时,说明环境声音的频率在未来一段时间内有较大的概率处于健康频段。因此,若环境声音满足上述两个条件中一个或两个,则智能手表可以提示用户减小拾音频率,从而可以在不影响用户健康的前提下减小环境声音检测的功耗。
可选地,所述减小拾音频率,包括:提示所述用户减小拾音频率;接收所述用户输入的控制信息,所述控制信息用于减小拾音频率;根据所述控制信息减小拾音频率。
当需要减小拾音频率时,智能手表可以通过文字或声音提示用户选择是否减小拾音频率;当用户选择减小拾音频率时,智能手表基于用户的选择减小拾音频率,可以满足用户的个性化需求。
可选地,所述方法还包括:显示所述音频信号的音量和/或频率随时间变换的特征图。
智能手表可以显示不同时间周期的检测记录,例如,可以显示每日的环境声音频率值或音量值,也可以显示每周的环境声音频率值或音量值,还可以显示每月的环境声音频率值或音量值,从而可以便于用户针对性地做好听力预防措施。
可选地,还包括:获取所述用户的实时生理信息,所述实时生理信息的获取时间与所述音频信号的获取时间相同;根据所述实时生理信息与预设生理信息的差值确定所述音频信号对应的第一舒适度,其中,所述第一舒适度与所述差值负相关。
上述实时生理信息可以是心率值、血氧含量或血压值。以实时生理信息为心率值为例,当智能手表实时采集到的心率值与预设心率值的差值较大时,说明用户的心率值偏离健康心率值的程度较大,可以确定用户的舒适度较差,即,音频信号对应的第一舒适度较差;当智能手表实时采集到的心率值与预设心率值的差值较小时,说明用户的心率值与健康心率值较为接近,可以确定用户的舒适度较好,即,音频信号对应的第一舒适度较好。因此,应用上述方案可以在用户在未出现严重生理反应时提示及时更换环境,维护用户健康。
可选地,还包括:获取所述用户输入的第一指示信息,所述第一指示信息用于指示所述音频信号的第二舒适度;根据所述第二舒适度训练舒适度算法,以使所述第一舒适度与所述第二舒适度相同,其中,所述舒适度算法用于确定所述第一舒适度。
不同用户对环境声音的忍耐度不同,智能手表可以提示用户对当前的环境声音的舒适度进行评价,基于用户的评价确定不同舒适度对应的预设生理信息,可以做出更加符合用户个体特征的决策。
可选地,所述方法还包括:播放多种声音,所述多种声音的音量和频率不同;获取所述用户输入的第二指示信息,所述第二指示信息用于指示所述多种声音对应的第三舒适度;根据所述第三舒适度训练所述舒适度算法,所述舒适度算法用于确定所述第一舒适度。
上述实施例利用主动播放的声音确定用户对不同声音的感受,即,确定第三舒适度。相比于利用环境声音训练舒适度算法,本实施例能够提供种类更加丰富的声音,由用户主动、快速训练舒适度算法,迅速提高舒适度算法的性能。
可选地,还包括:当所述音频信号的频段处于有害频段内时,提示所述用户进行防护处理。
音频信号的频率过低或者过高也会对用户的健康造成负面影响,智能手表可以对音频信号的频段进行检测,以便于在收到有害频段的环境声音时提示用户进行防护处理。
可选地,还包括:当所述音频信号为多个声源的混合信号时,提示所述用户从所述多个声源中选择待处理的声源;获取所述用户输入的第三指示信息,所述第三指示信息用于指示所述待处理的声源;获取所述用户输入的第四指示信息,所述第四指示信息用于指示所述待处理的声源的处理方式,所述处理方式包括降噪处理或增强处理;根据所述第三指示信息和所述第四指示信息对所述待处理的声源对应的音频信号进行降噪处理或增强处理。
智能手表获取的音频信号通常是多个声源的混合信号,智能手表可以通过神经网络或其它分析方法确定该混合信号对应的多个声源,并提示用户选择待处理的声源。若用户需要获取该多个声源中的特定声源,可以通过第三指示信息和第四指示信息指示该特定声源的声音需要增强,或者,可以通过第三指示信息和第四指示信息指示除该特定声源之外的声源发出的声音需要降噪。因此,本实施例可以基于用户的需要对音频信号进行处理,增强用户的体验感。
可选地,所述方法还包括:当所述待处理的声源与所述处理方式不匹配时,提示所述用户确认所述待处理的声源与所述处理方式是否正确。
待处理的声源例如是现场会议中的讲话声,通常情况下,用户对讲话声的处理方式都是增强处理,智能手表或者手机可以确定讲话声与增强处理是匹配的,当用户选择了讲话声和降噪处理时,智能手表或者手机可以确定待处理的声源与处理方式不匹配,提示用户确认选择的待处理的声源与处理方式是否正确,从而可以避免用户的错误选择。
可选地,所述获取用户所处环境的音频信号,包括:通过多个物联网设备获取所述音频信号。
上述多个物联网设备可以是蓝牙音箱、手机、智能电视和摄像头。通过多个物联网设备获取音频信号能够预测用户周边的音频环境,提醒用户尽早做好防范措施。
第二方面,提供了另一种处理音频信号的方法,包括:获取用户所处环境的音频信号;获取所述用户的实时生理信息,所述实时生理信息的获取时间与所述音频信号的获取时间相同;根据预设生理信息与所述实时生理信息的差值确定所述音频信号对应的第一舒适度,其中,所述第一舒适度与所述差值负相关。
可选地,还包括:获取所述用户输入的第一指示信息,所述第一指示信息用于指示所述音频信号对应的第二舒适度;根据所述第二舒适度训练舒适度算法,所述舒适度算法用于确定所述第一舒适度。
可选地,还包括:播放多种声音,所述多种声音的音量和频率不同;获取所述用户输入的第二指示信息,所述第二指示信息用于指示所述多种声音对应的第三舒适度;根据所述噪音阈值和所述有害频段训练所述舒适度算法,所述舒适度算法用于确定所述第一舒适度。
可选地,还包括:当所述音频信号的持续时长大于等于时间阈值时,并且,当所述音频信号满足以下两个条件中的一个或两个时,减小拾音频率;所述音频信号的音量小于等于音量阈值,所述音频信号的频率处于健康频段内。
可选地,还包括:当所述音频信号的音量大于所述音量阈值时,增大拾音频率。
可选地,还包括:当所述音频信号的频段处于有害频段内时,提示所述用户进行防护处理。
可选地,还包括:当所述音频信号为多个声源的混合信号时,提示所述用户从所述多个声源中选择待处理的声源;获取所述用户输入的第三指示信息,所述第三指示信息用于指示所述待处理的声源;获取所述用户输入的第四指示信息,所述第四指示信息用于指示所述待处理的声源的处理方式,所述处理方式包括降噪处理或增强处理;根据所述第三指示信息和所述第四指示信息对所述待处理的声源对应的音频信号进行降噪处理和/或增强处理。
可选地,所述方法还包括:当所述待处理的声源与所述处理方式不匹配时,提示所述用户确认所述待处理的声源与所述处理方式是否正确。
可选地,所述获取用户所处环境的音频信号,包括:通过多个物联网设备获取所述音频信号。
第三方面,本申请提供了一种处理音频信号的装置,包括用于执行第一方面所述的方法的单元。该装置可以是终端设备,也可以是终端设备内的芯片。该装置可以包括输入单元和处理单元。该处理单元可以是处理器,该输入单元可以是通信接口;该终端设备还可以包括存储单元,该存储单元可以是存储器;该存储单元用于存储指令,该处理单元执行该存储单元所存储的指令,以使该终端设备执行第一方面所述的方法。
第四方面,本申请提供了一种处理音频信号的装置,包括用于执行第二方面所述的方法的单元。该装置可以是终端设备,也可以是终端设备内的芯片。该装置可以包括输入单元和处理单元。该处理单元可以是处理器,该输入单元可以是通信接口;该终端设备还可以包括存储单元,该存储单元可以是存储器;该存储单元用于存储指令,该处理单元执行该存储单元所存储的指令,以使该终端设备执行第二方面所述的方法。
第五方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质中存储了计算机程序,该计算机程序被处理器执行时,使得处理器执行第一方面所述的方法。
第六方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质中存储了计算机程序,该计算机程序被处理器执行时,使得处理器执行第二方面所述的方法。
第七方面,本申请提供了一种计算机程序产品,该计算机程序产品包括:计算机程序代码,当该计算机程序代码被处理器运行时,使得处理器执行第一方面所述的方法。
第八方面,本申请提供了一种计算机程序产品,该计算机程序产品包括:计算机程序代码,当该计算机程序代码被处理器运行时,使得处理器执行第二方面所述的方法。
附图说明
图1是本申请提供的一种处理音频信号的装置的硬件系统的示意图;
图2是本申请提供的一种处理音频信号的装置的软件系统的示意图;
图3是本申请提供的一种处理音频信号的应用场景的示意图;
图4是本申请提供的一种一种监测环境声音的方法的示意图;
图5是本申请提供的另一种处理音频信号的应用场景的示意图;
图6是本申请提供的一种处理音频信号的方法的示意图;
图7是本申请提供的一种开启节能拾音功能的手机界面的示意图;
图8是本申请提供的一种用户设置阈值的手机界面的示意图;
图9是本申请提供的一种提示用户进行防护的手机界面的示意图;
图10是本申请提供的另一种处理音频信号的方法的示意图;
图11是本申请提供的一种预测舒适度的手机界面的示意图;
图12是本申请提供的一种改善用户听力环境的手机界面的示意图;
图13是本申请提供的一种提示用户确认音频信号的处理方法的手机界面的示意图;
图14是本申请提供的另一种处理音频信号的装置的结构示意图。
具体实施方式
下面将结合附图,对本申请实施例中的技术方案进行描述。
图1示出了一种适用于本申请的装置的硬件结构,该装置用于获取用户所处环境的音频信号。
如图1所示,装置100可以是手机、智慧屏、平板电脑、可穿戴电子设备、车载电子设备、增强现实(augmented reality,AR)设备、虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)、投影仪等等,本申请实施例对装置100的具体类型不作任何限制。
装置100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,光电容积描记(photo plethysmograph,PPG)传感器180M等。
需要说明的是,图1所示的结构并不构成对装置100的具体限定。在本申请另一些实施例中,装置100可以包括比图1所示的部件更多或更少的部件,或者,装置100可以包括图1所示的部件中某些部件的组合,或者,装置100可以包括图1所示的部件中某些部件的子部件。图1示的部件可以以硬件、软件、或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元。例如,处理器110可以包括以下处理单元中的至少一个:应用处理器(application processor,AP)、调制解调处理器、图形处理器(graphics processing unit,GPU)、图像信号处理器(image signal processor,ISP)、控制器、视频编解码器、数字信号处理器(digital signal processor,DSP)、基带处理器、神经网络处理器(neural-network processing unit,NPU)。其中,不同的处理单元可以是独立的器件,也可以是集成的器件。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。例如,处理器110可以包括以下接口中的至少一个:内部集成电路(inter-integrated circuit,I2C)接口、内部集成电路音频(inter-integrated circuit sound,I2S)接口、脉冲编码调制(pulse codemodulation,PCM)接口、通用异步接收传输器(universal asynchronous receiver/transmitter,UART)接口、移动产业处理器接口(mobile industry processor interface,MIPI)、通用输入输出(general-purpose input/output,GPIO)接口、SIM接口、USB接口。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K、充电器、闪光灯、摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现装置100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194和摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI)、显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现装置100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现装置100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号接口,也可被配置为数据信号接口。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194、无线通信模块160、音频模块170和传感器模块180。GPIO接口还可以被配置为I2C接口、I2S接口、UART接口或MIPI接口。
USB接口130是符合USB标准规范的接口,例如可以是迷你(Mini)USB接口、微型(Micro)USB接口或C型USB(USB Type C)接口。USB接口130可以用于连接充电器为装置100充电,也可以用于装置100与外围设备之间传输数据,还可以用于连接耳机以通过耳机播放音频。USB接口130还可以用于连接其他装置100,例如AR设备。
图1所示的各模块间的连接关系只是示意性说明,并不构成对装置100的各模块间的连接关系的限定。可选地,装置100的各模块也可以采用上述实施例中多种连接方式的组合。
充电管理模块140用于从充电器接收电力。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的电流。在一些无线充电的实施例中,充电管理模块140可以通过装置100的无线充电线圈接收电磁波(电流路径如虚线所示)。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为装置100供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量、电池循环次数和电池健康状态(例如,漏电、阻抗)等参数。可选地,电源管理模块141可以设置于处理器110中,或者,电源管理模块141和充电管理模块140可以设置于同一个器件中。
装置100的无线通信功能可以通过天线1、天线2、移动通信模块150、无线通信模块160、调制解调处理器以及基带处理器等器件实现。
天线1和天线2用于发射和接收电磁波信号。装置100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在装置100上的无线通信的解决方案,例如下列方案中的至少一个:第二代(2th generation,2G)移动通信解决方案、第三代(3thgeneration,3G)移动通信解决方案、第四代(4th generation,5G)移动通信解决方案、第五代(5th generation,5G)移动通信解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波和放大等处理,随后传送至调制解调处理器进行解调。移动通信模块150还可以放大经调制解调处理器调制后的信号,放大后的该信号经天线1转变为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(例如,扬声器170A、受话器170B)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
与移动通信模块150类似,无线通信模块160也可以提供应用在装置100上的无线通信解决方案,例如下列方案中的至少一个:无线局域网(wireless local areanetworks,WLAN)、蓝牙(bluetooth,BT)、全球导航卫星系统(global navigationsatellite system,GNSS)、调频(frequency modulation,FM)、近场通信(near fieldcommunication,NFC)、红外(infrared,IR)。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,并将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频和放大,该信号经天线2转变为电磁波辐射出去。
在一些实施例中,装置100的天线1和移动通信模块150耦合,装置100的天线2和无线通信模块160耦合。
装置100可以通过GPU、显示屏194以及应用处理器实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194可以用于显示图像或视频。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD)、有机发光二极管(organic light-emitting diode,OLED)、有源矩阵有机发光二极体(active-matrix organic light-emitting diode,AMOLED)、柔性发光二极管(flex light-emitting diode,FLED)、迷你发光二极管(mini light-emitting diode,Mini LED)、微型发光二极管(micro light-emitting diode,Micro LED)、微型OLED(Micro OLED)或量子点发光二极管(quantum dotlight emitting diodes,QLED)。在一些实施例中,装置100可以包括1个或N个显示屏194,N为大于1的正整数。
装置100可以通过ISP、摄像头193、视频编解码器、GPU、显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP可以对图像的噪点、亮度和色彩进行算法优化,ISP还可以优化拍摄场景的曝光和色温等参数。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的红绿蓝(red green blue,RGB),YUV等格式的图像信号。在一些实施例中,装置100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当装置100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。装置100可以支持一种或多种视频编解码器。这样,装置100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1、MPEG2、MPEG3和MPEG4。
NPU是一种借鉴生物神经网络结构的处理器,例如借鉴人脑神经元之间传递模式对输入信息快速处理,还可以不断地自学习。通过NPU可以实现装置100的智能认知等功能,例如:图像识别、人脸识别、语音识别和文本理解。
外部存储器接口120可以用于连接外部存储卡,例如安全数码(secure digital,SD)卡,实现扩展装置100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能(例如,声音播放功能和图像播放功能)所需的应用程序。存储数据区可存储装置100使用过程中所创建的数据(例如,音频数据和电话本)。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如:至少一个磁盘存储器件、闪存器件和通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令和/或存储在设置于处理器中的存储器的指令,执行装置100的各种处理方法。
装置100可以通过音频模块170、扬声器170A、受话器170B、麦克风170C、耳机接口170D以及应用处理器等实现音频功能,例如,音乐播放和录音。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也可以用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170或者音频模块170的部分功能模块可以设置于处理器110中。
扬声器170A,也称为喇叭,用于将音频电信号转换为声音信号。装置100可以通过扬声器170A收听音乐或免提通话。
受话器170B,也称为听筒,用于将音频电信号转换成声音信号。当用户使用装置100接听电话或语音信息时,可以通过将受话器170B靠近耳朵接听语音。
麦克风170C,也称为话筒或传声器,用于将声音信号转换为电信号。当用户拨打电话或发送语音信息时,可以通过靠近麦克风170C发声将声音信号输入麦克风170C。装置100可以设置至少一个麦克风170C。在另一些实施例中,装置100可以设置两个麦克风170C,以实现降噪功能。在另一些实施例中,装置100还可以设置三个、四个或更多麦克风170C,以实现识别声音来源和定向录音等功能。处理器110可以对麦克风170C输出的电信号进行处理,例如,音频模块170与无线通信模块160可以通过PCM接口耦合,麦克风170C将环境声音转换为电信号(如PCM信号)后,通过PCM接口将该电信号传输至处理器110;从处理器110对该电信号进行音量分析和频率分析,确定环境声音的音量和频率。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动装置100平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,例如可以是电阻式压力传感器、电感式压力传感器或电容式压力传感器。电容式压力传感器可以是包括至少两个具有导电材料的平行板,当力作用于压力传感器180A,电极之间的电容改变,装置100根据电容的变化确定压力的强度。当触摸操作作用于显示屏194时,装置100根据压力传感器180A检测所述触摸操作。装置100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令;当触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定装置100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定装置100围绕三个轴(即,x轴、y轴和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。例如,当快门被按下时,陀螺仪传感器180B检测装置100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消装置100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航和体感游戏等场景。
气压传感器180C用于测量气压。在一些实施例中,装置100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。装置100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当装置100是翻盖机时,装置100可以根据磁传感器180D检测翻盖的开合。装置100可以根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测装置100在各个方向上(一般为x轴、y轴和z轴)加速度的大小。当装置100静止时可检测出重力的大小及方向。加速度传感器180E还可以用于识别装置100的姿态,作为横竖屏切换和计步器等应用程序的输入参数。
距离传感器180F用于测量距离。装置100可以通过红外或激光测量距离。在一些实施例中,例如在拍摄场景中,装置100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(light-emitting diode,LED)和光检测器,例如,光电二极管。LED可以是红外LED。装置100通过LED向外发射红外光。装置100使用光电二极管检测来自附近物体的红外反射光。当检测到反射光时,装置100可以确定附近存在物体。当检测不到反射光时,装置100可以确定附近没有物体。装置100可以利用接近光传感器180G检测用户是否手持装置100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式或口袋模式的自动解锁与自动锁屏。
环境光传感器180L用于感知环境光亮度。装置100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测装置100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。装置100可以利用采集的指纹特性实现解锁、访问应用锁、拍照和接听来电等功能。
温度传感器180J用于检测温度。在一些实施例中,装置100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,装置100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,装置100对电池142加热,以避免低温导致装置100异常关机。在其他一些实施例中,当温度低于又一阈值时,装置100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称为触控器件。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,触摸屏也称为触控屏。触摸传感器180K用于检测作用于其上或其附近的触摸操作。触摸传感器180K可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于装置100的表面,并且与显示屏194设置于不同的位置。
PPG传感器180M能够利用光电技术测量用户的心率和血氧。在一些实施例中,PPG传感器180M发射一束绿光,该绿光是穿透皮肤进入活体组织后部分光子被吸收,另外部分光子会被反射出去被光子接收器获取到,其中,肌肉、骨骼、静脉等组织对光子的吸收是基本不变的,受血管收缩和扩张的影响,动脉对光子的吸收会发生变化。因此,光子接收器会收到两种光信号,一种是肌肉、骨骼、静脉等组织反射的直流光信号,另一种是动脉反射的交流光信号。PPG传感器180M将光信号转换为电信号后输入处理器110,处理器110根据交流光信号转换的电信号可以确定用户的心率值。处理器110还可以基于PPG传感器180M输出的电信号确定用户的血氧值。
按键190包括开机键和音量键。按键190可以是机械按键,也可以是触摸式按键。装置100可以接收按键输入信号,实现于案件输入信号相关的功能。
马达191可以产生振动。马达191可以用于来电提示,也可以用于触摸反馈。马达191可以对作用于不同应用程序的触摸操作产生不同的振动反馈效果。对于作用于显示屏194的不同区域的触摸操作,马达191也可产生不同的振动反馈效果。不同的应用场景(例如,时间提醒、接收信息、闹钟和游戏)可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态和电量变化,也可以用于指示消息、未接来电和通知。
SIM卡接口195用于连接SIM卡。SIM卡可以插入SIM卡接口195实现与装置100的接触,也可以从SIM卡接口195拔出实现与装置100的分离。装置100可以支持1个或N个SIM卡接口,N为大于1的正整数。同一个SIM卡接口195可以同时插入多张卡,所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容外部存储卡。装置100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,装置100采用嵌入式SIM(embedded-SIM,eSIM)卡,eSIM卡可以嵌在装置100中,不能和装置100分离。
上文详细描述了装置100的硬件系统,下面介绍装置100的软件系统。软件系统可以采用分层架构、事件驱动架构、微核架构、微服务架构或云架构,本申请实施例以分层架构为例,示例性地描述装置100的软件系统。
如图2所示,采用分层架构的软件系统分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,软件系统可以分为四层,从上至下分别为应用程序层、应用程序框架层、安卓运行时(Android Runtime)和系统库、以及内核层。
应用程序层可以包括相机、图库、日历、通话、地图、导航、WLAN、蓝牙、音乐、视频、短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用程序编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层可以包括一些预定义的函数。
例如,应用程序框架层包括窗口管理器、内容提供器、视图系统、电话管理器、资源管理器和通知管理器。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏、锁定屏幕和截取屏幕。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频、图像、音频、拨打和接听的电话、浏览历史和书签、以及电话簿。
视图系统包括可视控件,例如显示文字的控件和显示图片的控件。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成,例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供装置100的通信功能,例如通话状态(接通或挂断)的管理。
资源管理器为应用程序提供各种资源,比如本地化字符串、图标、图片、布局文件和视频文件。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于下载完成告知和消息提醒。通知管理器还可以管理以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知。通知管理器还可以管理以对话窗口形式出现在屏幕上的通知,例如在状态栏提示文本信息、发出提示音、电子设备振动以及指示灯闪烁。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理、堆栈管理、线程管理、安全和异常的管理、以及垃圾回收等功能。
系统库可以包括多个功能模块,例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES)和2D图形引擎(例如:SGL)。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D图层和3D图层的融合。
媒体库支持多种音频格式的回放和录制、多种视频格式回放和录制以及静态图像文件。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG和PNG。
三维图形处理库可以用于实现三维图形绘图、图像渲染、合成和图层处理。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
下面结合拾音场景,示例性说明装置100的软件系统以及硬件系统的工作流程。
当用户在触摸传感器180K上进行触摸操作时,相应的硬件中断被发送至内核层,内核层将触摸操作加工成原始输入事件,该原始输入事件例如包括触摸坐标和触摸操作的时间戳等信息。原始输入事件被存储在内核层,应用程序框架层从内核层获取原始输入事件,识别该原始输入事件对应的控件。若该触摸操作为单击操作,并且该单击操作对应的控件为麦克风应用程序图标的控件,则该控件调用应用程序框架层的接口,启动麦克风应用,进而通过调用内核层启动麦克风驱动,通过麦克风170C获取音频信号。
下面以装置100为智能手表为例,对本申请提供的处理音频信号的方法进行描述。
图3是本申请提供的一种处理音频信号的应用场景的示意图。
智能手表作为拾音设备从用户所处的环境中获取音频信号(即,环境声音)。该音频信号通常是多个声源的混合信号,例如,当用户站在街道上时,汽车轮胎的摩擦声、行人的交谈声、以及店铺的广告声共同构成了环境声音。
环境声音对用户的健康存在重要影响,当用户长期暴露于高音量的环境声音中时,听力系统会受到不可逆的损伤。此外,环境声音的频段对用户的健康也存在重要影响,当用户长期暴露在低频环境声音(如20Hz以下的环境声音)中时,会出现神经衰弱等疾病。
智能手表可以监测环境声音,当环境声音的音量大于等于音量阈值时,和/或,当环境声音的频段处于有害频段时,提示用户进行防护。
图4示出了本申请提供的一种监测环境声音的方法的示意图。
智能手表的麦克风在环境声音中进行拾音后,将音频信号转换为脉冲编码调制(pulse code modulation,PCM)信号。随后,该PCM信号分别经过音量分析和频率分析得到包含音量值和频段值的监测结果。
在频率分析过程中,PCM信号经过快速傅里叶变换(fast Fourier transform,FFT)得到频谱信号,随后可以确定该频谱信号的频率分布,从而得到环境声音的频段值。
本申请对音频信号的音量分析和频率分析的具体方式不做限定。
当环境声音的频段处于有害频段时,智能手表可以通过震动、闪烁、提示音或文字等形式提示用户当前环境声音有害健康,以便于用户离开当前环境。当环境声音的音量过大时,智能手表可以通过蓝牙连接(如图3中的双向箭头所示)指示耳机开启降噪功能,以保护用户的健康,本申请对智能手表与耳机的通信方式不做限定。
智能手表还可以与其它电子设备协同处理音频信号。例如,当智能手表处理能力不足时,或者,当智能手表电量不足时,可以将PCM信号传输至手机,由手机对PCM信号进行音量分析和频率分析,并由手机基于监测结果控制耳机进行降噪等操作。
除了通过智能手表进行拾音外,还可以通过智能手环、智能电视、笔记本电脑、平板电脑等电子设备进行拾音,包含这些电子设备的音频信号处理系统如图5所示,其中,智能手表、智能电视、笔记本电脑和平板电脑可以称为物联网设备。物联网设备可以通过WLAN或其他通信方式与音频信号处理设备(如手机)进行通信,将采集到的音频信号传输至处理设备,由处理设备对音频信号进行分析,确定针对该音频信号的处理方式。确定音频信号的处理方式后,处理设备可以与耳机进行交互,控制耳机进行相应的处理(如降噪或播放提示音)。通过多个电子设备获取音频信号能够预测用户周边的音频环境,提醒用户尽早做好防范措施。
为保证用户的健康,环境声音的监测功能需要长时间开启。然而,一些电子设备的续航能力有限,需要减小监测环境声音的功耗,下面介绍本申请提供的处理音频信号的方法。
如图6所示,方法600包括:
S610,获取用户所处环境的音频信号。
S620,所述音频信号的持续时长大于等于时间阈值,并且,当所述音频信号满足以下两个条件中的一个或两个时,减小拾音频率;所述音频信号的音量小于等于音量阈值,所述音频信号的频率处于健康频段内。
方法600可以由智能手表执行。当环境声音的音量在一段时间内小于等于音量阈值时,说明环境声音的音量在未来一段时间内有较大的概率小于音量阈值;当环境声音的频率在一段时间内处于健康频段时,说明环境声音的频率在未来一段时间内有较大的概率处于健康频段。因此,若环境声音满足上述两个条件中一个或两个,则智能手表可以提示用户减小拾音频率,从而可以在不影响用户健康的前提下减小环境声音检测的功耗。
例如,智能手表监测到环境声音的音量在30分钟内小于等于音量阈值,并且,环境声音的频率处于健康频段,则可以通过智能手表或手机提示用户开启节能拾音功能。手机显示的界面如图7所示。用户选择开启节能模式后,手机向智能手表发送开启节能模式的指令,智能手表减小拾音频率以节省功耗。
上述音量阈值可以由用户根据自己的感受设定,也可以由智能手表基于国家卫生部门给出的健康音量阈值设定,例如,可以设定为80dB;类似地,上述健康频段的范围可以由用户根据自己的感受设定,也可以由智能手表基于国家卫生部门给出的健康频段范围确定,例如,可以设定为20~20000Hz。用户设定音量阈值和频段阈值的界面示意图如图8所示,其中,音量设定栏目存在一个阈值,频段设定栏目存在两个阈值,原因在于安静的环境对用户的健康有益,因此无需设定音量的最小告警阈值。本申请对音量阈值和健康频段的设定方式不做限定。
可选地,当所述音频信号的音量大于音量阈值时,智能手表可以增大拾音频率。
当环境声音的音量在一段时间内大于音量阈值时,说明环境声音的音量在未来一段时间内有较大的概率高于音量阈值,则智能手表可以提示用户增大拾音频率,以便于及时提醒用户进行防护。
例如,智能手表监测到环境声音的音量大于80dB,并且,环境声音的频率小于20Hz,处于有害频段内,则可以通过手机提示用户注意听力防护。手机显示的界面如图9所示。手机可以通过震动、闪烁、提示音或文字等形式提示用户。
此外,手机还可以显示不同时间周期的检测记录,如图9所示,可以显示每日的环境声音频率值或音量值,也可以显示每周的环境声音频率值或音量值,还可以显示每月的环境声音频率值或音量值,从而可以便于用户针对性地做好听力预防措施。
需要说明的是,以上减小或增大拾音频率也可以是在智能手表未提示用户的情况下完成的,即在用户无感知的状态下由智能手表自动完成,从而提升用户使用体验。
上文详细描述了本申请提供的监测有害健康的环境声音的方法。在一些场景中,虽然环境声音对健康无害,但用户仍会有所不适,本申请还提供了一种基于用户生理信息对环境声音进行评测的方法,以便于用户选择舒适的环境。
如图10所示,方法1000包括:
S1010,获取用户所处环境的音频信号。
S1020,获取所述用户的实时生理信息,所述实时生理信息的获取时间与所述音频信号的获取时间相同。
S1030,根据预设生理信息与所述实时生理信息的差值确定所述音频信号对应的第一舒适度,其中,所述第一舒适度与所述差值负相关。
上述实时生理信息可以是智能手表监测到的心率值、血氧含量或血压值。上述预设生理信息可以是用户设定的心率值、血氧含量或血压值,也可以是国家卫生部门给出的健康心率值、血氧含量或血压值。本申请对实时生理信息和预设生理信息的具体内容不做限定。
第一舒适度与差值负相关,指的是:当实时生理信息和预设生理信息的差值增大时,第一舒适度降低;当实时生理信息和预设生理信息的差值减小时,第一舒适度升高。
以实时生理信息为心率值为例,当智能手表实时采集到的心率值与预设心率值的差值较大时,说明用户的心率值偏离健康心率值的程度较大,可以确定用户的舒适度较差,即,音频信号对应的第一舒适度较差;当智能手表实时采集到的心率值与预设心率值的差值较小时,说明用户的心率值偏离健康心率值的接近,可以确定用户的舒适度较好,即,音频信号对应的第一舒适度较好。因此,应用上述方案可以在用户在未出现严重生理反应时提示及时更换环境,维护用户健康。
不同用户对环境声音的忍耐度不同,当用户A和用户B处于相同的环境中时,用户A和用户B的生理信息可能有较大差异。因此,智能手表可以提示用户对当前的环境声音的舒适度进行评价,基于用户的评价确定不同舒适度对应的预设生理信息,以便于做出更加符合用户个体特征的决策。
例如,手机可以显示图11所示的界面,提示用户对当前的环境声音的舒适度进行打分;用户可以根据当前的实际感受从舒适、一般、忍耐和难以忍耐中选择一个。该四个舒适度即音频信号的第二舒适度,用户输入的信息即第一指示信息,手机可以根据第二舒适度训练舒适度算法,以使第一舒适度与第二舒适度相同。训练完成后,手机可以不再显示用户输入栏目,直接给出预测结果(舒适、一般、忍耐和难以忍耐中的一个),也可以在给出预测结果的同时继续显示用户输入栏目,进一步提升预测准确度。
上述舒适度算法可以是神经网络模型、决策树或随机森林等人工智能模型,本申请对此不做限定。
上述示例是利用环境声音训练舒适度算法的实施例,在一些场景中,环境声音的内容比较单一,例如,环境声音缺少频率较低或音量较高的声音,利用环境声音训练舒适度算法可能无法达到理想的预测效果。此时,手机可以控制耳机主动播放低频声音或高音量声音,获取用户输入的第二指示信息,第二指示信息指示当前播放的声音的舒适度,该舒适度即第三舒适度,可以是舒适、一般、忍耐和难以忍耐中的一个。手机可以根据第三舒适度训练舒适度算法,以使舒适度算法的预测结果与第三舒适度相同。
舒适度算法训练完成后,手机可以根据舒适度算法的预测结果提示用户采取措施保护听力,例如,当预测结果为舒适时,手机提醒用户所处环境声舒适度很理想,无需采取措施;当评分为一般时,手机提醒用户所处环境声舒适度一般,听力及生理健康存在潜在风险,请及时防护;当评分为忍耐时,手机提醒用户所处环境声糟糕,请注意听力及生理健康,远离噪声源;当评分为难以忍受时,请注意听力及生理健康,迅速远离噪声源。
除了监测有害健康的环境声音之外,在环境声音无害的情况下,智能手表或手机还可以改善用户的听力环境。
环境声音通常为多个声源的混合信号,智能手表监测到环境声音后,可以通过神经网络或其它分析方法确定该混合信号对应的多个声源,并提示用户选择待处理的声源。若用户需要获取该多个声源中的特定声源,可以通过第三指示信息指示该特定声源的声音需要增强,或者,可以通过第三指示信息指示除该特定声源之外的声源发出的声音需要降噪。
例如,智能手表监测到环境声音后,可以通过手机显示如图12所示的界面,提示用户从所述多个声源中选择待处理的声源,用户可以根据当前情况选择降噪处理和/或增强处理。
若用户正在休息,则可以点击“背景声”121、“讲话声”122以及“鸣笛声”123对应的选项,即选择当前所有待处理的声源,并点击“降噪”125对应的选项,以对当前所有待处理的声源进行降噪处理。手机获取用户输入的信息后,向耳机发出降噪指令,指示耳机对所有的声源的音频信号进行降噪处理。若用户正在进行参与现场会议,则可以先点击“背景声”121对应的选项,再点击“降噪”125对应的选项,手机可以控制耳机针对背景声源发出的声音进行降噪处理,以便于获得清晰的讲话声音;此外,用户还可以点击“讲话声”122对应的选项,再点击“增强”124对应的选项,手机可以控制耳机对现场会议的讲话声音进行增强处理。
因此,本实施例可以基于用户的需要对音频信号进行处理,增强用户的体验感。
手机还可以根据收集到的环境声音的内容预测用户的操作,例如,若手机从智能手表获取的音频信号包括讲话声,则手机可以确定用户正处于交谈场景,手机可以预测用户希望对“背景声”和/或“鸣笛声”进行降噪,并对“讲话声”进行增强。若用户选择的待处理声源与处理方式与手机的预测结果相同,则手机按照用户的指示进行处理;若用户选择的待处理声源与处理方式与手机的预测结果不同,则手机可以提示用户确认选择结果。
例如,用户在图12所示的界面上进行触摸操作,先后触发生成了第三指示信息和第四指示信息,若第三指示信息指示选择待处理的声源为“讲话声”122,并且第四指示信息指示选择的处理模式为“增强”124,则手机可以直接按照用户的指示对现场会议的讲话声音进行增强处理。若第三指示信息指示选择待处理的声源为“讲话声”122,并且第四指示信息指示选择的处理模式为“降噪”125,则手机可以显示如图13所示的界面,提示用户再次确认选择结果;若用户选择“是”,则手机可以按照用户的需求对现场会议的讲话声音进行降噪处理;若用户选择“否”,则引导用户重新选择待处理的声源和处理模式,从而可以避免用户的错误操作。
上述示例中,用户可以在图12所示的界面上选择一个或多个声源,并选择该一个或多个声源对应的处理方式,手机可以在被选中的对象前的选项框中填充颜色,表示该选项被选中。若用户仅选择处理方式而未选择待处理的声源,手机可以在图12所示的界面通过对话框提示用户选择待处理的声源。
在一些特定的场景中,例如,用户存在听力障碍或者环境噪声过于复杂,耳机的增强效果或降噪效果难以达到理想效果,则手机可以提示用户向“讲话声”122的声源所在的位置移动,以便于用户及时获取需要的信息。
上文详细介绍了本申请提供的处理音频信号的方法的示例。可以理解的是,相应的装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请可以根据上述方法示例对处理音频信号的装置进行功能单元的划分,例如,可以将各个功能划分为各个功能单元,也可以将两个或两个以上的功能集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图14示出了本申请提供的一种处理音频信号的装置的结构示意图。图14中的虚线表示该单元或该模块为可选的。装置1400可用于实现上述方法实施例中描述的方法。装置1400可以是终端设备或芯片。
装置1400包括一个或多个处理器1401,该一个或多个处理器1401可支持装置1400实现方法实施例中的方法。处理器1401可以是通用处理器或者专用处理器,例如,处理器1401可以是中央处理器(central processing unit,CPU)。CPU可以用于对装置1400进行控制,执行软件程序,以实现处理音频信号的功能。
处理器1401也可以是数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammable gate array,FPGA)或者其它可编程逻辑器件,例如,分立门、晶体管逻辑器件或分立硬件组件。本申请对处理器的具体类型不做限定。
装置1400还可以包括通信模块1405,用以实现信号的输入(接收)和/或输出(发送)。
例如,通信模块1405可以是终端设备的收发器,终端设备通过收发器发送或接收无线信号;或者,通信模块1405可以是芯片的通信接口,芯片通过通信接口发送或接收有线信号(如降噪指令)。
装置1400中可以包括一个或多个存储器1402,其上存有程序1404,程序1404可被处理器1401运行,生成指令1403,使得处理器1401根据指令1403执行上述方法实施例描述的方法。可选地,存储器1402中还可以存储有数据(如方法实施例中的各个阈值)。可选地,处理器1401还可以读取存储器1402中存储的数据,该数据可以与程序1404存储在相同的存储地址,该数据也可以与程序1404存储在不同的存储地址。
处理器1401和存储器1402可以单独设置,也可以集成在一起,例如,集成在系统级芯片(system on chip,SOC)上。
应理解,上述方法实施例的各步骤可以通过处理器1401中的硬件形式的逻辑电路或者软件形式的指令完成,装置1400执行处理音频信号的方法的具体方式以及产生的有益效果可以参见方法实施例中的相关描述。
本申请还提供了一种计算机程序产品,该计算机程序产品被处理器1401执行时实现本申请中任一方法实施例所述的方法。
该计算机程序产品可以存储在存储器1402中,例如是程序1404,程序1404经过预处理、编译、汇编和链接等处理过程最终被转换为能够被处理器1401执行的可执行目标文件。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机执行时实现本申请中任一方法实施例所述的方法。该计算机程序可以是高级语言程序,也可以是可执行目标程序。
该计算机可读存储介质例如是存储器1402。存储器1402可以是易失性存储器或非易失性存储器,或者,存储器1402可以同时包括易失性存储器和非易失性存储器。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
本领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和设备的具体工作过程以及产生的技术效果,可以参考前述方法实施例中对应的过程和技术效果,在此不再赘述。
在本申请所提供的几个实施例中,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的方法实施例的一些特征可以忽略,或不执行。以上所描述的装置实施例仅仅是示意性的,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个单元或组件可以结合或者可以集成到另一个系统。另外,各单元之间的耦合或各个组件之间的耦合可以是直接耦合,也可以是间接耦合,上述耦合包括电的、机械的或其它形式的连接。
在本申请的各种实施例中,序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请的实施例的实施过程构成任何限定。
另外,本文中的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
总之,以上所述仅为本申请技术方案的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (13)
1.一种处理音频信号的方法,其特征在于,包括:
获取用户所处环境的音频信号;
当所述音频信号的持续时长大于等于时间阈值时,并且,当所述音频信号满足以下两个条件中的一个或两个时,减小拾音频率;
所述音频信号的音量小于等于音量阈值,所述音频信号的频率处于健康频段内。
2.根据权利要求1所述的方法,其特征在于,所述减小拾音频率,包括:
提示所述用户减小拾音频率;
接收所述用户输入的控制信息,所述控制信息用于减小拾音频率;
根据所述控制信息减小拾音频率。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
显示所述音频信号的音量和/或频率随时间变换的特征图。
4.根据权利要求1至3中任一项所述的方法,其特征在于,还包括:
获取所述用户的实时生理信息,所述实时生理信息的获取时间与所述音频信号的获取时间相同;
根据预设生理信息与所述实时生理信息的差值确定所述音频信号对应的第一舒适度,其中,所述第一舒适度与所述差值负相关。
5.根据权利要求4所述的方法,其特征在于,还包括:
获取所述用户输入的第一指示信息,所述第一指示信息用于指示所述音频信号对应的第二舒适度;
根据所述第二舒适度训练舒适度算法,所述舒适度算法用于确定所述第一舒适度。
6.根据权利要求4所述的方法,其特征在于,还包括:
播放多种声音,所述多种声音的音量和频率不同;
获取所述用户输入的第二指示信息,所述第二指示信息用于指示所述多种声音对应的第三舒适度;
根据所述第三舒适度训练所述舒适度算法,所述舒适度算法用于确定所述第一舒适度。
7.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:
当所述音频信号的频段处于有害频段内时,提示所述用户进行防护处理。
8.根据权利要求1至7中任一项所述的方法,其特征在于,还包括:
当所述音频信号为多个声源的混合信号时,提示所述用户从所述多个声源中选择待处理的声源;
获取所述用户输入的第三指示信息,所述第三指示信息用于指示所述待处理的声源;
获取所述用户输入的第四指示信息,所述第四指示信息用于指示所述待处理的声源的处理方式,所述处理方式包括降噪处理或增强处理;
根据所述第三指示信息和所述第四指示信息对所述待处理的声源对应的音频信号进行降噪处理或增强处理。
9.根据权利要求8所述的方法,其特征在于,还包括:
当所述待处理的声源与所述处理方式不匹配时,提示所述用户确认所述待处理的声源与所述处理方式是否正确。
10.根据权利要求1至9中任一项所述的方法,其特征在于,所述获取用户所处环境的音频信号,包括:
通过多个物联网设备获取所述音频信号。
11.一种处理音频信号的装置,其特征在于,包括处理器和存储器,所述处理器和存储器耦合,所述存储器用于存储计算机程序,当所述计算机程序被所述处理器执行时,使得所述装置执行权利要求1至10中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至10中任一项所述的方法。
13.一种芯片,其特征在于,包括处理器,当所述处理器执行指令时,所述处理器执行如权利要求1至10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011175531.6A CN114420160A (zh) | 2020-10-28 | 2020-10-28 | 处理音频信号的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011175531.6A CN114420160A (zh) | 2020-10-28 | 2020-10-28 | 处理音频信号的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114420160A true CN114420160A (zh) | 2022-04-29 |
Family
ID=81260350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011175531.6A Pending CN114420160A (zh) | 2020-10-28 | 2020-10-28 | 处理音频信号的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114420160A (zh) |
-
2020
- 2020-10-28 CN CN202011175531.6A patent/CN114420160A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110956939B (zh) | 调节屏幕亮度的方法及电子设备 | |
CN113722058B (zh) | 一种资源调用方法及电子设备 | |
WO2021036785A1 (zh) | 一种消息提醒方法及电子设备 | |
WO2021083128A1 (zh) | 一种声音处理方法及其装置 | |
CN111552451A (zh) | 显示控制方法及装置、计算机可读介质及终端设备 | |
CN111522425A (zh) | 一种电子设备的功耗控制方法及电子设备 | |
CN114466107A (zh) | 音效控制方法、装置、电子设备及计算机可读存储介质 | |
CN114461057A (zh) | Vr显示控制方法、电子设备及计算机可读存储介质 | |
CN110286975B (zh) | 一种前景元素的显示方法和电子设备 | |
WO2022052786A1 (zh) | 皮肤敏感度的显示方法、装置、电子设备及可读存储介质 | |
CN115657992B (zh) | 一种屏幕显示的方法、装置、设备及存储介质 | |
CN116048217B (zh) | 一种电子设备运行方法、装置和电子设备 | |
CN114125145B (zh) | 显示屏解锁的方法、电子设备及存储介质 | |
WO2022135195A1 (zh) | 显示虚拟现实界面的方法、装置、设备和可读存储介质 | |
CN112527220B (zh) | 一种电子设备显示方法及电子设备 | |
CN114827098A (zh) | 合拍的方法、装置、电子设备和可读存储介质 | |
CN114420160A (zh) | 处理音频信号的方法和装置 | |
CN113918003A (zh) | 检测皮肤接触屏幕时长的方法、装置及电子设备 | |
CN114637392A (zh) | 显示方法及电子设备 | |
CN110737916A (zh) | 通信终端及处理方法 | |
CN116048831B (zh) | 一种目标信号处理方法和电子设备 | |
CN116320123B (zh) | 一种语音信号的输出方法和电子设备 | |
CN116233599B (zh) | 一种录像模式推荐方法和电子设备 | |
CN116703741B (zh) | 一种图像对比度的生成方法、装置和电子设备 | |
CN116703689B (zh) | 一种着色器程序的生成方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |