CN118098261A - 一种音频处理方法、设备及系统 - Google Patents

一种音频处理方法、设备及系统 Download PDF

Info

Publication number
CN118098261A
CN118098261A CN202211500553.4A CN202211500553A CN118098261A CN 118098261 A CN118098261 A CN 118098261A CN 202211500553 A CN202211500553 A CN 202211500553A CN 118098261 A CN118098261 A CN 118098261A
Authority
CN
China
Prior art keywords
audio
snore
signal
target user
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211500553.4A
Other languages
English (en)
Inventor
张威
许培达
王伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202211500553.4A priority Critical patent/CN118098261A/zh
Publication of CN118098261A publication Critical patent/CN118098261A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本申请提供了一种音频处理方法、设备及系统,该方法包括:第一设备获取第一音频和第一用户数据;第一音频包括第一鼾声信号组;第一音频为第一时间段录制的音频;第一用户数据为第一时间段采集的目标用户的呼吸特征参数;第一设备在确定第一鼾声信号组的鼾声信号规律和第一用户数据不匹配时确定第一鼾声信号组为非目标用户的鼾声信号;第一设备基于第一鼾声信号组对应的第二音频生成降噪音频,降噪音频与第二音频的相位相反且强度相同;第二设备用于播放降噪音频。实施本申请实施例,第一设备可以识别非目标用户的鼾声,从而针对非目标用户的鼾声进行降噪,可以有效降低噪音给用户带来的影响,提高用户体验。

Description

一种音频处理方法、设备及系统
技术领域
本申请实施例涉及终端技术,尤其涉及一种音频处理方法、设备及系统。
背景技术
日常生活中,部分人会因为疲劳等各种原因在睡眠中发出的一种呼吸粗鸣声,即鼾声。通常,打鼾者听不到自己的鼾声,但是鼾声会对周围人的睡眠质量造成影响。理论上,大约35分贝左右的噪声水平就足以破坏睡眠者的睡眠质量,而大多数打鼾者的鼾声已经超过50分贝。若人们长期受到这样的噪音影响,睡眠质量将遭受严重影响,从而影响人们在日常生活中的精神力、注意力以及警觉性等,对其身心健康构成威胁。
如何降低噪声带来的影响是当前及未来的研究方向。
发明内容
本申请提供了一种音频处理方法、设备及系统,在该音频处理方法中,该方法可以识别非目标用户的鼾声,从而针对非目标用户的鼾声进行降噪,可以有效降低噪音的影响。
第一方面,本申请实施例提供了一种音频处理方法,该方法包括:
第一设备获取第一音频和第一用户数据;第一音频包括第一鼾声信号组;第一音频为第一时间段录制的音频;第一用户数据为第一时间段采集的目标用户的呼吸特征参数;第一鼾声信号组包括多个鼾声信号;第一设备在确定第一鼾声信号组的鼾声信号规律和第一用户数据不匹配时,确定第一鼾声信号组为非目标用户的鼾声信号;第一设备基于第一鼾声信号组对应的第二音频生成降噪音频,降噪音频与第二音频的相位相反且强度相同;第一设备向第二设备发送降噪音频,第二设备用于播放降噪音频。
实施本申请实施例,第一设备可以识别非目标用户的鼾声,从而针对非目标用户的鼾声进行降噪,可以有效降低噪音给用户的影响。
其中,呼吸特征参数用于确定用户的呼吸规律,例如,呼吸特征参数可以为呼吸率、心率、脉搏中的至少一个。其中,呼吸率即呼吸频率,例如呼吸率可以为人体每分钟完成一次呼吸的频率,也可以是人体每分钟的呼吸次数。
结合第一方面,在一种可能的实现方式中,第一鼾声信号组的鼾声信号规律为第二时间段内第一鼾声信号组的鼾声信号次数;第一用户数据为第二时间段内目标用户的呼吸次数;第一设备在确定第一鼾声信号组的鼾声信号规律和第一用户数据不匹配时,确定第一鼾声信号组为非目标用户的鼾声信号,包括:第一设备在确定鼾声信号次数和呼吸次数的次数之差超过预设次数时,确定第一鼾声信号组为非目标用户的鼾声信号。
其中,第二时间段可以为一分钟,第二时间段用于说明计算鼾声信号次数和呼吸次数时的时长相等。
结合第一方面,在一种可能的实现方式中,第一用户数据为第三设备发送至第一设备的数据;在第一设备获取第一音频和第一用户数据之前,方法还包括:第一设备向第三设备发送睡眠监测请求,睡眠监测请求用于请求目标用户的睡眠状态;目标用户为第三设备的佩戴者;第一设备接收第三设备发送的响应消息,响应消息用于指示目标用户已进入睡眠状态;第一设备在接收响应消息后,向第二设备发送录音请求,以及向第三设备发送获取请求,录音请求用于请求获取第二设备录制的音频,录制的音频包括第一音频;获取请求用于请求获取第三设备采集的用户数据,采集的用户数据包括第一用户数据。
本申请实施例中,第一设备可以通过第三设备监测用户是否为睡眠状态,在用户入睡后再进行睡眠降噪。该方法可以降低第一设备、第二设备和第三设备执行睡眠降噪的功耗。
结合第一方面,在一种可能的实现方式中,第一音频中包括多个音频信号;方法还包括:
第一设备确定多个音频信号中每一个音频信号的到达方向和传播距离;多个音频信号包括第一音频信号;第一设备在确定第一音频信号满足传播距离超过预设距离和到达方向为非预设方向中的至少一个时,向第二设备发送调节请求;调节请求可以包括第一指示信息或第二指示信息,第一指示信息用于指示第二设备将第二设备的耳塞的松紧程度调整至目标程度,第二指示信息用于指示播放预设音频。
本申请实施例中,第一设备在确定第一音频信号满足传播距离超过预设距离和到达方向为非预设方向中的至少一个时,确定存在环境噪音,进而,通过调节请求调整耳塞或播放预设音频。该方法还可以针对环境噪音进行处理,避免环境噪音对用户的睡眠情况造成干扰。
第二方面,本申请实施例提供了一种音频处理方法,该方法包括:
第一设备获取第一音频和第一用户数据;第一音频包括第二鼾声信号组;第一音频为第一时间段录制的音频;第一用户数据为第一时间段采集的目标用户的呼吸特征参数;第二鼾声信号组包括多个鼾声信号;第一设备在确定第二鼾声信号组的鼾声信号规律和第一用户数据匹配时,确定第二鼾声信号组为目标用户的鼾声信号;第一设备在识别到目标用户的鼾声信号中存在异常鼾声时,提示目标用户。
本申请实施例中,第一设备可以基于目标用户的呼吸特征参数,判断第一音频中是否包括目标用户的鼾声信号,进而,在目标用户的鼾声信号存在异常时提示目标用户。由于鼾声异常一般是由于存在呼吸暂停或呼吸不畅等异常事件,该方法通过监测目标用户的鼾声信号的情况,可以降低异常事件给目标用户带来的影响,提高用户体验;也可以降低对非目标用户的睡眠质量造成影响。
结合第二方面,在一种可能的实现方式中,第二鼾声信号组的鼾声信号规律为第二时间段内第二鼾声信号组的鼾声信号次数;第一用户数据为第二时间段内目标用户的呼吸次数;第一设备在确定第二鼾声信号组的鼾声信号规律和第一用户数据匹配时,确定第二鼾声信号组为目标用户的鼾声信号,包括:第一设备在确定鼾声信号次数和呼吸次数的次数之差不超过预设次数时,确定第二鼾声信号组为目标用户的鼾声信号。
结合第二方面,在一种可能的实现方式中,目标用户的鼾声信号包括第一信号;方法还包括:第一设备在识别到第一信号符合预设条件时,确定第一信号为异常鼾声;其中,预设条件包括第一信号和第二信号的强度差值超过预设强度差值、第一信号和第二信号之间的间隔时长超过预设间隔时长、第一信号的时长与目标用户的多个鼾声信号的平均时长的差值大于预设时长差值中的至少一个;第二信号为目标用户的鼾声信号中第一信号的前一个鼾声信号。
结合第二方面,在一种可能的实现方式中,第一音频还包括第一鼾声信号组,方法还包括:第一设备在确定第一鼾声信号组的鼾声信号规律和第一用户数据不匹配时,基于第一鼾声信号组对应的第二音频生成降噪音频,降噪音频与第二音频的相位相反且强度相同;第一设备向第二设备发送降噪音频,第二设备用于播放降噪音频,目标用户为佩戴第二设备的用户。
本申请实施例中,第一设备可以基于目标用户的呼吸特征参数,判断第一音频中是否包括目标用户的鼾声信号,进而,在第一音频中包括非目标用户的鼾声信号时,基于非目标用户的鼾声信号生成降噪音频,进而,播放该降噪音频。该方法可以避免他人鼾声对用户的睡眠质量造成影响,提高用户体验;该方法中,第二设备可以为耳机等可佩带的设备,以实现近场降噪,优化降噪效果。
结合第二方面,在一种可能的实现方式中,提示目标用户,包括:第一设备向第三设备发送第一提示请求,第一提示请求用于请求以第一强度执行电击或震动;在提示目标用户之后,方法还包括:第一设备在未识别到异常鼾声时,向第三设备发送停止请求,停止请求用于请求停止电击或震动。
结合第二方面,在一种可能的实现方式中,在提示目标用户之后,方法还包括:第一设备在预设时间段内识别的鼾声信号均为异常鼾声时,向第三设备发送第二提示请求,第二提示请求用于请求以第二强度执行电击或震动;第一强度小于第二强度。
本申请实施例中,第一设备可以通过第三设备以第一强度对目标用户进行电击或震动,在目标用户的鼾声在预设时间段后未恢复正常时,通过第三设备以第二强度对目标用户进行电击或震动。该方法可以避免异常事件对用户的身体健康造成影响。
结合第二方面,在一种可能的实现方式中,在第一设备获取第一音频和第一用户数据之前,方法还包括:第一设备向第三设备发送睡眠监测请求,睡眠监测请求用于请求目标用户的睡眠状态;目标用户为第三设备的佩戴者;第一设备接收第三设备发送的响应消息,响应消息用于指示目标用户已进入睡眠状态;第一设备在接收响应消息后,向第二设备发送录音请求,以及向第三设备发送获取请求,录音请求用于请求获取第二设备录制的音频,录制的音频包括第一音频;获取请求用于请求获取第三设备采集的用户数据,采集的用户数据包括第一用户数据。
结合第二方面,在一种可能的实现方式中,第一音频中包括多个音频信号;方法还包括:第一设备确定多个音频信号中每一个音频信号的到达方向和传播距离;多个音频信号包括第一音频信号;第一设备在确定第一音频信号满足传播距离超过预设距离和到达方向为非预设方向中的至少一个时,向第二设备发送调节请求;调节请求可以包括第一指示信息或第二指示信息,第一指示信息用于指示第二设备将第二设备的耳塞的松紧程度调整至目标程度,第二指示信息用于指示播放预设音频。
本申请实施例中,第一设备可以从录制的音频中识别不同类型的噪音,如环境噪音、目标用户的鼾声和非目标用户的鼾声,其中,目标用户的鼾声还可以包括异常鼾声和正常鼾声;进而,针对不同类型的噪音进行不同的干预手段,例如针对目标用户的异常鼾声,第一设备可以通过电击和震动刺激目标用户恢复鼾声正常或唤醒目标用户;又例如,针对非目标用户的鼾声,通过播放降噪音频以避免他人鼾声对目标用户的睡眠造成影响;又例如,针对环境噪音,第一设备可以通过播放预设音频或调整耳塞避免环境噪音对目标用户的睡眠造成影响。可见,本申请实施例可以有效降低各种噪音对用户的睡眠造成的影响,极大提高用户体验。
第三方面,本申请实施例提供了一种电子设备,包括一个或多个功能模块,该一个或多个功能模块可用于执行如上述任一方面中或任一方面中任一可能的实现方式中的音频处理方法。
第四方面,本申请提供了一种计算机存储介质,包括计算机指令,当计算机指令在电子设备上运行时,使得通信装置执行上述任一方面中或任一方面中任一可能的实现方式中的音频处理方法。
第五方面,本申请提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述任一方面中或任一方面中任一可能的实现方式中的音频处理方法。
第六方面,本申请提供了一种芯片,包括:处理器和接口,所述处理器和接口相互配合,使得所述芯片执行上述任一方面中或任一方面中任一可能的实现方式中的音频处理方法。
可以理解地,上述第三方面提供的电子设备、第四方面提供的计算机可读存储介质、第五方面提供的计算机程序产品、第六方面提供的芯片均用于执行本申请实施例所提供的方法。因此,其所能达到的有益效果可参考对应方法中的有益效果,此处不再赘述。
附图说明
图1是本申请实施例提供一种有源噪声控制系统的双人床示意图;
图2A是本申请实施例提供的一种音频处理系统的框架图;
图2B是本申请实施例提供的一种音频处理系统的框架图;
图3是本申请实施例提供的一种无线耳机的示意图;
图4A是本申请实施例提供的一种电子设备100的硬件结构示意图;
图4B是本申请实施例提供的电子设备100的软件结构框图;
图5A至图5E是本申请实施例示例性的提供的第一设备上的一些用户界面;
图6是本申请提供的一种音频处理方法的整体流程示意图;
图7是本申请实施例提供的一种识别鼾声来源的示意图;
图8A是本申请实施例提供的一种判断鼾声信号情况的示意图;
图8B是本申请实施例提供的一种判断鼾声信号情况的示意图;
图8C是本申请实施例提供的一种判断鼾声信号情况的示意图;
图9是本申请提供的另一种音频处理方法的整体流程示意图;
图10是本申请实施例提供的又一种音频处理方法的流程示意图;
图11是本申请提供的一种音频处理装置110的示意图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、详尽地描述。其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;文本中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为暗示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本申请以下实施例中的术语“用户界面(user interface,UI)”,是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。用户界面是通过java、可扩展标记语言(extensible markuplanguage,XML)等特定计算机语言编写的源代码,界面源代码在电子设备上经过解析,渲染,最终呈现为用户可以识别的内容。用户界面常用的表现形式是图形用户界面(graphicuser interface,GUI),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的文本、图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。
为了减少鼾声对周围人的影响,提高周围人的睡眠质量,目前有两种方法,第一种是鼾声降噪,即降低鼾声带来的干扰;第二种是消除鼾声源,即让打鼾者停止打鼾。
首先,介绍第一种方法:鼾声降噪,该方法主要分为被动式的降噪和主动式的降噪。其中,被动式的降噪即通过耳塞、耳罩等物理隔绝的方式降低人耳接收到的噪声,对噪声抑制有一定的效果,但仍无法完全消除噪声;主动式的降噪,是利用反向声源将噪声进行消除。
以下示例性介绍主动式降噪的方案。以公开号为CN111862928A、申请名称为“基于远程麦克风技术的鼾声有源噪声控制系统及实现方法”的专利为例进行说明。请参见图1,图1是该专利公开的有源噪声控制系统的双人床示意图。
如图1所示,A1~A8为扬声器,E1~E4为麦克风,F为控制面板,其中,A1,A2,A5,A6扬声器在F两侧(未在图1中示出)。具体的,该方案通过在床头或枕头上布设多个麦克风以录制睡眠期间的音频,在识别到音频为鼾声后,通过床头或枕头上的多个扬声器播放处理后的音频使其与鼾声相互抵消,在人的双耳附近形成一片静音区域。
但是,由于该方法通过使麦克风声场与噪声场进行相位相消匹配来消除鼾声,形成的静音区范围与噪声的波长强相关,因此,该方法存在很强的区域限制性,当用户睡眠期间头部位置发生改变时,降噪效果会大大下降。例如1kHz噪声的波长约为34cm,用户由于睡姿调整移动时可能会导致降噪效果逐渐下降,如在用户移动距离达到半波长17cm时,处于噪声加强区,由于相位相涨导致噪声强度提高到原来的4倍,起到反作用。此外,该方法中双人床枕头中间有阻隔物,影响睡眠体验,用户体验较差;床头位置附近电器过多,存在安全隐患。
综上,当前主动式降噪存在以下问题:(1)通过远程麦克风(如图1中的麦克风)进行远场主动降噪时,虽然有足够的处理时间来生成匹配的降噪音频,但是会随着用户睡眠期间的移动导致降噪效果下降,甚至是噪声增强;(2)由于无线耳机上的麦克风以及扬声器基本上安装在同一位置或相邻位置,从收音到输出降噪音频之间通常只有几十微秒的处理时间,按现有的无线耳机器件水平无法在此期间实现整个音频的采集,处理,识别,生成,输出等过程,无法实现近场主动降噪。
接下来,示例性的介绍第二种方法:消除鼾声源。该方法通过给打鼾者佩戴止鼾器或者无线耳机等,通过一个或多个麦克风或者无线耳机采集睡眠期间的音频,判断为鼾声后,通过弱电击或震动的方式唤醒打鼾者,从而消除鼾声源。例如,公开号为CN 108697328B、申请名称为“一种鼾声识别方法及止鼾装置”的专利;以及公开号为CN 204697246 U、申请名称为“具有止鼾功能的蓝牙无线耳机”公开的专利。
但是该方法通过弱电击和震动的方式唤醒打鼾者,会造成打鼾者睡眠周期(例如深度睡眠)的中断,影响打鼾者的睡眠质量。另外,止鼾器的佩戴可能会影响打鼾者的睡眠质量。
为了更加清楚、详细地介绍本申请实施例提供的音频处理方法,下面先介绍本申请实施例提供的音频处理系统。
请参见图2A,图2A是本申请实施例提供的一种音频处理系统的框架图。
如图2A所示,音频处理系统可以包括第一设备11、第二设备12和第三设备13。其中,第三设备13可以包括多个穿戴设备。
其中,第一设备11可以为具备交互功能的电子设备(图2A示例性示出了第一设备11为手机),其中,交互功能可以为显示屏输入或语音输入等;第二设备12可以为具备播放和录制音频的功能的电子设备(图2A示例性示出了第二设备12为无线耳机);第三设备13为具备采集用户数据的功能的设备(图2A示例性示出了第三设备13为智能手表)。
可选地,第二设备12和第三设备13中至少一个具备震动或电击的功能。
在一些实施例中,目标用户可以佩戴第二设备12和第三设备13。第一设备11在检测到开启睡眠降噪的用户操作时,响应于该用户操作,向第二设备12发送录音请求,向第三设备13发送获取请求;第二设备12响应于录音请求,录制音频并将录制的音频发送至第一设备11;第三设备13响应于获取请求,采集目标用户的用户数据并将采集的用户数据发送至第一设备11;第一设备11基于接收到的音频和接收到的用户数据,在识别到存在非目标用户的鼾声时,通过第二设备12播放降噪音频,该降噪音频与非目标用户的鼾声相位相反且强度相等;在识别到存在目标用户的异常鼾声时,可以提示目标用户,该提示用于唤醒目标用户或刺激目标用户恢复鼾声正常。其中,提示目标用户的方法可以为通过第二设备12和第三设备13中的至少一个进行震动或电击。
其中,第三设备13上至少包含一个可以采集以下数据的生物传感器,该数据包括呼吸率、心率、脉搏、血氧等。
在一种实现中,第二设备12包括左耳机和右耳机。其中,每个无线耳机至少包含一个麦克风,用于录制耳部区域的音频,计算音频信号的传播距离和方向;每个无线耳机至少包含一个扬声器,用于播放降噪音频,进行主动式降噪;每个无线耳机可以包括至少一个机械调节装置,用于调整耳塞松紧程度,进行被动式降噪,或产生震动以刺激用户停止异常打鼾。
请参见图2B,图2B是本申请实施例提供的一种音频处理系统的框架图。
如图2B所示,音频处理系统可以包括第一设备21和第二设备22。
其中,第一设备21为具备交互功能的电子设备(图2B示例性示出了第一设备21为手机);第二设备22具备上述第二设备12和第三设备13的功能的电子设备(图2B示例性示出了第二设备22为无线耳机)。
可以理解的是,图2A和图2B中的音频处理系统架构只是本申请实施例中的一种示例性的实施方式,本申请实施例中的音频处理系统架构包括但不仅限于以上音频处理系统架构。
请参见图3,图3是本申请实施例提供的一种无线耳机的示意图。
如图3所示,该无线耳机包括机械调节装置、耳塞和机身。其中,耳塞与机械调节装置安装于机身;耳塞与机械调节装置相连接,机械调节装置用于调整耳塞的松紧程度。
机械调节装置将耳塞的松紧程度调紧时,耳塞沿远离机身一侧向外撑开。也就是说,当用户佩戴该无线耳机,机械调节装置将耳塞的松紧程度调紧时,用户可以感觉到耳塞变大,耳塞与耳道的距离变近。可以理解的,耳塞的松紧程度调紧时可以更好阻挡外界声音。
机械调节装置将耳塞的松紧程度调松时,耳塞沿靠近机身一侧向内收敛。也就是说,当用户佩戴该无线耳机,机械调节装置将耳塞的松紧程度调松时,用户可以感觉到耳塞变小,耳塞与耳道的距离变远。
在图2A和图2B所示的系统架构中,第二设备12和第二设备22可以为如图3所示的无线耳机。无线耳机可以用于在存在外界噪音时调整耳塞。
以下示例性以电子设备100为例对上述第一设备11进行说明。
图4A示出了电子设备100的硬件结构示意图。
下面以电子设备100为例对实施例进行具体说明。应该理解的是,电子设备100可以具有比图中所示的更多的或者更少的部件,可以组合两个或多个的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
电子设备100可以包括:处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,无线耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙无线耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙无线耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙无线耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
SIM卡接口可以被用于与SIM卡接口195通信,实现传送数据到SIM卡或读取SIM卡中数据的功能。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接无线耳机,通过无线耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度等进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用(比如人脸识别功能,指纹识别功能、移动支付功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如人脸信息模板数据,指纹信息模板等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universalflash storage,UFS)等。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,无线耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
在本申请实施例中,电子设备可以通过发声装置播放声音信号。其中,发声装置可以为下述扬声器170A,也可以为下述受话器170B,还可以为连接电子设备的外部设备,如无线耳机和眼镜等,此处不作限定。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
无线耳机接口170D用于连接有线无线耳机。无线耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry associationof the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于合成请求,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。
本申请实施例中,电子设备100可以通过处理器110执行本申请实施例提供的音频处理方法。
图4B是本申请实施例提供的电子设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图4B所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息和运动健康等应用程序。
在一些实施例中,用户可以通过电子设备100的运动健康与其他设备(如上文中第二设备12、第三设备13以及第二设备22)进行通信连接,例如向其他设备发送获取请求或获取其他设备发送的数据(如录制的音频等)。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图4B所示,应用程序框架层可以包括显示(display)管理器,传感器(sensor)管理器,跨设备连接管理器,事件管理器,任务(activity)管理器,窗口管理器,内容提供器,视图系统,资源管理器,通知管理器等。
显示管理器用于系统的显示管理,负责所有显示相关事务的管理,包括创建、销毁、方向切换、大小和状态变化等。一般来说,单设备上只会有一个默认显示模块,即主显示模块。
传感器管理器负责传感器的状态管理,并管理应用向其监听传感器事件,将事件实时上报给应用。
跨设备连接管理器用于与其他设备建立通信连接。
事件管理器用于系统的事件管理服务,负责接收底层上传的事件并分发给各窗口,完成事件的接收和分发等工作。
任务管理器用于任务(Activity)组件的管理,包括启动管理、生命周期管理、任务方向管理等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。窗口管理器还用于负责窗口显示管理,包括窗口显示方式、显示大小、显示坐标位置、显示层级等相关的管理。
以上各个实施例的具体执行过程可以参见下文中人机对话方法的相关内容。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库(也可称为数据管理层)可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)和事件数据等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
图5A至图5E是本申请实施例示例性的提供的第一设备(如手机)上的一些用户界面。
图5A示出了第一设备上的用于展示已安装应用程序的示例性用户界面51。该用户界面51显示有:状态栏、运动健康应用的图标510、图库应用的图标以及其他应用程序的图标等。其中,状态栏可包括:移动通信信号(又可称为蜂窝信号)的一个或多个信号强度指示符、Wi-Fi信号的一个或多个信号强度指示符,电池状态指示符、时间指示符等。
如图5A所示,用户可以点击运动健康应用的图标510,相应的,第一设备响应于该用户操作,可以显示如图5B所示的用户界面52。应理解,该用户界面52为示例性示出的运动健康应用的应用界面,不应造成本申请实施例的限定。
如图5B所示,用户界面52显示有睡眠降噪控件520。
在一些实施例中,第一设备响应于用户针对图5B所示的用户界面52显示的睡眠降噪控件520的操作,可以显示如图5C所示的用户界面53。
该用户界面53可以包括第一时间输入栏530、第二时间输入栏531、耳塞降噪开关532、音频降噪开关533、异常开关控件534以及确定控件535。其中,第一时间输入栏530用于输入开始睡眠时间;第二时间输入栏531用于输入结束睡眠时间;耳塞降噪开关532用于开启或关闭针对环境噪音进行耳塞降噪的功能,其中,环境噪音包括室内噪音和室外噪音;音频降噪开关533用于开启或关闭针对鼾声进行音频降噪的功能;异常开关控件534用于开启或关闭在鼾声异常时进行提示的功能;确定控件535用于基于针对用户界面53的其他控件的用户操作以开启睡眠降噪。
在另一些实施例中,第一设备响应于用户针对图5B所示的用户界面52显示的睡眠降噪控件520的操作,可以显示如图5D所示的用户界面54。用户界面54包括耳塞降噪开关540、音频降噪开关541、异常开关控件542以及开始控件543,其中,耳塞降噪开关540、音频降噪开关541、异常开关控件542可以参见耳塞降噪开关532、音频降噪开关533、异常开关控件534的介绍;开始控件543用于开启睡眠降噪。
在一种实现中,第一设备响应于针对开始控件543的用户操作,基于针对耳塞降噪开关540、音频降噪开关541、异常开关控件542的选择,开启睡眠降噪,例如,执行下文实施例中步骤S601至步骤S616。
在另一种实现中,第一设备响应于针对开始控件543的用户操作,开始检测用户是否为睡眠状态,如可以通过穿戴设备进行检测;在确定用户为睡眠状态时,可以基于针对耳塞降噪开关540、音频降噪开关541、异常开关控件542的选择,开启睡眠降噪。
如图5D所示,第一设备响应于针对用户界面54显示的开始控件543的操作,可以显示如图5E所示的用户界面55。该用户界面55包括耳塞降噪开关550、音频降噪开关551、异常开关控件552以及结束控件553,其中,耳塞降噪开关550、音频降噪开关551、异常开关控件552可以参见耳塞降噪开关532、音频降噪开关533、异常开关控件534的介绍;结束控件553用于关闭睡眠降噪。
基于图2A所示的系统,图6示例性提供了一种音频处理方法。该方法中,示例性的以图2A中的第一设备11为手机,第二设备12为无线耳机,第三设备13为智能手表为例进行说明,目标用户为佩戴无线耳机和智能手表的用户。
请参见图6,图6是本申请提供的一种音频处理方法的整体流程示意图。该方法可以包括以下步骤:
步骤S601:手机响应于开启睡眠降噪的用户操作,向无线耳机发送录音请求,该录音请求用于请求获取无线耳机录制的音频。
在一些实施例中,手机可以显示第一界面,第一界面包括睡眠降噪的开启控件;手机在检测到针对该开启控件的用户操作时,向无线耳机发送录音请求,该录音请求用于请求获取无线耳机录制的音频。
可选的,录音请求中可以包括该录音时间段的指示信息,该指示信息用于指示在该录音时间段内进行录音。可选的,该录音时间段可以为用户确定的。
示例性的,第一界面可以为如图5C所示的用户界面53;该用户界面53可以包括第一时间输入栏530、第二时间输入栏531。进而,手机可以接收针对第一时间输入栏530、第二时间输入栏531的输入操作,将第一时间输入栏530的输入信息确定为录音时间段的起始时间,将第二时间输入栏531的输入信息确定为录音时间段的结束时间;进而,手机在检测到针对确定控件535的用户操作时,可以无线耳机发送录音请求,该录音请求包括指示信息,该指示信息用于指示在该录音时间段内进行录音。
在另一种实现中,该录音请求不包括录音时间段的指示信息;手机在检测到开启睡眠降噪的用户操作,响应于该用户操作,向无线耳机发送录音请求,该录音请求用于指示无线耳机开始录音。后续,手机在检测到结束睡降噪的用户操作时,可以向无线耳机发送结束请求,该结束请求用于指示停止录音。
示例性的,第一界面可以为如图5D所示的用户界面54。用户界面54包括开始控件543,开始控件543用于开启睡眠降噪。手机可以响应于针对开始控件543的用户操作,可以无线耳机发送录音请求,以及,显示如图5E所示的用户界面55。该用户界面55包括结束控件553,结束控件553用于关闭睡眠降噪;进而,手机在检测到针对确定控件535的用户操作时,可以无线耳机发送结束请求,该结束请求用于指示停止录音。
在另一些实施例中,手机可以响应于开启睡眠降噪的用户操作,检测目标用户是否为睡眠状态;在确定目标用户为睡眠状态时,再向无线耳机发送录音请求。其中,手机可以通过自身的加速度传感器等检测目标用户是否为睡眠状态,也可以通过智能手表或无线耳机等设备检测目标用户是否为睡眠状态,例如手机与智能手表建立通信连接,智能手表在确定目标用户为睡眠状态时向手机发送指令,该指令用于指示目标用户已进行睡眠状态,本申请实施例对手机检测目标用户是否为睡眠状态的方法不做限定。
步骤S602:无线耳机响应于录音请求,通过麦克风开始录制音频。
在一些实施例中,无线耳机包括左耳机和右耳机,左耳机和右耳机可以分别通过各自的麦克风开始录音,得到录制的音频。
步骤S603:无线耳机将录制的音频发送至手机。
其中,无线耳机和手机可以建立蓝牙、WiFi等通信连接,此处对通信连接方法不做限定。进而,无线耳机可以通过该通信连接,将录制的音频发送手机。
在一些实施例中,无线耳机可以实时或间隔预设时间段向手机发送录制的音频。
步骤S604:手机向智能手表发送获取请求,该获取请求用于请求目标用户的用户数据。
在一些实施例中,手机响应于开启睡眠降噪的用户操作,向智能手表发送获取请求。也就是说,手机可以响应于开启睡眠降噪的用户操作,向无线耳机发送录音请求的同时,向智能手表发送获取请求。
其中,手机与智能手表可以建立蓝牙、WiFi等通信连接,此处对通信连接方法不做限定。进而,手机可以通过该通信连接,将获取请求发送至智能手表。
其中,目标用户的用户数据可以包括目标用户的生理参数,该生理参数可以包括呼吸特征参数,呼吸特征参数用于确定用户的呼吸规律,例如,呼吸特征参数可以为呼吸率、心率、脉搏中的至少一个。其中,呼吸率即呼吸频率,例如,呼吸率可以为人体每分钟完成一次呼吸的频率。
可选的,用户数据还可以包括辅助特征参数,该辅助特征用于辅助判断异常鼾声,例如辅助特征参数为血氧。
步骤S605:智能手表将采集的用户数据发送至手机。
在一种实现中,智能手表可以实时采集目标用户的用户数据,如心率和脉搏等;基于采集的心率和脉搏,计算目标用户的呼吸率;进而,将该呼吸率发送至手机。
在另一种实现中,智能手表可以直接将心率或脉搏发送至手机,由手机算计呼吸率。
步骤S606:手机从接收到的音频中获取第一时间段的第一音频。
在一些实施例中,无线耳机实时将其录制的音频发送至手机;手机可以在无线耳机发送的音频达到第一时间段的时长时,对该第一时间段的音频进行下述步骤S607所示的处理。
其中,第一时间段可以为预设的时间段,例如取值范围可以为10s至20s,此处对第一时间段不做限定。需要说明的是,为方便描述,本申请实施例示例性的以第一时间段为例进行说明。
在另一些实施例中,无线耳机在每间隔第一时间段的时长时,向手机发送该时段内录制的音频。
步骤S607:手机在确定第一音频包括室外噪音时,向无线耳机发送调节请求,该调节请求用于将耳塞的松紧程度调整至目标程度。
在一些实施例中,手机可以先基于第一音频中音频信号的到达方向和传播距离,判断该第一音频是否存在音频信号为室外噪音;进而,在确定该第一音频包括室外噪音时,向无线耳机发送调节请求,该调节请求用于调整耳塞的松紧程度。
其中,音频信号的到达方向是指音频信号的发声源至拾音器之间的方向;音频信号的传播距离是指音频信号的发声源至拾音器之间的距离。例如,无线耳机通过麦克风录制音频,则音频信号的到达方向为该音频信号的发声源至该麦克风的方向;音频信号的到达方向为该音频信号的发声源至该麦克风的距离。
在一种实现中,第一音频中包括多个音频信号;手机可以基于第一音频的幅值、相位和时延等信息,计算多个音频信号中每一个音频信号的到达方向和传播距离;在存在音频信号满足传播距离超过预设距离和/或到达方向为非预设方向时,确定第一音频中包括室外噪音。
例如预设距离为3米,手机确定第一音频中存在音频信号的传播距离为4米,即该音频信号的传播距离超过预设距离,那么手机可以确定该音频信号为室外噪音,即该第一音频包括室外噪音;又例如,预设方向为水平方向和垂直方向,手机确定第一音频中存在音频信号的传播方向不为水平方向和垂直方向,那么手机可以确定该音频信号为室外噪音,即该第一音频包括室外噪音。
其中,预设方向可以为预设的,也可以是由用户输入的。例如,手机的应用界面可以提供家庭环境或上下铺环境的选项;进而,手机在检测到用户针对家庭环境的选项的用户操作时,将水平方向确定为预设方向;在检测到针对上下铺环境的选项的用户操作时,将垂直方向确定为预设方向。
其中,预设距离可以为预设的,也可以是由用户输入的,本申请实施例对此不作限定。
可选地,调节请求包括松紧程度的指示信息,该指示信息用于指示目标程度。
可选地,目标程度是基于室外噪音的强度(如分贝值)确定的,其中,室外噪音强度越大,目标程度的松紧程度越紧。例如耳塞的松紧程度由松到紧依次为包括程度1、程度2和程度3,手机将室外噪音分为三个强度范围,分别为第一强度范围、第二强度范围和第三强度范围,其中,第一强度范围的分贝值小于第二强度范围的分贝值,第二强度范围的分贝值小于第三强度范围的分贝值;进而,手机在室外噪音的强度在第一强度范围内时,确定目标程度为程度1;在室外噪音的强度在第二强度范围内时,确定目标程度为程度2;在室外噪音的强度在第三强度范围内的,确定目标程度为程度3。
步骤S608:无线耳机响应于该调节请求,将耳塞的松紧程度调整至目标程度。
其中,无线耳机可以配置有耳塞,无线耳机可以控制耳塞的松紧程度。示例性的,该无线耳机可以为图3所示的无线耳机。
在一些实施例中,目标程度为预设程度;无线耳机在接收到该调节请求后,将无线耳机上耳塞的松紧程度调整至预设程度。例如,无线耳机上耳塞的松紧程度包括开启或未开启两种状态;无线耳机在接收到调节请求后,将该将耳塞的松紧程度调整为开启状态,该开启状态用于阻挡外界噪音。
在另一些实施例中,调节请求包括指示目标程度的指示信息。例如耳塞的松紧程度按照由松到紧依次为程度1、程度2和程度3,则无线耳机在接收到用于指示程度2的指示信息时,可以将耳塞的松紧程度调节至程度2。
在另一些实施例中,步骤S607中,手机在确定第一音频包括室外噪音时,可以不是向无线耳机发送调节请求,而是向无线耳机发送第二请求,该第二请求包括预设音频,该预设音频可以为白噪音或助眠音乐等,此处对预设音频不作限定。进而,步骤S608中为,无线耳机在接收到该预设音频后,响应于该第二请求,可以播放该预设音频。需要说明的是,该方法可以适用于不配置耳塞的无线耳机。
步骤S609:手机在确定第一音频包括室内噪音时,从接收到的用户数据中获取第一时间段的第一用户数据。
在一些实施例中,第一音频中包括多个音频信号;手机可以计算多个音频信号中每一个音频信号的到达方向和传播距离;在存在音频信号满足传播距离不超过预设距离和/或到达方向为预设方向时,确定第一音频中包括室内噪音。其中,确定室内噪音的具体内容可参见步骤S607中的相关内容。
步骤S610:手机识别第一音频中是否包括鼾声信号。
在一些实施例中,手机可以通过提取第一音频中音频信号的音频特征(频域特征和时域特征),在第一音频中不存在符合预设音频特征的音频信号时,确定该第一音频中不包括鼾声信号;在第一音频中存在符合预设音频特征的音频信号时,确定该第一音频中包括鼾声信号。
在一种实现中,手机可以通过将第一音频输入鼾声识别模型,得到识别结果,该识别结果包括第一音频存在鼾声信号或第一音频中不存在鼾声信号。其中,鼾声识别模型可以为机器学习模型或深度学习网络;该鼾声识别模型识别到的鼾声信号可以符合鼾声信号的音频特征,例如,鼾声信号的音频特征为基频为200~500Hz,和/或,基频在时域或频率上的分布规律满足预设分布规律。
进而,手机在识别第一音频中包括鼾声信号时,执行步骤S611;在该第一音频不包括鼾声信号时,确定该第一音频为室内噪音,手机可以向无线耳机发送第一请求,该第一请求用于将耳塞的松紧程度调整至第一程度。
在一种实现中,若手机已执行步骤S607,且目标程度与第一程度相同,则手机可以不向无线耳机发送第一请求;若手机未执行步骤S607,或者,已执行步骤S607且目标程度与第一程度不同,则手机可以向无线耳机发送第一请求。
步骤S611:手机在确定第一音频包括鼾声信号时,基于第一用户数据和第一音频,识别该鼾声信号的来源,该鼾声信号来源包括目标用户和非目标用户。
在一些实施例中,第一用户数据包括呼吸率,手机可以基于目标用户的呼吸率和第一音频的鼾声信号规律,判断该鼾声信号的来源。
在一种实现中,手机可以在确定第一音频中鼾声信号后,可以从第一音频中识别至少一组鼾声信号;确定至少一组鼾声信号的鼾声频次,该鼾声频次可以为一分钟内的鼾声信号次数;在目标用户的呼吸率与至少一组鼾声信号的鼾声频次相等时,确定该至少一组鼾声信号为该目标用户的鼾声信号,即鼾声信号来源包括目标用户;在目标用户的呼吸率与至少一组鼾声信号的鼾声频次不相等时,确定该至少一组鼾声信号为非目标用户的鼾声信号,即鼾声信号来源包括非目标用户。
应理解,第一音频的鼾声信号的来源可以仅包括目标用户、仅包括非目标用户以及同时包括目标用户和非目标用户。本申请实施例中,手机在识别到第一音频的鼾声信号的来源包括目标用户时,可以针对目标用户的鼾声信号执行以下步骤S612;在识别到第一音频的鼾声信号的来源包括非目标用户时,可以针对非目标用户的鼾声信号执行以下步骤S612执行以下步骤S615。也就是说,手机在识别到同时包括第一音频的鼾声信号的来源同时包括目标用户和非目标用户,可以同时分别对两个来源的鼾声执行不同的步骤。
例如,手机从第一音频中识别两组鼾声信号,其中,第一组鼾声信号为目标用户的鼾声信号;第二组鼾声信号为非目标用户的鼾声信号,则手机可以针对第一组鼾声信号执行以下步骤S612;针对第二组鼾声信号执行以下步骤S615。
请参见图7,图7是本申请实施例提供的一种识别鼾声来源的示意图。如图7所示,手机从第一音频中识别到存在一组鼾声信号在一分钟内的鼾声次数为N,手机接收到智能手表采集到的目标用户的呼吸率为每分钟M次,M和N均为正整数;那么,手机可以在M与N的差值为预设差值时,确定第一音频包括目标用户的鼾声;反之,确定第一音频中不包括目标用户的鼾声。
其中,手机可以基于鼾声信号的频率(即鼾声信号间隔)和/或强度频率从第一音频中识别多组鼾声信号,例如,手机可以将强度相近且鼾声信号间隔规律的鼾声信号确定为同一组鼾声信号。
可选地,手机还可以基于鼾声信号的传播距离判断是否为目标用户鼾声信号。
步骤S612:手机在确定鼾声信号的来源包括非目标用户时,基于非目标用户的鼾声音频生成降噪音频。
其中,降噪音频与非目标用户的鼾声音频的相位相反且强度相同。
在一些实施例中,手机在确定第一音频中包含非目标用户的鼾声信号时,从第一音频中获取非目标用户的鼾声音频;提取非目标用户的鼾声音频中鼾声信号的波形,生成与该波形匹配的降噪音频。其中,波形匹配可以是指第一音频和非目标用户的鼾声音频的相位相反且强度相同。
在一些实施例中,手机在确认第一音频中仅包括非目标用户的鼾声信号时,提取第一音频中鼾声信号的波形,生成与该波形匹配的降噪音频。
步骤S613:手机向无线耳机发送播放请求,该播放请求包括降噪音频,该播放请求用于请求播放降噪音频。
步骤S614:无线耳机响应于该播放请求,播放降噪音频。
在一些实施例中,无线耳机在接收到该降噪音频,可以重复播放该降噪音频。
步骤S615:手机在确定鼾声信号的来源包括目标用户时,基于目标用户的用户数据和目标用户的鼾声信号判断鼾声情况,该鼾声情况包括异常和正常。
在一些实施例中,手机可以从第一音频中提取目标用户的鼾声信号;进而,在该鼾声信号符合预设条件时,确定该鼾声信号存在异常;在确定该鼾声信号不符合预设条件时,认为该鼾声信号正常。需要说明的是,手机在识别到异常的鼾声信号时,也即是鼾声情况异常;手机在识别到正常的鼾声信号时,也即是鼾声情况正常。
其中,预设条件可以包括以下至少一项:连续两次鼾声信号的强度差值超过预设强度差值,例如鼾声信号突然增强或突然减少,其中,强度可以为分贝大小;连续两次鼾声信号之间的间隔时长超过预设间隔时长,其中,预设间隔时长可以为预先设置的时长;鼾声信号的时长与多个鼾声信号的平均时长的差值大于预设时长差值,例如鼾声信号打到一半的情况。
在另一些实施例中,手机可以在鼾声信号符合预设条件且血氧值低于预设阈值时,确定该鼾声信号存在异常。需要说明的是,血氧值低的情况下,异常鼾声出现概率较大。
请参见图8A,图8A是本申请实施例提供的一种判断鼾声信号情况的示意图。如图8A所示,横轴为时间,纵轴为强度。手机可以计算前后两个鼾声之间的强度差值,如鼾声1和鼾声2之间的强度差值为n1分贝,鼾声2和鼾声3之间的强度差值为n2分贝。若预设强度差值为n,那么,手机在识别n1<n时,可以确定鼾声2为正常鼾声,也即是确定当前鼾声情况正常;手机在识别n2>n时,可以确定鼾声3为异常鼾声,也即是确定当前鼾声情况异常。
请参见图8B,图8B是本申请实施例提供的一种判断鼾声信号情况的示意图。如图8B所示,预设间隔时长为T1,鼾声1与鼾声2的间隔时长为Ta,鼾声2与鼾声3的间隔时长为Tb,鼾声3与鼾声4的间隔时长为Tc。手机在识别到Ta<T1时,可以确定鼾声2为正常鼾声,即当前鼾声情况为正常;手机在识别到Tb<T1时,可以确定鼾声3为正常鼾声,即当前鼾声情况为正常;手机在识别到Tc>T1时,可以确定鼾声4为正常鼾声,即当前鼾声情况为异常。
请参见图8C,图8C是本申请实施例提供的一种判断鼾声信号情况的示意图。如图8C所示,平均时长为t,鼾声1的时长为ta,鼾声2的时长为tb,鼾声3的时长为tc。手机在识别到ta和t的差值小于预设时长差值q时,可以确定鼾声1为正常鼾声,即当前鼾声情况为正常;手机在识别到tb和t的差值小于预设时长差值q时,可以确定鼾声2为正常鼾声,即当前鼾声情况为正常;手机在识别到tb和t的差值大于预设时长差值q时,可以确定鼾声3为异常鼾声即当前鼾声情况为异常。需要说明的是,图8B和图8C仅为示例性示出的鼾声信号(如鼾声1)的分贝最高值所在的时刻,图8B和图8C的鼾声也可以画成如图8A所示的波形图,也就是说,本申请实施例中的一个鼾声信号具体可以为一段鼾声信号。
步骤S616:手机在确定目标用户的鼾声情况为异常时,提示目标用户。
在一些实施例中,手机在确定鼾声信号异常时,可以通过第一提示方式提示目标用户;在目标用户的鼾声信号正常时,停止提示。其中,第一提示方式可以为通过无线耳机或智能手表以第一强度执行电击或震动。
例如,手机在确定鼾声信号异常时,向穿戴设备发送第一提示请求,该第一提示请求用于请求以第一强度执行电击或震动;进而,手机在确定鼾声信号的情况为正常时,向穿戴设备发送停止请求,该停止请求用于请求停止电击或震动。其中,穿戴设备可以为上述无线耳机或上述智能手表。
在另一些实施例中,手机在确定鼾声信号异常时,可以通过第二提示方式提示目标用户;在确定目标用户为清醒状态时,停止提示。其中,第二提示方式可以为通过无线耳机或智能手表以第二强度执行电击或震动。其中,第二强度与上述第一强度可以相等,也可以不等。其中,穿戴设备可以为上述无线耳机或上述智能手表。
例如,手机在确定鼾声信号异常时,向穿戴设备发送第二提示请求,该第二提示请求用于请求以第二强度执行电击或震动;进而,手机在确定目标用户为清醒状态时,向穿戴设备发送停止请求,该停止请求用于请求停止电击或震动。
可选地,手机可以通过穿戴设备发送的用户数据确定用户是否清醒,例如在目标用户的心率的速度增加到预设速度时,确定目标用户为清醒状态;手机也可以在接收到针对用户界面55上的结束控件553的用户操作时,确定目标用户为清醒状态。此处对确定目标用户为清醒状态的方法不做限定。
在又一些实施例中,手机在确定鼾声信号异常时,可以通过第一提示方式提示目标用户;在预置时长后,若目标用户的鼾声信号的情况仍为异常,则可以通过第二提示方式提示目标用户;在确定目标用户为清醒状态时,停止提示。其中,第一提示方式可以为通过无线耳机或智能手表以第一强度执行电击或震动;第二提示方式可以为通过无线耳机或智能手表以第二强度执行电击或震动;第二强度大于第一强度。
可选地,手机可以通过手机的扬声器或无线耳机的麦克风播放预设音频以唤醒目标用户。需要说明的是,本申请实施例对唤醒目标用户的方式不做限定。
基于图2B所示的系统,图9示例性提供了一种音频处理方法,该方法中,示例性的以图2B中的第一设备21为手机,第二设备22为无线耳机为例进行说明,目标用户为佩戴无线耳机的用户。
请参见图9,图9是本申请提供的另一种音频处理方法的整体流程示意图。该方法可以包括以下步骤:
S901:手机响应于开启睡眠降噪的用户操作,向无线耳机发送获取请求。
其中,该获取请求用于请求获取无线耳机录制的音频和采集的用户数据。
在一些实施例中,手机可以显示相关界面,如图5C所示的用户界面53,该用户界面53可以包括确定控件535。进而,手机在检测到针对确定控件535的用户操作时,向无线耳机发送获取请求。
其中,手机检测开启睡眠降噪的用户操作的具体实现可以参加步骤S601的相关内容。
S902:无线耳机响应于获取请求,通过麦克风开始录制音频,以及采集用户数据。
其中,目标用户的用户数据可以包括目标用户的生理参数,该生理参数可以包括呼吸特征参数,呼吸特征参数用于确定用户的呼吸规律,例如,呼吸特征参数可以为呼吸率、心率、脉搏中的至少一个。其中,呼吸率即呼吸频率,例如呼吸率可以为人体每分钟完成一次呼吸的频率,也可以是人体每分钟的呼吸次数。
可选的,用户数据还可以包括辅助特征参数,该辅助特征用于辅助判断异常鼾声,例如辅助特征参数为血氧。
在一些实施例中,无线耳机响应于获取请求,通过麦克风开始录制音频,以及采集用户数据。具体实现可以参见上文中步骤S602至步骤S605的相关内容,此处不再赘述。
S903:无线耳机向手机发送响应消息,该响应消息包括录制的音频和采集的用户数据。
在一些实施例中,无线耳机可以实时或间隔预设时长向手机发送响应消息,响应消息包括无线耳机实时录制的音频和采集的用户数据。
在另一些实施例中,无线耳机可以间隔预设时长向手机发送响应消息,响应消息包括无线耳机预设时长内录制的音频和采集的用户数据。
S904:手机从接收到的音频中获取第一时间段的第一音频。
步骤S904的具体实现可以参见上文中步骤S606的相关内容。
S905:手机在确定第一音频中包括室外噪音时,向无线耳机发送调节请求。
步骤S904的具体实现可以参见上文中步骤S607的相关内容。
S906:无线耳机响应于该调节请求,将耳塞的松紧程度调整至目标程度。
步骤S904的具体实现可以参见上文中步骤S608的相关内容。
S907:手机在确定第一音频包括室内噪音时,从接收到的用户数据中获取第一时间段的第一用户数据。
步骤S904的具体实现可以参见上文中步骤S609的相关内容。
S908:手机识别第一音频中是否包括鼾声信号。
步骤S904的具体实现可以参见上文中步骤S610的相关内容。
S909:手机在确定第一音频包括鼾声信号时,基于第一用户数据和第一音频,识别该鼾声信号的来源。
步骤S904的具体实现可以参见上文中步骤S611的相关内容。
S910:手机在确定鼾声信号的来源包括非目标用户时,基于非目标用户的鼾声音频生成降噪音频。
步骤S904的具体实现可以参见上文中步骤S612的相关内容。
S911:手机向无线耳机发送播放请求,该播放请求包括降噪音频。
S912:无线耳机响应于播放请求,播放降噪音频。
步骤S904的具体实现可以参见上文中步骤S614的相关内容。
S913:手机在确定鼾声信号的来源包括目标用户时,基于目标用户的用户数据和目标用户的鼾声信号判断鼾声情况。
步骤S904的具体实现可以参见上文中步骤S615的相关内容。
S914:手机在确定目标用户的鼾声情况为异常时,提示目标用户。
在一些实施例中,手机在确定鼾声信号异常时,向无线耳机发送第一提示请求,该第一提示请求用于请求以第一强度执行电击或震动;进而,手机在确定鼾声信号的情况为正常时,向无线耳机发送停止请求,该停止请求用于请求停止电击或震动。
在另一些实施例中,手机在确定鼾声信号异常时,向无线耳机发送第二提示请求,该第二提示请求用于请求以第二强度执行电击或震动;进而,手机在确定目标用户为清醒状态时,向无线耳机发送停止请求,该停止请求用于请求停止电击或震动。
可选地,手机可以通过无线耳机发送的用户数据确定用户是否清醒,例如在目标用户的心率的速度增加到预设速度时,确定目标用户为清醒状态;手机也可以在接收到针对用户界面55上的结束控件553的用户操作时,确定目标用户为清醒状态。此处对确定目标用户为清醒状态的方法不做限定。
在又一些实施例中,手机在确定鼾声信号异常时,向无线耳机发送第一提示请求,该第一提示请求用于请求以第一强度执行电击或震动;在预置时长后,若目标用户的鼾声信号的情况仍为异常,则向无线耳机发送第二提示请求,该第二提示请求用于请求以第二强度执行电击或震动;在确定目标用户为清醒状态时,停止提示。其中,第二强度大于第一强度。
可选地,手机也可以通过手机的扬声器或无线耳机的麦克风播放预设音频以唤醒目标用户。需要说明的是,本申请实施例对唤醒目标用户的方式不做限定。
在一些实施例中,第一设备可以不考虑同时存在目标用户的鼾声和非目标用户的鼾声的情况,具体可参见图10所示的方法。
请参见图10,图10是本申请实施例提供的又一种音频处理方法的流程示意图。
如图10所示,第一设备执行步骤S1,即获取音频,计算该音频中噪音的传播距离和到达方向,进而,基于该噪音的传播距离和到达方向判断该噪音是否来自室内。其中,第一设备获取音频和判断噪音是否来自室内的具体实现可以参见上文中的相关描述。
进而,第一设备在确定噪音来自室内时,执行步骤S2,即判断该噪声是否为鼾声。第一设备在确定噪音来自室外时,执行步骤S3,即控制第二设备调整耳塞松紧程度,进行被动式降噪。
进而,第一设备在确定该噪声为鼾声时,执行步骤S4,即从该音频中提取鼾声规律,将该鼾声规律与用户的生理参数进行匹配,判断该鼾声是否为本人鼾声。第一设备确定该噪声不为鼾声时,执行步骤S5,即播放与该鼾声匹配的降噪音频,进行主动式降噪。
进而,第一设备在确定鼾声为本人鼾声时,执行步骤S6,即基于鼾声信号强度和稳定性判断鼾声是否存在异常。第一设备在鼾声不为本人鼾声时,执行步骤S5,即播放与该鼾声匹配的降噪音频,进行主动式降噪。其中,鼾声信号强度和稳定性是指鼾声信号强度变化以及鼾声规律变化,具体可参见上文中步骤S615的相关内容;该降噪音频为与上述音频相位相反且强度相同的音频。
进而,第一设备在确定鼾声存在异常时,执行步骤S7,即通过震动或弱电击等方式刺激用户,判断鼾声异常是否恢复。第一设备在鼾声不存在异常时,结束对该音频的处理。
进而,第一设备在鼾声异常没有恢复时,执行步骤S8,即逐渐加强震动(或电击)的强度或时长,判断用户是否清醒。第一设备在鼾声不存在异常时,结束对该音频的处理。
进而,第一设备在确定用户清醒时,结束对该音频的处理。第一设备在确定用户未清醒时,执行步骤S7。
请参见图11,图11是本申请提供的一种音频处理装置110的示意图。如图11所示,该音频处理装置110可以包括鼾声唤醒模块1101、鼾声识别模块1102以及鼾声处理模块1103。
其中:
鼾声唤醒模块1101用于:接收用户操作,响应于用户操作,获取音频和目标用户的用户数据;将获取的音频和用户数据发送至鼾声识别模块1102。
例如,鼾声唤醒模块1101位于第一设备侧,可以显示相关用户界面,接收作用于相关用户界面上开启鼾声识别和降噪功能的用户操作,控制手表、手机等电子设备进行睡眠监测;在识别到用户进入睡眠状态时,控制上述电子设备录制音频和用户数据,将录制的音频和用户数据发送至鼾声识别模块1102;在识别到用户进入睡眠状态时,控制鼾声识别模块1102和鼾声处理模块1103关闭鼾声识别和降噪功能。
示例性的,鼾声唤醒模块1101执行的步骤可以为上文中的步骤S601和S603。
鼾声识别模块1102用于:基于录制的音频和用户数据识别采集到的音频中的鼾声类型,其中,鼾声类型包括环境噪音、目标用户的鼾声、非目标用户的鼾声,其中,环境噪音包括室内噪音和室外噪音,目标用户的鼾声包括正常鼾声和异常鼾声。需要说明的是,本申请实施例中的环境噪音可以为除鼾声外的其它音频信号。
示例性的,鼾声识别模块1102执行的步骤可以为上文中的步骤S610、S611和S615。
鼾声处理模块1103用于:根据鼾声类别确定干预方式。
例如,在鼾声处理模块1103在鼾声识别模块1102判断存在非目标用户的鼾声时,进行主动和被动降噪处理;在鼾声处理模块1103在鼾声识别模块1102判断存在目标用户的鼾声时,且鼾声异常情况下,通过耳机震动或弱电击方式刺激目标用户,或者在目标用户佩戴手表,手环等穿戴设备时,可通过穿戴设备上的振动装置刺激打鼾者。
示例性的,鼾声处理模块1103执行的步骤可以为上文中的步骤S612、S613和S616。
可以理解的,本申请各个装置实施例中,对多个单元或者模块的划分仅是一种根据功能进行的逻辑划分,不作为对装置具体的结构的限定。在具体实现中,其中部分功能模块可能被细分为更多细小的功能模块,部分功能模块也可能组合成一个功能模块,但无论这些功能模块是进行了细分还是组合,装置110在音频处理的过程中所执行的大致流程是相同的。通常,每个单元都对应有各自的程序代码(或者程序指令),这些单元各自对应的程序代码在处理器上运行时,使得该单元相应的流程从而实现相应功能。
本申请实施例还提供了一种电子设备,电子设备包括一个或多个处理器和一个或多个存储器;其中,一个或多个存储器与一个或多个处理器耦合,一个或多个存储器用于存储计算机程序代码,计算机程序代码包括计算机指令,当一个或多个处理器执行计算机指令时,使得电子设备执行上述实施例描述的方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述实施例描述的方法。
本申请实施例还提供了一种计算机可读存储介质,包括指令,当指令在电子设备上运行时,使得电子设备执行上述实施例描述的方法。
可以理解的是,本申请的各实施方式可以任意进行组合,以实现不同的技术效果。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid StateDisk)等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。
总之,以上所述仅为本申请技术方案的实施例而已,并非用于限定本申请的保护范围。凡根据本申请的揭露,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (14)

1.一种音频处理方法,其特征在于,所述方法包括:
第一设备获取第一音频和第一用户数据;所述第一音频包括第一鼾声信号组;所述第一音频为第一时间段录制的音频;所述第一用户数据为所述第一时间段采集的目标用户的呼吸特征参数;所述第一鼾声信号组包括多个鼾声信号;
所述第一设备在确定所述第一鼾声信号组的鼾声信号规律和所述第一用户数据不匹配时,确定所述第一鼾声信号组为非目标用户的鼾声信号;
所述第一设备基于所述第一鼾声信号组对应的第二音频生成降噪音频,所述降噪音频与所述第二音频的相位相反且强度相同;
所述第一设备向第二设备发送所述降噪音频,所述第二设备用于播放所述降噪音频。
2.根据权利要求1所述的方法,其特征在于,所述第一鼾声信号组的鼾声信号规律为第二时间段内所述第一鼾声信号组的鼾声信号次数;所述第一用户数据为所述第二时间段内所述目标用户的呼吸次数;所述第一设备在确定所述第一鼾声信号组的鼾声信号规律和所述第一用户数据不匹配时,确定所述第一鼾声信号组为非目标用户的鼾声信号,包括:
所述第一设备在确定所述鼾声信号次数和所述呼吸次数的次数之差超过预设次数时,确定所述第一鼾声信号组为所述非目标用户的鼾声信号。
3.根据权利要求1或2所述的方法,其特征在于,所述第一用户数据为第三设备发送至所述第一设备的数据;在所述第一设备获取第一音频和第一用户数据之前,所述方法还包括:
所述第一设备向所述第三设备发送睡眠监测请求,所述睡眠监测请求用于请求所述目标用户的睡眠状态;所述目标用户为所述第三设备的佩戴者;
所述第一设备接收所述第三设备发送的响应消息,所述响应消息用于指示所述目标用户已进入睡眠状态;
所述第一设备在接收所述响应消息后,向所述第二设备发送录音请求,以及向所述第三设备发送获取请求,所述录音请求用于请求获取所述第二设备录制的音频,所述录制的音频包括所述第一音频;所述获取请求用于请求获取所述第三设备采集的用户数据,所述采集的用户数据包括所述第一用户数据。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一音频中包括多个音频信号;所述方法还包括:
所述第一设备确定所述多个音频信号中每一个音频信号的到达方向和传播距离;所述多个音频信号包括第一音频信号;
所述第一设备在确定所述第一音频信号满足传播距离超过预设距离和到达方向为非预设方向中的至少一个时,向所述第二设备发送调节请求;
所述调节请求可以包括第一指示信息或第二指示信息,所述第一指示信息用于指示所述第二设备将所述第二设备的耳塞的松紧程度调整至目标程度,所述第二指示信息用于指示播放预设音频。
5.一种音频处理方法,其特征在于,所述方法包括:
第一设备获取第一音频和第一用户数据;所述第一音频包括第二鼾声信号组;所述第一音频为第一时间段录制的音频;所述第一用户数据为所述第一时间段采集的目标用户的呼吸特征参数;所述第二鼾声信号组包括多个鼾声信号;
所述第一设备在确定所述第二鼾声信号组的鼾声信号规律和所述第一用户数据匹配时,确定所述第二鼾声信号组为所述目标用户的鼾声信号;
所述第一设备在识别到所述目标用户的鼾声信号中存在异常鼾声时,提示所述目标用户。
6.根据权利要求5所述的方法,其特征在于,所述第二鼾声信号组的鼾声信号规律为第二时间段内所述第二鼾声信号组的鼾声信号次数;所述第一用户数据为所述第二时间段内所述目标用户的呼吸次数;所述第一设备在确定所述第二鼾声信号组的鼾声信号规律和所述第一用户数据匹配时,确定所述第二鼾声信号组为所述目标用户的鼾声信号,包括:
所述第一设备在确定所述鼾声信号次数和所述呼吸次数的次数之差不超过预设次数时,确定所述第二鼾声信号组为所述目标用户的鼾声信号。
7.根据权利要求5或6所述的方法,其特征在于,所述目标用户的鼾声信号包括第一信号;所述方法还包括:
所述第一设备在识别到所述第一信号符合预设条件时,确定所述第一信号为所述异常鼾声;
其中,所述预设条件包括所述第一信号和第二信号的强度差值超过预设强度差值、所述第一信号和所述第二信号之间的间隔时长超过预设间隔时长、所述第一信号的时长与所述目标用户的多个鼾声信号的平均时长的差值大于预设时长差值中的至少一个;所述第二信号为所述目标用户的鼾声信号中所述第一信号的前一个鼾声信号。
8.根据权利要求5-7任一项所述的方法,其特征在于,所述第一音频还包括第一鼾声信号组,所述方法还包括:
所述第一设备在确定所述第一鼾声信号组的鼾声信号规律和所述第一用户数据不匹配时,基于所述第一鼾声信号组对应的第二音频生成降噪音频,所述降噪音频与所述第二音频的相位相反且强度相同;
所述第一设备向第二设备发送所述降噪音频,所述第二设备用于播放所述降噪音频,所述目标用户为佩戴所述第二设备的用户。
9.根据权利要求5-8任一项所述的方法,其特征在于,所述提示所述目标用户,包括:
所述第一设备向第三设备发送第一提示请求,所述第一提示请求用于请求以第一强度执行电击或震动;
在所述提示所述目标用户之后,所述方法还包括:
所述第一设备在未识别到异常鼾声时,向所述第三设备发送停止请求,所述停止请求用于请求停止电击或震动。
10.根据权利要求9所述的方法,其特征在于,在所述提示所述目标用户之后,所述方法还包括:
所述第一设备在预设时间段内识别的鼾声信号均为异常鼾声时,向所述第三设备发送第二提示请求,所述第二提示请求用于请求以第二强度执行电击或震动;所述第一强度小于所述第二强度。
11.根据权利要求5-10任一项所述的方法,其特征在于,在所述第一设备获取第一音频和第一用户数据之前,所述方法还包括:
所述第一设备向第三设备发送睡眠监测请求,所述睡眠监测请求用于请求所述目标用户的睡眠状态;所述目标用户为所述第三设备的佩戴者;
所述第一设备接收所述第三设备发送的响应消息,所述响应消息用于指示所述目标用户已进入睡眠状态;
所述第一设备在接收所述响应消息后,向所述第二设备发送录音请求,以及向所述第三设备发送获取请求,所述录音请求用于请求获取所述第二设备录制的音频,所述录制的音频包括所述第一音频;所述获取请求用于请求获取所述第三设备采集的用户数据,所述采集的用户数据包括所述第一用户数据。
12.根据权利要求5-11任一项所述的方法,其特征在于,所述第一音频中包括多个音频信号;所述方法还包括:
所述第一设备确定所述多个音频信号中每一个音频信号的到达方向和传播距离;所述多个音频信号包括第一音频信号;
所述第一设备在确定所述第一音频信号满足传播距离超过预设距离和到达方向为非预设方向中的至少一个时,向第二设备发送调节请求;
所述调节请求可以包括第一指示信息或第二指示信息,所述第一指示信息用于指示所述第二设备将所述第二设备的耳塞的松紧程度调整至目标程度,所述第二指示信息用于指示播放预设音频。
13.一种电子设备,其特征在于,所述电子设备包括一个或多个处理器和一个或多个存储器;其中,所述一个或多个存储器与所述一个或多个处理器耦合,所述一个或多个存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述一个或多个处理器执行所述计算机指令时,使得所述电子设备执行如权利要求1-12中任一项所述的方法。
14.一种计算机可读存储介质,包括指令,其特征在于,当所述指令在电子设备上运行时,使得所述电子设备执行如权利要求1-12中任一项所述的方法。
CN202211500553.4A 2022-11-28 2022-11-28 一种音频处理方法、设备及系统 Pending CN118098261A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211500553.4A CN118098261A (zh) 2022-11-28 2022-11-28 一种音频处理方法、设备及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211500553.4A CN118098261A (zh) 2022-11-28 2022-11-28 一种音频处理方法、设备及系统

Publications (1)

Publication Number Publication Date
CN118098261A true CN118098261A (zh) 2024-05-28

Family

ID=91157962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211500553.4A Pending CN118098261A (zh) 2022-11-28 2022-11-28 一种音频处理方法、设备及系统

Country Status (1)

Country Link
CN (1) CN118098261A (zh)

Similar Documents

Publication Publication Date Title
EP3974970A1 (en) Full-screen display method for mobile terminal, and apparatus
EP4167590A1 (en) Earphone noise processing method and device, and earphone
CN112399390B (zh) 一种蓝牙回连的方法及相关装置
WO2022002110A1 (zh) 一种模式控制方法、装置及终端设备
WO2021083128A1 (zh) 一种声音处理方法及其装置
CN113571035B (zh) 降噪方法及降噪装置
CN111065020B (zh) 音频数据处理的方法和装置
CN114125793A (zh) 一种蓝牙数据传输方法及相关装置
CN113129916B (zh) 一种音频采集方法、系统及相关装置
EP4395290A1 (en) Bluetooth audio playback method, electronic device, and storage medium
CN116048831B (zh) 一种目标信号处理方法和电子设备
WO2022089563A1 (zh) 一种声音增强方法、耳机控制方法、装置及耳机
CN113467747B (zh) 音量调节方法、电子设备及存储介质
CN118098261A (zh) 一种音频处理方法、设备及系统
CN115022807A (zh) 快递信息提醒方法和电子设备
CN116708630B (zh) 闹钟设置方法及终端设备
WO2024046416A1 (zh) 一种音量调节方法、电子设备及系统
CN115706752B (zh) 来电音量控制方法、电子设备及存储介质
WO2023020420A1 (zh) 音量显示方法、电子设备及存储介质
CN113630501B (zh) 响铃方法及终端设备
CN111026285B (zh) 一种调节压力阈值的方法及电子设备
CN115394437A (zh) 一种呼吸系统疾病筛查的方法及相关装置
CN114420160A (zh) 处理音频信号的方法和装置
CN117796760A (zh) 一种睡眠质量预测方法、电子设备及系统
CN117528370A (zh) 信号处理方法及装置、设备控制方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination