CN116208700A - 一种手机与音频设备通信的控制方法和系统 - Google Patents
一种手机与音频设备通信的控制方法和系统 Download PDFInfo
- Publication number
- CN116208700A CN116208700A CN202310451176.8A CN202310451176A CN116208700A CN 116208700 A CN116208700 A CN 116208700A CN 202310451176 A CN202310451176 A CN 202310451176A CN 116208700 A CN116208700 A CN 116208700A
- Authority
- CN
- China
- Prior art keywords
- sound
- adjustment
- parameters
- audio device
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/02—Constructional features of telephone sets
- H04M1/20—Arrangements for preventing acoustic feed-back
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
- H04M1/605—Portable telephones adapted for handsfree use involving control of the receiver volume to provide a dual operational mode at close or far distance from the user
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Abstract
本说明书实施例提供一种手机与音频设备通信的控制方法,该方法由手机中的处理器执行,包括:通过蓝牙网络、WIFI网络、有线连接中的一种或多种连接方式,将手机与音频设备进行连接;响应于接收到当前用户的播放指令,向音频设备发送预设声音参数,控制音频设备基于预设声音参数播放声音;在音频设备基于预设声音参数播放声音的过程中,实时执行声音参数调节方法,其中,声音参数调节方法包括:获取调整反馈,调整反馈通过手机和/或音频设备中部署的传感器采集,调整反馈至少包括环境反馈;基于调整反馈,确定音频设备的声音参数的调整特征;向音频设备发送调整特征,控制音频设备基于调整特征对声音参数进行调整。
Description
技术领域
本说明书涉及通信技术领域,特别涉及一种手机与音频设备通信的控制方法和系统。
背景技术
在日常的手机应用过程中,经常涉及到使用音频播放器等音频设备的应用场景,如听音乐、看视频、语音交流、视频交流等。而用户在上述应用场景下所处的环境可能是不同的,例如有安静舒适的环境、也有喧哗嘈杂的环境,为了在不同的环境中保持良好的听觉体验,通常需要根据不同的环境情况对手机的音频设备的音量进行调节。并且,不同的用户可能习惯或感到舒适的声音参数是不同的。用户在有音量调节需求的时候,往往是通过手动操作进行,但手动调节在某些情况下不是很方便,并且调节的及时性也难以保证。
CN101640518A提供了一种根据环境声音自动调整播放音量的系统及其方法,能够检测外界环境声音的变化,根据外界声音变化对播放音量进行调整。但CN101640518A提供的方法仅仅考虑了外界环境对用户听觉体验的影响,未考虑到不同用户可能在相同环境中对声音参数的需求也不同的,声音调整方法无法与不同的用户相匹配。
因此,希望提供一种手机与音频设备通信的控制方法和系统,提高声音调节的准确性和合理性。
发明内容
本说明书一个或多个实施例提供一种手机与音频设备通信的控制方法,所述方法由所述手机中的处理器执行,包括:通过蓝牙网络、WIFI网络、有线连接中的一种或多种连接方式,将所述手机与所述音频设备进行连接;响应于接收到当前用户的播放指令,向所述音频设备发送预设声音参数,控制所述音频设备基于所述预设声音参数播放声音;在所述音频设备基于所述预设声音参数播放声音的过程中,实时执行声音参数调节方法,所述声音参数调节方法包括:获取调整反馈,所述调整反馈通过所述手机和/或所述音频设备中部署的传感器采集,所述调整反馈至少包括环境反馈,所述环境反馈包括环境声数据;基于所述调整反馈,确定所述音频设备的声音参数的调整特征,所述调整特征至少包括调整量,所述声音参数至少包括音量和均衡器参数;向所述音频设备发送所述调整特征,控制所述音频设备基于所述调整特征对所述声音参数进行调整。
本说明书一个或多个实施例提供一种手机与音频设备通信的控制系统,所述系统包括:连接模块,用于通过蓝牙网络、WIFI网络、有线连接中的一种或多种连接方式,将所述手机与所述音频设备进行连接;控制模块,用于响应于接收到当前用户的播放指令,向所述音频设备发送预设声音参数,控制所述音频设备基于所述预设声音参数播放声音;调节模块,用于在所述音频设备基于所述预设声音参数播放声音的过程中,实时执行声音参数调节方法,所述调节模块包括:获取单元,用于获取调整反馈,所述调整反馈通过所述手机和/或所述音频设备中部署的传感器采集,所述调整反馈至少包括环境反馈,所述环境反馈包括环境声数据;确定单元,用于基于所述调整反馈,确定所述音频设备的声音参数的调整特征,所述调整特征至少包括调整量,所述声音参数至少包括音量和均衡器参数;控制单元,用于向所述音频设备发送所述调整特征,控制所述音频设备基于所述调整特征对所述声音参数进行调整。
本说明书一个或多个实施例提供一种手机与音频设备通信的控制装置,包括至少一个存储器和至少一个处理器;所述至少一个存储器存储计算机指令,所述至少一个处理器用于执行所述计算机指令中的部分指令,以实现上述实施例中任意一项所述的手机与音频设备通信的控制方法。
本说明书一个或多个实施例提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机运行上述实施例中任意一项所述的手机与音频设备通信的控制方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的手机与音频设备通信的控制系统的示例性模块图;
图2是根据本说明书一些实施例所示的手机与音频设备通信的控制方法的示例性流程图;
图3是根据本说明书一些实施例所示的确定预设声音参数的示例性流程图;
图4是根据本说明书一些实施例所示的确定声音参数的调整特征的示例性流程图;
图5是根据本说明书一些实施例所示的基于优选声音参数确定模型确定优选声音参数的示例性示意图;
图6是根据本说明书一些实施例所示的确定调整平滑度的示例性流程图。
实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
在不同的环境中,用户对声音参数(如音色、音量、音调)的需求是不同的。例如,在安静舒适的环境中,用户所需的音量比在喧哗嘈杂的环境中更小;同时喧哗嘈杂的环境可能使得用户产生烦躁的情绪,可能更适合舒缓温柔一点的音色。并且,不同的用户,即使在相同的环境情况下,所需的声音参数也是不同的,有的用户习惯声音音量高一点,而有的用户则习惯低一点的音量。而且不同年龄段、不同性格特征、不同心理状态下的用户,其对声音参数的需求也不同,甚至在不同的时间段,用户对声音参数的需求也不同。还有的用户可能对不同的播放内容也会有不同的声音参数需求,例如听音乐和语音聊天,用户可能听音乐时喜欢音量低一点、舒缓一点;语音聊天时则要求音量大一点。因此,对手机的音频设备的声音参数调节需要考虑的影响因素存在多种。
CN101640518A提供的方法仅仅考虑了外界环境声音变化对用户听觉体验的影响,可能调节的声音参数准确性不够、也无法适应不同用户的需求。本说明书一些实施例提供了一种手机与音频设备通信的控制方法和系统,通过综合考虑各种可能影响声音参数调节的因素,并针对不同用户提取各种影响因素的深层次特征,以进行手机的音频设备的声音参数的实时调节、自动调节,可以提高手机的音频设备的声音参数调节的准确性和合理性,提升用户体验。
图1是根据本说明书一些实施例所示的手机与音频设备通信的控制系统的示例性模块图。在一些实施例中,所述手机与音频设备通信的控制系统100可以包括连接模块110、控制模块120、调节模块130。
连接模块110可以用于通过蓝牙网络、WIFI网络、有线连接中的一种或多种连接方式,将手机与音频设备进行连接。具体连接方式可以参见图2及其相关描述。
控制模块120可以用于响应于接收到当前用户的播放指令,向音频设备发送预设声音参数,控制音频设备基于预设声音参数播放声音。
在一些实施例中,控制模块120可以进一步用于获取播放场景特征,播放场景特征包括时间特征、位置特征、手机的被移动特征、播放内容特征;被移动特征基于第一预设时间内手机的定位信息确定,播放内容特征包括当前用户当前将要播放的内容的类型;基于播放场景特征,通过向量数据库确定一个或多个候选声音参数;基于一个或多个候选声音参数,确定预设声音参数。关于确定预设声音参数的更多内容可以参见图3及其相关描述。
调节模块130可以用于在音频设备基于预设声音参数播放声音的过程中,实时执行声音参数调节方法。在一些实施例中,声音参数调节方法可以通过调节模块130确定。
在一些实施例中,如图1所示,调节模块130可以包括获取单元132、确定单元134和控制单元136。获取单元132可以用于获取调整反馈,调整反馈通过手机和/或音频设备中部署的传感器采集,调整反馈至少包括环境反馈,环境反馈包括环境声数据。确定单元134可以用于基于调整反馈,确定音频设备的声音参数的调整特征,调整特征至少包括调整量,声音参数至少包括音量和均衡器参数。控制单元136可以用于向音频设备发送调整特征,控制音频设备基于调整特征对声音参数进行调整。更多关于确定声音参数调节方法的内容可以参见图2及其相关描述。
在一些实施例中,确定单元134可以进一步用于基于调整反馈,通过优选声音参数确定模型确定优选声音参数;基于优选声音参数,确定音频设备的声音参数的调整量。更多关于确定调整量的内容可以参见图4、图5及其相关描述。
在一些实施例中,调整特征还可以包括调整平滑度,调整平滑度是指将当前声音参数调整至优选声音参数的平滑程度。在一些实施例中,确定单元134可以进一步用于基于一个或多个未来时刻的环境声数据与当前时刻的环境声数据,确定环境声变化度;基于环境声变化度,确定调整平滑度。更多关于确定调整平滑度的内容可以参见图6及其相关描述。
需要注意的是,以上对于手机与音频设备通信的控制系统及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。在一些实施例中,图1中披露的连接模块110、控制模块120、调节模块130可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。例如,各个模块可以共用一个存储模块,各个模块也可以分别具有各自的存储模块。诸如此类的变形,均在本说明书的保护范围之内。
图2是根据本说明书一些实施例所示的手机与音频设备通信的控制方法的示例性流程图。在一些实施例中,流程200可以由处理器执行。如图2所示,流程200包括下述步骤:
步骤210,通过蓝牙网络、WIFI网络、有线连接中的一种或多种连接方式,将手机与音频设备进行连接。
有线连接即需要网络接口、网线等连接端口才能进行连接的连接方式。
音频设备可以指音频输入输出的设备。音频设备可以是手机自带的音频设备,也可以是手机外部可以与手机进行通讯连接的音频设备。例如,音频设备可以包括数字功放、功放机、音箱、多媒体控制台、数字调音台、音频采样卡、合成器、中高频音箱、话筒,PC中的声卡、耳机等。
在一些实施例中,处理器可以通过蓝牙网络、WIFI网络、有线连接等方式将手机和音频设备进行连接。例如,将手机和音频设备的蓝牙网络进行配对连接、将音频设备接入手机开的WIFI网络、或通过USB数据传输等方式将手机和音频设备进行有线连接。
步骤220,响应于接收到当前用户的播放指令,向音频设备发送预设声音参数,控制音频设备基于预设声音参数播放声音。
当前用户可以指需要进行播放设备的声音参数调节的用户。例如,当前用户可以是当前正在使用或将要使用手机或播放设备(如听音乐、看视频、语音聊天等)的用户。
播放指令可以指用于触发音频设备进行音频播放的指令。例如,播放指令可以是播放音乐的指令、播放视频的指令、拨打语音电话/视频电话的指令等。在一些实施例中,播放指令可以由用户在手机/音频设备上操作触发。
预设声音参数可以指提前为当前用户预设的不同播放场景对应的音频设备的声音参数。例如,在室内环境下的声音参数、在室外环境下的声音参数、会议模式下的声音参数、音乐模式下的声音参数等。其中,声音参数可以包括音量大小、均衡器参数等。在一些实施例中,声音参数还可以包括音调、音色等。
在一些实施例中,处理器可以获取当前用户的历史音频播放数据,基于历史音频播放数据获取当前用户在不同播放场景下的历史声音参数,将不同播放场景下的历史声音参数作为每一个对应播放场景下的预设声音参数。
在一些实施例中,处理器可以获取播放场景特征,播放场景特征包括时间特征、位置特征、手机的被移动特征、以及播放内容特征;手机的被移动特征基于第一预设时间内手机的定位信息确定,播放内容特征包括当前用户当前将要播放的内容的类型;基于播放场景特征,通过向量数据库确定一个或多个候选声音参数;基于一个或多个候选声音参数,确定预设声音参数。关于确定预设声音参数的更多内容可以参见图3及其相关描述。
在一些实施例中,响应于接收到当前用户的播放指令,处理器可以获取当前用户的播放场景,基于播放场景向音频设备发送对应的预设声音参数。在一些实施例中,播放场景可以基于播放场景特征确定。关于播放场景特征的内容可以参见图3及其相关描述。
在一些实施例中,音频设备接收到预设声音参数后,处理器可以控制音频设备以预设声音参数播放声音。
步骤230,在音频设备基于预设声音参数播放声音的过程中,实时执行声音参数调节方法。
声音参数调节方法可以指对声音参数进行调节的方法。例如,声音参数调节方法可以是将播放音量调高/调低XX分贝。在一些实施例中,声音参数调节方法可以包括:获取调整反馈,调整反馈通过手机和/或音频设备中部署的传感器采集,调整反馈至少包括环境反馈,环境反馈包括环境声数据;基于调整反馈,确定音频设备的声音参数的调整特征,调整特征至少包括调整量,声音参数至少包括音量和均衡器参数;向音频设备发送调整特征,控制音频设备基于调整特征对声音参数进行调整。
其中,调整反馈可以指用于对音频播放器的声音参数进行调整的参考数据。例如,调整反馈可以包括环境反馈。环境反馈可以指来自音频设备所处的外界环境的反馈数据。环境反馈可以包括环境声数据,环境声数据可以指音频设备所处的外界环境的声音数据、声音特征等,可以包括声源类型、和声源强度(音量大小)。声源类型可以包括道路交通噪声、轨道交通噪声、电磁噪声、航空噪声、空气动力性噪声、建筑施工噪声、机械设备噪声、场所噪声等。
在一些实施例中,处理器可以获取调整反馈,调整反馈可以通过手机或音频设备中部署的传感器采集。例如,处理器可以基于部署在手机或音频设备中的音频采集器,采集调整反馈。
调整特征可以指对音频设备的声音参数进行调整的特征数据。例如,调整特征可以包括音量调高、音量调低、及具体的调高/调低幅度(即调整量)。
在一些实施例中,处理器可以基于调整反馈,确定音频设备的声音参数的调整特征,其中,调整特征至少包括调整量,声音参数至少包括音量和均衡器参数。例如,处理器可以提前为不同的调整反馈预设对应的调整特征存储在存储器中,当确定调整反馈后,直接从存储器中获取该调整反馈对应的调整特征。
在一些实施例中,处理器可以基于当前用户使用音频设备的播放场景的变化,实时获取调整反馈,并基于实时获取的调整反馈确定实时的调整特征。
在一些实施例中,处理器可以根据环境反馈中的环境声数据,确定环境声大小;根据环境声大小,通过预设规则(预设表)来确定声音参数的调整特征。例如,环境声越大,则音频设备的音量也可以适当调大(但不能超过人耳可承受的安全范围)。处理器可以提前预设不同的环境声大小对应的音频设备的音量,当确定环境声大小后,可以直接获取与该环境声大小对应的音量。
在一些实施例中,处理器可以基于调整反馈,通过优选声音参数确定模型确定优选声音参数;基于优选声音参数,确定音频设备的声音参数的调整量。更多关于确定声音参数的调整量的内容可以参见图4、图5及其相关描述。
在一些实施例中,调整特征还包括调整平滑度,调整平滑度是指将当前声音参数调整至优选声音参数的平滑程度。在一些实施例中,处理器可以基于一个或多个未来时刻的环境声数据与当前时刻的环境声数据,确定环境声变化度;基于环境声变化度,确定调整平滑度。更多关于确定调整平滑度的内容可以参见图6及其相关描述。
在一些实施例中,处理器可以向音频设备发送调整特征,控制音频设备基于调整特征对声音参数进行调整。例如,假设调整特征为音量调高10个分贝,原本音频设备的声音参数中音量为20分贝,处理器可以控制音频设备根据前述调整特征,将声音参数中的音量调整为30分贝。
在一些实施例中,处理器可以在音频设备基于预设声音参数播放声音的过程中,处理器可以基于当前用户使用音频设备的播放场景的变化,实时执行声音参数调节方法。例如,处理器可以基于当前用户使用音频设备的播放场景的变化,实时获取对应的调整特征,基于实时调整特征对音频设备的声音参数进调整。
本说明书一些实施例,通过获取不同播放场景下的调整反馈,基于调整反馈确定调整特征,再基于调整特征对音频设备的声音参数进行调整,考虑了多种可能影响用户听觉体验的因素(如环境的安静程度、不同时间段、不同播放内容等),可以提高音频设备声音参数调整的合理性和准确性,更加的个性化,提升了用户体验。
图3是根据本说明书一些实施例所示的确定预设声音参数的示例性流程图。在一些实施例中,流程300可以由处理器执行。如图3所示,流程300可以包括如下步骤:
步骤310,获取播放场景特征,播放场景特征包括时间特征、位置特征、手机的被移动特征、以及播放内容特征;被移动特征基于第一预设时间内手机的定位信息确定,播放内容特征包括当前用户当前将要播放的内容的类型。
播放场景特征可以指用于反映音频设备的播放场景特点的信息/数据,播放场景特征可以通过播放环境、播放位置、播放时间、播放内容等信息确定。例如,播放场景特征可以包括时间特征、位置特征、手机的被移动特征、以及播放内容特征。在一些实施例中,处理器可以基于手机中配置的传感器、手机软件等获取播放场景特征。
时间特征可以指音频设备使用时间在当天所属的时段。例如,时间特征可以包括凌晨、清晨、上午、中午、下午、晚上和深夜。在一些实施例中,时间特征可以基于音频设备使用的具体时间所在当天的时段确定。例如,处理器可以提前将一天划分为多个不同的时段,一个时段与一个时间特征对应,如00:00-5:00对应凌晨、5:00-9:00对应清晨、9:00-11:00对应上午、11:00-13:00对应中午、13:00-18:00对应下午、18:00-22:00对应晚上、22:00-24:00对应深夜。在一些实施例中,处理器可以基于手机时钟确定播放设备的使用时间,基于使用时间所处的时段确定对应的时间特征。
位置特征可以指反映手机和/或音频设备的位置分布的信息。例如,位置特征可以包括手机位置、音频设备位置、手机位置与音频设备位置之间的距离、手机位置和/或音频设备位置所属的类型等。在一些实施例中,处理器可以基于手机当前的定位信息、音频设备当前的定位信息确定位置特征。例如,通过定位信息可以确定手机/音频设备的具体位置、该具体位置是处于室内还是室外、以及定位所在环境的具体类型(如居民区、娱乐场所、办公区等)。
手机的被移动特征可以指一定时间内手机被移动的频率、移动距离等。在一些实施例中,处理器可以基于第一预设时间内手机的定位信息确定手机的被移动特征。其中,第一预设时间可以指当前时间之前的一段时间,可以基于计算需求通过人工设置,如可以将第一预设时间设置为20秒、30秒、1分钟等。
在一些实施例中,处理器可以基于第一预设时间内的定位信息构成定位信息序列,基于定位信息序列计算相邻定位信息的位移变化量,构成位移变化量序列,通过一个嵌入层对位移变化量序列进行处理,将输出的嵌入向量确定为手机的被移动特征。示例性的,定位信息序列可以表示为(A,B,C,D,E,F),其中,A、B、C、D、E、F依次表示在第一预设时间内按时间先后顺序排列的手机的定位信息,定位信息可以用经纬度/位置坐标表示;位移变化量序列可以表示为((B-A),(C-B),(D-C),(E-D),(F-E))。
播放内容特征可以指可以反映音频设备将要播放的内容特点的数据。例如,播放内容特征可以包括播放内容类型。播放内容类型可以包括音乐、有声小说、视频、语音消息等。更具体的,每一个播放内容类型还可以分为更多的细分类型。例如,音乐还可以分为摇滚、蓝调、抒情、流行、纯音乐等类型;视频还可以分为娱乐、教育、生活等类型。
在一些实施例中,处理器可以获取当前用户的历史播放数据,基于历史播放数据确定用户在不同时间段、不同环境类型(如室内/室外、居民区、办公区、娱乐场所等)对应的历史播放内容,基于历史播放内容确定当前用户将要播放的内容。例如,处理器可以将与当前用户对应的时间段相同、播放环境类型相同的历史播放内容确定为当前用户将要播放的内容。进一步的,处理器可以基于当前用户将要播放的内容,确定播放内容特征。例如,处理器可以基于当前用户将要播放的内容的具体类型(如音乐、有声小说、视频、语音消息等),确定播放内容特征。示例性地,处理器还可以将不同的播放内容类型用不同的数字或字母(如音乐1、有声小说2、视频3、语音消息4等)进行标记,当确定播放内容类型后将其对应的标记(数字或字母)作为播放内容特征。
在一些实施例中,场景特征还包括当前用户在历史时间使用音频设备时的声源特征分布,声源特征分布包括不同声源特征的时长占历史时间的占比。
历史时间可以指当前时间之前的一段时间。例如,假设当前时间为2025年1月13日上午9:00,则历史时间可以是2025年1月13日上午9:00之前的一段时间(如之前1小时、2小时、10小时、24小时等)。
声源特征分布可以指声源特征的分布情况,声源特征可以包括声源的类型,声源的类型可以包括道路交通噪声、轨道交通噪声、电磁噪声等。声源特征分布可以包括当前用户在历史时间使用音频设备时各种声源特征的分布占比。例如,声源特征分布可以指当前用户在历史时间使用音频设备时多种声源特征(如道路交通噪声、轨道交通噪声、电磁噪声)对应的分布时长占总的分布时长的占比。其中,总的分布时长为多种声源特征对应的分布时长的总和。应当理解的是,在历史时间可能不同的声源特征会在相同时间点重复发生,因此总的分布时长是基于每种声源特征分布时长的总和,而不是直接将历史时间作为总的分布时长。
在一些实施例中,处理器可以获取当前用户在历史时间使用音频设备时的声源特征数据,基于声源特征数据进行分析,分别获取不同声源特征的分布时长和所有声源特征的总的分布时长,然后将各种不同声源特征的分布时长与总的分布时长的比值作为声源特征分布。在一些实施例中,当前用户在历史时间使用音频设备时的声源特征数据可以通过配置于手机/音频设备中的传感器/声音采集设备等进行采集。
本说明书一些实施例,在对音频设备的声音参数进行调整时,通过加入当前用户在历史时间使用音频设备时的各种声源特征的分布情况,考虑了用户所处环境中不同的声源特征分布特征对用户听觉体验产生的潜移默化的影响,可以为用户确定更合理的声音参数,提高声音参数调整的准确性。
步骤320,基于播放场景特征,通过向量数据库确定一个或多个候选声音参数。
向量数据库可以指用于存储历史特征向量和与历史特征向量关联的历史声音参数的存储单元。其中,历史特征向量可以指用于表示历史用户的历史播放场景特征的向量。历史用户可以指在历史时间(即当前时间之前的时间)使用音频设备的用户。
在一些实施例中,处理器可以基于多个历史用户的历史播放场景特征构建多个历史特征向量,组成向量数据库。在一些实施例中,处理器可以基于播放场景特征中的每一个具体特征,构建历史特征向量。例如,处理器可以将播放场景特征中的每一个特征进行排序(如,时间特征-位置特征-手机的被移动特征-播放内容特征-声源特征分布),然后将每一个特征的具体数据按照排列顺序填入向量中,组成历史特征向量。示例性的,历史特征向量可以表示为(a,b,c,d,e),其中,a,b,c,d,e可以分别表示时间特征、位置特征、手机的被移动特征、播放内容特征和声源特征分布对应的具体数据。
在一些实施例中,历史特征向量可以与其对应的历史声音参数关联存储于数据库中。历史声音参数可以指历史播放场景特征对应的声音参数,即历史用户在历史播放场景下使用音频设备时的声音参数。
在一些实施例中,每一个历史特征向量对应的历史声音参数,可以基于与每一个历史特征向量对应的历史播放场景特征相同的其他历史播放场景特征下,大量历史用户选择的声音参数取平均值得到。例如,某个历史特征向量对应的历史播放场景特征为清晨在公园看新闻视频,则该历史特征向量对应的历史声音参数可以是其他清晨在公园看新闻视频的大量历史用户选择的声音参数的平均值。其中,历史用户选择的声音参数的确定可以是:在某个历史播放场景下,历史用户维持某个声音参数,未进行调整,则将该声音参数确定为历史用户选择的声音参数;或者,在某个历史播放场景下,历史用户在短时间(例如5秒)内调整了声音参数,则将调整后的声音参数作为历史用户选择的声音参数。
在一些实施例中,处理器可以基于当前播放场景特征,以构建历史特征向量的方式构建当前特征向量。
候选声音参数可以指可能作为预设声音参数、或可能用于确定预设声音参数的声音参数。在一些实施例中,处理器可以利用当前特征向量在向量数据库中检索,确定满足预设条件的历史特征向量,将其作为参考特征向量。其中,预设条件可以指向量距离小于距离阈值,向量距离可以包括欧氏距离、余弦距离等。在一些实施例中,处理器可以将与参考特征向量关联存储的历史声音参数确定为候选声音参数。
步骤330,基于一个或多个候选声音参数,确定预设声音参数。
在一些实施例中,处理器可以基于一个或多个候选声音参数,通过多种方式,确定预设声音参数。例如,处理器可以将一个或多个候选声音参数求平均,将平均值确定为预设声音参数。
在一些实施例中,处理器可以将一个或多个候选声音参数进行加权,确定预设声音参数。其中,一个或多个候选声音参数中每一个的权重相关于每一个候选声音参数对应的多个历史用户的音频设备特征与当前用户的音频设备特征的匹配度;音频设备特征包括设备使用特征、设备参数调节特征、设备可调节域;设备参数调节特征包括声音参数调节覆盖率、声音参数调节频率。
在一些实施例中,处理器可以基于一个或多个候选声音参数中每一个对应的权重,对一个或多个候选声音参数进行加权求和,确定预设声音参数。
在一些实施例中,处理器可以基于一个或多个候选声音参数中每一个候选声音参数对应的历史用户的音频设备特征与当前用户的音频设备特征的匹配度,确定每个候选声音参数对应的权重。匹配度越高,相应的权重越大。其中,多个历史用户即指用于构建多个历史向量的历史播放场景特征对应的多个用户。
音频设备特征可以指用于描述用户在音频设备上的使用情况的特征。例如,音频设备特征可以包括设备使用特征、设备参数调节特征、设备可调节域等。在一些实施例中,处理器可以获取用户使用音频设备的历史数据,基于历史数据确定音频设备特征。
设备使用特征可以指用户使用音频设备的频率。在一些实施例中,处理器可以基于用户使用音频设备的历史数据,确定设备使用特征。例如,处理器可以基于用户使用音频设备的历史数据,确定用户每一次使用音频设备的时间间隔,将多个时间间隔求平均值,作为用户使用音频设备的频率。
设备参数调节特征可以指用户对音频设备的声音参数的调节覆盖率以及调节频率。其中,声音参数调节覆盖率可以指用户调节音频设备的声音参数在设备可调节域中的占比。例如,设备可调节域可以包括声音参数1、2、3、4、5这5个类型,但根据历史数据,该用户只使用过声音参数1、声音参数2这2种类型来播放声音,则覆盖率为2/5。声音参数调节频率可以指用户调节音频设备的声音参数的频率,例如,每次使用都要调节、或偶尔调节。
在一些实施例中,处理器可以基于用户使用音频设备的历史数据,确定设备参数调节特征。
设备可调节域可以指音频设备的音量、均衡器参数等的可调节的范围,可调节的范围越大,可调节域越大。在一些实施例中,处理器可以获取音频设备的设备质量参数等信息,从设备质量参数等信息中获取设备可调节域。
匹配度可以指一个或多个候选声音参数中每一个候选声音参数对应的历史用户的音频设备特征与当前用户的音频设备特征的相似程度。在一些实施例中,处理器可以基于历史用户的音频设备特征和当前用户的音频设备特征分别构建音频设备特征向量,然后基于向量距离确定匹配度,向量距离越小,匹配度越高。其中,基于音频设备特征构建向量的方式可以是将音频特征中的每个具体特征按照一定的顺序排列(如,设备使用特征-设备参数调节特征-设备可调节域),然后按照排列顺序将每一个具体特征的实际数据填入向量中,形成音频设备特征向量。
在一些实施例中,匹配度还相关于第二预设时间内的操作信息的匹配程度。匹配程度越高,相应的匹配度越高。
第二预设时间可以指预设的用于获取操作信息的时间段,可以基于计算需求预设确定。
操作信息可以指用户在手机上进行的相关操作的信息。例如,操作信息可以包括当前用户的操作信息和历史用户的操作信息。当前用户的操作信息可以包括当前用户的触屏/点击频率、当前用户当前使用的应用、当前用户第三预设时间内使用的应用序列等。
当前用户的触屏/点击频率可以指用户在手机上进行触屏/点击的频率;当前用户当前使用的应用可以指当前用户正使用的应用(如音乐、微博、微信等);当前用户第三预设时间内使用的应用序列可以指当前用户在第三预设时间内使用的应用组成的序列。其中,第三预设时间是指当前时间之前的一段时间(如最近1分钟、5分钟等),应用序列可以基于用户第三预设时间使用的应用按照时间顺序排列构成。例如,在第三预设时间(最近5分钟)内,用户依次使用了微信、微博、音乐等3个应用,则对应的应用序列为:微信-微博-音乐。
操作信息的匹配程度可以指一个或多个候选声音参数中每一个候选声音参数对应的历史用户的操作信息与当前用户的操作信息的相似程度。在一些实施例中,处理器可以基于历史用户的操作信息和当前用户的操作信息分别构建操作信息向量,基于操作信息向量之间的向量距离确定匹配程度,向量距离越小,匹配程度越高。其中,操作信息向量可以基于将操作信息中每一个具体操作信息按一定顺序排列,然后依次按照顺序将每一个具体操作信息的实际数据填入向量中组成。
本说明书一些实施例,通过将一个或多个候选声音参数中每一个候选声音参数对应的历史用户的音频设备特征与当前用户的音频设备特征的匹配度,与操作信息的匹配程度关联,可以提高匹配度的准确性。
本说明书一些实施例,通过对一个或多个候选声音参数进行加权确定预设声音参数,并且根据每一个候选声音参数对应的多个用户的音频设备特征与当前用户的音频设备特征的匹配度来确定加权的权重,可以为匹配度高的候选声音参数确定相对较高的权重,提高确定预设声音参数的准确率。
本说明书一些实施例,基于播放场景特征,通过向量数据库进行匹配的方式确定候选声音参数,可以将与当前用户的播放场景特征相同或类似的历史用户的历史声音参数作为参考,提高确定的候选声音参数的准确率,进而提高确定预设声音参数的准确率。
应当注意的是,上述有关流程300的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程300进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。
图4是根据本说明书一些实施例所示的确定声音参数的调整特征的示例性流程图。在一些实施例中,流程400可以由处理器执行。如图4所示,流程400可以包括如下步骤:
步骤410,基于调整反馈,通过优选声音参数确定模型确定优选声音参数。
优选声音参数确定模型可以指用于确定优选声音参数的模型,为机器学习模型。在一些实施例中,优选声音参数确定模型的网络结构可以包括卷积神经网络(Convolutional Neural Networks,CNN)、深度神经网络(Deep Neural Networks,DNN)、循环神经网络(Recurrent Neural Network,RNN)或其他自定义网络中的至少一种。
在一些实施例中,优选声音参数确定模型的输入可以是当前时刻和多个历史时刻的环境声数据,输出可以是优选声音参数。其中,优选声音参数可以指使用户舒适度较高的声音参数。关于环境声数据的内容可以参见图2及其相关描述。
在一些实施例中,优选声音参数确定模型可以通过训练获取。在一些实施例中,训练优选声音参数的第一训练样本可以是样本环境声数据。第一训练样本可以通过从网络/数据库中获取大量用户使用音频设备时的历史环境声数据确定。在一些实施例中,训练优选声音参数确定模型的第一标签可以是每个第一训练样本对应的实际声音参数。处理器可以将历史环境声数据下用户长时间使用或手动调整后的声音参数确定为第一标签。
在一些实施例中,处理器可以将第一训练样本输入初始优选声音参数确定模型,得到初始优选声音参数。基于初始声音参数和第一标签构建损失函数;基于损失函数更新初始优选声音参数确定模型的参数;通过参数更新,获取训练好的优选声音参数确定模型。
在一些实施例中,优选声音参数确定模型还可以具有其他结构,具体可以参见图5及其相关描述。
在一些实施例中,优选声音参数确定模型可以包括环境声预测层、声源特征确定层、以及优选声音参数确定层;环境声预测层用于基于当前时刻及多个历史时刻的环境声数据,预测多个未来时刻的环境声数据;声源特征确定层用于基于当前时刻的环境声数据、以及多个未来时刻的环境声数据,确定多个第四预设时间内的声源特征,声源特征至少包括声源类型以及声源强度;声源特征确定层用于基于多个时间段的声源特征,确定优选声音参数。
图5是根据本说明书一些实施例所示的基于优选声音参数确定模型确定优选声音参数的示例性示意图。如图5所示,优选声音参数确定模型可以包括环境声预测层520、声源特征确定层540和优选声音参数确定层580。在一些实施例中,环境声预测层520的网络结构可以是RNN、LSTM等;声源特征确定层540的网络结构可以是DNN;优选声音参数确定层580的网络结构可以是DNN。
在一些实施例中,环境声预测层520的输入可以是当前时刻的环境声数据510-1和多个历史时刻的环境声数据510-2,输出可以是多个未来时刻的环境声数据530。其中,关于环境声数据的内容可以参见图2及其相关描述。当前时刻可以指当下的实际时间,历史时刻可以指当前时刻之前的时间点(如当前时刻之前的10秒内的时间点),未来时刻可以指当前时刻之后的时间点(如当前时刻之后的10秒内的时间点)。
在一些实施例中,声源特征确定层540的输入可以是当前时刻的环境声数据510-1和多个未来时刻的环境声数据530,输出可以是多个第四预设时间内的声源特征550。其中,多个未来时刻的环境声数据530可以基于环境声预测层520输出确定;关于声源特征的具体内容可以参见图3及其相关描述。第四预设时间可以指预设的需要确定声源特征的时间段。第四预设时间可以基于计算需求,通过预设确定。例如,假设声源特征确定层540输入的是当前时刻的环境声数据510-1和未来10秒内多个未来时刻的环境声数据530,则可以将这未来10秒按时间顺序每2秒(或每3秒、每4秒,可以灵活设定)确定为一个时间段,将确定的每个时间段确定为一个第四预设时间。
在一些实施例中,优选声音参数确定层580的输入可以是多个第四预设时间内的声源特征550,输出可以是优选声音参数590。关于优选声音参数的更多内容可以参见图4及其相关描述。
在一些实施例中,调整反馈还包括用户反馈,用户反馈至少包括第二预设时间内的操作信息,操作信息包括当前用户的触屏/点击频率、当前用户当前使用的应用、当前用户第三预设时间内使用的应用序列,优选声音参数确定模型的输入还包括用户特征,用户特征基于用户反馈通过用户特征预测模型预测得到。
用户反馈可以指用户使用手机或音频设备的操作反馈。例如,用户反馈可以包括第二预设时间内的操作信息,操作信息可以包括当前用户的触屏/点击频率、当前用户当前使用的应用、当前用户第三预设时间内使用的应用序列。关于第二时间内的操作信息的更多内容可以参见图3及其相关描述。
在一些实施例中,如图5所示,优选声音参数确定层580的输入还可以包括用户特征570。
用户特征570可以指与当前用户本身相关的数据。例如,用户特征570可以包括当前用户的性别、年龄、性格等特征。
在一些实施例中,用户特征570可以基于用户反馈通过用户特征预测模型预测得到,其中,用户特征预测模型是机器学习模型。在一些实施例中,用户特征预测模型的网络结构可以包括卷积神经网络(Convolutional Neural Networks,CNN)、深度神经网络(DeepNeural Networks,DNN)、循环神经网络(Recurrent Neural Network,RNN)或其他自定义网络中的至少一种。在一些实施例中,用户特征预测模型的输入可以是用户反馈,输出可以是用户特征570。
在一些实施例中,用户特征预测模型的输入还包括手机的被移动特征和播放内容特征。在一些实施例中,用户特征预测模型可以对用户反馈、手机的被移动特征和播放内容特征进行处理,确定用户特征570。
在一些实施例中,用户特征预测模型可以通过训练获取。在一些实施例中,训练用户特征预测模型的第二训练样本可以是样本用户反馈、样本手机的被移动特征、样本播放内容特征,可以通过用户的音频设备历史使用数据确定。第二标签可以是第二训练样本对应的实际用户特征,可以通过人工标记确定。
在一些实施例中,处理器可以将第二训练样本输入初始用户特征预测模型,得到初始用户特征,基于初始用户特征和第二标签构建损失函数。利用损失函数更新初始用户特征预测模型的参数,通过参数更新,获取训练好的用户特征预测模型。
本说明书一些实施例,在预测用户特征时,除了基于用户反馈,还基于手机的被移动特征和播放内容特征,考虑了不同年龄、性别的用户对手机的操作习惯、移动特征(如老年人移动速度缓慢)和播放内容的偏好等是不同的,可以提高预测的用户特征的准确性。
不同性别、年龄段、性格的用户的操作习惯、对应用的偏好是不同的,听觉特性(例如听觉敏感程度)也是不同的,因此根据操作信息来预测用户特征更加符合实际情况。
在一些实施例中,如图5所示,优选声音参数确定层580的输入还可以包括播放场景特征560。其中,播放场景特征560可以包括时间特征560-1、位置特征560-2、被移动特征560-3和播放内容特征560-4。更多关于播放场景特征560的内容可以参见图3及其相关描述。
不同的播放场景特征,对用户听觉体验的影响也是不同的,因此,本说明书一些实施例,进一步将播放场景特征作为预测优选声音参数的基础,考虑了用户在不同的播放场景中可能需要不同的听觉体验,使得预测的优选声音参数更加合理。
在一些实施例中,优选声音参数确定模型可以通过联合训练获取。在一些实施例中,训练优选声音参数确定模型的第三训练样本可以是样本历史时刻的环境声数据、多个样本历史时刻之前时刻的环境声数据、样本用户特征和样本播放场景特征。在一些实施例中,第三训练样本可以通过预设确定,也可以从网络/数据库获取大量历史用户的音频设备的大量历史使用数据,从大量历史数据确定第三训练样本。第三标签可以是第三训练样本对应的实际优选声音参数,可以通过人工标注确定。例如,处理器可以基于大量历史使用数据,获取不同用户特征的用户在不同环境声数据、不同播放场景特征下长时间使用或是手动调整后的声音参数(认为用户较能接受这种声音参数),作为对应的实际优选声音参数,即第三标签。
在一些实施例中,处理器可以将样本历史时刻的环境声数据、多个样本历史时刻之前时刻的环境声数据输入初始环境声预测层,得到多个初始未来时刻的环境声数据;将样本历史时刻的环境声数据、多个初始未来时刻的环境声数据输入初始声源特征确定层,得到多个初始第四预设时间内的声源特征;将多个初始第四预设时间内的声源特征、样本用户特征、样本播放场景特征输入初始优选声音参数预测层,得到初始优选声音参数;基于初始优选声音参数和第三标签构建损失函数。基于损失函数同步更新初始环境声预测层、初始声音特征确定层和初始优选声音参数确定层的参数。通过参数更新,获取训练好的优选声音参数确定模型。
本说明书一些实施例,通过将优选声音参数确定模型设置不同的层,分别利用不同的层对不同的特征进行处理,可以提取到更深层次的特征信息,提高预测的效率和准确率。
步骤420,基于优选声音参数,确定音频设备的声音参数的调整量。
在一些实施例中,处理器可以基于优选声音参数,结合当前音频设备的声音参数,确定两者的差值;基于差值确定调整量。
本说明书一些实施例,通过优选声音参数确定模型对环境声数据进行处理,可以利用机器学习模型的自学习能力,从大量数据中找到优选声音参数与不同的环境声数据之间的关系,提高预测的准确性和效率。
应当注意的是,上述有关流程400的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程400进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。
图6是根据本说明书一些实施例所示的确定调整平滑度的示例性流程图。在一些实施例中,流程600可以由处理器执行。如图6所示,流程600可以包括如下步骤:
在一些实施例中,调整特征还包括调整平滑度,调整平滑度是指将当前声音参数调整至优选声音参数的平滑程度。例如,当前声音参数为30分贝,优选声音参数为50分贝,可以在1秒内快速将音量从30分贝调整到50分贝,也可以在5秒内缓慢将音量从30分贝调整到50分贝。调整时间可以基于调整平滑度确定,调整平滑度越大,调整时间越长;反之,调整平滑度越小,调整时间越短。调整平滑度可以通过以下方式确定:
步骤610,基于一个或多个未来时刻的环境声数据与当前时刻的环境声数据,确定环境声变化度。
环境声数据可以包括音量和频率,例如,某个时刻的环境声数据可以包括该时刻的环境声的音量和频率。环境声变化度可以指环境声(如音量、频率)的变化程度,可以用变化速度、变化量进行衡量。在一些实施例中,处理器可以将一个或多个未来时刻的环境声数据中,每一个未来时刻的环境声数据中的音量与频率,与当前时刻的环境声数据中对应的音量与频率求差值,得到多个音量差值和频率差值。在一些实施例中,处理器可以对多个音量差值、频率差值分别求和,得到音量差值和、频率差值和。
在一些实施例中,处理器可以基于音量差值和的绝对值、频率差值和的绝对值确定环境声变化度。例如,处理器可以将音量差值和的绝对值、频率差值和的绝对值进行加权求和,基于加权求和结果确定环境声变化度。例如,加权求和结果越大,环境声变化度越大;反之,加权求和结果越小,环境声变化度越小。其中,加权求和的权重可以基于计算需求设置或通过系统默认设置。
步骤620,基于环境声变化度,确定调整平滑度。
在一些实施例中,处理器可以基于环境声变化度确定调整平滑度。环境声变化度越大,调整平滑度越小;反之,环境声变化度越小,调整平滑度越大。
应当理解的是,声音参数包括音量和均衡器参数,相应的,调整平滑度也包括音量调节的调整平滑度、均衡器参数的调整平滑度。在一些实施例中,处理器可以基于音量差值和,确定音量调节的调整平滑度。音量差值和越大,音量调节的调整平滑度越小;反之音量差值和越小,音量调节的调整平滑度越大。在一些实施例中,处理器可以基于频率差值和,确定均衡器参数的调整平滑度。频率差值和越大,均衡器参数的调整平滑度越小;反之,频率差值和越小,均衡器参数的调整平滑度越大。
在一些实施例中,调整平滑度还相关于第二预设时间内的操作信息。
在一些实施例中,处理器可以基于第二预设时间内的操作信息,确定调整平滑度。例如,处理器可以基于操作信息中的用户触屏/点击的频率确定调整平滑度。用户触屏/点击的频率越大,调整平滑度可以适当减小。
用户进行不同的操作时,其专注程度是不同的,而不同的专注程度下用户人耳对声音参数的调整的敏感程度不同,对声音的调节要求可能也相应不同。例如,专注力不够时,对声音调节的敏感程度较低,因此可能需要较大的调整平滑度。本说明书一些实施例,根据用户的操作信息来确定对应的调整平滑度,更符合用户的需求。
环境声变化度越大,人耳收到外部环境的影响也就越大,更容易被外界环境转移注意力,相应的对声音参数的调节的敏感度也会降低。因此,在注意力低时,可以相应减小调整平滑度,加快声音参数的调整。本说明书一些实施例,通过确定环境声变化度,再基于环境声变化度确定调整平滑度,可以为不同环境中的用户确定合适的调整平滑度,更加准确合理。
应当注意的是,上述有关流程600的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程600进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。
本说明书实施例之一还提供一种手机与音频设备通信的控制装置,包括至少一个处理器和至少一个存储器,至少一个存储器存储计算机指令;至少一个处理器用于执行计算机指令中的部分指令,以实现本说明书实施例中任意一项所述的手机与音频设备通信的方法。
本说明书实施例之一还提供一种计算机可读存储介质,存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机运行如本说明书实施例所述的手机与音频设备通信的方法。
本说明书实施例可能带来的有益效果包括但不限于:(1)通过获取不同播放场景下的调整反馈,基于调整反馈确定调整特征,再基于调整特征对音频设备的声音参数进行调整,考虑了多种可能影响用户听觉体验的因素(如环境的安静程度、不同时间段、不同播放内容等),可以提高音频设备声音参数调整的合理性和准确性,更加的个性化,提升了用户体验;(2)基于播放场景特征,通过向量数据库进行匹配的方式确定候选声音参数,可以将与当前用户的播放场景特征相同或类似的历史用户的历史声音参数作为参考,提高确定的候选声音参数的准确率,进而提高确定预设声音参数的准确率;(3)通过优选声音参数确定模型对环境声数据进行处理,可以利用机器学习模型的自学习能力,从大量数据中找到优选声音参数与不同的环境声数据之间的关系,提高预测的准确性和效率;(4)通过确定环境声变化度,再基于环境声变化度确定调整平滑度,可以为不同环境中的用户确定合适的调整平滑度,更加准确合理。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
Claims (10)
1.一种手机与音频设备通信的控制方法,其特征在于,所述方法由所述手机中的处理器执行,包括:
通过蓝牙网络、WIFI网络、有线连接中的一种或多种连接方式,将所述手机与所述音频设备进行连接;
响应于接收到当前用户的播放指令,向所述音频设备发送预设声音参数,控制所述音频设备基于所述预设声音参数播放声音;
在所述音频设备基于所述预设声音参数播放声音的过程中,实时执行声音参数调节方法,所述声音参数调节方法包括:
获取调整反馈,所述调整反馈通过所述手机和/或所述音频设备中部署的传感器采集,所述调整反馈至少包括环境反馈,所述环境反馈包括环境声数据;
基于所述调整反馈,确定所述音频设备的声音参数的调整特征,所述调整特征至少包括调整量,所述声音参数至少包括音量和均衡器参数;
向所述音频设备发送所述调整特征,控制所述音频设备基于所述调整特征对所述声音参数进行调整。
2.根据权利要求1所述的方法,其特征在于,所述预设声音参数通过以下方式确定:
获取播放场景特征,所述播放场景特征包括时间特征、位置特征、所述手机的被移动特征、以及播放内容特征;所述被移动特征基于第一预设时间内所述手机的定位信息确定,所述播放内容特征包括所述当前用户当前将要播放的内容的类型;
基于所述播放场景特征,通过向量数据库确定一个或多个候选声音参数;
基于所述一个或多个候选声音参数,确定所述预设声音参数。
3.根据权利要求1所述的方法,其特征在于,所述基于所述调整反馈,确定所述音频设备的声音参数的调整特征包括:
基于所述调整反馈,通过优选声音参数确定模型确定优选声音参数,所述优选声音参数确定模型为机器学习模型;
基于所述优选声音参数,确定所述音频设备的所述声音参数的所述调整量。
4.根据权利要求3所述的方法,其特征在于,所述调整特征还包括调整平滑度,所述调整平滑度是指将当前声音参数调整至优选声音参数的平滑程度,所述调整平滑度通过以下方式确定:
基于一个或多个未来时刻的所述环境声数据与当前时刻的所述环境声数据,确定环境声变化度;
基于所述环境声变化度,确定所述调整平滑度。
5.一种手机与音频设备通信的控制系统,其特征在于,所述系统包括:
连接模块,用于通过蓝牙网络、WIFI网络、有线连接中的一种或多种连接方式,将所述手机与所述音频设备进行连接;
控制模块,用于响应于接收到当前用户的播放指令,向所述音频设备发送预设声音参数,控制所述音频设备基于所述预设声音参数播放声音;
调节模块,用于在所述音频设备基于所述预设声音参数播放声音的过程中,实时执行声音参数调节方法,所述调节模块包括:
获取单元,用于获取调整反馈,所述调整反馈通过所述手机和/或所述音频设备中部署的传感器采集,所述调整反馈至少包括环境反馈,所述环境反馈包括环境声数据;
确定单元,用于基于所述调整反馈,确定所述音频设备的声音参数的调整特征,所述调整特征至少包括调整量,所述声音参数至少包括音量和均衡器参数;
控制单元,用于向所述音频设备发送所述调整特征,控制所述音频设备基于所述调整特征对所述声音参数进行调整。
6.根据权利要求5所述的系统,其特征在于,所述控制模块进一步用于:
获取播放场景特征,所述播放场景特征包括时间特征、位置特征、所述手机的被移动特征、以及播放内容特征;所述被移动特征基于第一预设时间内所述手机的定位信息确定,所述播放内容特征包括所述当前用户当前将要播放的内容的类型;
基于所述播放场景特征,通过向量数据库确定一个或多个候选声音参数;
基于所述一个或多个候选声音参数,确定所述预设声音参数。
7.根据权利要求5所述的系统,其特征在于,所述确定单元进一步用于:
基于所述调整反馈,通过优选声音参数确定模型确定优选声音参数;
基于所述优选声音参数,确定所述音频设备的所述声音参数的所述调整量。
8.根据权利要求7所述的系统,其特征在于,所述调整特征还包括调整平滑度,所述调整平滑度是指将当前声音参数调整至优选声音参数的平滑程度,所述确定单元进一步用于:
基于一个或多个未来时刻的所述环境声数据与当前时刻的所述环境声数据,确定环境声变化度;
基于所述环境声变化度,确定所述调整平滑度。
9.一种手机与音频设备通信的控制装置,其特征在于,包括至少一个存储器和至少一个处理器;所述至少一个存储器存储计算机指令,所述至少一个处理器用于执行所述计算机指令中的部分指令,以实现如权利要求1-4中任意一项所述的手机与音频设备通信的控制方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机运行如权利要求1-4中任意一项所述的手机与音频设备通信的控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310451176.8A CN116208700B (zh) | 2023-04-25 | 2023-04-25 | 一种手机与音频设备通信的控制方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310451176.8A CN116208700B (zh) | 2023-04-25 | 2023-04-25 | 一种手机与音频设备通信的控制方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116208700A true CN116208700A (zh) | 2023-06-02 |
CN116208700B CN116208700B (zh) | 2023-07-21 |
Family
ID=86511451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310451176.8A Active CN116208700B (zh) | 2023-04-25 | 2023-04-25 | 一种手机与音频设备通信的控制方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116208700B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117041858A (zh) * | 2023-08-14 | 2023-11-10 | 央广云听文化传媒有限公司 | 空间音频播放优化方法和装置 |
CN117097775A (zh) * | 2023-09-06 | 2023-11-21 | 深圳市芯隆科技有限公司 | 一种基于人工智能的蓝牙播放控制系统及方法 |
Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101640518A (zh) * | 2008-07-30 | 2010-02-03 | 华联国际商务股份有限公司 | 根据环境声音自动调整播放音量的系统及其方法 |
CN101854571A (zh) * | 2009-03-31 | 2010-10-06 | 索尼公司 | 头戴式耳机设备 |
CN106648527A (zh) * | 2016-11-08 | 2017-05-10 | 乐视控股(北京)有限公司 | 一种音量控制方法、装置以及播放设备 |
CN107256139A (zh) * | 2017-05-08 | 2017-10-17 | 深圳市科迈爱康科技有限公司 | 音频音量的调整方法、终端及计算机可读存储介质 |
CN107360326A (zh) * | 2017-07-17 | 2017-11-17 | 北京小米移动软件有限公司 | 终端音量调节处理方法及终端 |
CN107509153A (zh) * | 2017-08-18 | 2017-12-22 | 广东欧珀移动通信有限公司 | 声音播放器件的检测方法、装置、存储介质及终端 |
CN109147816A (zh) * | 2018-06-05 | 2019-01-04 | 安克创新科技股份有限公司 | 对音乐进行音量调节的方法及设备 |
CN109195068A (zh) * | 2018-09-09 | 2019-01-11 | 昊智信息技术(深圳)有限公司 | 音频处理方法、装置以及音频设备 |
CN109819375A (zh) * | 2019-01-11 | 2019-05-28 | 平安科技(深圳)有限公司 | 调节音量的方法与装置、存储介质、电子设备 |
CN109862335A (zh) * | 2019-01-28 | 2019-06-07 | 刘莉 | 一种基于投影音视频播放的闭环监控系统及方法 |
US20190394598A1 (en) * | 2018-06-22 | 2019-12-26 | EVA Automation, Inc. | Self-Configuring Speakers |
US20200241834A1 (en) * | 2019-01-27 | 2020-07-30 | Listen AS | Dynamically adjustable sound parameters |
CN111930336A (zh) * | 2020-07-29 | 2020-11-13 | 歌尔科技有限公司 | 音频设备的音量调节方法、设备及存储介质 |
CN112104950A (zh) * | 2020-09-16 | 2020-12-18 | 海信视像科技股份有限公司 | 一种音量控制方法及显示设备 |
CN112261470A (zh) * | 2020-10-21 | 2021-01-22 | 维沃移动通信有限公司 | 音频处理方法及装置 |
CN112687286A (zh) * | 2020-12-22 | 2021-04-20 | 深圳地平线机器人科技有限公司 | 音频设备的降噪模型的调整方法和装置 |
CN112954115A (zh) * | 2021-03-16 | 2021-06-11 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音量调节方法、装置、电子设备及存储介质 |
CN113823318A (zh) * | 2021-06-25 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的倍率确定方法、音量调节方法及装置 |
CN113905306A (zh) * | 2020-06-22 | 2022-01-07 | 阿里巴巴集团控股有限公司 | 音频调整方法和装置、电子设备以及计算机可读存储介质 |
CN114697445A (zh) * | 2020-12-31 | 2022-07-01 | 华为技术有限公司 | 一种音量调节方法、电子设备、终端及可存储介质 |
US20220222034A1 (en) * | 2021-01-12 | 2022-07-14 | International Business Machines Corporation | Dynamically managing sounds in a chatbot environment |
CN114845213A (zh) * | 2022-05-06 | 2022-08-02 | 宇龙计算机通信科技(深圳)有限公司 | 一种调节终端音量的方法及终端 |
-
2023
- 2023-04-25 CN CN202310451176.8A patent/CN116208700B/zh active Active
Patent Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101640518A (zh) * | 2008-07-30 | 2010-02-03 | 华联国际商务股份有限公司 | 根据环境声音自动调整播放音量的系统及其方法 |
CN101854571A (zh) * | 2009-03-31 | 2010-10-06 | 索尼公司 | 头戴式耳机设备 |
CN106648527A (zh) * | 2016-11-08 | 2017-05-10 | 乐视控股(北京)有限公司 | 一种音量控制方法、装置以及播放设备 |
CN107256139A (zh) * | 2017-05-08 | 2017-10-17 | 深圳市科迈爱康科技有限公司 | 音频音量的调整方法、终端及计算机可读存储介质 |
CN107360326A (zh) * | 2017-07-17 | 2017-11-17 | 北京小米移动软件有限公司 | 终端音量调节处理方法及终端 |
CN107509153A (zh) * | 2017-08-18 | 2017-12-22 | 广东欧珀移动通信有限公司 | 声音播放器件的检测方法、装置、存储介质及终端 |
CN109147816A (zh) * | 2018-06-05 | 2019-01-04 | 安克创新科技股份有限公司 | 对音乐进行音量调节的方法及设备 |
US20190394598A1 (en) * | 2018-06-22 | 2019-12-26 | EVA Automation, Inc. | Self-Configuring Speakers |
CN109195068A (zh) * | 2018-09-09 | 2019-01-11 | 昊智信息技术(深圳)有限公司 | 音频处理方法、装置以及音频设备 |
CN109819375A (zh) * | 2019-01-11 | 2019-05-28 | 平安科技(深圳)有限公司 | 调节音量的方法与装置、存储介质、电子设备 |
US20200241834A1 (en) * | 2019-01-27 | 2020-07-30 | Listen AS | Dynamically adjustable sound parameters |
CN109862335A (zh) * | 2019-01-28 | 2019-06-07 | 刘莉 | 一种基于投影音视频播放的闭环监控系统及方法 |
CN113905306A (zh) * | 2020-06-22 | 2022-01-07 | 阿里巴巴集团控股有限公司 | 音频调整方法和装置、电子设备以及计算机可读存储介质 |
CN111930336A (zh) * | 2020-07-29 | 2020-11-13 | 歌尔科技有限公司 | 音频设备的音量调节方法、设备及存储介质 |
CN112104950A (zh) * | 2020-09-16 | 2020-12-18 | 海信视像科技股份有限公司 | 一种音量控制方法及显示设备 |
CN112261470A (zh) * | 2020-10-21 | 2021-01-22 | 维沃移动通信有限公司 | 音频处理方法及装置 |
CN112687286A (zh) * | 2020-12-22 | 2021-04-20 | 深圳地平线机器人科技有限公司 | 音频设备的降噪模型的调整方法和装置 |
CN114697445A (zh) * | 2020-12-31 | 2022-07-01 | 华为技术有限公司 | 一种音量调节方法、电子设备、终端及可存储介质 |
US20220222034A1 (en) * | 2021-01-12 | 2022-07-14 | International Business Machines Corporation | Dynamically managing sounds in a chatbot environment |
CN112954115A (zh) * | 2021-03-16 | 2021-06-11 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音量调节方法、装置、电子设备及存储介质 |
CN113823318A (zh) * | 2021-06-25 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的倍率确定方法、音量调节方法及装置 |
CN114845213A (zh) * | 2022-05-06 | 2022-08-02 | 宇龙计算机通信科技(深圳)有限公司 | 一种调节终端音量的方法及终端 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117041858A (zh) * | 2023-08-14 | 2023-11-10 | 央广云听文化传媒有限公司 | 空间音频播放优化方法和装置 |
CN117041858B (zh) * | 2023-08-14 | 2024-04-09 | 央广云听文化传媒有限公司 | 空间音频播放优化方法和装置 |
CN117097775A (zh) * | 2023-09-06 | 2023-11-21 | 深圳市芯隆科技有限公司 | 一种基于人工智能的蓝牙播放控制系统及方法 |
CN117097775B (zh) * | 2023-09-06 | 2024-04-30 | 深圳市芯隆科技有限公司 | 一种基于人工智能的蓝牙播放控制系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116208700B (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116208700B (zh) | 一种手机与音频设备通信的控制方法和系统 | |
CN104394491B (zh) | 一种智能耳机、云服务器以及音量调节方法和系统 | |
US9319019B2 (en) | Method for augmenting a listening experience | |
CN104508739B (zh) | 动态语言模型 | |
CN106021463B (zh) | 基于人工智能提供智能服务的方法、智能服务系统及智能终端 | |
US9344815B2 (en) | Method for augmenting hearing | |
KR20120066523A (ko) | 음성 인식 방법 및 이를 위한 시스템 | |
CN105117102B (zh) | 音频界面显示方法和装置 | |
CN109818839A (zh) | 应用于智能家居的个性化行为预测方法、装置和系统 | |
CN109741747B (zh) | 语音场景识别方法和装置、语音控制方法和设备、空调 | |
CN103886857B (zh) | 一种噪声控制方法及设备 | |
WO2016081304A1 (en) | Automated audio adjustment | |
WO2014113347A2 (en) | Accumulation of real-time crowd sourced data for inferring metadata about entities | |
CN104506586A (zh) | 一种通过手势调节音量的智能耳机系统及调节方法 | |
CN110265004B (zh) | 智能家居操作系统中目标终端的控制方法及装置 | |
CN112231497B (zh) | 信息分类方法、装置、存储介质及电子设备 | |
CN101208929A (zh) | 用于自动依据内容的媒体转换及产生的装置、系统、方法及制品 | |
CN104246757A (zh) | 预测性服务访问 | |
CN107948623A (zh) | 投影仪及其音乐关联信息显示方法 | |
CN103297581A (zh) | 一种移动终端及调节其均衡器的方法 | |
EP4305853A1 (en) | Method and system for customized amplification of auditory signals based on switching of tuning profiles | |
KR102239673B1 (ko) | 인공지능 기반 능동형 스마트 보청기 피팅 방법 및 시스템 | |
CN112287260A (zh) | 内容输出方法、装置和电子设备 | |
CN113660512B (zh) | 音频处理方法、装置、服务器和计算机可读存储介质 | |
KR20180089242A (ko) | 챗봇에서의 출력 유형에 따라 대화 내용을 생성하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |