CN114500141B - 用于语音设备音效控制的方法、装置、平台设备及存储介质 - Google Patents

用于语音设备音效控制的方法、装置、平台设备及存储介质 Download PDF

Info

Publication number
CN114500141B
CN114500141B CN202210111776.5A CN202210111776A CN114500141B CN 114500141 B CN114500141 B CN 114500141B CN 202210111776 A CN202210111776 A CN 202210111776A CN 114500141 B CN114500141 B CN 114500141B
Authority
CN
China
Prior art keywords
voice
current
sound effect
determining
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210111776.5A
Other languages
English (en)
Other versions
CN114500141A (zh
Inventor
丁威
姚晨光
张桂芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haier Air Conditioner Gen Corp Ltd
Qingdao Haier Air Conditioning Electric Co Ltd
Haier Smart Home Co Ltd
Original Assignee
Qingdao Haier Air Conditioner Gen Corp Ltd
Qingdao Haier Air Conditioning Electric Co Ltd
Haier Smart Home Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haier Air Conditioner Gen Corp Ltd, Qingdao Haier Air Conditioning Electric Co Ltd, Haier Smart Home Co Ltd filed Critical Qingdao Haier Air Conditioner Gen Corp Ltd
Priority to CN202210111776.5A priority Critical patent/CN114500141B/zh
Publication of CN114500141A publication Critical patent/CN114500141A/zh
Application granted granted Critical
Publication of CN114500141B publication Critical patent/CN114500141B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2807Exchanging configuration information on appliance services in a home automation network
    • H04L12/2814Exchanging control software or macros for controlling appliance services in a home automation network
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Automation & Control Theory (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请涉及智慧家居技术领域,公开一种用于语音设备音效控制的方法、装置、平台设备及存储介质。该方法包括:通过第一语音设备,接收当前用户发送的播放音频文件的当前语音请求信息;确定与所述当前语音请求信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;确定与每个第二语音设备对应的当前音效播放策略,并控制所述第二语音设备根据所述当前音效播放策略,进行所述音频文件的播放。这样,实现了全屋的全景声应用场景,进一步提高了智慧家居系统的智能性。

Description

用于语音设备音效控制的方法、装置、平台设备及存储介质
技术领域
本申请涉及智慧家居技术领域,例如涉及用于语音设备音效控制的方法、装置、平台设备及存储介质。
背景技术
随着智能技术的发展,智慧家居理念的不断深入,全屋性的智慧家居系统越来越普遍。在一个全屋智慧家居系统中,有多个可以进行多媒体播放的语音设备。
目前,智慧家居系统中,每个语音设备都可单独进行多媒体播放,但是,多个语音设备还不能联动一起播放音频文件,或者,还不能自动进行音频文件的多音效播放,而全屋的全景声听觉效果可以使得用户有更好的身历其境的感觉,因此,亟待提供一种可使用户有更好的全景声听觉效果的技术方案。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于语音设备音效控制的方法、装置、平台设备和存储介质,以解决智慧家居系统中还无全景声应用场景的技术问题。
在一些实施例中,所述方法包括:
通过第一语音设备,接收当前用户发送的播放音频文件的当前语音请求信息;
确定与所述当前语音请求信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;
确定与每个第二语音设备对应的当前音效播放策略,并控制所述第二语音设备根据所述当前音效播放策略,进行所述音频文件的播放。
在一些实施例中,所述用于语音设备音效控制的装置,包括:
接收模块,被配置为通过第一语音设备,接收当前用户发送的播放音频文件的当前语音请求信息;
确定模块,被配置为确定与所述当前语音请求信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;
控制模块,被配置为确定与每个第二语音设备对应的当前音效播放策略,并控制所述第二语音设备根据所述当前音效播放策略,进行所述音频文件的播放。
在一些实施例中,所述用于语音设备音效控制的装置,包括处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述用于语音设备音效控制方法。
在一些实施例中,所述平台设备,包括上述用于语音设备音效控制的装置。
在一些实施例中,所述存储介质,存储有程序指令,所述程序指令在运行时,执行上述用于语音设备音效控制的方法
本公开实施例提供的用于语音设备音效控制的方法、装置和平台设备,可以实现以下技术效果:
智慧家居系统中,平台设备接收到用户发出的播放音频文件的语音请求信息后,可对语音请求信息进行解析,确定发出语音请求信息的用户身份信息,并可确定与用户身份信息匹配的语音设备,从而,控制语音设备采样对应的音效播放策略进行音频文件的播放,这样,可联动家居系统中多个语音设备一起播放音频文件,并且,还可采样多声道多音效的方式进行音频文件的播放,实现了全屋的全景声应用场景,进一步提高了智慧家居系统的智能性,也达到了用户到达声临其境的听觉效果,提高了用户体验。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本公开实施例提供的一种智慧家居系统的结构示意图;
图2是本公开实施例提供的一种用于语音设备音效控制方法的流程示意图;
图3是本公开实施例提供的一种用于语音设备音效控制方法的流程示意图;
图4是本公开实施例提供的一种用于语音设备音效控制装置的结构示意图;
图5是本公开实施例提供的一种用于语音设备音效控制装置的结构示意图;
图6是本公开实施例提供的一种用于语音设备音效控制装置的结构示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
本公开实施例中,智慧家居系统中,有多个具有语音功能的智能设备,即语音设备,这些设备可播放音频文件,例如:音乐、配音等等,并且,还可可与智慧家居系统中的平台设备进行通讯,平台设备可对每个语音设备进行数据管理以及控制,当然,语音设备之间也可进行通讯,这样,用户发出播放音频文件的语音请求信息后,通过一个、两个或多个语音设备,平台设备可接收到语音请求信息,并可对语音请求信息进行解析,确定发出语音请求信息的用户身份信息,并确定与用户身份信息匹配的语音设备,还确定每个语音设备对应的音效播放策略后,控制每个语音设备根据对应的音效播放策略,进行音频文件的播放,这样,多个与用户身份信息对应的语音设备可根据对应的音效播放策略,进行音频文件的播放,实现了全屋的全景声应用场景,进一步提高了智慧家居系统的智能性,也达到了用户到达声临其境的听觉效果,提高了用户体验。
图1是本公开实施例提供的一种智慧家居系统的结构示意图。如图1所示,智慧家居系统包括:平台设备100,以及与平台设备100进行通讯的智能家居设备200。并且,有一个、两个或多个智能家居设备200具有语音功能,即语音设备200。语音设备200可播放音频文件,例如:音乐、电影配音、语音学习资料等等,智能家居设备200可为智能音箱、投影仪、智能电视等等。平台设备100可为云端服务器设备,智能家居设备200为语音设备200时,平台设备100可与每个语音设备200进行通讯,从而,可对语音设备200进行数据管理以及远程控制。
本公开实施例中,智慧家居系统中,平台设备可确定与每个用户对应的语音设备的音效播放策略,并控制语音设备一起根据不同的音效播放策略播放音频文件,实现了全屋的全景声应用场景。
图2是本公开实施例提供的一种用于语音设备音效控制方法的流程示意图。如图2所示,语音设备音效控制的过程包括:
步骤201:通过第一语音设备,接收当前用户发送的播放音频文件的当前用户语音请求信息。
本公开实施例中,智慧家居系统中,平台设备可与语音设备进行通讯,智慧家居系统中的当前用户发出的播放音频文件的语音请求信息时,当前用户设定范围内的语音设备即可将接收到的当前语音请求信息发送给平台设备,因此,发送当前语音请求信息的语音设备可为第一语音设备,第一语音设备可为一个、两个、或多个。当前用户的位置不同,对应的第一语音设备也不同。
这样,第一语音设备发送了播放音频文件的当前语音请求信息,则平台设备可接收到当前语音请求信息。
步骤202:确定与当前语音请求信息匹配的当前用户身份信息,以及与当前用户身份信息匹配的第二语音设备。
智慧家居系统中,平台设备可与每个语音设备进行通讯,并可对语音设备进行数据管理以及远程控制。并且,平台设备还可获取每个用户的语音音色特征信息,以及用户习惯位置信息等等,从而得到户身份信息、语音音色特征信息、语音设备等等之间的对应关系。在一些实施例中,获取用户的语音音色特征信息,以及用户习惯位置信息;保存用户身份信息与语音音色特征信息之间的第一对应关系;确定与用户习惯位置信息匹配的语音设备,并保存用户身份信息与语音设备之间的第二对应关系。
其中,用户习惯位置信息包括:用户活动习惯区域信息,以及用户习惯使用设备信息等中的一种或多种。例如:获取了用户1的用户习惯位置信息,确定用户1的活动习惯区域包括:卧室1,则可将卧室1中所有的语音设备确定为与用户1的用户身份信息匹配的语音设备,即保存用户1的用户身份信息与卧室1中所有的语音设备之间的对应关系。若获取了用户2的用户习惯位置信息,确定用户2的活动习惯区域包括:客厅,并且习惯使用设备信息包括:语音设备1和语音设备2,则可保存用户2的用户身份信息与客厅中语音设备1和语音设备2之间的对应关系。
可通过数据输入、网络获取等等方式,获取用户的语音音色特征信息,以及用户习惯位置信息,并保存第一对应关系以及第二对应关系。
表1是本公开实施例提供的一种用户身份信息与语音音色特征信息之间的第一对应关系。表2是本公开实施例提供的一种用户身份信息与语音设备之间的第二对应关系。
用户身份信息 语音音色特征信息
用户ID1 语音音色特征信息1
用户ID2 语音音色特征信息2
用户ID3 语音音色特征信息3
…… ……
表1
表2
在一些实施例中,平台设备中保存了用户身份信息与语音音色特征信息之间的第一对应关系,以及用户身份信息与语音设备之间的第二对应关系。从而,可对接收的当前用户语音请求信息进行解析,确定当前用户语音特征信息;根据保存的第一对应关系,确定与当前用户语音特征信息匹配的当前用户身份信息;并且,还可根据保存的第二对应关系,确定与当前用户身份信息匹配的第二语音设备。
例如:保存的第一对应关系、第二对应关系分别如表1、表2所示,则若解析当前语音请求信息后的,得到的当前用户语音特征信息为语音音色特征信息2,则根据表1可确定当前用户身份信息为用户ID2,并可根据表2,可确定客厅中的智能音箱、卧室2中的投影仪……为第二语音设备。
本公开实施例中,第一语音设备可与第二语音设备为同一个设备,也可不是同一个设备。
步骤203:确定与每个第二语音设备对应的当前音效播放策略,并控制第二语音设备根据当前音效播放策略,进行音频文件的播放。
可预先保存语音设备与音效播放策略之间的第三对应关系,例如:客厅中的电视对应高音音效策略,客厅中的智能音箱对应的中音音效策略,而卧室1中的智能音箱对应低音音效策略等等。
这样,可根据保存的语音设备与音效播放策略之间的第三对应关系,确定与每个第二语音设备对应的当前音效播放策略。
或者,在一些实施例中,可根据每个第二语音设备的位置信息,确定与每个第二语音设备对应的当前音效播放策略,可包括:在当前第二语音设备位于当前用户所在区域的边缘区域的情况下,将低音音效确定为当前第二语音设备的当前音效播放策略;在当前第二语音设备位于当前用户所在区域的中央区域的情况下,将高音音效确定为当前第二语音设备的当前音效播放策略;在当前第二语音设备位于当前用户所在区域的第一设定区域的情况下,将中音音效确定为当前第二语音设备的当前音效播放策略,其中,第一设定区域位于边缘区域和中央区域之间。
例如:对接收到的当前语音请求信息进行解析,可确定当前用户位置信息,即当前用户所在区域为客厅,且当前用户对应的第二语音设备包括:客厅中的投影仪、客厅中的智能音箱,以及客厅中的智能空调。其中,客厅中的投影仪位于客厅的中央区域,则可将将高音音效确定为客厅中的投影仪的当前音效播放策略,而客厅中的智能空调处于客厅的边缘区域,则可将低音音效确定为客厅中的智能空调的当前音效播放策略,而智能音箱处于客厅投影仪与客厅智能空调之间,即处于客厅的第一设定区域内,即可将中音音效确定为客厅的智能音箱的当前音效播放策略。
确定了与每个第二语音设备对应的当前音效播放策略后,可向对应的第二语音设备发送携带对应当前音效播放策略的控制指令,控制第二语音设备根据当前音效播放策略,进行音频文件的播放。
可见,本实施例中,用户发出播放音频文件的语音请求信息后,通过一个、两个或多个语音设备,平台设备接收到语音请求信息后,可对语音请求信息进行解析,确定发出语音请求信息的用户身份信息,并可确定与用户身份信息匹配的语音设备,并确定每个语音设备对应的音效播放策略后,控制每个语音设备根据对应的音效播放策略,进行音频文件的播放,这样,多个与用户身份信息对应的语音设备可根据对应的音效播放策略,联动进行音频文件的播放,实现了全屋的全景声应用场景,进一步提高了智慧家居系统的智能性,也达到了用户到达声临其境的听觉效果,提高了用户体验。
下面将操作流程集合到具体实施例中,举例说明本发明实施例提供的用于语音设备音效控制过程。
本实施例中,智慧家居系统如图1所示,其中,平台设备保存了如表1、表2所示的对应关系。
图3是本公开实施例提供的一种用于语音设备音效控制方法的流程示意图。如图3所示,语音设备音效控制过程包括:
步骤301:是否通过第一语音设备,接收到当前用户发送的播放音频文件的语音请求信息?若是,执行步骤302,否则,返回步骤301。
通过智慧家居系统中的语音设备,可接收到用户发出的播放音频文件的当前语音请求信息。例如:用户发出“请播放《**》这首歌曲”,在当前用户位置的设定范围内的语音设备即第一语音设备可将对应的当前语音请求信息发送给平台设备,从而,平台设备接收到当前语音请求信息,执行步骤302。
步骤302:对当前语音请求信息进行解析,确定当前用户语音特征信息。
步骤303:根据保存的第一对应关系,确定与当前用户语音特征信息匹配的当前用户身份信息。
步骤304:根据保存的第二对应关系,确定与当前用户身份信息对应的第二语音设备。
步骤305:根据每个第二语音设备的位置信息,以及当前用户的位置信息,确定与每个第二语音设备对应的当前音效播放策略。
平台设备中保存了每个语音设备的位置信息,这样,根据接收到的当前语音请求信息,解析到了当前用户的位置信息后,即可根据每个第二语音设备的位置信息,以及当前用户的位置信息,确定与每个第二语音设备对应的当前音效播放策略。
其中,可包括:在当前第二语音设备位于当前用户所在区域的边缘区域的情况下,将低音音效确定为当前第二语音设备的当前音效播放策略;在当前第二语音设备位于当前用户所在区域的中央区域的情况下,将高音音效确定为当前第二语音设备的当前音效播放策略;在当前第二语音设备位于当前用户所在区域的第一设定区域的情况下,将中音音效确定为当前第二语音设备的当前音效播放策略,其中,第一设定区域位于边缘区域和中央区域之间。
步骤306:向每个第二语音设备发送携带对应当前音效播放策略的控制指令,控制对应的第二语音设备根据当前音效播放策略,进行音频文件的播放。
可见,本实施例中,平台设备可接收到播放音频文件的语音请求信息后,可对语音请求信息进行解析,确定发出语音请求信息的用户身份信息,并可确定与用户身份信息匹配的语音设备,还根据每个语音设备的位置信息,确定每个语音设备对应的音效播放策略后,控制每个语音设备根据对应的音效播放策略,进行音频文件的播放,这样,多个与用户身份信息对应的语音设备可根据对应的音效播放策略,进行音频文件的播放,实现了全屋的全景声应用场景,进一步提高了智慧家居系统的智能性,也达到了用户到达声临其境的听觉效果,提高了用户体验。
根据上述用于语音设备音效控制的过程,可构建一种用于语音设备音效控制的装置。
图4是本公开实施例提供的一种用于语音设备音效控制装置的结构示意图。如图4所示,用于语音设备音效控制装置包括:接收模块410、确定模块420和控制模块430。
接收模块410,被配置为通过第一语音设备,接收当前用户发送的播放音频文件的当前语音请求信息。
确定模块420,被配置为确定与当前语音请求信息匹配的当前用户身份信息,以及与当前用户身份信息匹配的第二语音设备。
控制模块430,被配置为确定与每个第二语音设备对应的当前音效播放策略,并控制第二语音设备根据当前音效播放策略,进行音频文件的播放。
在一些实施例中,还包括:获取保存模块,被配置为获取用户的语音音色特征信息,以及用户习惯位置信息;保存用户身份信息与语音音色特征信息之间的第一对应关系;确定与用户习惯位置信息匹配的语音设备,并保存用户身份信息与语音设备之间的第二对应关系。
在一些实施例中,确定模块420,具体被配置为对当前语音请求信息进行解析,确定当前用户语音特征信息;根据保存的第一对应关系,确定与当前用户语音特征信息匹配的当前用户身份信息;根据保存的第二对应关系,确定与当前用户身份信息匹配的第二语音设备。
在一些实施例中,控制模块包括:
第一控制单元,被配置为根据保存的语音设备与音效播放策略之间的第三对应关系,确定与每个第二语音设备对应的当前音效播放策略。
第二控制单元,被配置为根据每个第二语音设备的位置信息,确定与每个第二语音设备对应的当前音效播放策略。
在一些实施例中,第二控制单元,具体被配置为在当前第二语音设备位于当前用户所在区域的边缘区域的情况下,将低音音效确定为当前第二语音设备的当前音效播放策略;在当前第二语音设备位于当前用户所在区域的中央区域的情况下,将高音音效确定为当前第二语音设备的当前音效播放策略;在当前第二语音设备位于当前用户所在区域的第一设定区域的情况下,将中音音效确定为当前第二语音设备的当前音效播放策略,其中,第一设定区域位于边缘区域和中央区域之间。
本实施例中,智慧家居系统如图1所示。
图5是本公开实施例提供的一种用于语音设备音效控制装置的结构示意图。如图5所示,用于语音设备音效控制装置包括:接收模块410、确定模块420和控制模块430,还可包括:获取保存模块440,而控制模块430可包括:第二控制单元432。
其中,获取保存模块440可获取用户的语音音色特征信息,以及用户习惯位置信息,并保存用户身份信息与语音音色特征信息之间的第一对应关系;以及确定与用户习惯位置信息匹配的语音设备,并保存用户身份信息与语音设备之间的第二对应关系。
这样,接收模块410接收到播放音频文件的当前语音请求信息后,确定模块420可对当前语音请求信息进行解析,确定当前用户语音特征信息;并可根据获取保存模块440保存的第一对应关系,确定与当前用户语音特征信息匹配的当前用户身份信息;以及根据获取保存模块440保存的第二对应关系,确定与当前用户身份信息对应的第二语音设备。
从而,控制模块430中的第二控制单元432可根据每个第二语音设备的位置信息,确定与每个第二语音设备对应的当前音效播放策略,并向每个第二语音设备发送携带对应当前音效播放策略的控制指令,控制每个第二语音设备根据当前音效播放策略,进行音频文件的播放。
可见,本实施例中,用于语音设备音效控制的装置可接收到用户发出的播放音频文件的语音请求信息后,可对语音请求信息进行解析,确定发出语音请求信息的用户身份信息,并可确定与用户身份信息匹配的语音设备,从而,控制语音设备采样对应的音效播放策略进行音频文件的播放,这样,可联动家居系统中多个语音设备一起播放音频文件,并且,还可采样多声道多音效的方式进行音频文件的播放,实现了全屋的全景声应用场景,进一步提高了智慧家居系统的智能性,也达到了用户到达声临其境的听觉效果,提高了用户体验。
本公开实施例提供了一种用于语音设备音效控制的装置,其结构如图6所示,包括:
处理器(processor)1000和存储器(memory)1001,还可以包括通信接口(Communication Interface)1002和总线1003。其中,处理器1000、通信接口1002、存储器1001可以通过总线1003完成相互间的通信。通信接口1002可以用于信息传输。处理器1000可以调用存储器1001中的逻辑指令,以执行上述实施例的用于语音设备音效控制的方法。
此外,上述的存储器1001中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器1001作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器1000通过运行存储在存储器1001中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述方法实施例中的用于语音设备音效控制的方法。
存储器1001可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器1001可以包括高速随机存取存储器,还可以包括非易失性存储器。
本公开实施例提供了一种用于语音设备音效控制装置,包括:处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行用于语音设备音效控制方法。
本公开实施例提供了一种平台设备,包括上述用于语音设备音效控制装置。
本公开实施例提供了一种存储介质,存储有程序指令,所述程序指令在运行时,执行如上述用于语音设备音效控制的方法。
本公开实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述用于语音设备音效控制方法。
上述的存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。本公开实施例的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。当用于本申请中时,虽然术语“第一”、“第二”等可能会在本申请中使用以描述各元件,但这些元件不应受到这些术语的限制。这些术语仅用于将一个元件与另一个元件区别开。比如,在不改变描述的含义的情况下,第一元件可以叫做第二元件,并且同样第,第二元件可以叫做第一元件,只要所有出现的“第一元件”一致重命名并且所有出现的“第二元件”一致重命名即可。第一元件和第二元件都是元件,但可以不是相同的元件。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

Claims (10)

1.一种用于语音设备音效控制的方法,其特征在于,包括:
通过第一语音设备,接收当前用户发送的播放音频文件的当前语音请求信息;
确定与所述当前语音请求信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;
确定与每个第二语音设备对应的当前音效播放策略,并控制所述第二语音设备根据所述当前音效播放策略,进行所述音频文件的播放;
所述确定与每个第二语音设备对应的当前音效播放策略包括:
根据每个所述第二语音设备的位置信息,以及当前用户的位置信息,确定与每个第二语音设备对应的当前音效播放策略;
根据每个所述第二语音设备的位置信息,以及当前用户的位置信息,确定与每个第二语音设备对应的当前音效播放策略包括:
在当前第二语音设备位于所述当前用户所在区域的边缘区域的情况下,将低音音效确定为所述当前第二语音设备的当前音效播放策略;
在当前第二语音设备位于所述当前用户所在区域的中央区域的情况下,将高音音效确定为所述当前第二语音设备的当前音效播放策略;
在当前第二语音设备位于所述当前用户所在区域的第一设定区域的情况下,将中音音效确定为所述当前第二语音设备的当前音效播放策略,其中,所述第一设定区域位于所述边缘区域和所述中央区域之间。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取用户的语音音色特征信息,以及用户习惯位置信息;
保存所述用户身份信息与语音音色特征信息之间的第一对应关系;
确定与所述用户习惯位置信息匹配的语音设备,并保存所述用户身份信息与语音设备之间的第二对应关系。
3.根据权利要求2所述的方法,其特征在于,所述确定与所述当前语音请求信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备包括:
对所述当前语音请求信息进行解析,确定当前用户语音特征信息;
根据保存的第一对应关系,确定与所述当前用户语音特征信息匹配的当前用户身份信息;
根据保存的第二对应关系,确定与所述当前用户身份信息匹配的第二语音设备。
4.根据权利要求1所述的方法,其特征在于,所述确定与每个第二语音设备对应的当前音效播放策略还包括:
根据保存的语音设备与音效播放策略之间的第三对应关系,确定与每个第二语音设备对应的当前音效播放策略。
5.一种用于语音设备音效控制的装置,其特征在于,包括:
接收模块,被配置为通过第一语音设备,接收当前用户发送的播放音频文件的当前语音请求信息;
确定模块,被配置为确定与所述当前语音请求信息匹配的当前用户身份信息,以及与所述当前用户身份信息匹配的第二语音设备;
控制模块,被配置为确定与每个第二语音设备对应的当前音效播放策略,并控制所述第二语音设备根据所述当前音效播放策略,进行所述音频文件的播放;
所述控制模块包括:第二控制单元,被配置为根据每个所述第二语音设备的位置信息,以及当前用户的位置信息,确定与每个第二语音设备对应的当前音效播放策略;
第二控制单元具体被配置为:
在当前第二语音设备位于所述当前用户所在区域的边缘区域的情况下,将低音音效确定为所述当前第二语音设备的当前音效播放策略;
在当前第二语音设备位于所述当前用户所在区域的中央区域的情况下,将高音音效确定为所述当前第二语音设备的当前音效播放策略;
在当前第二语音设备位于所述当前用户所在区域的第一设定区域的情况下,将中音音效确定为所述当前第二语音设备的当前音效播放策略,其中,所述第一设定区域位于所述边缘区域和所述中央区域之间。
6.根据权利要求5所述的装置,其特征在于,还包括:
获取保存模块,被配置为获取用户的语音音色特征信息,以及用户习惯位置信息;保存所述用户身份信息与语音音色特征信息之间的第一对应关系;确定与所述用户习惯位置信息匹配的语音设备,并保存所述用户身份信息与语音设备之间的第二对应关系;
所述确定模块,具体被配置为对所述当前语音请求信息进行解析,确定当前用户语音特征信息;根据保存的第一对应关系,确定与所述当前用户语音特征信息匹配的当前用户身份信息;根据保存的第二对应关系,确定与所述当前用户身份信息匹配的第二语音设备。
7.根据权利要求5所述的装置,其特征在于,所述控制模块还包括:
第一控制单元,被配置为根据保存的语音设备与音效播放策略之间的第三对应关系,确定与每个第二语音设备对应的当前音效播放策略。
8.一种用于语音设备音效控制的装置,该装置包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至4任一项所述用于语音设备音效控制的方法。
9.一种平台设备,其特征在于,包括:如权利要求5或8所述用于语音设备音效控制的装置。
10.一种存储介质,存储有程序指令,其特征在于,所述程序指令在运行时,执行如权利要求1至4任一项所述用于语音设备音效控制的方法。
CN202210111776.5A 2022-01-29 2022-01-29 用于语音设备音效控制的方法、装置、平台设备及存储介质 Active CN114500141B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210111776.5A CN114500141B (zh) 2022-01-29 2022-01-29 用于语音设备音效控制的方法、装置、平台设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210111776.5A CN114500141B (zh) 2022-01-29 2022-01-29 用于语音设备音效控制的方法、装置、平台设备及存储介质

Publications (2)

Publication Number Publication Date
CN114500141A CN114500141A (zh) 2022-05-13
CN114500141B true CN114500141B (zh) 2024-03-19

Family

ID=81478480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210111776.5A Active CN114500141B (zh) 2022-01-29 2022-01-29 用于语音设备音效控制的方法、装置、平台设备及存储介质

Country Status (1)

Country Link
CN (1) CN114500141B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106648524A (zh) * 2016-09-30 2017-05-10 四川九洲电器集团有限责任公司 一种音频播放方法及音频播放设备
CN111354357A (zh) * 2018-12-24 2020-06-30 中移(杭州)信息技术有限公司 一种音频资源播放的方法、装置、电子设备及存储介质
CN113470634A (zh) * 2020-04-28 2021-10-01 海信集团有限公司 语音交互设备的控制方法、服务器及语音交互设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106648524A (zh) * 2016-09-30 2017-05-10 四川九洲电器集团有限责任公司 一种音频播放方法及音频播放设备
CN111354357A (zh) * 2018-12-24 2020-06-30 中移(杭州)信息技术有限公司 一种音频资源播放的方法、装置、电子设备及存储介质
CN113470634A (zh) * 2020-04-28 2021-10-01 海信集团有限公司 语音交互设备的控制方法、服务器及语音交互设备

Also Published As

Publication number Publication date
CN114500141A (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN101175343B (zh) 声像定位装置
EP3547706B1 (en) Method and device for switching play modes of wireless speaker, and wireless speaker
US10149089B1 (en) Remote personalization of audio
JP6785904B2 (ja) 情報プッシュ方法及び装置
CN110933489B (zh) 视频播放控制的方法及装置、视频播放设备
CN104683852B (zh) 处理广播信息的方法和设备
US20170090856A1 (en) Method and terminal for controlling grouping play of playing system
CN104091596A (zh) 一种乐曲识别方法、系统和装置
CN104954853A (zh) 一种播放信息保存方法、系统、播放终端及控制终端
US20170169834A1 (en) Android-based audio content processing method and device
CN107957908A (zh) 一种麦克风共享方法、装置、计算机设备及存储介质
CN103577145A (zh) 电子设备的音量处理装置及方法、电子系统
CN105868400A (zh) 录音信息处理方法及装置
US20230289622A1 (en) Volume recommendation method and apparatus, device and storage medium
CN104376859A (zh) 一种播放列表自动调整的方法和网络音乐播放器
CN114500141B (zh) 用于语音设备音效控制的方法、装置、平台设备及存储介质
CN100483404C (zh) 用于搜索媒体对象的方法
CN116366579B (zh) 一种网络交换机交互的方法以及网络交换机
CN104392744A (zh) 一种录制音频的方法及装置
CN105072534A (zh) 一种无线音箱系统的控制方法及终端
KR20010096297A (ko) 디지털 음원과 광고를 결합한 광고시스템 및 그 방법
CN113905321A (zh) 基于对象音频通道元数据和生成方法、设备及存储介质
WO2020024508A1 (zh) 语音信息的获取方法及装置
CN111477218A (zh) 多语音识别方法、装置、终端和非临时性计算机可读存储介质
CN114500140B (zh) 用于语音设备唤醒的方法、装置、平台设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant