CN112201257A - 基于声纹识别的信息推荐方法、装置、电子设备及存储介质 - Google Patents

基于声纹识别的信息推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112201257A
CN112201257A CN202011053281.9A CN202011053281A CN112201257A CN 112201257 A CN112201257 A CN 112201257A CN 202011053281 A CN202011053281 A CN 202011053281A CN 112201257 A CN112201257 A CN 112201257A
Authority
CN
China
Prior art keywords
user
information
voiceprint
recommendation
voiceprint recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202011053281.9A
Other languages
English (en)
Inventor
魏铄
于旭峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apollo Intelligent Connectivity Beijing Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011053281.9A priority Critical patent/CN112201257A/zh
Publication of CN112201257A publication Critical patent/CN112201257A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了基于声纹识别的信息推荐方法、装置、电子设备及存储介质,涉及深度学习、语音识别、车联网等人工智能领域。具体实现方案为:获取第一用户发起的语音请求;响应于语音识别操作,对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,所述声纹识别结果中包含至少一个用户的声纹信息,其中,所述至少一个用户中的每个用户的声纹信息对应一个用于信息推送的配置信息;根据所述第一用户的声纹信息,获取到与所述第一用户的声纹信息对应的配置信息;为所述第一用户发送基于所述配置信息得到的推荐信息。采用本申请,可以为区别出的不同用户针对性的发送推荐信息,提高与用户互动的便捷性及信息定向推荐的准确性。

Description

基于声纹识别的信息推荐方法、装置、电子设备及存储介质
技术领域
本申请涉及信息处理领域。本申请尤其涉及深度学习、语音识别、车联网等人工智能领域等领域。
背景技术
信息处理的便捷、高效在数据大爆发的时代对用户来说意义重大,便携终端、车载终端、手机终端等电子设备相比以往更加智能化,芯片的解析能力也更强,可以通过开发各个终端或者在各个终端上植入第三方的各种应用来提高对各类信息处理的便捷性及高效性,以尽量使用满足用户交互体验的、易用、简化的信息处理来满足用户生活的方方面面。
信息处理的一应用场景中,以车载终端为例,用户在驾驶车辆过程中,旅途会比较枯燥,有收听音乐、广播节目、聊天等需求,对此需求,相关技术中并未存在有效的解决方案。
发明内容
本申请提供了一种基于声纹识别的信息推荐方法、装置、电子设备及存储介质。
根据本申请的一方面,提供了一种基于声纹识别的信息推荐方法,包括:
获取第一用户发起的语音请求;
响应于语音识别操作,对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,所述声纹识别结果中包含至少一个用户的声纹信息,其中,所述至少一个用户中的每个用户的声纹信息对应一个用于信息推送的配置信息;
根据所述第一用户的声纹信息,获取到与所述第一用户的声纹信息对应的配置信息;
响应于信息推荐的检测操作,为所述第一用户发送基于所述配置信息得到的推荐信息。
根据本申请的另一方面,提供了一种基于声纹识别的信息推荐装置,包括:
请求获取模块,用于获取第一用户发起的语音请求;
声纹识别模块,用于响应于语音识别操作,对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,所述声纹识别结果中包含至少一个用户的声纹信息,其中,所述至少一个用户中的每个用户的声纹信息对应一个用于信息推送的配置信息;
配置获取模块,用于根据所述第一用户的声纹信息,获取到与所述第一用户的声纹信息对应的配置信息;
信息推荐模块,用于响应于信息推荐的检测操作,为所述第一用户发送基于所述配置信息得到的推荐信息。
根据本申请的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本申请任意一实施例所提供的方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使该计算机执行本申请任意一项实施例所提供的方法。
采用本申请,通过获取第一用户发起的语音请求,以便响应于语音识别操作,可以对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,声纹识别结果中包含至少一个用户的声纹信息,其中,所述至少一个用户中的每个用户的声纹信息对应一个用于信息推送的配置信息。根据第一用户的声纹信息,可以获取到与该第一用户的声纹信息对应的配置信息,从而响应于信息推荐的检测操作,为该第一用户发送基于该配置信息得到的推荐信息。由于对第一用户发起的语音请求根据预设的声纹识别结果进行识别,可以得到与该第一用户的声纹信息对应的配置信息,并根据该配置信息为该第一用户发送推荐信息,也就是说,可以通过声纹识别的方式区别出多个用户中的不同用户,从而为该不同用户分别针对性的发送该推荐信息,提高了与用户互动的便捷性及信息定向推荐的准确性。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例的基于声纹识别的信息推荐方法的流程示意图;
图2是根据本申请实施例的声纹识别结果的示意图;
图3是根据本申请实施例的包含用户使用记录及声纹信息的配置信息示意图;
图4是根据本申请实施例的包含定制信息及声纹信息的配置信息示意图;
图5是根据本申请实施例的基于声纹识别的信息推荐装置的组成结构示意图;
图6是用来实现本申请实施例的基于声纹识别的信息推荐方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。本文中术语“第一”、“第二”表示指代多个类似的技术用语并对其进行区分,并不是限定顺序的意思,或者限定只有两个的意思,例如,第一特征和第二特征,是指代有两类/两个特征,第一特征可以为一个或多个,第二特征也可以为一个或多个。
另外,为了更好的说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。
根据本申请的实施例,提供了一种基于声纹识别的信息推荐方法,图1是根据本申请实施例的基于声纹识别的信息推荐方法的流程示意图,该方法可以应用于基于声纹识别的信息推荐装置,例如,该装置可以部署于终端或服务器或其它处理设备执行的情况下,可以执行语音识别、声纹识别、信息推荐等等。其中,终端可以为用户设备(UE,UserEquipment)、移动设备、蜂窝电话、无绳电话、个人数字处理(PDA,Personal DigitalAssistant)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图1所示,包括:
S101、获取第一用户发起的语音请求。
一示例中,该方法应用于车载终端的场景中,该第一用户可以为包括本车车主在内的本车中的一个用户,本车中最多承载5个用户,则获取第一用户发起的语音请求可以为:获取本车内第一用户发起的语音请求,以便对语音请求采用声纹识别方式进行区分,以明确区分出时本车中哪一个用户所发出的语音。
一示例中,该方法应用于家庭为单位的家居终端的场景中,该第一用户可以为以家庭为单位(如一家三口、一家四口、一家五口)的家庭用户中的一个用户,以家庭为单位最多为5个用户,则获取第一用户发起的语音请求可以为:获取本室内第一用户发起的语音请求,以便对语音请求采用声纹识别方式进行区分,以明确区分出时本室内哪一个用户所发出的语音。
本申请除了上述车载终端的场景、家庭为单位的家居终端的场景,还可以适用于其他场景中,且用户总人数不超过5个用户。
S102、响应于语音识别操作,对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,所述声纹识别结果中包含至少一个用户的声纹信息,其中,所述至少一个用户中的每个用户的声纹信息对应一个用于信息推送的配置信息。
S103、根据所述第一用户的声纹信息,获取到与所述第一用户的声纹信息对应的配置信息。
一示例中,该配置信息可以为关系表的形式,比如包含所述至少一个用户的声纹信息、所述至少一个用户的用户使用记录和/或用户使用偏好构成的对应关系表。
S104、响应于信息推荐的检测操作,为所述第一用户发送基于配置信息得到的推荐信息。
相关技术中,以车载终端的场景为例,利用车载终端通常可以识别出车主,比如,依靠车主账号或者车主账号所绑定的车主的人脸进行识别,以便通过车载终端为该车主发送推荐信息。然而,对于车内有包括车主在内不止一个用户(比如网约车有多个乘客)的情况,无法为车内的不止一个用户分别发送推荐信息,比如为用户推送所喜好的音乐、广播节目、广告等。
采用本申请,通过获取第一用户发起的语音请求,以便响应于语音识别操作,可以对第一用户发起的语音请求根据预设的声纹识别结果进行比对,从预设的声纹识别结果包含的至少一个用户数据中比对得到该第一用户的情况下,获取配置信息。可以响应于信息推荐的检测操作,为该第一用户发送基于该配置信息得到的推荐信息。也就是说,本申请可以通过声纹识别来区分出上述车载终端的场景中不止一个用户的声纹特征,从而经过声纹特征的比对确定出发起语音请求的第一用户到底是谁,从而为该不同用户分别针对性的发送该推荐信息,提高了与用户互动的便捷性及信息定向推荐的准确性。
一示例中,就预设的声纹识别结果而言,可以预先收集至少一个用户发起的历史语音请求,对该历史语音请求进行声纹识别,从而得到该预设的声纹识别结果。图2为根据本申请实施例的声纹识别结果的示意图,如图2所示,本车内包括车主在内有五个用户,相应的,该预设的声纹识别结果11中包括分别对应不同用户识别得到的第一声纹信息、第二声纹信息、第三声纹信息、第四声纹信息、及第五声纹信息。
一示例中,可以为该第一用户发送推荐信息,如根据该配置信息(如根据声纹识别<—>用户使用记录对应关系所构成的第一图表)发送该推荐信息。其中,该第一图表仅为示例,该第一图表中“用户使用记录”还可以替换为“用户使用记录+用户偏好”,或者,该第一图表中“用户使用记录”还可以替换为“用户偏好”等等各种可能性。图3是根据本申请实施例的包含用户使用记录及声纹信息的配置信息示意图,如图3所示,在该第一图表20中包含声纹信息11及用户使用记录12。其中,声纹识别信息11及用户使用记录12中的信息分别对应不同的用户并针对性的建立二者的对应关系。
一示例中,还可以预先为包含该第一用户的多个不同用户分别定制所推荐的信息,将该定制好的信息与声纹识别事先配置好,得到该配置信息(如根据声纹识别<—>定制信息对应关系所构成的第二图表),以根据该配置信息发送该推荐信息。图4是根据本申请实施例的包含定制信息及声纹信息的配置信息示意图,如图4所示,在该第二图表30中包含声纹信息11及定制信息13。其中,声纹信息11及定制信息13中的信息分别对应不同的用户并针对性的建立二者的对应关系。
一实施方式中,除了可以收集至少一个用户发起的历史语音请求,对历史语音请求进行声纹识别,得到上述预设的声纹识别结果。还可以对该预设的声纹识别结果进行各种更新操作。
对该预设的声纹识别结果进行各种更新操作的一示例中,若响应于语音识别操作,对获取的第一用户发起的语音请求进行声纹识别,发现并未包含在所述预设的声纹识别结果中,说明该第一用户是新用户,比如之前预设的声纹识别结果都是与车主的家庭成员用户,而该新用户可能是该车主的朋友或相关人员(如该车主为网约车,该相关人员为网约车的用户等),则将对该第一用户发起的语音请求所得到的第一声纹识别结果存储于所述预设的声纹识别结果,即:对该预设的声纹识别结果进行用户数据的更新操作。需要指出的是,所述更新操作,除了以新增第一用户的方式进行添加的更新操作,还可以是删除已有用户的方式进行删除的更新操作等。
采用本实施方式,通过收集历史语音请求得到的识别结果,从而得到该预设的声纹识别结果,还可以对该预设的声纹识别结果进行各种更新操作,以便响应于语音识别操作时,可以根据该预设的声纹识别结果进行比对,以对多个用户进行区分,为信息推荐的准确性提高了先决条件。
一实施方式中,还包括:响应至少一个用户发起历史语音请求,从所述历史语音请求中解析出请求信息;根据所述请求信息,得到至少一个用户的用户使用记录和/或用户使用偏好;关联存储所述至少一个用户的声纹信息和所述至少一个用户的用户使用记录和/或用户使用偏好。
一示例中,可以响应于上述语音识别操作,由于事先存储有根据至少一个用户发起的历史语音请求所得到的声纹识别结果,因此,可以通过声纹识别来区分发起语音的至少一个用户,可以从至少一个用户中区分出当前发起语音请求的第一用户。由于事先收集了至少一个用户发起的历史用户使用记录,并建立了该历史用户使用记录与该声纹信息的对应关系,得到了上述配置信息,因此,如果第一用户为再次发起语音请求的用户,也就是说,已经基于该第一用户前次发起语音请求,经声纹识别及关系配置存储有该配置信息,则:可以为该第一用户再次发起的语音请求,直接根据该配置信息发送推荐信息,比如,该第一用户之前的历史用户使用记录为喜欢听邓丽君的歌曲,那么,该第一用户再次发起的语音请求“我要听歌”,如车载终端上的应用(如音乐类应用)会为该第一用户播放“邓丽君的歌曲”。又如,该第一用户之前的历史用户使用记录为导航去某商场,那么,该第一用户再次发起的语音请求“我距离商场还有多远”,如车载终端上的应用(如聊天互动类应用)会调起地图类应用以获取距离信息,并根据该距离新为该第一用户播放“距离商场还有2公里”、或者与距离相关的信息“距离商场还有5分钟”等等。
本申请不限于此处描述的示例,只要可以触发声纹识别以区分本车内或以家庭为单位的家庭用户中多个用户的某一个目标用户,并为该目标用户发送符合历史用户使用记录的推荐信息,都在本申请的保护范围之内。
本申请中,至少一个用户通过语音所能唤醒并与该至少一个用户进行互动的应用不限于:上述音乐类应用、上述聊天互动类应用,还可以是满足用户互动需求的其他应用,通过这些互动的应用,可以实现音乐开启及播放、收音机开启及播放、视频开启及播放、及相声或综艺等多媒体节目的开启及播放。
本申请中,至少一个用户通过语音发起的语音请求中不限于泛型指令的情况,都可以采用本申请实现基于声纹识别的信息推荐。其中,泛型指令指包含不确定的信息,比如,“我要听歌”,即未明确指出听那一首歌,比如“我要听邓丽君的我只在乎你”,也就是说,即便用户的语音请求所包含的指令内容为不确定的,语焉不详,但是,仍旧可以为用户选择推荐信息并发送,从而形成良好的互动操作。
一实施方式中,对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,包括:从所述第一用户发起的语音请求中解析出语音信息;对所述语音信息进行声纹识别,得到第一声纹特征;将所述第一声纹特征与所述预设的声纹识别结果中的第二声纹特征进行比对;比对一致的情况下,确认所述预设的声纹识别结果中包含所述第一用户的声纹信息。
一实施方式中,所述响应于信息推荐的检测操作,为所述第一用户发送基于所述配置信息得到的推荐信息,包括:根据所关联存储的所述至少一个用户的声纹信息和所述至少一个用户的用户使用记录和/或用户使用偏好,得到对应关系表;所述配置信息为所述对应关系表的情况下,从所述对应关系表中获取到对应所述第一用户的声纹信息,从所述对应关系表中,查询到与所述第一用户的声纹信息对应的第一用户使用记录和/或第一用户使用偏好;根据所述第一用户使用记录和/或第一用户使用偏好,得到所述推荐信息,并为所述第一用户发送所述推荐信息。
一实施方式中,还包括:根据位置优先级或身份优先级为所述第一用户发送所述推荐信息。
一示例中,车载场景的情况下,根据所述位置优先级,确定所述第一用户为车载主驾位置的用户,比如爸爸在主驾位置,对车辆的行驶拥有更多的掌控权,第一用户可以为爸爸。车载场景的情况下,根据所述身份优先级,确定所述第一用户为在车载用户群中身份地位最高的用户,比如妈妈作为一家之主,拥有更多的掌控权,因此,第一用户可以为妈妈。
一示例中,家居场景的情况下,根据所述位置优先级,确定所述第一用户为用于响应所述语音识别操作的终端距离最近的用户,比如,姐姐距离该终端最近,第一用户可以为姐姐。家居场景的情况下,根据所述身份优先级,确定所述第一用户为在家居用户群中身份地位最高的用户,比如妈妈作为一家之主,拥有更多的掌控权,因此,第一用户可以为妈妈。
一示例中,该配置信息可以为对应该第一用户的配置信息,比如基于该第一用户账号下的多个历史用户使用记录构成的配置表,以便为该第一用户针对性的推送基于该配置信息得到的推荐信息。
一示例中,针对上述根据预设的声纹识别结果进行比对而言,可以采用各种比对方法,不限于采用如多层感知、径向基函数等神经网络方法。还可显式训练,以区分说话人和其背景说话人等等,都在本申请的保护范围之内。
一实施方式中,响应于信息推荐的检测操作,为所述第一用户发送基于所述配置信息得到的推荐信息,包括:从所述配置信息中,查询到对应所述第一用户的第一声纹识别结果;从所述配置信息中,提取与所述第一声纹信息对应的第一历史用户使用记录(可以为一个或多个);根据所述第一历史用户使用记录得到所述推荐信息,并为所述第一用户发送所述推荐信息。
一实施方式中,还可以包括:根据所述预设的声纹识别结果,将至少一个用户绑定在本车车主的用户账号下,得到用户列表。比如,该方法用于车载终端的场景中,上述第一用户发起语音请求后可以语音唤醒小度(如车载终端中安装的第三方应用“百度语音助手-小度”)时,通过声纹识别记录区分使用该车的不同用户后,将不同用户绑定在该本车的当前车主帐号下。
应用示例:
应用本申请实施例一处理流程包括如下内容:
一、在用户唤醒“百度语音助手-小度”(“百度语音助手-小度”可以安装于车载终端中)时,可以通过声纹识别记录区分使用该车的不同用户,区分出该车的不同用户后,可以将这些用户绑定在当前车主的帐号下。通过预先收集或实时收集用户发起的语音,得到各个用户分别对应的各个声纹唤醒后的用户使用记录、用户使用偏好等,以建立包含所述至少一个用户的声纹信息、所述至少一个用户的用户使用记录和/或用户使用偏好构成的对应关系表,从而得到配置信息,如“声纹—用户使用记录的配置关系”。
二、如果该用户之前已经通过声纹识别并记录在预设的声纹识别结果中,则直接为用户发送推荐信息,比如,唤醒后发起播放音乐、打开收音机、播放视频、来段相声。
三、如果该用户未被记录在预设的声纹识别结果中,则先将其更新到预设的声纹识别结果中,以及同时更新该配置信息,在该用户再次唤醒“百度语音助手-小度”时,对该用户进行声纹识别后根据该配置信息为用户发送推荐信息,比如,唤醒后发起播放音乐、打开收音机、播放视频、来段相声。
根据本申请的实施例,提供了一种基于声纹识别的信息推荐装置,图5是根据本申请实施例的基于声纹识别的信息推荐装置的组成结构示意图,如图5所示,包括:请求获取模块41,用于获取第一用户发起的语音请求;声纹识别模块42,用于响应于语音识别操作,对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,所述声纹识别结果中包含至少一个用户的声纹信息,其中,所述至少一个用户中的每个用户的声纹信息对应一个用于信息推送的配置信息;配置获取模块43,用于根据所述第一用户的声纹信息,获取到与所述第一用户的声纹信息对应的配置信息;信息推荐模块44,用于响应于信息推荐的检测操作,为所述第一用户发送基于所述配置信息得到的推荐信息。
一实施方式中,还包括第一收集模块,用于收集至少一个用户发起的历史语音请求,对所述历史语音请求进行声纹识别,得到所述声纹识别结果。
一实施方式中,还包括:请求响应模块,用于响应至少一个用户发起历史语音请求,从所述历史语音请求中解析出请求信息;第二收集模块,用于根据所述请求信息,得到至少一个用户的用户使用记录和/或用户使用偏好;存储模块,用于关联存储所述至少一个用户的声纹信息和所述至少一个用户的用户使用记录和/或用户使用偏好。
一实施方式中,所述声纹识别模块,用于从所述第一用户发起的语音请求中解析出语音信息;对所述语音信息进行声纹识别,得到第一声纹特征;将所述第一声纹特征与所述预设的声纹识别结果中的第二声纹特征进行比对;比对一致的情况下,确认所述预设的声纹识别结果中包含所述第一用户的声纹信息。
一实施方式中,所述信息推荐模块,用于根据所关联存储的所述至少一个用户的声纹信息和所述至少一个用户的用户使用记录和/或用户使用偏好,得到对应关系表;所述配置信息为所述对应关系表的情况下,从所述对应关系表中获取到对应所述第一用户的声纹信息,从所述对应关系表中,查询到与所述第一用户的声纹信息对应的第一用户使用记录和/或第一用户使用偏好;根据所述第一用户使用记录和/或第一用户使用偏好,得到所述推荐信息,并为所述第一用户发送所述推荐信息。
一实施方式中,还包括:优先级推送模块,用于根据位置优先级或身份优先级为所述第一用户发送所述推荐信息。
一实施方式中,还包括:用户优先级确定模块,用于车载场景的情况下,根据所述位置优先级,确定所述第一用户为车载主驾位置的用户;车载场景的情况下,根据所述身份优先级,确定所述第一用户为在车载用户群中身份地位最高的用户。
一实施方式中,还包括:用户优先级确定模块,用于家居场景的情况下,根据所述位置优先级,确定所述第一用户为用于响应所述语音识别操作的终端距离最近的用户;家居场景的情况下,根据所述身份优先级,确定所述第一用户为在家居用户群中身份地位最高的用户。
一实施方式中,还包括账号绑定模块,用于根据所述预设的声纹识别结果,将至少一个用户绑定在本车车主的用户账号下,得到用户列表。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是用来实现本申请实施例的基于声纹识别的信息推荐方法的电子设备的框图。该电子设备可以为前述部署设备或代理设备。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器801、存储器802,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器801为例。
存储器802即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的基于声纹识别的信息推荐方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的基于声纹识别的信息推荐方法。
存储器802作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的基于声纹识别的信息推荐方法对应的程序指令/模块(例如,附图5所示的请求获取模块、声纹比对模块、信息推荐模块等模块)。处理器801通过运行存储在存储器802中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的基于声纹识别的信息推荐方法。
存储器802可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器802可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器802可选包括相对于处理器801远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
基于声纹识别的信息推荐方法的电子设备,还可以包括:输入装置803和输出装置804。处理器801、存储器802、输入装置803和输出装置804可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置803可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置804可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示7器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
采用本申请,通过获取第一用户发起的语音请求,以便响应于语音识别操作,可以对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,声纹识别结果中包含至少一个用户的声纹信息,每个声纹信息对应一个用于信息推送的配置信息。根据第一用户的声纹信息,可以获取到与该第一用户的声纹信息对应的配置信息,从而响应于信息推荐的检测操作,为该第一用户发送基于该配置信息得到的推荐信息。由于对第一用户发起的语音请求根据预设的声纹识别结果进行识别,可以得到与该第一用户的声纹信息对应的配置信息,并根据该配置信息为该第一用户发送推荐信息,也就是说,可以通过声纹识别的方式区别出多个用户中的不同用户,从而为该不同用户分别针对性的发送该推荐信息,提高了与用户互动的便捷性及信息定向推荐的准确性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (20)

1.一种基于声纹识别的信息推荐方法,所述方法包括:
获取第一用户发起的语音请求;
响应于语音识别操作,对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,所述声纹识别结果中包含至少一个用户的声纹信息,其中,所述至少一个用户中的每个用户的声纹信息对应一个用于信息推送的配置信息;
根据所述第一用户的声纹信息,获取到与所述第一用户的声纹信息对应的配置信息;
响应于信息推荐的检测操作,为所述第一用户发送基于所述配置信息得到的推荐信息。
2.根据权利要求1所述的方法,还包括:
收集至少一个用户发起的历史语音请求,对所述历史语音请求进行声纹识别,得到所述声纹识别结果。
3.根据权利要求1所述的方法,还包括:
响应至少一个用户发起历史语音请求,从所述历史语音请求中解析出请求信息;
根据所述请求信息,得到至少一个用户的用户使用记录和/或用户使用偏好;
关联存储所述至少一个用户的声纹信息和所述至少一个用户的用户使用记录和/或用户使用偏好。
4.根据权利要求1-3中任一项所述的方法,其中,所述对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,包括:
从所述第一用户发起的语音请求中解析出语音信息;
对所述语音信息进行声纹识别,得到第一声纹特征;
将所述第一声纹特征与所述预设的声纹识别结果中的第二声纹特征进行比对;
比对一致的情况下,确认所述预设的声纹识别结果中包含所述第一用户的声纹信息。
5.根据权利要求3所述的方法,其中,所述响应于信息推荐的检测操作,为所述第一用户发送基于所述配置信息得到的推荐信息,包括:
根据所关联存储的所述至少一个用户的声纹信息和所述至少一个用户的用户使用记录和/或用户使用偏好,得到对应关系表;
所述配置信息为所述对应关系表的情况下,从所述对应关系表中获取到对应所述第一用户的声纹信息,从所述对应关系表中,查询到与所述第一用户的声纹信息对应的第一用户使用记录和/或第一用户使用偏好;
根据所述第一用户使用记录和/或第一用户使用偏好,得到所述推荐信息,并为所述第一用户发送所述推荐信息。
6.根据权利要求1所述的方法,还包括:
根据位置优先级或身份优先级为所述第一用户发送所述推荐信息。
7.根据权利要求6所述的方法,还包括:
车载场景的情况下,根据所述位置优先级,确定所述第一用户为车载主驾位置的用户;
车载场景的情况下,根据所述身份优先级,确定所述第一用户为在车载用户群中身份地位最高的用户。
8.根据权利要求6所述的方法,还包括:
家居场景的情况下,根据所述位置优先级,确定所述第一用户为用于响应所述语音识别操作的终端距离最近的用户;
家居场景的情况下,根据所述身份优先级,确定所述第一用户为在家居用户群中身份地位最高的用户。
9.根据权利要求1-3中任一项所述的方法,还包括:
根据所述声纹识别结果,将至少一个用户绑定在本车车主的用户账号下,得到用户列表。
10.一种基于声纹识别的信息推荐装置,所述装置包括:
请求获取模块,用于获取第一用户发起的语音请求;
声纹识别模块,用于响应于语音识别操作,对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别,所述声纹识别结果中包含至少一个用户的声纹信息,其中,所述至少一个用户中的每个用户的声纹信息对应一个用于信息推送的配置信息;
配置获取模块,用于根据所述第一用户的声纹信息,获取到与所述第一用户的声纹信息对应的配置信息;
信息推荐模块,用于响应于信息推荐的检测操作,为所述第一用户发送基于所述配置信息得到的推荐信息。
11.根据权利要求10所述的装置,还包括第一收集模块,用于:
收集至少一个用户发起的历史语音请求,对所述历史语音请求进行声纹识别,得到所述声纹识别结果。
12.根据权利要求10所述的装置,还包括:
请求响应模块,用于响应至少一个用户发起历史语音请求,从所述历史语音请求中解析出请求信息;
第二收集模块,用于根据所述请求信息,得到至少一个用户的用户使用记录和/或用户使用偏好;
存储模块,用于关联存储所述至少一个用户的声纹信息和所述至少一个用户的用户使用记录和/或用户使用偏好。
13.根据权利要求10-12中任一项所述的装置,其中,所述声纹识别模块,用于:
从所述第一用户发起的语音请求中解析出语音信息;
对所述语音信息进行声纹识别,得到第一声纹特征;
将所述第一声纹特征与所述预设的声纹识别结果中的第二声纹特征进行比对;
比对一致的情况下,确认所述预设的声纹识别结果中包含所述第一用户的声纹信息。
14.根据权利要求10-12中任一项所述的装置,其中,所述信息推荐模块,用于:
根据所关联存储的所述至少一个用户的声纹信息和所述至少一个用户的用户使用记录和/或用户使用偏好,得到对应关系表;
所述配置信息为所述对应关系表的情况下,从所述对应关系表中获取到对应所述第一用户的声纹信息,从所述对应关系表中,查询到与所述第一用户的声纹信息对应的第一用户使用记录和/或第一用户使用偏好;
根据所述第一用户使用记录和/或第一用户使用偏好,得到所述推荐信息,并为所述第一用户发送所述推荐信息。
15.根据权利要求7所述的装置,还包括:优先级推送模块,用于:
根据位置优先级或身份优先级为所述第一用户发送所述推荐信息。
16.根据权利要求15所述的装置,还包括:用户优先级确定模块,用于:
车载场景的情况下,根据所述位置优先级,确定所述第一用户为车载主驾位置的用户;
车载场景的情况下,根据所述身份优先级,确定所述第一用户为在车载用户群中身份地位最高的用户。
17.根据权利要求15所述的装置,还包括:用户优先级确定模块,用于:
家居场景的情况下,根据所述位置优先级,确定所述第一用户为用于响应所述语音识别操作的终端距离最近的用户;
家居场景的情况下,根据所述身份优先级,确定所述第一用户为在家居用户群中身份地位最高的用户。
18.根据权利要求10-12中任一项所述的装置,还包括账号绑定模块,用于:
根据所述预设的声纹识别结果,将至少一个用户绑定在本车车主的用户账号下,得到用户列表。
19.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。
CN202011053281.9A 2020-09-29 2020-09-29 基于声纹识别的信息推荐方法、装置、电子设备及存储介质 Withdrawn CN112201257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011053281.9A CN112201257A (zh) 2020-09-29 2020-09-29 基于声纹识别的信息推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011053281.9A CN112201257A (zh) 2020-09-29 2020-09-29 基于声纹识别的信息推荐方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112201257A true CN112201257A (zh) 2021-01-08

Family

ID=74008018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011053281.9A Withdrawn CN112201257A (zh) 2020-09-29 2020-09-29 基于声纹识别的信息推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112201257A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113611305A (zh) * 2021-09-06 2021-11-05 云知声(上海)智能科技有限公司 自主学习家居场景下的语音控制方法、系统、设备及介质
CN113656609A (zh) * 2021-08-13 2021-11-16 阿波罗智联(北京)科技有限公司 推荐多媒体信息的方法、装置、电子设备和存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868360A (zh) * 2016-03-29 2016-08-17 乐视控股(北京)有限公司 基于语音识别的内容推荐方法及装置
CN105979376A (zh) * 2015-12-02 2016-09-28 乐视致新电子科技(天津)有限公司 一种推荐方法和装置
CN106043179A (zh) * 2016-06-08 2016-10-26 乐视控股(北京)有限公司 车辆调节方法及装置
CN106228988A (zh) * 2016-07-29 2016-12-14 珠海市魅族科技有限公司 一种基于声纹信息的习惯信息匹配方法及装置
CN107623614A (zh) * 2017-09-19 2018-01-23 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN108062354A (zh) * 2017-11-22 2018-05-22 上海博泰悦臻电子设备制造有限公司 信息推荐方法、系统、存储介质、电子设备及车辆
CN108074571A (zh) * 2017-12-27 2018-05-25 深圳市亿道信息股份有限公司 增强现实设备的语音控制方法、系统及存储介质
CN108122557A (zh) * 2017-12-25 2018-06-05 四川长虹电器股份有限公司 基于声纹识别的车载多媒体导航终端
CN108320753A (zh) * 2018-01-22 2018-07-24 珠海格力电器股份有限公司 电器设备的控制方法、装置和系统
CN109547854A (zh) * 2019-01-23 2019-03-29 深圳市酷开网络科技有限公司 一种基于声纹识别的电视推送方法、智能电视及存储介质
CN110415695A (zh) * 2019-07-25 2019-11-05 华为技术有限公司 一种语音唤醒方法及电子设备
CN110867188A (zh) * 2018-08-13 2020-03-06 珠海格力电器股份有限公司 内容服务的提供方法、装置、存储介质及电子装置
CN110990685A (zh) * 2019-10-12 2020-04-10 中国平安财产保险股份有限公司 基于声纹的语音搜索方法、设备、存储介质及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105979376A (zh) * 2015-12-02 2016-09-28 乐视致新电子科技(天津)有限公司 一种推荐方法和装置
CN105868360A (zh) * 2016-03-29 2016-08-17 乐视控股(北京)有限公司 基于语音识别的内容推荐方法及装置
CN106043179A (zh) * 2016-06-08 2016-10-26 乐视控股(北京)有限公司 车辆调节方法及装置
CN106228988A (zh) * 2016-07-29 2016-12-14 珠海市魅族科技有限公司 一种基于声纹信息的习惯信息匹配方法及装置
CN107623614A (zh) * 2017-09-19 2018-01-23 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN108062354A (zh) * 2017-11-22 2018-05-22 上海博泰悦臻电子设备制造有限公司 信息推荐方法、系统、存储介质、电子设备及车辆
CN108122557A (zh) * 2017-12-25 2018-06-05 四川长虹电器股份有限公司 基于声纹识别的车载多媒体导航终端
CN108074571A (zh) * 2017-12-27 2018-05-25 深圳市亿道信息股份有限公司 增强现实设备的语音控制方法、系统及存储介质
CN108320753A (zh) * 2018-01-22 2018-07-24 珠海格力电器股份有限公司 电器设备的控制方法、装置和系统
CN110867188A (zh) * 2018-08-13 2020-03-06 珠海格力电器股份有限公司 内容服务的提供方法、装置、存储介质及电子装置
CN109547854A (zh) * 2019-01-23 2019-03-29 深圳市酷开网络科技有限公司 一种基于声纹识别的电视推送方法、智能电视及存储介质
CN110415695A (zh) * 2019-07-25 2019-11-05 华为技术有限公司 一种语音唤醒方法及电子设备
CN110990685A (zh) * 2019-10-12 2020-04-10 中国平安财产保险股份有限公司 基于声纹的语音搜索方法、设备、存储介质及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656609A (zh) * 2021-08-13 2021-11-16 阿波罗智联(北京)科技有限公司 推荐多媒体信息的方法、装置、电子设备和存储介质
CN113611305A (zh) * 2021-09-06 2021-11-05 云知声(上海)智能科技有限公司 自主学习家居场景下的语音控制方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
US11409817B2 (en) Display apparatus and method of controlling the same
JP7214778B2 (ja) 情報推薦方法及び装置
CN108763579B (zh) 搜索内容推荐方法、装置、终端设备及存储介质
WO2018157721A1 (zh) 信息获取方法、提供方法、装置及系统、存储介质
CN105787776A (zh) 信息处理方法及装置
CN109725975A (zh) 消息被读状态的提示方法、装置和电子设备
CN104796743A (zh) 内容项显示系统、方法及设备
CN104933170A (zh) 信息展示方法及装置
CN105262674A (zh) 用于设置隐私权限的方法、装置、服务器及终端
CN112201257A (zh) 基于声纹识别的信息推荐方法、装置、电子设备及存储介质
CN110706701B (zh) 语音技能推荐方法、装置、设备及存储介质
CN104090921A (zh) 多媒体文件播放方法、装置、终端及服务器
CN105100197A (zh) 安装应用的方法及装置
CN108427549B (zh) 通知消息的声音处理方法、装置、存储介质及终端
CN111611023A (zh) 智能设备的控制方法、装置、电子设备和存储介质
CN112581946A (zh) 语音控制方法、装置、电子设备和可读存储介质
CN105091894A (zh) 导航方法、智能终端设备及可穿戴设备
CN109597996B (zh) 一种语义解析方法、装置、设备和介质
CN105096162A (zh) 内容项显示方法及装置
CN112948621A (zh) 音乐应用中的播客推荐方法及设备
CN111881005A (zh) 一种信息显示方法、装置、设备及存储介质
CN112825256A (zh) 录制语音包功能的引导方法、装置、设备和计算机存储介质
CN104866477A (zh) 一种信息处理方法及电子设备
CN110109597A (zh) 一种歌单切换方法、装置、系统、终端和存储介质
CN106411699B (zh) 社交网络应用中的消息显示控制方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211019

Address after: 100176 Room 101, 1st floor, building 1, yard 7, Ruihe West 2nd Road, economic and Technological Development Zone, Daxing District, Beijing

Applicant after: Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd.

Address before: 2 / F, baidu building, 10 Shangdi 10th Street, Haidian District, Beijing 100085

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
WW01 Invention patent application withdrawn after publication

Application publication date: 20210108

WW01 Invention patent application withdrawn after publication