CN108960934A - 语音对话过程中的信息推荐方法及系统 - Google Patents

语音对话过程中的信息推荐方法及系统 Download PDF

Info

Publication number
CN108960934A
CN108960934A CN201810797047.3A CN201810797047A CN108960934A CN 108960934 A CN108960934 A CN 108960934A CN 201810797047 A CN201810797047 A CN 201810797047A CN 108960934 A CN108960934 A CN 108960934A
Authority
CN
China
Prior art keywords
user
information
recommended
log information
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810797047.3A
Other languages
English (en)
Inventor
肖通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Speech Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN201810797047.3A priority Critical patent/CN108960934A/zh
Publication of CN108960934A publication Critical patent/CN108960934A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Signal Processing (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种语音对话过程中的信息推荐方法,包括:接收当前用户通过当前终端设备所发送的对话语句;对所述对话语句进行分析处理,以获得分析处理结果;查询对应于所述当前用户的关联日志信息;基于所述分析处理结果和所述关联日志信息确定待推荐内容。本发明中,通过获取的关联日志信息能够确定用户的历史行为信息,进一步的通过对用户的对话语句进行分析处理能够获得当前用户的意图,最终综合考虑用户的历史行为信息和当前用户意图来确定待推荐内容,从而提升了为用户所推荐内容的精准性,提升了用户体验。

Description

语音对话过程中的信息推荐方法及系统
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音对话过程中的信息推荐方法、系统、电子设备及存储介质。
背景技术
智能推荐是新近比较热门的技术分支和应用分支,它通过智能算法为客户精确推荐其需的产品和服务。目前市面上智能推荐系统已经有若干比较流行的技术,主要分为基于用户的协同过滤算法和基于商品的协同过滤算法两大类。基于用户的协同过滤算法,基本思路是将用户进行分类分组,再根据本组内用户的选择偏好,对同组的其他人员进行推荐商品。基于商品的协同过滤算法,基本思路是以商品被推荐或收藏或关注的所处的同一池子(篮子)来进行商品的分类分组,进而对同属于一类的或关联的商品向特定的用户进行推荐。
然而,发明人发现,无论上述哪一种算法,都是简单的为用户推荐与历史访问内容相关联的信息。这种机械的推荐方法只能基于历史信息来推定用户当前可能喜欢的内容,忽略了用户当前的真实意图,从而导致为用户所推荐的内容并非用户当前所感兴趣的内容,推荐不精准,造成不好的用户体验。
发明内容
本发明实施例提供一种语音对话过程中的信息推荐方法、系统、电子设备及存储介质,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种语音对话过程中的信息推荐方法,包括:
接收当前用户通过当前终端设备所发送的对话语句;
对所述对话语句进行分析处理,以获得分析处理结果;
查询对应于所述当前用户的关联日志信息;
基于所述分析处理结果和所述关联日志信息确定待推荐内容。
第二方面,本发明实施例提供一种语音对话过程中的信息推荐系统,包括:
信息接收程序模块,用于接收当前用户通过当前终端设备所发送的对话语句;
对话分析程序模块,用于对所述对话语句进行分析处理,以获得分析处理结果;
日志查询程序模块,用于查询对应于所述当前用户的关联日志信息;
推荐内容确定程序模块,用于基于所述分析处理结果和所述关联日志信息确定待推荐内容。
第三方面,本发明实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项语音对话过程中的信息推荐方法。
第四方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明上述任一项语音对话过程中的信息推荐方法。
第五方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项语音对话过程中的信息推荐方法。
本发明实施例中,通过获取的关联日志信息能够确定用户的历史行为信息,进一步的通过对用户的对话语句进行分析处理能够获得当前用户的意图,最终综合考虑用户的历史行为信息和当前用户意图来确定待推荐内容,从而提升了为用户所推荐内容的精准性,提升了用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的语音对话过程中的信息推荐方法的一实施例的流程图;
图2为本发明的语音对话过程中的信息推荐方法的另一实施例的流程图;
图3为本发明实施例中的获取日志信息的架构示意图;
图4为本发明的语音对话过程中的信息推荐方法的再一实施例的流程图;
图5为本发明的语音对话过程中的信息推荐方法的又一实施例的流程图;
图6为语音对话过程全链路个性化推荐嵌入流程图;
图7为在语音对话过程中的资源调取中的个性化推荐嵌入流程图;
图8为在语音对话过程中由使用方自主调用个性化推荐内容流程图;
图9为本发明的语音对话过程中的信息推荐系统一实施例的原理图;
图10为本发明中的日志查询程序模块一实施例的原理图;
图11为本发明中的对话分析程序模块一实施例的原理图;
图12为本发明中的推荐内容确定程序模块一实施例的原理图;
图13为本发明的电子设备的一实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
在本发明中,“模块”、“装置”、“系统”等指应用于计算机的相关实体,如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如,元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中,并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间,并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号,例如,来自一个与本地系统、分布式系统中另一元件交互的,和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
如图1所示,本发明的实施例提供一种语音对话过程中的信息推荐方法,该方法可以应用于语音对话服务器,该语音对话服务器与智能音箱或者车载导航终端或者智能终端等配合以为用户提供语音对话服务,该方法包括:
S10、接收当前用户通过当前终端设备所发送的对话语句;其中,当前终端可以是当前用户所使用的智能手机,例如,当前用户可以通过智能手机上所安装的语音助手说“我想听XXX的歌”,则智能手机将该对话语句发送至语音对话服务器。
S20、对所述对话语句进行分析处理,以获得分析处理结果;本发明实施例中,语音对话服务器中搭载有语音对话服务系统,用于对所述对话语句进行分析处理,从而能够根据用户的实时对话语句确定当前用户的当前意图。其中,语音对话服务器可以包括自动语音识别系统、自然语言理解系统和对话管理系统。
S30、查询对应于所述当前用户的关联日志信息;该关联日志信息为与当前用户的当前意图相关联的日志信息,例如,该关联日志信息为购买唱片记录,怎可以确定待推荐内容为,为当前用户推荐XXX歌手的在售唱片。
S40、基于所述分析处理结果和所述关联日志信息确定待推荐内容。通过基于与用户的当前意图相关的日志信息以及的分析处理结果来确定待推荐内容,从而使得所确定的待推荐内容既是与用户当前意图相关的内容,又是与用户的历史行为相关联的内容。由此得到的待推荐内容必然更加符合用户喜好、适于用户需求,使得推荐内容不会显得生硬,能够为用户提供良好的体验。
本实施例中,通过获取的关联日志信息能够确定用户的历史行为信息,进一步的通过对用户的对话语句进行分析处理能够获得当前用户的意图,最终综合考虑用户的历史行为信息和当前用户意图来确定待推荐内容,从而提升了为用户所推荐内容的精准性,提升了用户体验。
如图2所示,为本发明的语音对话过程中的信息推荐方法的另一实施例,其中,所述查询对应于所述当前用户的关联信息包括:
S31、从所述对话语句中提取所述当前用户的关联声纹信息;
S32、在用户日志库中查询对应于所述关联声纹信息的关联日志信息;其中,所述用户日志库中存储有所有用户的声纹信息与相应的日志信息存储地址之间的映射关系。
由于声纹信息是每个用户各自独有的生物特征信息,采用关联声纹信息保证了对用户识别的唯一性。因为,实际应用中,同一个终端设备可能会有多个用户都使用过,如果简单的认为使用同一个终端的就是同一个用户,从而就会把具有不同喜好的用户的日志信息误以为是同一个用户的日志信息,从而无论实际使用终端设备的是哪个用户,所推荐的内容都是基于所有使用过该终端的用户的日志信息(历史行为)所确定的,显然这样所推荐的内容是不够精准的。
而本发明实施例中,由于用于确定待推荐内容的日志信息是唯一对应于用户声纹信息的,所以保证了所获取的关联日志信息必然是唯一对应于当前用户的,也就真正做到了基于用户自己的历史行为,来为用户进行个性化内容的推荐,保证了推荐内容的精准性,避免了不同用户之间的干扰。
本发明实施例的所能解决的另一个问题是,保证了用户的隐私。例如,第一用户和第二用户共用终端设备A,那么第一用户和第二用户分别使用终端设备A时,都能够看到系统基于对方的喜好所推荐的内容,从而就能够进一步的反推出对方的历史上网行为,窥探对方隐私。而本发明实施例的方法则显然不存在这种问题,因为每一次为用户推荐内容所基于的关联日志信息都是根据唯一对应于用户的声纹信息对获取的,进而所呈现的推荐内容也仅仅是基于当前用户的历史行为和当前行为所确定的。
此外,发明人在实现本发明的过程中发现,基于本发明的方法也一定程度上也方便了用户的上网行为。例如,在第一用户登录自有账户访问某购物网站后,第二用户第一用户的账户登录状态下直接访问该购物网站,由于是以语音对话的形式进行访问的,所以即便是在第一用户的账户登录状态下,为第二用户所呈现的推荐内容也是基于第二用户的历史日志信息和当前意图所确定的,而非基于第一用户的自有账号所确定的。因此,无需第二用户登录自己的账号也能够获取符合自己喜好的推荐内容。
所述关联日志信息可以是所述当前用户通过所述当前终端设备之外的其它终端设备所上传的日志信息。本发明实施例中的方法不限定用户所使用的终端设备,只要是对话过程中识别了用户的声纹信息,就能够获取对应于该声纹信息的日志信息。并且无论用户在哪个终端上所产生的历史数据都作为日志信息上传至服务器或者云端。
所述用户日志库中存储有用户的多个不同账户信息下所产生的日志信息。用户日志库中所存储的日志信息包括了用户在不同账户下所产生的所有的日志信息,例如,同一个用户在淘宝、京东、当当、亚马逊、百度等账户下各自产生的日志信息,都将作为与该同一用户的声纹信息相对应的存储在用户日志库中。
如图3所示,为本发明实施例中获取日志信息的架构图,所包括的日志信息包括但不限于来自网站的网站属性数据,来自终端设备的行为日志(本地skill)、基础信息(车型/车速/GPS等)、云端日志(云log),来自合作方和第三方的数据(爬虫数据),内容资源调用日志,其它数据(例如,aios数据、智能客服数据、标注数据)。之后将所采集的数据上报并拉取路径和规则,存储在基础日志存储系统中,最终由基础日志应用分发层发送至推荐系统(应用本发明上述实施例的语音对话过程中的推荐方法的推荐系统)。
如图4所示,为本发明的语音对话过程中的信息推荐方法的另一实施例,其中,所述对所述对话语句进行分析处理,以获得分析处理结果包括:
S21、自动语音识别系统将所述对话语句转化为相应的文本信息;
S22、自然语言理解系统对所述文本信息进行分析处理以得到语义解析结果;
S23、对话管理系统根据所述语义解析结果以确定推荐引擎地址。
本实施例所涉及的自动语音识别系统、自然语言理解系统和对话管理系统均可以是依托于现有技术中较为成熟的神经网络训练服方法,预先训练得到。通过自然语言理解系统确定了能够反映用户当前意图的语义解析结果,其中还包括了对话所属的领域(例如,导航领域、餐饮领域、旅游领域等),进一步地由对话管理系统来确定对应于领域的推荐引擎的推荐引擎地址,以用于搜索符合用户喜好的推荐内容。
如图5所示,为本发明的语音对话过程中的信息推荐方法的另一实施例,其中,所述基于所述分析处理结果和所述关联日志信息确定待推荐内容包括:
S41、基于所述推荐引擎地址启动所述推荐引擎;
S42、所述推荐引擎根据所述关联日志信息搜索以确定待推荐内容。
对话推荐系统与语音交互系统融合,并且做到基于语音日志的对话过程推荐,有三种典型的应用场景(如图6-7所示)。第一种是语音对话过程全链路个性化推荐嵌入,即在整个对话管理过程中,推荐内容深度融合。第二种是在语音对话过程中的资源调取中的个性化推荐嵌入,即当对话过程中需调取外部API资源时,进行个性化推荐。第三种是在语音对话过程中,由使用方自主管理对话过程,进而自主调用个性化推荐内容。
如图6所示,为语音对话过程全链路个性化推荐嵌入流程图,使用方在使用对话定制时,应添加该技能对应哪个领域的推荐(比如如果是音乐相关的技能,则配置该技能应被对应至个性化推荐的音乐领域),具体包括:
当终端用户通过产品和技能发起一个请求后,经过语音云服务的识别/语义解析后,送至语音云服务的对话管理中,由对话管理来判断该条语义解析结果是否应进入个性化推荐系统(提高匹配的精确度),一般来讲可以根据语义slot的匹配度来做判断;
若对话管理系统判断需进入个性化推荐系统,则将该请求已配置的对应推荐领域和语义解析结果同步至推荐系统。由推荐系统运算并给出推荐结果;
进入推荐系统后,一般需要经过这样几个重点环节来输出结果:其一,判断是否进入定制化推荐模式,主要判断条件是看“是否有定制化推荐条件”“推荐内容标签是否存在”“定制化条件是否合理并且满足”这三个条件,如果三个条件同时满足则进入定制化推荐引擎中,如果三个条件有一个不满足则进入非定制化引擎中(即通用推荐引擎);
其中,是否有定制化推荐条件指的是,客户或者开发者需要有自己个性化的推荐条件,比如有客户要求“当我的客户开车的时速达到120公里/小时的时候,就给他推荐舒缓一些的音乐”“当发现我客户情绪很低落的时候,就给他讲一个有趣的笑话”,这些都是定制化的推荐条件。
内容标签是否存在指的是,对于需要推荐的内容有没有进行标签化管理。比如音乐有“悲伤音乐/开心音乐音乐/老年人音乐等”,故事有“鬼故事/儿童故事等”。这些就是内容的标签。在有的地方做了比较规范的管理,有的是没有这个的。
条件是否合理并可满足指的是,推荐引擎切换的判断中,需要查看上述的几种条件,但是有条件并不代表条件就是合理的。比如如果客户这么定义条件“当我的客户变成了孙悟空,就给他吃一个仙桃”“如果空调达到了零下50度,就给客户讲个笑话”。如果这些不合理的条件出现,则会判断不合理。
推荐引擎基于以上内容给出个性化推荐结果,再通过统一化的API接口形式输出,供使用方调用,在本例中,使用方可输入的即为终端用户的语音请求(如“我想听首歌”)和用户ID信息,输出的结果即为个性化的推荐结果(如“歌曲列表”或“歌手列表”等);
对话管理系统根据推荐系统给出的推荐结果去调用内容服务资源的接口,查询到相关的内容,然后推送给终端用户或用语音合成播报出来;
推荐系统给出推荐结果后,为了保证推荐引擎的有效性和准确性,需要做两个事情,一个事情是对于推荐结果的用户反馈,主要由用户的显示反馈(如用户点击了歌曲或者点击了不喜欢)和隐示反馈(如用户有没有听这首歌或者歌曲播放的时长等),一个事情是对推荐结果的效果监测,主要有离线评测、A/Btest评测、用户反馈评测等几种方法。将这些反馈结果和评测结果回传至推荐引擎中,可以有效优化推荐引擎的效果;至此,语音对话过程和个性化推荐系统的融合闭环基本形成。
如图7所示,为在语音对话过程中的资源调取中的个性化推荐嵌入流程图,包括:用户通过终端发送请求至语音云处理,由语音云处理(DDS-Server:ASR+NLU)对该请求进行处理,之后将处理结果发送至语音云处理(DDS-Server:DM),进一步DDS-Server基于NLU和DM的处理结果进行结果查询;由基于webhook和推荐引擎生成新webhook引擎查询结果并发送至DDS-Server,对查询结果进行正常语音云处理(DDS-Server:ASR+NLU+DM+终端);最后获取用户对推荐结果的反馈以及用户对推荐效果的评价以用于优化推荐引擎。其中,DDS-Server的全称是“DUI(Dialogue User Interface)Dialogue System-Server”,中文全称是“DUI对话系统-服务”,ASR指的是Automatic Speech Recognition,NLU指的是NaturalLanguage Understanding,DM指的是DialogManagement,webhook是一个API概念,并且变得越来越流行。我们能用事件描述的事物越多,webhook的作用范围也就越大。webhook作为一个轻量的事件处理应用,正变得越来越有用。准确的说webhook是一种web回调或者http的push API,是向APP或者其他应用提供实时信息的一种方式。webhook在数据产生时立即发送数据,也就是你能实时收到数据。这一种不同于典型的API,需要用了实时性需要足够快的轮询。这无论是对生产还是对消费者都是高效的,唯一的缺点是初始建立困难。webhook有时也被称为反向API,因为他提供了API规则,你需要设计要使用的API。webhook将向你的应用发起http请求,典型的是post请求,应用程序由请求驱动。
如图8所示,为在语音对话过程中由使用方自主调用个性化推荐内容流程图,包括:用户通过终端发送请求至语音云处理,由语音云处理(DDS-Server:ASR+NLU)对该请求进行处理,之后开发者接管对话和资源调用,开发者向推荐系统发送关联信息(包括是否需要推荐和该对话应用的领域),推荐系统基于关联信息确定推荐结果并由开发者进行资源调用和终端对接,最后收集用户对推荐结果的反馈和用户对推荐效果的评价以用于优化推荐引擎。
个性化推荐系统目前在市面上应用已经比较广泛,比如在电商购物选择中,可以根据历史购买记录和浏览记录等信息,进行有效的个性化推荐,再比如在新闻浏览页面,可以根据历史浏览习惯和喜好,自动的推送用户喜欢的内容。这些做法都可以有效的提高用户的依赖度和粘性,提升平台的活跃度。
当然,这些都是较常规的页面化和静默的推荐行为。基于语音日志和对话过程中的个性化推荐系统就比较好的解决了在语音交互这一新兴领域中个性化推荐的落地问题。能够帮助用户更快更好的找到自己喜欢的内容,更好的服务于用户,也能够显著提高用户的粘性和活跃度,这些都是对语音交互发展比较有益的,也能够促进人机交互过程中的流畅度,消除生硬感和陌生感。
上文中,介绍了三种典型的语音交互过程中个性化推荐的应用场景,并着重介绍了第一种应用场景,即语音对话过程全链路个性化推荐嵌入,即在整个对话管理过程中,推荐内容深度融合。还有其他两种典型场景在此也大略介绍一下,并略述三者的优劣点。
第一种,在语音对话全过程中进行个性化推荐嵌入。优点是通用性较后两者更好。缺点是每个技能都需要开发者进行配置,比较繁琐,学习成本也比较高,暂时无法做到产品级(多技能组合形式)的一键式推荐引擎调用
第二种,为在语音对话过程中的资源调取中的个性化推荐嵌入。当对话过程中需调取外部API资源时,进行个性化推荐,即将推荐系统与内容资源的API调用接口进行融合,使用API时默认会使用推荐系统。这种方法优点是开发者学习成本低,基本能做到感知不到。缺点是:第一,用户在使用API调用的时候也许不想用推荐系统,这种需求满足不了;第二,这种方法只能局限在可控的内容资源接口上,对于外部的非可控的API则做不到
第三种,在语音对话过程中,由使用方自主管理对话过程,进而自主调用个性化推荐内容。即将对话管理权交给使用方,由其决定是否采用推荐系统,或者采用怎样的API资源,并且管理自己的对话。这种方法的优点是比较灵活,开发者可以自主确定对话的输入输出,推荐系统作为API形式单独存在即可。缺点是开发者学习成本比较高,需要对推荐系统和对话管理系统均具备比较深入的了解才能够实现。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作合并,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
如图9所示,本发明的实施例还提供一种语音对话过程中的信息推荐系统900,包括:
信息接收程序模块910,用于接收当前用户通过当前终端设备所发送的对话语句;
对话分析程序模块920,用于对所述对话语句进行分析处理,以获得分析处理结果;
日志查询程序模块930,用于查询对应于所述当前用户的关联日志信息;
推荐内容确定程序模块940,用于基于所述分析处理结果和所述关联日志信息确定待推荐内容。
本实施例中,通过获取的关联日志信息能够确定用户的历史行为信息,进一步的通过对用户的对话语句进行分析处理能够获得当前用户的意图,最终综合考虑用户的历史行为信息和当前用户意图来确定待推荐内容,从而提升了为用户所推荐内容的精准性,提升了用户体验。
如图10所示,本发明实施例中的所述日志查询程序模块930包括:
声纹提取单元931,用于从所述对话语句中提取所述当前用户的关联声纹信息;
日志查询单元932,用于在用户日志库中查询对应于所述关联声纹信息的关联日志信息;其中,所述用户日志库中存储有所有用户的声纹信息与相应的日志信息存储地址之间的映射关系。
在一些实施例中,所述用户日志库中存储有用户的多个不同账户信息下所产生的日志信息。
在一些实施例中,所述关联日志信息可以是所述当前用户通过所述当前终端设备之外的其它终端设备所上传的日志信息。
如图11所示,本发明实施例中的所述对话分析程序模块920包括:
自动语音识别单元921,用于将所述对话语句转化为相应的文本信息;
自然语言理解单元922,用于对所述文本信息进行分析处理以得到语义解析结果;
对话管理单元923,用于根据所述语义解析结果以确定推荐引擎地址。
如图12所示,本发明实施例中的所述推荐内容确定程序模块940包括:
引擎启动单元941,用于基于所述推荐引擎地址启动所述推荐引擎;
推荐引擎单元942,用于根据所述关联日志信息搜索以确定待推荐内容。
在一些实施例中,本发明实施例提供一种非易失性计算机可读存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项语音对话过程中的信息推荐方法。
在一些实施例中,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项语音对话过程中的信息推荐方法。
在一些实施例中,本发明实施例还提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行语音对话过程中的信息推荐方法。
在一些实施例中,本发明实施例还提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时语音对话过程中的信息推荐方法。
上述本发明实施例的语音对话过程中的信息推荐系统可用于执行本发明实施例的语音对话过程中的信息推荐方法,并相应的达到上述本发明实施例的实现语音对话过程中的信息推荐方法所达到的技术效果,这里不再赘述。本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
图13是本申请另一实施例提供的执行语音对话过程中的信息推荐方法的电子设备的硬件结构示意图,如图13所示,该设备包括:
一个或多个处理器1310以及存储器1320,图13中以一个处理器1310为例。
执行语音对话过程中的信息推荐方法的设备还可以包括:输入装置1330和输出装置1340。
处理器1310、存储器1320、输入装置1330和输出装置1340可以通过总线或者其他方式连接,图13中以通过总线连接为例。
存储器1320作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的语音对话过程中的信息推荐方法对应的程序指令/模块。处理器1310通过运行存储在存储器1320中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例语音对话过程中的信息推荐方法。
存储器1320可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据语音对话过程中的信息推荐训练装置的使用所创建的数据等。此外,存储器1320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器1320可选包括相对于处理器1310远程设置的存储器,这些远程存储器可以通过网络连接至语音对话过程中的信息推荐装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置1330可接收输入的数字或字符信息,以及产生与语音对话过程中的信息推荐装置的用户设置以及功能控制有关的信号。输出装置1340可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器1320中,当被所述一个或者多个处理器1310执行时,执行上述任意方法实施例中的语音对话过程中的信息推荐方法。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种语音对话过程中的信息推荐方法,包括:
接收当前用户通过当前终端设备所发送的对话语句;
对所述对话语句进行分析处理,以获得分析处理结果;
查询对应于所述当前用户的关联日志信息;
基于所述分析处理结果和所述关联日志信息确定待推荐内容。
2.根据权利要求1所述的方法,其中,所述查询对应于所述当前用户的关联信息包括:
从所述对话语句中提取所述当前用户的关联声纹信息;
在用户日志库中查询对应于所述关联声纹信息的关联日志信息;其中,所述用户日志库中存储有所有用户的声纹信息与相应的日志信息存储地址之间的映射关系。
3.根据权利要求1所述的方法,其中,所述对所述对话语句进行分析处理,以获得分析处理结果包括:
自动语音识别系统将所述对话语句转化为相应的文本信息;
自然语言理解系统对所述文本信息进行分析处理以得到语义解析结果;
对话管理系统根据所述语义解析结果以确定推荐引擎地址。
4.根据权利要求3所述的方法,其中,所述基于所述分析处理结果和所述关联日志信息确定待推荐内容包括:
基于所述推荐引擎地址启动所述推荐引擎;
所述推荐引擎根据所述关联日志信息搜索以确定待推荐内容。
5.一种语音对话过程中的信息推荐系统,包括:
信息接收程序模块,用于接收当前用户通过当前终端设备所发送的对话语句;
对话分析程序模块,用于对所述对话语句进行分析处理,以获得分析处理结果;
日志查询程序模块,用于查询对应于所述当前用户的关联日志信息;
推荐内容确定程序模块,用于基于所述分析处理结果和所述关联日志信息确定待推荐内容。
6.根据权利要求5所述的系统,其中,所述日志查询程序模块包括:
声纹提取单元,用于从所述对话语句中提取所述当前用户的关联声纹信息;
日志查询单元,用于在用户日志库中查询对应于所述关联声纹信息的关联日志信息;其中,所述用户日志库中存储有所有用户的声纹信息与相应的日志信息存储地址之间的映射关系。
7.根据权利要求5所述的系统,其中,所述对话分析程序模块包括:
自动语音识别单元,用于将所述对话语句转化为相应的文本信息;
自然语言理解单元,用于对所述文本信息进行分析处理以得到语义解析结果;
对话管理单元,用于根据所述语义解析结果以确定推荐引擎地址。
8.根据权利要求7所述的系统,其中,所述推荐内容确定程序模块包括:引擎启动单元,用于基于所述推荐引擎地址启动所述推荐引擎;
推荐引擎单元,用于根据所述关联日志信息搜索以确定待推荐内容。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任意一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任意一项所述方法的步骤。
CN201810797047.3A 2018-07-19 2018-07-19 语音对话过程中的信息推荐方法及系统 Pending CN108960934A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810797047.3A CN108960934A (zh) 2018-07-19 2018-07-19 语音对话过程中的信息推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810797047.3A CN108960934A (zh) 2018-07-19 2018-07-19 语音对话过程中的信息推荐方法及系统

Publications (1)

Publication Number Publication Date
CN108960934A true CN108960934A (zh) 2018-12-07

Family

ID=64497893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810797047.3A Pending CN108960934A (zh) 2018-07-19 2018-07-19 语音对话过程中的信息推荐方法及系统

Country Status (1)

Country Link
CN (1) CN108960934A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885778A (zh) * 2018-12-27 2019-06-14 福建农林大学 一种基于增强现实的旅游导览应用方法及系统
CN110008331A (zh) * 2019-04-15 2019-07-12 三角兽(北京)科技有限公司 信息展示方法、装置、电子设备及计算机可读存储介质
CN110674338A (zh) * 2019-09-27 2020-01-10 百度在线网络技术(北京)有限公司 语音技能推荐方法、装置、设备及存储介质
CN110730274A (zh) * 2019-10-17 2020-01-24 厦门快商通科技股份有限公司 语音抓包解析方法、系统、移动终端及存储介质
CN110866179A (zh) * 2019-10-08 2020-03-06 上海博泰悦臻网络技术服务有限公司 一种基于语音助手的推荐方法、终端及计算机存储介质
CN111144939A (zh) * 2019-12-23 2020-05-12 上海擎感智能科技有限公司 一种产品分析方法、装置、计算机存储介质及系统
CN112085463A (zh) * 2020-08-11 2020-12-15 广州汽车集团股份有限公司 一种车载语音日程管理装置、方法及车载终端
CN112163081A (zh) * 2020-10-14 2021-01-01 网易(杭州)网络有限公司 标签确定方法、装置、介质及电子设备
CN112486336A (zh) * 2020-11-09 2021-03-12 深圳市鹰硕教育服务有限公司 基于云服务平台的智能笔数据处理方法、装置及电子设备
CN112712800A (zh) * 2020-12-14 2021-04-27 杭州未名信科科技有限公司 应用于充电桩的数据处理方法、装置、存储介质及终端
CN112732951A (zh) * 2020-12-30 2021-04-30 青岛海信智慧生活科技股份有限公司 一种人机交互的方法及装置
CN113162847A (zh) * 2021-03-08 2021-07-23 北京百度网讯科技有限公司 交互方法、装置、设备及存储介质
CN113722455A (zh) * 2021-08-09 2021-11-30 北京零秒科技有限公司 数据处理方法及装置、存储介质、电子装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063521A (zh) * 2014-07-17 2014-09-24 百度在线网络技术(北京)有限公司 搜索业务实现方法和装置
CN104836720A (zh) * 2014-02-12 2015-08-12 北京三星通信技术研究有限公司 交互式通信中进行信息推荐的方法及装置
CN105702254A (zh) * 2012-05-24 2016-06-22 上海博泰悦臻电子设备制造有限公司 基于移动终端的语音控制装置及其语音控制方法
CN105933413A (zh) * 2016-04-21 2016-09-07 深圳前海大数点科技有限公司 一种基于用户声音交互的个性化实时内容推送系统
CN107886949A (zh) * 2017-11-24 2018-04-06 科大讯飞股份有限公司 一种内容推荐方法及装置
CN107993133A (zh) * 2018-01-23 2018-05-04 北京知行信科技有限公司 一种基于自然语言的智能分析推荐方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105702254A (zh) * 2012-05-24 2016-06-22 上海博泰悦臻电子设备制造有限公司 基于移动终端的语音控制装置及其语音控制方法
CN104836720A (zh) * 2014-02-12 2015-08-12 北京三星通信技术研究有限公司 交互式通信中进行信息推荐的方法及装置
CN104063521A (zh) * 2014-07-17 2014-09-24 百度在线网络技术(北京)有限公司 搜索业务实现方法和装置
CN105933413A (zh) * 2016-04-21 2016-09-07 深圳前海大数点科技有限公司 一种基于用户声音交互的个性化实时内容推送系统
CN107886949A (zh) * 2017-11-24 2018-04-06 科大讯飞股份有限公司 一种内容推荐方法及装置
CN107993133A (zh) * 2018-01-23 2018-05-04 北京知行信科技有限公司 一种基于自然语言的智能分析推荐方法及系统

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885778A (zh) * 2018-12-27 2019-06-14 福建农林大学 一种基于增强现实的旅游导览应用方法及系统
CN110008331B (zh) * 2019-04-15 2021-09-14 腾讯科技(深圳)有限公司 信息展示方法、装置、电子设备及计算机可读存储介质
CN110008331A (zh) * 2019-04-15 2019-07-12 三角兽(北京)科技有限公司 信息展示方法、装置、电子设备及计算机可读存储介质
CN110674338A (zh) * 2019-09-27 2020-01-10 百度在线网络技术(北京)有限公司 语音技能推荐方法、装置、设备及存储介质
CN110674338B (zh) * 2019-09-27 2022-11-01 百度在线网络技术(北京)有限公司 语音技能推荐方法、装置、设备及存储介质
CN110866179A (zh) * 2019-10-08 2020-03-06 上海博泰悦臻网络技术服务有限公司 一种基于语音助手的推荐方法、终端及计算机存储介质
CN110730274B (zh) * 2019-10-17 2021-11-19 厦门快商通科技股份有限公司 语音抓包解析方法、系统、移动终端及存储介质
CN110730274A (zh) * 2019-10-17 2020-01-24 厦门快商通科技股份有限公司 语音抓包解析方法、系统、移动终端及存储介质
CN111144939A (zh) * 2019-12-23 2020-05-12 上海擎感智能科技有限公司 一种产品分析方法、装置、计算机存储介质及系统
CN112085463A (zh) * 2020-08-11 2020-12-15 广州汽车集团股份有限公司 一种车载语音日程管理装置、方法及车载终端
CN112163081A (zh) * 2020-10-14 2021-01-01 网易(杭州)网络有限公司 标签确定方法、装置、介质及电子设备
CN112486336A (zh) * 2020-11-09 2021-03-12 深圳市鹰硕教育服务有限公司 基于云服务平台的智能笔数据处理方法、装置及电子设备
CN112712800A (zh) * 2020-12-14 2021-04-27 杭州未名信科科技有限公司 应用于充电桩的数据处理方法、装置、存储介质及终端
CN112732951A (zh) * 2020-12-30 2021-04-30 青岛海信智慧生活科技股份有限公司 一种人机交互的方法及装置
CN113162847A (zh) * 2021-03-08 2021-07-23 北京百度网讯科技有限公司 交互方法、装置、设备及存储介质
CN113162847B (zh) * 2021-03-08 2023-03-24 北京百度网讯科技有限公司 交互方法、装置、设备及存储介质
CN113722455A (zh) * 2021-08-09 2021-11-30 北京零秒科技有限公司 数据处理方法及装置、存储介质、电子装置

Similar Documents

Publication Publication Date Title
CN108960934A (zh) 语音对话过程中的信息推荐方法及系统
US11030412B2 (en) System and method for chatbot conversation construction and management
US11810576B2 (en) Personalization of experiences with digital assistants in communal settings through voice and query processing
Khan et al. Build better chatbots
US10817667B2 (en) Method and system for a chat box eco-system in a federated architecture
JP7044916B2 (ja) データ送信のためのフィードバックコントローラ
CN104394126B (zh) 信息推荐方法、服务器、客户端及系统
US10339926B2 (en) Digital assistant
CN108351870A (zh) 根据活动模式的计算机语音识别和语义理解
US11355123B2 (en) Network data aligning
US20200097608A1 (en) Method and system for service agent assistance of article recommendations to a customer in an app session
CN108491188B (zh) 语音对话产品的开发资源的管理方法及装置
CN109145204A (zh) 画像标签生成和使用方法及系统
CN112133281A (zh) 一种语音播报方法、装置、电子设备和存储介质
CN109313668B (zh) 构建会话理解系统的系统和方法
CN105989120B (zh) 一种个性化内容推荐方法及个性化内容推荐系统
EP3625668B1 (en) Establishment of audio-based network sessions with non-registered resources
CN105491126A (zh) 基于人工智能的服务提供方法及装置
CN109948151A (zh) 构建语音助手的方法
WO2021107951A1 (en) Interfacing with applications via dynamically updating natural language processing
CN108140055A (zh) 触发应用信息
CN113746875A (zh) 一种语音包推荐方法、装置、设备及存储介质
US11057332B2 (en) Augmented expression sticker control and management
CN112837683B (zh) 语音服务方法及装置
CN110268400A (zh) 改进与电子聊天界面的交互

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181207