CN115022664A

CN115022664A - 基于人工智能的直播带货辅助方法及装置

Info

Publication number: CN115022664A
Application number: CN202210687843.8A
Authority: CN
Inventors: 王冬晨; 马晨光; 陈吉胜
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2022-06-17
Filing date: 2022-06-17
Publication date: 2022-09-06

Abstract

基于人工智能的直播带货辅助方法及装置，该方法将直播过程的介绍内容对象进行分类，根据分类创建意图，利用收集的语料训练意图形成语义模型；对预设的意图配置对应的应答内容，将配置的应答内容和训练意图的语义模型关联至直播软件中；在利用直播软件进行直播过程中，采用ASR引擎将主播语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配；将命中的意图所对应的应答内容，展示到直播终端的屏幕上供用户观看。本发明简化了主播工作，节省卖货时间；能够快速教会消费者如何观看直播和购物，提高用户转化率；同时人工智能技术的运用，提高趣味性，可以使消费者更久的停留，变相为直播间带来热度，实现正向循环。

Description

基于人工智能的直播带货辅助方法及装置

技术领域

本发明属于在线直播技术领域，具体涉及一种基于人工智能的直播带货辅助方法及装置。

背景技术

目前，随着移动互联网的发展及销售渠道的线上化，直播带货逐渐成为零售行业的主流销售模式。以网红主播为代表的直播带货行业，逐步刺激传统的互联网销售，如淘宝，京东进行升级。且随着行业的发展，带货主播成为国家新型行业技术岗位，一个好的直播，可以更好介绍货品，带动气氛，促进消费者购买，从而提高转化率，提高成交额。

对于新型的直播带货方式，消费者在观看直播时，同时也需要学习很多直播的操作以及购买的方法。比如怎么关注主播，怎么加入粉丝团，怎么参与抽奖，怎么购买闪购商品，怎么购买货架商品。此时，主播就需要再拿出一个手机，在手机上进行演示，并用直播设备拍摄演示手机。现有方案中，存在演示效率低，浪费卖货时间，直播体验非常差，导致用户学不会，影响转化率，且需要频繁讲解。如何研究一种直播带货辅助技术方案是亟待解决的技术问题。

发明内容

为此，本发明提供一种基于人工智能的直播带货辅助方法及装置，解决直播带货过程中需要频繁演示及无法及时应答用户，用户转化率低的问题。

为了实现上述目的，本发明提供如下技术方案：基于人工智能的直播带货辅助方法，包括：

将直播过程的介绍内容对象进行分类，根据分类创建意图，利用收集的语料训练意图形成语义模型；

对预设的意图配置对应的应答内容，将配置的应答内容和训练意图的语义模型关联至直播软件中；

在利用直播软件进行直播过程中，采用ASR引擎将主播语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配；

将命中的意图所对应的应答内容，展示到直播终端的屏幕上供用户观看。

作为基于人工智能的直播带货辅助方法优选方案，对指定用户在直播软件的弹幕进行语义理解，若触发意图，则向指定用户单独发送所触发意图对应的应答内容。

作为基于人工智能的直播带货辅助方法优选方案，当弹幕为互动交流文字时，利用NLP引擎理解弹幕的互动交流文字；

当弹幕为语音互动时，采用ASR引擎将弹幕语音转文字，再由NLP引擎理解ASR引擎转换的弹幕文字，对转换的弹幕文字进行意图匹配。

作为基于人工智能的直播带货辅助方法优选方案，对预设的意图配置的应答内容包括预置的图像动画，还包括将对应的文字应答内容通过TTS引擎转换的语音。

作为基于人工智能的直播带货辅助方法优选方案，通过触发关键词或正则表达式的形式，启动ASR引擎进行语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配。

本发明还提供一种基于人工智能的直播带货辅助装置，包括：

意图创建模块，用于将直播过程的介绍内容对象进行分类，根据分类创建意图；

意图训练模块，用于利用收集的语料训练意图形成语义模型；

应答配置模块，用于对预设的意图配置对应的应答内容，将配置的应答内容和训练意图的语义模型关联至直播软件中；

意图匹配模块，用于在利用直播软件进行直播过程中，采用ASR引擎将主播语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配；

应答反馈模块，用于将命中的意图所对应的应答内容，展示到直播终端的屏幕上供用户观看。

作为基于人工智能的直播带货辅助装置优选方案，还包括弹幕处理模块，用于对指定用户在直播软件的弹幕进行语义理解，若触发意图，则向指定用户单独发送所触发意图对应的应答内容。

作为基于人工智能的直播带货辅助装置优选方案，所述弹幕处理模块中，当弹幕为互动交流文字时，利用NLP引擎理解弹幕的互动交流文字；

所述弹幕处理模块中，当弹幕为语音互动时，采用ASR引擎将弹幕语音转文字，再由NLP引擎理解ASR引擎转换的弹幕文字，对转换的弹幕文字进行意图匹配。

作为基于人工智能的直播带货辅助装置优选方案，所述应答配置模块中，对预设的意图配置的应答内容包括预置的图像动画，还包括将对应的文字应答内容通过TTS引擎转换的语音。

作为基于人工智能的直播带货辅助装置优选方案，所述意图匹配模块及所述弹幕处理模块中，通过触发关键词或正则表达式的形式，启动ASR引擎进行语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配。

本发明具有如下优点：将直播过程的介绍内容对象进行分类，根据分类创建意图，利用收集的语料训练意图形成语义模型；对预设的意图配置对应的应答内容，将配置的应答内容和训练意图的语义模型关联至直播软件中；在利用直播软件进行直播过程中，采用ASR引擎将主播语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配；将命中的意图所对应的应答内容，展示到直播终端的屏幕上供用户观看。本发明利用ASR、NLP、TTS技术提供了一种带货辅助方案，简化了主播的工作，节省了卖货时间；能够快速教会消费者如何观看直播和购物，让消费者可以第一时间加入到购买队伍中，提高用户转化率；同时人工智能技术的运用，提高了趣味性及消费者兴趣，可以使消费者更久的停留在直播间，变相为直播间带来热度，实现正向循环。

附图说明

为了更清楚地说明本发明的实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图引伸获得其它的实施附图。

图1为本发明实施例1提供的基于人工智能的直播带货辅助方法流程示意图；

图2为本发明实施例2提供的基于人工智能的直播带货辅助装置架构示意图。

具体实施方式

以下由特定的具体实施例说明本发明的实施方式，熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

由于一场直播持续时间长，主播指导性操作需要重复去做，每次都要找设备、进行演示，如果遇到网络问题，或者临场找演示设备，或者主播演示的操作有问题，一来浪费卖货时间，二来直播体验非常差，导致用户学不会，影响转化率。另外无法回看，演示完毕后如果有新人加入直播间，则在下一次演示前，新加入用户并不知道相应的操作方式。有鉴于此，本发明提供如下具体技术方案，以解决直播带货过程中需要频繁演示及无法及时应答用户，用户转化率低的问题。

实施例1

参见图1，本发明实施例1提供一种基于人工智能的直播带货辅助方法，包括：

S1、将直播过程的介绍内容对象进行分类，根据分类创建意图，利用收集的语料训练意图形成语义模型；

S2、对预设的意图配置对应的应答内容，将配置的应答内容和训练意图的语义模型关联至直播软件中；

S3、在利用直播软件进行直播过程中，采用ASR引擎将主播语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配；

S4、将命中的意图所对应的应答内容，展示到直播终端的屏幕上供用户观看。

本实施例中，还包括S5、对指定用户在直播软件的弹幕进行语义理解，若触发意图，则向指定用户单独发送所触发意图对应的应答内容。当弹幕为互动交流文字时，利用NLP引擎理解弹幕的互动交流文字；当弹幕为语音互动时，采用ASR引擎将弹幕语音转文字，再由NLP引擎理解ASR引擎转换的弹幕文字，对转换的弹幕文字进行意图匹配。

具体的，在实施过程中，将需要介绍的内容进行分类，并创建意图，如“关注主播”，“购买流程”，“加入粉丝团”等，收集对应的语料并训练意图，形成语义模型。对应的语料可以从历史直播过程中总结概括。比如需要介绍“购买流程”的语料，“怎么购买”，“购买链接在哪儿”，“从哪儿入手”等。

针对不同的意图，可以配置不同应对内容，支持TTS回复，图像动画等等形式。然后将配置的内容以及训练的语义模型关联到主播的直播软件中。

具体的，训练语义模型和直播软件关联存在相关技术，即对训练好的语义模型进行软件部署，如利用python服务接口，在python服务器上部署模型文件，给出一个http服务，后台通过这个服务可以调用语义模型进行输入输出。也可以利用java直接加载语义模型，使用TensorFlow的java包，然后加载训练的语义模型文件，事先将模型文件保存成pb格式，然后在java的环境中添加依赖。最后再加载语义模型。不需要额外的接口，调用方便，不需要额外安装python环境。

本实施例中，对预设的意图配置的应答内容包括预置的图像动画，还包括将对应的文字应答内容通过TTS引擎转换的语音。通过触发关键词或正则表达式的形式，启动ASR引擎进行语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配。

具体的，主播在直播过程中，如果需要介绍购买流程，只需要触发关键词或正则表达式，如“给大家介绍一下购买流程”。此时ASR引擎将语音转文字，并由NLP引擎理解，命中意图“购买流程”，通过配置的“购买流程”意图展示的内容，在直播终端屏幕中自动展示给到消费者进行观看。当新来的消费者不知道操作方式时，可以接收消费者的打字交流互动，或者语音互动弹幕，此时依然通过ASR引擎和NLP引擎技术对消费者语义进行理解，如触发意图，则给该消费者单独播放询问问题的答案或视频动画。

具体的，ASR引擎能够将麦克风采集到的自然声音转化为文字，NLP引擎能够使计算机像人类一样理解、处理和生成语言，通过机器学习进行工作。TTS引擎能够把文字转化为自然语音流。ASR引擎、NLP引擎和TTS引擎技术本身存在相关技术。

需要说明的是，本实施例中，语义模型的训练，意图识别等本身存在相关技术。

综上所述，本发明通过将直播过程的介绍内容对象进行分类，根据分类创建意图，利用收集的语料训练意图形成语义模型；对预设的意图配置对应的应答内容，将配置的应答内容和训练意图的语义模型关联至直播软件中；在利用直播软件进行直播过程中，采用ASR引擎将主播语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配；将命中的意图所对应的应答内容，展示到直播终端的屏幕上供用户观看。本发明利用ASR、NLP、TTS技术提供了一种带货辅助方案，简化了主播的工作，节省了卖货时间；能够快速教会消费者如何观看直播和购物，让消费者可以第一时间加入到购买队伍中，提高用户转化率；同时人工智能技术的运用，提高了趣味性及消费者兴趣，可以使消费者更久的停留在直播间，变相为直播间带来热度，实现正向循环。

需要说明的是，本公开实施例的方法可以由单个设备执行，例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下，由多台设备相互配合来完成。在这种分布式场景的情况下，这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤，这多台设备相互之间会进行交互以完成所述的方法。

需要说明的是，上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

实施例2

参见图2，本发明实施例2还提供一种基于人工智能的直播带货辅助装置，包括：

意图创建模块1，用于将直播过程的介绍内容对象进行分类，根据分类创建意图；

意图训练模块2，用于利用收集的语料训练意图形成语义模型；

应答配置模块3，用于对预设的意图配置对应的应答内容，将配置的应答内容和训练意图的语义模型关联至直播软件中；

意图匹配模块4，用于在利用直播软件进行直播过程中，采用ASR引擎将主播语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配；

应答反馈模块5，用于将命中的意图所对应的应答内容，展示到直播终端的屏幕上供用户观看。

本实施例中，还包括弹幕处理模块6，用于对指定用户在直播软件的弹幕进行语义理解，若触发意图，则向指定用户单独发送所触发意图对应的应答内容。

本实施例中，所述弹幕处理模块6中，当弹幕为互动交流文字时，利用NLP引擎理解弹幕的互动交流文字；

所述弹幕处理模块6中，当弹幕为语音互动时，采用ASR引擎将弹幕语音转文字，再由NLP引擎理解ASR引擎转换的弹幕文字，对转换的弹幕文字进行意图匹配。

本实施例中，所述应答配置模块5中，对预设的意图配置的应答内容包括预置的图像动画，还包括将对应的文字应答内容通过TTS引擎转换的语音。

本实施例中，所述意图匹配模块4及所述弹幕处理模块6中，通过触发关键词或正则表达式的形式，启动ASR引擎进行语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配。

本实施例的基于人工智能的直播带货辅助装置实施过程中，将需要介绍的内容进行分类，并创建意图，如“关注主播”，“购买流程”，“加入粉丝团”等，收集对应的语料并训练意图，形成语义模型。对应的语料可以从历史直播过程中总结概括。比如需要介绍“购买流程”的语料，“怎么购买”，“购买链接在哪儿”，“从哪儿入手”等。针对不同的意图，可以配置不同应对内容，支持TTS回复，图像动画等等形式。然后将配置的内容以及训练的语义模型关联到主播的直播软件中。

主播在直播过程中，如果需要介绍购买流程，只需要触发关键词或正则表达式，如“给大家介绍一下购买流程”。此时ASR引擎将语音转文字，并由NLP引擎理解，命中意图“购买流程”，通过配置的“购买流程”意图展示的内容，在直播终端屏幕中自动展示给到消费者进行观看。当新来的消费者不知道操作方式时，可以接收消费者的打字交流互动，或者语音互动弹幕，此时依然通过ASR引擎和NLP引擎技术对消费者语义进行理解，如触发意图，则给该消费者单独播放询问问题的答案或视频动画。

需要说明的是，上述装置各模块/子模块之间的信息交互、执行过程等内容，由于与本申请实施例1中的方法实施例基于同一构思，其带来的技术效果与本申请方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

实施例3

本发明实施例3提供一种非暂态计算机可读存储介质，所述计算机可读存储介质中存储有基于人工智能的直播带货辅助方法的程序代码，所述程序代码包括用于执行实施例1或其任意可能实现方式的基于人工智能的直播带货辅助方法的指令。

计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(SolidState Disk、SSD))等。

实施例4

本发明实施例4提供一种电子设备，包括：存储器和处理器；

所述处理器和所述存储器通过总线完成相互间的通信；所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行实施例1或其任意可能实现方式的基于人工智能的直播带货辅助方法。

具体的，处理器可以通过硬件来实现也可以通过软件来实现，当通过硬件实现时，该处理器可以是逻辑电路、集成电路等；当通过软件来实现时，该处理器可以是一个通用处理器，通过读取存储器中存储的软件代码来实现，该存储器可以集成在处理器中，可以位于所述处理器之外，独立存在。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

虽然，上文中已经用一般性说明及具体实施例对本发明作了详尽的描述，但在本发明基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

Claims

1.基于人工智能的直播带货辅助方法，其特征在于，包括：

2.根据权利要求1所述的基于人工智能的直播带货辅助方法，其特征在于，对指定用户在直播软件的弹幕进行语义理解，若触发意图，则向指定用户单独发送所触发意图对应的应答内容。

3.根据权利要求2所述的基于人工智能的直播带货辅助方法，其特征在于，当弹幕为互动交流文字时，利用NLP引擎理解弹幕的互动交流文字；

4.根据权利要求3所述的基于人工智能的直播带货辅助方法，其特征在于，对预设的意图配置的应答内容包括预置的图像动画，还包括将对应的文字应答内容通过TTS引擎转换的语音。

5.根据权利要求4所述的基于人工智能的直播带货辅助方法，其特征在于，通过触发关键词或正则表达式的形式，启动ASR引擎进行语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配。

6.基于人工智能的直播带货辅助装置，其特征在于，包括：

7.根据权利要求6所述的基于人工智能的直播带货辅助装置，其特征在于，还包括弹幕处理模块，用于对指定用户在直播软件的弹幕进行语义理解，若触发意图，则向指定用户单独发送所触发意图对应的应答内容。

8.根据权利要求7所述的基于人工智能的直播带货辅助装置，其特征在于，所述弹幕处理模块中，当弹幕为互动交流文字时，利用NLP引擎理解弹幕的互动交流文字；

9.根据权利要求8所述的基于人工智能的直播带货辅助装置，其特征在于，所述应答配置模块中，对预设的意图配置的应答内容包括预置的图像动画，还包括将对应的文字应答内容通过TTS引擎转换的语音。

10.根据权利要求9所述的基于人工智能的直播带货辅助装置，其特征在于，所述意图匹配模块及所述弹幕处理模块中，通过触发关键词或正则表达式的形式，启动ASR引擎进行语音转文字，并由NLP引擎理解ASR引擎转换的文字，对转换的文字进行意图匹配。