CN115022664A - 基于人工智能的直播带货辅助方法及装置 - Google Patents

基于人工智能的直播带货辅助方法及装置 Download PDF

Info

Publication number
CN115022664A
CN115022664A CN202210687843.8A CN202210687843A CN115022664A CN 115022664 A CN115022664 A CN 115022664A CN 202210687843 A CN202210687843 A CN 202210687843A CN 115022664 A CN115022664 A CN 115022664A
Authority
CN
China
Prior art keywords
live broadcast
intention
bullet screen
characters
engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210687843.8A
Other languages
English (en)
Inventor
王冬晨
马晨光
陈吉胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN202210687843.8A priority Critical patent/CN115022664A/zh
Publication of CN115022664A publication Critical patent/CN115022664A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/47815Electronic shopping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)

Abstract

基于人工智能的直播带货辅助方法及装置,该方法将直播过程的介绍内容对象进行分类,根据分类创建意图,利用收集的语料训练意图形成语义模型;对预设的意图配置对应的应答内容,将配置的应答内容和训练意图的语义模型关联至直播软件中;在利用直播软件进行直播过程中,采用ASR引擎将主播语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配;将命中的意图所对应的应答内容,展示到直播终端的屏幕上供用户观看。本发明简化了主播工作,节省卖货时间;能够快速教会消费者如何观看直播和购物,提高用户转化率;同时人工智能技术的运用,提高趣味性,可以使消费者更久的停留,变相为直播间带来热度,实现正向循环。

Description

基于人工智能的直播带货辅助方法及装置
技术领域
本发明属于在线直播技术领域,具体涉及一种基于人工智能的直播带货辅助方法及装置。
背景技术
目前,随着移动互联网的发展及销售渠道的线上化,直播带货逐渐成为零售行业的主流销售模式。以网红主播为代表的直播带货行业,逐步刺激传统的互联网销售,如淘宝,京东进行升级。且随着行业的发展,带货主播成为国家新型行业技术岗位,一个好的直播,可以更好介绍货品,带动气氛,促进消费者购买,从而提高转化率,提高成交额。
对于新型的直播带货方式,消费者在观看直播时,同时也需要学习很多直播的操作以及购买的方法。比如怎么关注主播,怎么加入粉丝团,怎么参与抽奖,怎么购买闪购商品,怎么购买货架商品。此时,主播就需要再拿出一个手机,在手机上进行演示,并用直播设备拍摄演示手机。现有方案中,存在演示效率低,浪费卖货时间,直播体验非常差,导致用户学不会,影响转化率,且需要频繁讲解。如何研究一种直播带货辅助技术方案是亟待解决的技术问题。
发明内容
为此,本发明提供一种基于人工智能的直播带货辅助方法及装置,解决直播带货过程中需要频繁演示及无法及时应答用户,用户转化率低的问题。
为了实现上述目的,本发明提供如下技术方案:基于人工智能的直播带货辅助方法,包括:
将直播过程的介绍内容对象进行分类,根据分类创建意图,利用收集的语料训练意图形成语义模型;
对预设的意图配置对应的应答内容,将配置的应答内容和训练意图的语义模型关联至直播软件中;
在利用直播软件进行直播过程中,采用ASR引擎将主播语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配;
将命中的意图所对应的应答内容,展示到直播终端的屏幕上供用户观看。
作为基于人工智能的直播带货辅助方法优选方案,对指定用户在直播软件的弹幕进行语义理解,若触发意图,则向指定用户单独发送所触发意图对应的应答内容。
作为基于人工智能的直播带货辅助方法优选方案,当弹幕为互动交流文字时,利用NLP引擎理解弹幕的互动交流文字;
当弹幕为语音互动时,采用ASR引擎将弹幕语音转文字,再由NLP引擎理解ASR引擎转换的弹幕文字,对转换的弹幕文字进行意图匹配。
作为基于人工智能的直播带货辅助方法优选方案,对预设的意图配置的应答内容包括预置的图像动画,还包括将对应的文字应答内容通过TTS引擎转换的语音。
作为基于人工智能的直播带货辅助方法优选方案,通过触发关键词或正则表达式的形式,启动ASR引擎进行语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配。
本发明还提供一种基于人工智能的直播带货辅助装置,包括:
意图创建模块,用于将直播过程的介绍内容对象进行分类,根据分类创建意图;
意图训练模块,用于利用收集的语料训练意图形成语义模型;
应答配置模块,用于对预设的意图配置对应的应答内容,将配置的应答内容和训练意图的语义模型关联至直播软件中;
意图匹配模块,用于在利用直播软件进行直播过程中,采用ASR引擎将主播语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配;
应答反馈模块,用于将命中的意图所对应的应答内容,展示到直播终端的屏幕上供用户观看。
作为基于人工智能的直播带货辅助装置优选方案,还包括弹幕处理模块,用于对指定用户在直播软件的弹幕进行语义理解,若触发意图,则向指定用户单独发送所触发意图对应的应答内容。
作为基于人工智能的直播带货辅助装置优选方案,所述弹幕处理模块中,当弹幕为互动交流文字时,利用NLP引擎理解弹幕的互动交流文字;
所述弹幕处理模块中,当弹幕为语音互动时,采用ASR引擎将弹幕语音转文字,再由NLP引擎理解ASR引擎转换的弹幕文字,对转换的弹幕文字进行意图匹配。
作为基于人工智能的直播带货辅助装置优选方案,所述应答配置模块中,对预设的意图配置的应答内容包括预置的图像动画,还包括将对应的文字应答内容通过TTS引擎转换的语音。
作为基于人工智能的直播带货辅助装置优选方案,所述意图匹配模块及所述弹幕处理模块中,通过触发关键词或正则表达式的形式,启动ASR引擎进行语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配。
本发明具有如下优点:将直播过程的介绍内容对象进行分类,根据分类创建意图,利用收集的语料训练意图形成语义模型;对预设的意图配置对应的应答内容,将配置的应答内容和训练意图的语义模型关联至直播软件中;在利用直播软件进行直播过程中,采用ASR引擎将主播语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配;将命中的意图所对应的应答内容,展示到直播终端的屏幕上供用户观看。本发明利用ASR、NLP、TTS技术提供了一种带货辅助方案,简化了主播的工作,节省了卖货时间;能够快速教会消费者如何观看直播和购物,让消费者可以第一时间加入到购买队伍中,提高用户转化率;同时人工智能技术的运用,提高了趣味性及消费者兴趣,可以使消费者更久的停留在直播间,变相为直播间带来热度,实现正向循环。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例1提供的基于人工智能的直播带货辅助方法流程示意图;
图2为本发明实施例2提供的基于人工智能的直播带货辅助装置架构示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于一场直播持续时间长,主播指导性操作需要重复去做,每次都要找设备、进行演示,如果遇到网络问题,或者临场找演示设备,或者主播演示的操作有问题,一来浪费卖货时间,二来直播体验非常差,导致用户学不会,影响转化率。另外无法回看,演示完毕后如果有新人加入直播间,则在下一次演示前,新加入用户并不知道相应的操作方式。有鉴于此,本发明提供如下具体技术方案,以解决直播带货过程中需要频繁演示及无法及时应答用户,用户转化率低的问题。
实施例1
参见图1,本发明实施例1提供一种基于人工智能的直播带货辅助方法,包括:
S1、将直播过程的介绍内容对象进行分类,根据分类创建意图,利用收集的语料训练意图形成语义模型;
S2、对预设的意图配置对应的应答内容,将配置的应答内容和训练意图的语义模型关联至直播软件中;
S3、在利用直播软件进行直播过程中,采用ASR引擎将主播语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配;
S4、将命中的意图所对应的应答内容,展示到直播终端的屏幕上供用户观看。
本实施例中,还包括S5、对指定用户在直播软件的弹幕进行语义理解,若触发意图,则向指定用户单独发送所触发意图对应的应答内容。当弹幕为互动交流文字时,利用NLP引擎理解弹幕的互动交流文字;当弹幕为语音互动时,采用ASR引擎将弹幕语音转文字,再由NLP引擎理解ASR引擎转换的弹幕文字,对转换的弹幕文字进行意图匹配。
具体的,在实施过程中,将需要介绍的内容进行分类,并创建意图,如“关注主播”,“购买流程”,“加入粉丝团”等,收集对应的语料并训练意图,形成语义模型。对应的语料可以从历史直播过程中总结概括。比如需要介绍“购买流程”的语料,“怎么购买”,“购买链接在哪儿”,“从哪儿入手”等。
针对不同的意图,可以配置不同应对内容,支持TTS回复,图像动画等等形式。然后将配置的内容以及训练的语义模型关联到主播的直播软件中。
具体的,训练语义模型和直播软件关联存在相关技术,即对训练好的语义模型进行软件部署,如利用python服务接口,在python服务器上部署模型文件,给出一个http服务,后台通过这个服务可以调用语义模型进行输入输出。也可以利用java直接加载语义模型,使用TensorFlow的java包,然后加载训练的语义模型文件,事先将模型文件保存成pb格式,然后在java的环境中添加依赖。最后再加载语义模型。不需要额外的接口,调用方便,不需要额外安装python环境。
本实施例中,对预设的意图配置的应答内容包括预置的图像动画,还包括将对应的文字应答内容通过TTS引擎转换的语音。通过触发关键词或正则表达式的形式,启动ASR引擎进行语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配。
具体的,主播在直播过程中,如果需要介绍购买流程,只需要触发关键词或正则表达式,如“给大家介绍一下购买流程”。此时ASR引擎将语音转文字,并由NLP引擎理解,命中意图“购买流程”,通过配置的“购买流程”意图展示的内容,在直播终端屏幕中自动展示给到消费者进行观看。当新来的消费者不知道操作方式时,可以接收消费者的打字交流互动,或者语音互动弹幕,此时依然通过ASR引擎和NLP引擎技术对消费者语义进行理解,如触发意图,则给该消费者单独播放询问问题的答案或视频动画。
具体的,ASR引擎能够将麦克风采集到的自然声音转化为文字,NLP引擎能够使计算机像人类一样理解、处理和生成语言,通过机器学习进行工作。TTS引擎能够把文字转化为自然语音流。ASR引擎、NLP引擎和TTS引擎技术本身存在相关技术。
需要说明的是,本实施例中,语义模型的训练,意图识别等本身存在相关技术。
综上所述,本发明通过将直播过程的介绍内容对象进行分类,根据分类创建意图,利用收集的语料训练意图形成语义模型;对预设的意图配置对应的应答内容,将配置的应答内容和训练意图的语义模型关联至直播软件中;在利用直播软件进行直播过程中,采用ASR引擎将主播语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配;将命中的意图所对应的应答内容,展示到直播终端的屏幕上供用户观看。本发明利用ASR、NLP、TTS技术提供了一种带货辅助方案,简化了主播的工作,节省了卖货时间;能够快速教会消费者如何观看直播和购物,让消费者可以第一时间加入到购买队伍中,提高用户转化率;同时人工智能技术的运用,提高了趣味性及消费者兴趣,可以使消费者更久的停留在直播间,变相为直播间带来热度,实现正向循环。
需要说明的是,本公开实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
实施例2
参见图2,本发明实施例2还提供一种基于人工智能的直播带货辅助装置,包括:
意图创建模块1,用于将直播过程的介绍内容对象进行分类,根据分类创建意图;
意图训练模块2,用于利用收集的语料训练意图形成语义模型;
应答配置模块3,用于对预设的意图配置对应的应答内容,将配置的应答内容和训练意图的语义模型关联至直播软件中;
意图匹配模块4,用于在利用直播软件进行直播过程中,采用ASR引擎将主播语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配;
应答反馈模块5,用于将命中的意图所对应的应答内容,展示到直播终端的屏幕上供用户观看。
本实施例中,还包括弹幕处理模块6,用于对指定用户在直播软件的弹幕进行语义理解,若触发意图,则向指定用户单独发送所触发意图对应的应答内容。
本实施例中,所述弹幕处理模块6中,当弹幕为互动交流文字时,利用NLP引擎理解弹幕的互动交流文字;
所述弹幕处理模块6中,当弹幕为语音互动时,采用ASR引擎将弹幕语音转文字,再由NLP引擎理解ASR引擎转换的弹幕文字,对转换的弹幕文字进行意图匹配。
本实施例中,所述应答配置模块5中,对预设的意图配置的应答内容包括预置的图像动画,还包括将对应的文字应答内容通过TTS引擎转换的语音。
本实施例中,所述意图匹配模块4及所述弹幕处理模块6中,通过触发关键词或正则表达式的形式,启动ASR引擎进行语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配。
本实施例的基于人工智能的直播带货辅助装置实施过程中,将需要介绍的内容进行分类,并创建意图,如“关注主播”,“购买流程”,“加入粉丝团”等,收集对应的语料并训练意图,形成语义模型。对应的语料可以从历史直播过程中总结概括。比如需要介绍“购买流程”的语料,“怎么购买”,“购买链接在哪儿”,“从哪儿入手”等。针对不同的意图,可以配置不同应对内容,支持TTS回复,图像动画等等形式。然后将配置的内容以及训练的语义模型关联到主播的直播软件中。
主播在直播过程中,如果需要介绍购买流程,只需要触发关键词或正则表达式,如“给大家介绍一下购买流程”。此时ASR引擎将语音转文字,并由NLP引擎理解,命中意图“购买流程”,通过配置的“购买流程”意图展示的内容,在直播终端屏幕中自动展示给到消费者进行观看。当新来的消费者不知道操作方式时,可以接收消费者的打字交流互动,或者语音互动弹幕,此时依然通过ASR引擎和NLP引擎技术对消费者语义进行理解,如触发意图,则给该消费者单独播放询问问题的答案或视频动画。
需要说明的是,上述装置各模块/子模块之间的信息交互、执行过程等内容,由于与本申请实施例1中的方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。
实施例3
本发明实施例3提供一种非暂态计算机可读存储介质,所述计算机可读存储介质中存储有基于人工智能的直播带货辅助方法的程序代码,所述程序代码包括用于执行实施例1或其任意可能实现方式的基于人工智能的直播带货辅助方法的指令。
计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(SolidState Disk、SSD))等。
实施例4
本发明实施例4提供一种电子设备,包括:存储器和处理器;
所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行实施例1或其任意可能实现方式的基于人工智能的直播带货辅助方法。
具体的,处理器可以通过硬件来实现也可以通过软件来实现,当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于所述处理器之外,独立存在。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (10)

1.基于人工智能的直播带货辅助方法,其特征在于,包括:
将直播过程的介绍内容对象进行分类,根据分类创建意图,利用收集的语料训练意图形成语义模型;
对预设的意图配置对应的应答内容,将配置的应答内容和训练意图的语义模型关联至直播软件中;
在利用直播软件进行直播过程中,采用ASR引擎将主播语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配;
将命中的意图所对应的应答内容,展示到直播终端的屏幕上供用户观看。
2.根据权利要求1所述的基于人工智能的直播带货辅助方法,其特征在于,对指定用户在直播软件的弹幕进行语义理解,若触发意图,则向指定用户单独发送所触发意图对应的应答内容。
3.根据权利要求2所述的基于人工智能的直播带货辅助方法,其特征在于,当弹幕为互动交流文字时,利用NLP引擎理解弹幕的互动交流文字;
当弹幕为语音互动时,采用ASR引擎将弹幕语音转文字,再由NLP引擎理解ASR引擎转换的弹幕文字,对转换的弹幕文字进行意图匹配。
4.根据权利要求3所述的基于人工智能的直播带货辅助方法,其特征在于,对预设的意图配置的应答内容包括预置的图像动画,还包括将对应的文字应答内容通过TTS引擎转换的语音。
5.根据权利要求4所述的基于人工智能的直播带货辅助方法,其特征在于,通过触发关键词或正则表达式的形式,启动ASR引擎进行语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配。
6.基于人工智能的直播带货辅助装置,其特征在于,包括:
意图创建模块,用于将直播过程的介绍内容对象进行分类,根据分类创建意图;
意图训练模块,用于利用收集的语料训练意图形成语义模型;
应答配置模块,用于对预设的意图配置对应的应答内容,将配置的应答内容和训练意图的语义模型关联至直播软件中;
意图匹配模块,用于在利用直播软件进行直播过程中,采用ASR引擎将主播语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配;
应答反馈模块,用于将命中的意图所对应的应答内容,展示到直播终端的屏幕上供用户观看。
7.根据权利要求6所述的基于人工智能的直播带货辅助装置,其特征在于,还包括弹幕处理模块,用于对指定用户在直播软件的弹幕进行语义理解,若触发意图,则向指定用户单独发送所触发意图对应的应答内容。
8.根据权利要求7所述的基于人工智能的直播带货辅助装置,其特征在于,所述弹幕处理模块中,当弹幕为互动交流文字时,利用NLP引擎理解弹幕的互动交流文字;
所述弹幕处理模块中,当弹幕为语音互动时,采用ASR引擎将弹幕语音转文字,再由NLP引擎理解ASR引擎转换的弹幕文字,对转换的弹幕文字进行意图匹配。
9.根据权利要求8所述的基于人工智能的直播带货辅助装置,其特征在于,所述应答配置模块中,对预设的意图配置的应答内容包括预置的图像动画,还包括将对应的文字应答内容通过TTS引擎转换的语音。
10.根据权利要求9所述的基于人工智能的直播带货辅助装置,其特征在于,所述意图匹配模块及所述弹幕处理模块中,通过触发关键词或正则表达式的形式,启动ASR引擎进行语音转文字,并由NLP引擎理解ASR引擎转换的文字,对转换的文字进行意图匹配。
CN202210687843.8A 2022-06-17 2022-06-17 基于人工智能的直播带货辅助方法及装置 Pending CN115022664A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210687843.8A CN115022664A (zh) 2022-06-17 2022-06-17 基于人工智能的直播带货辅助方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210687843.8A CN115022664A (zh) 2022-06-17 2022-06-17 基于人工智能的直播带货辅助方法及装置

Publications (1)

Publication Number Publication Date
CN115022664A true CN115022664A (zh) 2022-09-06

Family

ID=83074489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210687843.8A Pending CN115022664A (zh) 2022-06-17 2022-06-17 基于人工智能的直播带货辅助方法及装置

Country Status (1)

Country Link
CN (1) CN115022664A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110177284A (zh) * 2019-05-23 2019-08-27 北京达佳互联信息技术有限公司 信息展示方法、装置、电子设备及存储介质
CN111935496A (zh) * 2020-08-21 2020-11-13 腾讯科技(深圳)有限公司 一种信息展示方法及相关设备
CN112487167A (zh) * 2020-12-02 2021-03-12 广州虎牙科技有限公司 自动问答模型的训练方法以及相关装置、设备
CN113132741A (zh) * 2021-03-03 2021-07-16 广州鑫泓设备设计有限公司 一种虚拟直播系统和方法
CN113421143A (zh) * 2020-10-10 2021-09-21 阿里巴巴集团控股有限公司 辅助直播的处理方法、装置及电子设备
KR102388670B1 (ko) * 2022-01-11 2022-04-20 주식회사온앤미 라이브 스트리밍 중계 서비스 제공 장치, 시스템, 방법 및 프로그램
WO2022121601A1 (zh) * 2020-12-11 2022-06-16 北京字跳网络技术有限公司 一种直播互动方法、装置、设备及介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110177284A (zh) * 2019-05-23 2019-08-27 北京达佳互联信息技术有限公司 信息展示方法、装置、电子设备及存储介质
CN111935496A (zh) * 2020-08-21 2020-11-13 腾讯科技(深圳)有限公司 一种信息展示方法及相关设备
CN113421143A (zh) * 2020-10-10 2021-09-21 阿里巴巴集团控股有限公司 辅助直播的处理方法、装置及电子设备
CN112487167A (zh) * 2020-12-02 2021-03-12 广州虎牙科技有限公司 自动问答模型的训练方法以及相关装置、设备
WO2022121601A1 (zh) * 2020-12-11 2022-06-16 北京字跳网络技术有限公司 一种直播互动方法、装置、设备及介质
CN113132741A (zh) * 2021-03-03 2021-07-16 广州鑫泓设备设计有限公司 一种虚拟直播系统和方法
KR102388670B1 (ko) * 2022-01-11 2022-04-20 주식회사온앤미 라이브 스트리밍 중계 서비스 제공 장치, 시스템, 방법 및 프로그램

Similar Documents

Publication Publication Date Title
CN110647636B (zh) 交互方法、装置、终端设备及存储介质
US20220366281A1 (en) Modeling characters that interact with users as part of a character-as-a-service implementation
US8374859B2 (en) Automatic answering device, automatic answering system, conversation scenario editing device, conversation server, and automatic answering method
CN109101545A (zh) 基于人机交互的自然语言处理方法、装置、设备和介质
CN107040452B (zh) 一种信息处理方法、装置和计算机可读存储介质
US20140046876A1 (en) System and method of providing a computer-generated response
CN110189754A (zh) 语音交互方法、装置、电子设备及存储介质
CN107294837A (zh) 采用虚拟机器人进行对话交互的方法和系统
CN103905644A (zh) 移动终端通话界面的生成方法及设备
CN112087655A (zh) 赠送虚拟礼物的方法、装置及电子设备
CN112188220A (zh) 直播中信息的提示方法和装置、存储介质、电子装置
CN107077638A (zh) 基于先进的递归神经网络的“字母到声音”
CN111601145A (zh) 基于直播的内容展示方法、装置、设备及存储介质
CN107452378A (zh) 基于人工智能的语音交互方法和装置
CN109885277A (zh) 人机交互设备、方法、系统和装置
CN110503954A (zh) 语音技能启动方法、装置、设备及存储介质
CN111629222A (zh) 一种视频处理方法、设备及存储介质
US11663791B1 (en) Dynamic avatars for customer support applications
CN113850898A (zh) 场景渲染方法及装置、存储介质及电子设备
US20100324908A1 (en) Learning Playbot
KR102419192B1 (ko) 인공지능 대화 서비스 제공 시스템 및 그의 동작방법
CN115022664A (zh) 基于人工智能的直播带货辅助方法及装置
CN110600021A (zh) 室外智能语音交互方法、装置和系统
CN109240640B (zh) 广告语音交互方法、装置及存储介质
CN115623133A (zh) 线上会议方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination