CN112019871B

CN112019871B - 一种基于大数据的直播电商内容智能管理平台

Info

Publication number: CN112019871B
Application number: CN202010929437.9A
Authority: CN
Inventors: 不公告发明人
Original assignee: Shenzhen Qianhai Wuyou Information Service Co ltd
Current assignee: Shenzhen Qianhai Wuyou Information Service Co.,Ltd.
Priority date: 2020-09-07
Filing date: 2020-09-07
Publication date: 2021-05-04
Anticipated expiration: 2040-09-07
Also published as: CN112019871A

Abstract

本发明公开一种基于大数据的直播电商内容智能管理平台，包括直播内容分割分类模块、视频帧位置匹配模块、播放规则数据库、播放规则选择模块、视频筛选播放模块和播放规则智能推荐模块，本发明通过对商品的完整直播回放视频按照内容进行视频分割并进行关键词标注，构成商品特征关键词视频列表，且通过视频帧位置匹配模块根据人工输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置，并手动选择某一种播放规则进行播放，实现了对商品直播视频内容的智能管理，具有操作性强的特点，弥补了人为调节视频进度条造成的操作性差、效率低和匹配度低问题，提高了调节效率，增强了消费者观看直播的观看体验感。

Description

一种基于大数据的直播电商内容智能管理平台

技术领域

本发明属于电商直播管理技术领域，具体涉及一种基于大数据的直播电商内容智能管理平台。

背景技术

随着移动互联网的发展、网络技术的进步以及智能终端的普及，网络电商直播这一新的内容形态迅猛发展，各大直播平台如雨后春笋般涌现。人们在通过智能终端观看直播的过程中，经常会出现进入某一商品直播间看到的直播已经过半或接近尾声，如果想了解该商品直播之前的内容，这就需要人为滑动直播视频的进度条，以调节直播视频回放到自己想看的位置，由于手动滑动视频进度条的距离不可控性，其调节回放的视频不一定是自己想看的视频，这需要不断调节，人为调节视频回放的方法具有可操作性差、调节效率低、同时消费者自己想看的视频与调节回放的直播视频匹配度低，导致观看体验感不高，鉴于此，本发明设计一种基于大数据的直播电商内容智能管理平台。

发明内容

本发明的技术任务是提出一种集操作性强、调节效率高和智能化程度高的基于大数据的直播电商内容智能管理平台，解决了背景技术提到的问题。

本发明的目的可以通过以下技术方案来实现：

一种基于大数据的直播电商内容智能管理平台，包括直播内容分割分类模块、视频帧位置匹配模块、播放规则数据库、播放规则选择模块和视频筛选播放模块，所述直播内容分割分类模块用于对商品的完整直播回放视频按照内容进行视频分割并进行关键词标注，所述视频帧位置匹配模块用于人工通过输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置，其中直播内容分割分类模块、视频帧位置匹配模块、播放规则选择模块和播放规则智能推荐模块均与视频筛选播放模块连接，所述播放规则选择模块与播放规则数据库连接；

所述直播内容分割分类模块包括视频内容分段单元、视频分割单元和关键词标注单元，其中视频分割单元与视频内容分段单元连接，关键词标注单元与视频分割单元连接；

所述视频内容分段单元用于对商品的完整直播视频讲解内容按照视频讲解的先后顺序进行视频内容分段，每一段视频讲解内容分别对应商品某方面的特征，按照这样的分段方式将商品的完整直播视频讲解内容划分为若干讲解段；

所述视频分割单元用于对划分的商品直播视频若干讲解段，记录每个讲解段视频讲解的开始视频帧位置和结束视频帧位置，对商品直播视频各讲解段从开始视频帧位置和结束视频帧位置进行视频分割，将商品的完整直播视频分割为若干商品特征视频段，构成商品特征视频列表；

所述关键词标注单元用于对分割的商品特征视频段，对每个商品特征视频段讲解的商品内容提取讲解关键词，并标注在对应的商品特征视频下方，连同商品特征视频列表组成商品特征关键词视频列表，并将组成的商品特征关键词视频列表发送至视频筛选播放模块；

所述视频帧位置匹配模块包括关键词人工输入单元、语音识别单元和关键词匹配单元；

所述关键词人工输入单元通过在视频直播界面的搜索输入框中输入关键词；

所述语音识别单元用于对完整的视频直播回放视频提取其视频直播语音内容进行语音模板库匹配，获取文本识别结果，其具体识别过程包括以下几个步骤：

S1.语音预处理：对提取的视频直播语音信息进行端点检测和语音增强处理得到增强语音；

S2.语音模板匹配:对得到的增强语音中的特征向量进行抓取，同时提取预设的语音模板库，将抓取的语音特征向量依次与语音模板库中的每个模板进行匹配，并统计抓取的语音特征向量与语音模板库中每个模板的匹配相似度，筛选相似度最大的语音模板，当筛选的最大相似度大于设定的相似度阈值，则输出相似度最大的语音模板；

S3.文本识别:对输出的语音模块根据其模板定义，通过查表得出文本识别结果；

所述关键词匹配单元与语音识别单元连接，其具体匹配过程包括以下几个步骤：

H1.文本分词排列：用于对获取的视频直播语音识别的文本内容进行分词，得到各个词组，进而将得到的各词组按照其对应在直播视频中视频帧位置的顺序进行排列；

H2.关键词与词组匹配：并将人工输入的商品关键词与文本分词的各词组按照词组的排列顺序进行逐一匹配，输出匹配到的词组；

H3.匹配结果分析：若匹配到的词组只有一个，则根据视频直播内容与文本识别内容的对应关系，定位匹配到的词组出现在直播视频中的视频帧位置；若匹配到的词组有若干个，则依次定位匹配到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置，并根据得到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置进行视频筛选，从整个完整直播回放视频中筛选若干候选视频段，同时进行关键词多级筛选匹配，从候选视频段中获取关键词匹配到的词组出现在直播视频的视频帧位置；

所述播放规则选择模块用于根据播放规则数据库内手动选择播放规则中的一级播放规则，通过人工选择某一种一级播放规则，若选择的一级播放规则为除关键词匹配到的视频帧位置为中点的中点式播放以外的其他一级播放规则，则将选择的一级播放规则发送至视频筛选播放模块，若选择的一级播放规则为以关键词匹配到的视频帧位置为中点的中点式播放，则继续进行二级播放规则选择，并将选择的二级播放规则发送至视频筛选播放模块；

所述视频筛选播放模块接收直播内容分割分类模块发送的商品特征关键词视频列表，通过从商品特征关键词视频列表中的商品特征关键词筛选相应特征关键词，并手动从商品特征关键词视频列表中选择该商品特征关键词视频进行视频播放；

同时，视频筛选播放模块获取视频帧位置匹配模块匹配到的关键词出现在直播视频的视频帧位置，并接收播放规则选择模块发送的播放规则，按照接收的播放规则进行视频播放。

优选地，所述文本内容进行分词的具体过程为首先对文本内容进行过滤停用词得到处理后的文本内容，然后采用中文语料词典对处理后的文本内容进行中文分词，得到若干词组。

进一步地，所述关键词多级筛选匹配过程具体包括以下步骤：

W1：对得到的各候选视频段按照视频段所处直播视频中的前后位置顺序进行编号，并根据视频直播内容与文本识别内容的对应关系，将得到的各候选视频段进行文本识别，得到各候选视频段的文本识别结果，并对各候选视频段的文本识别结果进行中文分词，得到各候选视频段的若干分词词组；

W2：在视频直播界面的搜索输入框中输入二级关键词；

W3：将输入的二级关键词与各候选视频段的若干分词词组按照候选视频段的编号顺序逐一匹配，并统计二级关键词与每个候选视频段的各个分词词组的匹配相似度，输出匹配相识度最大的词组，若匹配到的词组有且只有一个，则停止关键词匹配，并记录匹配到的词组对应的候选视频段编号，同时定位匹配到的词组在对应该候选视频段上的视频帧位置，若在某个候选视频段内匹配到的词组有多个，则执行步骤W4，若在多个候选视频段都能匹配到词组，则执行步骤W6;

W4：依次定位匹配到的各词组出现在该候选视频段内开始视频帧位置和结束视频帧位置，并根据得到的各词组出现在该候选视频段的开始视频帧位置和结束视频帧位置对该候选视频段进行视频筛选，从该候选视频段筛选若干二级候选视频段，对得到的各二级候选视频段进行文本识别，并对文本识别结果进行分词；

W5：在视频直播界面的搜索输入框中输入三级关键词，并将输入的三级关键词与各二级候选视频段的若干分词词组进行逐一匹配，直至匹配到单个词组，并获取匹配到的单个词组所属的二级候选视频段，同时定位匹配到的单个词组在对应二级候选视频段上的视频帧位置；

W6：重新输入二级关键词，直至匹配到的候选视频段有且只有一个。

进一步地，所述播放规则数据库包括手动选择播放规则和智能推荐播放规则，所述手动选择播放规则包含一级播放规则和二级播放规则，所述一级播放规则用于对关键词匹配到的视频帧位置的播放方向进行设置，包括关键词匹配到的视频帧位置往前式播放、以关键词匹配到的视频帧位置为中点的中点式播放和关键词匹配到的视频帧位置往后式播放；所述二级播放规则用于对以关键词匹配到的视频帧位置为中点的中点式播放的时间段进行设置，包括关键词匹配到的视频帧位置往前和往后的一级播放时间段、二级播放时间段和三级播放时间段。

进一步地，还包括播放规则智能推荐模块，用于提取播放规则数据库中存储的智能推荐播放规则，并将推荐播放规则发送至视频筛选播放模块。

更进一步地，所述智能推荐播放规则为多数人选择的播放规则。

本发明的有益效果：

（1）本发明通过对商品的完整直播回放视频按照内容进行视频分割，并对分割的每个视频段提取视频内容关键词同时进行标注，构成商品特征关键词视频列表，消费者通过商品特征关键词筛选自己想要看的关键词，并手动从商品特征关键词视频列表中选择该商品特征关键词视频进行视频播放，实现了对商品直播视频内容的智能管理，具有操作性强的特点，弥补了人为滑动直播视频的进度条调节视频造成的操作性差问题，提高了调节效率，增强了消费者观看直播的观看体验感。

（2）本发明通过设置视频帧位置匹配模块根据人工输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置，并手动选择某一种播放规则进行播放，能够精准获取含有输入关键词的直播视频段，其得到的直播视频段与消费者喜好智能匹配度高，极大满足了消费者的观看需求，进而提高了消费者观看直播的兴趣。

附图说明

利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的系统模块框图；

图2为本发明的直播内容分割分类模块框图；

图3为本发明的视频帧位置匹配模块框图;

图4为本发明的语音识别单元步骤流程图；

图5为本发明的关键词匹配单元步骤流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-3所示，一种基于大数据的直播电商内容智能管理平台，包括直播内容分割分类模块、视频帧位置匹配模块、播放规则数据库、播放规则选择模块、视频筛选播放模块和播放规则智能推荐模块，所述直播内容分割分类模块用于对商品的完整直播回放视频按照内容进行视频分割并进行关键词标注，所述视频帧位置匹配模块用于人工通过输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置，其中直播内容分割分类模块、视频帧位置匹配模块、播放规则选择模块和播放规则智能推荐模块均与视频筛选播放模块连接，所述播放规则选择模块与播放规则数据库连接。

直播内容分割分类模块包括视频内容分段单元、视频分割单元和关键词标注单元，其中视频分割单元与视频内容分段单元连接，关键词标注单元与视频分割单元连接。

视频内容分段单元用于对商品的完整直播视频讲解内容按照视频讲解的先后顺序进行视频内容分段，每一段视频讲解内容分别对应商品某方面的特征，商品特征包括外形特征、用途特征等，其外形特征包含形状、颜色、尺寸等，按照这样的分段方式将商品的完整直播视频讲解内容划分为若干讲解段。

视频分割单元用于对划分的商品直播视频若干讲解段，记录每个讲解段视频讲解的开始视频帧位置和结束视频帧位置，对商品直播视频各讲解段从开始视频帧位置和结束视频帧位置进行视频分割，将商品的完整直播视频分割为若干商品特征视频段，构成商品特征视频列表。

关键词标注单元用于对分割的商品特征视频段，对每个商品特征视频段讲解的商品内容提取讲解关键词，并标注在对应的商品特征视频下方，连同商品特征视频列表组成商品特征关键词视频列表，并将组成的商品特征关键词视频列表发送至视频筛选播放模块。

本优选实施例提出的直播内容分割分类模块实现了对商品直播视频内容的智能管理，其得到的商品特征关键词视频列表，只需要人工点击相应的关键词视频，就可以播放消费者想看的视频，具有操作性强的特点，弥补了人为滑动直播视频的进度条调节视频造成的操作性差问题，提高了调节效率，增强了消费者观看直播的观看体验感。

视频帧位置匹配模块包括关键词人工输入单元、语音识别单元和关键词匹配单元。

关键词人工输入单元通过在视频直播界面的搜索输入框中输入关键词。

参阅图4所示，语音识别单元用于对完整的视频直播回放视频提取其视频直播语音内容进行语音模板库匹配，获取文本识别结果，其具体识别过程包括以下几个步骤：

S3.文本识别:对输出的语音模块根据其模板定义，通过查表得出文本识别结果。

参阅图5所示，关键词匹配单元与语音识别单元连接，其具体匹配过程包括以下几个步骤：

H3.匹配结果分析：若匹配到的词组只有一个，则根据视频直播内容与文本识别内容的对应关系，定位匹配到的词组出现在直播视频中的视频帧位置；若匹配到的词组有若干个，则依次定位匹配到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置，并根据得到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置进行视频筛选，从整个完整直播回放视频中筛选若干候选视频段，同时进行关键词多级筛选匹配，其关键词多级筛选匹配过程具体包括以下步骤：

H31.候选视频段文本识别：对得到的各候选视频段按照视频段所处直播视频中的前后位置顺序进行编号，并根据视频直播内容与文本识别内容的对应关系，将得到的各候选视频段进行文本识别，得到各候选视频段的文本识别结果，并对各候选视频段的文本识别结果进行中文分词，得到各候选视频段的若干分词词组；

H32.二级关键词输入：在视频直播界面的搜索输入框中输入二级关键词；

H33.二级关键词匹配：将输入的二级关键词与各候选视频段的若干分词词组按照候选视频段的编号顺序逐一匹配，并统计二级关键词与每个候选视频段的各个分词词组的匹配相似度，输出匹配相识度最大的词组，若匹配到的词组有且只有一个，则停止关键词匹配，并记录匹配到的词组对应的候选视频段编号，同时定位匹配到的词组在对应该候选视频段上的视频帧位置，若在某个候选视频段内匹配到的词组有多个，则执行步骤H34，若在多个候选视频段都能匹配到词组，则执行步骤H36;

H34.二级候选视频段文本识别：依次定位匹配到的各词组出现在该候选视频段内开始视频帧位置和结束视频帧位置，并根据得到的各词组出现在该候选视频段的开始视频帧位置和结束视频帧位置对该候选视频段进行视频筛选，从该候选视频段筛选若干二级候选视频段，对得到的各二级候选视频段进行文本识别，并对文本识别结果进行分词；

H35.三级关键词输入及匹配：在视频直播界面的搜索输入框中输入三级关键词，并将输入的三级关键词与各二级候选视频段的若干分词词组进行逐一匹配，直至匹配到单个词组，并获取匹配到的单个词组所属的二级候选视频段，同时定位匹配到的单个词组在对应二级候选视频段上的视频帧位置；

H36.二级关键词重输入：重新输入二级关键词，直至匹配到的候选视频段有且只有一个。

本优选实施例通过设置视频帧位置匹配模块以通过人工通过输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置，并手动选择某一种播放规则进行播放，能够精准获取含有输入关键词的直播视频段，其得到的直播视频段与消费者喜好智能匹配度高，极大满足了消费者的观看需求，进而提高了消费者观看直播的兴趣。

同时，本优选实施例提到的关键词多级筛选匹配通过设置二级关键词和三级关键词进行逐级匹配，以得到匹配更加精准的视频段，其获得的视频段与消费者输入的关键词匹配度更高，更加满足消费者的观看需求，体现了平台的智能化水平。

播放规则选择模块用于根据播放规则数据库内手动选择播放规则中的一级播放规则，通过人工选择某一种一级播放规则，若选择的一级播放规则为除关键词匹配到的视频帧位置为中点的中点式播放以外的其他一级播放规则，则将选择的一级播放规则发送至视频筛选播放模块，若选择的一级播放规则为以关键词匹配到的视频帧位置为中点的中点式播放，则继续进行二级播放规则选择，并将选择的二级播放规则发送至视频筛选播放模块。

本优选实施例提到的播放规则数据库包括手动选择播放规则和智能推荐播放规则，所述手动选择播放规则包含一级播放规则和二级播放规则，所述一级播放规则用于对关键词匹配到的视频帧位置的播放方向进行设置，包括关键词匹配到的视频帧位置往前式播放、以关键词匹配到的视频帧位置为中点的中点式播放和关键词匹配到的视频帧位置往后式播放；所述二级播放规则用于对以关键词匹配到的视频帧位置为中点的中点式播放的时间段进行设置，包括关键词匹配到的视频帧位置往前和往后的一级播放时间段、二级播放时间段和三级播放时间段，其中设置的不同播放时间段为消费者提供了多种选择性，不同播放时间段设置的时间段不同，一级播放时间段最短，三级播放时间段最长。

播放规则智能推荐模块，用于提取播放规则数据库中存储的智能推荐播放规则，并将推荐播放规则发送至视频筛选播放模块，所述智能推荐播放规则为多数人选择的播放规则，本实施例通过将多数人选择的播放规则推荐给消费者，便于消费者在不知道选择哪种播放规则时，为其提供备选播放规则，提高了平台的人性化水平

视频筛选播放模块接收直播内容分割分类模块发送的商品特征关键词视频列表，通过从商品特征关键词视频列表中的商品特征关键词筛选相应特征关键词，并手动从商品特征关键词视频列表中选择该商品特征关键词视频进行视频播放；

以上内容仅仅是对本发明结构所作的举例和说明，所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，只要不偏离发明的结构或者超越本权利要求书所定义的范围，均应属于本发明的保护范围。

Claims

1.一种基于大数据的直播电商内容智能管理平台，其特征在于：包括直播内容分割分类模块、视频帧位置匹配模块、播放规则数据库、播放规则选择模块和视频筛选播放模块，所述直播内容分割分类模块用于对商品的完整直播回放视频按照内容进行视频分割并进行关键词标注，所述视频帧位置匹配模块用于人工通过输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置，其中直播内容分割分类模块、视频帧位置匹配模块、播放规则选择模块和播放规则智能推荐模块均与视频筛选播放模块连接，所述播放规则选择模块与播放规则数据库连接；

2.根据权利要求1所述的一种基于大数据的直播电商内容智能管理平台，其特征在于：所述文本内容进行分词的具体过程为首先对文本内容进行过滤停用词得到处理后的文本内容，然后采用中文语料词典对处理后的文本内容进行中文分词，得到若干词组。

3.根据权利要求1所述的一种基于大数据的直播电商内容智能管理平台，其特征在于：所述关键词多级筛选匹配过程具体包括以下步骤：

W2：在视频直播界面的搜索输入框中输入二级关键词；

4.根据权利要求1所述的一种基于大数据的直播电商内容智能管理平台，其特征在于：所述播放规则数据库包括手动选择播放规则和智能推荐播放规则，所述手动选择播放规则包含一级播放规则和二级播放规则，所述一级播放规则用于对关键词匹配到的视频帧位置的播放方向进行设置，包括关键词匹配到的视频帧位置往前式播放、以关键词匹配到的视频帧位置为中点的中点式播放和关键词匹配到的视频帧位置往后式播放；所述二级播放规则用于对以关键词匹配到的视频帧位置为中点的中点式播放的时间段进行设置，包括关键词匹配到的视频帧位置往前和往后的一级播放时间段、二级播放时间段和三级播放时间段。

5.根据权利要求1所述的一种基于大数据的直播电商内容智能管理平台，其特征在于：还包括播放规则智能推荐模块，用于提取播放规则数据库中存储的智能推荐播放规则，并将推荐播放规则发送至视频筛选播放模块。

6.根据权利要求5所述的一种基于大数据的直播电商内容智能管理平台，其特征在于：所述智能推荐播放规则为多数人选择的播放规则。