CN112019871B - 一种基于大数据的直播电商内容智能管理平台 - Google Patents
一种基于大数据的直播电商内容智能管理平台 Download PDFInfo
- Publication number
- CN112019871B CN112019871B CN202010929437.9A CN202010929437A CN112019871B CN 112019871 B CN112019871 B CN 112019871B CN 202010929437 A CN202010929437 A CN 202010929437A CN 112019871 B CN112019871 B CN 112019871B
- Authority
- CN
- China
- Prior art keywords
- video
- playing
- keyword
- frame position
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/432—Content retrieval operation from a local storage medium, e.g. hard-disk
- H04N21/4325—Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于大数据的直播电商内容智能管理平台,包括直播内容分割分类模块、视频帧位置匹配模块、播放规则数据库、播放规则选择模块、视频筛选播放模块和播放规则智能推荐模块,本发明通过对商品的完整直播回放视频按照内容进行视频分割并进行关键词标注,构成商品特征关键词视频列表,且通过视频帧位置匹配模块根据人工输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置,并手动选择某一种播放规则进行播放,实现了对商品直播视频内容的智能管理,具有操作性强的特点,弥补了人为调节视频进度条造成的操作性差、效率低和匹配度低问题,提高了调节效率,增强了消费者观看直播的观看体验感。
Description
技术领域
本发明属于电商直播管理技术领域,具体涉及一种基于大数据的直播电商内容智能管理平台。
背景技术
随着移动互联网的发展、网络技术的进步以及智能终端的普及,网络电商直播这一新的内容形态迅猛发展,各大直播平台如雨后春笋般涌现。人们在通过智能终端观看直播的过程中,经常会出现进入某一商品直播间看到的直播已经过半或接近尾声,如果想了解该商品直播之前的内容,这就需要人为滑动直播视频的进度条,以调节直播视频回放到自己想看的位置,由于手动滑动视频进度条的距离不可控性,其调节回放的视频不一定是自己想看的视频,这需要不断调节,人为调节视频回放的方法具有可操作性差、调节效率低、同时消费者自己想看的视频与调节回放的直播视频匹配度低,导致观看体验感不高,鉴于此,本发明设计一种基于大数据的直播电商内容智能管理平台。
发明内容
本发明的技术任务是提出一种集操作性强、调节效率高和智能化程度高的基于大数据的直播电商内容智能管理平台,解决了背景技术提到的问题。
本发明的目的可以通过以下技术方案来实现:
一种基于大数据的直播电商内容智能管理平台,包括直播内容分割分类模块、视频帧位置匹配模块、播放规则数据库、播放规则选择模块和视频筛选播放模块,所述直播内容分割分类模块用于对商品的完整直播回放视频按照内容进行视频分割并进行关键词标注,所述视频帧位置匹配模块用于人工通过输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置,其中直播内容分割分类模块、视频帧位置匹配模块、播放规则选择模块和播放规则智能推荐模块均与视频筛选播放模块连接,所述播放规则选择模块与播放规则数据库连接;
所述直播内容分割分类模块包括视频内容分段单元、视频分割单元和关键词标注单元,其中视频分割单元与视频内容分段单元连接,关键词标注单元与视频分割单元连接;
所述视频内容分段单元用于对商品的完整直播视频讲解内容按照视频讲解的先后顺序进行视频内容分段,每一段视频讲解内容分别对应商品某方面的特征,按照这样的分段方式将商品的完整直播视频讲解内容划分为若干讲解段;
所述视频分割单元用于对划分的商品直播视频若干讲解段,记录每个讲解段视频讲解的开始视频帧位置和结束视频帧位置,对商品直播视频各讲解段从开始视频帧位置和结束视频帧位置进行视频分割,将商品的完整直播视频分割为若干商品特征视频段,构成商品特征视频列表;
所述关键词标注单元用于对分割的商品特征视频段,对每个商品特征视频段讲解的商品内容提取讲解关键词,并标注在对应的商品特征视频下方,连同商品特征视频列表组成商品特征关键词视频列表,并将组成的商品特征关键词视频列表发送至视频筛选播放模块;
所述视频帧位置匹配模块包括关键词人工输入单元、语音识别单元和关键词匹配单元;
所述关键词人工输入单元通过在视频直播界面的搜索输入框中输入关键词;
所述语音识别单元用于对完整的视频直播回放视频提取其视频直播语音内容进行语音模板库匹配,获取文本识别结果,其具体识别过程包括以下几个步骤:
S1.语音预处理:对提取的视频直播语音信息进行端点检测和语音增强处理得到增强语音;
S2.语音模板匹配:对得到的增强语音中的特征向量进行抓取,同时提取预设的语音模板库,将抓取的语音特征向量依次与语音模板库中的每个模板进行匹配,并统计抓取的语音特征向量与语音模板库中每个模板的匹配相似度,筛选相似度最大的语音模板,当筛选的最大相似度大于设定的相似度阈值,则输出相似度最大的语音模板;
S3.文本识别:对输出的语音模块根据其模板定义,通过查表得出文本识别结果;
所述关键词匹配单元与语音识别单元连接,其具体匹配过程包括以下几个步骤:
H1.文本分词排列:用于对获取的视频直播语音识别的文本内容进行分词,得到各个词组,进而将得到的各词组按照其对应在直播视频中视频帧位置的顺序进行排列;
H2.关键词与词组匹配:并将人工输入的商品关键词与文本分词的各词组按照词组的排列顺序进行逐一匹配,输出匹配到的词组;
H3.匹配结果分析:若匹配到的词组只有一个,则根据视频直播内容与文本识别内容的对应关系,定位匹配到的词组出现在直播视频中的视频帧位置;若匹配到的词组有若干个,则依次定位匹配到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置,并根据得到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置进行视频筛选,从整个完整直播回放视频中筛选若干候选视频段,同时进行关键词多级筛选匹配,从候选视频段中获取关键词匹配到的词组出现在直播视频的视频帧位置;
所述播放规则选择模块用于根据播放规则数据库内手动选择播放规则中的一级播放规则,通过人工选择某一种一级播放规则,若选择的一级播放规则为除关键词匹配到的视频帧位置为中点的中点式播放以外的其他一级播放规则,则将选择的一级播放规则发送至视频筛选播放模块,若选择的一级播放规则为以关键词匹配到的视频帧位置为中点的中点式播放,则继续进行二级播放规则选择,并将选择的二级播放规则发送至视频筛选播放模块;
所述视频筛选播放模块接收直播内容分割分类模块发送的商品特征关键词视频列表,通过从商品特征关键词视频列表中的商品特征关键词筛选相应特征关键词,并手动从商品特征关键词视频列表中选择该商品特征关键词视频进行视频播放;
同时,视频筛选播放模块获取视频帧位置匹配模块匹配到的关键词出现在直播视频的视频帧位置,并接收播放规则选择模块发送的播放规则,按照接收的播放规则进行视频播放。
优选地,所述文本内容进行分词的具体过程为首先对文本内容进行过滤停用词得到处理后的文本内容,然后采用中文语料词典对处理后的文本内容进行中文分词,得到若干词组。
进一步地,所述关键词多级筛选匹配过程具体包括以下步骤:
W1:对得到的各候选视频段按照视频段所处直播视频中的前后位置顺序进行编号,并根据视频直播内容与文本识别内容的对应关系,将得到的各候选视频段进行文本识别,得到各候选视频段的文本识别结果,并对各候选视频段的文本识别结果进行中文分词,得到各候选视频段的若干分词词组;
W2:在视频直播界面的搜索输入框中输入二级关键词;
W3:将输入的二级关键词与各候选视频段的若干分词词组按照候选视频段的编号顺序逐一匹配,并统计二级关键词与每个候选视频段的各个分词词组的匹配相似度,输出匹配相识度最大的词组,若匹配到的词组有且只有一个,则停止关键词匹配,并记录匹配到的词组对应的候选视频段编号,同时定位匹配到的词组在对应该候选视频段上的视频帧位置,若在某个候选视频段内匹配到的词组有多个,则执行步骤W4,若在多个候选视频段都能匹配到词组,则执行步骤W6;
W4:依次定位匹配到的各词组出现在该候选视频段内开始视频帧位置和结束视频帧位置,并根据得到的各词组出现在该候选视频段的开始视频帧位置和结束视频帧位置对该候选视频段进行视频筛选,从该候选视频段筛选若干二级候选视频段,对得到的各二级候选视频段进行文本识别,并对文本识别结果进行分词;
W5:在视频直播界面的搜索输入框中输入三级关键词,并将输入的三级关键词与各二级候选视频段的若干分词词组进行逐一匹配,直至匹配到单个词组,并获取匹配到的单个词组所属的二级候选视频段,同时定位匹配到的单个词组在对应二级候选视频段上的视频帧位置;
W6:重新输入二级关键词,直至匹配到的候选视频段有且只有一个。
进一步地,所述播放规则数据库包括手动选择播放规则和智能推荐播放规则,所述手动选择播放规则包含一级播放规则和二级播放规则,所述一级播放规则用于对关键词匹配到的视频帧位置的播放方向进行设置,包括关键词匹配到的视频帧位置往前式播放、以关键词匹配到的视频帧位置为中点的中点式播放和关键词匹配到的视频帧位置往后式播放;所述二级播放规则用于对以关键词匹配到的视频帧位置为中点的中点式播放的时间段进行设置,包括关键词匹配到的视频帧位置往前和往后的一级播放时间段、二级播放时间段和三级播放时间段。
进一步地,还包括播放规则智能推荐模块,用于提取播放规则数据库中存储的智能推荐播放规则,并将推荐播放规则发送至视频筛选播放模块。
更进一步地,所述智能推荐播放规则为多数人选择的播放规则。
本发明的有益效果:
(1)本发明通过对商品的完整直播回放视频按照内容进行视频分割,并对分割的每个视频段提取视频内容关键词同时进行标注,构成商品特征关键词视频列表,消费者通过商品特征关键词筛选自己想要看的关键词,并手动从商品特征关键词视频列表中选择该商品特征关键词视频进行视频播放,实现了对商品直播视频内容的智能管理,具有操作性强的特点,弥补了人为滑动直播视频的进度条调节视频造成的操作性差问题,提高了调节效率,增强了消费者观看直播的观看体验感。
(2)本发明通过设置视频帧位置匹配模块根据人工输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置,并手动选择某一种播放规则进行播放,能够精准获取含有输入关键词的直播视频段,其得到的直播视频段与消费者喜好智能匹配度高,极大满足了消费者的观看需求,进而提高了消费者观看直播的兴趣。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的系统模块框图;
图2为本发明的直播内容分割分类模块框图;
图3为本发明的视频帧位置匹配模块框图;
图4为本发明的语音识别单元步骤流程图;
图5为本发明的关键词匹配单元步骤流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3所示,一种基于大数据的直播电商内容智能管理平台,包括直播内容分割分类模块、视频帧位置匹配模块、播放规则数据库、播放规则选择模块、视频筛选播放模块和播放规则智能推荐模块,所述直播内容分割分类模块用于对商品的完整直播回放视频按照内容进行视频分割并进行关键词标注,所述视频帧位置匹配模块用于人工通过输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置,其中直播内容分割分类模块、视频帧位置匹配模块、播放规则选择模块和播放规则智能推荐模块均与视频筛选播放模块连接,所述播放规则选择模块与播放规则数据库连接。
直播内容分割分类模块包括视频内容分段单元、视频分割单元和关键词标注单元,其中视频分割单元与视频内容分段单元连接,关键词标注单元与视频分割单元连接。
视频内容分段单元用于对商品的完整直播视频讲解内容按照视频讲解的先后顺序进行视频内容分段,每一段视频讲解内容分别对应商品某方面的特征,商品特征包括外形特征、用途特征等,其外形特征包含形状、颜色、尺寸等,按照这样的分段方式将商品的完整直播视频讲解内容划分为若干讲解段。
视频分割单元用于对划分的商品直播视频若干讲解段,记录每个讲解段视频讲解的开始视频帧位置和结束视频帧位置,对商品直播视频各讲解段从开始视频帧位置和结束视频帧位置进行视频分割,将商品的完整直播视频分割为若干商品特征视频段,构成商品特征视频列表。
关键词标注单元用于对分割的商品特征视频段,对每个商品特征视频段讲解的商品内容提取讲解关键词,并标注在对应的商品特征视频下方,连同商品特征视频列表组成商品特征关键词视频列表,并将组成的商品特征关键词视频列表发送至视频筛选播放模块。
本优选实施例提出的直播内容分割分类模块实现了对商品直播视频内容的智能管理,其得到的商品特征关键词视频列表,只需要人工点击相应的关键词视频,就可以播放消费者想看的视频,具有操作性强的特点,弥补了人为滑动直播视频的进度条调节视频造成的操作性差问题,提高了调节效率,增强了消费者观看直播的观看体验感。
视频帧位置匹配模块包括关键词人工输入单元、语音识别单元和关键词匹配单元。
关键词人工输入单元通过在视频直播界面的搜索输入框中输入关键词。
参阅图4所示,语音识别单元用于对完整的视频直播回放视频提取其视频直播语音内容进行语音模板库匹配,获取文本识别结果,其具体识别过程包括以下几个步骤:
S1.语音预处理:对提取的视频直播语音信息进行端点检测和语音增强处理得到增强语音;
S2.语音模板匹配:对得到的增强语音中的特征向量进行抓取,同时提取预设的语音模板库,将抓取的语音特征向量依次与语音模板库中的每个模板进行匹配,并统计抓取的语音特征向量与语音模板库中每个模板的匹配相似度,筛选相似度最大的语音模板,当筛选的最大相似度大于设定的相似度阈值,则输出相似度最大的语音模板;
S3.文本识别:对输出的语音模块根据其模板定义,通过查表得出文本识别结果。
参阅图5所示,关键词匹配单元与语音识别单元连接,其具体匹配过程包括以下几个步骤:
H1.文本分词排列:用于对获取的视频直播语音识别的文本内容进行分词,得到各个词组,进而将得到的各词组按照其对应在直播视频中视频帧位置的顺序进行排列;
H2.关键词与词组匹配:并将人工输入的商品关键词与文本分词的各词组按照词组的排列顺序进行逐一匹配,输出匹配到的词组;
H3.匹配结果分析:若匹配到的词组只有一个,则根据视频直播内容与文本识别内容的对应关系,定位匹配到的词组出现在直播视频中的视频帧位置;若匹配到的词组有若干个,则依次定位匹配到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置,并根据得到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置进行视频筛选,从整个完整直播回放视频中筛选若干候选视频段,同时进行关键词多级筛选匹配,其关键词多级筛选匹配过程具体包括以下步骤:
H31.候选视频段文本识别:对得到的各候选视频段按照视频段所处直播视频中的前后位置顺序进行编号,并根据视频直播内容与文本识别内容的对应关系,将得到的各候选视频段进行文本识别,得到各候选视频段的文本识别结果,并对各候选视频段的文本识别结果进行中文分词,得到各候选视频段的若干分词词组;
H32.二级关键词输入:在视频直播界面的搜索输入框中输入二级关键词;
H33.二级关键词匹配:将输入的二级关键词与各候选视频段的若干分词词组按照候选视频段的编号顺序逐一匹配,并统计二级关键词与每个候选视频段的各个分词词组的匹配相似度,输出匹配相识度最大的词组,若匹配到的词组有且只有一个,则停止关键词匹配,并记录匹配到的词组对应的候选视频段编号,同时定位匹配到的词组在对应该候选视频段上的视频帧位置,若在某个候选视频段内匹配到的词组有多个,则执行步骤H34,若在多个候选视频段都能匹配到词组,则执行步骤H36;
H34.二级候选视频段文本识别:依次定位匹配到的各词组出现在该候选视频段内开始视频帧位置和结束视频帧位置,并根据得到的各词组出现在该候选视频段的开始视频帧位置和结束视频帧位置对该候选视频段进行视频筛选,从该候选视频段筛选若干二级候选视频段,对得到的各二级候选视频段进行文本识别,并对文本识别结果进行分词;
H35.三级关键词输入及匹配:在视频直播界面的搜索输入框中输入三级关键词,并将输入的三级关键词与各二级候选视频段的若干分词词组进行逐一匹配,直至匹配到单个词组,并获取匹配到的单个词组所属的二级候选视频段,同时定位匹配到的单个词组在对应二级候选视频段上的视频帧位置;
H36.二级关键词重输入:重新输入二级关键词,直至匹配到的候选视频段有且只有一个。
本优选实施例通过设置视频帧位置匹配模块以通过人工通过输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置,并手动选择某一种播放规则进行播放,能够精准获取含有输入关键词的直播视频段,其得到的直播视频段与消费者喜好智能匹配度高,极大满足了消费者的观看需求,进而提高了消费者观看直播的兴趣。
同时,本优选实施例提到的关键词多级筛选匹配通过设置二级关键词和三级关键词进行逐级匹配,以得到匹配更加精准的视频段,其获得的视频段与消费者输入的关键词匹配度更高,更加满足消费者的观看需求,体现了平台的智能化水平。
播放规则选择模块用于根据播放规则数据库内手动选择播放规则中的一级播放规则,通过人工选择某一种一级播放规则,若选择的一级播放规则为除关键词匹配到的视频帧位置为中点的中点式播放以外的其他一级播放规则,则将选择的一级播放规则发送至视频筛选播放模块,若选择的一级播放规则为以关键词匹配到的视频帧位置为中点的中点式播放,则继续进行二级播放规则选择,并将选择的二级播放规则发送至视频筛选播放模块。
本优选实施例提到的播放规则数据库包括手动选择播放规则和智能推荐播放规则,所述手动选择播放规则包含一级播放规则和二级播放规则,所述一级播放规则用于对关键词匹配到的视频帧位置的播放方向进行设置,包括关键词匹配到的视频帧位置往前式播放、以关键词匹配到的视频帧位置为中点的中点式播放和关键词匹配到的视频帧位置往后式播放;所述二级播放规则用于对以关键词匹配到的视频帧位置为中点的中点式播放的时间段进行设置,包括关键词匹配到的视频帧位置往前和往后的一级播放时间段、二级播放时间段和三级播放时间段,其中设置的不同播放时间段为消费者提供了多种选择性,不同播放时间段设置的时间段不同,一级播放时间段最短,三级播放时间段最长。
播放规则智能推荐模块,用于提取播放规则数据库中存储的智能推荐播放规则,并将推荐播放规则发送至视频筛选播放模块,所述智能推荐播放规则为多数人选择的播放规则,本实施例通过将多数人选择的播放规则推荐给消费者,便于消费者在不知道选择哪种播放规则时,为其提供备选播放规则,提高了平台的人性化水平
视频筛选播放模块接收直播内容分割分类模块发送的商品特征关键词视频列表,通过从商品特征关键词视频列表中的商品特征关键词筛选相应特征关键词,并手动从商品特征关键词视频列表中选择该商品特征关键词视频进行视频播放;
同时,视频筛选播放模块获取视频帧位置匹配模块匹配到的关键词出现在直播视频的视频帧位置,并接收播放规则选择模块发送的播放规则,按照接收的播放规则进行视频播放。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (6)
1.一种基于大数据的直播电商内容智能管理平台,其特征在于:包括直播内容分割分类模块、视频帧位置匹配模块、播放规则数据库、播放规则选择模块和视频筛选播放模块,所述直播内容分割分类模块用于对商品的完整直播回放视频按照内容进行视频分割并进行关键词标注,所述视频帧位置匹配模块用于人工通过输入商品关键词从商品的完整直播回放视频中获取匹配到关键词的视频帧位置,其中直播内容分割分类模块、视频帧位置匹配模块、播放规则选择模块和播放规则智能推荐模块均与视频筛选播放模块连接,所述播放规则选择模块与播放规则数据库连接;
所述直播内容分割分类模块包括视频内容分段单元、视频分割单元和关键词标注单元,其中视频分割单元与视频内容分段单元连接,关键词标注单元与视频分割单元连接;
所述视频内容分段单元用于对商品的完整直播视频讲解内容按照视频讲解的先后顺序进行视频内容分段,每一段视频讲解内容分别对应商品某方面的特征,按照这样的分段方式将商品的完整直播视频讲解内容划分为若干讲解段;
所述视频分割单元用于对划分的商品直播视频若干讲解段,记录每个讲解段视频讲解的开始视频帧位置和结束视频帧位置,对商品直播视频各讲解段从开始视频帧位置和结束视频帧位置进行视频分割,将商品的完整直播视频分割为若干商品特征视频段,构成商品特征视频列表;
所述关键词标注单元用于对分割的商品特征视频段,对每个商品特征视频段讲解的商品内容提取讲解关键词,并标注在对应的商品特征视频下方,连同商品特征视频列表组成商品特征关键词视频列表,并将组成的商品特征关键词视频列表发送至视频筛选播放模块;
所述视频帧位置匹配模块包括关键词人工输入单元、语音识别单元和关键词匹配单元;
所述关键词人工输入单元通过在视频直播界面的搜索输入框中输入关键词;
所述语音识别单元用于对完整的视频直播回放视频提取其视频直播语音内容进行语音模板库匹配,获取文本识别结果,其具体识别过程包括以下几个步骤:
S1.语音预处理:对提取的视频直播语音信息进行端点检测和语音增强处理得到增强语音;
S2.语音模板匹配:对得到的增强语音中的特征向量进行抓取,同时提取预设的语音模板库,将抓取的语音特征向量依次与语音模板库中的每个模板进行匹配,并统计抓取的语音特征向量与语音模板库中每个模板的匹配相似度,筛选相似度最大的语音模板,当筛选的最大相似度大于设定的相似度阈值,则输出相似度最大的语音模板;
S3.文本识别:对输出的语音模块根据其模板定义,通过查表得出文本识别结果;
所述关键词匹配单元与语音识别单元连接,其具体匹配过程包括以下几个步骤:
H1.文本分词排列:用于对获取的视频直播语音识别的文本内容进行分词,得到各个词组,进而将得到的各词组按照其对应在直播视频中视频帧位置的顺序进行排列;
H2.关键词与词组匹配:并将人工输入的商品关键词与文本分词的各词组按照词组的排列顺序进行逐一匹配,输出匹配到的词组;
H3.匹配结果分析:若匹配到的词组只有一个,则根据视频直播内容与文本识别内容的对应关系,定位匹配到的词组出现在直播视频中的视频帧位置;若匹配到的词组有若干个,则依次定位匹配到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置,并根据得到的各词组出现在直播视频的开始视频帧位置和结束视频帧位置进行视频筛选,从整个完整直播回放视频中筛选若干候选视频段,同时进行关键词多级筛选匹配,从候选视频段中获取关键词匹配到的词组出现在直播视频的视频帧位置;
所述播放规则选择模块用于根据播放规则数据库内手动选择播放规则中的一级播放规则,通过人工选择某一种一级播放规则,若选择的一级播放规则为除关键词匹配到的视频帧位置为中点的中点式播放以外的其他一级播放规则,则将选择的一级播放规则发送至视频筛选播放模块,若选择的一级播放规则为以关键词匹配到的视频帧位置为中点的中点式播放,则继续进行二级播放规则选择,并将选择的二级播放规则发送至视频筛选播放模块;
所述视频筛选播放模块接收直播内容分割分类模块发送的商品特征关键词视频列表,通过从商品特征关键词视频列表中的商品特征关键词筛选相应特征关键词,并手动从商品特征关键词视频列表中选择该商品特征关键词视频进行视频播放;
同时,视频筛选播放模块获取视频帧位置匹配模块匹配到的关键词出现在直播视频的视频帧位置,并接收播放规则选择模块发送的播放规则,按照接收的播放规则进行视频播放。
2.根据权利要求1所述的一种基于大数据的直播电商内容智能管理平台,其特征在于:所述文本内容进行分词的具体过程为首先对文本内容进行过滤停用词得到处理后的文本内容,然后采用中文语料词典对处理后的文本内容进行中文分词,得到若干词组。
3.根据权利要求1所述的一种基于大数据的直播电商内容智能管理平台,其特征在于:所述关键词多级筛选匹配过程具体包括以下步骤:
W1:对得到的各候选视频段按照视频段所处直播视频中的前后位置顺序进行编号,并根据视频直播内容与文本识别内容的对应关系,将得到的各候选视频段进行文本识别,得到各候选视频段的文本识别结果,并对各候选视频段的文本识别结果进行中文分词,得到各候选视频段的若干分词词组;
W2:在视频直播界面的搜索输入框中输入二级关键词;
W3:将输入的二级关键词与各候选视频段的若干分词词组按照候选视频段的编号顺序逐一匹配,并统计二级关键词与每个候选视频段的各个分词词组的匹配相似度,输出匹配相识度最大的词组,若匹配到的词组有且只有一个,则停止关键词匹配,并记录匹配到的词组对应的候选视频段编号,同时定位匹配到的词组在对应该候选视频段上的视频帧位置,若在某个候选视频段内匹配到的词组有多个,则执行步骤W4,若在多个候选视频段都能匹配到词组,则执行步骤W6;
W4:依次定位匹配到的各词组出现在该候选视频段内开始视频帧位置和结束视频帧位置,并根据得到的各词组出现在该候选视频段的开始视频帧位置和结束视频帧位置对该候选视频段进行视频筛选,从该候选视频段筛选若干二级候选视频段,对得到的各二级候选视频段进行文本识别,并对文本识别结果进行分词;
W5:在视频直播界面的搜索输入框中输入三级关键词,并将输入的三级关键词与各二级候选视频段的若干分词词组进行逐一匹配,直至匹配到单个词组,并获取匹配到的单个词组所属的二级候选视频段,同时定位匹配到的单个词组在对应二级候选视频段上的视频帧位置;
W6:重新输入二级关键词,直至匹配到的候选视频段有且只有一个。
4.根据权利要求1所述的一种基于大数据的直播电商内容智能管理平台,其特征在于:所述播放规则数据库包括手动选择播放规则和智能推荐播放规则,所述手动选择播放规则包含一级播放规则和二级播放规则,所述一级播放规则用于对关键词匹配到的视频帧位置的播放方向进行设置,包括关键词匹配到的视频帧位置往前式播放、以关键词匹配到的视频帧位置为中点的中点式播放和关键词匹配到的视频帧位置往后式播放;所述二级播放规则用于对以关键词匹配到的视频帧位置为中点的中点式播放的时间段进行设置,包括关键词匹配到的视频帧位置往前和往后的一级播放时间段、二级播放时间段和三级播放时间段。
5.根据权利要求1所述的一种基于大数据的直播电商内容智能管理平台,其特征在于:还包括播放规则智能推荐模块,用于提取播放规则数据库中存储的智能推荐播放规则,并将推荐播放规则发送至视频筛选播放模块。
6.根据权利要求5所述的一种基于大数据的直播电商内容智能管理平台,其特征在于:所述智能推荐播放规则为多数人选择的播放规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010929437.9A CN112019871B (zh) | 2020-09-07 | 2020-09-07 | 一种基于大数据的直播电商内容智能管理平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010929437.9A CN112019871B (zh) | 2020-09-07 | 2020-09-07 | 一种基于大数据的直播电商内容智能管理平台 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112019871A CN112019871A (zh) | 2020-12-01 |
CN112019871B true CN112019871B (zh) | 2021-05-04 |
Family
ID=73515480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010929437.9A Active CN112019871B (zh) | 2020-09-07 | 2020-09-07 | 一种基于大数据的直播电商内容智能管理平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112019871B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113824972B (zh) * | 2021-05-31 | 2024-01-09 | 深圳市雅阅科技有限公司 | 直播视频的处理方法、装置、设备及计算机可读存储介质 |
CN113807912A (zh) * | 2021-07-30 | 2021-12-17 | 北京房江湖科技有限公司 | 动态匹配用户和经纪人连接的方法及计算机程序产品 |
CN114596138A (zh) * | 2022-03-07 | 2022-06-07 | 北京字节跳动网络技术有限公司 | 一种信息推荐方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108235141A (zh) * | 2018-03-01 | 2018-06-29 | 北京网博视界科技股份有限公司 | 直播视频转碎片化点播的方法、装置、服务器和存储介质 |
CN108366216A (zh) * | 2018-02-28 | 2018-08-03 | 深圳市爱影互联文化传播有限公司 | 会议视频录制、记录及传播方法、装置及服务器 |
CN110688526A (zh) * | 2019-11-07 | 2020-01-14 | 山东舜网传媒股份有限公司 | 基于关键帧识别和音频文本化的短视频推荐方法及系统 |
CN110750679A (zh) * | 2019-09-05 | 2020-02-04 | 天脉聚源(杭州)传媒科技有限公司 | 一种基于关键词的视频搜索方法、系统、装置及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9465435B1 (en) * | 2013-08-26 | 2016-10-11 | Google Inc. | Segmentation of a video based on user engagement in respective segments of the video |
-
2020
- 2020-09-07 CN CN202010929437.9A patent/CN112019871B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108366216A (zh) * | 2018-02-28 | 2018-08-03 | 深圳市爱影互联文化传播有限公司 | 会议视频录制、记录及传播方法、装置及服务器 |
CN108235141A (zh) * | 2018-03-01 | 2018-06-29 | 北京网博视界科技股份有限公司 | 直播视频转碎片化点播的方法、装置、服务器和存储介质 |
CN110750679A (zh) * | 2019-09-05 | 2020-02-04 | 天脉聚源(杭州)传媒科技有限公司 | 一种基于关键词的视频搜索方法、系统、装置及存储介质 |
CN110688526A (zh) * | 2019-11-07 | 2020-01-14 | 山东舜网传媒股份有限公司 | 基于关键帧识别和音频文本化的短视频推荐方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112019871A (zh) | 2020-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112019871B (zh) | 一种基于大数据的直播电商内容智能管理平台 | |
CN101616264B (zh) | 新闻视频编目方法及系统 | |
KR102433393B1 (ko) | 동영상 콘텐츠 내의 인물을 인식하는 장치 및 방법 | |
US10304458B1 (en) | Systems and methods for transcribing videos using speaker identification | |
CN111754302B (zh) | 一种基于大数据的视频直播界面商品展示智能管理系统 | |
US9009054B2 (en) | Program endpoint time detection apparatus and method, and program information retrieval system | |
CN110839173A (zh) | 一种音乐匹配方法、装置、终端及存储介质 | |
CN112445935B (zh) | 一种基于内容分析的视频精选合集的自动生成方法 | |
CN110211590B (zh) | 一种会议热点的处理方法、装置、终端设备及存储介质 | |
CN110430476A (zh) | 直播间搜索方法、系统、计算机设备和存储介质 | |
CN113641859B (zh) | 脚本生成方法、系统、计算机存储介质及计算机程序产品 | |
CN112733654B (zh) | 一种视频拆条的方法和装置 | |
CN102075695A (zh) | 面向海量广播电视节目的新一代智能编目系统和方法 | |
WO2011160741A1 (en) | A method for indexing multimedia information | |
CN112699831B (zh) | 基于弹幕情感的视频热点片段检测方法、装置及存储介质 | |
CN105227966A (zh) | 电视播放控制方法、服务器及电视播放控制系统 | |
CN112784078A (zh) | 一种基于语义识别的视频自动剪辑方法 | |
CN111242110B (zh) | 一种新闻自动拆条的自适应条件随机场算法的训练方法 | |
CN114363714B (zh) | 标题生成方法、设备及存储介质 | |
CN113936236A (zh) | 一种基于多模态特征的视频实体关系及交互识别方法 | |
CN111669608A (zh) | 支持用户多媒体反馈的化妆品展示装置及方法 | |
CN114860992A (zh) | 视频的标题生成方法、装置、设备及存储介质 | |
CN112565820B (zh) | 一种视频新闻拆分方法和装置 | |
EP2345978B1 (en) | Detection of flash illuminated scenes in video clips and related ranking of video clips | |
CN116916089B (zh) | 一种融合人声特征与人脸特征的智能视频剪辑方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210412 Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.) Applicant after: Shenzhen Qianhai Wuyou Information Service Co.,Ltd. Address before: 518000 Dongmen Middle Road, Luoling community, Dongmen street, Luohu District, Shenzhen City, Guangdong Province Applicant before: Shenzhen ZHONGSHEN Electronic Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |