CN112541485B - 基于多源正则化消费视频事件检测模糊回归模型构建方法 - Google Patents
基于多源正则化消费视频事件检测模糊回归模型构建方法 Download PDFInfo
- Publication number
- CN112541485B CN112541485B CN202011599917.XA CN202011599917A CN112541485B CN 112541485 B CN112541485 B CN 112541485B CN 202011599917 A CN202011599917 A CN 202011599917A CN 112541485 B CN112541485 B CN 112541485B
- Authority
- CN
- China
- Prior art keywords
- video
- consumption
- consumption video
- fuzzy
- associated attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 29
- 238000010276 construction Methods 0.000 title claims abstract description 7
- 238000000034 method Methods 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及视频检测技术领域,公开了基于多源正则化消费视频事件检测模糊回归模型构建方法,通过获取目标消费视频集和多源视频数据集,并对多源视频数据集以及目标消费视频集的视频数据的图像进行特征提取,并根据目标消费视频集得特征值获得消费视频事件的关联属性因素;消费视频事件的关联属性因素的特征向量作为输入数据集,利用模糊回归算法获得关联属性因素的初始权重,构建消费视频事件的模糊集;加入正则化项,对消费视频事件的模糊集进行优化,得到消费视频事件的检测模型,可以有效规避统计数据不准确和多源数据的关联属性因素较多存在的模糊性,提高了在多源条件下对消费视频事件识别、检测的可靠性。
Description
技术领域
本发明涉及视频检测技术领域,具体涉及基于多源正则化消费视频事件检测模糊回归模型构建方法。
背景技术
在视频检索应用中,视频语意内容分析是一项关键的学习任务。视频事件检测(或概念识别)是一种从视频序列(或视频关键帧)中分析视频语义内容的机器学习方法,在许多计算机视觉应用(如基于内容的视频搜索和索引、人机交互等)中,视频事件检测(或概念识别)是一项基本的学习任务。从大量不同的视频源(如新闻视频、消费视频以及Web视频等)中检测视频事件是一项具有挑战性的工作,且逐渐得到许多研究者的关注和研究。当前的视频内容分析研究主要关注于视频概念(如活动、场景、对象等)的识别,而视频事件的检测更具有挑战性。
目前,虽然消费视频概念识别研究已取得一些有益进展,但消费视频事件尤其是复杂事件的检测研究尚处于初级阶段,且大多囿于短视频的异常事件或模式重复事件的识别与检测,却鲜有关于复杂环境下消费视频事件检测技术报到。
发明内容
基于以上问题,本发明提供基于多源正则化消费视频事件检测模糊回归模型构建方法,本发明通过将多源视频数据和目标消费视频数据进行特征提取,以目标消费视频的时长、分辨率、图形物品、图形物品显示帧数等关联属性作为自变量,消费视频事件作为因变量进行模糊回归拟合得到模糊集,再通对模糊集正则化处理,得到优化的消费视频事件的检测模型,可以有效规避统计数据不准确和多源数据的关联属性因素较多存在的模糊性,提高了在多源条件下对消费视频事件识别、检测的可靠性。
为实现上述技术效果,本发采用了以下技术方案:
基于多源正则化消费视频事件检测模糊回归模型构建方法,包括如下步骤:
S1、获取目标消费视频集,并从多源数据库中获取多源视频数据集,均存入本地数据库中;
S2、对本地数据库中多源视频数据集以及目标消费视频集的视频数据的图像进行特征提取,并根据目标消费视频集得特征值获得消费视频事件的关联属性因素;
S3、消费视频事件的关联属性因素的特征向量作为输入数据集,利用模糊回归算法获得关联属性因素的初始权重,构建消费视频事件的模糊集;
S4、加入正则化项,对消费视频事件的模糊集进行优化,得到消费视频事件的检测模型。
进一步地,步骤S3中模糊回归算法的具体方法为:
A1、定义是一个对称三角模糊数,则它的隶属函数为:
其中,a为对称中心,δ为模糊度,且δ>0;
A2、确定消费视频事件的关联属性因素有m个,根据三角隶属度函数建立消费视频事件的拟合值yk与关联属性因素的多元回归关系:
其中,A0、A1、A2、…、Am为m+1个待估权重参数,为m个关联属性因素,εk为随机变量,k=1,2,…,m;
A3、消费视频事件的关联属性因素的特征向量作为输入数据集,以约束条件为每个拟合值yk满足μAi(yk)≥h,(0≤h≤1),其中h为水平截集,对Ai进行求解,i=1,2,…,m,获得模糊集中关联属性因素的初始权重。
进一步地,步骤S4中正则化项对模糊集的优化流程为:
B1、提取目标消费视频集中各个视频中的音频数据和文本数据,并将音频数据也转换为文本数据;
B2、对目标消费视频集中所有文本数据进行分词、标注词性处理后,将目标消费视频集中预定词性的词语作为L1范数惩罚项,采用L1范数惩罚对消费视频事件的模糊集进行优化,获得消费视频事件的检测模型。
进一步地,步骤S2中的消费视频事件的关联属性因素包括视频的时长、分辨率、图形物品、图形物品显示帧数。
与现有技术相比,本发明的有益效果是:本发明通过将多源视频数据和目标消费视频数据进行特征提取,以目标消费视频的时长、分辨率、图形物品、图形物品显示帧数等关联属性作为自变量,消费视频事件作为因变量进行模糊回归拟合得到模糊集,再通对模糊集正则化处理,得到优化的消费视频事件的检测模型,可以有效规避统计数据不准确和多源数据的关联属性因素较多存在的模糊性,提高了在多源条件下对消费视频事件识别、检测的可靠性。
附图说明
图1为实施例中基于多源正则化消费视频事件检测模糊回归模型构建方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例:
参见图1,基于多源正则化消费视频事件检测模糊回归模型构建方法,包括如下步骤:
S1、获取目标消费视频集,并从多源数据库中获取多源视频数据集,均存入本地数据库中;
S2、对本地数据库中多源视频数据集以及目标消费视频集的视频数据的图像进行特征提取,并根据目标消费视频集得特征值获得消费视频事件的关联属性因素;本实施例中的消费视频事件的关联属性因素包括但不限于视频的时长、分辨率、图形物品、图形物品显示帧数。
S3、消费视频事件的关联属性因素的特征向量作为输入数据集,利用模糊回归算法获得关联属性因素的初始权重,构建消费视频事件的模糊集;具体方法为:
A1、定义是一个对称三角模糊数,则它的隶属函数为:
其中,a为对称中心,δ为模糊度,且δ>0;
A2、确定消费视频事件的关联属性因素有m个,根据三角隶属度函数建立消费视频事件的拟合值yk与关联属性因素的多元回归关系:
其中,A0、A1、A2、…、Am为m+1个待估权重参数,为m个关联属性因素,εk为随机变量,k=1,2,…,m;
A3、消费视频事件的关联属性因素的特征向量作为输入数据集,以约束条件为每个拟合值yk满足μAi(yk)≥h,(0≤h≤1),其中h为水平截集,本实施例中取h=0.5,对Ai进行求解,i=1,2,…,m,获得模糊集中关联属性因素的初始权重。
S4、加入正则化项,对消费视频事件的模糊集进行优化,得到消费视频事件的检测模型。优化流程为:
B1、提取目标消费视频集中各个视频中的音频数据和文本数据,并将音频数据也转换为文本数据;
B2、对目标消费视频集中所有文本数据进行分词、标注词性处理后,将目标消费视频集中预定词性的词语作为L1范数惩罚项,采用L1范数惩罚对消费视频事件的模糊集进行优化,获得消费视频事件的检测模型。
在本实施例中,通过将多源视频数据和目标消费视频数据进行特征提取,以目标消费视频的时长、分辨率、图形物品、图形物品显示帧数等关联属性作为自变量,消费视频事件作为因变量进行模糊回归拟合得到模糊集,再通对模糊集正则化处理,得到优化的消费视频事件的检测模型,可以有效规避统计数据不准确和多源数据的关联属性因素较多存在的模糊性,提高了在多源条件下对消费视频事件识别、检测的可靠性。
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (3)
1.基于多源正则化消费视频事件检测模糊回归模型构建方法,其特征在于,包括如下步骤:
S1、获取目标消费视频集,并从多源数据库中获取多源视频数据集,均存入本地数据库中;
S2、对本地数据库中多源视频数据集以及目标消费视频集的视频数据的图像进行特征提取,并根据目标消费视频集得特征值获得消费视频事件的关联属性因素;
S3、消费视频事件的关联属性因素的特征向量作为输入数据集,利用模糊回归算法获得关联属性因素的初始权重,构建消费视频事件的模糊集;
S4、加入正则化项,对消费视频事件的模糊集进行优化,得到消费视频事件的检测模型;
步骤S4中正则化项对模糊集的优化流程为:
B1、提取目标消费视频集中各个视频中的音频数据和文本数据,并将音频数据也转换为文本数据;
B2、对目标消费视频集中所有文本数据进行分词、标注词性处理后,将目标消费视频集中预定词性的词语作为L1范数惩罚项,采用L1范数惩罚对消费视频事件的模糊集进行优化,获得消费视频事件的检测模型。
2.根据权利要求1所述的基于多源正则化消费视频事件检测模糊回归模型构建方法,其特征在于,步骤S3中模糊回归算法的具体方法为:
A1、定义是一个对称三角模糊数,则它的隶属函数为:
其中,a为对称中心,δ为模糊度,且δ>0;
A2、确定消费视频事件的关联属性因素有m个,根据三角隶属度函数建立消费视频事件的拟合值yk与关联属性因素的多元回归关系:
其中,A0、A1、A2、…Am为m+1个待估权重参数,为m个关联属性因素,εk为随机变量,k=1,2,…,m;
A3、消费视频事件的关联属性因素的特征向量作为输入数据集,以约束条件为每个拟合值yk满足μAi(yk)≥h,0≤h≤1,其中h为水平截集,对Ai进行求解,i=1,2,…,m,获得模糊集中关联属性因素的初始权重。
3.根据权利要求1-2任意一项所述的基于多源正则化消费视频事件检测模糊回归模型构建方法,其特征在于:步骤S2中的消费视频事件的关联属性因素包括视频的时长、分辨率、图形物品、图形物品显示帧数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011599917.XA CN112541485B (zh) | 2020-12-29 | 2020-12-29 | 基于多源正则化消费视频事件检测模糊回归模型构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011599917.XA CN112541485B (zh) | 2020-12-29 | 2020-12-29 | 基于多源正则化消费视频事件检测模糊回归模型构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112541485A CN112541485A (zh) | 2021-03-23 |
CN112541485B true CN112541485B (zh) | 2024-03-29 |
Family
ID=75017934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011599917.XA Active CN112541485B (zh) | 2020-12-29 | 2020-12-29 | 基于多源正则化消费视频事件检测模糊回归模型构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112541485B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787049A (zh) * | 2016-02-26 | 2016-07-20 | 浙江大学 | 一种基于多源信息融合分析的网络视频热点事件发现方法 |
CN106709877A (zh) * | 2016-11-11 | 2017-05-24 | 天津大学 | 一种基于多参数正则优化模型的图像去模糊方法 |
US9779362B1 (en) * | 2014-08-25 | 2017-10-03 | Google Inc. | Ranking video delivery problems |
CN110110610A (zh) * | 2019-04-16 | 2019-08-09 | 天津大学 | 一种用于短视频的事件检测方法 |
CN110363165A (zh) * | 2019-07-18 | 2019-10-22 | 深圳大学 | 基于tsk模糊系统的多目标跟踪方法、装置及存储介质 |
CN110991843A (zh) * | 2019-11-22 | 2020-04-10 | 国网山东省电力公司临沂供电公司 | 考虑城市化发展及电能替代效应的饱和电力需求预测方法 |
CN111368254A (zh) * | 2020-03-02 | 2020-07-03 | 西安邮电大学 | 多流形正则化非负矩阵分解的多视角数据缺失补全方法 |
CN111400495A (zh) * | 2020-03-17 | 2020-07-10 | 重庆邮电大学 | 一种基于模板特征的视频弹幕消费意图识别方法 |
CN112002109A (zh) * | 2020-08-28 | 2020-11-27 | 宁波职业技术学院 | 一种基于视频事件检测器用的无线远程报警装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7933847B2 (en) * | 2007-10-17 | 2011-04-26 | Microsoft Corporation | Limited-memory quasi-newton optimization algorithm for L1-regularized objectives |
US9082047B2 (en) * | 2013-08-20 | 2015-07-14 | Xerox Corporation | Learning beautiful and ugly visual attributes |
US10581945B2 (en) * | 2017-08-28 | 2020-03-03 | Banjo, Inc. | Detecting an event from signal data |
US10546197B2 (en) * | 2017-09-26 | 2020-01-28 | Ambient AI, Inc. | Systems and methods for intelligent and interpretive analysis of video image data using machine learning |
-
2020
- 2020-12-29 CN CN202011599917.XA patent/CN112541485B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9779362B1 (en) * | 2014-08-25 | 2017-10-03 | Google Inc. | Ranking video delivery problems |
CN105787049A (zh) * | 2016-02-26 | 2016-07-20 | 浙江大学 | 一种基于多源信息融合分析的网络视频热点事件发现方法 |
CN106709877A (zh) * | 2016-11-11 | 2017-05-24 | 天津大学 | 一种基于多参数正则优化模型的图像去模糊方法 |
CN110110610A (zh) * | 2019-04-16 | 2019-08-09 | 天津大学 | 一种用于短视频的事件检测方法 |
CN110363165A (zh) * | 2019-07-18 | 2019-10-22 | 深圳大学 | 基于tsk模糊系统的多目标跟踪方法、装置及存储介质 |
CN110991843A (zh) * | 2019-11-22 | 2020-04-10 | 国网山东省电力公司临沂供电公司 | 考虑城市化发展及电能替代效应的饱和电力需求预测方法 |
CN111368254A (zh) * | 2020-03-02 | 2020-07-03 | 西安邮电大学 | 多流形正则化非负矩阵分解的多视角数据缺失补全方法 |
CN111400495A (zh) * | 2020-03-17 | 2020-07-10 | 重庆邮电大学 | 一种基于模板特征的视频弹幕消费意图识别方法 |
CN112002109A (zh) * | 2020-08-28 | 2020-11-27 | 宁波职业技术学院 | 一种基于视频事件检测器用的无线远程报警装置 |
Non-Patent Citations (1)
Title |
---|
L1-norm locally linear representation regularization multi-source adaptation learning;Jianwen Tao 等;《Neural networks》;第69卷;80-98 * |
Also Published As
Publication number | Publication date |
---|---|
CN112541485A (zh) | 2021-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110609897B (zh) | 一种融合全局和局部特征的多类别中文文本分类方法 | |
CN103984714B (zh) | 一种基于本体语义的云制造服务供需智能匹配方法 | |
CN110489565B (zh) | 基于领域知识图谱本体中的对象根类型设计方法及系统 | |
CN110413825B (zh) | 面向时尚电商的街拍推荐系统 | |
CN111552788B (zh) | 基于实体属性关系的数据库检索方法、系统与设备 | |
CN114898349A (zh) | 目标商品识别方法及其装置、设备、介质、产品 | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
Bhardwaj et al. | Review of text mining techniques | |
Shrivastava et al. | Product recommendations using textual similarity based learning models | |
CN113722443B (zh) | 一种融合文本相似度和协同过滤的标签推荐方法和系统 | |
Ji et al. | Research on fabric image retrieval method based on multi-feature layered fusionon | |
Ding et al. | Context-aware semantic type identification for relational attributes | |
CN112541485B (zh) | 基于多源正则化消费视频事件检测模糊回归模型构建方法 | |
Godara et al. | Support vector machine classifier with principal component analysis and k mean for sarcasm detection | |
Xi et al. | Image caption automatic generation method based on weighted feature | |
CN113821631B (zh) | 一种基于大数据的商品匹配方法 | |
Nath et al. | An efficient clustering scheme using support vector methods | |
Huang et al. | An integrated scheme for video key frame extraction | |
Liu et al. | Research on feature dimensionality reduction in content based public cultural video retrieval | |
Mandloi et al. | Hybrid music recommendation system using content-based filtering and K-mean clustering algorithm | |
CN111159335A (zh) | 基于金字塔池化与lda主题模型的短文本分类方法 | |
Xia et al. | Attributes-oriented clothing description and retrieval with multi-task convolutional neural network | |
Mohamed et al. | A new challenge on video recommendation by content | |
Yang et al. | A semi-supervised method for feature selection | |
Fang | Research on Personalized Recommendation System Based on Machine Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |