CN105913072A - 视频分类模型的训练方法和视频分类方法 - Google Patents

视频分类模型的训练方法和视频分类方法 Download PDF

Info

Publication number
CN105913072A
CN105913072A CN201610202497.4A CN201610202497A CN105913072A CN 105913072 A CN105913072 A CN 105913072A CN 201610202497 A CN201610202497 A CN 201610202497A CN 105913072 A CN105913072 A CN 105913072A
Authority
CN
China
Prior art keywords
video
attribute
word
classification
sorted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610202497.4A
Other languages
English (en)
Inventor
张立宁
余婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeCloud Computing Co Ltd
LeTV Holding Beijing Co Ltd
LeTV Cloud Computing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Cloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Cloud Computing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201610202497.4A priority Critical patent/CN105913072A/zh
Priority to PCT/CN2016/089246 priority patent/WO2017166512A1/zh
Publication of CN105913072A publication Critical patent/CN105913072A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种视频分类模型的训练方法以及基于训练好的视频分类模型对视频进行分类的方法。其中,视频分类模型的训练方法,包括获取某领域视频集合中每个视频的文本内容和已有类别标签;对每个视频的文本内容进行分词,得到每个视频的属性词集合;建立贝叶斯模型,将该领域视频集合中每个视频的属性词集合和已有类别标签输入至贝叶斯模型以对所述贝叶斯模型进行训练,得到视频分类模型。对视频进行分类的方法包括对待分类视频的文本内容进行分词,得到待分类视频的属性词集合,将属性词集合中的每个属性词输入视频分类模型,从而确定所述待分类视频在所述类别目录中的类别标签。本公开能够高效、简便和高准确率的实现对视频的分类。

Description

视频分类模型的训练方法和视频分类方法
技术领域
本公开属于互联网技术领域,尤其涉及一种视频分类模型的训练方法和视频分类方法。
背景技术
在大数据的环境下,视频的分类存储对于实现视频的管理以及兴趣推荐具有十分重要的作用。现有技术中,对于一些专业性的类别视频播放网站(例如播放教学视频的教育平台),具有自己的一套视频管理系统,对网站上的视频进行分类存储。但由于类别视频播放网站自身能力有限,不具备长程转码能力,当其想上传一个视频时,需要利用视频服务提供商(例如乐视云平台)提供的长程转码功能生成该视频的ID,再将该ID分发至视频服务提供商的CDN平台上,当其需要播放该视频时,只需要从视频服务提供商的CDN平台上取到该视频的网络地址即可实现播放。由于ID一般由一串无意义的字母、数字构成(每个视频的ID是唯一的),因此对于视频服务提供商来讲,存储于其云平台中的该视频的内容标签仅仅为一串无意义的字母、数字。因此,若视频服务提供商想对其云平台中这种类型的视频进行分类十分困难。
发明内容
本公开的目的是为了实现视频服务提供商(例如乐视云平台)对存储于其所搭建的云平台服务器群集中的视频的准确分类。
为了实现本公开的目的,本公开提供一种视频分类模型的训练方法,包括以下步骤:
获取某领域视频集合中每个视频的文本内容和已有类别标签;
对每个视频的文本内容进行分词,得到每个视频的属性词集合;
建立贝叶斯模型,将该领域视频集合中每个视频的属性词集合和已有类别标签输入至贝叶斯模型以对所述贝叶斯模型进行训练,得到视频分类模型。
进一步,所述的视频分类模型的训练方法,其中,在获取某领域视频集合中每个视频的文本内容和已有类别标签的步骤之后,还包括:
根据所述已有类别标签,建立该领域视频集合的类别目录。
进一步,所述的视频分类模型的训练方法,其中,所述视频分类模型的输入参数为属性词,输出参数为:多个类别概率值;其中,每个类别概率值表示该属性词属于所述类别目录中某个类别的概率。
进一步,所述的视频分类模型的训练方法,其中,所述获取某领域的视频集合中每个视频的文本内容和类别标签的步骤包括:
获取存储于云服务器中的某领域的视频集合中每个视频的网络地址;
根据所述视频的网络地址,通过网页爬取算法获取每个视频的播放网页;
从每个视频播放页网中提取当前视频的文本内容和类别标签。
进一步,所述的视频分类模型的训练方法,其中,所述对每个视频的文本内容进行分词,得到每个视频的属性词集合的步骤包括:
对所述文本内容进行分词,得到分词结果;
根据词性标注算法对所述分词结果中的每个词语进行词性标注,并根据标注结果对所述分词结果中的词语进行筛选,得到一级关键词集合;
根据停用词表,对所述一级关键词集合进行过滤,得到属性词集合。
进一步,所述的视频分类模型的训练方法,其中,所述文本内容包括当前视频的标题和/或内容简介。
进一步,所述的视频分类模型的训练方法,其中,所述,所述贝叶斯模型为朴素贝叶斯模型。
根据本公开的另一个方面,还提供了一种视频分类方法,包括以下步骤:
获取待分类视频的文本内容;
对待分类视频的文本内容进行分词,得到待分类视频的属性词集合;
将待分类视频的属性词集合中的每个属性词输入权利要求1-4任一项所述的视频分类模型,得到待分类视频的每个属性词的类别概率值;
根据所述每个属性词的类别概率值,确定所述待分类视频在所述类别目录中的类别标签。
进一步,所述的视频分类方法,所述得到待分类视频的每个属性词的类别概率值的步骤中,所述每个属性词包括至少一个类别概率值。
进一步,所述的视频分类方法,所述根据所述每个属性词的类别概率值,对待分类视频进行分类的步骤包括以下步骤:
从每个属性词的多个类别概率值中,选取数值最大的一个作为该属性词的最优类别概率值;
对待分类视频的属性词集合中的各个属性词的最优类别概率值进行乘积运算,得到所述待分类视频的类别概率;
根据待分类视频的类别概率,确定所述待分类视频在所述类别目录中的类别标签。
本公开能够高效、简便和高准确率的实现对视频的分类。
附图说明
图1是本公开视频分类模型的训练方法的步骤流程图;
图2是本公开视频分类模型的训练方法中获取视频的文本内容和类别标签的步骤流程图;
图3是本公开视频分类模型的训练方法中对每个视频的文本内容进行分词的步骤流程图;
图4是本公开视频分类方法的步骤流程图;
图5是本公开视频分类方法中根据每个属性词的类别概率值,对待分类视频进行分类的步骤流程图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本公开进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
图1是本公开视频分类模型的训练方法的步骤流程图。
如图1所示,一种视频分类模型的训练方法,包括以下步骤:
步骤S1,获取某领域视频集合中每个视频的文本内容和已有类别标签。
在一些专业性的类别视频播放网站(例如播放教学视频的教育平台),网站上的视频播放页中包括以自然语言编辑的对视频的内容进行描述的文本内容,所述文本内容包括当前视频的标题和/或内容简介。某领域可以是教育、新闻、娱乐等领域。另外,这些专业性的类别视频播放网站为了便于对视频的管理,一般都会建立自己的一套类别目录,其中,所述一套类别目录包括多个类别名称,每个视频都会被划分到相应的类别名称下,并将该类别名称作为该视频的类别标签。本公开中所述的已有类别标签指的视频在专业性的类别视频播放网站中的类别标签。
在获取某领域视频集合中每个视频的文本内容和已有类别标签的步骤之后,还包括:根据所述已有类别标签,建立该领域视频集合的类别目录的步骤。需要说明的是,由于视频服务提供商的云平台(例如乐视云平台)中所存储的某一领域的视频集合中,其中的视频来源不仅仅于一个视频播放网站,可能是来源于海量的视频播放网站,因此,由于每个视频播放网站的已有的类别目录可能不全面,不能覆盖到某领域视频集合中的所有的视频,因此,本公开需要基于已有类别标签,重新建立该领域视频集合的类别目录。
具体的,本公开以教育领域为例,重新建立的教育领域视频集合的类别目录中的类别名称主要包括:学前、小学、小升初、初中、中考、高中、高考、大学、出国留学、公务员、司法、IT、财经金融、国际游学、管理、生活技能、体育、夏令营、兴趣、艺术、语言培训、孕婴辅导、职业技能、其他。
步骤S2,对每个视频的文本内容进行分词,得到每个视频的属性词集合。
本步骤中,可以采用现有技术中的分词算法对每个视频的文本内容进行分词,得到每个视频的属性词集合。其中,每个视频的属性词集合包括至少一个属性词。
步骤S3,建立贝叶斯模型,将该领域视频集合中每个视频的属性词集合和已有类别标签输入至贝叶斯模型以对所述贝叶斯模型进行训练,得到视频分类模型。
所述贝叶斯模型为朴素贝叶斯模型。所述视频分类模型的输入参数为属性词,输出参数为:多个类别概率值。其中,每个类别概率值表示该属性词属于所述类别目录中某个类别的概率。
图2是本公开视频分类模型的训练方法中获取视频的文本内容和类别标签的步骤流程图。
如图2所示,所述获取某领域的视频集合中每个视频的文本内容和类别标签的步骤包括:
步骤S11,获取存储于云服务器中的某领域的视频集合中每个视频的网络地址。
在步骤S1之前,使用云平台服务器群集所提供的长程转码服务的专业性的类别视频播放网站,将其网站上的视频利用视频服务提供商(例如乐视云平台)提供的长程转码功能生成该视频的ID,再将该ID分发至视频服务提供商的CDN平台中的一台或多台服务器(即云服务器),所述云服务器对所述视频进行存储。需要说明的是,由于视频服务提供商通常为大量的视频播放网站提供长程转码的服务,因此视频服务提供商的云服务器中存储有海量的视频、每个视频的ID以及每个视频的网络地址。因此,在步骤S11中,仅仅需要将所述视频的网络地址获取到即可。
步骤S12,根据所述视频的网络地址,通过网页爬取算法获取每个视频的播放网页。
所是述网页爬取算法,指的基于现有技术中的网络爬虫的算法,网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。
步骤S13,从每个视频播放页网中提取当前视频的文本内容和类别标签。
在一些专业性的类别视频播放网站(例如播放教学视频的教育平台),网站上的视频播放页中包括以自然语言编辑的对视频的内容进行描述的文本内容,所述文本内容包括当前视频的标题和/或内容简介。另外,这些专业性的类别视频播放网站为了便于对视频的管理,一般都会建立自己的一套类别目录,其中,所述一套类别目录包括多个类别名称,每个视频都会被划分到相应的类别名称下,并将该类别名称作为该视频的类别标签。本公开中所述的已有类别标签指的视频在专业性的类别视频播放网站中的类别标签。
图3是本公开视频分类模型的训练方法中对每个视频的文本内容进行分词的步骤流程图。
如图3所示,所述步骤S2,对每个视频的文本内容进行分词,得到每个视频的属性词集合的步骤包括:
步骤S21,对所述文本内容进行分词,得到分词结果,根据词性标注算法对所述分词结果中的每个词语进行词性标注,并根据标注结果对所述分词结果中的词语进行筛选,得到一级关键词集合。其中,所述一级关键词集合中包含多个一级关键词。
由于文本内容是以自然语言进行描述的,包括很多词语,其中有些词语可能是不需要的一些词语,需要对文本内容采用预定的算法进行关键字提取,以过滤掉一些不需要的词语。在本步骤中,仅仅是根据分词词性表中词语的词性对所述文本内容进行分词,一方面将词语分割,另一方面过滤掉一些结构词、语气词等词语,如的、呢、啊。另外,在本步骤之前,还包括将分词词性表存储于云服务器中,并时时更新所述分词词性表。
步骤S22,根据停用词表,对所述一级关键词集合进行过滤,得到属性词集合。其中,所述属性词集合中包含多个属性词。
在本步骤之前,还包括将停用词表存储于云服务器中,并时时更新所述停用词表。其中,停用词表采用现有技术中的停用词表。对所述一级关键词集合进行过滤指的是将一级关键词集合中的停用词过滤掉。
图4是本公开视频分类方法的步骤流程图。
如图4所示,一种视频分类方法,包括以下步骤:
步骤S01,获取待分类视频的文本内容。
获取待分类视频即一个新的视频,该视频是新上传至云服务器中的视频。
步骤S02,对待分类视频的文本内容进行分词,得到待分类视频的属性词集合。
步骤S03,将待分类视频的属性词集合中的每个属性词输入权利要求1-4任一项所述的视频分类模型,得到待分类视频的每个属性词的类别概率值。
根据所述每个属性词的类别概率值,确定所述待分类视频在所述类别目录中的类别标签。所述得到待分类视频的每个属性词的类别概率值的步骤中,所述每个属性词包括至少一个类别概率值。
图5是本公开视频分类方法中根据每个属性词的类别概率值,对待分类视频进行分类的步骤流程图。
如图5所示,所述根据所述每个属性词的类别概率值,对待分类视频进行分类的步骤包括以下步骤:
步骤S031,从每个属性词的多个类别概率值中,选取数值最大的一个作为该属性词的最优类别概率值。
步骤S032,对待分类视频的属性词集合中的各个属性词的最优类别概率值进行乘积运算,得到所述待分类视频的类别概率。
步骤S033,根据待分类视频的类别概率,确定所述待分类视频在所述类别目录中的类别标签。
应当理解的是,本公开的上述具体实施方式仅仅用于示例性说明或解释本公开的原理,而不构成对本公开的限制。因此,在不偏离本公开的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。此外,本公开所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (10)

1.一种视频分类模型的训练方法,包括:
获取某领域视频集合中每个视频的文本内容和已有类别标签;
对每个视频的文本内容进行分词,得到每个视频的属性词集合;
建立贝叶斯模型,将该领域视频集合中每个视频的属性词集合和已有类别标签输入至贝叶斯模型以对所述贝叶斯模型进行训练,得到视频分类模型。
2.根据权利要求1所述的方法,其中,在获取某领域视频集合中每个视频的文本内容和已有类别标签之后,还包括:
根据所述已有类别标签,建立该领域视频集合的类别目录。
3.根据权利要求2所述的方法,其中,所述视频分类模型的输入参数为属性词,输出参数为:多个类别概率值;其中,每个类别概率值表示该属性词属于所述类别目录中某个类别的概率。
4.根据权利要求1-3任一项所述的方法,其中,所述获取某领域的视频集合中每个视频的文本内容和类别标签包括:
获取存储于云服务器中的某领域的视频集合中每个视频的网络地址;
根据所述视频的网络地址,获取每个视频的播放网页;
从每个视频播放页网中提取当前视频的文本内容和类别标签。
5.根据权利要求1-3任一项所述的方法,其中,所述对每个视频的文本内容进行分词,得到每个视频的属性词集合包括:
对所述文本内容进行分词,得到分词结果;
根据词性标注算法对所述分词结果中的每个词语进行词性标注,并根据标注结果对所述分词结果中的词语进行筛选,得到一级关键词集合;
根据停用词表,对所述一级关键词集合进行过滤,得到属性词集合。
6.根据权利要求1-3任一项所述的方法,其中,所述文本内容包括当前视频的标题和/或内容简介。
7.根据权利要求1-3任一项所述的方法,其中,所述,所述贝叶斯模型为朴素贝叶斯模型。
8.一种视频分类方法,包括:
获取待分类视频的文本内容;
对待分类视频的文本内容进行分词,得到待分类视频的属性词集合;
将待分类视频的属性词集合中的每个属性词输入权利要求1-4任一项所述的视频分类模型,得到待分类视频的每个属性词的类别概率值;
根据所述每个属性词的类别概率值,确定所述待分类视频在所述类别目录中的类别标签。
9.根据权利要求8所述的视频分类方法,其中,所述每个属性词包括至少一个类别概率值。
10.根据权利要求9所述的视频分类方法,其中,所述根据所述每个属性词的类别概率值,对待分类视频进行分类包括:
从每个属性词的多个类别概率值中,选取数值最大的一个作为该属性词的最优类别概率值;
对待分类视频的属性词集合中的各个属性词的最优类别概率值进行乘积运算,得到所述待分类视频的类别概率;
根据待分类视频的类别概率,确定所述待分类视频在所述类别目录中的类别标签。
CN201610202497.4A 2016-03-31 2016-03-31 视频分类模型的训练方法和视频分类方法 Pending CN105913072A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610202497.4A CN105913072A (zh) 2016-03-31 2016-03-31 视频分类模型的训练方法和视频分类方法
PCT/CN2016/089246 WO2017166512A1 (zh) 2016-03-31 2016-07-07 视频分类模型的训练方法和视频分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610202497.4A CN105913072A (zh) 2016-03-31 2016-03-31 视频分类模型的训练方法和视频分类方法

Publications (1)

Publication Number Publication Date
CN105913072A true CN105913072A (zh) 2016-08-31

Family

ID=56745144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610202497.4A Pending CN105913072A (zh) 2016-03-31 2016-03-31 视频分类模型的训练方法和视频分类方法

Country Status (2)

Country Link
CN (1) CN105913072A (zh)
WO (1) WO2017166512A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194419A (zh) * 2017-05-10 2017-09-22 百度在线网络技术(北京)有限公司 视频分类方法及装置、计算机设备与可读介质
CN108563722A (zh) * 2018-04-03 2018-09-21 有米科技股份有限公司 文本信息的行业分类方法、系统、计算机设备和存储介质
CN108804598A (zh) * 2018-05-29 2018-11-13 王妃 云图分布式视频分类方法
CN108932252A (zh) * 2017-05-25 2018-12-04 合网络技术(北京)有限公司 视频聚合方法及装置
CN108965920A (zh) * 2018-08-08 2018-12-07 北京未来媒体科技股份有限公司 一种视频内容拆条方法及装置
CN108959323A (zh) * 2017-05-25 2018-12-07 腾讯科技(深圳)有限公司 视频分类方法和装置
CN110110143A (zh) * 2019-04-15 2019-08-09 厦门网宿有限公司 一种视频分类方法及装置
WO2020000876A1 (zh) * 2018-06-27 2020-01-02 北京字节跳动网络技术有限公司 用于生成模型的方法和装置
CN110851607A (zh) * 2019-11-19 2020-02-28 中国银行股份有限公司 资讯分类模型的训练方法及装置
CN111104545A (zh) * 2018-10-26 2020-05-05 阿里巴巴集团控股有限公司 背景音乐的配置方法、设备、客户端装置及电子设备
CN111131899A (zh) * 2018-10-31 2020-05-08 中国移动通信集团浙江有限公司 一种多站点的视频播放记录整合方法和装置
CN111935499A (zh) * 2020-08-17 2020-11-13 深圳市前海多晟科技股份有限公司 一种基于分布式存储技术的超高清视频网关系统
CN113536778A (zh) * 2020-04-14 2021-10-22 北京沃东天骏信息技术有限公司 标题的生成方法、装置和计算机可读存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749299A (zh) * 2019-10-31 2021-05-04 北京国双科技有限公司 确定视频类型的方法、装置、电子设备及可读存储介质
CN111488489B (zh) * 2020-03-26 2023-10-24 腾讯科技(深圳)有限公司 视频文件的分类方法、装置、介质及电子设备
CN111753790B (zh) * 2020-07-01 2023-12-12 武汉楚精灵医疗科技有限公司 一种基于随机森林算法的视频分类方法
CN111950360B (zh) * 2020-07-06 2023-08-18 北京奇艺世纪科技有限公司 一种识别侵权用户的方法及装置
CN111666452A (zh) * 2020-07-09 2020-09-15 腾讯科技(深圳)有限公司 用于对视频进行聚类的方法和装置
CN112270192B (zh) * 2020-11-23 2023-12-19 科大国创云网科技有限公司 一种基于词性和停用词过滤的语义识别方法及系统
CN115706837A (zh) * 2021-08-13 2023-02-17 云丁网络技术(北京)有限公司 安防信息处理方法、装置及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201835A (zh) * 2007-12-21 2008-06-18 四川大学 应急联动警情自动分类系统
CN104199933A (zh) * 2014-09-04 2014-12-10 华中科技大学 一种多模态信息融合的足球视频事件检测与语义标注方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060173916A1 (en) * 2004-12-22 2006-08-03 Verbeck Sibley Timothy J R Method and system for automatically generating a personalized sequence of rich media
CN102184262A (zh) * 2011-06-15 2011-09-14 悠易互通(北京)广告有限公司 基于web的文本分类挖掘系统及方法
CN104219575B (zh) * 2013-05-29 2020-05-12 上海连尚网络科技有限公司 相关视频推荐方法及系统
CN104834640A (zh) * 2014-02-10 2015-08-12 腾讯科技(深圳)有限公司 网页的识别方法及装置
CN103955703A (zh) * 2014-04-25 2014-07-30 杭州电子科技大学 一种基于朴素贝叶斯的医疗影像疾病分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201835A (zh) * 2007-12-21 2008-06-18 四川大学 应急联动警情自动分类系统
CN104199933A (zh) * 2014-09-04 2014-12-10 华中科技大学 一种多模态信息融合的足球视频事件检测与语义标注方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHUNNENG HUANG ET AL: "text-based video content classification for online video-sharing sites", 《JOURNAL OF AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY》 *
艾丽丽: "基于文本挖掘的视频资源分类研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194419A (zh) * 2017-05-10 2017-09-22 百度在线网络技术(北京)有限公司 视频分类方法及装置、计算机设备与可读介质
CN108932252A (zh) * 2017-05-25 2018-12-04 合网络技术(北京)有限公司 视频聚合方法及装置
CN108959323A (zh) * 2017-05-25 2018-12-07 腾讯科技(深圳)有限公司 视频分类方法和装置
CN108959323B (zh) * 2017-05-25 2021-12-07 腾讯科技(深圳)有限公司 视频分类方法和装置
CN108563722A (zh) * 2018-04-03 2018-09-21 有米科技股份有限公司 文本信息的行业分类方法、系统、计算机设备和存储介质
CN108804598A (zh) * 2018-05-29 2018-11-13 王妃 云图分布式视频分类方法
WO2020000876A1 (zh) * 2018-06-27 2020-01-02 北京字节跳动网络技术有限公司 用于生成模型的方法和装置
CN108965920A (zh) * 2018-08-08 2018-12-07 北京未来媒体科技股份有限公司 一种视频内容拆条方法及装置
CN111104545A (zh) * 2018-10-26 2020-05-05 阿里巴巴集团控股有限公司 背景音乐的配置方法、设备、客户端装置及电子设备
CN111131899A (zh) * 2018-10-31 2020-05-08 中国移动通信集团浙江有限公司 一种多站点的视频播放记录整合方法和装置
CN110110143B (zh) * 2019-04-15 2021-08-03 厦门网宿有限公司 一种视频分类方法及装置
CN110110143A (zh) * 2019-04-15 2019-08-09 厦门网宿有限公司 一种视频分类方法及装置
CN110851607A (zh) * 2019-11-19 2020-02-28 中国银行股份有限公司 资讯分类模型的训练方法及装置
CN113536778A (zh) * 2020-04-14 2021-10-22 北京沃东天骏信息技术有限公司 标题的生成方法、装置和计算机可读存储介质
CN111935499A (zh) * 2020-08-17 2020-11-13 深圳市前海多晟科技股份有限公司 一种基于分布式存储技术的超高清视频网关系统

Also Published As

Publication number Publication date
WO2017166512A1 (zh) 2017-10-05

Similar Documents

Publication Publication Date Title
CN105913072A (zh) 视频分类模型的训练方法和视频分类方法
CN105893571A (zh) 一种视频内容标签的建立方法和系统
CN105612514B (zh) 通过将语境线索与图像关联进行图像分类的系统和方法
CN103324760B (zh) 使用解说词文档自动生成营养健康教育视频的方法及系统
CN104484431B (zh) 一种基于领域本体的多源个性化新闻网页推荐方法
CN105389329B (zh) 一种基于群体评论的开源软件推荐方法
Schmiedeke et al. Blip10000: A social video dataset containing spug content for tagging and retrieval
CN108304493B (zh) 一种基于知识图谱的上位词挖掘方法及装置
CN106354860A (zh) 基于标签集的信息资源自动贴标签并自动推送的方法
CN102945246B (zh) 网络信息数据的处理方法及装置
De Lusenet Tending the garden or harvesting the fields: Digital preservation and the UNESCO charter on the preservation of the digital heritage
CN106528676B (zh) 基于人工智能的实体语义检索处理方法及装置
CN106294358A (zh) 一种信息的检索方法及系统
CN101404036A (zh) PowerPoint电子演示文稿的关键词抽取方法
CN102682120A (zh) 一种网络评论精华文章的获取方法、装置和系统
Bosworth The bad environmentalism of ‘nature is healing’memes
CN105989058A (zh) 一种汉语新闻摘要生成系统及方法
CN109033166A (zh) 一种人物属性抽取训练数据集构建方法
CN106407473A (zh) 一种基于事件相似性建模的获取事件脉络的方法及其系统
Rosanensi et al. Analysis sentiment and tourist response to rinjani mountain tour based on comments from photo upload in instagram
CN110851622A (zh) 文本生成方法和装置
CN103514289A (zh) 一种兴趣本体库构建方法及装置
CN106485525A (zh) 信息处理方法及装置
CN110110218A (zh) 一种身份关联方法及终端
Fiol-Roig et al. Data mining techniques for web page classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160831