CN111563488A - 一种视频主题内容识别方法、系统及存储介质 - Google Patents
一种视频主题内容识别方法、系统及存储介质 Download PDFInfo
- Publication number
- CN111563488A CN111563488A CN202010672053.3A CN202010672053A CN111563488A CN 111563488 A CN111563488 A CN 111563488A CN 202010672053 A CN202010672053 A CN 202010672053A CN 111563488 A CN111563488 A CN 111563488A
- Authority
- CN
- China
- Prior art keywords
- video
- frame
- data result
- neural network
- pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本发明公开了一种视频主题内容识别方法、系统及存储介质,该方法通过对待识别的视频进行预处理,提取到若干个关键帧以及分割生成若干连续帧片段;然后,将提取到的关键帧图片、由连续帧片段的全部帧图片拼接而成的图片、由连续帧片段的多个帧图片构成的批量图片分别输入至预先训练好的三个神经网络模型中,并相应地得到第一数据结果、第二数据结果和第三数据结果;最后,将第一数据结果、第二数据结果和第三数据结果取交集后,输入至预先训练好的分类模型中,得到该视频的分类结果。因此,本发明通过神经网络模型分别对关键帧图片、连续帧的拼接图片与批量图片进行识别,更全面地获取视频内容的特征,从而保证视频内容识别的准确度。
Description
技术领域
本发明涉及视频处理技术和人工智能技术,尤其涉及一种视频主题内容识别方法、系统及存储介质。
背景技术
随着机器学习的不断发展,神经网络对于图像识别的精度越来越高,同时随着短视频兴起,海量视频数据需要进行内容识别与分类,但是由于视频中存在遮挡,运动模糊,光照变化多样性,形态变化多样性等问题,仅仅将视频转换为多张图片进行识别是无法得到很好的效果,且准确度不高,因此,有必要设计一种基于机器学习的视频内容识别方案。
发明内容
鉴于以上所述现有技术的不足,本发明的目的在于:提供一种基于机器学习的视频内容识别方案,能够提高视频内容识别的准确度。
为实现上述发明目的,本发明提供以下技术方案:
一种视频主题内容识别方法,其包括以下步骤:
对待识别的视频进行预处理,其中,所述预处理包括提取关键帧和连续帧片段切割;
将通过所述预处理而提取到的若干个关键帧图片输入至预先训练好的关键帧神经网络模型中,得到第一数据结果;
将每个连续帧片段的全部帧图片拼接而成的图片输入至预先训练好的连续帧拼接图片神经网络模型,得到第二数据结果;
将每个连续帧片段的多个帧图片构成的批量图片输入至预先连续帧批量图片神经网络模型,得到第三数据结果;
将所述第一数据结果、所述第二数据结果和所述第三数据结果取交集后,输入至预先训练好的分类模型中,得到该视频的分类结果。
根据一种具体的实施方式,本发明的视频主题内容识别方法中,所述提取关键帧基于相邻帧之间的差分的平均强度,确定关键帧。
进一步地,所述关键帧神经网络模型采用VGG网络结构。
根据一种具体的实施方式,本发明的视频主题内容识别方法中,对连续帧片段的帧图片拼接的方式为:沿图像的横向或竖向方向连续拼接。
进一步地,所述连续帧拼接图片神经网络模型采用VGG网络结构。
根据一种具体的实施方式,本发明的视频主题内容识别方法中,所述连续帧批量图片神经网络模型采用3DCNN网络结构。
根据一种具体的实施方式,本发明的视频主题内容识别方法中,所述分类模型包括隐含层和softmax层。
根据一种具体的实施方式,本发明的视频主题内容识别方法中,所述关键帧神经网络模型、所述连续帧拼接图片神经网络模型和所述连续帧批量图片神经网络模型在训练时均采用LSTM算法对相似的输出结果进行融合。
本发明在具体实施的一方面,还提供一种视频主题内容识别系统,其包括:
视频预处理模块,用于对待识别的视频进行预处理;其中,所述预处理包括提取关键帧和连续帧片段切割;
关键帧神经网络模块,用于根据输入的若干个关键帧图片,得到第一数据结果;
连续帧拼接图片神经网络模块,用于根据输入的由每个连续帧片段的全部帧图片拼接而成的图片,得到第二数据结果;
连续帧批量图片神经网络模块,用于根据输入的由每个连续帧片段的多个帧图片构成的批量图片,得到第三数据结果;
分类模块,用于根据输入的由所述第一数据结果、所述第二数据结果和所述第三数据结果取交集后的数据结果,得到该视频的分类结果。
本发明在具体实施的一方面,还提供一种可读存储介质,其上存储有一个或多个程序,其特征在于,该一个或多个程序被一个或多个处理器执行时实现本发明的视频主题内容识别方法。
与现有技术相比,本发明的有益效果:
本发明的视频主题内容识别方法,通过对待识别的视频进行预处理,提取到若干个关键帧以及分割生成若干连续帧片段;然后,将提取到的关键帧图片、由连续帧片段的全部帧图片拼接而成的图片、由连续帧片段的多个帧图片构成的批量图片分别输入至预先训练好的三个神经网络模型中,并相应地得到第一数据结果、第二数据结果和第三数据结果;最后,将第一数据结果、第二数据结果和第三数据结果取交集后,输入至预先训练好的分类模型中,得到该视频的分类结果。因此,本发明通过神经网络模型分别对关键帧图片、连续帧的拼接图片与批量图片进行识别,以获得视频中更全面的特征,从而保证视频内容识别的准确度。
附图说明
图1为本发明视频主题内容识别方法的流程图;
图2为VGG网络结构的示意图;
图3为本发明视频主题内容识别系统的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
如图1所示,一种视频主题内容识别方法,其包括以下步骤:
对待识别的视频进行预处理,其中,预处理包括提取关键帧和连续帧片段切割。具体的,提取关键帧的方式是基于相邻帧之间的差分的平均强度。一旦视频中的某一帧与前一帧画面内容产生了很大变化,即该帧与前一帧之间的差分的平均强度大于设定阈值,则认为该帧它是关键帧,并将其提取出来。而连续帧片段切割的方式是基于片段包含的帧数来确定的,例如,可将待识别视频分割为分别包含7帧的若干个连续帧片段,也可将待识别视频分割为分别包含15帧的若干个连续帧片段。如此,经过预处理后,即可得到一定数量的关键帧图片以及连续帧片段。
接着,将提取到若干个关键帧图片输入至预先训练好的关键帧神经网络模型中,得到第一数据结果G1。通常而言,需要将提取出来的关键帧图片统一处理为一定规格图片格式,作为输入,本发明在实施时,图片规格被统一处理为224*224,关键帧神经网络模型采用如图2所示的VGG网络结构。
相应地,将待识别视频分割为分别包含7帧的若干个连续帧片段后,然后将每个连续帧片段的7张帧图片的规格统一处理为224*224,然后,沿图片像素行的方向,将7张规格224*224的帧图片拼接为一张规格224*1568的图片,并将拼接好的图片输入至预先训练好的连续帧拼接图片神经网络模型,得到第二数据结果G2。本发明在实施时,连续帧拼接图片神经网络模型采用VGG网络结构。
相应地,将待识别视频分割为分别包含15帧的若干个连续帧片段后,将每个连续帧片段其中的7张224*224的帧图片构成的批量图片,并输入至预先训练好的连续帧批量图片神经网络模型,得到第三数据结果G3;本发明在实施时,连续帧拼接图片神经网络模型采用3DCNN网络结构。
最后,将第一数据结果G1、第二数据结果G2和第三数据结果G3取交集后,输入至预先训练好的分类模型中,得到该视频的分类结果。本发明在实施时,分类模型采用VGG网络结构包括一个隐含层和一个softmax层。
本发明的视频主题内容识别方法中,需要先完成关键帧神经网络模型、连续帧拼接图片神经网络模型和连续帧批量图片神经网络模型的训练工作。
首先,根据实际业务场景,整合定义了10个分类,分别是:美食,风景,搞笑,美女,儿童,游戏,植物,建筑,动物,车辆。然后数据集的准备:对于每个分类在业务场景中选取2000个视频作为标注样本,共20000个,其中每个类别抽取1500个视频做训练集,训练集共15000个视频;剩余每个类别500个视频做测试集,测试集一共5000个视频。
然后,分别建立关键帧神经网络模型、连续帧拼接图片神经网络模型和连续帧批量图片神经网络模型,并分别进行训练。
1、关键帧神经网络的训练:
A.对训练集中的视频进行关键帧提取。
B.将提取出来的关键帧图片统一处理为大小为224*224的图片格式,作为输入。
C.采用经典的VGG网络结构来进行样本训练,提取图片中的特征。
D.将上一层的输出经由Long Short-Term Memory(以下简称LSTM)算法将相似的输出结果融合,最后得到第一数据结果G1。
2、连续帧拼接图片神经网络的训练:
A.将样本视频以连续的每7帧为一个片段进行切割。
B.将切割出的片段以每1帧为准处理成7张224*224大小的图片,然后拼接成大小为224*1568的图片矩阵作为输入。
C.采用经典的VGG网络结构来进行样本训练,提取图片中的特征。
D.将上一层的输出经由Long Short-Term Memory(以下简称LSTM)算法将相似的输出结果融合,最后得到第二数据结果G2。
3、连续帧批量图片神经网络的训练:
A.将本视频连续的每15帧为一个片段进行切割,得到一个批量的输入N,每个输入N由7张图片构成,将图片处理为224*224大小的图片。
B.每一组图片输入N,采用3DCNN的网络结构提取连续图片中的特征信息,作为输出M。
C.将上一层的输出M经由Long Short-Term Memory(以下简称LSTM)算法将相似的输出结果融合,最后得到第三数据结果G3。
4、将G1,G2,G3的结果取交集后作为统一的输出,经过一个隐藏层和softmax层完成最后的分类训练。
5、经过测试,最后的准确率达到满足预期目标。
如图3所示,本发明在具体实施的一方面,还提供一种视频主题内容识别系统,其包括:
视频预处理模块,用于对待识别的视频进行预处理;其中,所述预处理包括提取关键帧和连续帧片段切割;
关键帧神经网络模块,用于根据输入的若干个关键帧图片,得到第一数据结果;
连续帧拼接图片神经网络模块,用于根据输入的由每个连续帧片段的全部帧图片拼接而成的图片,得到第二数据结果;
连续帧批量图片神经网络模块,用于根据输入的由每个连续帧片段的多个帧图片构成的批量图片,得到第三数据结果;
分类模块,用于根据输入的由所述第一数据结果、所述第二数据结果和所述第三数据结果取交集后的数据结果,得到该视频的分类结果。
本发明在具体实施的一方面,还提供一种可读存储介质,其上存储有一个或多个程序,其特征在于,该一个或多个程序被一个或多个处理器执行时实现本发明的视频主题内容识别方法。
应该理解到,本发明所揭露的系统,可通过其它的方式实现。例如所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,模块之间的通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的存储介质。
Claims (10)
1.一种视频主题内容识别方法,其特征在于,包括以下步骤:
对待识别的视频进行预处理,其中,所述预处理包括提取关键帧和连续帧片段切割;
将通过所述预处理而提取到的若干个关键帧图片输入至预先训练好的关键帧神经网络模型中,得到第一数据结果;
将每个连续帧片段的全部帧图片拼接而成的图片输入至预先训练好的连续帧拼接图片神经网络模型,得到第二数据结果;
将每个连续帧片段的多个帧图片构成的批量图片输入至预先训练好的连续帧批量图片神经网络模型,得到第三数据结果;
将所述第一数据结果、所述第二数据结果和所述第三数据结果取交集后,输入至预先训练好的分类模型中,得到该视频的分类结果。
2.如权利要求1所述的视频主题内容识别方法,其特征在于,所述提取关键帧基于相邻帧之间的差分的平均强度,确定关键帧。
3.如权利要求2所述的视频主题内容识别方法,其特征在于,所述关键帧神经网络模型采用VGG网络结构。
4.如权利要求1所述的视频主题内容识别方法,其特征在于,对连续帧片段的帧图片拼接的方式为:沿图像的横向或竖向方向连续拼接。
5.如权利要求4所述的视频主题内容识别方法,其特征在于,所述连续帧拼接图片神经网络模型采用VGG网络结构。
6.如权利要求1所述的视频主题内容识别方法,其特征在于,所述连续帧批量图片神经网络模型采用3DCNN网络结构。
7.如权利要求1所述的视频主题内容识别方法,其特征在于,所述分类模型包括隐含层和softmax层。
8.如权利要求1~7任一项所述的视频主题内容识别方法,其特征在于,所述关键帧神经网络模型、所述连续帧拼接图片神经网络模型和所述连续帧批量图片神经网络模型在训练时均采用LSTM算法对相似的输出结果进行融合。
9.一种视频主题内容识别系统,其特征在于,包括:
视频预处理模块,用于对待识别的视频进行预处理;其中,所述预处理包括提取关键帧和连续帧片段切割;
关键帧神经网络模块,用于根据输入的若干个关键帧图片,得到第一数据结果;
连续帧拼接图片神经网络模块,用于根据输入的由每个连续帧片段的全部帧图片拼接而成的图片,得到第二数据结果;
连续帧批量图片神经网络模块,用于根据输入的由每个连续帧片段的多个帧图片构成的批量图片,得到第三数据结果;
分类模块,用于根据输入的由所述第一数据结果、所述第二数据结果和所述第三数据结果取交集后的数据结果,得到该视频的分类结果。
10.一种可读存储介质,其上存储有一个或多个程序,其特征在于,该一个或多个程序被一个或多个处理器执行时实现权利要求1~8任一项所述的视频主题内容识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010672053.3A CN111563488A (zh) | 2020-07-14 | 2020-07-14 | 一种视频主题内容识别方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010672053.3A CN111563488A (zh) | 2020-07-14 | 2020-07-14 | 一种视频主题内容识别方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111563488A true CN111563488A (zh) | 2020-08-21 |
Family
ID=72072850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010672053.3A Pending CN111563488A (zh) | 2020-07-14 | 2020-07-14 | 一种视频主题内容识别方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111563488A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599907A (zh) * | 2016-11-29 | 2017-04-26 | 北京航空航天大学 | 多特征融合的动态场景分类方法与装置 |
CN108319905A (zh) * | 2018-01-25 | 2018-07-24 | 南京邮电大学 | 一种基于长时程深度时空网络的行为识别方法 |
CN108615027A (zh) * | 2018-05-11 | 2018-10-02 | 常州大学 | 一种基于长短期记忆-加权神经网络对视频人群计数的方法 |
CN109376603A (zh) * | 2018-09-25 | 2019-02-22 | 北京周同科技有限公司 | 一种视频识别方法、装置、计算机设备及存储介质 |
CN109598891A (zh) * | 2018-12-24 | 2019-04-09 | 中南民族大学 | 一种利用深度学习分类模型实现烟雾检测的方法和系统 |
CN109635790A (zh) * | 2019-01-28 | 2019-04-16 | 杭州电子科技大学 | 一种基于3d卷积的行人异常行为识别方法 |
CN109886227A (zh) * | 2019-02-27 | 2019-06-14 | 哈尔滨工业大学 | 基于多通道卷积神经网络的室内火灾视频识别方法 |
CN110837842A (zh) * | 2019-09-12 | 2020-02-25 | 腾讯科技(深圳)有限公司 | 一种视频质量评估的方法、模型训练的方法及装置 |
CN110942009A (zh) * | 2019-11-22 | 2020-03-31 | 南京甄视智能科技有限公司 | 基于时空混合卷积网络的跌倒检测方法与系统 |
CN111125405A (zh) * | 2019-12-19 | 2020-05-08 | 国网冀北电力有限公司信息通信分公司 | 电力监控图像异常检测方法和装置、电子设备及存储介质 |
CN111274995A (zh) * | 2020-02-13 | 2020-06-12 | 腾讯科技(深圳)有限公司 | 视频分类方法、装置、设备和计算机可读存储介质 |
-
2020
- 2020-07-14 CN CN202010672053.3A patent/CN111563488A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599907A (zh) * | 2016-11-29 | 2017-04-26 | 北京航空航天大学 | 多特征融合的动态场景分类方法与装置 |
CN108319905A (zh) * | 2018-01-25 | 2018-07-24 | 南京邮电大学 | 一种基于长时程深度时空网络的行为识别方法 |
CN108615027A (zh) * | 2018-05-11 | 2018-10-02 | 常州大学 | 一种基于长短期记忆-加权神经网络对视频人群计数的方法 |
CN109376603A (zh) * | 2018-09-25 | 2019-02-22 | 北京周同科技有限公司 | 一种视频识别方法、装置、计算机设备及存储介质 |
CN109598891A (zh) * | 2018-12-24 | 2019-04-09 | 中南民族大学 | 一种利用深度学习分类模型实现烟雾检测的方法和系统 |
CN109635790A (zh) * | 2019-01-28 | 2019-04-16 | 杭州电子科技大学 | 一种基于3d卷积的行人异常行为识别方法 |
CN109886227A (zh) * | 2019-02-27 | 2019-06-14 | 哈尔滨工业大学 | 基于多通道卷积神经网络的室内火灾视频识别方法 |
CN110837842A (zh) * | 2019-09-12 | 2020-02-25 | 腾讯科技(深圳)有限公司 | 一种视频质量评估的方法、模型训练的方法及装置 |
CN110942009A (zh) * | 2019-11-22 | 2020-03-31 | 南京甄视智能科技有限公司 | 基于时空混合卷积网络的跌倒检测方法与系统 |
CN111125405A (zh) * | 2019-12-19 | 2020-05-08 | 国网冀北电力有限公司信息通信分公司 | 电力监控图像异常检测方法和装置、电子设备及存储介质 |
CN111274995A (zh) * | 2020-02-13 | 2020-06-12 | 腾讯科技(深圳)有限公司 | 视频分类方法、装置、设备和计算机可读存储介质 |
Non-Patent Citations (6)
Title |
---|
NGUYEN NGOC HOANG等: "A Real-time Multimodal Hand Gesture Recognition via 3D Convolutional Neural Network and Key Frame Extraction", 《MLMI2018》 * |
VALENTIN VIELZEUF等: "Temporal Multimodal fusion for video emotion classification in the wild", 《ARXIV》 * |
YANFENG GU等: "Deep feature extraction and motion representation for satellite video scene classification", 《SCIENCE CHINA》 * |
张聪聪等: "基于关键帧的双流卷积网络的人体动作识别方法", 《南京信息工程大学学报》 * |
王瑾薇: "基于神经网络的中国手语词手势检测与手语识别方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
胡智光等: "图像拼接技术在大米检测系统中的应用", 《湖南工程学院学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110119757B (zh) | 模型训练方法、视频类别检测方法、装置、电子设备和计算机可读介质 | |
CN110020437B (zh) | 一种视频和弹幕相结合的情感分析及可视化方法 | |
CN107239801B (zh) | 视频属性表示学习方法及视频文字描述自动生成方法 | |
CN110188829B (zh) | 神经网络的训练方法、目标识别的方法及相关产品 | |
CN111582241A (zh) | 视频字幕识别方法、装置、设备及存储介质 | |
CN112215171B (zh) | 目标检测方法、装置、设备及计算机可读存储介质 | |
CN111310041B (zh) | 图文发布的方法、模型的训练方法、装置及存储介质 | |
CN110532911B (zh) | 协方差度量驱动小样本gif短视频情感识别方法及系统 | |
CN111738169B (zh) | 一种基于端对端网络模型的手写公式识别方法 | |
CN113393370A (zh) | 中国书法文字图像风格迁移的方法、系统、智能终端 | |
CN112668638A (zh) | 一种图像美学质量评估和语义识别联合分类方法及系统 | |
CN111432206A (zh) | 基于人工智能的视频清晰度处理方法、装置及电子设备 | |
CN115393599A (zh) | 构建图像语义分割模型和图像处理的方法、装置、电子设备及介质 | |
CN113411550B (zh) | 视频上色方法、装置、设备及存储介质 | |
CN113822127A (zh) | 视频处理方法、装置、视频处理设备及存储介质 | |
CN112560668A (zh) | 一种基于场景先验知识的人体行为识别方法 | |
WO2023185074A1 (zh) | 一种基于互补时空信息建模的群体行为识别方法 | |
CN111242114A (zh) | 文字识别方法及装置 | |
CN111563488A (zh) | 一种视频主题内容识别方法、系统及存储介质 | |
CN115661904A (zh) | 数据标注和域适应模型训练方法、装置、设备及介质 | |
CN117009577A (zh) | 一种视频数据处理方法、装置、设备及可读存储介质 | |
CN112312205B (zh) | 一种视频处理方法、装置、电子设备和计算机存储介质 | |
CN114743170A (zh) | 一种基于ai算法的自动驾驶场景标注方法 | |
CN114064968A (zh) | 一种新闻字幕摘要生成方法和系统 | |
CN113688915A (zh) | 一种面向内容安全的困难样本挖掘方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200821 |
|
RJ01 | Rejection of invention patent application after publication |