CN112651356A - 视频难度定级模型获取方法及视频难度定级方法 - Google Patents
视频难度定级模型获取方法及视频难度定级方法 Download PDFInfo
- Publication number
- CN112651356A CN112651356A CN202011611951.4A CN202011611951A CN112651356A CN 112651356 A CN112651356 A CN 112651356A CN 202011611951 A CN202011611951 A CN 202011611951A CN 112651356 A CN112651356 A CN 112651356A
- Authority
- CN
- China
- Prior art keywords
- video
- difficulty
- feature
- model
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000000605 extraction Methods 0.000 claims abstract description 49
- 238000010187 selection method Methods 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 7
- 238000003745 diagnosis Methods 0.000 claims description 13
- 238000007477 logistic regression Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了视频难度定级模型获取方法及视频难度定级方法,上述方法包括获取用于训练视频难度定级模型的视频样本集,所述视频样本集中每个视频样本的难度级别均基于欧洲语言共同标准标定;按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果;根据所述视频特征选择结果,对所述视频样本集中各个视频样本进行特征提取;根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型。本发明可以自动且精准的为视频难度进行定级,从而排除了人工定级的主观不稳定性,使得定级的结果稳定可靠。
Description
技术领域
本公开涉及视频处理技术领域,尤其涉及视频难度定级模型获取方法及视频难度定级方法。
背景技术
目前在视频难度定级方面,鲜有先行者。但是相关技术在文本难度定级方面有不少方案,如J.Peter Kincaid和他的团队开发的Flesch-Kincaid readability公式(弗莱施·金凯德可读性公式),来衡量技术手册的文本难度;Robert Gunning为了让大众读者能够看到难度适合的内容开发了Gunning Fog指数(迷雾指数)。G.Harry McLaughlin为了得到比Gunning Fox指数更为精确的结果,开发了SMOG grade(烟雾等级)阅读难度测量工具。Meri Coleman和T.L.Liau一起合作开发了Coleman-Liau指数(科尔曼·利亚乌指数)来测量文本难度。ARI指数(自动阅读难度指数)则是被设计用于实时监控打字机打出的文本难度。另外还有被广泛采用的蓝思分级阅读指数。
可见,相关技术在文本难度定级领域有所建树,然而与阅读不同,看视频的过程是听的过程,定级难度远大于阅读,这导致相关技术难以对于视频难度进行定级,并且文本难度定级尚没有采用统一的语言体系标准,比如欧洲语言教学与评估框架性共同标准CEFR,不具有普适性,视频难度定级也显然存在同样缺陷。
发明内容
为了至少相关技术中难以对于视频难度进行定级的技术问题,本公开实施例提供视频难度定级模型获取方法及视频难度定级方法。
一方面,本公开提供了一种视频难度定级模型获取方法,所述方法包括:
获取用于训练视频难度定级模型的视频样本集,所述视频样本集中每个视频样本的难度级别均基于欧洲语言共同标准标定;
按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果;
根据所述视频特征选择结果,对所述视频样本集中各个视频样本进行特征提取;
根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型。
另一方面,本公开提供一种视频难度定级方法,所述方法包括:
获取待定级的视频;
根据视频难度定级模型对所述待定级的视频进行特征提取,得到特征提取结果;
将所述特征提取结果输入所述视频难度定级模型,将所述视频难度定级模型输出的最大的预测值所对应的难度级别,作为所述待定级的视频的难度级别;
其中,所述视频难度定级模型通过上述的视频难度定级模型获取方法得到。
另一方面,本公开提供一种视频难度定级模型获取装置,所述装置包括:
样本集获取模块,用于获取用于训练视频难度定级模型的视频样本集,所述视频样本集中每个视频样本的难度级别均基于欧洲语言共同标准标定;
视频特征选取模块,用于按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果;
特征提取模块,用于根据所述视频特征选择结果,对所述视频样本集中各个视频样本进行特征提取;
建模模块,用于根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型。
另一方面,本公开提供一种视频难度定级装置,所述装置包括:
待定级的视频获取模块,用于获取待定级的视频;
提取结果获取模块,用于根据视频难度定级模型对所述待定级的视频进行特征提取,得到特征提取结果;
定级模块,用于将所述特征提取结果输入所述视频难度定级模型,将所述视频难度定级模型输出的最大的预测值所对应的难度级别,作为所述待定级的视频的难度级别;
其中,所述视频难度定级模型通过上述的视频难度定级模型获取方法得到。
另一方面,本公开提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现上述的视频难度定级模型获取方法及视频难度定级方法。
另一方面,本公开提供了一种电子设备,其特征在于,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现上述的视频难度定级模型获取方法及视频难度定级方法。
本公开提供了视频难度定级模型获取方法及视频难度定级方法。本公开无需人工判断视频的难度,提高了工作效率,开创了语言系统下的视频难度定级的先河,且充分考虑视频语速及题对难度的影响,判断精确度高,综合达到了85.6%。本公开能够给不同级别的英语学习者提供恰当难度的视频学习内容,对视频难度能够做到高效化、精准化、统一化的量化。
附图说明
为了更清楚地说明本公开实施例或相关技术中的技术方案和优点,下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本公开实施例提供的一种视频难度定级模型获取方法的流程示意图;
图2是本公开提供的按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果的流程图;
图3是本公开提供的对所述子特征集中的各个视频特征进行共线诊断的流程图;
图4是本公开提供的共线性诊断结果示意图;
图5是本公开提供的根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型的流程图;
图6是本公开提供的回归建模的建模结果;
图7是本公开提供的对于预设数量的样本视频,由视频难度定级模型输出的难度级别和实际的难度级别的交叉表;
图8是本公开提供的预测结果对应的交叉表;
图9是本公开提供的一种视频难度定级方法的流程图;
图10是本公开提供的一种视频难度定级模型获取装置;
图11是本公开提供的一种视频难度定级装置;
图12是本公开提供的一种用于实现本公开实施例所提供的方法的设备的硬件结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了使本公开实施例公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本公开实施例,并不用于限定本公开实施例。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。为了便于理解本公开实施例上述的技术方案及其产生的技术效果,本公开实施例首先对于相关专业名词进行解释:
欧洲语言共同标准(CEFR):欧洲共同语言参考标准(The Common EuropeanFramework of Reference for Languages,简称CEFR)是被国际认可的描述语言能力和水平的标准,CEFR共有6个难度级别,分别为A1,A2,B1,B2,C1,C2。在欧洲,CEFR被广泛接受,并且越来越多的运用到欧洲以外的世界范围内。另外,我们针对国内实际情况,增加了A1前的一个级别Pre-A1,同时去掉了C2母语使用者才能达到的水平。
SPSS(Statistical Product and Service Solutions):统计产品与服务解决方案”软件。
请参阅图1,图1示出了本公开实施例提供的一种视频难度定级模型获取方法的流程示意图,本公开提供了如实施例或流程图上述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境),上述方法可以包括:
S101.获取用于训练视频难度定级模型的视频样本集,所述视频样本集中每个视频样本的难度级别均基于欧洲语言共同标准标定。
S102.按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果。
具体地,请参考图2,其示出了按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果的流程图,包括:
S1021.获取待选定的视频特征,构成待选定特征集。
本公开并不对待选定特征集中的视频特征进行限定。
S1022.在所述待选定特征集中抽取预设数量的视频特征,得到多个子特征集,每个子特征集中包括预设数量的视频特征。
具体地,每个子特征集可以包括预设数量的视频特征,本公开并不对子特征集的数量进行限定,也不对抽取方法进行限定,可以由建模人员根据经验进行抽取,每个子特征集都对应一个可选的抽取方式。
S1023.对于每个子特征集,对所述子特征集中的各个视频特征进行共线诊断。
具体地,如图3所示,所述对所述子特征集中的各个视频特征进行共线诊断,包括:按照所述子特征集对所述视频样本集中的视频样本进行特征提取,得到特征提取结果,所述特征提取结果表征所述视频样本的目标视频特征的值,所述目标视频特征为所述子特征集中的视频特征;对各个视频样本的特征提取结果进行共线性诊断,得到诊断结果。
示例性的,若子特征集包括教学属性、视频语速、视频SMOG指数、Coleman Liau指数、自动可读性指数、句子数、单词数、单词数、复杂单词数和平均每单词音节数十个特征,则对于视频样本集中的视频样本都提取这十个特征,得到十个目标视频特征的值,然后对各个视频样本的目标视频的值进行共线性诊断。
具体地,可以使用spss统计软件进行共线性诊断,共线性诊断结果如图4所示,容差均大于0.1且VIF均小于10,说明教学属性、视频语速、视频SMOG指数、Coleman Liau指数、自动可读性指数、句子数、单词数、单词数、复杂单词数和平均每单词音节数十个特征共线程度较小。
S1024.根据共线诊断结果确定目标子特征集,以使得所述目标子特征集中的各个视频特征的共线程度小于预设阈值。
本公开实施例中认为共线程度小的子特征集中的视频特征的整体能够更为全面的对视频画像进行刻画,若共线程度小于预设阈值的子特征集有多个时,可以根据建模人员的经验选择其中之一作为目标子特征集。
S1025.将所述目标子特征集作为所述视频特征选择结果。
在一个实施例中,本公开选择教学属性、视频语速、视频SMOG指数、Coleman Liau指数、自动可读性指数、句子数、单词数、单词数、复杂单词数和平均每单词音节数十个特征构成的子特征集作为目标子特征集,具体该子特征集的内容如表1所示。
表1
S103.根据所述视频特征选择结果,对所述视频样本集中各个视频样本进行特征提取。
示例性的,若视频特征选择结果为教学属性、视频语速、视频SMOG指数、ColemanLiau指数、自动可读性指数、句子数、单词数、单词数、复杂单词数和平均每单词音节数十个特征构成的子特征集,则在所述对所述视频样本集中各个视频样本进行特征提取的步骤中,提取各个视频样本的教学属性、视频语速、视频SMOG指数、Coleman Liau指数、自动可读性指数、句子数、单词数、单词数、复杂单词数和平均每单词音节数对应的值,并将其作为特征提取结果。
S104.根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型。
具体地,请参考图5,其示出了根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型的流程图,包括:
S1041.根据对所述各个视频样本的特征提取结果以及对应的难度级别,进行多分类逻辑回归建模。
S1042.根据建模结果得到所述视频难度定级模型。
本公开中根据所述欧洲语言共同标准构建视频难度定级模型结构,所述视频难度定级模型结构包括中间变量层和输出层,所述中间变量层包括多个中间变量,所述输出层包括与欧洲语言共同标准的难度级别一一对应的输出分支,每个所述输出分支用于输出欧洲语言共同标准中的一个难度级别的预测值;所述中间变量的个数与所述欧洲语言共同标准的难度级别粒度相对应;根据所述建模结果和所述视频难度定级模型结构,得到所述视频难度定级模型。
本公开所使用的欧洲语言共同标准包括六个视频难度,因此,所述视频难度定级模型结构包括中间变量层包括六个中间变量,示例性的,本公开通过G0,G1,G2,G3,G4,G5来表征六个中间变量,以P0,P1,P2,P3,P4,P5分别表征六个输出分支输出的预测值,其中P0,P1,P2,P3,P4,P5分别表征视频难度为欧洲语言共同标准的Pre-A1,A1,A2,B1,B2,C1的概率。
具体地,在一个实施例中,可以基于spss来进行多分类逻辑回归建模,回归建模的建模结果如图6所示,根据所述建模结果可以得到所述视频难度定级模型的公式化表达。
其中,所述视频难度的中间变量通过下述公式进行表达:
G0=-176.877-18.395*SMOG-5.101*Coleman-2.589*Automated-12.159*sentences+0.947*words+2.176*complex_words+192.869*syllables+19.066*IF(isteaching=0,1,0)+8.406*IF(speed=1,1,0)+10.352*IF(speed=2,1,0)-8.323*IF(speed=3,1,0)+0.503*IF(speed=4,1,0);
G1=1.7-0.68*SMOG-0.756*Coleman+0.268*Automated+0.416*sentences-0.094*words-0.455*complex_words+8.088*syllables+1.723*IF(isteaching=0,1,0)+21.934*IF(speed=1,1,0)+1.678*IF(speed=2,1,0)+3.131*IF(speed=3,1,0)+4.25*IF(speed=4,1,0);
G2=0.085-0.604*SMOG-0.67*Coleman+0.175*Automated+0.238*sentences-0.052*words-0.366*complex_words+8.438*syllables+2.306*IF(isteaching=0,1,0)+21.049*IF(speed=1,1,0)+0.918*IF(speed=2,1,0)+2.869*IF(speed=3,1,0)+3.461*IF(speed=4,1,0);
G3=2.223-0.737*SMOG-0.522*Coleman+0.193*Automated+0.172*sentences-0.034*words-0.068*complex_words+5.688*syllables+1.202*IF(isteaching=0,1,0)+20.767*IF(speed=1,1,0)+1.653*IF(speed=2,1,0)+2.759*IF(speed=3,1,0)+2.797*IF(speed=4,1,0);
G4=-19.36-0.808*SMOG-0.436*Coleman+0.158*Automated+0.025*sentences-0.02*words-0.018*complex_words+8.057*syllables+18.773*IF(isteaching=0,1,0)+3.582*IF(speed=1,1,0)+0.628*IF(speed=2,1,0)+2.471*IF(speed=3,1,0)+3.285*IF(speed=4,1,0);
G5=0;
注:IF(speed=1,1,0)表示speed=1时取1,否则取0
所述视频难度的输出分支所述输出的预测值通过下述公式进行表达:
注:e为自然常数,值约为2.718281828459
P0表示将视频难度预测为pre-A1的概率
P1表示将视频难度预测为A1的概率
P2–P5分别表示将视频难度预测为A2-B2的概率;
在得到视频难度定级模型,在一个实施例中,还可以对视频难度定级模型的精度进行判断,请参考图7,其示出了对于预设数量的样本视频,由视频难度定级模型输出的难度级别和实际的难度级别的交叉表。视频难度定级模型输出的难度级别和实际的难度级别一致或者相差一个等级可以认为是准确的,由表7可知,预测一致的样本量2+95+54+54+13+9=227,向上一级预测的样本量0+14+25+9+3=51,向下一级预测的样本量:0+29+25+17+1=72,模型准确度:(227+51+72)/389*100%=90.0%。
为了进一步验证视频难度定级模型的准确性,进一步选取新的292个样本视频,使用该视频难度定级模型对样本进行预测,得到的结果如图8所示,其示出了预测结果对应的交叉表。预测一致的样本量1+50+52+25+7+0=135,向上一级预测的样本量:2+10+12+3+4=31,向下一级预测的样本量:4+39+20+19+2=84,准确度:(135+31+84)/292*100%=85.6%。
本公开示出的一种视频难度定级模型获取方法,无需人工判断视频的难度,提高了工作效率,开创了语言系统下的视频难度定级的先河,且充分考虑视频语速及题对难度的影响,判断精确度高,综合达到了85.6%。本公开能够给不同级别的英语学习者提供恰当难度的视频学习内容,对视频难度能够做到高效化、精准化、统一化的量化。
本公开还示出了一种视频难度定级方法,如图9所示,所述方法包括:
S201.获取待定级的视频。
S202.根据视频难度定级模型对所述待定级的视频进行特征提取,得到特征提取结果。
本公开的视频难度定级模型根据上述的视频难度定级模型获取方法得到。
S203.将所述特征提取结果输入所述视频难度定级模型,将所述视频难度定级模型输出的最大的预测值所对应的难度级别,作为所述待定级的视频的难度级别。
本公开示出的一种视频难度定级方法,可以自动且精准的为视频难度进行定级,从而排除了人工定级的主观不稳定性,使得定级的结果稳定可靠。
本公开实施例还公开了一种视频难度定级模型获取装置,如图10所示,上述装置包括:
样本集获取模块101,用于获取用于训练视频难度定级模型的视频样本集,所述视频样本集中每个视频样本的难度级别均基于欧洲语言共同标准标定;
视频特征选取模块102,用于按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果;
特征提取模块103,用于根据所述视频特征选择结果,对所述视频样本集中各个视频样本进行特征提取;
建模模块104,用于根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型。
具体地,本公开实施例公开一种视频难度定级模型获取装置与上述对应的方法实施例均基于相同发明构思。详情请参见方法实施例,在此不再赘述。
本公开实施例还公开了一种视频难度定级装置,如图11所示,上述装置包括:
待定级的视频获取模块201,用于获取待定级的视频;
提取结果获取模块202,用于根据视频难度定级模型对所述待定级的视频进行特征提取,得到特征提取结果;
定级模块203,用于将所述特征提取结果输入所述视频难度定级模型,将所述视频难度定级模型输出的最大的预测值所对应的难度级别,作为所述待定级的视频的难度级别;
其中,所述视频难度定级模型通过上述的视频难度定级模型获取方法得到。
具体地,本公开实施例公开一种视频难度定级装置与上述对应的方法实施例均基于相同发明构思。详情请参见方法实施例,在此不再赘述。
本公开实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述视频难度定级模型获取方法及视频难度定级方法。
本公开实施例还提供了一种计算机可读存储介质,上述计算机可读存储介质可以存储有多条指令。上述指令可以适于由处理器加载并执行本公开实施例上述的视频难度定级模型获取方法及视频难度定级方法。
进一步地,图12示出了一种用于实现本公开实施例所提供的方法的设备的硬件结构示意图,上述设备可以参与构成或包含本公开实施例所提供的装置。如图12所示,设备10可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图12所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,设备10还可包括比图12中所示更多或者更少的组件,或者具有与图12所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到设备10(或移动设备)中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本公开实施例中上述的方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的视频难度定级模型获取方法及视频难度定级方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括设备10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(NetworkInterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与设备10(或移动设备)的用户界面进行交互。
需要说明的是:上述本公开实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本公开特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本公开中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,上述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上上述仅为本公开的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种视频难度定级模型获取方法,其特征在于,所述方法包括:
获取用于训练视频难度定级模型的视频样本集,所述视频样本集中每个视频样本的难度级别均基于欧洲语言共同标准标定;
按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果;
根据所述视频特征选择结果,对所述视频样本集中各个视频样本进行特征提取;
根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型。
2.根据权利要求1所述的方法,其特征在于,所述按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果,包括:
获取待选定的视频特征,构成待选定特征集;
在所述待选定特征集中抽取预设数量的视频特征,得到多个子特征集,每个子特征集中包括预设数量的视频特征;
对于每个子特征集,对所述子特征集中的各个视频特征进行共线诊断;
根据共线诊断结果确定目标子特征集,以使得所述目标子特征集中的各个视频特征的共线程度小于预设阈值;
将所述目标子特征集作为所述视频特征选择结果。
3.根据权利要求2所述的方法,其特征在于,所述对所述子特征集中的各个视频特征进行共线诊断,包括:
按照所述子特征集对所述视频样本集中的视频样本进行特征提取,得到特征提取结果,所述特征提取结果表征所述视频样本的目标视频特征的值,所述目标视频特征为所述子特征集中的视频特征;
对各个视频样本的特征提取结果进行共线性诊断,得到诊断结果。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型,包括:
根据对所述各个视频样本的特征提取结果以及对应的难度级别,进行多分类逻辑回归建模;
根据建模结果得到所述视频难度定级模型。
5.根据权利要求4所述的方法,其特征在于,所述视频特征选择结果包括教学属性、视频语速、视频SMOG指数、Coleman Liau指数、自动可读性指数、句子数、单词数、单词数、复杂单词数和平均每单词音节数。
6.根据权利要求5所述的方法,其特征在于,所述根据建模结果得到所述视频难度定级模型,包括:
根据所述欧洲语言共同标准构建视频难度定级模型结构,所述视频难度定级模型结构包括中间变量层和输出层,所述中间变量层包括多个中间变量,所述输出层包括与欧洲语言共同标准的难度级别一一对应的输出分支,每个所述输出分支用于输出欧洲语言共同标准中的一个难度级别的预测值;所述中间变量的个数与所述欧洲语言共同标准的难度级别粒度相对应;
根据所述建模结果和所述视频难度定级模型结构,得到所述视频难度定级模型。
7.一种视频难度定级方法,其特征在于,所述方法包括:
获取待定级的视频;
根据视频难度定级模型对所述待定级的视频进行特征提取,得到特征提取结果;
将所述特征提取结果输入所述视频难度定级模型,将所述视频难度定级模型输出的最大的预测值所对应的难度级别,作为所述待定级的视频的难度级别;
其中,所述视频难度定级模型通过权利要求1-6中任意一项所述的视频难度定级模型获取方法得到。
8.一种视频难度定级模型获取装置,其特征在于,所述装置包括:
样本集获取模块,用于获取用于训练视频难度定级模型的视频样本集,所述视频样本集中每个视频样本的难度级别均基于欧洲语言共同标准标定;
视频特征选取模块,用于按照预设的特征选取方法选择用于评定视频难度级别的视频特征,得到视频特征选择结果;
特征提取模块,用于根据所述视频特征选择结果,对所述视频样本集中各个视频样本进行特征提取;
建模模块,用于根据对所述各个视频样本的特征提取结果以及对应的难度级别得到视频难度定级模型。
9.一种视频难度定级装置,其特征在于,所述装置包括:
待定级的视频获取模块,用于获取待定级的视频;
提取结果获取模块,用于根据视频难度定级模型对所述待定级的视频进行特征提取,得到特征提取结果;
定级模块,用于将所述特征提取结果输入所述视频难度定级模型,将所述视频难度定级模型输出的最大的预测值所对应的难度级别,作为所述待定级的视频的难度级别;
其中,所述视频难度定级模型通过权利要求1-6中任意一项所述的视频难度定级模型获取方法得到。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如权利要求1至6中任一项所述的一种视频难度定级模型获取方法,以及如权利要求7所述的一种视频难度定级方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011611951.4A CN112651356B (zh) | 2020-12-30 | 2020-12-30 | 视频难度定级模型获取方法及视频难度定级方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011611951.4A CN112651356B (zh) | 2020-12-30 | 2020-12-30 | 视频难度定级模型获取方法及视频难度定级方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112651356A true CN112651356A (zh) | 2021-04-13 |
CN112651356B CN112651356B (zh) | 2024-01-23 |
Family
ID=75364207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011611951.4A Active CN112651356B (zh) | 2020-12-30 | 2020-12-30 | 视频难度定级模型获取方法及视频难度定级方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651356B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095071A (zh) * | 2021-04-28 | 2021-07-09 | 杭州菲助科技有限公司 | 将英文视频或文本难度对标至国内年级的系统和方法 |
CN113761898A (zh) * | 2021-08-30 | 2021-12-07 | 杭州菲助科技有限公司 | 将英文视频或文本难度对标至国内1-9年级的方法和系统 |
CN113934850A (zh) * | 2021-11-02 | 2022-01-14 | 北京语言大学 | 融合文本分布律特征的中文文本可读性评价方法及系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015003341A1 (zh) * | 2013-07-10 | 2015-01-15 | 中国科学院自动化研究所 | 基于质量元数据的视频分类器构造方法 |
CN106920546A (zh) * | 2015-12-23 | 2017-07-04 | 小米科技有限责任公司 | 智能识别语音的方法及装置 |
CN107229710A (zh) * | 2017-05-27 | 2017-10-03 | 深圳市唯特视科技有限公司 | 一种基于局部特征描述符的视频分析方法 |
CN107277502A (zh) * | 2017-08-01 | 2017-10-20 | 成都大学 | 一种测评立体视频视疲劳程度的方法与系统 |
CN107506346A (zh) * | 2017-07-10 | 2017-12-22 | 北京享阅教育科技有限公司 | 一种基于机器学习的中文阅读难度分级方法及系统 |
CN108647571A (zh) * | 2018-03-30 | 2018-10-12 | 国信优易数据有限公司 | 视频动作分类模型训练方法、装置及视频动作分类方法 |
CN109214374A (zh) * | 2018-11-06 | 2019-01-15 | 北京达佳互联信息技术有限公司 | 视频分类方法、装置、服务器及计算机可读存储介质 |
CN110070026A (zh) * | 2019-04-17 | 2019-07-30 | 中国科学院自动化研究所 | 基于模式识别的视频图像危险态势感知方法、系统、装置 |
CN111104831A (zh) * | 2018-10-29 | 2020-05-05 | 香港城市大学深圳研究院 | 一种视觉追踪方法、装置、计算机设备以及介质 |
CN111444878A (zh) * | 2020-04-09 | 2020-07-24 | Oppo广东移动通信有限公司 | 一种视频分类方法、装置及计算机可读存储介质 |
CN111597383A (zh) * | 2020-04-24 | 2020-08-28 | 北京奇艺世纪科技有限公司 | 一种视频热度级别预测方法及装置 |
US10825564B1 (en) * | 2017-12-11 | 2020-11-03 | State Farm Mutual Automobile Insurance Company | Biometric characteristic application using audio/video analysis |
-
2020
- 2020-12-30 CN CN202011611951.4A patent/CN112651356B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015003341A1 (zh) * | 2013-07-10 | 2015-01-15 | 中国科学院自动化研究所 | 基于质量元数据的视频分类器构造方法 |
CN106920546A (zh) * | 2015-12-23 | 2017-07-04 | 小米科技有限责任公司 | 智能识别语音的方法及装置 |
CN107229710A (zh) * | 2017-05-27 | 2017-10-03 | 深圳市唯特视科技有限公司 | 一种基于局部特征描述符的视频分析方法 |
CN107506346A (zh) * | 2017-07-10 | 2017-12-22 | 北京享阅教育科技有限公司 | 一种基于机器学习的中文阅读难度分级方法及系统 |
CN107277502A (zh) * | 2017-08-01 | 2017-10-20 | 成都大学 | 一种测评立体视频视疲劳程度的方法与系统 |
US10825564B1 (en) * | 2017-12-11 | 2020-11-03 | State Farm Mutual Automobile Insurance Company | Biometric characteristic application using audio/video analysis |
CN108647571A (zh) * | 2018-03-30 | 2018-10-12 | 国信优易数据有限公司 | 视频动作分类模型训练方法、装置及视频动作分类方法 |
CN111104831A (zh) * | 2018-10-29 | 2020-05-05 | 香港城市大学深圳研究院 | 一种视觉追踪方法、装置、计算机设备以及介质 |
CN109214374A (zh) * | 2018-11-06 | 2019-01-15 | 北京达佳互联信息技术有限公司 | 视频分类方法、装置、服务器及计算机可读存储介质 |
CN110070026A (zh) * | 2019-04-17 | 2019-07-30 | 中国科学院自动化研究所 | 基于模式识别的视频图像危险态势感知方法、系统、装置 |
CN111444878A (zh) * | 2020-04-09 | 2020-07-24 | Oppo广东移动通信有限公司 | 一种视频分类方法、装置及计算机可读存储介质 |
CN111597383A (zh) * | 2020-04-24 | 2020-08-28 | 北京奇艺世纪科技有限公司 | 一种视频热度级别预测方法及装置 |
Non-Patent Citations (2)
Title |
---|
乔璐;江丰光;: "慕课学习者群体的聚类分析――以"STEM课程设计与案例分析"慕课为例", 现代教育技术, no. 01 * |
吴争;董育宁;: "网络视频流量分类的特征选择方法研究", 计算机工程与应用, no. 06 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095071A (zh) * | 2021-04-28 | 2021-07-09 | 杭州菲助科技有限公司 | 将英文视频或文本难度对标至国内年级的系统和方法 |
CN113761898A (zh) * | 2021-08-30 | 2021-12-07 | 杭州菲助科技有限公司 | 将英文视频或文本难度对标至国内1-9年级的方法和系统 |
CN113934850A (zh) * | 2021-11-02 | 2022-01-14 | 北京语言大学 | 融合文本分布律特征的中文文本可读性评价方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112651356B (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112651356A (zh) | 视频难度定级模型获取方法及视频难度定级方法 | |
US8904355B2 (en) | Test script generation system | |
CN109784381A (zh) | 标注信息处理方法、装置及电子设备 | |
CN110490181B (zh) | 一种基于ocr识别技术的表单填写审核方法、装置、设备以及计算机存储介质 | |
CN105373478B (zh) | 自动化测试方法和系统 | |
CN109684947A (zh) | 标注质量监控方法、装置、计算机设备和存储介质 | |
CN112712121B (zh) | 一种图像识别模型训练方法、装置及存储介质 | |
CN110580217B (zh) | 软件代码健康度的检测方法、处理方法、装置及电子设备 | |
CN112527676A (zh) | 模型自动化测试方法、装置及存储介质 | |
CN111223015A (zh) | 课程推荐方法、装置及终端设备 | |
CN109948050B (zh) | 信息处理方法和装置,存储介质和电子设备 | |
CN111679808A (zh) | Rpa机器人应用需求测评方法及装置 | |
CN109993315B (zh) | 一种数据处理方法、装置及电子设备 | |
CN114821178A (zh) | 一种基于深度学习的模块化图像识别分类系统的处理方法 | |
CN110826306B (zh) | 数据采集的方法、装置、计算机可读存储介质及电子设备 | |
CN111506501A (zh) | 一种测试指令集的生成方法、装置及电子设备 | |
CN108491451B (zh) | 一种英文阅读文章推荐方法、装置、电子设备及存储介质 | |
CN114943273A (zh) | 数据处理方法、存储介质以及计算机终端 | |
CN108230798A (zh) | 试题分析方法、设备及计算机可读存储介质 | |
CN112906805A (zh) | 图像训练样本筛选和任务模型训练方法、装置及电子设备 | |
CN111143643B (zh) | 元素识别方法、装置、可读存储介质和电子设备 | |
CN114519008A (zh) | 一种回归测试用例的推荐方法、装置、介质及设备 | |
CN112150097A (zh) | 一种学习设计生成方法、装置、电子设备及存储介质 | |
CN111210673B (zh) | 课程数据处理方法、装置、终端设备及计算机存储介质 | |
CN112905896A (zh) | 一种推荐个数模型的训练方法、混合内容推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |