CN111813993A - 视频内容的拓展方法、装置、终端设备及存储介质 - Google Patents

视频内容的拓展方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
CN111813993A
CN111813993A CN202010923540.2A CN202010923540A CN111813993A CN 111813993 A CN111813993 A CN 111813993A CN 202010923540 A CN202010923540 A CN 202010923540A CN 111813993 A CN111813993 A CN 111813993A
Authority
CN
China
Prior art keywords
word
expanded
words
knowledge base
weight value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010923540.2A
Other languages
English (en)
Inventor
周凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Research Institute of Sun Yat Sen University
Original Assignee
Shenzhen Research Institute of Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Research Institute of Sun Yat Sen University filed Critical Shenzhen Research Institute of Sun Yat Sen University
Priority to CN202010923540.2A priority Critical patent/CN111813993A/zh
Publication of CN111813993A publication Critical patent/CN111813993A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请适用于人工智能技术领域,提供了视频内容的拓展方法、装置、终端设备及存储介质,方法包括:提取视频图像中的文本内容的待拓展词;确定所述待拓展词的知识库链接词;根据所述知识库链接词,将预设知识库中与所述知识库链接词对应的知识文本作为所述待拓展词的拓展内容。从而对不同场景下的视频图像进行内容拓展,进而能够显示视频图像中出现的专业知识点的知识解释,丰富视频内容的展示方式,使得视频图像能够适用于更多的应用场景。

Description

视频内容的拓展方法、装置、终端设备及存储介质
技术领域
本申请属于人工智能技术领域,尤其涉及视频内容的拓展方法、装置、终端设备及存储介质。
背景技术
随着互联网的不断升级,短视频、视频直播等媒体逐渐进入人们的视野,越来越多的用户参与教育直播课、网络公开课等在线教育。相比于传统的线下课堂,在线教育能够给用户带来诸多便利,但是也非常考验用户的自主学习能力。在相关技术中,在线教育视频中经常会出现专业术语或专有名词,若用户不知道专业术语或专有名词的含义时,则需要自行查阅百度百科或维基百科等知识库。由此可见,目前的视频显示方式仅能够显示原有的视频内容,显示内容单一,在专业知识点较多的教学场景中无法发挥重要作用,难以适用于专业教学场景,存在适用范围小的问题。
发明内容
本申请实施例提供了视频内容的拓展方法、装置、终端设备及存储介质,可以解决当前的视频内容显示方式存在适用范围小的问题。
第一方面,本申请实施例提供了一种视频内容的拓展方法,包括:
提取视频图像中的文本内容的待拓展词;
确定待拓展词的知识库链接词;
根据知识库链接词,将预设知识库中与知识库链接词对应的知识文本作为待拓展词的拓展内容。
本申请实施例提供的视频内容的拓展方法,通过提取视频图像中的文本内容的待拓展词,从而能够自动识别出视频图像中出现专有名词或专业术语,并确定待拓展词的知识库链接词,从而能够确定链接预设知识库的知识库链接词,以及根据知识库链接词,将预设知识库中与知识库链接词对应的知识文本作为待拓展词的拓展内容,从而对不同场景下的视频图像进行内容拓展,进而能够显示视频图像中出现的专业知识点的知识解释,丰富视频内容的展示方式,使得视频图像能够适用于更多的应用场景。
第二方面,本申请实施例提供了一种视频内容的拓展装置,包括:
提取模块,用于提取视频图像中的文本内容的待拓展词;
确定模块,用于确定待拓展词的知识库链接词;
拓展模块,用于根据知识库链接词,将预设知识库中与知识库链接词对应的知识文本作为待拓展词的拓展内容。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的视频内容的拓展方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的视频内容的拓展方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的视频内容的拓展方法。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的视频内容的拓展方法的流程示意图;
图2是本申请一实施例提供的视频内容的拓展方法中步骤S101的具体流程示意图;
图3是本申请一实施例提供的视频内容的拓展方法中步骤S102的具体流程示意图;
图4是本申请另一实施例提供的视频内容的拓展方法中步骤S102的具体流程示意图;
图5是本申请再一实施例提供的视频内容的拓展方法中步骤S102的具体流程示意图;
图6是本申请又一实施例提供的视频内容的拓展方法的流程示意图
图7是本申请实施例提供的视频内容的拓展装置的结构示意图;
图8是本申请实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
如背景技术相关记载,在线教育视频中经常会出现专业术语或专有名词,若用户不知道专业术语或专有名词的含义时,则需要自行查阅百度百科或维基百科等知识库。可见,目前的视频显示方式仅能够显示原有的视频内容,显示内容单一,在专业知识点较多的教学场景中无法发挥重要作用,难以适用于专业教学场景,存在适用范围小的问题。
有鉴于此,本申请实施例提供一种视频内容的拓展方法,通过提取视频图像中的文本内容的待拓展词,从而能够自动识别出视频图像中出现专有名词或专业术语,并确定待拓展词的知识库链接词,从而能够确定链接预设知识库的知识库链接词,以及根据所述知识库链接词,将预设知识库中与所述知识库链接词对应的知识文本作为所述待拓展词的拓展内容,从而对不同场景下的视频图像进行内容拓展,进而能够显示视频图像中出现的专业知识点的知识解释,丰富视频内容的展示方式,使得视频图像能够适用于更多的应用场景。
请参阅图1,图1示出了本申请提供的视频内容的拓展方法的示意性流程图。本实施例提供的视频内容的拓展方法的执行主体为终端设备,终端设备包括但不限于智能手机、平板电脑、超级计算机、个人数字助理等移动终端,也可以包括台式电脑、服务器等终端设备。如图1所示的视频内容的拓展方法包括步骤S101至S103,详述如下:
S101,提取视频图像中的文本内容的待拓展词。
在本实施例中,视频图像为用户所浏览的视频画面,视频包括但不限于在线直播视频和录制视频,在线直播视频包括但不限于教育直播课、网络公开课和其他网络直播等,录制视频包括但不限于电影影像、纪录片和短视频等。文本内容为视频图像中出现的文本,其包括但不限于视频字幕和视频图像背景中的文本,字幕或文本包括但不限于中文、英文、日文和法文等语言文体。当视频为在线直播视频时,文本内容可以为视频图像背景中的文本,例如,在数学直播课的视频图像中,黑板或ppt(power point)上出现的数学公式和数学名词等文本等;当视频为录制视频时,文本内容可以为视频字幕和视频图像背景中的文本,例如,在化学发展史纪录片的视频图像中出现的中文字幕或英文字幕,以及图像背景中出现的化学式、化学家名称等文本。
待拓展词为视频中出现的专有名词或专业术语,其包括但不限于人、地方、事物等特有的名词,如人名、地名和机构名。可以理解的是,专业术语是指在特定学科领域用来表示概念的称谓的集合,其包括特征学科领域对一些特定事物的统一业内称谓和简称。
终端设备提取视频图像中的文本内容的待拓展词,包括识别视频图像中出现的待拓展词,以及提取识别到的待拓展词。可选地,终端设备提取视频图像中的文本内容的待拓展词,可以基于命名实体识别算法和中文分词(还可以是英文分词等)技术识别视频图像中的待拓展词,再基于关键词提取算法提取识别到的待拓展词。
示例性地,终端设备基于支持向量机-隐马尔科夫模型(Support VectorMachine-Hidden Markov Model,SVM-HMM)构建的中文分词模型,或者基于双向长短期记忆网络-条件随机场模型(Long Short-Term Memory-Conditional Random Field,LSTM-CRF)构建的中文分词模型,对视频图像中的文本内容进行中文分词,得到多个单词;再基于条件随机场模型(Conditional Random Field,CRF)构建的命名实体识别模型,对基于上述中文分词模型得到的多个单词进行命名实体识别,得到多个命名实体;最后基于关键词的词频、位置信息和词长等特征构建的TF-IDF(term frequency-inverse document frequency)算法,或者基于词语网络构建的TextRank算法,对多个命名实体进行关键词提取,得到一个或多个关键词,并将关键词作为待拓展词。
S102,确定待拓展词的知识库链接词。
在本实施例中,知识库链接词为链接至预设知识库的词汇,其包括待拓展词的多义词中的一个、待拓展词本身和待拓展词的同义词。终端设备确定待拓展词的知识库链接词,包括确定待拓展词是否为多义词,若待拓展词为多义词,则确定待拓展词的含义,从而确定知识库链接为待拓展词含义对应的词汇或该词汇对应的同义词,若待拓展词不为多义词,则确定待拓展词的知识库链接词为待拓展词本身或待拓展词的同义词。可选地,可设置待拓展词的消歧页面确定待拓展词是否为多义词,若消歧页面包括待拓展词的多个歧义词,则说明待拓展词为多义词。
作为示例而非限定,调用维基百科的消歧义页面确定待拓展词是否为多义词,当待拓展词不为多义词时,知识库链接词为待拓展词本身或待拓展词的同义词,例如待拓展词为支持向量机,则知识库链接词可以为支持向量机、支持向量网络和SVM。当待拓展词为多义词时,确定文本内容中待拓展词的含义,以确定待拓展词的知识链接词,例如,待拓展词为苹果,苹果的含义包括品牌名称、蔷薇科苹果属果实和电影名称等,根据文本内容确定苹果在文本内容中的含义,若苹果的含义确定为品牌名称则知识库链接词为苹果公司、Apple.Inc等。
S103,根据知识库链接词,将预设知识库中与知识库链接词对应的知识文本作为待拓展词的拓展内容。
在本实施例中,预设知识库包括但不限于维基百科、百度百科和自定义构建的知识库;知识文本为词条的摘要或简介。根据知识库链接词,链接至预设知识库中知识库链接词对应的词条页面,获取该词条页面中词条简介位置对该词条的简介,将该简介作为待拓展词的拓展内容。示例性地,知识库链接词为苹果(蔷薇科苹果属植物),根据苹果(蔷薇科苹果属植物)链接至百度百科的“苹果”词条页面,获取页面中“苹果”词条的简介“苹果是蔷薇科苹果亚科苹果属植物,其树为落叶乔木。苹果营养价值很高,富含矿物质和维生素,含钙量丰富,有助于代谢掉体内多余盐分,苹果酸可代谢热量,防止下半身肥胖。”,将该简介作为知识文本显示于终端设备的显示屏幕的预设位置。
本实施例根据所述知识库链接词,将预设知识库中与所述知识库链接词对应的知识文本作为所述待拓展词的拓展内容,从而对不同场景下的视频图像进行内容拓展,进而能够显示视频图像中出现的专业知识点的知识解释,丰富视频内容的展示方式,使得视频图像能够适用于更多的应用场景。
请参阅图2,图2示出了本申请一实施例提供的一种视频内容的拓展方法中步骤S101的具体实现流程图。如图2所示,步骤S101包括步骤S201至S202。应理解,与图1实施例相同的步骤,此处不再描述。
S201,提取视频图像中的文本内容的多个关键词;
在本实施例中,关键词为视频中出现的专有名词或专业术语,其包括视频中出现的所有专有名词或专业术语,也就是说,关键词可以包括常见的专有名词或专业术语,也可以包括不常见的专有名词或专业术语。例如苹果、雪梨、猴子等名词属于常见的专有名词或专业术语,莲雾、猞猁等名词属于不常见的专有名词或专业术语。需要说明的是,上述例子仅用作示例,在实际情况中,莲雾、猞猁等名词是否属于不常见的专有名词或专业术语,可根据对大量文本进行训练后确定。
终端设备基于预设关键词提取算法,提取文本内容的关键词,预设关键词提取算法包括TF-IDF算法和TextRank算法。为了提高关键词的可解释性,本实施例对TF-IDF算法和TextRank算法进行改进,其中可解释性为向用户提供词汇解释的必要性,必要性越高,可解释性越高,其中关键词在文本内容中的TF-IDF权重值或TextRank权重值越高,则该关键词的可解释性越高。需要说明的是,本实施例虽然采用改进后的TF-IDF算法和TextRank算法提取关键词,但并不意味着本实施例仅能够采用改进后的TF-IDF算法和TextRank算法提取关键词,可以理解,本实施也可以采用原TF-IDF算法和TextRank算法提取关键词。
在一种可能实现的方式中,提取文本内容的关键词,包括:对文本内容进行分词,得到多个单词;根据预设的TF-IDF算法和/或TextRank-IDF算法,计算每个单词在文本内容中的TF-IDF权重值和/或TextRank-IDF权重值;将TF-IDF权重值大于第一阈值的单词和/或TextRank-IDF权重值大于第二阈值的单词作为关键词。
在本实施例中,TF-IDF算法为基于统计特征的算法,具体为通过词频特征来提取关键词的算法。TextRank-IDF算法为基于词语网络的算法,该算法采用图模型的理论,通常将关键词视为复杂网络中比重大的节点,其基本思想是将文本拆分为句子,保留指定词性的词,将每个词作为图的一个节点,图中任意两个词对应的节点之间存在一条无向无权边,计算出每个词节点的重要性,取若干最重要节点作为关键词。
可选地,预设TF-IDF算法的计算公式为
Figure DEST_PATH_IMAGE001
Figure 476300DEST_PATH_IMAGE002
表示单词i在文本内容中的TF-IDF权重值,
Figure DEST_PATH_IMAGE003
表示单词i的词频,
Figure 935094DEST_PATH_IMAGE004
表示单词i的逆文档词频,
Figure DEST_PATH_IMAGE005
表示单词i的词长权重值,
Figure 122493DEST_PATH_IMAGE006
表示单词i在文本内容中出现的次数,
Figure DEST_PATH_IMAGE007
表示文本内容中所有单词的数目,
Figure DEST_PATH_IMAGE009
表示预设语料库中所有文档数,
Figure 419351DEST_PATH_IMAGE010
表示预设预料库中包含单词i的文档数,
Figure DEST_PATH_IMAGE011
表示单词i的词语长度,
Figure 105941DEST_PATH_IMAGE012
表示文本内容中的最长词的词语长度。
在本实施例中,由于TF-IDF算法适用于长文本,对于只有几分钟的短视频文本而言,可能会出现TF计算出的词频偏大或者很多词汇的词频趋于一致的情况。以及在计算IDF时,对语料库的依赖较大,若语料库本身和需要进行处理的文本内容相似度高,则在词条重叠度高时,会导致词语IDF值偏低,从而使TF-IDF权重值失去参考意义。因此本实施例通过原TF-IDF算法的基础上,在增加单词的词长权重
Figure DEST_PATH_IMAGE013
,以使提取到的关键词更加符合汉语文本中的长词通常更有实际意义和可解释性的特点,从而提高关键词的可解释性。
可选地,预设TextRank-IDF算法的计算公式为
Figure 52031DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE015
表示单词i在文本内容中的TextRank-IDF权重值,d表示阻尼系数,
Figure 479339DEST_PATH_IMAGE016
表示指向单词j的词集合,
Figure DEST_PATH_IMAGE017
表示单词i属于词集合
Figure 194486DEST_PATH_IMAGE016
Figure 612829DEST_PATH_IMAGE018
表示单词j指向的单词集合,
Figure DEST_PATH_IMAGE019
表示单词k属于单词集合
Figure 293819DEST_PATH_IMAGE018
Figure 88600DEST_PATH_IMAGE020
表示将单词i与单词j作为两点时两点之间边的权重,
Figure DEST_PATH_IMAGE021
表示将单词j与单词k作为两点时两点之间边的权重,
Figure 156788DEST_PATH_IMAGE022
表示单词j的在文本内容中的TextRank权重值,
Figure DEST_PATH_IMAGE023
表示单词i的逆文档词频。
在本实施例中,TextRank算法为通过迭代得到结果的算法,这对于长文本来说,迭代计算所需要的时间较长,并且该算法提取关键词的依据是词间关联性,这对于文档结构的依赖较大,可见TextRank算法得到的部分关键词的可解释性和代表性较差。因此,本实施例在原TextRank算法的基础上,增加单词的逆文档词频,以去除部分常见词噪声,使得TextRank-IDF算法得到的关键词更具有代表性。
S202,基于多个关键词,确定文本内容的待拓展词。
在本实施例中,待拓展词为不常见的专有名词或专业术语。当步骤S201基于原TF-IDF算法和TextRank算法提取关键词时,则关键词中包含常见词汇和不常见词汇;当步骤S201基于改进后的TF-IDF算法和TextRank算法提取关键词时,则关键词中除了包含不常见词汇之外,也存在包含有常见词汇的可能。可以理解的是,对于常见词汇,在非常大的概率下,用户已经清楚常见词汇的含义,无需再为用户提供常见词汇的技术服务;对于不常见词汇,在非常大的概率下,用户不清楚不常见词汇的含义,所以需要为用户提供不常见词汇的技术服务。因此,从步骤S201提取到关键词中确定不常见词汇,将不常见词汇作为文本内容的待拓展词,从而针对用户需求提供相应的技术服务,提高用户体验。
在一种可能实现的方式中,基于关键词,确定文本内容的待拓展词,包括:基于每个关键词在文本内容中的TF-IDF权重值或TextRank-IDF权重值,根据TID-Rank权重值,对多个关键词进行排序,得到排列顺序;将在排列顺序中的前N个或后N个的关键词作为文本内容的待拓展词,N为预设数量。本实施方式仅考虑关键词的TF-IDF权重值或TextRank-IDF权重值,将权重值靠前的关键词作为待拓展词。
在另一种可能实现的方式中,基于关键词,确定文本内容的待拓展词,包括:基于每个关键词在文本内容中的TF-IDF权重值和TextRank-IDF权重值,确定每个关键词在文本内容中的TID-Rank权重值,TID-Rank权重值为根据文本内容的长度对关键词的权重进行重新分配的结果;根据TID-Rank权重值,对多个关键词进行排序,得到排列顺序;将在排列顺序中的前N个或后N个的关键词作为文本内容的待拓展词,N为预设数量。
在本实施例中,为了提高更有针对性的向用户提供不常见词汇的词汇解释,本实施例采用用增加了权重倍数的TF-IDF算法和TexRank-IDF算法计算词语权重,然后根据文本长短的统计,对词语权重进行重新分配比重,得到一组新的关键词权重,即TID-Rank权重值。具体地,对于专有名词,通过中文分词已经将其识别,并结合词性标注,在提取算法中设置权重倍数来增加其相应的权重;对于术语,通过关键词提取算法已经得到相当一部分与视频内容相关的专业词汇,结合改进的关键词提取算法,去除掉其中部分噪声词汇,提高词长较长的低频词的权重;对于视频文本长度不固定的特征,将适用于不同长度文本的关键词提取算法进行结合,重新分配权值,得到最终的待拓展词权重。
进一步地,根据TID-Rank权重值,对关键词进行排序,将在排列顺序中的前N个或后N个的关键词作为文本内容的待拓展词。在本实施例中,对TID-Rank权重值倒序排列(即从大到小排序),设定拓展词系数为k,计算排序顺序中能够作为文本内容的待拓展词的个数。具体地,
Figure 683715DEST_PATH_IMAGE024
,其中N为作为文本内容的待拓展词的个数,
Figure DEST_PATH_IMAGE025
为文本内容的关键词个数。可选地k设置为0.05。
可选地,基于关键词在文本内容中的TF-IDF权重值和TextRank-IDF权重值,确定关键词在文本内容中的TID-Rank权重值,包括:根据文本内容的文本长度,确定TF-IDF权重值和TextRank-IDF权重值的置信度系数;基于置信度系数、TF-IDF权重值和TextRank-IDF权重值,根据预设TID-Rank算法计算关键词在文本内容中的TID-Rank权重值。
在本实施例中,由于每个视频图像中的文本内容的文本长度不一致,TF-IDF算法更加适用于长文本,而TextRank-IDF算法会因长文本而增加计算复杂度,所以本实施例根据文本内容的文本长度,重新分配TF-IDF算法得到的TF-IDF权重值和TextRank-IDF算法得到的TextRank-IDF权重值的置信度,当置信度系数越高,则说明对应算法所得到权重值更加可信。
可选地,预设TID-Rank算法的计算公式为
Figure 105863DEST_PATH_IMAGE026
Figure DEST_PATH_IMAGE027
表示关键词i在文本内容中的TID-Rank权重值,
Figure 376438DEST_PATH_IMAGE028
表示增加词性权重后的关键词i在文本内容中的TF-IDF权重值,
Figure DEST_PATH_IMAGE029
Figure 299133DEST_PATH_IMAGE030
表示关键词i的词性权重,
Figure DEST_PATH_IMAGE031
表示关键词i在文本内容中的TF-IDF权重值,
Figure 262541DEST_PATH_IMAGE032
表示增加词性权重后的关键词i在文本内容中的TextRank-IDF权重值,
Figure DEST_PATH_IMAGE033
Figure 906405DEST_PATH_IMAGE034
表示关键词i在文本内容中的TextRank-IDF权重值,
Figure DEST_PATH_IMAGE035
表示TF-IDF权重值的置信度系数,
Figure 715092DEST_PATH_IMAGE036
,t表示文本内容的长度,T表示预设的文本长度阈值,
Figure 321654DEST_PATH_IMAGE037
表示TextRank-IDF权重值的置信度系数。
在本实施例中,词性权重为对TF-IDF算法和TexRank-IDF算法所增加的权重倍数,具体为预先对关键词的词性设置的权重,可选地,将识别到的专有名词和未登录词的权重倍数设置为2,其余词性权重系数为1,其中未登录词为生僻的冷门词汇,如与视频主题无关且无法通过关键词提取算法抽取出来的词汇。也就是说,对于专有名词,采用2倍权重的TF-IDF算法和TexRank-IDF算法计算专有名词的权重值。应理解,上述权重倍数的具体数值仅用作示例,在实际应用中,可以通过对大量文本训练得到该权重倍数。
本实施例通过将适用于不同长度文本的关键词提取算法进行结合,根据文本内容的文本长度重新分配关键词提取算法的比重,从而利用不同算法的优点,得到更加具有可解释性的待拓展词。
请参阅图3,图3示出了本申请一实施例提供的一种视频内容的拓展方法中步骤S102的具体实现流程图。如图3所示,步骤S102包括步骤S301至S303。应理解,与图1实施例相同的步骤,此处不再描述。
S301,若待拓展词为歧义词,则获取待拓展词的多个候选词。
在本实施例中,歧义词为多义词,表示存在多种含义的词汇,例如,苹果可以指企业品牌,也可以指蔷薇科苹果属果实,还可以至电影名称等。候选词为待拓展词的每个含义所对应的词汇,例如,待拓展词为苹果,则候选词可以包括表示企业品牌的苹果公司、表示蔷薇科苹果属果实的苹果食物、表示电影名称的《苹果》等。示例性地,预先在预设知识库设置待拓展词的多个候选词,当待拓展词为歧义词时,则调用预设知识库中预先设置的待拓展词的多个候选词。
在一种可能实现的方式中,若待拓展词为歧义词,则获取待拓展词的多个候选词,包括:若待拓展词为歧义词,则获取视频图像的主题类别,以及在预设知识库中与待拓展词对应的多个词条,每个词条对应的一个或多个分类标签;对视频图像的主题类别与词条的分类标签进行相似度匹配,得到第二相似度;将大于第三阈值的第二相似度所对应的词条作为待拓展词的候选词。
在本实施例中,在进行视频数据预处理时,对视频资源进行了主题分类,而在构建预设知识库时,抽取词条的结构化信息,结构化信息包括词语的分类标签。结合视频的主题类别和词条的分类标签,确定待拓展词的含义。
作为示例而非限定,以“苹果”为例,视频《西方科技龙头出卖自己的良心—中国揭秘》是科技类视频,视频中的“苹果”是苹果公司的“苹果”的可能性较大。在链接知识库时,首先获取到苹果的相关歧义项作为词条,并获取各个词条在预设知识库中的分类标签,具体参见下表。该视频的类别为科技,讲述了苹果公司等企业在互联网大会上的表现,那么对应的在视频中出现的词条苹果应链接到候选词“苹果产品公司”。具体地,将各个词条与待拓展词的第二相似度均设置为0.0,利用字符串匹配将视频的主题类别“科技”与各个词条的分类标签进行匹配,若匹配成功,则将词条的相似度值增加0.1,依此类推。例如,词条“苹果产品公司”的分类标签“电子科技产品”与视频的主题类别“科技”匹配成功,则将词条“苹果产品公司”与待拓展词的第二相似度增加0.1,当第二相似度大于第三阈值时,则将词条“苹果产品公司”作为候选词。
词条 分类标签
蔷薇科苹果属果实 水果,植物学,苹果属,植物
苹果产品公司 公司,电子科技产品,手机,乔布斯
李玉执导电影《苹果》 爱情电影,电影作品,电影,娱乐作品
在一实施例中,若待拓展词为歧义词,则获取待拓展词的多个候选词之前,还包括:根据预设知识库中的预设歧义词条列表,确定预设歧义词条列表中是否包含待拓展词对应的多个词条;若确定预设歧义词条列表中包含待拓展词对应的多个词条,则判定待拓展词为歧义词。
在本实施例中,预设歧义词列表为待拓展词的歧义词列表,例如维基百科设置的用于展示存在歧义的所有实体消歧义页、百度百科设置的用于解释存在歧义词的歧义词条链接项。通过预设歧义词列表不仅可以判断某个词是否存在歧义,还可以获得待拓展词的所有候选词。根据知识库中词条的歧义信息,判断视频拓展词是否存在一词多义的情况,若存在,则获取待拓展词的多个候选词,若不存在,则将待拓展词本身或待拓展词的同义词作为知识库链接词。
S302,对待拓展词与候选词进行相似度匹配,得到第一相似度。
在本实施例中,对待拓展词与候选词进行相似度匹配,得到第一相似度,包括:获取预设知识库中的候选词的知识内容;提取知识内容的第一词向量,以及提取文本内容的第二词向量;对第一词向量与第二词向量进行相似度匹配,得到第一相似度。候选词的知识内容为在预设知识库的该候选词的摘要或简介。
示例性地,获取候选词在百度百科中的摘要,作为各个候选词的知识内容。对各个候选词的知识内容进行去停用词、分词等操作后,利用TF-IDF统计文本词频,得到知识内容的第一词向量对应的向量空间为
Figure 16815DEST_PATH_IMAGE038
其中,
Figure 443249DEST_PATH_IMAGE039
是指第k个候选词,n为第一词向量的向量空间中词汇的总数量。
对待拓展词所属视频的文本内容进行去停用词、分词等操作,利用TF-IDF算法计算视频文本的词频,得到视频图像的文本内容的第二词向量对应的向量空间为
Figure 445840DEST_PATH_IMAGE040
其中,
Figure 906908DEST_PATH_IMAGE041
是第j个视频图像中的文本内容,即待拓展词对应的视频文本,
Figure 8856DEST_PATH_IMAGE042
为文本中第i个词的TF-IDF值,m为第二词向量的向量空间中词汇的总数量。
S303,将与待拓展词的第一相似度最高的候选词作为知识库链接词。
在本实施例中,将第一词向量的向量空间和第二词向量的向量空间分别做余弦相似度计算,得到文本相似度。可选地,余弦计算公式为
Figure 689630DEST_PATH_IMAGE043
其中,
Figure 168015DEST_PATH_IMAGE044
表示第二词向量的空间向量中词i的TF-IDF值,
Figure 483590DEST_PATH_IMAGE045
表示第一词向量的向量空间中词i的TF-IDF值。通过余弦相似度计算,
Figure 22019DEST_PATH_IMAGE046
的值越大,则拓展词与候选词的文本相似度越高。
请参阅图4,图4示出了本申请另一实施例提供的一种视频内容的拓展方法中步骤S102的具体实现流程图。如图4所示,步骤S102包括步骤S401至S403。应理解,与图1实施例相同的步骤,此处不再描述
S401,若待拓展词为歧义词,则获取待拓展词的多个候选词,以及待拓展词与每个候选词之间的第一相似度、每个候选词的分类标签与视频图像的主题类别之间的第二相似度。
在本实施例中,上述第一相似度、第二相似度的计算过程可参照图3实施例,此处不再赘述。
S402,将第一相似度与第二相似度进行求和,得到待拓展词与候选词的第三相似度。
在本实施例中,考虑到科技视频讲解的内容中,其中提到的词的标签中也有一定的概率不是科技相关内容。如视频《牛顿定律》中讲述了牛顿从苹果落地发现了牛顿定律,该视频的主题类别也为科技,而视频中提到的“苹果”为水果,与科技完全无关。但通过上述类别标签的匹配会将词条“苹果公司”的相似度增加,造成一定偏差。另外,分类标签的匹配很大程度依赖标签内容的准确性,为了进一步提高准确性,通过分类标签匹配后,进一步对视频拓展词与候选词的知识内容的文本特征计算相似度,来最终确定各候选词的相似度。具体地,将第一相似度与第二相似度进行求和,得到待拓展词与候选词的第三相似度。
S403,将与待拓展词的第三相似度最高的候选词作为知识库链接词。
在本实施例中,第三相似度越高说明待拓展词与候选词的含义越相近,因此将第三相似度最高的候选词作为知识库链接词。
请参阅图5,图5示出了本申请再一实施例提供的一种视频内容的拓展方法中步骤S102的具体实现流程图。如图4所示,步骤S102包括步骤S401至S403。应理解,与图1实施例相同的步骤,此处不再描述
S501,若待拓展词不为歧义词,则确定待拓展词的重定向同义词;
S502,将重定向同义词作为待拓展词的知识库链接词。
在本实施例中,重定向同义词为与待拓展词具有相同含义的词汇。在专业领域中常常出现名词缩写。如SVM(support vectormachine),即支持向量机,也叫支持向量网络。在进行知识库链接时,要求通过同义词中的任一个均可以链接到LDA词条解释页面。维基百科提供了词条的重定向信息,词条“SVM”重定向到“支持向量机”,则将“SVM”看作是“支持向量机”的指称形式。在词条A对应的维基百科页面中,重定向信息的格式是Redirect—Ma,其中Ma是A的指称形式。本实施例下载了中文维基百科的词条重定向页,以及百度百科结构化信息中的同义词项,将同义词在进行知识库链接时链接到正确的词条页面。
请参阅图6,图6示出了本申请又一实施例提供的一种视频内容的拓展方法的具体实现流程图。如图6所示,在图1实施例的基础上,步骤S102之前包括步骤S601至S602。应理解,与图1实施例相同的步骤,此处不再描述。
S601,访问目标知识库,并抽取目标知识库中词条的三元组信息。
在本实施例中,目标知识库包括但不限于维基百科知识库、百度百科知识库和与互动百科知识库等。三元组信息为以三元组形式存储的信息,针对三元组的存储,万维网联盟(W3C)提出了RDF资源描述框架。该框架将三元组的实体、属性、属性值分别视为主语谓语和宾语,其中主语和宾语构成图的顶点,谓语构成边,以图的形式存储RDF数据。RDF数据通过SPARQL进行查询,SPARQL是语义网的核心技术之一,用于访问和操作RDF数据库,SPARQL查询基于图匹配思想,通过查找RDF图中所有符合匹配模式的子图来得到变量。
示例性地,利用Zhishi.me语义知识库抽取词条的三元组信息。Zhishi.me是全球第一个符合链接数据标准的开放中文语义知识库。该知识库用与DBpedia抽取框架类似的抽取算法从百度百科、互动百科和中文维基百科中抽取语义信息,利用启发式规则、关联规则挖掘等对语义数据进行了清理和挖掘,通过半监督的实体匹配算法对处理后的异构数据源数据从实体层和模式层两方面进行匹配和融合。
S602,基于三元组信息构建预设知识库。
在本实施例中,将三元组加入fuseki数据库中,对数据库中的三元组信息进行补充和更新。最后使用SPARQL对构建完成的教育领域词条相对完整的中文百科知识库进行发布。具体地,终端设备下载并配置了Apache开源项目jena提供的fuseki服务器,该服务器可以存储和管理RDF数据,将S601抽取的三元组上传到fuseki的图数据库中,然后编写SPARQL查询语句来获取知识库中某一个实体对应的所有属性和值,通过JSON数据的形式返回给前端,对知识库进行发布。
进一步地,对已构建的知识库增加了获取在线百科词条的功能,增加其实时性和实用性。具体地,在查询知识库中的词条时,出现词条不存在情况便将该词条名返回给后台,将词条名与百度百科词条链接的前缀组合得到词条对应的百科链接,并存储到新增词条队列;然后重复百科词条预处理和构建三元组的步骤对词条进行信息抽取、存储和发布等操作,将新的三元组信息加入到知识库中。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的视频内容的拓展方法,图7示出了本申请实施例提供的视频内容的拓展装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图7,该装置包括:
提取模块701,用于提取视频图像中的文本内容的待拓展词;
确定模块702,用于确定待拓展词的知识库链接词;
拓展模块703,用于根据知识库链接词,将预设知识库中与知识库链接词对应的知识文本作为待拓展词的拓展内容。
本申请实施例提供一种视频内容的拓展装置,通过提取模块701提取视频图像中的文本内容的待拓展词,从而能够自动识别出视频图像中出现专有名词或专业术语,并通过确定模块702确定待拓展词的知识库链接词,从而能够确定链接预设知识库的知识库链接词,以及通过拓展模块703根据知识库链接词,将预设知识库中与知识库链接词对应的知识文本作为待拓展词的拓展内容,从而能够为在线教育视频提供学习支持服务,使得用户能够根据本方法对视频内容拓展的拓展内容进行学习,进而显著提高用户的学习效率。
在一实施例中,提取模块701还用于:
提取视频图像中的文本内容的多个关键词;
基于多个关键词,确定文本内容的待拓展词。
在一实施例中,提取模块701还用于:
对文本内容进行分词,得到多个单词;
根据预设的TF-IDF算法和/或TextRank-IDF算法,计算每个单词在文本内容中的TF-IDF权重值和/或TextRank-IDF权重值;
将TF-IDF权重值大于第一阈值的单词和/或TextRank-IDF权重值大于第二阈值的单词作为关键词。
在一实施例中,预设TF-IDF算法的计算公式为
Figure 921580DEST_PATH_IMAGE047
Figure 203656DEST_PATH_IMAGE048
表示单词i在文本内容中的TF-IDF权重值,
Figure 639317DEST_PATH_IMAGE049
表示单词i的词频,
Figure 83068DEST_PATH_IMAGE023
表示单词i的逆文档词频,
Figure 726715DEST_PATH_IMAGE050
表示单词i的词长权重值,
Figure 546903DEST_PATH_IMAGE051
表示单词i在文本内容中出现的次数,
Figure 837070DEST_PATH_IMAGE052
表示文本内容中所有单词的数目,
Figure 451722DEST_PATH_IMAGE009
表示预设语料库中所有文档数,
Figure 325875DEST_PATH_IMAGE010
表示预设预料库中包含单词i的文档数,
Figure 949754DEST_PATH_IMAGE011
表示单词i的词语长度,
Figure 94428DEST_PATH_IMAGE012
表示文本内容中的最长词的词语长度。
在一实施例中,预设TextRank-IDF算法的计算公式为
Figure 145561DEST_PATH_IMAGE053
Figure 509939DEST_PATH_IMAGE015
表示单词i在文本内容中的TextRank-IDF权重值,d表示阻尼系数,
Figure 671930DEST_PATH_IMAGE016
表示指向单词j的词集合,
Figure 936690DEST_PATH_IMAGE017
表示单词i属于词集合
Figure 158723DEST_PATH_IMAGE016
Figure 741889DEST_PATH_IMAGE018
表示单词j指向的单词集合,
Figure 707571DEST_PATH_IMAGE019
表示单词k属于单词集合
Figure 826837DEST_PATH_IMAGE018
Figure 219772DEST_PATH_IMAGE020
表示将单词i与单词j作为两点时两点之间边的权重,
Figure 558743DEST_PATH_IMAGE021
表示将单词j与单词k作为两点时两点之间边的权重,
Figure 62537DEST_PATH_IMAGE022
表示单词j的在文本内容中的TextRank权重值,
Figure 36309DEST_PATH_IMAGE023
表示单词i的逆文档词频。
在一实施例中,提取模块701还用于:
基于每个关键词在文本内容中的TF-IDF权重值和TextRank-IDF权重值,确定每个关键词在文本内容中的TID-Rank权重值,TID-Rank权重值为根据文本内容的长度对关键词的权重进行重新分配的结果;
根据TID-Rank权重值,对多个关键词进行排序,得到排列顺序;
将在排列顺序中的前N个或后N个的关键词作为文本内容的待拓展词,N为预设数量。
在一实施例中,提取模块701还用于:
根据文本内容的文本长度,确定TF-IDF权重值和TextRank-IDF权重值的置信度系数;
基于置信度系数、TF-IDF权重值和TextRank-IDF权重值,根据预设TID-Rank算法计算关键词在文本内容中的TID-Rank权重值。
在一实施例中,预设TID-Rank算法的计算公式为
Figure 600145DEST_PATH_IMAGE026
Figure 157903DEST_PATH_IMAGE027
表示关键词i在所述文本内容中的TID-Rank权重值,
Figure 465388DEST_PATH_IMAGE054
表示增加词性权重后的关键词i在所述文本内容中的TF-IDF权重值,
Figure 559246DEST_PATH_IMAGE055
Figure 293984DEST_PATH_IMAGE030
表示关键词i的词性权重,
Figure 341968DEST_PATH_IMAGE056
表示关键词i在所述文本内容中的TF-IDF权重值,
Figure 187564DEST_PATH_IMAGE057
表示增加词性权重后的关键词i在所述文本内容中的TextRank-IDF权重值,
Figure 135928DEST_PATH_IMAGE033
Figure 41567DEST_PATH_IMAGE034
表示关键词i在所述文本内容中的TextRank-IDF权重值,
Figure 573918DEST_PATH_IMAGE035
表示所述TF-IDF权重值的置信度系数,
Figure 223205DEST_PATH_IMAGE058
,t表示所述文本内容的长度,T表示预设的文本长度阈值,
Figure 291655DEST_PATH_IMAGE037
表示所述TextRank-IDF权重值的置信度系数。
在一实施例中,确定模块702还用于:
若待拓展词为歧义词,则获取待拓展词的多个候选词;
对待拓展词与候选词进行相似度匹配,得到第一相似度;
将与待拓展词的第一相似度最高的候选词作为知识库链接词。
在一实施例中,确定模块702还用于:
若待拓展词为歧义词,则获取视频图像的主题类别,以及在预设知识库中与待拓展词对应的多个词条,每个词条对应的一个分类标签;
对视频图像的主题类别与词条的分类标签进行相似度匹配,得到第二相似度;
将大于第三阈值的第二相似度所对应的词条作为待拓展词的候选词。
在一实施例中,确定模块702还用于:
获取预设知识库中的候选词的知识内容;
提取知识内容的第一词向量,以及提取文本内容的第二词向量;
对第一词向量与第二词向量进行相似度匹配,得到第一相似度。
在一实施例中,确定模块702还用于:
根据预设知识库中的预设歧义词条列表,确定预设歧义词条列表中是否包含待拓展词对应的多个词条;
若确定预设歧义词条列表中包含待拓展词对应的多个词条,则判定待拓展词为歧义词,则。
在一实施例中,确定模块702还用于:
获取待拓展词的多个候选词,以及待拓展词与每个候选词之间的第一相似度、每个候选词的分类标签与视频图像的主题类别之间的第二相似度;
将第一相似度与第二相似度进行求和,得到待拓展词与候选词的第三相似度;
将与待拓展词的第三相似度最高的候选词作为知识库链接词。
在一实施例中,确定模块702还用于:
若待拓展词不为歧义词,则确定待拓展词的重定向同义词;
将重定向同义词作为待拓展词的知识库链接词。
在一实施例中,视频内容的拓展装置还包括:
访问模块,用于访问目标知识库,并抽取目标知识库中的多个词条的三元组信息;
构建模块,用于基于多个词条的三元组信息,构建预设知识库。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图8为本申请一实施例提供的终端设备的结构示意图。如图8所示,该实施例的终端设备8包括:至少一个处理器80(图8中仅示出一个)处理器、存储器81以及存储在存储器81中并可在至少一个处理器80上运行的计算机程序82,处理器80执行计算机程序82时实现上述任意方法实施例中的步骤。
终端设备8可以是手机、桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备可包括但不仅限于处理器80、存储器81。本领域技术人员可以理解,图8仅仅是终端设备8的举例,并不构成对终端设备8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器80可以是中央处理单元(Central Processing Unit,CPU),该处理器80还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器81在一些实施例中可以是所述终端设备8的内部存储单元,例如终端设备8的硬盘或内存。所述存储器81在另一些实施例中也可以是所述终端设备8的外部存储设备,例如所述终端设备8上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器81还可以既包括所述终端设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (18)

1.一种视频内容的拓展方法,其特征在于,包括:
提取视频图像中的文本内容的待拓展词;
确定所述待拓展词的知识库链接词;
根据所述知识库链接词,将预设知识库中与所述知识库链接词对应的知识文本作为所述待拓展词的拓展内容。
2.如权利要求1所述的视频内容的拓展方法,其特征在于,所述提取视频图像中的文本内容的待拓展词,包括:
提取所述视频图像中的文本内容的多个关键词;
基于多个所述关键词,确定所述文本内容的所述待拓展词。
3.如权利要求2所述的视频内容的拓展方法,其特征在于,所述提取所述视频图像中的文本内容的多个关键词,包括:
对所述文本内容进行分词,得到多个单词;
根据预设TF-IDF算法和/或预设TextRank-IDF算法,计算每个所述单词在所述文本内容中的TF-IDF权重值和/或TextRank-IDF权重值;
将TF-IDF权重值大于第一阈值和/或TextRank-IDF权重值大于第二阈值的单词作为所述关键词。
4.如权利要求3所述的视频内容的拓展方法,其特征在于,所述预设TF-IDF算法的计算公式为
Figure 585776DEST_PATH_IMAGE001
Figure 664590DEST_PATH_IMAGE002
表示单词i在所述文本内容中的TF-IDF权重值,
Figure 162568DEST_PATH_IMAGE003
表示单词i的词频,
Figure 606318DEST_PATH_IMAGE004
表示单词i的逆文档词频,
Figure 258754DEST_PATH_IMAGE005
表示单词i的词长权重值,
Figure 78943DEST_PATH_IMAGE006
表示单词i在所述文本内容中出现的次数,
Figure 369110DEST_PATH_IMAGE007
表示所述文本内容中所有单词的数目,
Figure 249341DEST_PATH_IMAGE009
表示预设语料库中所有文档数,
Figure 126424DEST_PATH_IMAGE010
表示所述预设预料库中包含单词i的文档数,
Figure 484724DEST_PATH_IMAGE011
表示单词i的词语长度,
Figure 894977DEST_PATH_IMAGE012
表示所述文本内容中的最长词的词语长度。
5.如权利要求3所述的视频内容的拓展方法,其特征在于,所述预设TextRank-IDF算法的计算公式为
Figure 680530DEST_PATH_IMAGE013
Figure 41979DEST_PATH_IMAGE014
表示单词i在所述文本内容中的TextRank-IDF权重值,d表示阻尼系数,
Figure 203970DEST_PATH_IMAGE015
表示指向单词j的词集合,
Figure 468729DEST_PATH_IMAGE016
表示单词i属于词集合
Figure 690763DEST_PATH_IMAGE015
Figure 542438DEST_PATH_IMAGE017
表示单词j指向的单词集合,
Figure 304857DEST_PATH_IMAGE018
表示单词k属于单词集合
Figure 424123DEST_PATH_IMAGE017
Figure 817058DEST_PATH_IMAGE019
表示将单词i与单词j作为两点时两点之间边的权重,
Figure 654564DEST_PATH_IMAGE020
表示将单词j与单词k作为两点时两点之间边的权重,
Figure 656893DEST_PATH_IMAGE021
表示单词j的在所述文本内容中的TextRank权重值,
Figure 630665DEST_PATH_IMAGE022
表示单词i的逆文档词频。
6.如权利要求2所述的视频内容的拓展方法,其特征在于,所述基于多个所述关键词,确定所述文本内容的所述待拓展词,包括:
基于每个所述关键词在所述文本内容中的TF-IDF权重值和TextRank-IDF权重值,确定每个所述关键词在所述文本内容中的TID-Rank权重值,所述TID-Rank权重值为根据所述文本内容的长度对所述关键词的权重进行重新分配的结果;
根据所述TID-Rank权重值,对多个所述关键词进行排序,得到排列顺序;
将在所述排列顺序中的前N个或后N个所述关键词作为所述文本内容的所述待拓展词,N为预设数量。
7.如权利要求6所述的视频内容的拓展方法,其特征在于,所述基于每个所述关键词在所述文本内容中的TF-IDF权重值和TextRank-IDF权重值,确定每个所述关键词在所述文本内容中的TID-Rank权重值,包括:
根据所述文本内容的文本长度,确定所述TF-IDF权重值和所述TextRank-IDF权重值的置信度系数;
基于所述置信度系数、所述TF-IDF权重值和TextRank-IDF权重值,根据预设TID-Rank算法计算所述关键词在所述文本内容中的TID-Rank权重值。
8.如权利要求7所述的视频内容的拓展方法,其特征在于,所述预设TID-Rank算法的计算公式为
Figure 194502DEST_PATH_IMAGE023
Figure 519304DEST_PATH_IMAGE024
表示关键词i在所述文本内容中的TID-Rank权重值,
Figure 74393DEST_PATH_IMAGE025
表示增加词性权重后的关键词i在所述文本内容中的TF-IDF权重值,
Figure 168251DEST_PATH_IMAGE026
Figure 840672DEST_PATH_IMAGE027
表示关键词i的词性权重,
Figure 449508DEST_PATH_IMAGE028
表示关键词i在所述文本内容中的TF-IDF权重值,
Figure 59218DEST_PATH_IMAGE029
表示增加词性权重后的关键词i在所述文本内容中的TextRank-IDF权重值,
Figure 7583DEST_PATH_IMAGE030
Figure 913222DEST_PATH_IMAGE031
表示关键词i在所述文本内容中的TextRank-IDF权重值,
Figure 947037DEST_PATH_IMAGE032
表示所述TF-IDF权重值的置信度系数,
Figure 832210DEST_PATH_IMAGE033
,t表示所述文本内容的长度,T表示预设的文本长度阈值,
Figure 900660DEST_PATH_IMAGE034
表示所述TextRank-IDF权重值的置信度系数。
9.如权利要求1所述的视频内容的拓展方法,其特征在于,所述确定所述待拓展词的知识库链接词,包括:
若所述待拓展词为歧义词,则获取所述待拓展词的多个候选词;
对所述待拓展词与所述候选词进行相似度匹配,得到第一相似度;
将与所述待拓展词的所述第一相似度最高的所述候选词作为所述知识库链接词。
10.如权利要求9所述的视频内容的拓展方法,其特征在于,所述若所述待拓展词为歧义词,获取所述待拓展词的多个候选词,包括:
若所述待拓展词为歧义词,则获取所述视频图像的主题类别,以及在预设知识库中与所述待拓展词对应的多个词条,每个所述词条对应的一个或多个分类标签;
对所述视频图像的主题类别与所述词条的分类标签进行相似度匹配,得到第二相似度;
将大于第三阈值的所述第二相似度所对应的词条作为所述待拓展词的所述候选词。
11.如权利要求9所述的视频内容的拓展方法,其特征在于,所述对所述待拓展词与所述候选词进行相似度匹配,得到第一相似度,包括:
获取所述预设知识库中的所述候选词的知识内容;
提取所述知识内容的第一词向量,以及提取所述文本内容的第二词向量;
对所述第一词向量与所述第二词向量进行相似度匹配,得到所述第一相似度。
12.如权利要求9所述的视频内容的拓展方法,其特征在于,所述若所述待拓展词为歧义词,则获取所述待拓展词的多个候选词之前,还包括:
根据所述预设知识库中的所述预设歧义词条列表,确定所述预设歧义词条列表中是否包含所述待拓展词对应的多个词条;
若确定所述预设歧义词条列表中包含所述待拓展词对应的多个词条,则判定所述待拓展词为歧义词。
13.如权利要求1所述的视频内容的拓展方法,其特征在于,所述确定所述待拓展词的知识库链接词,包括:
若所述待拓展词为歧义词,则获取所述待拓展词的多个候选词,以及所述待拓展词与每个所述候选词之间的第一相似度、每个所述候选词的分类标签与所述视频图像的主题类别之间的第二相似度;
将所述第一相似度与所述第二相似度进行求和,得到所述待拓展词与所述候选词的第三相似度;
将与所述待拓展词的所述第三相似度最高的所述候选词作为所述知识库链接词。
14.如权利要求1所述的视频内容的拓展方法,其特征在于,所述确定所述待拓展词的知识库链接词,包括:
若所述待拓展词不为歧义词,则确定所述待拓展词的重定向同义词;
将所述重定向同义词作为所述待拓展词的知识库链接词。
15.如权利要求1所述的视频内容的拓展方法,其特征在于,所述确定所述待拓展词的知识库链接词之前,还包括:
访问目标知识库,并抽取所述目标知识库中的多个词条的三元组信息;
基于多个词条的所述三元组信息,构建所述预设知识库。
16.一种视频内容的拓展装置,其特征在于,包括:
提取模块,用于提取视频图像中的文本内容的待拓展词;
确定模块,用于确定所述待拓展词的知识库链接词;
拓展模块,用于根据所述知识库链接词,将预设知识库中与所述知识库链接词对应的知识文本作为所述待拓展词的拓展内容。
17.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至15任一项所述的方法。
18.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至15任一项所述的方法。
CN202010923540.2A 2020-09-04 2020-09-04 视频内容的拓展方法、装置、终端设备及存储介质 Pending CN111813993A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010923540.2A CN111813993A (zh) 2020-09-04 2020-09-04 视频内容的拓展方法、装置、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010923540.2A CN111813993A (zh) 2020-09-04 2020-09-04 视频内容的拓展方法、装置、终端设备及存储介质

Publications (1)

Publication Number Publication Date
CN111813993A true CN111813993A (zh) 2020-10-23

Family

ID=72860001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010923540.2A Pending CN111813993A (zh) 2020-09-04 2020-09-04 视频内容的拓展方法、装置、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN111813993A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420224A (zh) * 2021-07-19 2021-09-21 北京字节跳动网络技术有限公司 一种信息处理的方法、装置以及计算机存储介质
CN113596562A (zh) * 2021-08-06 2021-11-02 北京字节跳动网络技术有限公司 视频处理方法、装置、设备、介质和计算机程序产品
CN113596352A (zh) * 2021-07-29 2021-11-02 北京达佳互联信息技术有限公司 视频的处理方法、处理装置和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104105002A (zh) * 2014-07-15 2014-10-15 百度在线网络技术(北京)有限公司 音视频文件的展示方法和装置
CN107562896A (zh) * 2017-09-06 2018-01-09 华中师范大学 一种基于知识关联的资源组织及展示方法
CN108052630A (zh) * 2017-12-19 2018-05-18 中山大学 一种基于中文教育视频提取拓展词的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104105002A (zh) * 2014-07-15 2014-10-15 百度在线网络技术(北京)有限公司 音视频文件的展示方法和装置
CN107562896A (zh) * 2017-09-06 2018-01-09 华中师范大学 一种基于知识关联的资源组织及展示方法
CN108052630A (zh) * 2017-12-19 2018-05-18 中山大学 一种基于中文教育视频提取拓展词的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
化柏林: "《文本信息分析与全文检索技术》", 30 August 2008, 科学技术文献出版社 *
王瑞 等: "基于上下文词向量和主题模型的实体消歧方法", 《中文信息学报》 *
顾晓雪 等: "结合内容和标签的Web 文本聚类研究", 《现代图书情报技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420224A (zh) * 2021-07-19 2021-09-21 北京字节跳动网络技术有限公司 一种信息处理的方法、装置以及计算机存储介质
CN113596352A (zh) * 2021-07-29 2021-11-02 北京达佳互联信息技术有限公司 视频的处理方法、处理装置和电子设备
CN113596562A (zh) * 2021-08-06 2021-11-02 北京字节跳动网络技术有限公司 视频处理方法、装置、设备、介质和计算机程序产品

Similar Documents

Publication Publication Date Title
US11775760B2 (en) Man-machine conversation method, electronic device, and computer-readable medium
Montejo-Ráez et al. Ranked wordnet graph for sentiment polarity classification in twitter
US8386240B2 (en) Domain dictionary creation by detection of new topic words using divergence value comparison
CN106960030B (zh) 基于人工智能的推送信息方法及装置
CN110674317B (zh) 一种基于图神经网络的实体链接方法及装置
EP3729231A1 (en) Domain-specific natural language understanding of customer intent in self-help
CN109299280B (zh) 短文本聚类分析方法、装置和终端设备
CN111930792B (zh) 数据资源的标注方法、装置、存储介质及电子设备
CN110162771B (zh) 事件触发词的识别方法、装置、电子设备
Firmanto et al. Prediction of movie sentiment based on reviews and score on rotten tomatoes using sentiwordnet
CN111813993A (zh) 视频内容的拓展方法、装置、终端设备及存储介质
US10685012B2 (en) Generating feature embeddings from a co-occurrence matrix
CN105760363B (zh) 文本文件的词义消歧方法及装置
CN110162768B (zh) 实体关系的获取方法、装置、计算机可读介质及电子设备
CN107885717B (zh) 一种关键词提取方法及装置
WO2009026850A1 (en) Domain dictionary creation
CN114880447A (zh) 信息检索方法、装置、设备及存储介质
CN113688310A (zh) 一种内容推荐方法、装置、设备及存储介质
Singh et al. Sentiment analysis using lexicon based approach
Golpar-Rabooki et al. Feature extraction in opinion mining through Persian reviews
CN113204953A (zh) 基于语义识别的文本匹配方法、设备及设备可读存储介质
CN113836938A (zh) 文本相似度的计算方法及装置、存储介质、电子装置
CN117271736A (zh) 一种问答对的生成方法和系统、电子设备及存储介质
CN111737420A (zh) 一种基于争议焦点的类案检索方法及系统及装置及介质
CN112307738A (zh) 用于处理文本的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201023