CN110942070B - 内容展示方法、装置、电子设备及计算机可读存储介质 - Google Patents

内容展示方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110942070B
CN110942070B CN201911210011.1A CN201911210011A CN110942070B CN 110942070 B CN110942070 B CN 110942070B CN 201911210011 A CN201911210011 A CN 201911210011A CN 110942070 B CN110942070 B CN 110942070B
Authority
CN
China
Prior art keywords
subtitle
word
keyword list
text
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911210011.1A
Other languages
English (en)
Other versions
CN110942070A (zh
Inventor
程启健
裴帅帅
陈博
尚岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201911210011.1A priority Critical patent/CN110942070B/zh
Publication of CN110942070A publication Critical patent/CN110942070A/zh
Application granted granted Critical
Publication of CN110942070B publication Critical patent/CN110942070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Abstract

本发明提供了一种内容展示方法、装置、电子设备及计算机可读存储介质,属于计算机技术领域。该方法包括:获取当前播放的媒体数据中当前画面的目标字幕信息,确定与所述目标字幕信息对应的目标知识课程,在所述当前画面中展示所述目标知识课程,从而通过获取媒体数据当前播放画面中的字幕信息后,可以确定与当前字幕信息对应的知识课程,并在当前画面中进行展示,则媒体数据的不同播放画面可以对应不同的知识课程,可以使用户更好地了解媒体数据剧情中的知识点,更好地了解媒体数据所要表达的内容,有效地提高了用户的观影体验。

Description

内容展示方法、装置、电子设备及计算机可读存储介质
技术领域
本发明属于计算机技术领域,特别是涉及一种内容展示方法、装置、电子设备及计算机可读存储介质。
背景技术
随着网络技术的快速发展,视频网站已经成为大众休闲娱乐的重要平台,如用户可以通过访问视频网站来播放视频。
在播放视频的过程中,通常会出现一些用户感兴趣的知识点,例如在某电视剧中的“东莨菪碱”以及“原生家庭”等,这些单词是和整个剧情有密切的关系,用户十分希望了解其实际含义。当前视频网站往往会通过视频的标题、推荐语以及内容简介等文案内容,与知识课程进行关联来为用户展示相应的知识点内容。然而,对于视频的标题、推荐语以及内容简介等文案内容,其所包含的信息量较少,根据这些文案内容为用户推荐的知识课程,有较多的知识点未被囊括,并不能满足用户的需求。
发明内容
本发明提供一种内容展示方法、装置、电子设备及计算机可读存储介质,以便在一定程度上解决基于用户输入执行的操作与用户期望的操作存在偏差,执行操作的准确率较低的问题。
依据本发明的第一方面,提供了一种内容展示方法,所述方法包括:
获取当前播放的媒体数据中当前画面的目标字幕信息;;
确定与所述目标字幕信息对应的目标知识课程;
在所述当前画面中展示所述目标知识课程。
可选地,所述确定与所述目标字幕信息对应的目标知识课程,包括:
对所述目标字幕信息进行分词处理,得到多个字幕单词;
当预设的字幕关键词列表中存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词;
当预设的课程关键词列表中存在与所述第一关键词匹配的课程关键词时,则将所述课程关键词作为针对所述目标字幕信息的第二关键词;
查找与所述第二关键词匹配的目标知识课程。
可选地,所述字幕关键词列表通过如下方式生成:
提取所述媒体数据的字幕文本中各行字幕信息;
对所述各行字幕信息进行分词处理,得到第一单词;
将所述第一单词与预设的文本关键词列表进行匹配,生成与所述第一单词对应的第一匹配结果,所述第一匹配结果包括至少一个与所述文本关键词列表匹配成功的第一目标单词;
采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第一单词进行筛选。
可选地,所述课程关键词列表通过如下方式生成:
对所述介绍文本进行分词处理,得到第二单词;
将所述第二单词与预设的文本关键词列表进行匹配,生成与所述第二单词对应的第二匹配结果,所述第二匹配结果包括至少一个与所述文本关键词列表匹配成功的第二目标单词;
采用所述第二目标单词,生成针对所述预设知识课程的课程关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第二单词进行筛选。
可选地,所述文本关键词列表通过如下方式生成:
分别对所述字幕文本以及所述介绍文本进行分词处理,得到第三单词;
获取所述第三单词的TF-IDF词频特征和标注序列特征,并采用所述词频特征与所述标注序列特征,计算所述第三单词的权重系数;
根据所述第三单词的权重系数,生成针对所述字幕文本与所述介绍文本的文本关键词列表。
可选地,所述采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表,包括:
采用所述媒体数据的媒体信息和所述第一目标单词,生成与所述媒体信息对应的字幕关键词列表;
在判断预设的字幕关键词列表中是否存在与所述字幕单词匹配的字幕关键词的步骤之前,该方法还包括:
获取当前播放的媒体数据的媒体信息,并确定所述媒体信息对应的字幕关键词列表;
所述当预设的字幕关键词列表中存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词,包括:
当所述媒体信息对应的字幕关键词列表中,存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词。
依据本发明的第二方面,提供了一种内容展示装置,所述装置包括:
目标字幕获取模块,用于获取当前播放的媒体数据中当前画面的目标字幕信息;
知识课程确定模块,用于确定与所述目标字幕信息对应的目标知识课程;
知识课程展示模块,用于在所述当前画面中展示所述目标知识课程。
可选地,所述知识课程确定模块包括:
第一分词子模块,用于对所述目标字幕信息进行分词处理,得到多个字幕单词;
第一关键词确定子模块,用于当预设的字幕关键词列表中存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词;
第二关键词确定子模块,用于当预设的课程关键词列表中存在与所述第一关键词匹配的课程关键词时,则将所述课程关键词作为针对所述目标字幕信息的第二关键词;
知识课程查找子模块,用于查找与所述第二关键词匹配的目标知识课程。
可选地,所述字幕关键词列表通过如下模块生成:
字幕信息提取模块,用于提取所述媒体数据的字幕文本中各行字幕信息;
第一分词模块,用于对所述各行字幕信息进行分词处理,得到第一单词;
第一单词匹配模块,用于将所述第一单词与预设的文本关键词列表进行匹配,生成与所述第一单词对应的第一匹配结果,所述第一匹配结果包括至少一个与所述文本关键词列表匹配成功的第一目标单词;
字幕关键词列表生成模块,用于采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第一单词进行筛选。
可选地,所述课程关键词列表通过如下模块生成:
第二分词模块,用于对所述介绍文本进行分词处理,得到第二单词;
第二单词匹配模块,用于将所述第二单词与预设的文本关键词列表进行匹配,生成与所述第二单词对应的第二匹配结果,所述第二匹配结果包括至少一个与所述文本关键词列表匹配成功的第二目标单词;
课程关键词列表生成模块,用于采用所述第二目标单词,生成针对所述预设知识课程的课程关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第二单词进行筛选。
可选地,所述文本关键词列表通过如下模块生成:
第三分词模块,用于分别对所述字幕文本以及所述介绍文本进行分词处理,得到第三单词;
权重系数计算模块,用于获取所述第三单词的TF-IDF词频特征和标注序列特征,并采用所述词频特征与所述标注序列特征,计算所述第三单词的权重系数;
文本关键词列表生成模块,用于根据所述第三单词的权重系数,生成针对所述字幕文本与所述介绍文本的文本关键词列表。
可选地,所述字幕关键词列表生成模块具体用于:
采用所述媒体数据的媒体信息和所述第一目标单词,生成与所述媒体信息对应的字幕关键词列表;
所述装置还包括:
关键词列表确定模块,用于获取当前播放的媒体数据的媒体信息,并确定所述媒体信息对应的字幕关键词列表;
所述第一单词匹配模块具体用于:
当所述媒体信息对应的字幕关键词列表中,存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词。
依据本发明的第三方面,一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如上所述的方法步骤。
依据本发明的第四方面,一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的内容的预测方法。
针对在先技术,本发明具备如下优点:
通过获取当前播放的媒体数据中当前画面的目标字幕信息,确定与所述目标字幕信息对应的目标知识课程,在所述当前画面中展示所述目标知识课程,从而通过获取媒体数据当前播放画面中的字幕信息后,可以确定与当前字幕信息对应的知识课程,并在当前画面中进行展示,则媒体数据的不同播放画面可以对应不同的知识课程,可以使用户更好地了解媒体数据剧情中的知识点,更好地了解媒体数据所要表达的内容,有效地提高了用户的观影体验。
并且,通过在媒体数据播放过程中实时进行知识课程展示,可以提高知识课程推荐的针对性,以及与媒体数据的关联性,可以带来较好的观看转换率,以及知识课程的推广度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种内容展示方法的步骤流程图;
图2是本发明实施例提供的一种内容展示方法中内容展示的示意图
图3是本发明实施例提供的另一种内容展示方法的步骤流程图;
图4是本发明实施例提供的另一种内容展示方法中关键词提取的示意图;
图5是本发明实施例提供的另一种内容展示方法中知识课程确定的示意图;
图6是本发明实施例提供的一种内容展示装置的框图;;
图7是本发明实施例提供的一种电子设备的框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1是本发明实施例提供的一种内容展示方法的步骤流程图,如图1所示,该方法可以包括:
步骤101,获取当前播放的媒体数据中当前画面的目标字幕信息;
随着网络技术的快速发展,视频网站已经成为大众休闲娱乐的重要平台,用户可以通过终端访问视频网站、视频客户端等来播放视频。其中,终端可以包括移动设备,具体可以包括手机、PDA(Personal Digital Assistant,个人数字助理)、膝上型计算机、掌上电脑、智能穿戴设备(如智能手环、智能眼镜、智能头箍等)等等,也可以包括固定设备,具体可以包括车载终端、智能家居等等,本发明实施例对此也不加以限制。在终端中可以通过浏览器访问视频网站,或通过视频客户端以播放视频。
作为一种示例,在视频的播放过程中,对于不同类型的媒体数据,在剧情中,通常会出现一些与剧情相关的专业名词,或是用户感兴趣的知识点,这些出现的单词往往和整个剧情有密切的关系,用户可以通过了解这些单词的含义,更好地了解剧情,从而了解媒体数据所要表达的内容,进而提高用户的观影体验。
在本发明实施例中,当用户通过视频客户端或视频网站播放媒体数据时,客户端或视频网站可以获取当前播放的媒体数据中当前画面的目标字幕信息。其中,在媒体数据播放的过程中,当画面为环境刻画、人物肖像刻画、人物情感表达等场景或人物刻画场景时,其往往不展示字幕信息,而在人物对话、旁白描述等场景时,媒体数据的画面中,则可以展示与当前画面内容对应的字幕信息。
在具体实现中,媒体数据可以为视频影片(下述视频),在视频播放过程中,视频客户端(还可以为视频网站,本发明实施例以客户端为例进行示例性说明)可以实时对视频的播放界面进行识别,并获取当前播放的视频中当前画面的目标字幕信息,如当前画面中出现“这就是原生家庭对你的影响”的字幕时,客户端可以实时获取该字幕信息。
在本发明实施例的一种示例中,当媒体数据的版权方提供了媒体数据的字幕文本时,在视频播放的过程中,视频客户端可以根据视频的播放进度,从字幕文本中提取与当前画面对应的字幕信息;当版权方未提供媒体数据的字幕文本时,视频客户端可以通过OCR(Optical Character Recognition,光学字符识别)识别当前画面中的字幕,并得到对应的字幕信息。
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,在本发明实施例的思想指导下,本领域技术人员可以根据实际情况对字幕信息进行获取,本发明对此不作限制。
步骤102,确定与所述目标字幕信息对应的目标知识课程;
在本发明实施例中,当获取当前播放的媒体数据中当前画面的目标字幕信息后,可以根据目标字幕信息的内容,确定与该内容对应的目标知识课程,则在媒体数据的播放过程中,视频客户端可以实时根据当前的字幕信息,确定与字幕信息对应的目标知识课程,从而在媒体数据的播放过程中,可以根据媒体数据的字幕信息,实时地根据字幕信息推荐对应的知识课程,使用户在观看视频的过程中,可以更好地了解媒体数据剧情中的知识点,提高用户的观影体验。
在具体实现中,不同的视频画面可以显示不同的字幕信息,不同的字幕信息可以对应不同的知识课程。其中,当字幕信息包括知识点词汇时,则该字幕信息可以对应至少一个与该知识点词汇匹配的知识课程;当字幕信息不包括知识点词汇时,则该字幕信息不对应任何知识课程,即在媒体数据的播放过程中,一部分画面不展示字幕信息,一部分画面展示字幕信息,在所有字幕信息中,包含知识点词汇的字幕信息,可以对应知识课程,不包含知识点词汇的字幕信息,不对应任何知识课程。其中,知识点词汇可以为某技术领域中的专业名词,特殊对象的名称等,如原生家庭、机器学习、冬虫夏草、服务器等等。
例如,在某画面中展示字幕信息为“这就是原生家庭对你的影响”,该字幕中包含“原生家庭”这一个知识点词汇,则该字幕信息可以对应至少一个与“原生家庭”匹配的知识课程;如画面中展示字幕信息为“今天天气很好”、“今晚吃了面条”、“今天心情有点糟糕”等字幕时,字幕信息中不包含任何知识点词汇,则不对应任何知识课程。
具体的,知识课程可以包括介绍文本,介绍文本可以包括知识课程的标题、推荐语以及课程内容描述等文本,介绍文本之间可以包括不同或相同的内容,则不同的知识课程可以对应不同的介绍文本,或具有部分相同内容的介绍文本,从而当字幕信息中包括某一知识点词汇时,该知识点词汇可以对应至少一个知识课程,进而该字幕信息可以对应至少一个知识课程。
当视频客户端在获取了当前播放的视频中画面展示的字幕信息后,可以将字幕信息中包含的内容,与知识课程的介绍文本进行匹配,确定与字幕信息对应的至少一个目标知识课程,实现将相关的知识课程与视频中的知识点词汇进行关联,在视频播放过程中,自动匹配与知识点词汇对应的知识课程,使用户更好地了解媒体数据剧情中的知识点,更好地了解媒体数据所要表达的内容,有效地提高了用户的观影体验。
步骤103,在所述当前画面中展示所述目标知识课程。
在本发明实施例中,当确定与目标字幕信息对应的至少一个目标知识课程后,可以在媒体数据的播放画面中,展示至少一个目标知识课程,从而在媒体数据的播放过程中,可以根据字幕信息中的知识点词汇为用户推荐与字幕信息匹配的知识课程,使用户更好地了解媒体数据剧情中的知识点,更好地了解媒体数据所要表达的内容,有效地提高了用户的观影体验。
在具体实现中,可以在视频画面的局部通过弹窗、浮窗以及遮罩层等方式展示目标知识课程的内容,并允许用户在观看过程中,通过点击该弹窗(或浮窗、遮罩层等),一键直达所推荐的知识课程界面,进行知识课程浏览,以了解媒体数据剧情中的知识点。其中,在展示目标知识课程的过程中,可以保持一定的展示时间,而不是在字幕信息刷新时,将目标知识过程一并关闭,从而可以为用户提供一定的时间以考虑是否浏览该知识课程,并且,在展示过程中,还可以为用户提供关闭控件,当用户不需要浏览该知识课程时,可以通过该关闭控件关闭目标知识课程的展示,进而在知识课程的展示过程中,可以为用户提供与媒体数据剧情关联的知识课程,同时还可以为用户提供个性化的知识课程处理方式,不仅可以使用户更好地了解媒体数据剧情中的知识点,还可以,通过在媒体数据播放过程中实时进行知识课程展示,可以提高知识课程推荐的针对性,以及与媒体数据的关联性,可以带来较好的观看转换率,以及知识课程的推广度。
在本发明实施例的一种示例中,如图2所示,是本发明实施例提供的一种内容展示方法中内容展示的示意图,用户通过视频客户端播放视频时,当视频当前画面的字幕信息为“这就是原生家庭对你的影响”,则该字幕信息中包含“原生家庭”这一知识点词汇,视频客户端可以确定与“原生家庭”对应的目标知识课程,如《如何与原生家庭和解》,并通过弹窗的方式在当前的画面中展示该知识课程,从而观看的用户可以点击该弹窗,并了解浏览《如何与原生家庭和解》以获取对应的内容,从而在媒体数据的播放过程中,可以使用户更好地了解媒体数据剧情中的知识点,更好地了解媒体数据所要表达的内容,有效地提高了用户的观影体验。
在本发明实施例中,通过获取当前播放的媒体数据中当前画面的目标字幕信息,确定与所述目标字幕信息对应的目标知识课程,在所述当前画面中展示所述目标知识课程,从而通过获取媒体数据当前播放画面中的字幕信息后,可以确定与当前字幕信息对应的知识课程,并在当前画面中进行展示,则媒体数据的不同播放画面可以对应不同的知识课程,可以使用户更好地了解媒体数据剧情中的知识点,更好地了解媒体数据所要表达的内容,有效地提高了用户的观影体验。
并且,通过在媒体数据播放过程中实时进行知识课程展示,可以提高知识课程推荐的针对性,以及与媒体数据的关联性,可以带来较好的观看转换率,以及知识课程的推广度。
图3是本发明实施例提供的另一种内容展示方法的步骤流程图,如图3所示,该方法可以包括:
步骤301,获取当前播放的媒体数据中当前画面的目标字幕信息;
在具体实现中,媒体数据可以为视频影片,在视频播放过程中,视频客户端可以实时对视频的播放界面进行识别,并获取当前播放的视频中当前画面的目标字幕信息,如当前画面中出现“这就是原生家庭对你的影响”的字幕时,客户端可以实时获取该字幕信息。
步骤302,确定与所述目标字幕信息对应的目标知识课程;
在本发明实施例中,当获取当前播放的媒体数据中当前画面的目标字幕信息后,可以根据目标字幕信息的内容,确定与该内容对应的目标知识课程,则在媒体数据的播放过程中,视频客户端可以实时根据当前的字幕信息,确定与字幕信息对应的目标知识课程,从而在媒体数据的播放过程中,可以根据媒体数据的字幕信息,实时地根据字幕信息推荐对应的知识课程,使用户在观看视频的过程中,可以更好地了解媒体数据剧情中的知识点,提高用户的观影体验。
在本发明实施例一种可选实施例中,在用户开始播放媒体数据时,视频客户端可以通过获取媒体数据的字幕文本,以及各个预设知识课程的介绍文本,接着分别对字幕文本以及介绍文本进行分词处理,得到第三单词,然后获取第三单词的TF-IDF词频特征和标注序列特征,并采用词频特征与标注序列特征,计算第三单词的权重系数,并根据第三单词的权重系数,生成针对字幕文本与介绍文本的文本关键词列表,从而通过将媒体数据的字幕文本,以及各个知识课程的介绍文本进行整合,提取所有文本的关键词,使得每一个提取的关键词,在媒体数据的字幕文本以及知识课程的介绍文本均被认可,进而提高了知识课程推荐的精准度。
在具体实现中,字幕文本可以包括媒体数据中所有的字幕信息,介绍文本可以包括知识课程的标题、推荐语以及课程内容描述等文本,其中,对于所有知识课程的文本集合,可以在媒体数据开始播放之前进行获取,也可以直接获取已经提取了关键词的知识课程关键词。
客户端对字幕文本以及介绍文本进行分词处理后,可以得到多个第三单词,然后通过TF/IDF技术对第三单词进行筛选。具体的,TF(Term Frequency,词频)可以统计各个单词出现的频率,IDF(Inverse Document Frequency,逆文本频率指数)可以用于衡量各个单词的普遍重要性,则可以通过采用词频特征和标注序列特征,计算各个第三单词的权重系数(如TF-IDF分值),并根据权重系数实现对各个第三单词进行筛选,从而可以过滤掉常见的词语,并重要的词语,如可以过滤掉“的”、“也”、“我”、“你”、“他”、“她”、“啊”、“呀”等无意义的单词,然后采用TF/IDF筛选出来的单词,生成针对字幕文本与介绍文本的文本关键词列表,使得每一个提取的关键词,在媒体数据的字幕文本以及知识课程的介绍文本均被认可,进而提高了知识课程推荐的精准度。
在本发明实施例的一种示例中,如图4所示,示出了本发明实施例提供的另一种内容展示方法中关键词提取的示意图,某视频的字幕文本可以包括“把每个人的出生家庭”、“称为原生家庭”、“原生家庭对人的一生的影响”、“非常大”、“包括人际交往模式、认知模式”、“情商以及性格”“、每个人要想改善自己的人际关系”、“调整好自己”、“都必须先回溯原生家庭”、“这样才能真正地认知自我”以及“修复好自己”等字幕信息,知识课程可以包括《原生家庭对个人成长的影响》、《如何与原生家庭进行和解》、《如何形成一个良好的人际关系》、《什么是人际交往模式》、《什么是认知模式》、《如何做一个高情商的人》等,在本示例中,以知识课程的标题为了进行说明,可以理解的是,对于推荐语以及课程内容描述,其与知识课程的标题相同,在此不再赘述。则视频客户端获取了该视频的字幕文本以及各个知识课程的介绍文本后,可以进行分词处理,接着再使用TF/IDF对文本进行关键词提取,过滤掉无意义的词语,从而可以得到下述文本关键词列表:
文本关键词列表
原生家庭
人际交往
人际关系
认知模式
情商
表1
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,在本发明实施例的思想指导下,本领域技术人员可以根据实际情况对文本关键词进行提取,本发明对此不作限制。
在本发明实施例中,在得到文本关键词列表后,可以通过如下方式生成与媒体数据对应的字幕关键词列表:获取所述媒体数据的字幕文本中各行字幕信息;对所述各行字幕信息进行分词处理,得到第一单词;将所述第一单词与预设的文本关键词列表进行匹配,生成与所述第一单词对应的第一匹配结果,所述第一匹配结果包括至少一个与所述文本关键词列表匹配成功的第一目标单词;采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表。
在具体实现中,当生成文本关键词列表后,视频客户端可以分别获取媒体数据字幕文本中的各行字幕信息,并对各行字幕信息进行分词,从而得到与各行字幕信息对应的多个第一单词。接着可以分别采用每行字幕信息对应的多个第一单词,与文本关键词列表中的关键词进行匹配,当文本关键词列表存在与第一单词相同的第一目标单词时,则采用各个第一目标单词与媒体信息,生成与媒体数据对应的字幕关键词列表。
需要说明的是,媒体信息可以为媒体数据的标识信息,如媒体数据的媒体名称、视频ID以及资源标识等等,本发明对此不作限制。
其中,不同的字幕信息可以对应不同的第一目标单词,也可以对应相同的第一目标单词,其与字幕信息中包含的知识点词汇关联,当不同的字幕信息中包含相同的知识点词汇时,可以对应相同的第一目标单词;当不同的字幕信息中包含不同的知识点词汇时,则可以分别对应不同的第一目标单词。
此外,当得到各行字幕信息对应的第一目标单词后,可以采用媒体数据的媒体信息,以及各个所述第一目标单词,生成与媒体数据匹配的字幕关键词列表。具体的,可以按照媒体信息、字幕信息与关键词列表的格式,生成字幕关键词列表,并存入高速缓存Redis数据库中。
在本发明实施例的一种示例中,如图4所示,示出了本发明实施例提供的另一种内容展示方法中关键词提取的示意图,当生成文本关键词列表后,可以获取视频的所有字幕信息,并分别对字幕信息进行分词,接着可以从文本关键词列表中提取与字幕信息匹配的第一目标单词,并生成字幕关键词列表,然后存入高速缓存Redis数据库中。具体的,某视频的字幕文本可以包括“把每个人的出生家庭”、“称为原生家庭”、“原生家庭对人的一生的影响”、“非常大”、“包括人际交往模式、认知模式”、“情商以及性格”、“每个人要想改善自己的人际关系”、“调整好自己”、“都必须先回溯原生家庭”、“这样才能真正地认知自我”以及“修复好自己”等字幕信息。媒体数据可以对应一个媒体信息,并包括多行字幕信息,一行字幕信息可以对应至少一个字幕关键词,可以不对应任何字幕关键词,则可以将媒体信息、字幕信息与字幕关键词三者之间的对应关系,按照列表格式,生成字幕关键词列表,并存入高速缓存Redis数据库中。字幕关键词列表如下表2所示:
媒体信息 字幕信息 字幕关键词
媒体的名称 把每个人的出生家庭 -
媒体的名称 称为原生家庭 原生家庭
媒体的名称 原生家庭对人的一生的影响 原生家庭
媒体的名称 非常大 -
媒体的名称 包括人际交往模式、认知模式 人际交往、认知模式
媒体的名称 情商以及性格 情商
媒体的名称 每个人要想改善自己的人际关系 人际关系
媒体的名称 调整好自己 -
媒体的名称 都必须先回溯原生家庭 原生家庭
媒体的名称 这样才能真正地认知自我 -
媒体的名称 修复好自己 -
表2
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,在本发明实施例的思想指导下,本领域技术人员可以根据实际情况对字幕关键词进行提取,本发明对此不作限制。
在本发明实施例中,当得到文本关键词列表后,还可以通过如下方式生成课程关键词列表:对所述介绍文本进行分词处理,得到第二单词;将所述第二单词与预设的文本关键词列表进行匹配,生成与所述第二单词对应的第二匹配结果,所述第二匹配结果包括至少一个与所述文本关键词列表匹配成功的第二目标单词;采用所述第二目标单词,生成针对所述预设知识课程的课程关键词列表。
在具体实现中,当生成文本关键词列表后,视频客户端还可以分别获取各个知识课程的介绍文本,并对介绍文本进行分词,从而得到与各个知识课程对应的多个第二单词。接着可以分别采用各个知识课程对应的第二单词,与文本关键词列表中的关键词进行匹配,当文本关键词列表存在与第三单词相同的第二目标单词时,则采用各个第二目标单词,生成与预设知识课程对应的课程关键词列表。
其中,不同的知识课程可以对应不同的第二目标单词,也可以对应相同的第二目标单词,其与知识课程中包含的知识点词汇关联,当不同的知识课程中包含相同的知识点词汇时,可以对应相同的第二目标单词;当不同的知识课程中包含不同的知识点词汇时,可以分别对应不同的第二目标单词,则一个第二目标单词可以对应多个不同的知识课程。
当得到各个知识课程对应的第二目标单词后,可以采用知识课程的名称,以及各个所述第二目标单词,生成与媒体数据匹配的课程关键词列表。具体的,可以按照类型、关键词与第二目标单词的列表格式,生成课程关键词列表,并存入高速缓存中。其中,类型可以包括人工配置以及自动配置,人工配置可以为运营人员对课程关键词列表进行人工配置的过程,自动配置则可以为上述生成课程关键词列表的过程。
在本发明实施例的一种示例中,如图4所示,示出了本发明实施例提供的另一种内容展示方法中关键词提取的示意图,当生成文本关键词列表后,视频客户端还可以分别获取各个知识课程的介绍文本,并对介绍文本进行分词,并与文本关键词列表中的关键词进行匹配,从而得到与各个知识课程对应的第二目标单词,然后存入Redis数据库中。具体的,知识课程可以包括《原生家庭对个人成长的影响》、《如何与原生家庭进行和解》、《如何形成一个良好的人际关系》、《什么是人际交往模式》、《什么是认知模式》、《如何做一个高情商的人》等,则对这些知识课程的介绍文本进行处理后,可以将类型、关键词与知识课程列表三者之间的对应关系,按照列表格式生成对应的课程关键词列表,如下表3所示:
表3
当生成课程关键词列表后,还可以按照一定的顺序进行排序,如按照倒排或顺排的方式进行排序,本发明对此不作限制。
需要说明的是,在本发明实施例中以从知识课程的标题中提取关键词为例进行示例性说明,可以理解的是,本发明实施例还可以从知识课程的介绍信息、简要信息等内容中提取关键词。
在本发明实施例中,还可以通过人工干预设置课程关键词列表,通过数据人员或工作人员,进行关键词、知识课程列表的人工配置,从而可以配置更高优先级的知识课程列表,提高知识课程推荐的精准度。
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,在本发明实施例的思想指导下,本领域技术人员可以根据实际情况对课程关键词进行提取,本发明对此不作限制。
在本发明实施例的一种可选实施例中,当生成文本关键词列表、字幕关键词列表以及课程关键词列表后,步骤302可以包括如下子步骤:
子步骤S11,对目标字幕信息进行分词处理,得到多个字幕单词;
子步骤S12,当字幕关键词列表中存在与字幕单词匹配的字幕关键词时,则将字幕关键词作为针对目标字幕信息的第一关键词;
子步骤S13,当课程关键词列表中存在与第一关键词匹配的课程关键词时,则将课程关键词作为针对目标字幕信息的第二关键词;;
子步骤S14,查找与第二关键词匹配的目标知识课程。
在具体实现中,可以先对目标字幕信息进行分词处理,得到多个字幕单词,接着可以将各个字幕单词与字幕关键词列表中的字幕关键词进行匹配,当字幕关键词列表中存在与字幕单词匹配的字幕关键词时,,则将字幕关键词作为针对目标字幕信息的第一关键词,从而得到与目标字幕信息对应的至少一个第一关键词。
在具体实现中,当得到与目标字幕信息对应的至少一个第一关键词后,可以将各个第一关键词与课程关键词列表中的课程关键词进行匹配,当课程关键词列表中存在与第一关键词对应的课程关键词时,则将课程关键词作为针对目标字幕信息的第二关键词,从而确定与至少一个第二关键词匹配的目标知识课程。
需要说明的是,字幕单词与字幕关键词列表、第一关键词与课程关键词列表的匹配方式可以为从列表中查找相同的单词,也可以是先判断相似度/匹配度,然后再根据相似度/匹配度大于预设阈值来确定是否匹配成功,本发明实施例中以查找相同的单词为例进行示例性说明,可以理解的是,本发明对此不作限制。
在本发明实施例的一种示例中,在视频播放过程中,当前画面的目标字幕信息为“把每个人的出生家庭”时,此时字幕信息中未包含任何知识点词汇,则继续获取,当目标字幕信息刷新为“原生家庭对人的一生的影响”时,视频客户端可以对该字幕信息继续分词,获得“原生家庭”、“对人”、“的”、“一生”、“的”以及“影响”等单词后,可以将这些单词与字幕关键词列表进行匹配,以提取对应的第一关键词,则字幕信息“原生家庭对人的一生的影响”对应的第一关键词为“原生家庭”,接着采用该第一关键词“原生家庭”,从课程关键词列表中,确定与该第一关键词匹配的知识课程,为《原生家庭对个人成长的影响》以及《如何与原生家庭进行和解》,即目标知识课程列表包括上述两个知识课程;当目标字幕信息刷新为“包括人际交往模式、认知模式”时,分词后,获得“包括”、“人际交往”、“模式”以及“认知模式”等单词,进一步可以得到第一关键词包括“人际交往”以及“认知模式”。然后可以采用这些第一关键词,从课程关键词列表中,确定与该第一关键词匹配的知识课程,为《什么是人际交往模式》、《什么是认知模式》,即目标知识课程列表可以包括上述两个课程等等。
在本发明实施例的另一种可选实施例中,当生成文本关键词列表、字幕关键词列表以及课程关键词列表后,步骤302可以还包括如下子步骤:
子步骤S21,对目标字幕信息进行分词处理,得到多个字幕单词;
子步骤S22,获取当前播放的媒体数据的媒体信息,并确定媒体信息对应的字幕关键词列表;
子步骤S22,当媒体信息对应的字幕关键词列表中,存在与字幕单词匹配的字幕关键词时,则将字幕关键词作为与目标字幕信息对应的第一关键词;
子步骤S24,当课程关键词列表中存在与第一关键词匹配的课程关键词时,则将课程关键词作为针对目标字幕信息的第二关键词;;
子步骤S25,查找与第二关键词匹配的目标知识课程。
在具体实现中,通过媒体数据的媒体信息,确定对应的字幕关键词列表后,可以将各个字幕单词与字幕关键词列表进行匹配,并得到第一关键词,然后进一步与课程关键词列表进行匹配,得到第二关键词,从而根据第二关键词查找目标知识课程。
需要说明的是,当目标字幕信息中未包含任何知识点词汇时,则无法查找到与目标字幕信息对应的知识课程。
在本发明实施例的另一种可选实施例中,客户端还可以采用媒体信息与目标字幕信息从字幕关键词列表中提取对应的关键词。具体的,媒体信息可以为媒体数据的视频名称,则可以通过“视频名称”+“当前字幕信息”从字幕关键词列表中,提取与目标字幕信息对应的至少一个第三关键词,从而可以通过不同的方式获取与目标字幕信息对应的关键词,实现多层次的关键词查询,有利于提高关键词查询的精确度,进一步提高知识课程匹配的精准度。
当得到与目标字幕信息匹配的至少一个第三关键词后,,可以将各个第三关键词与课程关键词列表中的课程关键词进行匹配,当课程关键词列表中存在与第三关键词相同的课程关键词时,则将课程关键词作为针对目标字幕信息的第四关键词,从而确定与第四关键词对应的至少一个目标知识课程。
在本发明实施例的一种示例中,如图5所示,示出了本实施例提供的另一种内容展示方法中知识课程确定的示意图,在视频播放过程中,当前画面的目标字幕信息为“把每个人的出生家庭”时,此时字幕信息中未包含任何知识点词汇,则继续获取,当目标字幕信息刷新为“原生家庭对人的一生的影响”时,可以直接采用该视频的视频名称以及目标字幕信息,到Redis缓存中的字幕关键词列表中,查询对应的关键词,从而得到字幕信息“原生家庭对人的一生的影响”对应的第一关键词为“原生家庭”,接着采用该第一关键词“原生家庭”,从课程关键词列表中,确定与该第一关键词匹配的知识课程,为《原生家庭对个人成长的影响》以及《如何与原生家庭进行和解》,即目标知识课程列表包括上述两个知识课程;当目标字幕信息刷新为“包括人际交往模式、认知模式”时,可以直接采用该视频的视频名称以及目标字幕信息,到Redis缓存中的字幕关键词列表中,查询对应的关键词,可以得到第一关键词包括“人际交往”以及“认知模式”。然后可以采用这些第一关键词,从课程关键词列表中,确定与该第一关键词匹配的知识课程,为《什么是人际交往模式》、《什么是认知模式》,即目标知识课程列表可以包括上述两个课程等等。
并且,在进行知识课程查询的过程前,可以先根据第一关键词,查询人工配置的知识课程列表,当未查询到相应的知识课程时,则可以进一步根据第一关键词查询自动配置的知识课程列表,从而通过不同优先级的查询方式,可以提高知识课程推荐的精准度。
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,在本发明实施例的思想指导下,本领域技术人员可以根据实际情况进行设置,本发明对此不作限制。
步骤304,在所述当前界面中,生成与所述目标知识课程对应的课程弹窗;
在具体实现中,当确定目标知识课程列表后,视频客户端可以在画面中生成一个课程弹窗,课程弹窗可以根据目标知识课程的数量进行生成。其中,课程弹窗包括半透明的弹窗、浮窗以及遮罩层中的至少一种
步骤305,通过所述课程弹窗展示所述目标知识课程以实现知识课程访问。
在具体实现中,可以在视频画面的局部通过课程弹窗方式展示目标知识课程的内容,并允许用户在观看过程中,通过点击该弹窗,客户端可以响应作用于课程弹窗的点击操作,展示目标知识课程以实现知识课程访问,从而实现一键直达所推荐的知识课程界面,进行知识课程浏览,以了解媒体数据剧情中的知识点。
其中,在展示目标知识课程的过程中,可以保持一定的展示时间,而不是在字幕信息刷新时,将目标知识过程一并关闭,从而可以为用户提供一定的时间以考虑是否浏览该知识课程,并且,在展示过程中,还可以为用户提供关闭控件,当用户不需要浏览该知识课程时,可以通过该关闭控件关闭目标知识课程的展示,进而在知识课程的展示过程中,可以为用户提供与媒体数据剧情关联的知识课程,同时还可以为用户提供个性化的知识课程处理方式,不仅可以使用户更好地了解媒体数据剧情中的知识点,还可以通过在媒体数据播放过程中实时进行知识课程展示,可以提高知识课程推荐的针对性,以及与媒体数据的关联性,可以带来较好的观看转换率,以及知识课程的推广度。
在本发明实施例中,通过获取当前播放的媒体数据中当前画面的目标字幕信息,确定与所述目标字幕信息对应的目标知识课程,在所述当前画面中展示所述目标知识课程,从而通过获取媒体数据当前播放画面中的字幕信息后,可以确定与当前字幕信息对应的知识课程,并在当前画面中进行展示,则媒体数据的不同播放画面可以对应不同的知识课程,可以使用户更好地了解媒体数据剧情中的知识点,更好地了解媒体数据所要表达的内容,有效地提高了用户的观影体验。
并且,通过在媒体数据播放过程中实时进行知识课程展示,可以提高知识课程推荐的针对性,以及与媒体数据的关联性,可以带来较好的观看转换率,以及知识课程的推广度。
图6是本发明实施例提供的一种内容展示装置的框图,,如图6所示,具体可以包括如下模块:
目标字幕获取模块601,用于获取当前播放的媒体数据中当前画面的目标字幕信息;
知识课程确定模块602,用于确定与所述目标字幕信息对应的目标知识课程;
知识课程展示模块603,用于在所述当前画面中展示所述目标知识课程。
在本发明实施例的一种可选实施例中,所述知识课程确定模块602包括:
第一分词子模块,用于对所述目标字幕信息进行分词处理,得到多个字幕单词;
第一关键词确定子模块,用于当预设的字幕关键词列表中存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词;
第二关键词确定子模块,用于当预设的课程关键词列表中存在与所述第一关键词匹配的课程关键词时,则将所述课程关键词作为针对所述目标字幕信息的第二关键词;
知识课程查找子模块,用于查找与所述第二关键词匹配的目标知识课程。
在本发明实施例的一种可选实施例中,所述字幕关键词列表通过如下模块生成:
字幕信息提取模块,用于提取所述媒体数据的字幕文本中各行字幕信息;
第一分词模块,用于对所述各行字幕信息进行分词处理,得到第一单词;
第一单词匹配模块,用于将所述第一单词与预设的文本关键词列表进行匹配,生成与所述第一单词对应的第一匹配结果,所述第一匹配结果包括至少一个与所述文本关键词列表匹配成功的第一目标单词;
字幕关键词列表生成模块,用于采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第一单词进行筛选。
在本发明实施例的一种可选实施例中,所述课程关键词列表通过如下模块生成:
第二分词模块,用于对所述介绍文本进行分词处理,得到第二单词;
第二单词匹配模块,用于将所述第二单词与预设的文本关键词列表进行匹配,生成与所述第二单词对应的第二匹配结果,所述第二匹配结果包括至少一个与所述文本关键词列表匹配成功的第二目标单词;
课程关键词列表生成模块,用于采用所述第二目标单词,生成针对所述预设知识课程的课程关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第二单词进行筛选。
在本发明实施例的一种可选实施例中,所述文本关键词列表通过如下模块生成:
第三分词模块,用于分别对所述字幕文本以及所述介绍文本进行分词处理,得到第三单词;
权重系数计算模块,用于获取所述第三单词的TF-IDF词频特征和标注序列特征,并采用所述词频特征与所述标注序列特征,计算所述第三单词的权重系数;
文本关键词列表生成模块,用于根据所述第三单词的权重系数,生成针对所述字幕文本与所述介绍文本的文本关键词列表。
在本发明实施例的一种可选实施例中,所述字幕关键词列表生成模块具体用于:
采用所述媒体数据的媒体信息和所述第一目标单词,生成与所述媒体信息对应的字幕关键词列表;
该装置还包括:
关键词列表确定模块,用于获取当前播放的媒体数据的媒体信息,并确定所述媒体信息对应的字幕关键词列表;
所述第一单词匹配模块具体用于:
当所述媒体信息对应的字幕关键词列表中,存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词。
综上所述,本发明实施例技术效果:通过获取当前播放的媒体数据中当前画面的目标字幕信息,确定与所述目标字幕信息对应的目标知识课程,在所述当前画面中展示所述目标知识课程,从而通过获取媒体数据当前播放画面中的字幕信息后,可以确定与当前字幕信息对应的知识课程,并在当前画面中进行展示,则媒体数据的不同播放画面可以对应不同的知识课程,可以使用户更好地了解媒体数据剧情中的知识点,更好地了解媒体数据所要表达的内容,有效地提高了用户的观影体验。
并且,通过在媒体数据播放过程中实时进行知识课程展示,可以提高知识课程推荐的针对性,以及与媒体数据的关联性,可以带来较好的观看转换率,以及知识课程的推广度。
对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
另外,本发明实施例还提供一种电子设备,如图7所示,,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现如下步骤:
获取当前播放的媒体数据中当前画面的目标字幕信息;;
确定与所述目标字幕信息对应的目标知识课程;
在所述当前画面中展示所述目标知识课程。
在本发明实施例的一种可选实施例中,所述确定与所述目标字幕信息对应的目标知识课程,包括:
对所述目标字幕信息进行分词处理,得到多个字幕单词;
当预设的字幕关键词列表中存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词;
当预设的课程关键词列表中存在与所述第一关键词匹配的课程关键词时,则将所述课程关键词作为针对所述目标字幕信息的第二关键词;
查找与所述第二关键词匹配的目标知识课程。
在本发明实施例的一种可选实施例中,所述字幕关键词列表通过如下方式生成:
获取所述媒体数据的字幕文本中各行字幕信息;
对所述各行字幕信息进行分词处理,得到第一单词;
将所述第一单词与预设的文本关键词列表进行匹配,生成与所述第一单词对应的第一匹配结果,所述第一匹配结果包括至少一个与所述文本关键词列表匹配成功的第一目标单词;
采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第一单词进行筛选。
在本发明实施例的一种可选实施例中,所述课程关键词列表通过如下方式生成:
对所述介绍文本进行分词处理,得到第二单词;
将所述第二单词与预设的文本关键词列表进行匹配,生成与所述第二单词对应的第二匹配结果,所述第二匹配结果包括至少一个与所述文本关键词列表匹配成功的第二目标单词;
采用所述第二目标单词,生成针对所述预设知识课程的课程关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第二单词进行筛选。
在本发明实施例的一种可选实施例中,所述文本关键词列表通过如下方式生成:
分别对所述字幕文本以及所述介绍文本进行分词处理,得到第三单词;
获取所述第三单词的TF-IDF词频特征和标注序列特征,并采用所述词频特征与所述标注序列特征,计算所述第三单词的权重系数;
根据所述第三单词的权重系数,生成针对所述字幕文本与所述介绍文本的文本关键词列表。
在本发明实施例的一种可选实施例中,所述采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表,包括:
采用所述媒体数据的媒体信息和所述第一目标单词,生成与所述媒体信息对应的字幕关键词列表;
在判断预设的字幕关键词列表中是否存在与所述字幕单词匹配的字幕关键词的步骤之前,该方法还包括:
获取当前播放的媒体数据的媒体信息,并确定所述媒体信息对应的字幕关键词列表;
所述当预设的字幕关键词列表中存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词,包括:
当所述媒体信息对应的字幕关键词列表中,存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的内容的预测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的内容的预测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种内容展示方法,其特征在于,所述方法包括:
获取当前播放的媒体数据中当前画面的目标字幕信息;
根据预设的字幕关键词列表和预设的课程关键词列表确定与所述目标字幕信息对应的目标知识课程,所述字幕关键词列表包括若干个关键词,所述课程关键词列表包括与所述关键词关联的知识课程;
通过课程弹窗的形式在所述当前画面中展示所述目标知识课程;
其中,所述根据预设的字幕关键词列表和预设的课程关键词列表确定与所述目标字幕信息对应的目标知识课程,包括:
对所述目标字幕信息进行分词处理,得到多个字幕单词;
当所述预设的字幕关键词列表中存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词,所述字幕关键词列表为依据所述媒体数据的字幕文本与预设的文本关键词列表生成的关键词列表;
当所述预设的课程关键词列表中存在与所述第一关键词匹配的课程关键词时,则将所述课程关键词作为针对所述目标字幕信息的第二关键词,所述课程关键词列表为依据所述媒体数据的介绍文本与预设的文本关键词列表生成的关键词列表;
查找与所述第二关键词匹配的目标知识课程;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表。
2.根据权利要求1所述的方法,其特征在于,所述字幕关键词列表通过如下方式生成:
获取所述媒体数据的字幕文本中各行字幕信息;
对所述各行字幕信息进行分词处理,得到第一单词;
将所述第一单词与预设的文本关键词列表进行匹配,生成与所述第一单词对应的第一匹配结果,所述第一匹配结果包括至少一个与所述文本关键词列表匹配成功的第一目标单词;
采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表;
其中,所述文本关键词列表用于对所述第一单词进行筛选。
3.根据权利要求1所述的方法,其特征在于,所述课程关键词列表通过如下方式生成:
对所述介绍文本进行分词处理,得到第二单词;
将所述第二单词与预设的文本关键词列表进行匹配,生成与所述第二单词对应的第二匹配结果,所述第二匹配结果包括至少一个与所述文本关键词列表匹配成功的第二目标单词;
采用所述第二目标单词,生成针对所述预设知识课程的课程关键词列表;
其中,所述文本关键词列表用于对所述第二单词进行筛选。
4.根据权利要求2或3所述的方法,其特征在于,所述文本关键词列表通过如下方式生成:
分别对所述字幕文本以及所述介绍文本进行分词处理,得到第三单词;
获取所述第三单词的TF-IDF词频特征和标注序列特征,并采用所述词频特征与所述标注序列特征,计算所述第三单词的权重系数;
根据所述第三单词的权重系数,生成针对所述字幕文本与所述介绍文本的文本关键词列表。
5.根据权利要求2所述的方法,其特征在于,所述采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表,包括:
采用所述媒体数据的媒体信息和所述第一目标单词,生成与所述媒体信息对应的字幕关键词列表;
在判断预设的字幕关键词列表中是否存在与所述字幕单词匹配的字幕关键词的步骤之前,该方法还包括:
获取当前播放的媒体数据的媒体信息,并确定所述媒体信息对应的字幕关键词列表;
所述当预设的字幕关键词列表中存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词,包括:
当所述媒体信息对应的字幕关键词列表中,存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词。
6.一种内容展示装置,其特征在于,所述装置包括:
目标字幕获取模块,用于获取当前播放的媒体数据中当前画面的目标字幕信息;
知识课程确定模块,用于根据预设的字幕关键词列表和预设的课程关键词列表确定与所述目标字幕信息对应的目标知识课程,所述字幕关键词列表包括若干个关键词,所述课程关键词列表包括与所述关键词关联的知识课程;
知识课程展示模块,用于通过课程弹窗的形式在所述当前画面中展示所述目标知识课程;
其中,所述知识课程确定模块包括:
第一分词子模块,用于对所述目标字幕信息进行分词处理,得到多个字幕单词;
第一关键词确定子模块,用于当所述预设的字幕关键词列表中存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词,所述字幕关键词列表为依据所述媒体数据的字幕文本与预设的文本关键词列表生成的关键词列表;
第二关键词确定子模块,用于当所述预设的课程关键词列表中存在与所述第一关键词匹配的课程关键词时,则将所述课程关键词作为针对所述目标字幕信息的第二关键词,所述课程关键词列表为依据所述媒体数据的介绍文本与预设的文本关键词列表生成的关键词列表;
知识课程查找子模块,用于查找与所述第二关键词匹配的目标知识课程;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表。
7.根据权利要求6所述的装置,其特征在于,所述字幕关键词列表通过如下模块生成:
字幕信息提取模块,用于提取所述媒体数据的字幕文本中各行字幕信息;
第一分词模块,用于对所述各行字幕信息进行分词处理,得到第一单词;
第一单词匹配模块,用于将所述第一单词与预设的文本关键词列表进行匹配,生成与所述第一单词对应的第一匹配结果,所述第一匹配结果包括至少一个与所述文本关键词列表匹配成功的第一目标单词;
字幕关键词列表生成模块,用于采用所述第一目标单词,生成与所述媒体数据对应的字幕关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第一单词进行筛选。
8.根据权利要求6所述的装置,其特征在于,所述课程关键词列表通过如下模块生成:
第二分词模块,用于对所述介绍文本进行分词处理,得到第二单词;
第二单词匹配模块,用于将所述第二单词与预设的文本关键词列表进行匹配,生成与所述第二单词对应的第二匹配结果,所述第二匹配结果包括至少一个与所述文本关键词列表匹配成功的第二目标单词;
课程关键词列表生成模块,用于采用所述第二目标单词,生成针对所述预设知识课程的课程关键词列表;
其中,所述文本关键词列表为依据所述字幕文本与所述介绍文本生成的关键词列表,用于对所述第二单词进行筛选。
9.根据权利要求7或8所述的装置,其特征在于,所述文本关键词列表通过如下模块生成:
第三分词模块,用于分别对所述字幕文本以及所述介绍文本进行分词处理,得到第三单词;
权重系数计算模块,用于获取所述第三单词的TF-IDF词频特征和标注序列特征,并采用所述词频特征与所述标注序列特征,计算所述第三单词的权重系数;
文本关键词列表生成模块,用于根据所述第三单词的权重系数,生成针对所述字幕文本与所述介绍文本的文本关键词列表。
10.根据权利要求7所述的装置,其特征在于,所述字幕关键词列表生成模块具体用于:
采用所述媒体数据的媒体信息和所述第一目标单词,生成与所述媒体信息对应的字幕关键词列表;
所述装置还包括:
关键词列表确定模块,用于获取当前播放的媒体数据的媒体信息,并确定所述媒体信息对应的字幕关键词列表;
所述第一单词匹配模块具体用于:
当所述媒体信息对应的字幕关键词列表中,存在与所述字幕单词匹配的字幕关键词时,则将所述字幕关键词作为与所述目标字幕信息对应的第一关键词。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如权利要求1至5所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一所述的内容的预测方法。
CN201911210011.1A 2019-11-29 2019-11-29 内容展示方法、装置、电子设备及计算机可读存储介质 Active CN110942070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911210011.1A CN110942070B (zh) 2019-11-29 2019-11-29 内容展示方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911210011.1A CN110942070B (zh) 2019-11-29 2019-11-29 内容展示方法、装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110942070A CN110942070A (zh) 2020-03-31
CN110942070B true CN110942070B (zh) 2023-09-19

Family

ID=69908672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911210011.1A Active CN110942070B (zh) 2019-11-29 2019-11-29 内容展示方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110942070B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326395A (zh) * 2021-04-23 2021-08-31 维沃移动通信有限公司 信息处理方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104105002A (zh) * 2014-07-15 2014-10-15 百度在线网络技术(北京)有限公司 音视频文件的展示方法和装置
CN106060636A (zh) * 2016-06-29 2016-10-26 北京酷云互动科技有限公司 显示方法和显示系统
CN107424100A (zh) * 2017-07-21 2017-12-01 深圳市鹰硕技术有限公司 信息提供方法及系统
CN107786887A (zh) * 2017-10-10 2018-03-09 北京奇艺世纪科技有限公司 一种显示展示信息的方法及装置
CN109543102A (zh) * 2018-11-12 2019-03-29 百度在线网络技术(北京)有限公司 基于视频播放的信息推荐方法、装置及存储介质
CN109600681A (zh) * 2018-11-29 2019-04-09 南昌与德软件技术有限公司 字幕显示方法、装置、终端及存储介质
CN110309265A (zh) * 2019-06-30 2019-10-08 韶关市启之信息技术有限公司 一种决定视频是否推送相关法律知识的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9066135B2 (en) * 2012-12-18 2015-06-23 Sony Corporation System and method for generating a second screen experience using video subtitle data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104105002A (zh) * 2014-07-15 2014-10-15 百度在线网络技术(北京)有限公司 音视频文件的展示方法和装置
CN106060636A (zh) * 2016-06-29 2016-10-26 北京酷云互动科技有限公司 显示方法和显示系统
CN107424100A (zh) * 2017-07-21 2017-12-01 深圳市鹰硕技术有限公司 信息提供方法及系统
CN107786887A (zh) * 2017-10-10 2018-03-09 北京奇艺世纪科技有限公司 一种显示展示信息的方法及装置
CN109543102A (zh) * 2018-11-12 2019-03-29 百度在线网络技术(北京)有限公司 基于视频播放的信息推荐方法、装置及存储介质
CN109600681A (zh) * 2018-11-29 2019-04-09 南昌与德软件技术有限公司 字幕显示方法、装置、终端及存储介质
CN110309265A (zh) * 2019-06-30 2019-10-08 韶关市启之信息技术有限公司 一种决定视频是否推送相关法律知识的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
网络字幕媒体技术及其在远程教育中的应用;黄璐等;《中国电化教育》;20070910(第09期);全文 *

Also Published As

Publication number Publication date
CN110942070A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN109819284B (zh) 一种短视频推荐方法、装置、计算机设备及存储介质
CN106331778B (zh) 视频推荐方法和装置
JP7009769B2 (ja) 推奨生成方法、プログラム、及びサーバ装置
US20170091838A1 (en) Product recommendation using sentiment and semantic analysis
US20160014482A1 (en) Systems and Methods for Generating Video Summary Sequences From One or More Video Segments
CN110390033B (zh) 图像分类模型的训练方法、装置、电子设备及存储介质
US20150293928A1 (en) Systems and Methods for Generating Personalized Video Playlists
CN113079417B (zh) 生成弹幕的方法、装置、设备和存储介质
CN108446385A (zh) 用于生成信息的方法和装置
CN109255037B (zh) 用于输出信息的方法和装置
CN112507163B (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
CN113806588B (zh) 搜索视频的方法和装置
CN110347866B (zh) 信息处理方法、装置、存储介质及电子设备
WO2017096871A1 (zh) 视频推荐的方法及视频推荐的终端设备
CN111708943B (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN110019948B (zh) 用于输出信息的方法和装置
CN108197336B (zh) 一种视频查找的方法及装置
CN111897950A (zh) 用于生成信息的方法和装置
CN110942070B (zh) 内容展示方法、装置、电子设备及计算机可读存储介质
CN113407775B (zh) 视频搜索方法、装置及电子设备
CN112446214A (zh) 广告关键词的生成方法、装置、设备及存储介质
CN109472028B (zh) 用于生成信息的方法和装置
US20130230248A1 (en) Ensuring validity of the bookmark reference in a collaborative bookmarking system
CN110020106B (zh) 一种推荐方法、推荐装置和用于推荐的装置
JP2016177690A (ja) サービス推薦装置およびサービス推薦方法並びにサービス推薦プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant