CN109558513B - 一种内容推荐方法、装置、终端及存储介质 - Google Patents

一种内容推荐方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN109558513B
CN109558513B CN201811457121.3A CN201811457121A CN109558513B CN 109558513 B CN109558513 B CN 109558513B CN 201811457121 A CN201811457121 A CN 201811457121A CN 109558513 B CN109558513 B CN 109558513B
Authority
CN
China
Prior art keywords
recommended
audio
content
word
subtitle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811457121.3A
Other languages
English (en)
Other versions
CN109558513A (zh
Inventor
王群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Priority to CN201811457121.3A priority Critical patent/CN109558513B/zh
Publication of CN109558513A publication Critical patent/CN109558513A/zh
Application granted granted Critical
Publication of CN109558513B publication Critical patent/CN109558513B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种内容推荐方法、装置、终端及存储介质,该方法包括:在音视频播放过程中,实时获取音视频对应的字幕内容;对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户,实现了无需用户主动搜索即可在音视频播放过程中为用户推荐与播放内容相关的多维度信息和知识,提高了用户体验。

Description

一种内容推荐方法、装置、终端及存储介质
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种内容推荐方法、装置、终端及存储介质。
背景技术
随着互联网技术的发展,越来越多的用户通过浏览器或者各种音视频播放器观看视频或者收听音频,从而获取更多的信息。
然而,用户也只能了解到视频或音频中涉及的内容,无法获知与之相关的其他扩展性内容。另外,在遇到一些不懂的知识点或感兴趣的信息点时,用户需要去专门的搜索引擎进行搜索以获取更多信息,操作繁琐,影响用户体验。
发明内容
本发明实施例提供一种内容推荐方法、装置、终端及存储介质,以实现无需主动搜索即可在音视频播放过程中为用户推荐与播放内容相关的多维度信息和知识。
第一方面,本发明实施例提供了一种内容推荐方法,所述方法包括:
在音视频播放过程中,实时获取音视频对应的字幕内容;
对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;
将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户。
第二方面,本发明实施例还提供了一种内容推荐装置,所述装置包括:
字幕内容获取模块,用于在音视频播放过程中,实时获取音视频对应的字幕内容;
检索词确定模块,用于对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;
检索结果推荐模块,用于将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户。
第三方面,本发明实施例还提供了一种终端,所述终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的一种内容推荐方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明任意实施例所述的一种内容推荐方法。
本发明实施例通过在音视频播放过程中,实时获取音视频对应的字幕内容;对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户,实现了无需用户主动搜索即可在音视频播放过程中为用户推荐与播放内容相关的多维度信息和知识,提高用户体验。
附图说明
图1是本发明实施例一中的一种内容推荐方法的流程图;
图2是本发明实施例二中的一种内容推荐方法的流程图;
图3是本发明实施例三中的一种内容推荐方法的流程图;
图4是本发明实施例四中的一种内容推荐方法的流程图;
图5是本发明实施例四中的一种视频播放中内容推荐的界面示意图;
图6是本发明实施例五中的一种内容推荐装置的结构示意图;
图7是本发明实施例六中的一种终端的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种内容推荐方法的流程图,本实施例可适用于内容或信息推荐的情况,该方法可以由一种内容推荐装置来执行,该装置可通过软件和/或硬件实现,并可配置在终端中,例如具有音视频播放和无线通信功能的智能手机或平板电脑。如图1所示,该方法包括:
S110、在音视频播放过程中,实时获取音视频对应的字幕内容。
通过手机、平板或者计算机等终端中的浏览器或相关应用程序中的视频播放器播放视频/音频的过程中,一般会配置有与音视频对应有字幕,来帮助用户理解音视频内容。字幕内容是以文字形式显示电视、电影作品中的对话等非影像内容,比如在音视频播放界面的下方出现的解说文字,包括:影片的片名、唱词、对白和说明词(比如人物介绍、地名和年代等)。在本实施例中,可以在音视频播放的过程中,实时获取对应的字幕内容,例如播放到哪一时刻便可以获取对应时刻的字幕内容,还可以按照字幕中的标点符号来提取一句一句的字幕。当然,字幕随着播放进度依次呈现,因此获取字幕的操作也可以根据字幕中的首字是否变化来判断是否需要获取新的字幕内容。
S120、对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词。
对所述字幕内容进行解析可以是对字幕内容进行拆解分析,然后确定一个或多个推荐检索词,推荐检索词可以是从字幕内容中提取出的关键词,或是经过解析总结概括得到的关键词。
S130、将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户。
在确定了推荐检索词的基础上,可以基于推荐检索词进行自动检索,具体可以是向搜索引擎服务器发送检索请求,并将返回的检索结果在音视频播放过程中实时推荐给用户。例如可以将检索结果显示并更新在音频视频播放过程中的非视频播放区域,实现了无需用户主动搜索即可在音视频播放过程中为用户推荐与播放内容相关的多维度信息和知识,提高用户体验。
在具体实施的过程中,用户可以设置本发明实施例中的字幕内容搜索推荐功能处于开启状态,这样在用户消费视频/音频内容的过程中,浏览器或相关应用程序会根据字幕中的关键字提取进行主动搜索,并将搜索结果主动更新到页面上,以供用户了解更多的信息。
可选的,所述检索结果至少包括与所述至少一个推荐检索词对应的百科知识类检索结果。其中,百科知识类检索结果可以包括:知识描述,解读内容和图片内容等相关信息。
本实施例的技术方案,通过在音视频播放过程中,实时获取音视频对应的字幕内容;对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户,在用户观看浏览过程中不需要打断,可以自动根据字幕内容为用户进行相关度较高信息的推荐,实现了无需用户主动搜索即可在音视频播放过程中为用户推荐与播放内容相关的多维度信息和知识,提高用户体验。
实施例二
图2是本发明实施例二中提供的一种内容推荐方法的流程图,在上述实施例的基础上,可选的,对该方法做了进一步的优化,如图2所示,该方法具体包括:
S210、获取所述音视频对应的字幕文件。
在一种具体的实施方式中,由于字幕文件可以是独立于音视频文件的,且与音视频文件在时间上相对应,即是与音视频画面分离显示的附属字幕资源,因此可以从互联网或音视频数据库中一次性获取到该音视频对应的独立字幕文件。
S220、在所述音视频播放过程中,按照所述音视频的播放进度,从所述字幕文件中实时获取与每个播放时间点对应的字幕内容。
按照字幕文件上和视频文件上的时间点来进行匹配,从字幕文件中获取当前播放时间点对应的字幕。
S230、对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词。
S240、将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户。
可选的,在音视频播放过程中,实时获取音视频对应的字幕内容,包括:
在音视频播放过程中,实时检测播放画面上是否存在文字;
利用基于图像的文字识别技术,对存在文字的播放画面进行识别,得到对应的字幕内容。
在另一种具体的实施方式中,由于有的视频画面中的字幕是与视频画面不可分割的图像像素,这种情况下,在视频播放的过程中,可以实时检测播放画面是否存在文字,如果存在文字,则可以利用图像的文字识别技术对存在文字的播放画面进行识别,得到对应的字幕内容。比如,可以利用OCR(optical character recognition)文字识别技术,将当前画面图像中的字幕内容还原成文字。
可选的,所述方法还包括:
在获取所述字幕内容时,提取出现所述字幕内容时的播放画面图像;
相应的,将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户,包括:
将基于所述至少一个推荐检索词和对应的播放画面图像对应的检索结果,在音视频播放过程中实时推荐给用户;
其中,所述检索结果为基于所述至少一个推荐检索词进行检索得到初步检索结果,并基于所述播放画面图像从所述初步检索结果中确定的相关度符合预设阈值的检索结果。
在又一种具体的实施方式中,获取字幕内容时,可以实时提取出现字幕内容时的播放画面图像。相应的,可以将基于所述至少一个推荐检索词和对应的播放画面图像对应的检索结果推荐给用户。即检索结果是基于推荐检索词和画面图像共同确定的,比如可以是先基于推荐检索词得到了预设个数的检索结果后,在这些检索结果中选择出与当前字幕对应的画面内容相关度高于预设阈值的结果,并将该相关结果作为最终的检索结果进行推荐显示。示例性的,检索结果中包括苹果手机和果树等内容,而画面内容为水果园,则由于果树与画面内容相关度更高,可以将果树作为最终的检索结果。另外,也可以是直接将检索词和当前字幕的图像作为检索条件,向检索引擎服务器发起网络请求,这样返回的检索结果即是结合推荐检索词和图像得到的,可以提高检索结果的准确度和匹配度。
本实施例的技术方案,通过获取独立的字幕文件或者利用文字图像识别技术获取字幕内容,并确定检索词,然后基于检索词和/或画面图像进行检索,得到更准确和合理的检索结果,以供用户了解多维度知识。
实施例三
图3是本发明实施例三中提供的一种内容推荐方法的流程图,在上述实施例的基础上,可选的,对该方法做了进一步的优化,如图3所示,该方法具体包括:
S310、在音视频播放过程中,实时获取音视频对应的字幕内容。
S320、对所述字幕内容进行分词,得到至少一个分词结果。
在获取到字幕内容时,可以先对字幕内容进行分词,比如可以按照预设的分词字典或其他基于自然语言处理的规则进行分词,得到一个或多个分词结果,比如得到一个或多个关键词,例如名词。
S330、对不同的分词结果进行聚合,得到多个聚合词。
在得到分词结果的基础上,可以对不同的分词结果进行聚合,比如可以将不同的关键词进行组合得到多个聚合词,聚合词可以是多个常用词语以固定的语序并列组合在一起,构成具有泛化意义的一类词。例如,分词结果中包括“青岛”和“大学”,那么这两个关键词可以组合为“青岛大学”这一聚合词。
S340、利用预先训练的机器学习模型,从所述多个聚合词中确定出至少一个推荐检索词,其中,所述机器学习模型用于判断聚合词是否为符合语义规则的组合词。
预先训练的机器学习模型可以是预先基于大量的样本数据经过训练得到的,可以用于判断聚合词是否为符合语义规则的组合词。在本实施例中,利用机器学习模型判断出符合语义规则的组合词后,将该组合词作为推荐检索词。当然,如果没有符合语义规则的组合词,则可以将分词结果中的至少一个关键词作为推荐检索词。
S350、将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户。
可选的,所述方法还包括:
根据已经推荐给用户的检索结果所对应的至少一个推荐检索词建立已推荐词表;
相应的,对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词,包括:
对所述字幕内容进行解析,确定所述字幕内容中没有出现在所述已推荐词表中的至少一个推荐检索词。
在具体实施过程中,会出现在当前条字幕中存在与上一条字幕中推荐检索词相同的的情况,为了确保不进行某个推荐检索词的重复搜索,可以将每次已经检索的推荐检索词放入已推荐词表,这样在进行搜索之前可以先根据已推荐词表进行排查,排除已经检索过的检索词,提高检索效率。
本实施例的技术方案,通过机器学习模型对聚合词进行判断,然后进一步基于符合语义规则的聚合词进行检索,向用户推荐更加准确的检索结果。另外,在利用推荐检索词进行检索之前,可以先根据已推荐词表进行排查,排除已经检索过的检索词,提高检索效率,然后将检索结果在用户观看音视频过程中实时推荐给用户,满足用户的观看需求,提高用户体验。
实施例四
图4是本发明实施例四中提供的一种内容推荐方法的流程图,在上述实施例的基础上,可选的,对该方法做了进一步的优化,如图4所示,该方法具体包括:
S410、在音视频播放过程中,实时获取音视频对应的字幕内容;
S420、对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词。
S430、获取基于所述至少一个推荐检索词对应的检索结果。
具体的,可以基于当前的至少一个检索词,向搜索引擎对应的服务器发送检索请求,然后得到服务器返回的相应的检索结果。
S440、在音视频播放过程中,按照所述音视频播放的时间线顺序,在出现字幕内容时对应的时间点上实时展示与所述字幕内容对应的检索结果。
在获取到服务器返回的检索结果后,可以在音视频播放过程中,将检索结果进行页面内容渲染和添加,以供用户观看该检索结果。具体可以是按照音视频播放的时间线顺序,在出现字幕内容时对应的时间点上实时展示与所述字幕内容对应的检索结果。
可选的,所述在出现字幕内容时对应的时间点上实时展示与所述字幕内容对应的检索结果,包括:
根据所述检索结果的类型确定样式模板;
在出现字幕内容时对应的时间点上,按照所述样式模板实时展示与所述字幕内容对应的检索结果。
检索结果的类型可以纯文字类型、图片类型或者是文字和图片结合类型等。样式模板是展示文字、图像或其他设计方案的固定格式。样式模板可以是预先设计好的,不同的检索结果类型可以预先设定对应的样式模板,等待返回检索结果数据后,便可以根据检索结果类型选择适合的样式模板,并将检索结果数据灌入模板进行渲染。示例性的,如果是纯文字类型,可以是以列表的形式将多条检索结果在网页进行展示。
示例性的,图5是本发明实施例四提供的一种视频播放中内容推荐的界面示意图,其中区域1是音视频的播放画面区域,区域1包括进行字幕显示的区域2,区域3是检索结果显示区域,区域3中包括进行检索时间轴显示的区域4。如图5所示,纪录片《青岛》播放过程中,当1分3秒字幕出现“青岛拥有众多的大学”时,根据字幕关键字挖掘规则可以解析出对应的检索词为“青岛的大学”,则可以将“青岛的大学”作为检索词显示在区域4时间轴上1分3秒对应的位置,相应的,若在视频播放的1分45秒、2分5秒和2分25秒处分别识别出字幕对应的检索词为“青岛的人口”、“青岛的美食”和“胶州”,则将这些检索词同样对应显示在区域4的时间轴上的对应位置。此外,在这些检索词后面,还可以通过“展开”按钮折叠隐藏显示对应检索词的检索结果。
优选的,还可以预先建立基于知识的关系数据库,该关系数据库中可以存储有各种常用知识以及各种知识之间的关系,例如对于“青岛的大学”,在关系数据库中可以存储有位于青岛的大学,如中国海洋大学、青岛大学、中国石油大学、青岛理工大学和山东大学等,而这些具体的大学名称可以作为“青岛的大学”的二级检索词展示或隐藏展示在区域3(图中未示出二级检索词),若用户对其中某一个大学感兴趣,则可以通过对二级检索词的任意触发操作,触发对该二级检索词的进一步检索,检索结果也会在终端界面上展示。由此,可以通过二级检索词的方式,为用户提供更加准确的知识获取途径,方便用户直接获取想要的知识。
其中,关于检索词的检索结果、或者二级检索词及其检索结果,都可以按照折叠隐藏、弹窗、覆盖检索结果或插入等其他任意一种UI展示方式进行展示,因此,此处对具体的展示方式不做任何限定。
可选的,所述方法还包括:
响应于对音视频播放界面上导出按钮的触发操作,将已播放的音视频对应的字幕内容,和基于该字幕内容推荐的检索结果,合成为目标文档导出,其中,在所述目标文档中,对与所述检索结果对应的至少一个推荐检索词做出标记。
该触发操作可以是一个图标或选项,当用户点击以后,可以将此次视频播放过程中产生的已播放的音视频对应的字幕内容,和基于该字幕内容推荐的检索结果,合成为目标文档导出。用户可以在下次观看同一音视频过程中,可以直接导入目标文档,不需要再次进行相应的分词和检索,即可直接将目标文档中的推荐检索词和相应的检索结果按照字幕内容的播放情况进行展示,这样可以快速推荐和显示更多的知识以供用户了解。
本实施例的技术方案,通过获取基于所述至少一个推荐检索词对应的检索结果;在音视频播放过程中,按照所述音视频播放的时间线顺序,在出现字幕内容时对应的时间点上实时展示与所述字幕内容对应的检索结果,并且将检索结果可以根据类型选择相应的模板进行显示,可以满足用户的观看需求,提高用户体验。
实施例五
图6是本发明实施例五提供的一种内容推荐装置的结构示意图,如图6所示,该装置可以采用硬件和/或软件的形式实现,并可以配置于终端中,该装置包括:
字幕内容获取模块610,用于在音视频播放过程中,实时获取音视频对应的字幕内容;
检索词确定模块620,用于对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;
检索结果推荐模块630,用于将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户。
可选的,所述字幕内容获取模块610,包括:
字幕文件获取单元,用于获取所述音视频对应的字幕文件;
字幕内容获取单元,用于在所述音视频播放过程中,按照所述音视频的播放进度,从所述字幕文件中实时获取与每个播放时间点对应的字幕内容。
可选的,所述字幕内容获取模块610,还包括:
画面文字检测单元,用于在音视频播放过程中,实时检测播放画面上是否存在文字;
字幕内容识别单元,用于利用基于图像的文字识别技术,对存在文字的播放画面进行识别,得到对应的字幕内容。
可选的,所述检索词确定模块620,包括:
字幕分词单元,用于对所述字幕内容进行分词,得到至少一个分词结果;
聚合词确定单元,用于对不同的分词结果进行聚合,得到多个聚合词;
推荐词确定单元,用于利用预先训练的机器学习模型,从所述多个聚合词中确定出至少一个推荐检索词,其中,所述机器学习模型用于判断聚合词是否为符合语义规则的组合词。
可选的,所述装置还包括:
推荐词表建立模块,用于根据已经推荐给用户的检索结果所对应的至少一个推荐检索词建立已推荐词表;
相应的,所述检索词确定模块620,还用于对所述字幕内容进行解析,确定所述字幕内容中没有出现在所述已推荐词表中的至少一个推荐检索词。
可选的,所述装置还包括:
画面图像提取模块,用于在获取所述字幕内容时,提取出现所述字幕内容时的播放画面图像;
相应的,所述检索结果推荐模块630,还用于将基于所述至少一个推荐检索词和对应的播放画面图像对应的检索结果,在音视频播放过程中实时推荐给用户;
其中,所述检索结果为基于所述至少一个推荐检索词进行检索得到初步检索结果,并基于所述播放画面图像从所述初步检索结果中确定的相关度符合预设阈值的检索结果。
可选的,所述检索结果推荐模块630,还包括:
检索结果获取单元,用于获取基于所述至少一个推荐检索词对应的检索结果;
检索结果展示单元,用于在音视频播放过程中,按照所述音视频播放的时间线顺序,在出现字幕内容时对应的时间点上实时展示与所述字幕内容对应的检索结果。
可选的,所述检索结果展示单元,还包括:
样式模板确定子单元,用于根据所述检索结果的类型确定样式模板;
检索结果展示子单元,用于在出现字幕内容时对应的时间点上,按照所述样式模板实时展示与所述字幕内容对应的检索结果。
可选的,所述装置还包括:目标文档导出模块,用于:
响应于对音视频播放界面上导出按钮的触发操作,将已播放的音视频对应的字幕内容,和基于该字幕内容推荐的检索结果,合成为目标文档导出,其中,在所述目标文档中,对与所述检索结果对应的至少一个推荐检索词做出标记。
可选的,所述检索结果至少包括与所述至少一个推荐检索词对应的百科知识类检索结果。
本发明实施例所提供的一种内容推荐装置,可执行本发明任意实施例所提供的一种内容推荐方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的一种内容推荐方法。
实施例六
参见图7,本实施例提供了一种终端700,其包括:一个或多个处理器720;存储装置710,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器720执行,使得所述一个或多个处理器720实现本发明实施例所提供的一种内容推荐方法,所述方法包括:
在音视频播放过程中,实时获取音视频对应的字幕内容;
对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;
将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户。
当然,本领域技术人员可以理解,处理器720还可以实现本发明任意实施例所提供的一种内容推荐方法的技术方案。
图7显示的终端700仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,终端700以通用计算设备的形式表现。终端700的组件可以包括但不限于:一个或者多个处理器720,存储装置710,连接不同系统组件(包括存储装置710和处理器720)的总线750。
总线750表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
终端700典型地包括多种计算机系统可读介质。这些介质可以是任何能够被终端700访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置710可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)711和/或高速缓存存储器712。终端700可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统713可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线750相连。存储装置710可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块715的程序/实用工具714,可以存储在例如存储装置710中,这样的程序模块715包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块715通常执行本发明所描述的任意实施例中的功能和/或方法。
终端700也可以与一个或多个外部设备760(例如键盘、指向设备、显示器770等)通信,还可与一个或者多个使得用户能与该终端700交互的设备通信,和/或与使得该终端700能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口730进行。并且,终端700还可以通过网络适配器740与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器740通过总线750与终端700的其它模块通信。应当明白,尽管图中未示出,可以结合终端700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器720通过运行存储在存储装置710中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种内容推荐方法。
实施例七
本实施例提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种内容推荐方法,该方法包括:
在音视频播放过程中,实时获取音视频对应的字幕内容;
对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;
将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的一种内容推荐方法中的相关操作。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种内容推荐方法,其特征在于,所述方法包括:
在音视频播放过程中,实时获取音视频对应的字幕内容,以及出现所述字幕内容时的播放画面图像;
对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;
将基于所述至少一个推荐检索词和对应的播放画面图像对应的检索结果,在音视频播放过程中实时推荐给用户;
其中,所述检索结果为基于所述至少一个推荐检索词进行检索得到初步检索结果,并基于所述播放画面图像从所述初步检索结果中确定的相关度符合预设阈值的检索结果;
对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词,包括:
对所述字幕内容进行分词,得到至少一个分词结果;
对不同的分词结果进行聚合,得到多个聚合词;
利用预先训练的机器学习模型,从所述多个聚合词中确定出至少一个推荐检索词,其中,所述机器学习模型用于判断聚合词是否为符合语义规则的组合词;
所述方法还包括:
根据历史上已经推荐给用户的检索结果所对应的至少一个推荐检索词建立历史已推荐词表;
相应的,对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词,包括:
对所述字幕内容进行解析,确定所述字幕内容中当前没有出现在所述历史已推荐词表中的至少一个推荐检索词。
2.根据权利要求1所述的方法,其特征在于,在音视频播放过程中,获取音视频对应的字幕内容,包括:
获取所述音视频对应的字幕文件;
在所述音视频播放过程中,按照所述音视频的播放进度,从所述字幕文件中实时获取与每个播放时间点对应的字幕内容。
3.根据权利要求1所述的方法,其特征在于,在音视频播放过程中,实时获取音视频对应的字幕内容,包括:
在音视频播放过程中,实时检测播放画面上是否存在文字;
利用基于图像的文字识别技术,对存在文字的播放画面进行识别,得到对应的字幕内容。
4.根据权利要求1所述的方法,其特征在于,将基于所述至少一个推荐检索词对应的检索结果,在音视频播放过程中实时推荐给用户,包括:
获取基于所述至少一个推荐检索词对应的检索结果;
在音视频播放过程中,按照所述音视频播放的时间线顺序,在出现字幕内容时对应的时间点上实时展示与所述字幕内容对应的检索结果。
5.根据权利要求4所述的方法,其特征在于,所述在出现字幕内容时对应的时间点上实时展示与所述字幕内容对应的检索结果,包括:
根据所述检索结果的类型确定样式模板;
在出现字幕内容时对应的时间点上,按照所述样式模板实时展示与所述字幕内容对应的检索结果。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于对音视频播放界面上导出按钮的触发操作,将已播放的音视频对应的字幕内容,和基于该字幕内容推荐的检索结果,合成为目标文档导出,其中,在所述目标文档中,对与所述检索结果对应的至少一个推荐检索词做出标记。
7.根据权利要求1-6中任一所述的方法,其特征在于,所述检索结果至少包括与所述至少一个推荐检索词对应的百科知识类检索结果。
8.一种内容推荐装置,其特征在于,所述装置包括:
字幕内容获取模块,用于在音视频播放过程中,实时获取音视频对应的字幕内容,以及出现所述字幕内容时的播放画面图像;
检索词确定模块,用于对所述字幕内容进行解析,确定所述字幕内容中的至少一个推荐检索词;
检索结果推荐模块,用于将基于所述至少一个推荐检索词和对应的播放画面图像对应的检索结果,在音视频播放过程中实时推荐给用户;
其中,所述检索结果为基于所述至少一个推荐检索词进行检索得到初步检索结果,并基于所述播放画面图像从所述初步检索结果中确定的相关度符合预设阈值的检索结果;
所述检索词确定模块,包括:
字幕分词单元,用于对所述字幕内容进行分词,得到至少一个分词结果;
聚合词确定单元,用于对不同的分词结果进行聚合,得到多个聚合词;
推荐词确定单元,用于利用预先训练的机器学习模型,从所述多个聚合词中确定出至少一个推荐检索词,其中,所述机器学习模型用于判断聚合词是否为符合语义规则的组合词;
所述装置还包括:
推荐词表建立模块,用于根据已经推荐给用户的检索结果所对应的至少一个推荐检索词建立已推荐词表;
相应的,所述检索词确定模块,还用于对所述字幕内容进行解析,确定所述字幕内容中没有出现在所述已推荐词表中的至少一个推荐检索词。
9.一种终端,其特征在于,所述终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的一种内容推荐方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的一种内容推荐方法。
CN201811457121.3A 2018-11-30 2018-11-30 一种内容推荐方法、装置、终端及存储介质 Active CN109558513B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811457121.3A CN109558513B (zh) 2018-11-30 2018-11-30 一种内容推荐方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811457121.3A CN109558513B (zh) 2018-11-30 2018-11-30 一种内容推荐方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN109558513A CN109558513A (zh) 2019-04-02
CN109558513B true CN109558513B (zh) 2021-09-24

Family

ID=65868380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811457121.3A Active CN109558513B (zh) 2018-11-30 2018-11-30 一种内容推荐方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN109558513B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110248236B (zh) * 2019-07-02 2022-02-18 广州酷狗计算机科技有限公司 视频播放方法、装置、终端及存储介质
CN112445942A (zh) * 2019-09-02 2021-03-05 智慧芽信息科技(苏州)有限公司 一种检索条件的推荐方法、装置、设备及存储介质
CN110890095A (zh) * 2019-12-26 2020-03-17 北京大米未来科技有限公司 语音检测方法、推荐方法、装置、存储介质和电子设备
CN111163348A (zh) * 2020-01-08 2020-05-15 百度在线网络技术(北京)有限公司 基于视频播放的搜索方法和装置
CN111753135B (zh) * 2020-05-21 2024-02-06 北京达佳互联信息技术有限公司 视频展示方法、装置、终端、服务器、系统及存储介质
CN112233661B (zh) * 2020-10-14 2024-04-05 广州欢网科技有限责任公司 基于语音识别的影视内容字幕生成方法、系统及设备
CN113779381B (zh) * 2021-08-16 2023-09-26 百度在线网络技术(北京)有限公司 资源推荐方法、装置、电子设备和存储介质
CN114125534A (zh) * 2021-11-11 2022-03-01 百度在线网络技术(北京)有限公司 视频播放方法、装置、电子设备、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104105002A (zh) * 2014-07-15 2014-10-15 百度在线网络技术(北京)有限公司 音视频文件的展示方法和装置
CN105898495A (zh) * 2016-05-26 2016-08-24 维沃移动通信有限公司 一种移动终端推荐信息的推送方法及移动终端
CN106610969A (zh) * 2015-10-21 2017-05-03 上海文广互动电视有限公司 基于多模态信息的视频内容审查系统及方法
CN110309265A (zh) * 2019-06-30 2019-10-08 韶关市启之信息技术有限公司 一种决定视频是否推送相关法律知识的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100250708A1 (en) * 2009-03-31 2010-09-30 Alexander John Limberis Digital media referral and distribution
CN108833973B (zh) * 2018-06-28 2021-01-19 腾讯科技(深圳)有限公司 视频特征的提取方法、装置和计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104105002A (zh) * 2014-07-15 2014-10-15 百度在线网络技术(北京)有限公司 音视频文件的展示方法和装置
CN106610969A (zh) * 2015-10-21 2017-05-03 上海文广互动电视有限公司 基于多模态信息的视频内容审查系统及方法
CN105898495A (zh) * 2016-05-26 2016-08-24 维沃移动通信有限公司 一种移动终端推荐信息的推送方法及移动终端
CN110309265A (zh) * 2019-06-30 2019-10-08 韶关市启之信息技术有限公司 一种决定视频是否推送相关法律知识的方法

Also Published As

Publication number Publication date
CN109558513A (zh) 2019-04-02

Similar Documents

Publication Publication Date Title
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
CN109474847B (zh) 基于视频弹幕内容的搜索方法、装置、设备及存储介质
US9438850B2 (en) Determining importance of scenes based upon closed captioning data
TWI493363B (zh) 資料流之即時自然語言處理
US10210211B2 (en) Code searching and ranking
US9852217B2 (en) Searching and ranking of code in videos
US20130308922A1 (en) Enhanced video discovery and productivity through accessibility
CN109241319B (zh) 一种图片检索方法、装置、服务器和存储介质
CN109275047B (zh) 视频信息处理方法及装置、电子设备、存储介质
CN109697245A (zh) 基于网页视频的语音搜索方法和装置
CN107909088B (zh) 获取训练样本的方法、装置、设备和计算机存储介质
US8290925B1 (en) Locating product references in content pages
CN113704507B (zh) 数据处理方法、计算机设备以及可读存储介质
CN110430448B (zh) 一种弹幕处理方法、装置及电子设备
EP3706014A1 (en) Methods, apparatuses, devices, and storage media for content retrieval
CN111723235B (zh) 音乐内容识别方法、装置及设备
CN113407775B (zh) 视频搜索方法、装置及电子设备
CN107239209B (zh) 一种拍照搜索方法、装置、终端及存储介质
CN113486212A (zh) 搜索推荐信息的生成和展示方法、装置、设备及存储介质
CN117421413A (zh) 一种问答对生成方法、装置及电子设备
CN114697762B (zh) 一种处理方法、装置、终端设备及介质
CN117743267B (zh) 数据推送方法、装置、电子设备及存储介质
CN112905884B (zh) 生成序列标注模型的方法、设备、介质及程序产品
JP6858003B2 (ja) 分類検索システム
CN106815288A (zh) 一种视频相关信息生成方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant