CN103942285A - 一种针对页面动态元素的推荐方法和系统 - Google Patents

一种针对页面动态元素的推荐方法和系统 Download PDF

Info

Publication number
CN103942285A
CN103942285A CN201410140686.4A CN201410140686A CN103942285A CN 103942285 A CN103942285 A CN 103942285A CN 201410140686 A CN201410140686 A CN 201410140686A CN 103942285 A CN103942285 A CN 103942285A
Authority
CN
China
Prior art keywords
content
dynamic element
text
keyword
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410140686.4A
Other languages
English (en)
Other versions
CN103942285B (zh
Inventor
柴思远
张阔
王灿辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201410140686.4A priority Critical patent/CN103942285B/zh
Publication of CN103942285A publication Critical patent/CN103942285A/zh
Application granted granted Critical
Publication of CN103942285B publication Critical patent/CN103942285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种针对页面动态元素的推荐方法和系统,涉及网络技术领域。所述方法包括:判断用户触发的当前页面中是否存在动态元素;如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。本发明在查询深度上更紧密的靠近了用户本身的注意力的关注点,可使用户更便捷的从服务器获得与关注点相关的信息,可更精确、更实时的对用户的关注点进行跟踪。

Description

一种针对页面动态元素的推荐方法和系统
技术领域
本申请涉及网络技术领域,特别是涉及一种针对页面动态元素的推荐方法和系统。
背景技术
用户在通过浏览器进行网页浏览时,服务提供商为了向用户提供更多的信息量,往往利用服务器向用户推荐一些查询串附在浏览器的底边。现有技术中,用户进行页面浏览时,浏览器对当前页面进行页面分析,查找到对应的关键词,再将关键词上传至用于服务器中,由该服务器进行分析计算,通过数据模型得到关键词相关的推荐查询串,如上传的关键词为“天气”、“北京”,则由服务器对关键词进行分析,在数据模型中查询“天气”、“北京”相关的相关词,如“雾霾”、“七天”,并将相关词连同关键词组成推荐查询串以链接的形式返回给客户端“北京未来7天天气”、“北京天气查询”、“北京天气pm2.5”等附在底边栏,待用户触发某推荐查询串时,将该推荐查询串发送至默认的搜索引擎中,从而让用户获得了更多的与当前页面相关的信息。
在上述过程中,当用户查看某个页面时,往往首先由浏览器对当前页面的页面内容进行分析,如将页面的标题、文本、评论等分别赋予不同的权重参数,并按文本内容进行切分,从得到的各分词中按频率进行筛选,并按权重参数对当前页面的文本内容进行提取,从而得到关键词和对应的相关度。
将关键词和对应的相关度分别上传至用于推荐的服务器端,并结合网页库中的索引进行分析,匹配相关的推荐查询串,将排前的推荐查询串下发至客户端或直接嵌入至当前页面。当用户点击对应的推荐查询串时,直接将推荐查询串发送至默认的搜索引擎,得到的搜索结果为与当前页面相关的多个条目链接,从而向用户提供了一定的网络信息。
但是,上述过程中,只基于静态页面的主体内容进行分析,静态页面对应的文本内容固定不变,所以静态页面包括的信息容量有限,在文本分析的过程中,得到推荐的推荐查询串固定不变,一旦用户在阅读的过程中关注点发生变化,往往不能及时反映用户当前的关注点。
发明内容
本申请所要解决的技术问题是提供一种针对页面动态元素的推荐方法和系统,以解决现有技术中只针对静态页面的主题内容进行分析,无法跟随用户关注的动态内容进行词串推荐,导致服务器的推荐查询串不能及时与网页中的动态内容对应,以至推荐查询串不够精确的问题。
为了解决上述问题,本申请公开了一种针对页面动态元素的推荐方法,其特征在于,包括:
判断用户触发的当前页面中是否存在动态元素;
如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
优选的,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词,包括:
获取所述动态元素的播放内容对应的文本内容;
根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本;
根据所述目标文本提取各个关键词。
优选的,所述获取对应所述动态元素的播放内容对应的文本内容,包括:
获取所述动态元素对应的属性信息,并根据所述属性信息从第二服务器获取对应的文本内容。
优选的,所述获取对应所述动态元素的播放内容对应的文本内容,包括:
根据所述当前页面的链接地址与的文本内容的关联关系,直接获取所述文本内容。
优选的,所述根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本,包括:
对所述文本内容进行切分,获得按文档顺序排列的N个语义单元;
根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例;
以所述进度比例为基准确定阈值范围,计算所述阈值范围内的n个语义单元,并将所述n个语义单元作为对应所述播放进度的目标文本;其中,N、n为整数,且0<n<N。
优选的,所述计算当前播放的时长占播放总时长的进度比例,包括:
每隔指定时间间隔计算当前播放的时长与播放总时长的进度比例。
优选的,还包括:
当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框;
将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
优选的,还包括:
当接收到用户关闭所述弹出框的动作时,重新根据所述父页面的内容获取关键词。
优选的,还包括:
结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
本发明还公开了一种针对页面动态元素的推荐系统,包括:
动态判断模块,适于判断用户触发的当前页面中是否存在动态元素;
关键词提取模块,适于如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
推荐查询串展示模块,适于根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
优选的,所述关键词提取模块包括:
文本内容获取模块,适于从取所述动态元素的播放内容对应的文本内容;
目标文本获取模块,适于根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本;
第二关键词提取模块,适于根据所述目标文本提取各个关键词。
优选的,所述目标文本获取模块包括:
语义单元分析模块,适于对对所述文本内容进行切分,获得按文档顺序排列的N个语义单元;
播放进度计算模块,适于根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例;
第一目标文本获取模块,适于以所述进度比例为基准确定阈值范围,计算所述阈值范围内的n个语义单元,并将所述n个语义单元作为对应所述播放进度的目标文本;其中,N、n为整数,且0<n<N。
优选的,还包括:
弹出框提取模块,适于当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框;
第三关键词提取模块,适于将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
优选的,还包括:
优化模块,适于结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
与现有技术相比,本申请包括以下优点:
首先,相对现有技术,其只是对页面的静态内容进行分析,获取关键词提供给搜索引擎以得到相关联的推荐查询串,其只能直接针对页面中的静态文本进行语义分析得到关键词,上传至服务器以获取推荐查询串,该种方式其搜索范围窄,无法为在更深的查询深度和更广的查询广度上,为用户提供更优质的搜索服务。而本发明可针对用户当前浏览的网页,针对其中动态元素(动态元素包括视频、flash、弹框等非静态的、固化于网页中的内容),获取动态元素的播放内容对应的各个关键词,从第一服务器获推荐查询串,其在查询广度上拓宽了推荐查询串的推荐来源,在查询深度上更紧密的及时靠近了用户本身的注意力的关注点(比如用户在网页中观看电视剧时,其关注点是随着剧情的发展而改变的)。
其次,由于本发明可以基于动态元素的播放内容获得个关键词,继而从服务器获得推荐查询串,其推荐查询串更精确的跟随用户的兴趣和关注点的,因此,在此基础之上,用户不用进行大量的文字输入和页面操作,即可更便捷的从服务器获得与关注点相关的信息。
再次,由于本发明针对的是动态元素的内容,其信息容量很大,相对于现有技术中的静态分析的对象,其可不断根据动态元素的内容获得新的推荐查询词串,对比现有技术的推荐查询词串固定不变的状态,本发明更精确、更实时的对用户的关注点进行跟踪。
附图说明
图1是本发明实施例一的一种针对页面动态元素的推荐方法的流程示意图;
图2是本发明实施例二的一种针对页面动态元素的推荐方法的流程示意图;
图3是本发明实施例三的一种针对页面动态元素的推荐方法的流程示意图;
图4是本发明实施例四的一种针对页面动态元素的推荐系统的结构示意图;
图5是本发明实施例五的一种针对页面动态元素的推荐系统的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
背景技术中的方案,针对现有的搜索推荐往往只基于静态页面的主体内容进行分析,其一般只是单纯的、静态的分析用户当前触发的页面中的html文档中的文本信息,而静态页面对应的文本内容固定不变,所以静态页面包括的信息容量有限,在文本分析的过程中,得到关键词也固定不变,进而得到的推荐查询串也不会改变。那么在用户的页面一直处于打开状态时,其关键词知道用户关闭该页面或者访问其他页面时才会有所改变,但是当用户访问的页面中存在动态元素时(比如视频、flash、弹出框等),用户浏览时,其内容是存在变化的,从而用户的兴趣和关注点也存在变化,这种情况下,背景技术得到的推荐查询串无法随着用户在浏览动态元素时,随之而相应进行跟踪,无法更深更广的针对动态内容获得精确度和契合度更高的推荐查询串。
本发明的核心思想之一是:本发明针对动态元素的播放内容获取初始的关键词,然后再基于这些关键词去服务器获取推荐查询串,从而使推荐查询串可以根据动态元素的播放内容实时进行更新,以跟踪用户在播放过程中的关注点,在查询深度和广度上进一步提高服务商的搜索服务效率和质量,降低用户对查询的繁琐操作过程。
实施例一
参照图1,示出了本发明实施例一的一种针对页面动态元素的推荐方法的流程示意图,具体可以包括:
步骤110,判断用户触发的当前页面中是否存在动态元素;
在本发明实施例中,可对用户触发的当前页面进行解析,判断页面中是否存在动态元素。其中,解析当前页面,判断是否存在动态元素存在多种方式,本发明不对其加以限制。比如,针对各网站的网页预置解析模板,比如针对土豆网的各种类型网页预置解析模板,当用户触发土豆网的网页时,即可采用相应的解析模板进行解析。又比如,提取动态元素的核心特征或者特征组合,解析网页代码中是否存在该种特征或者特征组合,如果存在,则认为存在动态元素,比如对于富媒体对象的动态元素,其往往以.flv,.MP4等后缀进行结尾,那么当在网页中解析到上述特征后,即可判断网页中存在动态元素。
当然,还可直接根据服预置的页面链接的属性进行链接分析,比如可以预先对各视频网站播放视频的URL记录为存在动态元素,那么本发明实施例则可将当前页面的URL与前述记录的URL进行比较,如果匹配则说明存在动态元素。另外基于链接的判断还可以采用其他方法,比如基于各网站设置URL的正则表达式,然后对当前网页的URL以这些正则表达式进行判断。
本发明实施例中所述的动态元素,其可以理解为使页面展示内容发生实质变化的元素,比如网页中的富媒体对象,即视频等富媒体对象,当播放时,其页面的展示内容实质上在变化,用户的主要关注点关注在视频当前播放的内容;又比如页面中的弹出框,页面中的弹出框提供了一种快捷信息的展示途径,但在弹出框弹出时,页面中的内容将发生变化,用户的主要关注点关注在弹出框中的文本内容;等等其他类似元素。
步骤120,如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
当判断出用户触发的网页中有动态元素后,在用户观看动态元素的播放内容的过程中,针对在动态元素中当前展示的播放内容,获取对应的各个关键词。在本发明实施例中,根据动态元素的播放进度,不断对播放内容进行分析,可分别得到所述播放内容在当前播放进度下对应的各个关键词。
本发明实施例为了使获取的关键词可以更精准的跟踪用户兴趣点,则根据当前的播放内容去提取关键词。
在本发明实施例中,如果判断出不存在动态元素,则可停止后续操作步骤。
在本发明实施例中,针对所述播放内容获取各个关键词可采用各种通用的方法,本申请不对其加以限制。比如:
子步骤S11,对当前的播放内容对应的目标文本进行分词。分词的方法有很多种,比如下面几种方法:
1、基于字符串匹配的分词方法:是指按照一定的策略将待分析的汉字串与一个预置的机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。实际使用的分词系统,都是把机械分词作为一种初分手段,还需通过利用各种其它的语言信息来进一步提高切分的准确率。
2、基于统计的分词方法:是指中文信息中由于字与字相邻共现的频率或概率能够较好的反映成词的可信度,所以可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息,以及计算两个汉字X、Y的相邻共现概率。互现信息可以体现汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计,不需要切分词典。
子步骤S12,从分词后的结果中选择关键词。选择关键词的方式可采用多种方法,本发明可采用TF/IDF(term frequency–inverse document frequency是一种用于资讯检索与资讯探勘的常用加权技术)选择关键词。TF/IDF算法基于计算该词语的全局重要性。比如对于一个电视剧来说,用户当前观看某一集时,对于当前播放内容的对应的当前的文本内容,进行分词后得到n个词,那么首先统计这n个词在当前观看剧集的剧情文本中各自的出现次数Ni,还统计包括这些词的剧情文本份数Mi,然后以每个词的的出现次数Ni和当前剧情文档中的词的总数计算TFi,以Mi和剧情文档总数计算IDFi,最后即可计算TF/IDFi,其权重的意义大致为:对区别文档最有意义的词语应该是那些在文档中出现频率高,而在整个文档集合的其他文档中出现频率少的词语。那么选择权重大的词为关键词。
比如,对于电视剧《甄嬛传》播放的某一集,分集介绍中对应的文本内容到“甄嬛无意中发现碎玉轩海棠树不开花的秘密——树底下被人埋了大量麝香”进度时,获取上述文本,然后进行分词,然后利用上述TF/IDF算法,则可选择“麝香”作为关键词。
如此,本发明实施例在获取了各个关键词后,可将其上传至第一服务器,然后即可由第一服务器执行步骤130。
步骤130,根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
在本发明实施例中,第一服务器收到客户端(比如通过浏览器)上传的各个关键词后,会基于各个关键词进行分析,通过数据模型查询相关的推荐查询串,然后将推荐查询串以链接的形式返回给客户端或直接嵌入至当前页面,如此则可在动态元素当前展示的播放内容附近,对推荐查询串进行对应的展示,以方便用户进行点击。在本发明实施例中,推荐查询串可以采用链接的形式展示的前述用户触发的页面中,当用户点击该推荐查询串时,浏览器即可基于其对应的链接向其指向的服务器发送http请求。
在本发明实施例中,也可采用多种基于各关键词获取推荐查询串的方法,本发明不对其加以限制。本发明可采用主题模型(Latent DirichletAllocation)对各关键词进行主题相关性计算,获得与相应主题相关的推荐查询串。主题模型公式大致可以理解为:
主题模型就是用大量已知的“词语-文档”矩阵,通过一系列的训练,推理出右边的“词语-主题”矩阵和“主题文档”矩阵;即可通过预先训练好的矩阵,对当前的词语和文档,可以知道该词语与哪种主题更契合。比如《甄嬛传》某一集反复把“麝香”和“流产”这两个概念联系在一起,通过主题模型(Latent Dirichlet Allocation),很容易将这两个概念的主题计算到一起,这样在就可以给出“麝香对孕妇的影响”、“白麝香会导致不孕吗”类似的推荐查询串,并在浏览器底边栏进行同步展示。
优选的,本发明实施例还包括:
步骤140,结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
在动态元素的展示过程中,本发明实施例为用户推荐了大量的查询词。那么当推荐查询串被触发,也即其被用户点击后,就可以建立动态元素播放内容与用户点击行为之间的联系,还可建立当前播放时间点和用户点击行为之间的联系,总的来说,也是为了针对由动态元素当前播放内容的目标文本的关键词,建立其与用户点击行为之间的关系。一般的说,当推荐的内容和用户当前的关注点,也就是动态元素当前播放的内容,越具有相关性,越会得到用户的点击行为。同理,用户的点击行为的多寡也验证了影视剧播放过程中查询推荐的准确程度。那么本发明利用这样的数据,结合机器学习模型(比如回归模型)将服务器端的各带推荐查询串与所述动态元素的相关性进行优化,这样可以有效的提升推荐的准确性。
在本实施例中,可采用逻辑回归模型优化推荐查询串与动态元素的相关性,当然也可采用其他回归模型。逻辑回归模型:
P ( Y = 1 | x ) = &pi; ( x ) = 1 1 + e - g ( x ) ,
其中,x′=(x1,x2,…xn)为n维变量,在本发明实施例中,该n维变量包括了:推荐查询串的点击操作和当前播放内容之间的关系的特征;还可包括:
字面特征(推荐词对应的分词结果,分词后的二元组合,推荐词的日均访问量和长度);
站点特征(站点域名,站点类型,站点的日均访问量);
页面特征(站点title字面特征,动态元素的日均访问量,评论数量,评论的倾向,动态元素的导演,年代,制作公司等);
相关性特征(推荐词语站点title的分词结果对应的交集和并集,分词结果所对应的主题是否具有相似独立性,即主题相互之间是否具有大于阈值的相似度,如果大于或等于阈值则相似,小于阈值则相互独立);
用户特征(当前用户前一个浏览页面,浏览时间,用户地域信息,注册用户的性别、行业和兴趣等)。
而本发明可针对用户当前浏览的网页,针对其中动态元素(动态元素包括视频、flash、弹框等非静态的、固化于网页中的内容),获取动态元素的播放内容对应的各个关键词,从第一服务器获推荐查询串,其在查询广度上拓宽了推荐查询串的推荐来源,在查询深度上更紧密的靠近了用户本身的注意力的关注点(比如用户在网页中观看电视剧时,其关注点是随着剧情的发展而改变的)。
其次,由于本发明可以基于动态元素的播放内容获得个关键词,继而从服务器获得推荐查询串,其推荐查询串更精确的跟随用户的兴趣和关注点的,因此,在此基础之上,用户不用进行大量的文字输入和页面操作,即可更便捷的从服务器获得与关注点相关的信息。、
再次,由于本发明针对的是动态元素的内容,其信息容量很大,相对于现有技术中的静态分析的对象,其可不断根据动态元素的内容获得新的推荐查询词串,对比现有技术的推荐查询词串固定不变的状态,本发明更精确、更实时的对用户的关注点进行跟踪。
最后,本发明实施例也可用于广告链接的推广和发布,方便广告提供商实时根据客户的关注点投放更精准的广告。
实施例二
参照图2,其示出了本发明实施例二的一种针对页面动态元素的推荐方法的流程示意图,具体可以包括:
步骤210,判断用户触发的当前页面中是否存在动态元素;
步骤220,如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词。
所述步骤220包括:
子步骤221,获取所述动态元素的播放内容对应的文本内容;
在本发明实施例中,为了节省客户端的系统资源,不用在客户端分析动态元素本身,而是可以从其他途径获取对应动态元素的播放内容,从而可从该文本内容中获得关键词。
在本发明实施例中,可以从第二服务器获取所述动态元素的播放内容对应的文本内容。由于进行推荐查询串分析和返回的服务器(比如某个搜索引擎服务器)本身不存储动态元素的文本内容,而第三方的服务器(即上述的第二服务器)可能存储这些文本内容。比如对于影视剧集类的动态元素为例,存在存储剧集资料的第三方的服务器,比如“电视猫”中的分集介绍。那么本发明则可从该第三方的服务器获取对应所述动态元素的文本内容,充分利用网络资源,避免第一服务器本身为了存储大量其他剧集资源而占用增加大量的硬件成本和人工成本。
优选的,本实施例中,所述获取对应所述动态元素的播放内容对应的文本内容时:获取所述动态元素对应的属性信息,并以所述属性信息为参数从第二服务器获取动态元素的播放内容对应的文本内容。
在本发明实施例中,比如,对于电视剧视频来说,需要通过其当前的剧集名、集数、主演、导演、年代等属性信息,才能去第二服务器获取该电视剧视频相应的播放内容,即分集介绍。那么则需要首先获取动态元素对应的属性信息,然后去获取该动态元素相应的分集介绍的文本内容。本发明实施例中包括多种动态元素对应的属性信息的获取方法:
1、直接从页面中获取:
在本发明实施例中,如果解析到用户触发的页面中存在动态元素,则会结合页面结构获取动态元素的属性信息。
比如,判断页面链接为电影子站所在的播放页面时,则解析得到的视频属性为:影片名、主演、导演、年代等;判断页面链接为电视剧子站所在的播放页面时,解析得到的视频属性为:剧集名、集数、主演、导演、年代等,这些属性信息可以从当前页面的标题中获得,也可结合页面结构中解析对应的文本获得;
2、根据URL获取:
比如抓取当前页面的URL,根据事先存储在服务器端的URL与对应视频属性的关联关系,根据URL对应的字段进行分析,得到当前页面对应播放剧集或电影对应的剧集名、集数或者影片名。
当然,还可以采用其他方法获取该动态元素的属性信息,本发明不对其加以限制。
然后,可将属性信息发送至第二服务器,第二服务器以该属性信息为参数,从其数据库中获取文本数据,即为该动态元素的播放内容。可以理解为,根据属性信息查询第三方的信息库,在第三方的信息库中进行查询,获取动态元素对应的播放内容。以剧集为例,可对第三方剧集资料库进行查询,如“电视猫”,将属性信息作为参数,实时在垂直站点http://www.tvmao.com/进行查询,得到该集剧集的文本数据,即该电视剧的播放内容。当然,在其他实施例中,第一服务器和第二服务器可为同一服务器,即该服务器可同时存储动态元素的播放内容并根据关键词提供推荐查询串。
优选的,在其他实施例中,所述获取对应所述动态元素对应的目标文本时:根据所述当前页面的链接地址与的文本内容的关联关系,直接获取所述文本内容。
以视频为例,也可以通过对垂直站点进行数据整合,事先将全网中各个视频站点的该集剧集的播放链接地址分别与第三方垂直站点中该集的播放内容(即前述的文本内容)进行关联,当用户对视频进行播放时,直接调用该集的文本内容作为播放内容进行后续分析。
子步骤222,根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本;
可以理解,在本发明实施例中,随着动态元素的播放,其播放内容也在变化,那么为了使获取的关键词与播放内容同步,则需要将文本内容与播放进度同步。以电视剧视频类型的动态元素为例,其视频播放后,视频内容是随剧情发展的,那么即可以视频的当前播放进度去获取对应当前进度下的剧情的文本内容。
优选的,所述根据所述动态元素在当前的播放进度,从所述文本内容中获取对应所述播放进度的目标文本,包括:
子步骤S1,对所述文本内容进行切分,获得按文档顺序排列的n个语义单元;
比如对于当前播放的电视剧集,对剧集文本进行分句切分,获得按剧情先后顺序排列的n个语义单元。在本发明实施例中,可按照剧情文本中的标点符号进行切分。
子步骤S2,根据所述动态元素的播放内容的播放的总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例;
比如,播放《甄嬛传》第24集时,首先会获取该集时长45:05,在播放过程中获取播放进度如当该视频播放至15:25时,其播放的进度比例为15:25/45:05=0.3385。
子步骤S3,以所述进度比例为基准确定阈值范围,计算所述阈值范围内的n个语义单元,并将所述n个语义单元作为对应所述播放进度的目标文本;其中,N、n为整数,且0<n<N。
如前述总共切分了n个语义单元,由于语义单元是按序排列的,那么第i个语义单元所处的位置可以计算为i/n,为了对当前播放进度的目标文本进行抓取,可以进度比例为基准,取上下浮动0.1的取值区间,那么在该取值区间中的语义单元则为前述目标文本。其中N、n为整数,且0<n<N。
比如,前述例子中的0.3385这个基准,按此比例在一定阈值范围,如[0.3,0.4],对电视猫中《甄嬛传》第24集的分集介绍中的文本内容的分句进行同步,可同步至分句“宫中时疫发作,宫女太监不断染病,人人自危”。
优选的,所述计算当前播放的时长占播放总时长的进度比例时,每隔指定时间间隔计算当前播放的时长与播放总时长的进度比例。
本发明为了便于控制,节省计算量,设定同步的间隔时间,即每隔指定间隔(比如5秒)计算当前播放的时长与总时段的进度比例。
子步骤223,根据所述目标文本提取各个关键词。
步骤230,根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应的同步展示。
比如上述例子中,抓取上述分句进行分析,抓取其中的分词“染病”、“时疫”作为关键词发送到第一服务器,第一服务器在推荐模型中分别进行匹配,得到推荐查询串“时疫是什么病”、“儿子染怪病母亲含泪将其养笼中”、“牛肺疫治疗方法”等返回用户使用的浏览器,在浏览器的底边栏进行展示。如此,用户在播放动态元素,比如视频时,也可以在当前展示页面看到推荐查询串了。
在本发明实施例中,步骤220至步骤230循环执行,直至视频播放结束或者用户关闭页面。其根据放进度不断对播放内容进行分析,定时将分析得到的查询串不断更新在浏览器的底边栏,使搜索推荐的内容随着页面中用户的观看进度而变化。
比如当作为动态元素的该集视频播放至24:51时,播放的进度为24:51/45:05=0.544,按此比例在一定阈值范围,如[0.5,0.6]对该视频的播放内容对应的文本内容中的分句进行同步,可同步至分句“甄嬛欲求皇帝救助眉庄,皇帝却为京城百姓安危和朝政烦心,无暇接见”。抓取该分句进行分析,抓取其中的分词“救助”、“烦心”作为关键词发送到第一服务器,在推荐模型中分别进行匹配,得到推荐查询串“民政救助哪些病”、“我国古代的救助思想”等附在浏览器的底边栏,从而根据播放进度不断对播放内容进行分析,使得到的推荐查询串不断的同步更新。当然,在其他实施例中,可以将得到的推荐查询串间隔一段时间后与当前播放进度对应进行异步展示,特别是播放电视剧类型的视频片头时,虽然当前播放进度已大于零,但尚未有实质性的播放内容,此时需间隔一段时间再进行推荐查询串的展示。
另外,本发明实施例在对当前播放进度对应的目标文本获得的各关键词时,还可结合该动态元素的播放内容的背景介绍或者所述播放内容的整个文本集合作为计算推荐查询串的因素。第一服务器也可从第二服务器获取所述背景介绍或者当前整个文本集合。
可以理解,当前影视剧集的故事背景和单集剧情也可以作为计算推荐词的重要依据,这些数据可以通过上述方法在第三方数据源获取,如“电视猫”。在用户观看影视剧的过程中,依据上述方法,获取到当前播放内容的剧集介绍,例如用户观看《甄嬛传》第四集时,对应播放内容中分析目标文本“甄嬛无意中发现碎玉轩海棠树不开花的秘密——树底下被人埋了大量麝香”,这里“麝香”会被提出,用做计算推荐查询串的重要依据。但是“麝香”相关的查询词主题比较多且分散,比如“麝香猫咖啡”“麝香价格”“麝香是什么动物身上的”等。但是在电视猫中存储的《甄嬛传》全集整个分集介绍对应的文本集合中,反复把“麝香”和“流产”这两个概念联系在一起。通过主题模型(Latent Dirichlet Allocation),很容易将这两个概念的主题计算到一起,这样在就可以给出“麝香对孕妇的影响”、“白麝香会导致不孕吗”等类似的推荐查询串。
当然,所述步骤220,根据所述动态元素当前展示的播放内容,获取各个关键词,还可采用其他形式。前述子步骤中对整个文档采用分句进行,本发明也可不对文档内容进行分句,可对文档内容配置一个提取范围,然后按动态元素的当前播放进度对应的提取范围提取对应的目标文本对其进行分析得到关键词,然后再将所得的关键词分别发送至第一服务器获取推荐查询串。或者按动态元素的当前播放进度对应的提取范围直接提取对应的关键词,然后再将所得的关键词分别发送至第一服务器获取推荐查询串。
当然,动态元素的播放内容对应的文本内容(比如剧情文本)或关键词与视频的各播放时间的关联关系可事先保存在服务器上,当视频播放至对应的时刻时,直接调用对应的剧情文本或对应剧情文本中的关键词,分别发送至搜索服务器中进行推荐查询串的匹配。也可以根据视频的播放时刻实时匹配查找相应的剧情文本,并进行文本分析得到关键词,再定时发送关键词至搜索服务器中分别进行推荐查询串的匹配。
在本发明实施例中,当第三方数据源中的播放内容对应的文本内容有明显的按集标注的信息,如“第一集”、“第二集”等,则可以集为单位定时对播放内容对应的文档内容,即播放内容进行切分,按集对推荐查询串进行更新。当前用户观看“甄嬛传”第53集时,不断抓取电视猫中《甄嬛传》第53集的剧情介绍,获取“进香”、“出家”、“寺院”等关键字,则推荐“古代出家的皇帝”、“历史上的皇家寺院”、“武则天在哪出家为尼”等搜索链接附在浏览器的底边栏;当前观看至“甄嬛传”第55集时,又获取“迎接”、“回宫”、“重逢”等关键字,则推荐“皇后回宫该怎么回应”、“古时各种迎接礼仪”等搜索链接同步地附在底边栏。
优选的,本发明实施例还包括:
步骤240,结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
在本发明实施例优选的针对可持续播放的动态元素(比如视频类动态元素)。本发明实施例基于网络中的剧集资源的提供方情况,客户端(比如浏览器)、第一服务器(负责提供推荐查询串)、第二服务器(负责提供与动态元素相关的文档内容)思路,从而充分利用了网络中第三方提供的服务器资源。
当然本发明实施例中第一服务器和第二服务器也可以合并,在此并不对其加以限制。
本实施例与实施例一类似的步骤原理类似,在此不再详述。
实施例三
参照图3,其示出了本发明实施例三的一种针对页面动态元素的推荐方法的流程示意图,具体可以包括:
步骤310,判断用户在移动终端当前触发的页面中是否存在动态元素;
步骤320,如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
所述步骤320包括:
子步骤321,当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框;
页面中的弹出框提供了一种快捷信息的展示途径,但在弹出框弹出时,页面中的内容将发生变化,用户的主要关注点关注在弹出框中的文本内容,因此,本实施例将根据弹出框中的文本内容进行分析,结合用户的关注点进行搜索推荐。
在本发明实施例中,当动态元素为弹出框时,其播放进度直接为100%,即弹出框中的页面内容即为弹出框的播放内容,对于其他瞬时展示的动态元素,其播放进度也可以理解为100%。
本发明实施例首先提取当前页面中的弹出框。即对父页面进行解析,获取弹出框对应的文本标记;对各弹出框中的文本内容进行预加载。
子步骤322,将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
对弹出框中的文本内容进行分析抓取,即根据抓取弹出框中的文本内容进行解析,得到弹出框中显示的标题、正文等信息,并进行文本分析;再根据文本内容进行分析,提取其中的关键字,发送至第一服务器中。
步骤330,根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
然后第一服务器将分析得到的推荐查询串返回客户端,客户端更新在移动终端所在的浏览器的底边栏。
优选的,还包括:
步骤340,当接收到用户关闭所述弹出框的动作时,重新根据所述父页面的内容获取关键词。
当接收到用户关闭该弹出框的动作时,重新根据父页面的内容加载原有的推荐查询串,使搜索推荐的内容随着页面中用户的触发而变化。上述实施例可在移动设备中进行相应的搜索推荐,移动设备对视频类型的动态元素进行查看时,查询视频对应的播放内容,定时将分析得到的推荐查询串不断更新在移动应用的指定位置,如视频的边栏等位置,使搜索推荐的内容随着页面中用户的观看进度而变化。
优选的,还包括:
步骤350,结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
本实施例与实施例一和实施例二原理类似,在此不再详述。
实施例四
参照图4,其示出了本发明实施例四的一种针对页面动态元素的推荐系统的结构示意图,具体可以包括:
动态判断模块410,适于判断用户触发的当前页面中是否存在动态元素;
关键词提取模块420,适于如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
优选的,所述关键词提取模块420包括:
文本内容获取模块,适于获取所述动态元素的播放内容对应的文本内容;
目标文本获取模块,适于根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本;
第二关键词提取模块,适于根据所述目标文本提取各个关键词。
所述文本内容获取模块包括:
第一文本内容获取模块,适于获取所述动态元素对应的属性信息,并以所述属性信息为参数从第二服务器获取对应的文本内容。
优选的,所述文本内容获取模块包括:
第二文本内容获取模块,适于根据所述当前页面的链接地址与的文本内容的关联关系,直接获取所述文本内容。
优选的,所述目标文本获取模块包括:
语义单元分析模块,适于对对所述文本内容进行切分,获得按文档顺序排列的N个语义单元;
播放进度计算模块,适于根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例;
第一目标文本获取模块,适于以所述进度比例为基准确定阈值范围,计算所述阈值范围内的n个语义单元,并将所述n个语义单元作为对应所述播放进度的目标文本;其中,N、n为整数,且0<n<N。
优选的,所述播放进度计算模块包括:
定时模块,适于每隔指定时间间隔计算当前播放的时长与播放总时长的进度比例。
优选的,还包括:
弹出框提取模块,适于当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框;
第三关键词提取模块,适于将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
优选的,还包括:
再获取模块,适于当接收到用户关闭所述弹出框的动作时,重新根据所述父页面的内容获取关键词。
推荐查询串展示模块430,根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
优选的,还包括:
优化模块,适于结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。。
实施例五
参照图5,其示出了本发明实施例五的一种针对页面动态元素的推荐系统的结构示意图,具体可以包括:客户端500、第一服务器600;
所述客户端500包括:
动态判断模块510,适于判断用户触发的当前页面中是否存在动态元素;
第一关键词提取模块520,适于如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;;
所述第一关键词提取模块520包括:
文本内容获取模块521,适于获取所述动态元素的播放内容对应的文本内容;
当然,本模块还可从第二服务器获取所述动态元素的播放内容对应的文本内容;所述第二服务器用于提供对应各动态元素的文本内容。
目标文本获取模块522,适于根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本;
第二关键词提取模块523,适于根据所述目标文本提取各个关键词。
推荐查询串展示模块530,适于根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
所述第一服务器600用于,针对所述关键词进行分析,获得推荐查询串并返回给客户端。
优选的,所述目标文本获取模块包括:
第一文本内容获取模块,适于获取所述动态元素对应的属性信息,并以所述属性信息为参数从第二服务器获取对应的文本内容。
所述文本内容获取模块包括:
第一文本内容获取模块,适于获取所述动态元素对应的属性信息,并以所述属性信息为参数从第二服务器获取对应的文本内容。
优选的,所述文本内容获取模块包括:
第二文本内容获取模块,适于根据所述当前页面的链接地址与的文本内容的关联关系,直接获取所述文本内容。
优选的,所述目标文本获取模块包括:
语义单元分析模块,适于对对所述文本内容进行切分,获得按文档顺序排列的N个语义单元;
播放进度计算模块,适于根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例;
第一目标文本获取模块,适于以所述进度比例为基准确定阈值范围,计算所述阈值范围内的n个语义单元,并将所述n个语义单元作为对应所述播放进度的目标文本;其中,N、n为整数,且0<n<N。
优选的,所述播放进度计算模块包括:
定时模块,适于每隔指定时间间隔计算当前播放的时长与播放总时长的进度比例。
优选的,还包括:
优化模块,优化模块,适于结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
需要说明的是,对于上述方法实施例而言,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上对本申请所提供的一种针对页面动态元素的推荐方法和系统,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种针对页面动态元素的推荐方法,其特征在于,包括:
判断用户触发的当前页面中是否存在动态元素;
如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
2.根据权利要求1所述的方法,其特征在于,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词,包括:
获取所述动态元素的播放内容对应的文本内容;
根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本;
根据所述目标文本提取各个关键词。
3.根据权利要求2所述的方法,其特征在于,所述获取对应所述动态元素的播放内容对应的文本内容,包括:
获取所述动态元素对应的属性信息,并根据所述属性信息从第二服务器获取对应的文本内容。
4.根据权利要求2所述的方法,其特征在于,所述获取对应所述动态元素的播放内容对应的文本内容,包括:
根据所述当前页面的链接地址与的文本内容的关联关系,直接获取所述文本内容。
5.根据权利要求2所述的方法,其特征在于,所述根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本,包括:
对所述文本内容进行切分,获得按文档顺序排列的N个语义单元;
根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例;
以所述进度比例为基准确定阈值范围,计算所述阈值范围内的n个语义单元,并将所述n个语义单元作为对应所述播放进度的目标文本;其中,N、n为整数,且0<n<N。
6.根据权利要求5所述的方法,其特征在于,所述计算当前播放的时长占播放总时长的进度比例,包括:
每隔指定时间间隔计算当前播放的时长与播放总时长的进度比例。
7.根据权利要求1或2所述的方法,其特征在于,还包括:
当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框;
将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
8.根据权利要求7所述的方法,其特征在于,还包括:
当接收到用户关闭所述弹出框的动作时,重新根据所述父页面的内容获取关键词。
9.根据权利要求1所述的方法,其特征在于,还包括:
结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
10.一种针对页面动态元素的推荐系统,其特征在于,包括:
动态判断模块,适于判断用户触发的当前页面中是否存在动态元素;
关键词提取模块,适于如果存在动态元素,则获取所述动态元素对应的播放内容,根据所述动态元素的当前播放进度不断对所述播放内容进行分析,分别得到所述播放内容在当前播放进度下对应的各个关键词;
推荐查询串展示模块,适于根据所述各个关键词,从第一服务器获取所述各个关键词各自对应匹配的各推荐查询串,并与所述当前播放进度进行对应展示。
11.根据权利要求10所述的系统,其特征在于,所述关键词提取模块包括:
文本内容获取模块,适于从取所述动态元素的播放内容对应的文本内容;
目标文本获取模块,适于根据所述动态元素的当前播放进度,从所述文本内容中获取对应所述当前播放进度对应的目标文本;
第二关键词提取模块,适于根据所述目标文本提取各个关键词。
12.根据权利要求11所述的系统,其特征在于,所述目标文本获取模块包括:
语义单元分析模块,适于对对所述文本内容进行切分,获得按文档顺序排列的N个语义单元;
播放进度计算模块,适于根据所述动态元素的播放内容的播放总时长和当前播放的时长,计算当前播放的时长占播放总时长的进度比例;
第一目标文本获取模块,适于以所述进度比例为基准确定阈值范围,计算所述阈值范围内的n个语义单元,并将所述n个语义单元作为对应所述播放进度的目标文本;其中,N、n为整数,且0<n<N。
13.根据权利要求10或11所述的系统,其特征在于,还包括:
弹出框提取模块,适于当所述动态元素为弹出框时,从所述弹出框对应的父页面提取所述当前页面中的弹出框;
第三关键词提取模块,适于将根据所述弹出框获取文本内容作为播放内容,并将所述文本内容作为目标文本进行分析,得到各关键词。
14.根据权利要求10所述的系统,其特征在于,还包括:
优化模块,适于结合所述推荐查询串被触发的情况和所述目标文本的关键词之间的关系,优化所述当前播放进度对应的所述目标文本的关键词与所述推荐查询串的相关性。
CN201410140686.4A 2014-04-09 2014-04-09 一种针对页面动态元素的推荐方法和系统 Active CN103942285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410140686.4A CN103942285B (zh) 2014-04-09 2014-04-09 一种针对页面动态元素的推荐方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410140686.4A CN103942285B (zh) 2014-04-09 2014-04-09 一种针对页面动态元素的推荐方法和系统

Publications (2)

Publication Number Publication Date
CN103942285A true CN103942285A (zh) 2014-07-23
CN103942285B CN103942285B (zh) 2017-12-08

Family

ID=51189953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410140686.4A Active CN103942285B (zh) 2014-04-09 2014-04-09 一种针对页面动态元素的推荐方法和系统

Country Status (1)

Country Link
CN (1) CN103942285B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203568A (zh) * 2016-03-18 2017-09-26 百度在线网络技术(北京)有限公司 一种文件播放功能与搜索功能的切换方法及装置
CN107832312A (zh) * 2017-01-03 2018-03-23 北京工业大学 一种基于深度语义辨析的文本推荐方法
CN111163348A (zh) * 2020-01-08 2020-05-15 百度在线网络技术(北京)有限公司 基于视频播放的搜索方法和装置
CN111507065A (zh) * 2020-03-10 2020-08-07 百度在线网络技术(北京)有限公司 阅读信息的处理方法、设备及存储介质
CN111741354A (zh) * 2020-06-01 2020-10-02 深圳康佳电子科技有限公司 一种基于界面元素辅助语音交互的方法、系统及存储介质
WO2021012522A1 (zh) * 2019-07-19 2021-01-28 平安科技(深圳)有限公司 基于图像识别的网页取证方法、装置、存储介质及服务器
CN113111221A (zh) * 2021-05-13 2021-07-13 北京字节跳动网络技术有限公司 一种基于视频的搜索方法及装置
WO2021169537A1 (zh) * 2020-02-24 2021-09-02 北京星选科技有限公司 一种对象推送方法、系统、装置、终端及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080162206A1 (en) * 2006-12-28 2008-07-03 Yahoo! Inc. Rich media engagement market targeting
US20100161416A1 (en) * 2008-12-22 2010-06-24 Electronics And Telecommunications Research Institute Method of providing targeted advertisements
CN101968802A (zh) * 2010-09-30 2011-02-09 百度在线网络技术(北京)有限公司 一种基于用户浏览行为进行互联网内容推荐的方法与设备
CN102402594A (zh) * 2011-11-04 2012-04-04 电子科技大学 一种富媒体个性化推荐方法
CN103024464A (zh) * 2011-12-31 2013-04-03 中国科学院计算技术研究所 提供与视频播放内容相关信息的系统和方法
CN103442001A (zh) * 2013-08-22 2013-12-11 百度在线网络技术(北京)有限公司 信息推荐方法、装置和服务器
CN103686452A (zh) * 2013-12-06 2014-03-26 北京普瑞众合国际科技有限公司 一种视频关联信息的添加处理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080162206A1 (en) * 2006-12-28 2008-07-03 Yahoo! Inc. Rich media engagement market targeting
US20100161416A1 (en) * 2008-12-22 2010-06-24 Electronics And Telecommunications Research Institute Method of providing targeted advertisements
CN101968802A (zh) * 2010-09-30 2011-02-09 百度在线网络技术(北京)有限公司 一种基于用户浏览行为进行互联网内容推荐的方法与设备
CN102402594A (zh) * 2011-11-04 2012-04-04 电子科技大学 一种富媒体个性化推荐方法
CN103024464A (zh) * 2011-12-31 2013-04-03 中国科学院计算技术研究所 提供与视频播放内容相关信息的系统和方法
CN103442001A (zh) * 2013-08-22 2013-12-11 百度在线网络技术(北京)有限公司 信息推荐方法、装置和服务器
CN103686452A (zh) * 2013-12-06 2014-03-26 北京普瑞众合国际科技有限公司 一种视频关联信息的添加处理方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203568A (zh) * 2016-03-18 2017-09-26 百度在线网络技术(北京)有限公司 一种文件播放功能与搜索功能的切换方法及装置
CN107832312A (zh) * 2017-01-03 2018-03-23 北京工业大学 一种基于深度语义辨析的文本推荐方法
CN107832312B (zh) * 2017-01-03 2023-10-10 北京工业大学 一种基于深度语义辨析的文本推荐方法
WO2021012522A1 (zh) * 2019-07-19 2021-01-28 平安科技(深圳)有限公司 基于图像识别的网页取证方法、装置、存储介质及服务器
CN111163348A (zh) * 2020-01-08 2020-05-15 百度在线网络技术(北京)有限公司 基于视频播放的搜索方法和装置
WO2021169537A1 (zh) * 2020-02-24 2021-09-02 北京星选科技有限公司 一种对象推送方法、系统、装置、终端及存储介质
CN111507065A (zh) * 2020-03-10 2020-08-07 百度在线网络技术(北京)有限公司 阅读信息的处理方法、设备及存储介质
CN111741354A (zh) * 2020-06-01 2020-10-02 深圳康佳电子科技有限公司 一种基于界面元素辅助语音交互的方法、系统及存储介质
CN113111221A (zh) * 2021-05-13 2021-07-13 北京字节跳动网络技术有限公司 一种基于视频的搜索方法及装置

Also Published As

Publication number Publication date
CN103942285B (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
US20210056257A1 (en) Obtaining data from incomplete electronic forms
CN103942285A (zh) 一种针对页面动态元素的推荐方法和系统
CN102929928B (zh) 基于多维相似度的个性化新闻推荐方法
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
Barford et al. Adscape: Harvesting and analyzing online display ads
KR20160055930A (ko) 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법
CN105045931A (zh) 一种基于Web挖掘的视频推荐方法和系统
KR102155342B1 (ko) 다중파라미터 분석 기반 인플루언서 매칭을 이용한 광고 서비스 제공 시스템
CN106383887A (zh) 一种环保新闻数据采集和推荐展示的方法及系统
KR101566616B1 (ko) 빅데이터 처리를 통한 광고의사결정시스템 및 방법
CN102890702A (zh) 一种面向网络论坛的意见领袖挖掘方法
CN104090923B (zh) 一种浏览器中的富媒体信息的展示方法和装置
CN104090757B (zh) 针对浏览器的富媒体信息展示方法
CN106503907B (zh) 一种业务评估信息确定方法以及服务器
Arantes et al. Understanding video-ad consumption on YouTube: a measurement study on user behavior, popularity, and content properties
CN111931073B (zh) 内容推送方法、装置、电子设备及计算机可读介质
Cozza et al. Experimental measures of news personalization in Google News
US9292515B1 (en) Using follow-on search behavior to measure the effectiveness of online video ads
CN100555283C (zh) 一种直接针对用户的相关信息的发布方法和系统
US20240169004A1 (en) Methods and systems for self-tuning personalization engines in near real-time
CN101115024A (zh) 一种显示网页内容相关信息的方法及系统
Bufnea et al. A community driven approach for click bait reporting
TWI647638B (zh) 互動式推薦系統與方法
CN110110202A (zh) 一种信息流推送方法及装置
CN106156024B (zh) 一种信息处理方法及服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant