CN102265276A - 基于上下文的推荐系统 - Google Patents

基于上下文的推荐系统 Download PDF

Info

Publication number
CN102265276A
CN102265276A CN2009801522025A CN200980152202A CN102265276A CN 102265276 A CN102265276 A CN 102265276A CN 2009801522025 A CN2009801522025 A CN 2009801522025A CN 200980152202 A CN200980152202 A CN 200980152202A CN 102265276 A CN102265276 A CN 102265276A
Authority
CN
China
Prior art keywords
content
described system
feature
database
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801522025A
Other languages
English (en)
Other versions
CN102265276B (zh
Inventor
M.巴比里
S.P.P.普龙克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fink Tv Guidance Co Ltd
Original Assignee
Axel Springer Digital TV Guide GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axel Springer Digital TV Guide GmbH filed Critical Axel Springer Digital TV Guide GmbH
Publication of CN102265276A publication Critical patent/CN102265276A/zh
Application granted granted Critical
Publication of CN102265276B publication Critical patent/CN102265276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种推荐系统和方法,其包含:第一提取器(S200),用于应用第一特征提取算法提取表征运行在所述系统上的第一应用程序(例如,互联网浏览器)处理的输入数据(例如,网页)的内容的第一特征;以及第二提取器(S100),用于应用第二特征提取算法提取表征运行在所述系统上的第二应用程序(例如,个人TV或电影访问程序)的数据库的内容的第二特征。另外,还提供了比较所述第一和第二特征以便识别用于推荐的匹配项的比较器(S300)。

Description

基于上下文的推荐系统
技术领域
本发明涉及向用户推荐产品或服务的系统、方法、和计算机程序产品。
背景技术
在当今的信息社会里,知识正在以前所未有的惊人步伐从个体阶段步入团体层面。信息——数字时代的珍贵原料从未如此容易地通过互联网获得、处理和传播。然而,随着数量巨大的信息呈现在用户面前,当用户需要时,以更好地满足他们要求的方式找出他们想要的东西的难度迅速增大。推荐系统通过使用对特定对象或项目的评估对那个对象或项目作出推荐。它们被作为基于计算机的智能系统引入,以应付信息和产品过量的问题。推荐系统的两个基本实体是用户和项目。用户是利用向他提供有关各种项目的意见的推荐系统和从推荐系统接收有关新项目的推荐的人员。通常,推荐系统的目的是生成有关新项目的建议或预测特定项目对特殊用户的实用性。推荐系统的输出可以是,例如,预测或推荐。将预测表达成代表特定项目的预期意见的数值。可以将推荐表达成预料活跃用户最喜欢的项目列表。文件和用户简介可以用关键词向量或列表来表示以便于比较和学习。
如今,人们花费在看电视(TV)上的时间越来越少,而花费在浏览互联网上的时间越来越多。以传统方式广播和在TV上观看的视频内容现在越来越普遍地可从互联网上获得。同时,新的电视机和机顶盒使互联网内容可经由电视机访问。此外,已经提出了使用户能够使用遥控器和他们的电视机访问互联网服务和浏览互联网的能上网(internet-enabled)电视机。
硬盘驱动器和数字视频压缩技术提供了时移电视直播和不必担心磁带或其它移动记录媒体的可用性地高质量记录大量电视节目的可能性。同时,视听信号的数字化使普通用户的内容源的数量成倍增加。使用例如简单抛物面天线和数字接收器就可获得数以百计的频道。每天在互联网上触及各种服务地发布成千上万个视频片段,且所有主要内容制作商都已经使它们的整个内容库可在线获得。每天广播和可获得数千个可能感兴趣的节目,并且可以将它们记录和存储在本地以便于以后访问。
但是,虽然为普通用户提供的内容极大地增加了,但消耗在可用内容上的时间已经成为限制参数。因此,根据用户需要和偏爱筛选出特定信息和选择个别内容已经成为重要课题。
推荐系统可以通过例如估计某个用户对某个项目的喜欢程度,并自动排序内容项来解决这些问题。这可以通过将内容项的特点或特征与用户简介或用户设置相比较来完成。因此,可以将推荐系统看作筛选出引起用户注意的用户特定内容的工具或机构。
但是,在许多情况下,来自不同媒体或服务的内容是分开处理的,从而将推荐系统的用户引向既耗费时间又负载加重的操作。举一个例子来说,互联网浏览通常使用互联网浏览器来完成,而TV接收器具有它们自己的传统界面。可编程录像机(PVR)可以经由显示在TV上的电子节目指南(EPG)或经由网页来控制。EPG是按照例如欧洲电信标准协会(ETSI)的EN 300707v1.2.1标准规定的。EPG可以是存储在产品中和用户经由屏幕菜单等访问的数据库。EPG的值将符合用户观看判据的大多数感兴趣节目告知用户。现在,用户可以看看在接着的几天内是否可获得和在什么频道上可获得他选择的节目。或者,用户可以通过将信息提供者与节目数据相联系的评价而选择要被告知的最佳节目。可以包括像节目的语言、它的副标题和不适合孩子观看的节目的音频描述或指示那样的类似属性。因此,通过将数据作为数据库存储在电视机或录像机中,将呈现或显示信息的方式与发送数据的方式分开,允许观众按照他的偏爱有选择地存储信息,使用预定刷新序列以便使大多数关键信息总是可用,以及使用最终产品中的存储设备以便观众即时访问有关可用节目的信息和网络运营商可以减小最佳性能所需的带宽,EPG提供了观众选择想观看的节目所需的功能,并且提供了将这个信息传送到电视机或录像机的便捷途径。
已经为内容用户(例如,观众)建议了个人用户平台作为构建他们自己的个人(TV)简介(例如,在“真正”频道旁边的个人TV频道)的选项。这可以用几种方式实现。按照第一种选项,可以使用“种子”节目。在观看节目(例如,BBC新闻)的同时,用户可以通过在EPG中创建由特定内容(例如,BBC新闻广播)和有关其它相关新闻内容的建议组成的个人频道(叫做,例如,“我的新闻”),创建或修改个人(TV)简介。这些建议可以基于过去观看选择的评价,包括用户对系统认为相关的内容所投的赞成和反对票。按照第二种选项,用户可以通过输入特定特点创建他们自己所希望的个人(TV)简介(例如,个人频道简介),和系统可以按照观众的选择和偏爱再次“学习”如何细调这个新个人(TV)简介内容。按照第三种选项,用户可以简单地下载别人已经创建好的个人(TV)简介(例如,个人频道简介)。我们的想法是,最终可以提供充满这样观众可以相互推荐的简介的网站。
但是,上述互联网浏览与TV服务的分离导致在浏览互联网、阅读博客、阅读在线新闻、访问社交网站上朋友的页面时,用户可能会偶然碰到与TV节目或电影有关的信息。如果该信息是令人感兴趣的,应该按照新获得信息改变个人TV简介,或应该将个人TV或PVR编程成记录与用户在互联网上找到的东西有关的节目或电影。这导致了经由电视机的用户界面进行相当多的和耗时的操作。在一些情况下,这样的延迟可能是不恰当的,并且可能妨碍TV节目或电影或经由互联网浏览器检测到的其它内容项的及时记录。
发明内容
本发明的目的是提供能够快速和可靠修改为用户推荐的内容项的推荐系统。
这个目的是通过如权利要求1所要求的系统、如权利要求17所要求的方法和如权利要求18所要求的计算机程序产品实现的。
按照本发明,提供了第一提取器,它适用于将第一特征提取算法应用在内容项上,从而提取表征运行在特定装置上的第一应用程序处理的输入数据的内容的第一特征。另外,还提供了第二提取器,它适用于将第二特征提取算法应用于运行在特定装置或系统的另一个装置上的第二应用程序的数据库的内容,从而提取表征第二应用程序的数据库的内容的第二特征。比较器可操作地与第一提取器和第二提取器连接,并适用于比较第一和第二特征,从而识别用于推荐的匹配项。
于是,提供了当通过比较器检测到或识别出与第一应用程序的处理数据的匹配项时自动或响应性地访问第二应用程序的设置(像,例如,个人电视设置等那样)的便捷方式。可以将可以通过特定内容表征的任何类型的输入数据与可以包含可以作出推荐的任何类型产品和/或服务的第二应用程序的数据库的内容相比较。因此,可以没有明显延迟和中断其它应用程序或过程地提供推荐和随后修改进程。
按照第一方面,可以提供由第一应用程序触发以便激活第二应用程序的切换功能或切换进程。这个切换进程保证了推荐和随后修改进程无缝地和自动地启动,以便使处理延迟最小。
按照可以与第一方面结合的第二方面,所述第一应用程序可以包含互联网浏览器,和输入数据可以包含从互联网下载的内容信息。在一种特定实现中,内容信息可以包含超文本标记语言(HTML)文档。这样的基于浏览器应用程序提供了在用户的浏览或冲浪活动期间可以提供第二应用程序的推荐的优点,其中可以突出显示特定内容项以便将有关推荐选项告知用户。
按照可以与上述第一和第二方面的至少一个方面结合的第三方面,所述第二应用程序的数据库可以包含电子节目指南信息。这里,在第一应用程序中一检测到电视相关信息,就可以在输入数据的处理期间向用户推荐电视访问。
按照可以与上述第一至第三方面的任何一个方面结合的第四方面,所述第二应用程序的数据库可以是电影数据库。与上述第三方面类似,如果有的话,可以推荐与经过第一应用程序处理的输入数据有关的电影数据库当中的电影。
按照可以与上述第一至第四方面的任何一个方面结合的第五方面,所述第一提取器可以适用于检测输入数据的内容与电视节目有关还是与现有电影或电视作品有关。因此,经过第一应用程序处理的输入数据中的相应项目可以用于触发到第二应用程序的切换或切换进程,或为了推荐给用户,可以突出显示出来供用户选择,然后用户单独激活切换进程。
按照可以与上述第一至第五方面的任何一个方面结合的第六方面,所述第一和第二特征提取算法可以适用于从输入数据中除去标记和无用词的至少一种。从而,可以从输入数据中剥离与输入数据的任何内容无关或不指示输入数据的任何内容的信息。
按照可以与上述第一至第六方面的任何一个方面结合的第七方面,所述比较器可以适用于根据第一和第二特征之间的重叠量识别匹配项。这种措施提供了可以预定决定足够相似度或匹配度所需的预定重叠量的优点。
按照可以与上述第一至第七方面的任何一个方面结合的第八方面,所述第一和第二特征可以包含检索词频率逆文档频率值的向量(vectors of termfrequency inverse document frequency value)。这种手段保证捕获到输入数据的词汇、文本文档和特定类别之间的相关性。
按照可以与上述第一至第八方面的任何一个方面结合的第九方面,所述比较器可以适用于应用词干抽取过程(word stemmer)、近似字符串匹配过程、和计算n-gram的过程的至少一种。从而,可以提供优化所述第一和第二特征之间的比较的可替代或另外算法。
按照可以与上述第一至第九方面的任何一个方面结合的第十方面,所述第一提取器可以包含网页文本的自动关键词标识器,其中将关键词标记成用于做个人电视频道的种子。因此,可以实现消费者根据所浏览网页获取电视内容的简单方式。
按照可以与上述第一至第十方面的任何一个方面结合的第十一方面,所述第二特征可以包含设置在数据库中的元数据。在一个特例中,所述比较器可以适用于将不同权重应用于所述元数据。这种措施提供了可以将关键词等的列表与内容项相联系,从而可以减少或防止生成关键词的附加处理的优点。
按照可以与上述第一至第十一方面的任何一个方面结合的第十二方面,所述第二特征可以包含即时电视节目点播(TV-Anytime)功能的内容引用标识符(CRID)。从而,可以提供内容引用,以便允许内容的地点无关引用。
按照可以与上述第一至第十二方面的任何一个方面结合的第十三方面,可以为显示匹配项和提供选择匹配项的输入功能提供用户界面。因此,可以向用户提供选择或记录匹配项的选项。
注意,上述推荐系统可以根据含有分立硬件部件的至少一个分立硬件电路、至少一个集成芯片、一排芯片模块、或受存储在存储器中的软件例程或程序控制的至少一个信号处理设备或计算机设备或芯片来实现。
附图说明
现在参考附图,根据本发明的实施例举例描述本发明,在附图中:
图1示出了按照第一实施例的能上网电视机的示意性方块图;以及
图2示出了各个实施例所涉及的处理步骤的示意图流程图。
具体实施方式
现在根据带有基于个人电视的推荐技术的示范性能上网电视机描述本发明的实施例。
图1示出了按照第一实施例的能上网电视机的示意性方块图。该电视机包含可以施加浏览器(B)20和TV接收器(TV)40的输出信号以便显示在屏幕上的显示单元或模块10。TV接收器40经由可以是抛物面卫星天线的天线60接收输入信号。浏览器20与互联网50连接,以便访问互联网内容(网页)或下载其它内容信息。浏览器20可以通过用户界面(UI)22控制,用户界面(UI)22可以包含键盘、指针设备、触摸板等。另外,TV接收器40可以与可编程录像机(PVR)42连接,可编程录像机(PVR)42可以经由可以例如根据广播或互联网信息更新的存储在数据库32中的电子节目指南(EPG)来控制。另外,还提供了根据指示电视机的至少一个用户的偏爱的用户简介表46推荐EPG 32当中的节目信息的推荐单元48。
另外,提供了分析浏览器20处理的输入数据以便提取表征经过处理输入数据的内容的特征(例如,关键词等)的确定单元或模块30。确定单元30还访问数据库32,以便分析数据库的内容和提取表征可用节目数据的内容的特征。根据所提取特征之间的所确定匹配,确定单元30控制可编程录像机42和/或用户简介表46提供对与在浏览器20上处理的输入数据有关的TV节目或作品的访问。更新的用户简介表46影响或控制推荐单元48,从而推荐的TV节目可以适用于被浏览的互联网内容。
在一个特定实现例子中,确定单元30可以配置成识别与TV节目或电影作品有关的数据项,并且在显示单元10的屏幕上突出显示或标记这些数据项。然后,用户可以使用用户界面22激活或切换到确定单元30上的匹配过程。
在上述实施例中,确定单元30可以实现成例如互联网浏览器20的插件,用于分析例如HTML元素(例如,标题、链接、段落、表格单元格等),和自动检测HTML文档中的内容与即将播放的TV节目有关还是与现有电影/TV作品有关。在这种情况下,向用户提供了通过使用用户界面22简单地选择上下文相关菜单等上的选项访问他个人的TV设置的便捷方式(上下文相关菜单可以例如当在突出显示的HTML元素上进行鼠标右击时出现)。可以向用户提供例如将即将播放的TV节目加入他的个人TV频道之一中,或通过评价相关内容(例如,“喜欢”/“不喜欢”)更新他的简介。
按照第一实施例,当用户正在使用浏览器20浏览互联网时,他可能阅读到有关某个话题或个人的在线新闻文章。确定单元30自动地或响应正在运行浏览器应用程序的激活而分析数据库32中的EPG的文本和内容,并自动检测在特定TV频道上,在晚上晚些时候是否安排了具有有关该话题或个人的信息的TV节目来播放。于是,确定单元30控制浏览器20显示指示已经在数据库32的EPG中找到相关TV节目的图标。另外,该系统可以显示有关相关TV节目的信息(例如,元数据)。
现在,用户可以点击或激活该图标,和浏览器20可以指示与用户当前正在阅读的网页有关的所检索TV节目。用户现在可以选择将所检索TV节目加入设置在他的用户简介表46中的个人新闻频道中的选项。
按照第二实施例,确定单元30访问的数据库32可以包含电影信息。当用户正在浏览互联网,例如,正在阅读有关特定电影的重拍的博客条目时,确定单元30(例如,浏览器插件)自动地或响应正在运行浏览器应用程序的激活而分析电影数据库的文本和内容,并自动检测与该电影相联系的人物是否出现在各种TV和电影作品的元数据中。另外,出现在博客条目中的以上电影的标题词组也可以出现在电影数据库中。于是,确定单元30控制浏览器20显示指示已经找到相关电影/TV信息的图标。用户现在可以经由用户界面22点击或激活该图标,并且拥有通过评价所识别人物和所识别电影(例如,“喜欢”/“不喜欢”)更新用户简介表46中他的个人TV简介的选项。
注意,结合图1所述的单元或模块可以实现成分立硬件电路或功能,或实现成控制处理器或计算设备(例如,中央处理单元(CPU)、PC、服务器等)的软件例程。
图2示出了按照上述第一和第二实施例的基于上下文推荐过程的的示意图流程图。
注意,本发明不局限于TV/电影作品或TV节目的推荐,而是可以为任何可推荐产品和服务实现。举一个例子来说,上述浏览器应用程序和TV应用程序(例如,TV/DVR)可以适用于运行在经由网络(例如,互联网)连接的不同物理系统上。在更具体的例子中,互联网浏览器可以用在与机顶盒应用程序(例如,DVR)通信的移动电话上。
一般说来,该系统和过程含有可以是经过运行在处理系统上的相应应用程序处理(例如,装入浏览器20中和在浏览器20中得到处理)的任何文字文档(例如,HTML文档)的输入数据、和来自可用服务和/或产品(例如,EPG或电影数据)的数据库(DB)的另一种输入数据。如上所述,推荐系统可以通过浏览器20的插件或直接访问装载和显示在浏览器中的数据的任何其它例程或电路来控制。
在图2的过程的步骤S200中,通过特征提取算法分析经过处理的输入数据(例如,HTML文档),以提取表征其内容的(文字)特征。任何内容分析和特征提取算法都可以用于此目的。举一个例子来说,首先可以从输入数据中剥离它的语言标记(例如,HTML文本),然后可以除去无用词。无用词是特定语言中像代词、冠词那样不代表特定文档的频繁使用词汇,以及像助动词那样的频繁使用动词。就英语而言,无用词的进一步例子是“about”、“actually”、“because”、“could”、“did”、“either”、“for”、“got”、“have”、“into”、“just”、“known”、“less”、“me”、“not”、“of”、“put”、“rather”、“she”、“that”、“untl”、“very”、“was”、和“you”等。然后,可以将文档中的其余词汇用作代表该文档的特征。也可以使用像描述在例如D.Munteanu等人的文章《文本文档推荐系统中的分类过程》(D.Munteanu et al.″Classification Process in aText Document Recommender System″),The Annals of″Dunarea D.Jos″University of Galatz,ISSN 1221-454X,2005中那样的其它分类算法,或在本文件或其它地方引用的参考文献中提到的其它算法。
类似地,在步骤S100中,以相似方式处理数据库(例如,EPG或电影数据)的内容。如图2中的虚线箭头所指,步骤S100的处理可选地可以通过步骤S200的过程激活,例如,当步骤S200的分析开始时或当已经检测到输入数据的预定类型或内容时。然后,汇总标题、风格、描述和其它元数据,以创建内容(例如,TV节目或电影)的文字描述。可以将文字描述视作单独文档地处理它们。然后,可以通过关键词的列表表示每个所提取或所剥离项目。
然后,在比较步骤S300中比较在步骤S100和S200中提取的特征或项目以寻找匹配。例如,当在步骤S100和S200中提取的特征之间存在足够大重叠时,可以认为找到匹配。也可以使用其它类型的特征和计算匹配的其它方式,并应该认为这些都在本发明的范围之内。例如,取代将简单的数组提取项目(例如,关键词等)用于代表文档和数据库项目,也可以使用检索词频率逆文档频率(TFIDF)值的向量。这样用于文本分类的TFIDF描述在,例如,张某等人的文章《用于文本分类的改进TF-IDF手段》(Zhang et al.,″Animproved TF-IDF approach for text classification″),Journal of ZhejiangUniversity SCIENCE,ISSN 1009-3095中。
另外,可以通过使用词库(或本体)将同义词和相关术语包括进来丰富该组提取项目(例如,关键词)。另外或可替代地,为了方便匹配过程,可以使用像描述在,例如,S.Abdou等人的文章《用于基因组任务的词根评估、询问扩展和人工索引手段》(S.Abdou et al.,″Evaluation of Stemming,QueryExpansion and Manual Indexing Approaches for the Genomic Task″,TREC-2005)中的那些那样的词干抽取过程将所提取项目(例如,关键词列表或特征组)中的项目缩减成它们的词干。
可替代地,除了在比较步骤S300中进行严格字符串匹配之外,也可以使用像描述在,例如,US 5,467,425或W.Litwin等人的文章《使用累积代数符号差的模式匹配和n-gram取样》(W.Litwin et al.,″Pattern Matching UsingCumulative Algebraic Signatures and n-gram Sampling″,2006)中的那样,基于自然语言处理的概率模型的近似字符串匹配或所谓“n-gram”的计算。
在寻找步骤S100和S200的所提取项目或特征之间的匹配时,取决于从数据库中检索的数据的结构,也可以使用一些元数据。例如,在EPG数据库的情况下,可以通过数据库提供与一个项目相联系的关键词的列表,以便可以省略在步骤S100中生成附加关键词。或者,可替代地,可以将从数据库32的内容中提取的关键词、特征或项目加入从已经列在数据库32中的元数据中导出的关键词中。作为一个附加选项,在进行匹配时不同元数据可以具有不同权重。例如,从节目的标题中提取的关键词可以具有比从梗概中提取的关键词高的权重。
当在步骤S300中发现匹配时,在步骤S320中提取匹配项,并且可以在步骤S330中通知用户以便提供控制访问。这可以使用图形手段来实现(例如,显示图标,突出显示文档中已经发现匹配的文本或段落)。可替代地,系统可以不干扰用户,只有当用户在用户界面22上选择特定选项时才显示匹配结果,因此,步骤S330可以是一个可选步骤。
在推荐TV节目或电影的情况下,控制访问可以向用户提供记录EPG项目、将其加入他的个人频道之一中、或评价它(例如,选择“喜欢”或“不喜欢”)的选项。然后,确定单元30可以相应地访问可编程录像机42或用户简介表46,以便开始修改内容(步骤S340)。
在上述第二实施例的电影数据库情况下,可以使用与显示在图2中的那个相似的过程,差异在于,当在步骤S300中发现匹配时,如果已经发现与EPG 32的附加匹配,则只能给出在可编程录像机42上安排记录的选项。
注意,本发明不局限于HTML文档或互联网内容,也可以应用于任何类型的输入数据,例如,数字文字文档。此外,本发明可以应用于机顶盒、电视机、移动电话、个人数字助理(PDA)、个人计算机(PC)和含有互联网浏览器的所有设备。另外,本发明可以应用于使用推荐从多种来源(例如,网络电视)中收集、筛选、和向它们的用户呈现内容的服务。因此,本发明也不局限于TV/电影内容的推荐,也可以应用于音乐、话剧、图书、和可以作出推荐的所有类型产品和服务。
作为上述实施例的特定应用,可以使用即时电视节目点播(TVA)系统的TVA功能。这里,内容引用标识符(CRID)允许内容的地点无关引用。它可以由也具有将CRID转化成地点的能力的权威机构指定。CRID可以指向单个内容或一系列其它CRID。它可以实现成指向可以通过注册互联网域名识别的权威机构分配的数据或内容的统一资源标识符(URI)。从而,可以提供分配内容的简单机制。
总之,本发明涉及包含第一提取器和第二提取器的推荐系统和方法,第一提取器应用第一特征提取算法提取表征运行在系统上的第一应用程序(例如,互联网浏览器)处理的输入数据(例如,网页、电子文档等)的内容的第一特征,而第二提取器应用第二特征提取算法提取表征运行在系统上的第二应用程序(例如,个人TV或电影访问程序)的数据库的内容的第二特征。另外,还提供了比较第一和第二特征以便识别用于推荐的匹配项的比较器。
虽然在附图和上面的描述中详细例示和描述了本发明,但这样的例示和描述应该被认为是例示性的或示范性的,而不是限制性的。本发明不局限于所公开的实施例。通过阅读本公开,其它修改对于本领域的普通技术人员来说是显而易见的。这样的修改可能涉及在技术上已知的和可以用于取代本文已述的特征或除了本文已述的特征之外还可以使用的其它特征。
本领域的普通技术人员可以通过研究附图、本公开和所附权利要求书了解和实现所公开实施例的变种。在权利要求书中,词汇“包含”并不排除其它元件或步骤,和不定冠词“一个”或“一种”也不排除多个元件或步骤。单个处理器或其它单元可以根据相应软件例程至少完成图2的功能。计算机程序可以存储/分布在像与其它硬件一起或作为其它硬件的一部分供应的光存储媒体或固态媒体那样的适当媒体上,但也可以像经过互联网或其它有线或无线远程通信系统那样,以其它形式分配。某些措施被阐述在相互不同从属权利要求中的仅有事实并不指示不能使用这些措施的组合获益。权利要求书中的任何标号都不应该理解为限制本发明的范围。

Claims (17)

1.一种为至少一个内容项作出推荐的系统,所述系统包含:
a)第一提取器(S200),用于应用第一特征提取算法提取表征运行在所述系统上的第一应用程序处理的输入数据的内容的第一特征;
b)第二提取器(S100),用于应用第二特征提取算法提取表征运行在所述系统上的第二应用程序的数据库(32)的内容的第二特征;
c)比较器(S300),用于比较所述第一和第二特征,以便识别用于所述推荐的匹配项,
d)其中,所述第一提取器(S200)适用于检测所述输入数据的所述内容与电视节目有关还是与现有电影或电视作品有关。
2.按照权利要求1所述的系统,进一步包含由第一应用程序触发以便激活第二应用程序的切换功能。
3.按照权利要求1所述的系统,其中所述第一应用程序包含互联网浏览器(20),和所述输入数据包含从互联网下载的内容信息。
4.按照权利要求3所述的系统,其中所述内容信息包含HTML文档。
5.按照权利要求1所述的系统,其中所述第二应用程序的所述数据库(32)包含电子节目指南信息。
6.按照权利要求1所述的系统,其中所述第二应用程序的所述数据库(32)是电影数据库。
7.按照权利要求1所述的系统,其中所述第一和第二特征提取算法适用于从所述输入数据中除去标记和无用词的至少一种。
8.按照权利要求1所述的系统,其中所述比较器(S300)适用于根据所述第一和第二特征之间的重叠量识别匹配项。
9.按照权利要求1所述的系统,其中所述第一和第二特征包含检索词频率逆文档频率值的向量。
10.按照权利要求1所述的系统,其中所述比较器适用于应用词干抽取过程、近似字符串匹配过程、和计算n-gram的过程的至少一种。
11.按照权利要求1所述的系统,其中所述第一提取器(S200)包含网页文本的自动关键词标识器,和其中将关键词标记成用于做个人电视频道的种子。
12.按照权利要求1所述的系统,其中所述第二特征包含设置在所述数据库(32)中的元数据。
13.按照权利要求12所述的系统,其中所述比较器(S300)适用于将不同权重应用于所述元数据。
14.按照权利要求1所述的系统,其中所述第二特征包含即时电视节目点播功能的内容引用标识符。
15.按照权利要求1所述的系统,进一步包含提供选择所述匹配项的输入功能的用户界面(22)。
16.一种为至少一个内容项作出推荐的方法,所述方法包含:
a)应用第一特征提取算法提取表征第一数据处理应用程序处理的输入数据的内容的第一特征;
b)应用第二特征提取算法提取表征第二数据处理应用程序的数据库的内容的第二特征;
c)比较所述第一和第二特征,以便识别用于所述推荐的匹配项,
d)其中,所述第一提取器(S200)适用于检测所述输入数据的所述内容与电视节目有关还是与现有电影或电视作品有关。
17.一种包含当运行在计算设备上时形成按照权利要求16所述的步骤的代码模块的计算机程序产品。
CN200980152202.5A 2008-12-23 2009-12-15 基于上下文的推荐系统 Active CN102265276B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08172776.0 2008-12-23
EP08172776A EP2202656A1 (en) 2008-12-23 2008-12-23 Context-based recommender system
PCT/EP2009/067149 WO2010072614A1 (en) 2008-12-23 2009-12-15 Context-based recommender system

Publications (2)

Publication Number Publication Date
CN102265276A true CN102265276A (zh) 2011-11-30
CN102265276B CN102265276B (zh) 2017-10-13

Family

ID=40535595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980152202.5A Active CN102265276B (zh) 2008-12-23 2009-12-15 基于上下文的推荐系统

Country Status (5)

Country Link
US (1) US20110320482A1 (zh)
EP (2) EP2202656A1 (zh)
CN (1) CN102265276B (zh)
RU (1) RU2523930C2 (zh)
WO (1) WO2010072614A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103632278A (zh) * 2012-08-21 2014-03-12 镇江雅迅软件有限责任公司 一种基于上下文信息的多策略商品推荐系统
CN104160712A (zh) * 2011-10-30 2014-11-19 谷歌公司 计算媒体节目之间的相似度

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8751957B1 (en) * 2000-11-22 2014-06-10 Pace Micro Technology Plc Method and apparatus for obtaining auditory and gestural feedback in a recommendation system
US9721035B2 (en) * 2010-06-30 2017-08-01 Leaf Group Ltd. Systems and methods for recommended content platform
KR101741698B1 (ko) * 2010-10-18 2017-05-31 삼성전자주식회사 검색 서비스 제공방법 및 이를 적용한 디스플레이 장치
US8978047B2 (en) * 2011-02-03 2015-03-10 Sony Corporation Method and system for invoking an application in response to a trigger event
US9928375B2 (en) * 2011-06-13 2018-03-27 International Business Machines Corporation Mitigation of data leakage in a multi-site computing infrastructure
US20140223464A1 (en) * 2011-08-15 2014-08-07 Comigo Ltd. Methods and systems for creating and managing multi participant sessions
KR101471940B1 (ko) * 2012-02-03 2014-12-24 한국과학기술원 Tv 프로그램 콘텐츠와 웹 콘텐츠의 연계추천 장치, 시스템, 방법 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
US20140114901A1 (en) * 2012-10-19 2014-04-24 Cbs Interactive Inc. System and method for recommending application resources
US9215489B2 (en) 2012-11-30 2015-12-15 The Nielson Company (Us), Llc Custom electronic program guides
CN103260061B (zh) * 2013-05-24 2015-11-18 华东师范大学 一种上下文感知的iptv节目推荐方法
CN104639993A (zh) * 2013-11-06 2015-05-20 株式会社Ntt都科摩 视频节目推荐方法及其服务器
US20150149261A1 (en) * 2013-11-25 2015-05-28 Flipboard, Inc. Measuring quality of content items presented by a digital magazine server
US10325274B2 (en) * 2014-01-31 2019-06-18 Walmart Apollo, Llc Trend data counter
US10332127B2 (en) 2014-01-31 2019-06-25 Walmart Apollo, Llc Trend data aggregation
WO2015198376A1 (ja) * 2014-06-23 2015-12-30 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
RU2015111633A (ru) 2015-03-31 2016-10-20 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для обработки показателей активности, связанных с пользователем, способ и система связывания первого элемента и второго элемента
GB2538776A (en) * 2015-05-28 2016-11-30 Cisco Tech Inc Contextual content programming
RU2632131C2 (ru) 2015-08-28 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и устройство для создания рекомендуемого списка содержимого
CN105279224B (zh) * 2015-09-09 2019-01-15 百度在线网络技术(北京)有限公司 信息推送方法及装置
RU2629638C2 (ru) 2015-09-28 2017-08-30 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер создания рекомендуемого набора элементов для пользователя
RU2632100C2 (ru) * 2015-09-28 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер создания рекомендованного набора элементов
US10515119B2 (en) * 2015-12-15 2019-12-24 At&T Intellectual Property I, L.P. Sequential recommender system for virtualized network services
RU2632144C1 (ru) 2016-05-12 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Компьютерный способ создания интерфейса рекомендации контента
RU2636702C1 (ru) 2016-07-07 2017-11-27 Общество С Ограниченной Ответственностью "Яндекс" Способ и устройство для выбора сетевого ресурса в качестве источника содержимого для системы рекомендаций
RU2632132C1 (ru) 2016-07-07 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и устройство для создания рекомендаций содержимого в системе рекомендаций
RU2651188C1 (ru) * 2016-11-28 2018-04-18 Общество С Ограниченной Ответственностью "Яндекс" Способ выбора веб-сайта для области быстрого доступа в веб-браузере
WO2018126209A1 (en) * 2016-12-30 2018-07-05 Lenk Ronald J Artificially intelligent communication through hierarchical keyword parsing
USD882600S1 (en) 2017-01-13 2020-04-28 Yandex Europe Ag Display screen with graphical user interface
US10602214B2 (en) 2017-01-19 2020-03-24 International Business Machines Corporation Cognitive television remote control
RU2720952C2 (ru) 2018-09-14 2020-05-15 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания рекомендации цифрового содержимого
RU2720899C2 (ru) 2018-09-14 2020-05-14 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения зависящих от пользователя пропорций содержимого для рекомендации
RU2714594C1 (ru) 2018-09-14 2020-02-18 Общество С Ограниченной Ответственностью "Яндекс" Способ и система определения параметра релевантность для элементов содержимого
RU2725659C2 (ru) 2018-10-08 2020-07-03 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для оценивания данных о взаимодействиях пользователь-элемент
RU2731335C2 (ru) 2018-10-09 2020-09-01 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для формирования рекомендаций цифрового контента
US11373231B2 (en) 2019-01-31 2022-06-28 Walmart Apollo, Llc System and method for determining substitutes for a requested product and the order to provide the substitutes
US11373228B2 (en) 2019-01-31 2022-06-28 Walmart Apollo, Llc System and method for determining substitutes for a requested product
CN110189197A (zh) * 2019-05-22 2019-08-30 常熟理工学院 基于上下文多臂赌博机的电商个性化推荐方法
CN110557655B (zh) * 2019-09-06 2021-10-26 卓米私人有限公司 一种视频画面显示方法、装置、电子设备及存储介质
RU2757406C1 (ru) 2019-09-09 2021-10-15 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для обеспечения уровня сервиса при рекламе элемента контента
CN112565823A (zh) * 2020-12-09 2021-03-26 深圳市朗强科技有限公司 高清视频数据的发送、接收方法及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030226147A1 (en) * 2002-05-31 2003-12-04 Richmond Michael S. Associating an electronic program guide (EPG) data base entry and a related internet website
CN101075893A (zh) * 2006-05-19 2007-11-21 佳能株式会社 网络信息处理设备及方法和信息处理设备及其控制方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5467425A (en) 1993-02-26 1995-11-14 International Business Machines Corporation Building scalable N-gram language models using maximum likelihood maximum entropy N-gram models
US6005565A (en) * 1997-03-25 1999-12-21 Sony Corporation Integrated search of electronic program guide, internet and other information resources
EP0912053A1 (en) * 1997-10-24 1999-04-28 CANAL+ Société Anonyme Multichannel digital television system
JP3606764B2 (ja) * 1999-04-20 2005-01-05 シャープ株式会社 ファイルオブジェクト閲覧と関連して提示されたテレビ番組表から、録画予約、または録画済の番組再生を行うシステム
US20020154157A1 (en) * 2000-04-07 2002-10-24 Sherr Scott Jeffrey Website system and process for selection and delivery of electronic information on a network
US20030097657A1 (en) * 2000-09-14 2003-05-22 Yiming Zhou Method and system for delivery of targeted programming
US20040210926A1 (en) * 2003-01-08 2004-10-21 Avtrex, Inc. Controlling access to content
US7533399B2 (en) * 2004-12-02 2009-05-12 Panasonic Corporation Programming guide content collection and recommendation system for viewing on a portable device
US20070100915A1 (en) * 2005-10-31 2007-05-03 Rose Daniel E Methods for displaying dynamic suggestions in a user interface
US20070208718A1 (en) * 2006-03-03 2007-09-06 Sasha Javid Method for providing web-based program guide for multimedia content
US20070219856A1 (en) * 2006-03-14 2007-09-20 Comcast Cable Holdings, Llc Method and system of recommending television programs
JP4372119B2 (ja) * 2006-05-19 2009-11-25 キヤノン株式会社 Web情報処理装置及びWeb情報処理方法
JP4444932B2 (ja) * 2006-08-24 2010-03-31 キヤノン株式会社 情報処理装置及びその制御方法
US20080066099A1 (en) * 2006-09-11 2008-03-13 Apple Computer, Inc. Media systems with integrated content searching
JP2008293211A (ja) * 2007-05-23 2008-12-04 Hitachi Ltd アイテム推薦システム
US20090228918A1 (en) * 2008-03-05 2009-09-10 Changingworlds Ltd. Content recommender

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030226147A1 (en) * 2002-05-31 2003-12-04 Richmond Michael S. Associating an electronic program guide (EPG) data base entry and a related internet website
CN101075893A (zh) * 2006-05-19 2007-11-21 佳能株式会社 网络信息处理设备及方法和信息处理设备及其控制方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104160712A (zh) * 2011-10-30 2014-11-19 谷歌公司 计算媒体节目之间的相似度
US9654834B2 (en) 2011-10-30 2017-05-16 Google Inc. Computing similarity between media programs
CN104160712B (zh) * 2011-10-30 2017-09-08 谷歌公司 关联媒体节目的计算机实现的方法、处理电路系统和计算机可读介质
CN103632278A (zh) * 2012-08-21 2014-03-12 镇江雅迅软件有限责任公司 一种基于上下文信息的多策略商品推荐系统

Also Published As

Publication number Publication date
CN102265276B (zh) 2017-10-13
RU2011130931A (ru) 2013-01-27
WO2010072614A1 (en) 2010-07-01
EP2382561A1 (en) 2011-11-02
US20110320482A1 (en) 2011-12-29
EP2202656A1 (en) 2010-06-30
RU2523930C2 (ru) 2014-07-27

Similar Documents

Publication Publication Date Title
CN102265276A (zh) 基于上下文的推荐系统
KR101061234B1 (ko) 정보처리 장치와 방법, 및 기록 매체
US9330162B2 (en) Method and apparatus for providing temporal context for recommending content for consumption by a user device
CN106331778B (zh) 视频推荐方法和装置
JP6235556B2 (ja) コンテンツ提示方法、コンテンツ提示装置及びプログラム
CN101267518B (zh) 从内容元数据提取相关信息的方法和装置
CN101595481B (zh) 用于在电子装置上促进信息搜索的方法和系统
JP4636147B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP4328757B2 (ja) 番組選択装置及び番組選択装置の制御方法
US9098551B1 (en) Method and system for ranking content by click count and other web popularity signals
US20080183681A1 (en) Method and system for facilitating information searching on electronic devices
JP4370850B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
US20130097159A1 (en) System and method for providing information regarding content
CN104160712A (zh) 计算媒体节目之间的相似度
WO2015070807A1 (zh) 一种智能电视的节目推荐方法及装置
De Pessemier et al. Context aware recommendations for user-generated content on a social network site
CN103052954A (zh) 推荐系统的基于简档内容检索
US8174579B2 (en) Related scene addition apparatus and related scene addition method
KR20150035824A (ko) 동적 미디어 세그먼트 가격 책정
JP2006203593A (ja) Tv放送視聴システム及びtv放送視聴方法
CN102884524A (zh) 针对显示的电视内容的自动图像发现和推荐
WO2011101527A1 (en) Method for providing a recommendation to a user
JP2005352754A (ja) 情報ナビゲーション装置、方法、プログラム、及び記録媒体
KR100871873B1 (ko) 맞춤형 방송 시스템의 선호 정보 관리 장치 및 방법
CN106445922B (zh) 确定多媒体资源的标题的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Berlin

Applicant after: AXEL SPRINGER DIGITAL TV GUIDE GMBH

Address before: Berlin

Applicant before: Axel Springer Digital TV Guide GmbH

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: AXEL SPRINGER DIGITAL TV GUIDE TO: FENKE DIGITAL TV GUIDE CO., LTD.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201203

Address after: hamburg

Patentee after: Fink TV guidance Co., Ltd

Address before: Berlin

Patentee before: Fink Digital Television Director Co.,Ltd.

TR01 Transfer of patent right