CN104813313A - Web信息发现方法和用户接口 - Google Patents
Web信息发现方法和用户接口 Download PDFInfo
- Publication number
- CN104813313A CN104813313A CN201280077288.1A CN201280077288A CN104813313A CN 104813313 A CN104813313 A CN 104813313A CN 201280077288 A CN201280077288 A CN 201280077288A CN 104813313 A CN104813313 A CN 104813313A
- Authority
- CN
- China
- Prior art keywords
- theme
- web content
- display space
- user
- topic model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 33
- 230000013011 mating Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000010168 coupling process Methods 0.000 description 8
- 238000005859 coupling reaction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000008878 coupling Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 239000000919 ceramic Substances 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000009182 swimming Effects 0.000 description 4
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 239000002360 explosive Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 244000287680 Garcinia dulcis Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013497 data interchange Methods 0.000 description 1
- 238000011982 device technology Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Abstract
提供了一种智能化和个性化的web信息发现的方法和用户接口。方法可以包括构造涉及数据智能和人类智能的分层、树状结构的主题模型,所述主题模型包括一个或多个节点,其具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间。该方法可以进一步包括收集与相应的主题匹配的web内容,引起所收集的web内容的信息在映射到相应的主题的显示空间中呈现。
Description
技术领域
本发明一般涉及互联网应用和用户接口。更具体地,本发明涉及提供智能和个性化的web信息发现和用户接口。
背景技术
过去十年中移动通信和移动装置技术已经在全球范围激增。例如,现在无线分组数据服务在全球许多地区都是可用的。目前,一般的移动装置和计算装置在世界上正变得无处不在。采用这些装置提供了许多服务。这些服务可以包括访问互联网,例如浏览、获取和分享互联网信息。
同时,互联网内容正呈爆炸式发展,因此在爆炸式的信息世界中通常很难找到用户想要的相关信息。尤其是对于使用移动装置通过移动无线环境享受互联网的用户,可能消耗很多时间和很多无线通信流量来从大量web页面中寻找希望的互联网内容。因此,提供允许智能和容易地提供用户希望拥有的相关用户特定的互联网内容将成为现有技术的进步。
发明内容
为了克服上述现有技术中的局限以及为了克服基于阅读和理解本说明书时将变得显而易见的其它局限,本公开提供用于以下方面的方法:
根据一个实施例,一种方法包括构造分层、树状结构的主题模型,所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间。该方法进一步包括收集与所述相应的主题匹配的web内容。该方法进一步包括引起在映射到所述相应的主题的显示空间内呈现所收集的web内容的信息。
在示例性实施例中,该方法可以进一步包括基于用户生成的web内容的标签和/或从所述用户访问的web内容自动提取的主题来获得反映用户偏好的一组主题。
在示例性实施例中,可以通过以下方式从所述用户访问的web内容自动提取所述主题:基于多个web内容通过聚类算法学习多个主题;以及基于所述用户访问的web内容的用户访问历史来推荐反映所述用户偏好的一个或多个主题。
在示例性实施例中,基于多个web内容通过聚类算法学习多个主题可以包括:通过一组预定义的主题和表示所述预定义的主题的一组种子web内容训练聚类算法;以及参考所述一组种子web内容识别所述用户访问的web内容的主题。
在示例性实施例中,该方法可以进一步包括:确定主题的优先级;以及根据所确定的主题的优先级自动设置映射到主题的显示空间的位置和/或尺寸。主题的优先级可以基于与主题相匹配的web内容而确定。
在示例性实施例中,该方法进一步可以包括:从其它装置获得所述分层、树状结构的主题模型的全部或一部分。
在示例性实施例中,该方法可以进一步包括调整所述分层、树状结构的主题模型的至少一部分,收集与被调整的主题模型中的相应主题匹配的web内容;以及引起调整所述用户接口的显示空间,用于在映射到所述被调整的主题模型中的相应主题的显示空间中呈现与所述被调整的主题模型中的相应主题匹配的所收集的web内容的信息。
在一些示例性实施例中,该方法可以进一步包括与其它装置分享分层、树状结构的主题模型的全部或一部分。
在一些示例性实施例中,主题模型可以包括多于一个级别。映射到为相同父主题的子主题的主题的显示空间可以被安排在用户接口的相同页面中并且所述显示空间被配置为当映射到所述父主题的显示空间被选择时而被显示。
在一些示例性实施例中,收集与相应的主题匹配的web内容可以包括识别与所述相应的主题相关联的web页面的统一资源定位符。
根据另一实施例,一种设备,包括至少一个处理器,以及包括计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置为,利用所述至少一个处理器,至少部分地引起所述设备构造分层、树状结构的主题模型,所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间。进一步引起该设备收集与所述相应的主题匹配的web内容。进一步引起该设备在映射到所述相应的主题的显示空间内呈现所收集的web内容的信息。
根据另一实施例,一种携带一个或多个指令的一个或多个序列的计算机可读存储介质,当所述指令被一个或多个处理器执行时,至少部分地引起设备构造分层、树状结构的主题模型,所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间。进一步引起该设备收集与所述相应的主题匹配的web内容。进一步引起该设备在映射到所述相应的主题的显示空间内呈现所收集的web内容的信息。
根据另一实施例,一种设备包括用于构造分层、树状结构的主题模型的部件,所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间。该设备还包括用于收集与所述相应的主题匹配的web内容的部件。该设备还包括用于引起在映射到所述相应的主题的显示空间内呈现所收集的web内容的信息的部件。
根据另一实施例,一种用户接口包括接口模块,其被配置为接收web内容的信息,其中,所述web内容被收集用于与分层、树状结构的主题模型中的主题相匹配。所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间。所述用户接口还包括显示模块,其被配置为在映射到所述相应的主题的显示空间内呈现与所述相应的主题匹配的web内容的信息。在一些示例性实施例中,主题模型可以包括多于一个级别。在一些示例性实施例中,显示模块可以进一步被配置为在用户接口的相同页面上安排映射到为相同父主题的子主题的主题的显示空间,并且当映射到所述父主题的显示空间被选择时,显示映射到为所述相同父主题的子主题的所述主题的显示空间。
在一些示例性实施例中,所述接口模块可以被进一步配置为接收主题的优先级,并且所述显示模块可以进一步被配置为根据主题的优先级自动设置映射到所述主题的显示空间的位置和/或尺寸。主题的优先级可以基于与主题匹配的web内容被确定。
在一些示例性实施例中,当分层、树状结构的主题模型的至少一部分被调整时,并且该显示模块可以进一步被配置为调整所述用户接口的显示空间从而在映射到被调整的主题模型中的相应主题的显示空间内呈现所收集的用于与所述被调整的主题模型中的相应主题匹配的web内容的信息。
简单地通过示出多个特定实施例和实现,本发明的更多其它方面、特征和优点很容易从以下详细说明中显现,这些特定实施例和实现包括用于执行本发明的被设想的最佳模式。本发明还能够具有其它和不同的实施例,并且其若干细节可以在多种明显的方面修改,所有这些都不偏离本发明的精神和范围。因此,附图和说明应被视为本质上是说明性的,而非限制性的。
附图说明
本发明的实施例以举例的方式,并且不是以限制的方式进行说明,在附图中:
图1是根据实施例的能够提供web信息发现的系统框图;
图2是根据一个实施例的用户设备的组件的简化框图;
图3是根据一个实施例的用于提供web信息发现的过程的流程图;
图4示出根据一个实施例的显示web内容的用户接口的示例性屏幕截图和用于构造内容树的示例性方法;
图5示出根据一个实施例的用于通过LDA建模算法来学习主题的示例性的方法;
图6示出根据一个实施例的示例性内容树;
图7示出根据图6所示的内容树的用于显示发现的互联网内容的用户接口的示例性屏幕截图;
图8示出根据一个实施例的对图6所示的内容树的示例性调整,和用于根据调整的内容树来显示互联网内容的用户接口的示例性屏幕截图;
图9示出根据一个实施例的用于确定内容树中的主题的各自优先级的示例性方法;
图10示出根据一个实施例的用于分享内容树的示例性方法;以及
图11是适合在实践本发明的多种示例性实施例中使用的多种装置的简化框图。
具体实施方式
公开了以分布式方式用于提供智能和个性化的web信息发现和用户接口的方法、设备和计算机程序的示例。在下文说明中,出于解释的目的阐述了许多特定细节,以便提供对本发明的实施例的全面理解。然而,对于本领域技术人员来说很明显的,本发明的实施例可以在不使用这些特定细节来实践或者利用等效布置来实践。在其它实例中,公知的结构和装置以框图形式示出以便避免不必要地模糊本发明的实施例。相同的参考编号始终表示相同的元素。根据本发明的一些示例性实施例,术语“数据”、“内容”、“信息”以及相似术语可以互换使用,以表示能够被传输、接收、操作、呈现和/或存储的数据。
图1是根据实施例的能够提供智能和个性化的web信息发现的系统和用户接口的图。如图1所示,系统100包括具有经由通信网络111到服务提供方113和其它用户设备(UE)101的连接的UE 101。举例来说,系统100的通信网络111包括例如数据网络(未示出)、无线网络(未示出)、电话网络(未示出)或其任意结合的一个或多个网络。根据设想,数据网络可以是任意局域网(LAN)、城域网(MAN)、广域网(WAN)、公共数据网络(例如互联网)、自组织移动网络或者任意其它合适的分组交换网络,例如商业上拥有的、专有的分组交换网络,例如专有的电缆或光纤网络。此外,无线网络可以是例如蜂窝网络并且可以采用多种技术,包括全球演进的增强型数据速率(EDGE)、通用分组无线业务(GPRS)、全球移动通信系统(GSM)、互联网协议多媒体子系统(IMS)、通用移动电信系统(UMTS)等,以及任意其它合适的无线介质,例如,全球微波接入互操作性(WiMax)、无线局域网(WLAN)、长期演进(LTE)网络、码分多址(CDMA)、宽带码分多址(WCDMA)、无线保真(WiFi)、卫星、移动ad-hoc网络(MANET)等。
UE 101可以是任意类型的移动终端、固定终端,或者便携式终端,包括移动手机、站、单元、装置、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、便携计算机、笔记本计算机、上网本计算机、平板计算机、个人数字助理(PDA)或其任意结合。还可以设想,UE 101可以支持任意类型的用户接口(例如“可穿戴”电路等)。如图1所示的,除了通常在移动装置或计算装置内使用的其它应用以外,用户设备(UE)101a-101b还可以用来执行互联网应用103a-103b。互联网应用103可以利用通信网络111与代理服务器107和服务提供方113的至少一个进行通信,用于访问例如来自服务提供方113的web页面以及用于随后经由用户接口(例如屏幕,未示出)向用户呈现所访问的互联网内容。例如,互联网应用103可以包括浏览器应用,其可以是任意公知的web浏览器,例如微软公司的Firefox、Explorer,苹果公司的Safari或Google公司的Chrome等。
服务提供方113向用户提供互联网内容,例如一个或多个web页面115。UE 101可以通过通信网络111访问存储在服务提供方115a-115n内的多个web页面115a-115n。web页面115以由服务提供方113规定的方式将信息呈现给UE 101,所述方式对特定用户并非是定制的并且可以是对服务提供方113特定的。在UE 101和服务提供方113之间的通信可以使用任意公知的数据交换语言的标准化协议,例如可扩展标记语言(XML)。
在一些实施例中,服务提供方113的互联网内容可以经由代理服务器107提供给UE 101。代理服务器107可以从UE 101接收互联网接入请求,经由通信网络111与服务提供方113通信以用于获取普通web页面,将所获取的web页面适配至特定UE 101,并且提供适配后的web页面给UE101。例如,一般地服务提供方107中的web页面的信息格式和布局是针对具有大尺寸显示器和很强处理能力的计算机装置而设计。因此,这些web页面不适合在具有小尺寸显示器的移动电话上呈现。于是,代理服务器107可以过滤出在web页面中的一些不必要信息,例如插入到web页面中的广告,根据UE 101的显示器的状况调整web页面的布局,并且于是提供调整后的web页面给UE 101。这样,调整后的web页面可以更适于在UE 101的显示器上被呈现,并且可以减少用于下载web页面的通信流量。代理服务器107还可以在数据库109中存储用户信息、用户浏览历史以及与互联网浏览有关的其它信息。用户信息可以包括用户简档和与互联网内容访问有关的一个或多个用户设置。
如上文所指出的,互联网内容正呈爆炸式发展,并且因此在爆炸式的信息世界中通常很难找到用户想要的相关信息。在一些实施例中,代理服务器107还可以向UE 101推荐和推送例如热点新闻、订阅新闻组、广告等的web页面。然而,此推荐的结果通常是离散的web页面,并且它仍然不便于由用户识别在推荐结果中的多种不同类型的信息。例如,代理服务器107和服务提供方113可以推送热点新闻列表,并且当用户想要浏览一些体育新闻时,他不得不浏览所有热点新闻以挑选出体育新闻。尽管代理服务器107和服务提供方113可以进一步设置为仅向用户推荐体育新闻,当用户将他的兴趣改变为其它类型的新闻时,相似的问题仍然存在。毕竟,对于代理服务器107和服务提供方113来说,难以猜测用户喜欢何种类型的互联网内容。有时,甚至用户也不清楚他喜欢什么类型的新闻。
此外,对于传统的web内容呈现,虽然浏览器窗口中的内容可以是动态的,移动装置上的内容格式通常是静态和固定的,例如由在移动装置或代理服务器中的浏览应用设计来设置。显然,不同的用户可以对内容具有不同的需要。然而,还没有允许用户设计在个人用户接口中的个人内容格式呈现的方案。用户不能改变用户接口或定制应用内的用户接口。尽管在iOS和Android系统的一些应用中,用户可以定制应用在用户接口上的位置,在WP7系统的一些应用中桌面瓷砖(“tile”)的颜色可以定制,在WP8系统的一些应用中桌面瓷砖的尺寸可定制,但是用户接口组件的尺寸是固定的并且用户接口的设计是静态的。
为了解决或减轻这些问题中的至少一个,图1的系统100借助于信息发现模块105来引入提供智能和个性化的web信息发现能力和用户接口,信息发现模块105可以被配置为构造分层、树状结构的主题模型。分层、树状结构的主题模型包括一个或多个节点,每一个节点都具有相应的主题并且被配置为将其相应的主题与UE 101的用户接口(未示出)上的多个显示空间中的一个显示空间相关联。信息发现模块105可以进一步被配置为收集与相应的主题匹配的web内容,从而使得收集的与主题相匹配的web内容的信息可以被呈现在与该主题相关联的对应显示空间中。
如图1所示,信息发现模块105可以被安装在UE 101中,并且可以被配置为从代理服务器107和/或服务提供方113收集相关的web内容。在其它实施例中,信息发现模块105可以被安装在代理服务器107中。例如,分层、树状结构的主题模型可以参照UE 101的用户的浏览历史而构造。分层、树状结构的主题模型和相关web内容收集将在下文中将参考图4-10进行详细描述。
图2是根据一个实施例的用户设备的组件的简化框图。通过示例,UE101包括用于提供智能和个性化的web信息发现和用户接口的一个或多个组件。可以设想,这些组件的功能可以被结合在一个或多个组件或由等效功能的其它组件执行。在该实施例中,UE 101包括发现相关互联网内容以用于呈现给UE 101的用户的信息发现模块201。UE 101还可以包括协调UE 101的其它组件的使用的控制器模块207、在网络上通信的通信模块211、输出信息和接收输入的用户接口213以及存储器209。UE的应用103(例如互联网应用)可以在控制器模块207上利用UE 101的组件来执行。
用户接口213可以包括多种通信方法。例如,用户接口213可以具有包括视觉组件(例如屏幕)、音频组件、物理组件(例如振动)的输出以及其它通信方法。用户输入可以包括触摸屏接口、滚动和点击接口、按钮接口等。在某些实施例中,用户接口213可以另外具有人声用户接口组件。这样,可以使用文本到语音机制向用户提供文本信息。此外,可以使用语音到文本机制接收人声输入并且将人声输入转换成文本输入。此外,可以使用用户接口213来接收与信息发现模块201相关联的用户输入并且呈现与信息发现模块201相关联的信息和内容。
通信接口211可以包括多种通信手段。例如,通信接口211可以能够经由SMS、互联网协议、即时消息、语音会话(例如经由电话网络)或者其它通信类型进行通信。通信接口211可以由控制器模块207使用从而经由通信网络111与其它用户终端101、代理服务器107,服务提供方113以及其它装置通信。在一些实施例中,采用与信息发现模块201相关联的协议和方法,使用通信接口211发送和接收信息。
信息发现模块201可以包括内容树模块203和内容收集模块205。内容树模块203可以用来建立分层、树状结构的主题模型。主题模型包括一个或多个节点,其具有各自的主题并且被配置为将各自的主题关联到用户接口213的相应的显示空间。显示空间可以被显示在用户接口213中,并且可以用来呈现web内容的信息,例如web页面的摘要、web页面链接的列表、或者web页面的截图、指示已经找到多少新的相关web页面的数字等。在一些情况下,只要显示空间的可用区域足够,显示空间甚至可以显示相关的web页面之一的全部内容。显示空间可以是用户接口213的屏幕上的窗口、桌面瓷砖或任意其它显示区域,其可以是任意形状或尺寸并且可以延伸超出用户接口的显示屏幕213的边缘。内容收集模块205可以被用来收集与相应的主题匹配的web内容。在一些实施例中,针对相应主题收集的web内容的信息可以被传输到用户接口213并且在与相应主题相关联的对应显示空间中呈现。例如,与第一主题匹配的web内容截图可以被呈现在与第一主题相关联的第一显示空间,并且与第二主题匹配的web内容截图可以被呈现在与第二主题相关联的显示空间。于是,UE 101的用户可以方便快捷地在用户接口213的相应显示空间中找到关于不同主题的web内容。
用户接口213可以包括接口模块215和显示模块217。接口模块215可以被配置为接收例如由内容收集模块收集的web内容的信息。显示模块217可以被配置为根据主题模型的组织,在与各个主题映射的显示空间中呈现与各个主题匹配的web内容的信息。
图3是根据一个实施例的用于提供智能和个性化的web信息发现和用户接口的过程的流程图。在一个实施例中,过程300可以由信息发现模块105执行。如上文指出的,信息发现模块105可以部署在用户设备(例如UE 101)或代理服务器(例如代理服务器107)中,信息发现模块105被实现在例如包括如图11所示的处理器和存储器的芯片组上。这样,UE 101和代理服务器107可以提供用于完成过程300的多种部分的手段以及用于与UE 101和/或代理服务器107的其它组件结合来完成其它过程的手段。
在步骤301中,构造分层、树状结构的主题模型。主题模型包括一个或多个节点,其具有各自的主题并且被配置为将各自的主题与用户接口的显示空间映射。例如,主题可以由关键字表示。在一些实施例中,主题模型可以自动构造而不需要UE 101的用户参与。例如,可以参照用户的浏览历史通过估计用户偏好的主题来构造主题模型。在一些实施例中,用户可以参与主题模型的构造。例如,用户可以调整主题模型的任意部分。
在步骤303中,与各自的主题匹配的web内容可以例如从互联网被收集或搜索。例如,针对主题,具有与主题相关的内容的web页面的URL列表可以被识别用于匹配。
接下来,在步骤305中,引起收集的web内容的信息被呈现在映射到各自主题的显示空间中。在一些实施例中,收集的web内容的信息可以被提供给UE 101的用户接口用于呈现。这样,根据主题模型中的各个主题的位置,与各个主题匹配的web内容的信息可以被呈现在不同显示器空间内。web内容的信息可以是匹配的web页面摘要(例如相应主题的表达)的列表、匹配的web页面标题的列表、或匹配的web页面截图的列表等。web内容的信息还可以包括到匹配的web页面的链接,从而使得可以通过链接访问匹配的web内容。
现在参照图4,图4示出根据一个实施例的显示web内容的用户接口的示例性屏幕截图和用于构造内容树的示例性方法。通过示例,屏幕截图401示出内容组织的用户接口。内容组织可以包括一个或多个窗口,其中每一个窗口可以呈现与主题匹配的web页面的截图,并且可以提供对web页面的访问。用户可以选择窗口之一用于例如通过点击屏幕截图401(如所示出的通过手指示符)打开对应的web页面(例如在屏幕截图403中所示)。在实施例中,用户可以选择查看过去特定一天所观看的内容组织。
图4的右侧部分示出用于构造分层、树状结构的主题模型的示例性方法,分层、树状结构的主题模型也简单地称为内容树。内容树用一个或多个主题(称为内容树的“节点”)来建造。两个节点之间的链接(或称为分支)可以表示两个主题之间的父-和-子关系。例如,根节点的主题“内容树”可以视为是具有多个子主题的父主题,子主题包括主题“游泳”、“网球”、“食物”、“电影”以及“WP8”。主题“WP8”可以视为是包括子主题(即主题“Nokia”)的父主题,并且主题“Nokia”可以视为是包括子主题(即主题“Lumia 920”)的父主题。
在一些实施例中,可以从用户生成的标签中收集主题。例如,在读取屏幕截图403中所示的web页面之后,用户可以用关键字“电影、公民凯恩”来给web页面加标签,并且于是这些关键字可以作为用于形成内容树的主题。在一些实施例中,可以由其他用户做出web页面的标签。例如,由用户打开的web页面中的一些文章可能已经被其他用户阅读并且包括由其他用户插入的一些标签或评论。
额外地或可选地,主题可以来自从收集在用户浏览历史中的用户访问的web内容(例如从阅读、分享、评论的文章)中自动提取的主题/关键字。关于此,存在许多可以被利用从而提取主题的算法。例如,可以利用聚类算法,例如潜在狄利克雷分配(LDA模型)(“Latent Dirichlet allocation”)、分层聚类等,来基于大量web内容来学习多个主题。在某些实施例中,给出的大量web内容的URL,其中每一个都可以通过一组关键字来被描述为特征,于是相似的URL可以通过聚类算法形成主题。已经学习了这些主题,用户对web内容的浏览历史(例如由URL表示)可以转换成反映用户偏好的主题。例如,用户的浏览历史可以包括用户最近在web内容上的任意行为,例如喜欢、观看、分享、评论以及评分web内容。这样,反映用户对web内容的偏好的一个或多个主题上可以被推荐给用户,例如在右侧椭圆块“默里”、“美国公开”、“网球”、“Nokia”、“Lumia 920、“WP8”中示出的主题。
潜在狄利克雷分配(LDA)算法已经被广泛用于文本主题建模。其核心思想是从训练语料库挖掘潜在主题信息,然后使用主题信息用于分类。主题模型的实现是基于词的频率和词对的同时出现,并且它几乎不需要语言学知识。它可以避免过度拟合数据。对于非常大的数据集,LDA的结果可能是相同的,但跟贝叶斯(“Bayesian”)方法中的其它方法相比,LDA具有较低的计算复杂度。可以在期刊《机器学习研究》3:993-1022,2003的标题为“潜在狄利克雷分配”,作者为David M.Blei、Andrew Y.Ng和Michael I.Jordan的论文(David M.Blei,Andrew Y.Ng and Michael I.Jordan,“Latent Dirichlet allocation”,Journal of Machine LearningResearch,3:993-1022,2003)中找到更多的细节,该论文在此全文引用作为参考。
在一些实施例中,LDA算法可以使用一组预定义主题,并且一组种子web内容表示用于有效学习主题的预定义主题。从这一点来说,人类知识结构可以被认为是主题的预定义组,例如政治、物理、经济学等,如图5所示。例如,可以包括若干分支的百科全书的组织可以被用来导出人类知识结构。尽管图5仅显示人类知识结构中的8个方面,可以理解,人类知识结构可以包括任意数量的方面,并且可以基于不同分析标准而不同。这样的预定义知识可以表示可能是用户所偏好的主题。基于这些预定义主题,可以用已知的表示预定义主题的一些种子web页面来训练LDA算法。在这方面,来自知识语料库的web页面可以用作种子web页面。例如,对于主题“经济学”,LDA算法可以基于链接到维基百科(“Wikipedia”)中的词“经济学”的web页面来学习与“经济学”相关的web内容的特征。然后,用户浏览历史的web页面的主题可以参照种子web页面组被发现。例如,具有与特定主题(例如“经济学”)的种子web页面相似特征的web页面可以被识别为也涉及该特定主题。在示例性实施例中,半监督的LDA学习可以被用来识别用户浏览历史的web页面的主题,其中,种子web页面的主题的分布可以保持不变,而用户浏览历史的web页面主题的分布可以被调整。因此,反映用户对web浏览的兴趣的主题列表可以被识别,其中,主题可以全部在人类知识结构中找到。例如,根据用户浏览历史的web页面主题的分布,前三个广泛分布的主题可以被推荐为用户的偏好主题。
利用所收集的主题,可以构造包括一个或多个主题节点的内容树。内容树可以保存为模板并且通过可视化工具呈现给用户。在内容树的示例性实例中,内容树407可以包括五个主要分支,包括进一步链接子主题“孙杨”的主题“游泳”、进一步链接两个子主题“默里”和“美国公开”的主题“网球”、进一步链接子主题“KFC”的主题“食物”、进一步链接子主题“公民凯恩”的主题“电影”、以及进一步链接子主题“Nokia”的主题“WP8”,其中子主题“Nokia”进一步链接子主题“Lumia920”。在一些实施例中,内容树的结构,即主题之间的链路(分支)可以根据主题的语义类别被自动安排。例如,对于用户生成的标签“电影、公民凯恩”,通常能理解,主题“电影”可以是相对于主题“公民凯恩”的上位概念。在一些实施例中,用户可以安排或调整内容树的结构。例如,自动生成的内容树的结构可能不恰当。在最坏的情况下,自动生成的内容树可能由若干离散的主题组成。于是,用户可以例如通过可视化工具安排或调整主题以及它们之间的链路的位置。
内容树的组织被映射到web内容的组织上,该web内容的组织将要呈现在用户接口中。关于这方面,内容树中的主题可以映射到用户接口的对应显示空间。图6示出内容树中的主题和用户接口中的显示空间之间的示例性映射关系。在该示例中,内容树600可以包括多于一个级别的主题。映射到为同一父主题的子主题的主题的显示空间可以被安排在用户接口的相同页面中,并且可以被配置为当映射到父主题的显示空间被选择时被显示。例如,内容树的顶级中的主题可以指示web内容的最上位类别,并且将被显示在用户接口的主/根页面上对应的显示空间内。内容树的较低级别中的子主题可以指示它们所链接的在内容树的较高等级父主题的内容里的下位类别内容,并且将被显示在用户接口的分支页面上的对应显示空间中。为了描述在内容树中的主题的发源结构,我们可以用一组多级别号码对它们进行索引,例如,如图6所示。可以设想,可以通过许多其它方法来对发源结构进行索引。
根据内容树的组织,可以收集与每个主题相关的内容。关于此方面,主题和其父主题之间的关联关系将会限制主题的解释,并且影响与主题有关的内容的收集。例如,对于内容树等级中的主题“1.游泳”,与游泳有关的内容将会为其收集,并且对于较低等级中的子主题“1.1孙杨”,在涉及游泳的内容中与孙杨有关的内容将被收集。可以通过利用LDA建模算法来执行内容收集。对于给出的主题,LDA模型能够通过统计信息将主题建模为关键字,并且识别互联网中匹配的web内容的列表用于例如作为匹配的web页面的URL列表向用户推荐。
图7示出根据图6所示的内容树的用于显示互联网内容的用户接口的示例性屏幕截图。如图所示7,链接到根节点的主题的web内容在根/主页面700的各个显示空间中被呈现。例如,显示空间可以是用户接口的显示屏幕上的窗口、桌面瓷砖或任意其它显示区域,并且显示空间可以是任意形状或尺寸并且可以延伸超出显示屏的边缘。在各个显示空间内,与对应主题相关的web内容的信息可以被呈现,例如相关web页面的摘要、相关web页面的链接列表、或相关web页面的截图、指示已经找到多少新的相关web页面的数字等。在一些实施例中,只要显示空间的可用区域足够,主题的显示空间可以直接显示有关的web页面,例如在屏幕截图710中映射到主题“孙杨”的显示空间中所示。
在一些实施例中,选择主题的显示空间可以引起打开呈现主题的较低级别主题的对应显示空间的分支页面。例如,当选择主题“网球”的显示空间时,如屏幕截图720所示的分支页面可以被打开,并且例如在用户接口的屏幕上显示。分支页面720分别按照内容树600的组织来呈现与父主题“网球”的子主题“默里”和“美国公开”相关联的显示空间。在屏幕截图750和760中的页面示出内容树的主题和显示空间之间的相似的对应关系。在一些实施例中,如果主题不存在子主题,即该主题是最低级别的主题,选择这样的主题的显示空间可以引起直接打开相关的web页面。例如,当主题“默里”的显示空间被选择时,一则关于“安迪默里打败诺瓦克·德约科维奇,赢得美国公开赛”的新闻被显示。由此,利用web内容的系统分类,浏览互联网内容将变得更容易和更顺畅。
在一些实施例中,用户可以调整内容树。利用内容树的调整,用户接口中的对应显示空间的布局将相应地被调整。图8示出根据一个实施例的对图6所示的内容树的示例性调整,和对应被调整的内容树的用户接口的示例性屏幕截图。在该实施例中,由主题“网球”、“默里”和“美国公开”组成的分支可以从内容树中除去,如经修改的内容树800所示。照此,对应的显示空间从用户接口消失。例如,主页的布局可以被修改为如屏幕截图810所示。
在该实施例中,内容树中的主题的任意节点的位置可以被重新安排。例如,如内容树800中所示,主题“Nokia”和“WP8”的位置可以彼此交换。相似地,用户接口中对应显示空间的位置可以相应地重新安排。例如,主题“Nokia”的显示空间可以被安排在如屏幕截图810所示的主页中,而主题“WP8”可以安排在如屏幕截图820中所示的分支页面中,其被链接到主题“Nokia”的显示空间并且可以在选择主题“Nokia”的显示空间之后被打开。
在一些实施例中,利用内容树中主题的节点位置的变化,相关主题的语义可以相应地改变。例如,在原始内容树600中,主题“WP8”的含义将被解释为与WP8相关的所有内容,并且主题“Nokia”的含义将被解释成在其上位概念“WP8”之下。换句话说,主题“Nokia”本质上是指在与“WP8”相关的所有内容中与“Nokia”相关的内容。在修改的内容树800中,主题“Nokia”的含义将被改变为与Nokia相关的所有内容,并且主题“WP8”的含义将被改变为在与“Nokia”相关的所有内容中与“WP8”相关的内容。此外,用于相关主题的内容收集可以根据相关主题的语义改变而改变。由此,用户能够根据他的偏好来定制内容类别,从而使得信息发现可以更智能化和个人化,并且易于发现和提供用户希望具有的正确内容。同时,利用内容树的组织与主题的显示空间布局之间的映射,用户接口可以由性质和个性化需要而被自动呈现为与动态改变的内容一致。
在一些实施例中,用户接口中的显示空间的布局可以根据显示空间的对应主题的排序而被安排。例如,可以根据主题的偏好级别来排序主题,主题的偏好级别反映用户将偏好该主题的程度。图9示出根据一个实施例的用于确定内容树中的主题的各自优先级的示例性方法。tag1,tag2,tag3,…,tagk可以是在内容树900中的主题的相同上级节点下的主题,并且于是可以被安排在用户接口的相同页面中。若干web内容将针对每一个主题而被连接。例如,URL1的web页面和URLm的web页面可以作为与主题tag1匹配的内容而被收集,也可以将URL1的web页面作为与主题tag2匹配的内容而收集。在实施例中,主题可以直接根据收集的web页面的数量而被排序。例如,具有最大数量的被收集的web页面的主题的显示空间可以被安排在用户接口的页面的最显著位置处,例如页面的顶部,并且下面是具有第二大数量的被收集的web页面的主题的显示空间。
社交媒体和其交互将是增强用户参与度的重要方式。在特定实施例中,可以参照相关web内容的用户浏览行为来估计主题的偏好级别。关于此方面,相关web页面的排序可以基于用户在web页面上的浏览行为(例如喜欢、分享、评论、以及观看)而被确定。例如,在web页面上的浏览活动的数量被计算用于排序。在图9所示的示例中,URL1的web页面可以基于六个浏览行为,包括来自用户1的三个浏览行为和来自用户n的另外三个浏览行为,并且相似地,URL2的web页面可以基于两个浏览行为,URL3的web页面可以基于三个浏览行为,以及URLm的web页面可以基于5个浏览行为。于是,web页面URL1,2,3,m可以分别被排序为例如1,4,3,2。基于与主题相关的web页面的排序,可以计算出主题的排序。例如,主题的排序可以通过给web页面打上主题标签的用户数量乘以与该主题相关的所有web页面的排序的平均而计算出。在图9所示的示例中,主题tag1的排序可以被计算为2*(1+2)/2=3,主题tag2的排序可以被计算为4*(1)/1=4,主题tag3的排序可以被计算为3*(4+3)/2=10.5,以及主题tagk的排序可以被计算为1*(4+2)/2=3。根据主题的排序,显示空间可以被安排为反映优先级。例如,页面顶部的显示空间可以被分配给具有最高排序的主题,该显示空间的下面被分配给第二最高排序的主题,等等。
在一些实施例中,可以针对每个主题计算印象得分用于反映偏好级别。关于此方面,可以基于收集的内容对用户的相关性(例如从用户浏览行为和推荐)来计算印象得分。例如,对于每个主题,对应的印象得分可以计算为对打上该主题标签的所有web页面的浏览行为的总和。在图9所示的示例中,主题tag1,tag2,tag3和tagk的印象得分可以分别计算为8,3,5,和6。在一些实施例中,每个主题的显示空间的尺寸也可以设置为与这些印象得分成比例。由此,具有最高印象得分的主题tag1可以被分配最大的显示空间,从而有助于用户浏览最偏好的主题。
在一些实施例中,由于其他人的浏览行为和用户的浏览行为,主题的显示空间的位置和/或尺寸可以实时动态地改变用户接口。例如,在完成主题的web内容的阅读/交互之后,主题显示空间的尺寸于是可以取决于剩余内容而被改变。例如,主题的排序和印象得分可以降低,并且于是主题的显示空间可以收缩并且移动到另一位置。同时,其它主题的显示空间的尺寸和位置可以相应改变,例如被扩大。在实施例中,一旦主题的所有web内容已经被浏览,主题的显示空间可以收缩到最小尺寸,并且其它主题的显示空间则可以相应地和成比例地调整(例如放大)。显示空间的位置和尺寸例如可以通过一些图形优化算法被确定,这些图形优化算法可以优化在具有固定长度和宽度的用户接口中的显示空间布局。由此,用户接口可以随着用户浏览、发现内容和与内容交互而自动改变。
在一些实施例中,内容树或内容树的一部分可以在用户和其他用户之间分享。图10示出根据一个实施例的用于分享内容树的示例性方法。例如,爱丽丝可以具有内容树1000,并且对应显示空间的布局可以被安排为如屏幕截图1030中所示。鲍勃可以具有内容树1010,以及对应显示空间的布局可以安排为如屏幕截图1040所示。于是,爱丽丝的内容树和鲍勃的内容树中的某些分支可以被挑选出来构造我的内容树。例如可以考虑,爱丽丝的内容树中的分支“网球;默里、美国公开”和分支“Nokia;Lumia920”组织得非常好,例如因为爱丽丝是这些领域中的专家。于是,这两个分支可以被复制并且用作我的内容树1020中的分支。相似地,来自鲍勃的内容树的分支“电视节目;家园”和分支“苹果;iphone5”也可以结合到我的内容树1020中。由此,在分享的分支中的主题的对应内容的组织可以同时被分享。在一些实施例中,用户还可以贡献其内容树给其他用户用于分享。由此,个性化信息信道(即结构化的主题)可以被分享,而不是仅一个web页面或预定以的类别/RSS馈送等。因为这可以使用很长时间并且更吸引人,而不是一次性的文章阅读,所以更强大。
现在参考图11,示出适合在实践本发明的示例性实施例中使用的多种电子装置的简化框图。在图11中,通信网络111适于促进用户设备(例如UE 101a和UE 101b)之间的通信,以及用户设备和代理服务器之间的通信。网络111可以包括其它网络元件(未示出),其提供与数据通信网络(例如互联网)以及例如电话网络的其它网络的连接。UE 101a可以建立与UE 101b的通信路径。此外,UE 101a可以建立与代理服务器107的通信路径。尽管通信路径被示为无线通信路径,应该理解的是,这些通信路径也可以是有线通信路径。web内容发现可以根据如上所述的本发明的示例性实施例来执行。
UE 101a包括数据处理器(DP)1101A、存储程序(PROG)1101C的存储器(MEM)1101B、用于与UE 101b和代理服务器107通信的适当收发器1101D。UE 101a可以进一步包括或连接到用于呈现发现的web内容和相关信息的显示器(DISP)1101E。UE 101b还包括DP 1103A,存储PROG 1103C的MEM 1103B、适当的收发器1103D和显示器(DISP)1103E3。代理服务器107还包括DP 1107A、存储PROG 1107C的MEM1107、以及适当的收发器1107D。
假设PROG 1101C、1103C、1107C的至少一个包括程序指令,当由程序指令相关联的DP执行时使得电子装置能够根据如上所述的本发明的示例性实施例进行操作。即,本发明的示例性实施例可以至少部分地通过可由UE 101a的DP 1101A、UE 101的DP 1103、以及代理服务器107的DP 1107A执行的计算机软件来实现,或者通过硬件,或者通过软件和硬件的结合来实现。UE 101a、UE 101b以及代理服务器107的基本结构和操作是本领域技术人员已知的。
通常,UE 101a和UE 101b的多种实施例可以包括但不限于蜂窝电话、具有无线或有线通信能力的个人数字助理(PDA)、具有无线或有线通信能力的便携式计算机、例如具有无线或有线通信能力的数字相机的图像捕捉装置、具有无线或有线通信能力的游戏装置、允许无线或有线互联网访问和浏览的互联网设备,以及包含这样的功能的结合的便携式单元或终端。
MEM 1101B、1103B,1107B可以是适于本地技术环境的任意类型并且可以使用任意合适的数据存储技术实现,该数据存储技术例如基于半导体的存储装置、闪存、磁存储装置和系统、光存储装置和系统、固定存储器以及可移动存储器。DP 1101A、1103A、1107A可以是适合于本地技术环境的任意类型,并且作为非限制性的示例,可以包括通用计算机、专用计算机、微处理器、数字信号处理器(DSP)和基于多核处理器体系结构的处理器中的一个或多个。
DISP 1101E和1103E可以是任意类型的显示装置,包括但不限于阴极射线管(CRT)、液晶显示器(LCD)、等离子屏幕或触摸感测屏幕,用于接收来自DP 1101A和1103A的数据和指令,并且根据指令显示数据。
通常,多种示例性实施例可以实现在硬件或专用电路、软件、逻辑或者其任意结合中。例如,某些方面可以以硬件实现,而其它方面可以以固件或软件来实现,软件可以由控制器、微处理器或者其它计算装置执行,尽管本发明不限于此。虽然本发明的示例性实施例的多种方面可以图示和描述为框图、流程图、或者使用某种其它绘图表示,但是应该理解,本文所述的这些块、设备、系统、技术或方法可以实现在作为非限制示例的硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其它计算装置、或者其某种结合中。
同样地,应当理解,本发明的示例性实施例的至少一些方面可以在例如集成电路芯片和模块的多种组件中实践。因此,应该理解的是,本发明的示例性实施例可以在体现为集成电路的设备中实现,其中集成电路可以包括电路(以及可能的固件),用于体现可以被配置以便根据本发明的示例性实施例操作的数据处理器、数字信号处理器、基带电路和射频电路中的至少一个或多个。
应当理解,本发明的示例性实施例的至少一些方面可以体现在例如由一个或多个计算机或其它装置执行的一个或多个程序模块的计算机可执行指令中。一般而言,程序模块包括当由计算机或者其它装置中的处理器执行时执行特定任务或实现特定的抽象数据类型的例程、程序、对象、组件、数据结构等。计算机可执行指令可以被存储在例如硬盘、光盘、可移动存储介质、固态存储器、RAM等的计算机可读介质中。如将被本领域技术人员所认识到的,程序模块的功能可以按照在多种实施例中希望的那样被结合或分布。此外,功能可以全部或部分地包含在固件或例如集成电路、现场可编程门阵列(FPGA)等的硬件等同物中。
本发明包括本文明确公开的或其任意概括公开的任意新颖的特征或特征的结合。鉴于前文描述,当结合附图阅读时,对于本发明的上述示例性实施方式的多种修改和适应对于相关领域的技术人员来说将变得明显。然而,任意和所有修改将仍然落在本发明的非限制性和示例性实施例的范围内。
Claims (30)
1.一种方法,包括:
构造分层、树状结构的主题模型,所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间;
收集与所述相应的主题相匹配的web内容;以及
引起在映射到所述相应的主题的所述显示空间内呈现所收集的web内容的信息。
2.如权利要求1所述的方法,进一步包括:基于用户生成的web内容的标签和/或从所述用户访问的web内容自动提取的主题来获得反映用户偏好的一组主题。
3.如权利要求2所述的方法,其中,通过以下方式从所述用户访问的web内容自动提取所述主题:
基于多个web内容通过聚类算法学习多个主题;以及
基于所述用户访问的web内容的用户访问历史来推荐反映所述用户偏好的一个或多个主题。
4.如权利要求3所述的方法,其中,基于多个web内容通过聚类算法学习多个主题包括:
通过一组预定义的主题和表示所述预定义的主题的一组种子web内容训练所述聚类算法;以及
参考所述一组种子web内容识别所述用户访问的web内容的主题。
5.如权利要求1所述的方法,进一步包括:
确定主题的优先级;以及
根据所确定的所述主题的优先级自动设置映射到所述主题的显示空间的位置和/或尺寸。
6.如权利要求5所述的方法,其中,所述主题的优先级是基于与所述主题相匹配的web内容确定的。
7.如权利要求1所述的方法,进一步包括:从其它装置获得所述分层、树状结构的主题模型的全部或一部分。
8.如权利要求1所述的方法,进一步包括:
调整所述分层、树状结构的主题模型的至少一部分;
收集与被调整的主题模型中的相应主题相匹配的web内容;以及
引起调整所述用户接口的显示空间,用于在映射到所述被调整的主题模型中的相应主题的显示空间中呈现与所述被调整的主题模型中的相应主题相匹配的所收集的web内容的信息。
9.如权利要求1所述的方法,进一步包括:与其它装置分享所述分层、树状结构的主题模型的全部或一部分。
10.如权利要求1所述的方法,其中,所述主题模型包括多于一个级别,并且映射到为相同父主题的子主题的主题的显示空间被安排在用户接口的相同页面中,并且所述显示空间被配置为当映射到所述父主题的显示空间被选择时而被显示。
11.如权利要求1所述的方法,其中,收集与所述相应的主题匹配的web内容包括:识别与所述相应的主题相关联的web页面的统一资源定位符。
12.一种设备,包括:
至少一个处理器;以及
包括计算机程序代码的至少一个存储器,
所述至少一个存储器和所述计算机程序代码被配置为,利用所述至少一个处理器,引起所述设备执行至少以下步骤:
构造分层、树状结构的主题模型,所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间;
收集与所述相应的主题相匹配的web内容;以及
引起在映射到所述相应的主题的所述显示空间内呈现所收集的web内容的信息。
13.如权利要求12所述的设备,其中,进一步引起所述设备:基于用户生成的web内容的标签和/或从所述用户访问的web内容自动提取的主题来获得反映用户偏好的一组主题。
14.如权利要求13的设备,其中,通过以下方式从所述用户访问的web内容自动提取所述主题:
基于多个web内容通过聚类算法学习多个主题;以及
基于所述用户访问的web内容的用户访问历史来推荐反映所述用户偏好的一个或多个主题。
15.如权利要求14所述的设备,其中,基于多个web内容通过聚类算法学习多个主题包括:
通过一组预定义的主题和表示所述预定义的主题的一组种子web内容训练所述聚类算法;以及
参考所述一组种子web内容识别所述用户访问的web内容的主题。
16.如权利要求12所述的设备,其中,进一步引起所述设备:
确定主题的优先级;以及
根据所确定的所述主题的优先级自动设置映射到所述主题的显示空间的位置和/或尺寸。
17.如权利要求16所述的设备,其中,所述主题的优先级是基于与所述主题相匹配的web内容确定的。
18.如权利要求12所述的设备,进一步引起所述设备:从其它装置获得所述分层、树状结构的主题模型的全部或一部分。
19.如权利要求12所述的设备,进一步引起所述设备:调整所述分层、树状结构的主题模型的一部分。
20.如权利要求12所述的设备,进一步引起所述设备:与其它装置分享所述分层、树状结构的主题模型的全部或一部分。
21.如权利要求12所述的设备,其中,所述主题模型包括多于一个级别,并且映射到为相同父主题的子主题的主题的显示空间被安排在用户接口的相同页面中,并且所述显示空间被配置为当所述父主题的显示空间被选择时而被显示。
22.如权利要求12所述的设备,其中,收集与所述相应的主题匹配的web内容包括:识别与所述相应的主题相关联的web页面的统一资源定位符。
23.一种携带一个或多个指令的一个或多个序列的计算机可读存储介质,当所述指令被一个或多个处理器执行时,引起设备至少执行以下步骤:
构造分层、树状结构的主题模型,所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间;
收集与所述相应的主题相匹配的web内容;以及
引起在映射到所述相应的主题的所述显示空间内呈现所收集的web内容的信息。
24.一种设备,包括:
用于构造分层、树状结构的主题模型的部件,所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间;
用于收集与所述相应的主题相匹配的web内容的部件;以及
用于引起在映射到所述相应的主题的所述显示空间内呈现所收集的web内容的信息的部件。
25.一种计算机程序产品,其包括一个或多个指令的一个或多个序列,当所述指令被一个或多个处理器执行时,引起设备至少执行如权利要求1-12中的任一项所述的方法的步骤。
26.一种用户接口,包括:
接口组件,其被配置为接收web内容的信息,其中,所述web内容被收集用于与分层、树状结构的主题模型中的主题相匹配,所述主题模型包括一个或多个节点,所述一个或多个节点具有相应的主题并且被配置为将所述相应的主题映射到用户接口的显示空间;以及
显示模块,其被配置为在映射到所述相应的主题的所述显示空间内呈现与所述相应的主题相匹配的web内容的信息。
27.如权利要求26所述的用户接口,其中,所述主题模型包括多于一个级别,并且所述显示模块进一步被配置为:
在所述用户接口的相同页面上安排映射到为相同父主题的子主题的主题的显示空间,并且当映射到所述父主题的显示空间被选择时,显示映射到为所述相同父主题的子主题的所述主题的显示空间。
28.如权利要求26所述的用户接口,其中,所述接口模块被进一步配置为接收主题的优先级,并且所述显示模块进一步被配置为:
根据所述主题的所述优先级自动设置映射到所述主题的显示空间的位置和/或尺寸。
29.如权利要求28所述的用户接口,其中,所述主题的所述优先级是基于与所述主题相匹配的web内容确定的。
30.如权利要求26所述的用户接口,其中,当所述分层、树状结构的主题模型的至少一部分被调整时,并且所述显示模块进一步被配置为:
调整所述用户接口的显示空间从而在映射到被调整的主题模型中的相应主题的显示空间中呈现所收集的用于与所述被调整的主题模型中的相应主题相匹配的web内容的信息。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2012/085365 WO2014082209A1 (en) | 2012-11-27 | 2012-11-27 | Method for web information discovery and user interface |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104813313A true CN104813313A (zh) | 2015-07-29 |
Family
ID=50827021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280077288.1A Pending CN104813313A (zh) | 2012-11-27 | 2012-11-27 | Web信息发现方法和用户接口 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150286711A1 (zh) |
EP (1) | EP2926272A4 (zh) |
CN (1) | CN104813313A (zh) |
WO (1) | WO2014082209A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8275859B2 (en) * | 2009-03-31 | 2012-09-25 | International Business Machines Corporation | Selective partial updates of web content |
US20120266090A1 (en) * | 2011-04-18 | 2012-10-18 | Microsoft Corporation | Browser Intermediary |
US10089372B2 (en) | 2014-05-09 | 2018-10-02 | Sap Se | Data visualization using level of detail magnification |
US9710430B2 (en) * | 2014-05-09 | 2017-07-18 | Sap Se | Representation of datasets using view-specific visual bundlers |
US9946638B1 (en) | 2016-03-30 | 2018-04-17 | Open Text Corporation | System and method for end to end performance response time measurement based on graphic recognition |
US20170357622A1 (en) | 2016-06-12 | 2017-12-14 | Apple Inc. | Arrangement of documents in a document feed |
GB2594797A (en) * | 2020-03-26 | 2021-11-10 | Push Tech Limited | Viewing structured data published to a topic tree as restructured data tree according to a topic view mapping |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101192237A (zh) * | 2006-11-30 | 2008-06-04 | 国际商业机器公司 | 查询多方面信息的方法和系统 |
CN101609457A (zh) * | 2009-04-01 | 2009-12-23 | 北京搜狗科技发展有限公司 | 一种提供起始页推荐配置的方法及装置 |
CN101894170A (zh) * | 2010-08-13 | 2010-11-24 | 武汉大学 | 基于语义关联网络的跨模信息检索方法 |
EP2372577A1 (en) * | 2010-03-31 | 2011-10-05 | British Telecommunications public limited company | Context system |
US20120254188A1 (en) * | 2011-03-30 | 2012-10-04 | Krzysztof Koperski | Cluster-based identification of news stories |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7177796B1 (en) * | 2000-06-27 | 2007-02-13 | International Business Machines Corporation | Automated set up of web-based natural language interface |
US6687696B2 (en) * | 2000-07-26 | 2004-02-03 | Recommind Inc. | System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models |
US20050256899A1 (en) * | 2004-05-14 | 2005-11-17 | Bea Systems, Inc. | System and method for representing hierarchical data structures |
US7783622B1 (en) * | 2006-07-21 | 2010-08-24 | Aol Inc. | Identification of electronic content significant to a user |
US8214361B1 (en) * | 2008-09-30 | 2012-07-03 | Google Inc. | Organizing search results in a topic hierarchy |
CA2772082C (en) * | 2009-08-24 | 2019-01-15 | William C. Knight | Generating a reference set for use during document review |
US20140101542A1 (en) * | 2012-10-09 | 2014-04-10 | Microsoft Corporation | Automated data visualization about selected text |
-
2012
- 2012-11-27 WO PCT/CN2012/085365 patent/WO2014082209A1/en active Application Filing
- 2012-11-27 US US14/435,426 patent/US20150286711A1/en not_active Abandoned
- 2012-11-27 CN CN201280077288.1A patent/CN104813313A/zh active Pending
- 2012-11-27 EP EP12889372.4A patent/EP2926272A4/en not_active Ceased
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101192237A (zh) * | 2006-11-30 | 2008-06-04 | 国际商业机器公司 | 查询多方面信息的方法和系统 |
CN101609457A (zh) * | 2009-04-01 | 2009-12-23 | 北京搜狗科技发展有限公司 | 一种提供起始页推荐配置的方法及装置 |
EP2372577A1 (en) * | 2010-03-31 | 2011-10-05 | British Telecommunications public limited company | Context system |
CN101894170A (zh) * | 2010-08-13 | 2010-11-24 | 武汉大学 | 基于语义关联网络的跨模信息检索方法 |
US20120254188A1 (en) * | 2011-03-30 | 2012-10-04 | Krzysztof Koperski | Cluster-based identification of news stories |
Also Published As
Publication number | Publication date |
---|---|
WO2014082209A1 (en) | 2014-06-05 |
EP2926272A1 (en) | 2015-10-07 |
EP2926272A4 (en) | 2016-07-13 |
US20150286711A1 (en) | 2015-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chu et al. | A hybrid recommendation system considering visual information for predicting favorite restaurants | |
US8543532B2 (en) | Method and apparatus for providing a co-creation platform | |
US8762302B1 (en) | System and method for revealing correlations between data streams | |
TWI636416B (zh) | 內容個人化之多相排序方法和系統 | |
US9979777B1 (en) | Scoring stream items with models based on user interests | |
CA2894144C (en) | Displaying a stream of content | |
CN104813313A (zh) | Web信息发现方法和用户接口 | |
CN103955464B (zh) | 一种基于情境融合感知的推荐方法 | |
Cleger-Tamayo et al. | Top-N news recommendations in digital newspapers | |
US20150256636A1 (en) | System and method for analyzing messages in a network or across networks | |
CN108648010B (zh) | 用于向用户提供内容的方法、系统及相应介质 | |
KR102107848B1 (ko) | 도서 추천 서비스 방법 | |
US20110238608A1 (en) | Method and apparatus for providing personalized information resource recommendation based on group behaviors | |
US20130036121A1 (en) | System and method for recommending blog | |
Deepak et al. | A hybridized semantic trust-based framework for personalized web page recommendation | |
GB2507667A (en) | Targeted advertising based on momentum of activities | |
CN104903886A (zh) | 基于社交图谱信息的结构化搜索查询 | |
US20140074828A1 (en) | Systems and methods for cataloging consumer preferences in creative content | |
Díez et al. | Towards explainable personalized recommendations by learning from users’ photos | |
CN107562939A (zh) | 垂直领域新闻推荐方法、装置及可读储存介质 | |
CN105786897B (zh) | 用于提供基于情境感知的用户关注信息的情境感知本体构建方法 | |
US20140075293A1 (en) | Web page layout | |
CN103262079B (zh) | 检索装置及检索方法 | |
Wang et al. | Socially-driven multi-interaction attentive group representation learning for group recommendation | |
US20110153613A1 (en) | Information search apparatus and method using locational/societal relation-based automatic category generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150729 |