CN104919457A - 用于丰富社交媒体以改进个性化用户体验的方法和装置 - Google Patents

用于丰富社交媒体以改进个性化用户体验的方法和装置 Download PDF

Info

Publication number
CN104919457A
CN104919457A CN201380070146.7A CN201380070146A CN104919457A CN 104919457 A CN104919457 A CN 104919457A CN 201380070146 A CN201380070146 A CN 201380070146A CN 104919457 A CN104919457 A CN 104919457A
Authority
CN
China
Prior art keywords
electronic document
user
keyword
highlighting
annotate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380070146.7A
Other languages
English (en)
Inventor
A·秦
J·田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Nokia Technologies Oy
Original Assignee
Nokia Technologies Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Technologies Oy filed Critical Nokia Technologies Oy
Publication of CN104919457A publication Critical patent/CN104919457A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)

Abstract

提供了一种用于丰富社交媒体以改进个性化用户体验的方法和装置,该方法包括:接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该至少一个电子文档的个性化内容。这样,通过拥有来自多个用户的对于给定文档的高质量/相关的标签,可以更好地建立文档的简档。类似地,通过拥有用户对于多个文档的高质量的和有意义标签,可以更好地建立关于用户的兴趣和行为的简档。通过拥有更好的文档和用户简档,可以更好地将正确的文档推荐给正确的用户。此外,可以提供更有趣的UI特征以改进用户的体验和参与。

Description

用于丰富社交媒体以改进个性化用户体验的方法和装置
技术领域
本发明涉及社交媒体和推荐,具体涉及利用用户做出的突显(highlight)和/或注释来丰富社交媒体以改进个性化用户体验。
背景技术
传统上,作者写下文章并将其发表在诸如报纸、杂志和书等纸质媒体上。用户可以阅读文章并在其中做出注释和突显来强调对他们重要或有价值的内容,并表述他们对于感兴趣部分的观点。由这些注释和突显,不仅可以获得文章的重要内容而不必阅读整个文章,而且在某种程度上了解做出这些注释和突显的作者。然而,传统媒体中的这些注释和突显主要为了个人使用,而没有社会影响。
随着互联网的出现和发展,作者可以在诸如门户、BBS、电子书和博客等互联网社交媒体渠道发表文章。用户通常可以在文章上标记其个人感情或观点,诸如喜好、分享和评级。因此,相比于传统纸质媒体,互联网社交媒体提供了用户与作者及用户之间的更多参与和交互。然而,当前的互联网社交媒体技术仍然有如下局限:
1.用户的评论通常与原始文章是分开的,而不是文章中的注释,并在用户交互、界面、数据分析和推荐等方面与文章分开处理。用户无法承担任何作者角色,并在阅读和共同写作文章方面没有强烈的动机和参与。
2.用户在文章中的注释和突显未被充分利用来提供更丰富和可配置的包含了很多用户的社会智慧的文章视图
3.用户在不同文章中的注释和突显未被充分利用以生成关于用户的高质量和大量的数据,以提供用于诸如推荐等各种目的的用户简档(profile)。
4.当前的内容推荐是基于对整个文章进行内容分析以提取关键词,但通常仅仅是少数段落或句子是重要的,而不是整个文章;并且当前的推荐没有利用用户在文章中的注释。
发明内容
为了克服现有技术中的上述一个或多个局限或其他局限,提供了根据本发明的示例性实施例的方法和装置。
在一些示例性实施例中,提供了一种方法,包括:接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该至少一个电子文档的个性化内容。
在本发明的进一步的实施例中,所述使用关键词作为至少一个电子文档的标签以向用户提供来自至少一个电子文档的个性化内容包括:响应于用户对电子文档的请求,向用户提供与具有突显和/或注释的该电子文档相关联的用户界面控件,该用户界面控件被配置为使得用户能够选择阈值,从而只有具有突显和/或注释的电子文档的重要性分数高于阈值的关键词被呈现给用户。
在另一个进一步的实施例中,所述方法进一步包括:创建用户简档,其包括来自由相应用户做出的至少一个电子文档中的突显部分和/或注释的提取的关键词;其中,所述使用关键词作为至少一个电子文档的标签以向用户提供来自至少一个电子文档的个性化内容包括:对于该用户的用户简档中的至少一个关键词,基于相应的至少一个电子文档中的至少一个关键词的重要性分数计算该至少一个电子文档的推荐分数;根据推荐分数对至少一个电子文档进行排序;以及向用户推荐至少一个电子文档中具有最高推荐分数的预定数量的电子文档。
在本发明的一些其他实施例中,提供了一种装置,包括:至少一个处理器,以及至少一个包括计算机程序代码的存储器,所述至少一个存储器和计算机程序代码被配置为:与处理器一起,使得该装置至少执行以下操作:接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该至少一个电子文档的个性化内容。
在进一步的实施例中,所述使用关键词作为至少一个电子文档的标签以向用户提供来自至少一个电子文档的个性化内容包括:响应于用户对电子文档的请求,向用户提供与具有突显和/或注释的该电子文档相关联的用户界面控件,该用户界面控件被配置为使得用户能够选择阈值,从而只有具有突显和/或注释的电子文档的重要性分数高于阈值的关键词被呈现给用户。
在另一个进一步的实施例中,所述至少一个存储器和计算机程序代码被配置为:与处理器一起,使得该装置至少执行以下操作:创建用户简档,其包括来自由相应用户做出的至少一个电子文档中的突显部分和/或注释的提取的关键词;其中,所述使用关键词作为至少一个电子文档的标签以向用户提供来自至少一个电子文档的个性化内容包括:对于该用户的用户简档中的至少一个关键词,基于相应的至少一个电子文档中的至少一个关键词的重要性分数计算该至少一个电子文档的推荐分数;根据推荐分数对至少一个电子文档进行排序;以及向用户推荐至少一个电子文档中具有最高推荐分数的预定数量的电子文档。
在本发明的一些其他示例性实施例中,提供了一种计算机程序产品,其包括存储有计算机可执行程序代码指令的至少一个计算机可读存储介质,所述计算机可执行程序代码指令包括用于执行以下操作的程序代码指令:接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该至少一个电子文档的个性化内容。
在一些其他示例性实施例中,提供了一种用户界面,包括:与具有突显和/或注释的电子文档相关联地呈现的用户界面控件,其中由具有突显和/或注释的电子文档提取的新名词和其重要性分数与电子文档相关联地被记录,所述用户界面控件被配置为使得用户能够选择阈值,从而只有具有突显和/或注释的电子文档中的具有大于阈值的重要性分数的关键词被呈现给用户。
在另一个示例性实施例中,提供了一种方法,包括:接收由用户在至少一个电子文档中做出的突显和/或注释;从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为该相应的至少一个电子文档的标签;以及创建用户简档,其包括从由用户做出的该至少一个电子文档中突显部分和/或注释提取的关键词。
因此,通过获得来自多个用户的对于给定文档的高质量/相关的标注,可以更好地建立文档的简档。类似地,通过获得一个用户对于多个文档的高质量和有意义的标注,可以更好地建立关于用户的兴趣和行为的简档。并且,通过获得更好的文档和用户简档,可以更好地向适当的用户推荐适当的文档。此外,可以提供更有趣的UI特征以改进用户体验和参与。本发明的其他方面、特征和优点可以通过以下详细描述容易地获知,其中描述了若干特征实施例和实施方式,包括被认为本发明的最佳实施方式。本发明还有其他不同的实施例,其细节可以在各实施例中进行修改,其细节可以在各显著的方面进行修改,这些均没有超出本发明的精神和范围。因此,附图和描述在性质上是示例性的,而不是限制性的。
附图说明
本发明的实施例通过示例而非限制在以下附图中示出:
图1示出了根据本发明的实施例能够丰富社交媒体以改进个性化用户体验的系统图;
图2示出了呈现电子文档以及注释和/或突显和关键词的浏览器应用的示例性用户界面;
图3示出了示例性弹出窗口,其中显示了与电子文档相关的关键词;
图4A-4D示意性和示例性地示出了调整显示电子文档中不同数量的关键词(或单词)的阈值;
图5示意性和示例性地示出了另一个弹出窗口,其中显示了用户的声誉分数、由用户做出的突显和注释的数量;
图6示出了根据本发明的一些实施例的用于丰富社交媒体以改进个性化用户体验的装置的框图;
图7示出了根据本发明的另一些实施例的用于丰富社交媒体以改进个性化用户体验的装置700的框图;
图8示出了根据本发明的一些实施例的用于丰富社交媒体以改进个性化用户体验的方法800的流程图;
图9示出了根据本发明的另一些实施例的用于丰富社交媒体以改进个性化用户体验的方法900的流程图;
具体实施方式
公开了用于丰富社交媒体以改进个性化用户体验的方法、装置和计算机程序的示例。在以下描述中,为了说明的目的,阐述了大量的特定细节,以便提供对本发明的实施例的充分理解。然而,对本领域的技术人员来说显然的是,可以实现这些实施例,而不需要这些特定细节,或者使用等效的安排。在其他示例中,公知的结构和装置以框图的形式示出,或者被省略,以避免不必要地模糊了本发明的实施例。在整个说明书和附图中,相同的标号指相同的部件。根据本发明的一些示例性实施例,术语“数据”、“内容”、“信息”和类似的术语可以互换地使用,以指能够被传输、接收、操作、呈现和/或存储的数据。
图1是根据本发明的实施例能够丰富社交媒体以改进个性化用户体验的系统的图。如图1所示,系统100可包括一个或多个用户设备(UE)101,其通过通信网络111与服务提供者平台113连接。作为示例,系统100的通信网络111可包括一个或多个网络,例如数据网络(未示出)、无线网络(未示出)、电话网络(未示出),或其任何组合。可以设想数据网络可以是任何局域网(LAN)、城域网(MAN)、广域网(WAN)、公共数据网(例如,互联网)、自组织移动网,或任何其他适当的分组交换网,例如商用、专用分组交换网(例如专用电缆或光纤网)。此外,无线网例如可以是蜂窝网,并可以使用各种技术,包括增强型数据速率全球演进(EDGE)、通用分组无线业务(GPRS)、全球移动通信系统(GSM)、网际协议多媒体子系统(IMS)、通用移动通信系统(UMTS)等,以及任何其他适当的无线介质,例如全球微波接入互操作性(WiMAX)、无线局域网(WLAN)、长期演进(LTE)网络、码分多址(CDMA)、宽带码分多址(WCDMA)、无线高保真(WiFi)、卫星、移动自组网(MANET)等。
UE 101可以是任何类型的移动终端、固定终端或便携式终端,包括移动电话、工作站、单元、设备、多媒体计算机、多媒体平板计算机、互联网节点、通信器、桌面计算机、膝上型计算机、笔记本计算机、上网本、平板计算机、个人数字助理(PDA),或其任何组合。如本领域的技术人员所知的,UE 101可以包括例如处理器、存储将被处理器执行的程序的存储器,以便用于存储、输入/输出和通信的任何种类和数量的外围设备,例如外部存储器、键盘或小键盘、显示器或触摸屏、扬声器、话筒、摄像机、网络接口卡、收发器等,以及连接处理器与存储器和其他设备一个或多个总线。
如图1所示,UE 101可以安装有并执行浏览器应用103,以及在移动设备或计算设备中安装和执行的其他程序。浏览器应用103可以通过通信网络111将访问诸如网页等互联网内容的用户请求(用户以统一资源标识符的形式在浏览器应用中输入互联网内容的地址)发送到服务器应用,例如web服务器,从服务器应用接收作为对用户请求的响应的网页内容,然后在用户界面(例如用户设备101的屏幕)中显示网页。浏览器应用103可以是任何已知的web浏览器,例如微软公司的Firefox和InternetExplorer、苹果公司的Safari,或谷歌公司的Chrome,或任何新开发的web浏览器。
如本领域的技术人员所知的,从服务器应用接收并显示在UE上的互联网内容可以是各种形式的数据内容,例如网页、博客、电子邮件、微博、即时消息、短消息(SMS)、诸如社交网站等社交媒体上的帖子等。这些互联网内容存储、传输、处理或显示的单元可被称为文档,且因此在本文中这些互联网内容可被一般地称为电子文档。
在本发明的实施例中,浏览器应用103可被增强这样的能力,即接收由用户在显示在UE 101的用户界面中的电子文档中做出的注释和突显,并将所述注释和突显通过通信网络111发送到服务提供者平台113。这种增强可以通过在现有的浏览器上安装具有这种能力的插件来实现,或者通过新开发的具有这种能力的浏览器来实现。
浏览器应用103可允许用户以任何适当的方式突显电子文档中显示的任何部分,例如段落、句子、短语或词。例如,在UE 101是桌面计算机的情况中,用户可被允许首先使用鼠标选择电子文档的一部分,然后点击按钮来突显它;或者首先点击按钮进入突显模式,然后使用鼠标选择电子文档的一部分来突显它。作为另一个示例,在UE 101是具有触摸屏的智能电话或平板计算机的情况下,用户可被允许首先敲击一个按钮以进入突显模式,然后通过划动动作选择电子文档的一部分以突显它。当用户突显电子文档的一部分时,浏览器应用103可进一步在UE 101的用户界面中提供关于突显的某种视觉指示,例如对电子文档中的被突显部分添加下划线或改变被突显部分的背景颜色。
浏览器应用103可进一步允许用户在电子文档中针对电子文档中任何被突显的部分或任何其他部分,或针对整个电子文档,进行注释。浏览器应用103可以允许用户通过任何适当的方式在电子文档中的任何位置进行注释。例如,浏览器应用103可在浏览器窗口中提供一个按钮,点击该按钮将显示一个文本框,用户可以在该文本框中输入注释。并且,注释可以显示在电子文档中的光标位置。
在接收到由用户在电子文档中做出的突显和/或注释后,浏览器应用13可以将突显和/或注释发送到服务提供者平台113,并可能与电子文档一起发送。
应注意的是,在本发明的实施例中,除了接收由用户在电子文档中做出的突显和注释,并将突显和注释发送到服务提供者平台113的能力之外,浏览器应用103可以具有正常浏览器的与访问互联网内容相关的功能。因此,用户可以使用浏览器应用103作为正常的浏览器应用来访问互联网上的任何互联网内容,例如各种web服务器上的各种网页,并将网页显示在UE 101的用户界面中;然后,用户可以在网页中做出注释和/或突显,并将注释和/或突显并可能与网页一起发送到服务提供者平台113。
服务提供者平台113可包括具有足够的计算、存储和通信能力并安装有适当的软件应用的各种体系结构的一个或多个计算设备。这样的计算设备可包括例如处理器、存储将由处理器执行的程序的存储器,以及用户存储、通信等的各种类型和数量的外围设备,例如,外部存储器、网络接口卡,以及将处理器连接到存储器和其他设备的总线。
在本发明的一些实施例中,服务提供者平台113可以安装有并执行服务器应用113,例如web服务器,其可接收来自UE 101上的浏览器应用103的访问电子文档的用户请求,从服务提供者平台113或其他设备获取电子文档,并将电子文档发送到浏览器应用作为响应。服务器应用113也可通过诸如互联网的通信网络与其他服务提供者平台或各种其他服务器计算机(未示出)上的应用进行通信以获取电子文档。
UE 101和服务提供者平台113之间的通信可使用任何已知的标准化数据通信协议栈,例如传输控制协议/网标协议(TCP/IP)、超文本传输协议(HTTP)、超文本标记语言(HTML)、扩展标记语言(XML)等,或任何新开发的协议。
在本发明的实施例中,服务提供者平台113上的服务器应用115可以被增强这样的能力,即接收来自浏览器应用103的突显和/或注释(可能与电子文档)一起,并以如下所述方式处理所接收的突显和/或注释。这些能力可以通过向服务提供者平台113上的诸如web服务器应用的现有服务器应用添加用于接收和处理的新的模块来实现,或者通过服务提供者平台113上的新开发的具有用于接收和处理的模块的服务器应用115来实现。
在本发明的一些实施例中,接收突显和/或注释的能力也可以在代理服务器中实现。如本领域的技术人员所知的,代理服务器用作UE 101和服务提供者平台113或其他web服务器之间的中间设备,接收来自UE 101的访问电子文档的请求,通过通信网络111与服务提供者平台113或其他web服务器通信,以便获取电子文档,可能将所获取的电子文档调整适应于特定的UE 101,并将可能调整适应过的电子文档提供给UE 101。如本领域的技术人员所知的,代理服务器通常可在计算设备中实现,该计算设备包括至少一个处理器、存储将由处理器执行的程序的存储器、用于存储和通信等的各种其他外围设备,以及一个或多个用于将处理器连接到存储器和其他设备的总线。
在从浏览器应用103接收到突显和/或注释(可能与电子文档一起)之后,服务器应用113可由突显部分和注释提取关键词,以及电子文档中的其他部分。这些关键词可能代表电子文档的最重要的点,并可用作针对该用户的电子文档的标签。应注意这里的关键词也可以指关键词组。
可使用各种关键词提取算法来从具有突显和/或注释的电子文档中提取关键词。在本发明的一些实施例中,使用词频逆文档频率(TF-IDF)类算法从电子文档提取关键词。该算法的基本思想是基于一个词在一个电子文档中的出现频率(例如,该词在该电子文档中出现的次数相对于所有词在该电子文档中出现的次数)相对于包括该词的电子文档在电子文档库(例如,电子文档的训练库)中的出现频率计算该词在该电子文档中的重要性分数。根据该算法,一个词在一个电子文档中出现得越频繁,则该词在该电子文档中越重要;然而,该词也在其他电子文档中出现得越频繁,则该词在该电子文档中越不重要。在本发明的实施例中,一个词在一个电子文档中的重要性分数可被简单地计算为该词在该电子文档中的出现频率除以包括该词的电子文档在电子文档库(例如,服务提供者平台113中的所有电子文档,或服务提供者平台113可访问的所有电子文档)中的出现频率。当然,关键词的重要性分数也可以其他任何方式来计算,只要所计算的词的重要性分数可在某种程度上代表该词的相对重要性即可。应注意的是,因为服务提供者平台113可以从很多UE 101接收带有突显和/或注释的电子文档,随着时间的推移服务提供者平台可收集海量的带有突显和/或注释的电子文档,这些电子文档可用作计算词在当前电子文档中的重要性的训练库,并可用于其他目的,例如用于计算电子文档的推荐分数,如以下所述。
在计算词在带有突显和/或注释的电子文档中的出现频率时,该词在该电子文档中的突显部分、在注释中以及在该电子文档的其他部分中的出现可被相同地处理,即具有相同的权重。或者,它们可在计算出现频率时具有不同的权重。例如,在计算出现频率时,词在电子文档的突显部分和在注释中的出现可以具有比该词在电子文档的其他部分的出现更大的权重。甚至进一步地,例如,词在电子文档的其他部分的出现可以不具有任何权重,也就是说,在计算词在电子文档中的出现频率时,只有词在突显部分和注释中的出现才被计数。
在从电子文档中提取关键词时,服务器应用115可进一步地关注于名词,而不考虑其他词类。并且,服务器应用113可进一步使用词干提取来组合同一个基本词的不同变形。
在本发明的一些实施例中,还考虑到使用UE 101的用户可直接输入相对于电子文档的关键词,并且浏览器应用103可以将关键词与突显和/或注释以及可能的电子文档通过通信网络111发送到服务提供者平台113上的服务器应用113。因此,服务器应用115可具有从带有突显和/或注释的电子文档提取的关键词,以及所接收的直接由用户输入的关键词。在这种实施例中,浏览器应用103可在浏览器窗口中提供按钮,点击该按钮可显示文本输入框,用户可在其中输入关键词。
在由来自浏览器应用103的电子文档提取关键词和/或接收到由用户直接输入的关键词之后,服务器应用115可将关键词与关键词所提取自的电子文档、突显部分、其他部分或注释相关联地存储在与服务提供者平台113相关联的存储设备上的数据库中。由于单个电子文档可由很多用户使用很多UE 101访问、注释和/或突显,并且单个用户可以使用其UE 101访问、注释和/或突显很多电子文档,随着时间的推移,服务器应用可在数据库中存储关于带有很多用户做出的注释和/或突显的电子文档以及提取的关键词的数据。这些数据可以有组织和结构化的方式存储在数据库(例如,关系数据库表)中,这样给定任何一个电子文档、注释和/或突显、用户和关键词,可以获得所有相关的其他电子文档、注释和/或突显、用户和关键词。因此,由该海量数据,可以获得由很多用户的社会智慧所丰富的电子文档,其形式为由用户做出的注释和/或突显,以及由系统提取的和由用户直接输入的关键词。由这些注释和/或突显以及关键词,可以更短得多的时间获得关于电子文档本身的内容的更充分得多的理解。此外,由该海量数据,可以得知由特定用户访问的所有相关电子文档和由其做出的注释和/或突显,以及从这些电子文档的注释和/或突显部分及其他部分提取的关键词,和由用户直接输入的关键词,从而能够精确地确定用户的简档。
可以各种方式为各种目的利用该海量的高质量的数据,例如确定用户的简档,向用户推荐电子文档,向用户呈现电子文档的高度丰富的视图等等。
在本发明的一些实施例中,可利用该海量数据以向用户呈现电子文档的丰富视图。也就是说,当用户使用其UE 101上的浏览器应用103以通过服务器应用访问存储在服务提供者平台113上的电子文档时,服务器应用可将该电子文档与用户做出的所有注释和/或突显、以及与该电子文档关联的所提取和/或由用户直接输入的关键词一起发送到UE 101,以便由浏览器应用103呈现给用户。浏览器应用103可以各种方式向用户呈现电子文档和注释和/或突显以及关键词。例如,浏览器应用103可首先呈现原始电子文档,其设置有弹出菜单(可通过按压电子文档的文本或通过其他方式激活和显示该弹出菜单),在该弹出菜单中用户可选择菜单项以查看由用户做出的突显部分,查看由用户做出的注释,以及查看关键词。
参照图2,其示出了呈现电子文档以及注释和/或突显以及关键词的电子文档的浏览器应用103的示例性用户界面。如图所示,原始电子文档被呈现在用户界面中,且由不同用户做出的突显段落在呈现的原始电子文档中以不同颜色标记(突显段落也可以为了页面整洁不予标记,特别是在很多用户突显了电子文档的不同部分的情况下)。当用户长按电子文档的段落时,可呈现一弹出菜单,其菜单项被分别标记为“仅阅读突显段落”、“查看注释”以及“重点”。当用户接着点击菜单项“仅阅读突显段落”时,将弹出一窗口,其中将显示由不同用户做出的突显部分;当用户点击菜单项“查看注释”时,将弹出一窗口,其中将显示由不同用户做出的注释;而当用户点击菜单项“重点”时,将弹出一窗口,其中将显示与该电子文档相关的关键词。
参照图3,其示出了示例性弹出窗口,其中显示了与一电子文档相关的关键词。如图中所示,在该弹出窗口中,可显示与电子文档相关的不同关键词。如图中进一步示出的,可选地,不同关键词可以不同字号显示,其中更大字号代表关键词具有更大的如上所述的重要性分数。如更进一步示出的,该窗口可具有滚动条(或任何其他适当的用户界面控件),通过它用户可以选择用于显示关键词的重要性分数阈值;也就是说,当用户使用滚动条选择了一个阈值时,只有重要性分数大于该阈值的关键词才会显示在窗口中,而重要性分数小于该阈值的关键词将不会显示在窗口中。以这种方式,用户可以基于关键词的重要性方便地控制要显示的与电子文档相关的关键词的数量。用户可首先选择查看电子文档的最重要的关键词,然后逐渐地选择额外查看电子文档的越来越不重要的关键词,直到最后查看电子文档的所有的关键词。这样,关键词将获得一个额外的重要性维度。这就像关键词变成了三个维度的,其中二个维度在屏幕平面中,而另一个高度维度位于屏幕上方,且该高度维度实际上表示关键词的重要性分数。这也像对于一片水域中的具有不同高度的石块,当水面变得越来越低时,越来越多的石块显示出来,直到最终该水域中的所有石块都显示出来,从而呈现了石块影像景象的完整视图。
在本发明的一些其他实施例中,滚动条(或任何其他适当的用户界面控件)可被用于选择与关键词有关的重要性分数之外的其他统计值的阈值,以控制将显示在用户界面中的关键词的数量。这些其他统计值可以是例如关键词被不同用户访问、突显或注释的次数。可选地,这些其他统计值可以进一步地通过用户的社会声誉进行加权,如以下将描述的。因此,当用户使用滚动条选择一个阈值时,只有该其他统计值大于该阈值的关键词才会被显示在用户界面中。当然,在这样的实施例中,这些其他统计值应当已经事先与关键词相关联地存储在服务提供者平台113中,并可能与电子文档一起被发送到UE 101上的浏览器应用115。
在本发明的一些其他实施例中,滚动条(或任何其他适当的用户界面控件)可被用于控制电子文档中所有词的显示,而不是仅仅电子文档中的关键词。也就是说,当用户使用滚动条选择重要性分数或其他统计值的阈值时,电子文档中重要性分数或其他统计值大于该阈值的词可显示在用户界面中。当然,在这样的实施例中,电子文档中的所有词的重要性分数或其他统计值应当事先已经与词一起存储在服务者平台113,并可能与电子文档一起发送到UE 101上的浏览器应用115。
图4A-4D示意性和示例性地示出了调整阈值以显示电子文档中的不同数量的关键词(或词)。如图所示,从图4A到图4D,当使用滚动条使阈值变得越来越低时,越来越多的关键词(或词)被显示在用户界面中。
返回图3,在本发明的一些其他实施例中,显示在弹出窗口中的关键词可被配置为,当一个关键词被点击或敲击时,可弹出一个单独的窗口,其中列出了已突显或注释该关键词的所有用户的名称或ID。如本领域的技术人员所知的,仅作为示例,这一功能可通过以下方式实现:将关键词由浏览器应用103发送到服务器应用115,服务器应用115使用该关键词查询服务提供者平台113上的数据库(该数据库中相关联地存储有关键词以及关键词所提取自的电子文档、突显部分、其他部分或注释,以及用户名称或用户ID),以找到相应的用户ID或用户名称,然后由服务器应用115接收找到的用户ID或用户名称,并将用户ID或用户名称显示在单独的弹出窗口中。
在本发明的进一步的实施例中,显示在单独的弹出窗口中的用户名称或用户ID可被配置为:当一个用户名称或用户ID被点击或敲击时,可显示用户的声誉分数,用户做出的突显和注释,并可能在另一个弹出窗口中显示这些。图5示例性地示出了这样的另一个弹出窗口,其中显示了一个用户的声誉分数、由该用户做出的突显和注释的数量。用户的声誉分数反映了用户参与社交活动的程度,并且它可以各种方式来计算。例如,它可以被计算为用户做出的突显和注释的数量的和/或加权和。可选地,它也可以考虑用户做出的其他社交活动,例如由用户在诸如Facebook、Twitter和新浪微博等其他社交媒体上做出的喜好和分享等。在这样的实施例中,用户的声誉分数必须事先被计算并与用户ID或用户名称相关联地存储在服务提供者平台113中;并且当在单独的弹出窗口中点击或敲击用户名称或ID时,将用户名称或用户ID从浏览器应用103发送到服务器应用115,服务器应用113使用用户名称或用户ID找到用户的声誉分数,以及由用户做出的突显和注释,然后将它们发送回到浏览器应用103,以便显示在该另一个弹出窗口中。
如图5中所示,当显示在该另一个弹出窗口中的突显的数量或注释的数量被点击或敲击时,由该用户做出的所有突显段落或所有注释被显示,可能在进一步的弹出窗口中;并且可选地,可在该进一步的弹出窗口中提供到突显段落和注释的原始电子文档的链接。
尽管在以上描述的本发明的实施例中,关于由不同用户做出的电子文档的突显和/或注释的海量数据被用来向用户呈现电子文档的内容的丰富视图,在本发明的一些其他实施例中,该海量数据也可以被用来创建用户的用户简档,并可进一步用来向用户推荐电子文档。
在本发明的一些实施例中,从由用户做出的不同电子文档中的突显部分和/或注释中提取的关键词可被用来创建用户的用户简档。该用户简档可包括用户已注释和/或突显的关键词(即从由用户做出的与电子文档相关的突显部分和注释中提取的关键词),并可能包括由用户直接输入的关键词,从而返映了用户的偏好、兴趣、喜好等。所创造的不同用户的用户简档可与用户名称或用户ID相关联地被存储在服务提供者平台113中。用户简档可被用于各种目的。
在本发明的一些实施例中,包括由用户做出的突显的和/或注释的关键词的用户简档可被用来向用户推荐电子文档。具体地,对于用户的用户简档中的至少一个关键词(例如,每一个关键词),可基于该关键词在相应电子文档中的重要性分数(如上所述)计算对于电子文档库中的不同电子文档的推荐分数;然后,不同电子文档可根据其推荐分数被排序;最后,具有最高推荐分数的预定数量的电子文档可被推荐给用户。
在计算不同电子文档的推荐分数时,由贝叶斯推理启发,可使用以下公式:
对于给定第k个电子文档Dk和第i个关键词kwi,令
p(Dk|kwi)=p(kwi|Dk)*p(Dk)/p(kwi)   (1)
其中,p(Dk|kwi)是电子文档Dk对于关键词kwi的推荐分数,p(kwi|Dk)是关键词kwi在电子文档Dk中的重要性分数,p(Dk)是电子文档Dk在电子文档库中的电子文档中的出现频率,且p(kwi)是关键词kwi在电子文档库中的所有关键词中的出现频率,p(Dk)和p(kwi)可被表示为:
p ( D k ) = c o u n t ( D k ) Σ c o u n t ( D j ) - - - ( 2 )
p ( kw i ) = c o u n t ( kw i ) Σ c o u n t ( kw t ) - - - ( 3 )
其中,count(Dk)是Dk在电子文档库中的出现次数,∑count(Dj)是所有电子文档在电子文档库中的出现次数的和,count(kwi)是kwi在电子文档库中的出现次数,=且∑count(kwt)是所有关键词在电子文档库中的出现次数的和。
由于∑count(Dj)和∑count(kwt)被假设为对于所有电子文档和所有关键词是恒定的,它们的关系可被表示为::
∑count(kwt)=λ∑count(Dj)     (4)
其中,λ是归一化因子。
由等式(1)一(4),可以得出:
p(Dk|kwi)=p(kwi|Dk)*count(Dk)/count(kwi)·λ    (5)
因此,由等式(5),对于用户简档中的一个或多个关键词中的每一个,可计算对于电子文档库中的所有电子文档的推荐分数(由于λ对于所有电子文档和关键词是恒定的,且推荐分数仅用于排序,当计算推荐分数时,可从等式(5)中省略λ),然后可根据推荐分数对电子文档进行排序,并且对于每个关键词可选择具有最高推荐分数的预定数量的电子文档。对于不同关键词的具有最高推荐分数的预定数量的电子文档可简单地组合在一起,作为将向用户推荐并显示在用户的UE 101的用户界面中的一组电子文档;或者,可从对于不同关键词的具有最高推荐分数的预定数量的电子文档进一步确定电子文档的选定子集,例如,根据一个电子文档是否针对多于一个关键词在具有最高推荐分数的预定数量的电子文档中出现来进一步确定该子集。
以上参照附图1-5描述了根据本发明的实施例能够丰富社交媒体以改进个性化用户体验的系统,现参照图6,其示出了根据本发明的一些实施例的用于丰富社交媒体以改进个性化用户体验的装置600的框图。
如图所示,装置600可包括以下模块:接收模块601,其被配置为接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;
提取模块602,其被配置为从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及
提供模块603,其被配置为响应于用户对于电子文档的请求,将该电子文档与用户界面控件一起提供给用户,该用户界面控件被配置为使得用户能够选择呈现以下各项中的至少一个:由用户标记的电子文档的突显部分,由用户做出的电子文档中的注释,以及从电子文档提取的关键词。
根据本发明的实施例,所述接收模块601可进一步被配置为:接收由用户输入的关键词,作为相应的至少一个电子文档的附加标签。
根据本发明的实施例,所述提取模块602可包括:
计算子模块,其被配置为对于相应的至少一个电子文档中的电子文档,将具有突显和/或注释的该电子文档中的每个词的重要性分数计算为:相对于包括该词的各电子文档在电子文档库中的出现频率,该词在具有突显和/或注释的该电子文档中的出现频率;
识别子模块,其被配置为识别在具有突显和/或注释的该电子文档中具有最高重要性分数的预定数量的词,作为该电子文档的关键词;
其中,所述装置600还包括:
记录模块604,其被配置为将所提取的关键词及其重要性分数与相应的至少一个电子文档、关键词所提取自的相应的至少一个电子文档中的突显部分和/或注释、以及做出突显和/或注释的用户相关联地记录。
根据本发明的进一步的实施例,所述具有突显和/或注释的电子文档中的词的出现频率可包括该词在该电子文档的注释和/或突显部分以及其他部分中的出现频率的加权和。
根据本发明的实施例,所述提供模块603可被配置为:响应于用户对电子文档的请求,向用户提供与具有突显和/或注释的该电子文档相关联的用户界面控件,该用户界面控件被配置为使得用户能够选择阈值,从而只有具有突显和/或注释的电子文档的重要性分数高于阈值的关键词被呈现给用户。
根据本发明的进一步的实施例,所述装置600可进一步包括:
计算模块605,其被配置为:基于用户在相应的至少一个电子文档中做出的突显和/或注释计算相应用户的声誉分数;
其中,所述被呈现给用户的关键词被配置为:当这些关键词中的一个被用户点击或敲击时,呈现已突显或注释该关键词的所有用户的标识;以及
其中,所呈现的用户的标识被配置为:当所述用户的标识中的一个被点击或敲击时,呈现具有该标识的用户的声誉分数,以及到由具有该标识的用户做出的突显部分和/或注释的链接。
现参照图7,其示出了根据本发明的一些其他实施例的用于丰富社交媒体以改进个性化用户体验的装置700的框图。
如图所示,装置700可包括以下模块:
接收模块601,其被配置为接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;
提取模块602,其被配置为从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及
记录模块604,其被配置为将所提取的关键词及其重要性分数与相应的至少一个电子文档、关键词所提取自的相应的至少一个电子文档中的突显部分和/或注释、以及做出突显和/或注释的用户相关联地记录;
简档模块701,其被配置为创建用户简档,其包括来自由相应用户做出的至少一个电子文档中的突显部分和/或注释的提取的关键词;
以及推荐模块702,其包括:
计算子模块,其被配置为:对于该用户的用户简档中的至少一个关键词,基于相应的至少一个电子文档中的至少一个关键词的重要性分数计算对于该至少一个电子文档的推荐分数;
排序子模块,其被配置为根据相应的推荐分数对至少一个电子文档进行排序;以及
推荐子模块,其被配置为向用户推荐至少一个电子文档中具有最高推荐分数的预定数量的电子文档。
根据本发明的实施例,所述计算子模块可被进一步被配置为:对于该用户的用户简档中的关键词,将电子文档的推荐分数计算为:该电子文档中的该关键词的重要性分数与该电子文档在电子文档库中的出现次数的乘积,除以该关键词在电子文档库中的出现次数。
如由相同标号的使用所指示的,装置700中的接收模块601、提取模块602和记录模块604可以与装置600中的相应模块相同,执行相同的功能并在本发明的各实施例中具有相同变形,因此为简明起见,不在此重复。
如本领域的技术人员所知的,装置600和700可以在服务提供者平台、UE、代理服务器或任何其他装置中的任何一个或其组合中实现。并且,一般而言,它们可以在计算设备中实现,该计算设备包括至少一个处理器,以及包括计算机程序代码的至少一个存储器,所述至少一个存储器和计算机程序代码被配置为与处理器一起使得该计算装置执行装置600或700的功能,或者形成装置600或700的模块。还应注意的是,装置600和700的以上描述仅是示例性的,而不是对本发明的范围的限制。在本发明的其他实施例中,装置600和700可具有更多、更少或不同的模块,且这些模块之间的包含、连接和功能等关系可以与所描述和图示的不同。
现参照图8,其示出了根据本发明的一些实施例的用于丰富社交媒体以改进个性化用户体验的方法800的流程图。
如图所示,方法800可包括以下步骤:
在步骤801,可接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;
在步骤802,可从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及
在步骤805,响应于用户对于电子文档的请求,可将该电子文档与用户界面控件一起提供给用户,该用户界面控件被配置为使得用户能够选择呈现以下各项中的至少一个:由用户标记的电子文档的突显部分,由用户做出的电子文档中的注释,以及从电子文档提取的关键词。
在本发明的实施例中,步骤802可进一步包括以下子步骤:
对于相应的至少一个电子文档中的电子文档,将具有突显和/或注释的该电子文档中的每个词的重要性分数计算为:相对于包括该词的各电子文档在电子文档库中的出现频率,该词在具有突显和/或注释的该电子文档中的出现频率;
识别在具有突显和/或注释的该电子文档中具有最高重要性分数的预定数量的词,作为该电子文档的关键词;
其中,该方法还包括以下步骤:
在步骤803,可将所提取的关键词及其重要性分数与相应的至少一个电子文档、关键词所提取自的相应的至少一个电子文档中的突显部分和/或注释、以及做出突显和/或注释的用户相关联地记录。
在本发明的进一步的实施例中,所述词在具有突显和/或注释的该电子文档中的出现频率包括该词在该电子文档的注释和/或突显部分以及其他部分中的出现频率的加权和。
在本发明的实施例中,方法800可进一步包括:
在步骤805,响应于用户对电子文档的请求,向用户提供与具有突显和/或注释的该电子文档相关联的用户界面控件,该用户界面控件被配置为使得用户能够选择阈值,从而只有具有突显和/或注释的电子文档的重要性分数高于阈值的关键词被呈现给用户。
在本发明的实施例中,所述方法800可进一步包括以下步骤:
在步骤804,可基于用户在相应的至少一个电子文档中做出的突显和/或注释计算相应用户的声誉分数;
其中,所述被呈现给用户的关键词被配置为:当这些关键词中的一个被用户点击或敲击时,呈现已突显或注释该关键词的所有用户的标识;以及
其中,所呈现的用户的标识被配置为:当所述用户的标识中的一个被点击或敲击时,呈现具有该标识的用户的声誉分数,以及到由具有该标识的用户做出的突显部分和/或注释的链接。
现参照图9,其示出了根据本发明的另一些实施例的用于丰富社交媒体以改进个性化用户体验的方法900的流程图。
如图所示,方法900可包括如下步骤:
在步骤801,可接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;
在步骤802,可从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;
在步骤803,可将所提取的关键词及其重要性分数与相应的至少一个电子文档、关键词所提取自的相应的至少一个电子文档中的突显部分和/或注释、以及做出突显和/或注释的用户相关联地记录;
在步骤901,可创建用户简档,其包括来自由相应用户做出的至少一个电子文档中的突显部分和/或注释的提取的关键词;
在步骤902,对于该用户的用户简档中的至少一个关键词,可基于相应的至少一个电子文档中的至少一个关键词的重要性分数计算对于该至少一个电子文档的推荐分数;
在步骤903,可根据相应的推荐分数对至少一个电子文档进行排序;以及
在步骤904,向用户推荐至少一个电子文档中具有最高推荐分数的预定数量的电子文档。
在本发明的实施列中,步骤902可进一步包括:对于该用户的用户简档中的关键词,将对于电子文档的推荐分数计算为:该电子文档中的该关键词的重要性分数与该电子文档在电子文档库中的出现次数的乘积,除以该关键词在电子文档库中的出现次数。
如由相同标号的使用所指示的,方法900中的步骤801、802和803可以与方法800中的相应步骤相同,执行相同的功能并在本发明的各实施例中具有相同变形,因此为简明起见,不在此重复。
如本领域的技术人员所知的,方法800和900可以服务提供者平台、UE、代理服务器或任何其他装置中的任何一个或其组合中实现。并且,一般而言,它们可以在计算设备中实现,该计算设备包括至少一个处理器,以及包括计算机程序代码的至少一个存储器,所述至少一个存储器和计算机程序代码被配置为与处理器一起使得该计算装置执行方法800或900的步骤。还应注意的是,方法800和900的以上描述仅是示例性的,而不是对本发明的范围的限制。在本发明的其他实施例中,方法800和900可具有更多、更少或不同的步骤,且这些步骤之间的包含、顺序和功能等关系可以与所描述和图示的不同。
在本发明的一些其他实施例中,提供了一种计算机程序产品,其包括存储有计算机可执行程序代码指令的至少一个计算机可读存储介质,所述计算机可执行程序代码指令包括用于执行以下操作的程序代码指令:
接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;
从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及
使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该至少一个电子文档的个性化内容。
在本发明的一些其他实施例中,提供了一种用户界面,包括:
与具有突显和/或注释的电子文档相关联地呈现的用户界面控件,其中由具有突显和/或注释的电子文档提取的新名词和其重要性分数与电子文档相关联地被记录,所述用户界面控件被配置为使得用户能够选择阈值,从而只有具有突显和/或注释的电子文档中的具有大于阈值的重要性分数的关键词被呈现给用户。
在本发明的进一步的实施例中,所述呈现给用户的关键词被配置为:当这些关键词中的一个被用户点击或敲击时,呈现已突显或注释该关键词的所有用户的标识;以及
其中,所呈现的用户的标识被配置为:当所述用户的标识中的一个被点击或敲击时,呈现具有该标识的用户的声誉分数,以及到由具有该标识的用户做出的突显部分和/或注释的链接,所述声誉分数是基于用户在相应的至少一个电子文档中做出的突显和/或注释计算的。
在本发明的一些其他实施例中,提供了一种方法,包括以下步骤:
接收由用户在至少一个电子文档中做出的突显和/或注释;
从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为该相应的至少一个电子文档的标签;以及
创建用户简档,其包括从由用户做出的该至少一个电子文档中突显部分和/或注释提取的关键词。
一般而言,各示例性实施例可在硬件或专用电路、软件、逻辑或其任意组合中实现。例如,一些方面可在硬件中实现,而另一些方面可在固件或软件中实现,所述软件可以由控制器、微处理器或其他计算设备执行,尽管本发明不限于此。尽管本发明的各示例性实施例的各方面在这里可以框图、流程图来描述和图示,或使用其他图形表示来描述和图示,可理解这里描述的方框、装置、系统、技术或方法作为非限制性示例可以实现为硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备,或其某种组合。
图此,应理解本发明的示例性实施例的至少一些方面可以诸如集成电路芯片和模块的各种组件来实现。因此,应理解本发明的示例性实施例可在体现为集成电路的装置中实现,其中该集成电路可包括电路(以及可能的固件),其用于实现可被配置为根据本发明的示例性实施例操作的数据处理器、数字信号处理器、基带电路和射频电路中的一个或多个。
应理解,本发明的示例性实施例的至少一些方面可实现为计算机可执行指令,例如在一个或多个程序模块中,由一个或多个计算机或设备执行。一般而言,程序模块包括例程、程序、对象、组件、数据结构等,其在由计算机或其他设备中的处理器执行时执行特定任何或实现抽象数据类型。所述计算机可执行指令可存储在诸如硬盘、光盘、可移动存储介质、固态存储器、RAM等计算机可读介质中。如本领域的技术人员可理解的,程序模块的功能可在各种实施例中根据需要进行组合和分布。此外,所述功能可分部或部分地在固件或诸如集成电路、现场可编程门阵列(FPGA)等的硬件等价物中实现。
本发明包括这里显式地描述的任何创新性功能或其组合,以及其任何概括。对本发明的示例性实施例的各种修改和变形对于本领域的技术人员来说,当其参照附图阅读了以上描述后,是显而易见的。然而,任何及全部修改都将落入本发明的非限制性和示例性的实施例中。

Claims (22)

1.一种方法,包括:
接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;
从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及
使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该至少一个电子文档的个性化内容。
2.根据权利要求1的方法,进一步包括:
接收由至少一个用户输入的关键词,作为相应的至少一个电子文档的附加标签。
3.根据权利要求1的方法,其中所述从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签包括:
对于相应的至少一个电子文档中的电子文档,将具有突显和/或注释的该电子文档中的每个词的重要性分数计算为:相对于包括该词的各电子文档在电子文档库中的出现频率,该词在具有突显和/或注释的该电子文档中的出现频率;
识别在具有突显和/或注释的该电子文档中具有最高重要性分数的预定数量的词,作为该电子文档的关键词;
其中,该方法还包括:
将所提取的关键词及其重要性分数与相应的至少一个电子文档、关键词所提取自的相应的至少一个电子文档中的突显部分和/或注释、以及做出突显和/或注释的用户相关联地记录。
4.根据权利要求3的方法,其中,所述词在具有突显和/或注释的该电子文档中的出现频率包括该词在该电子文档的注释和/或突显部分以及其他部分中的出现频率的加权和。
5.根据权利要求1的方法,其中,所述使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该相应的至少一个电子文档的个性化内容包括:
响应于用户对于电子文档的请求,将该电子文档与用户界面控件一起提供给用户,该用户界面控件被配置为使得用户能够选择呈现以下各项中的至少一个:由用户标记的电子文档的突显部分,由用户做出的电子文档中的注释,以及从电子文档提取的关键词。
6.根据权利要求1的方法,其中,所述使用关键词作为至少一个电子文档的标签以向用户提供来自至少一个电子文档的个性化内容包括:
响应于用户对电子文档的请求,向用户提供与具有突显和/或注释的该电子文档相关联的用户界面控件,该用户界面控件被配置为使得用户能够选择阈值,从而只有具有突显和/或注释的电子文档的重要性分数高于阈值的关键词被呈现给用户。
7.根据权利要求6的方法,进一步包括:
基于用户在相应的至少一个电子文档中做出的突显和/或注释计算相应用户的声誉分数;
其中,所述被呈现给用户的关键词被配置为:当这些关键词中的一个被用户点击或敲击时,呈现已突显或注释该关键词的所有用户的标识;以及
其中,所呈现的用户的标识被配置为:当所述用户的标识中的一个被点击或敲击时,呈现具有该标识的用户的声誉分数,以及到由具有该标识的用户做出的突显部分和/或注释的链接。
8.根据权利要求1的方法,进一步包括:
创建用户简档,其包括来自由相应用户做出的至少一个电子文档中的突显部分和/或注释的提取的关键词;
其中,所述使用关键词作为至少一个电子文档的标签以向用户提供来自至少一个电子文档的个性化内容包括:
对于该用户的用户简档中的至少一个关键词,基于相应的至少一个电子文档中的至少一个关键词的重要性分数计算对于该至少一个电子文档的推荐分数;
根据相应的推荐分数对至少一个电子文档进行排序;以及
向用户推荐至少一个电子文档中具有最高推荐分数的预定数量的电子文档。
9.根据权利要求8的方法,其中,所述基于相应的至少一个电子文档中的至少一个关键词的重要性分数计算该至少一个电子文档的推荐分数包括:
对于该用户的用户简档中的关键词,将对于电子文档的推荐分数计算为:该电子文档中的该关键词的重要性分数与该电子文档在电子文档库中的出现次数的乘积,除以该关键词在电子文档库中的出现次数。
10.一种装置,包括:
至少一个处理器,以及
至少一个包括计算机程序代码的存储器,
所述至少一个存储器和计算机程序代码被配置为:与处理器一起,使得该装置至少执行以下操作:
接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;
从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及
使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该至少一个电子文档的个性化内容。
11.根据权利要求10的装置,其中,所述至少一个存储器和计算机程序代码进一步被配置为:与处理器一起,使得该装置至少执行以下操作:
接收由至少一个用户输入的关键词,作为相应的至少一个电子文档的附加标签。
12.根据权利要求10的装置,其中所述从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签包括:
对于相应的至少一个电子文档中的电子文档,将具有突显和/或注释的该电子文档中的每个词的重要性分数计算为:相对于包括该词的各电子文档在电子文档库中的出现频率,该词在具有突显和/或注释的该电子文档中的出现频率;
识别在具有突显和/或注释的该电子文档中具有最高重要性分数的预定数量的词,作为该电子文档的关键词;
其中,所述至少一个存储器和计算机程序代码进一步被配置为:与处理器一起,使得该装置至少执行以下操作:
将所提取的关键词及其重要性分数与相应的至少一个电子文档、关键词所提取自的相应的至少一个电子文档中的突显部分和/或注释、以及做出突显和/或注释的用户相关联地记录。
13.根据权利要求12的装置,其中,所述词在具有突显和/或注释的该电子文档中的出现频率包括该词在该电子文档的注释和/或突显部分以及其他部分中的出现频率的加权和。
14.根据权利要求10的装置,其中,所述使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该相应的至少一个电子文档的个性化内容包括:
响应于用户对于电子文档的请求,将该电子文档与用户界面控件一起提供给用户,该用户界面控件被配置为使得用户能够选择呈现以下各项中的至少一个:由用户标记的电子文档的突显部分,由用户做出的电子文档中的注释,以及从电子文档提取的关键词。
15.根据权利要求10的装置,其中,所述使用关键词作为至少一个电子文档的标签以向用户提供来自至少一个电子文档的个性化内容包括:
响应于用户对电子文档的请求,向用户提供与具有突显和/或注释的该电子文档相关联的用户界面控件,该用户界面控件被配置为使得用户能够选择阈值,从而只有具有突显和/或注释的电子文档的重要性分数高于阈值的关键词被呈现给用户。
16.根据权利要求15的装置,进一步包括:
基于用户在相应的至少一个电子文档中做出的突显和/或注释计算相应用户的声誉分数;
其中,所述被呈现给用户的关键词被配置为:当这些关键词中的一个被用户点击或敲击时,呈现已突显或注释该关键词的所有用户的标识;以及
其中,所呈现的用户的标识被配置为:当所述用户的标识中的一个被点击或敲击时,呈现具有该标识的用户的声誉分数,以及到由具有该标识的用户做出的突显部分和/或注释的链接。
17.根据权利要求10的装置,其中,所述至少一个存储器和计算机程序代码进一步被配置为:与处理器一起,使得该装置至少执行以下操作:
创建用户简档,其包括来自由相应用户做出的至少一个电子文档中的突显部分和/或注释的提取的关键词;
其中,所述使用关键词作为至少一个电子文档的标签以向用户提供来自至少一个电子文档的个性化内容包括:
对于该用户的用户简档中的至少一个关键词,基于相应的至少一个电子文档中的至少一个关键词的重要性分数计算对于该至少一个电子文档的推荐分数;
根据相应的推荐分数对至少一个电子文档进行排序;以及
向用户推荐至少一个电子文档中具有最高推荐分数的预定数量的电子文档。
18.根据权利要求17的装置,其中,所述基于相应的至少一个电子文档中的至少一个关键词的重要性分数计算该至少一个电子文档的推荐分数包括:
对于该用户的用户简档中的关键词,将对于电子文档的推荐分数计算为:该电子文档中的该关键词的重要性分数与该电子文档在电子文档库中的出现次数的乘积,除以该关键词在电子文档库中的出现次数。
19.一种计算机程序产品,其包括存储有计算机可执行程序代码指令的至少一个计算机可读存储介质,所述计算机可执行程序代码指令包括用于执行以下操作的程序代码指令:
接收由至少一个用户在至少一个电子文档中做出的突显和/或注释;
从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为相应的至少一个电子文档的标签;以及
使用关键词作为相应的至少一个电子文档的标签,以向用户提供来自该至少一个电子文档的个性化内容。
20.一种用户界面,包括:
与具有突显和/或注释的电子文档相关联地呈现的用户界面控件,其中由具有突显和/或注释的电子文档提取的新名词和其重要性分数与电子文档相关联地被记录,所述用户界面控件被配置为使得用户能够选择阈值,从而只有具有突显和/或注释的电子文档中的具有大于阈值的重要性分数的关键词被呈现给用户。
21.根据权利要求20的用户界面,其中,所述呈现给用户的关键词被配置为:当这些关键词中的一个被用户点击或敲击时,呈现已突显或注释该关键词的所有用户的标识;以及
其中,所呈现的用户的标识被配置为:当所述用户的标识中的一个被点击或敲击时,呈现具有该标识的用户的声誉分数,以及到由具有该标识的用户做出的突显部分和/或注释的链接,所述声誉分数是基于用户在相应的至少一个电子文档中做出的突显和/或注释计算的。
22.一种方法,包括:
接收由用户在至少一个电子文档中做出的突显和/或注释;
从具有突显和/或注释的相应的至少一个电子文档提取关键词,作为该相应的至少一个电子文档的标签;以及
创建用户简档,其包括从由用户做出的该至少一个电子文档中突显部分和/或注释提取的关键词。
CN201380070146.7A 2013-01-11 2013-01-11 用于丰富社交媒体以改进个性化用户体验的方法和装置 Pending CN104919457A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2013/070343 WO2014107874A1 (en) 2013-01-11 2013-01-11 Method and apparatus for enriching social media to improve personalized user experience

Publications (1)

Publication Number Publication Date
CN104919457A true CN104919457A (zh) 2015-09-16

Family

ID=51166502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380070146.7A Pending CN104919457A (zh) 2013-01-11 2013-01-11 用于丰富社交媒体以改进个性化用户体验的方法和装置

Country Status (5)

Country Link
US (1) US20150324342A1 (zh)
EP (1) EP2943897A4 (zh)
JP (1) JP6224731B2 (zh)
CN (1) CN104919457A (zh)
WO (1) WO2014107874A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107861927A (zh) * 2017-09-21 2018-03-30 广州视源电子科技股份有限公司 文档注释方法、装置、可读存储介质及计算机设备
CN111279300A (zh) * 2017-11-15 2020-06-12 华为技术有限公司 在多显示器环境中提供丰富的电子阅读体验

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5930229B2 (ja) * 2014-03-10 2016-06-08 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 電子文書の内容の把握を支援する装置及び方法
US10210218B2 (en) * 2015-06-16 2019-02-19 Salesforce.Com, Inc. Processing a file to generate a recommendation using a database system
US11164223B2 (en) 2015-09-04 2021-11-02 Walmart Apollo, Llc System and method for annotating reviews
US10140646B2 (en) * 2015-09-04 2018-11-27 Walmart Apollo, Llc System and method for analyzing features in product reviews and displaying the results
US10691893B2 (en) * 2016-02-29 2020-06-23 International Business Machines Corporation Interest highlight and recommendation based on interaction in long text reading
US10387568B1 (en) * 2016-09-19 2019-08-20 Amazon Technologies, Inc. Extracting keywords from a document
US10102196B2 (en) 2016-11-08 2018-10-16 Motorola Solutions, Inc. Expanding a selected area of text, associating a data label with the expanded area of text, and storing the expanded area of text and data label in a clipboard
US10360302B2 (en) * 2017-09-15 2019-07-23 International Business Machines Corporation Visual comparison of documents using latent semantic differences
CN108628981A (zh) * 2018-04-27 2018-10-09 四川斐讯信息技术有限公司 一种基于身体指标的文章推送方法及系统
CN108875014B (zh) * 2018-06-20 2021-11-02 大国创新智能科技(东莞)有限公司 基于大数据与人工智能的精准项目推荐方法和机器人系统
US10732789B1 (en) 2019-03-12 2020-08-04 Bottomline Technologies, Inc. Machine learning visualization
US11500940B2 (en) * 2020-08-13 2022-11-15 International Business Machines Corporation Expanding or abridging content based on user device activity
JP7445318B2 (ja) 2022-02-28 2024-03-07 ロゴスサイエンス株式会社 サービス提供システム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1934569A (zh) * 2004-03-15 2007-03-21 雅虎公司 集成有用户注释的搜索系统和方法
CN101739415A (zh) * 2008-11-25 2010-06-16 华中师范大学 一种面向浏览器的网页标注系统
US20120030553A1 (en) * 2008-06-13 2012-02-02 Scrible, Inc. Methods and systems for annotating web pages and managing annotations and annotated web pages
CN102414665A (zh) * 2009-04-30 2012-04-11 Tivo有限公司 具有基于团体的分级的分层标签

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141134A (ja) * 2001-11-07 2003-05-16 Hitachi Ltd テキストマイニング処理方法及びその実施装置
US8554601B1 (en) * 2003-08-22 2013-10-08 Amazon Technologies, Inc. Managing content based on reputation
US8788492B2 (en) * 2004-03-15 2014-07-22 Yahoo!, Inc. Search system and methods with integration of user annotations from a trust network
US20070118794A1 (en) * 2004-09-08 2007-05-24 Josef Hollander Shared annotation system and method
US20060253421A1 (en) * 2005-05-06 2006-11-09 Fang Chen Method and product for searching title metadata based on user preferences
WO2007002820A2 (en) * 2005-06-28 2007-01-04 Yahoo! Inc. Search engine with augmented relevance ranking by community participation
US7814099B2 (en) * 2006-01-31 2010-10-12 Louis S. Wang Method for ranking and sorting electronic documents in a search result list based on relevance
US7925993B2 (en) * 2006-03-30 2011-04-12 Amazon Technologies, Inc. Method and system for aggregating and presenting user highlighting of content
JP4616800B2 (ja) * 2006-06-26 2011-01-19 日本電信電話株式会社 情報表示装置,情報表示方法,その方法を実装したプログラム及びそのプログラムを記録した媒体
US7805431B2 (en) * 2006-06-30 2010-09-28 Amazon Technologies, Inc. System and method for generating a display of tags
US8595619B1 (en) * 2007-01-31 2013-11-26 Google Inc. In response to a search result query providing a snippet of a document including an element previously highlighted by a user
US8347206B2 (en) * 2007-03-15 2013-01-01 Microsoft Corporation Interactive image tagging
CN101334783A (zh) * 2008-05-20 2008-12-31 上海大学 基于语义矩阵的网络用户行为个性化的表达方法
US20100070845A1 (en) * 2008-09-17 2010-03-18 International Business Machines Corporation Shared web 2.0 annotations linked to content segments of web documents
US8346534B2 (en) * 2008-11-06 2013-01-01 University of North Texas System Method, system and apparatus for automatic keyword extraction
JP2010224622A (ja) * 2009-03-19 2010-10-07 Nomura Research Institute Ltd タグ付与方法およびタグ付与プログラム
JP2010224624A (ja) * 2009-03-19 2010-10-07 Nomura Research Institute Ltd 注目キーワード抽出方法および注目キーワード抽出プログラム
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
JP5545883B2 (ja) * 2011-05-16 2014-07-09 日本電信電話株式会社 推薦データ成形方法、推薦データ成形装置および推薦データ成形プログラム
US9116654B1 (en) * 2011-12-01 2015-08-25 Amazon Technologies, Inc. Controlling the rendering of supplemental content related to electronic books
US9201876B1 (en) * 2012-05-29 2015-12-01 Google Inc. Contextual weighting of words in a word grouping
US9111319B2 (en) * 2012-06-26 2015-08-18 Researchgate Gmbh System, computer program product and computer-implemented method for sharing academic user profiles and ranking academic users

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1934569A (zh) * 2004-03-15 2007-03-21 雅虎公司 集成有用户注释的搜索系统和方法
US20120030553A1 (en) * 2008-06-13 2012-02-02 Scrible, Inc. Methods and systems for annotating web pages and managing annotations and annotated web pages
CN101739415A (zh) * 2008-11-25 2010-06-16 华中师范大学 一种面向浏览器的网页标注系统
CN102414665A (zh) * 2009-04-30 2012-04-11 Tivo有限公司 具有基于团体的分级的分层标签

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107861927A (zh) * 2017-09-21 2018-03-30 广州视源电子科技股份有限公司 文档注释方法、装置、可读存储介质及计算机设备
CN111279300A (zh) * 2017-11-15 2020-06-12 华为技术有限公司 在多显示器环境中提供丰富的电子阅读体验

Also Published As

Publication number Publication date
US20150324342A1 (en) 2015-11-12
EP2943897A1 (en) 2015-11-18
WO2014107874A1 (en) 2014-07-17
JP2016510453A (ja) 2016-04-07
EP2943897A4 (en) 2016-08-24
JP6224731B2 (ja) 2017-11-01

Similar Documents

Publication Publication Date Title
CN104919457A (zh) 用于丰富社交媒体以改进个性化用户体验的方法和装置
US10235349B2 (en) Systems and methods for automated content generation
US20220188337A1 (en) Organizing survey text responses
US20180232362A1 (en) Method and system relating to sentiment analysis of electronic content
US10037538B2 (en) Selection and presentation of news stories identifying external content to social networking system users
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
US20170098165A1 (en) Method and Apparatus for Establishing and Using User Recommendation Model in Social Network
KR20160055930A (ko) 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법
US10402479B2 (en) Method, server, browser, and system for recommending text information
EP2747013A1 (en) System and Method for Analyzing Messages in a Network or Across Networks
US9710440B2 (en) Presenting fixed format documents in reflowed format
US20200125221A1 (en) Coalescing Notifications Associated with Interactive Digital Content
US20120296746A1 (en) Techniques to automatically search selected content
US20140379719A1 (en) System and method for tagging and searching documents
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
CN106250464A (zh) 排序模型的训练方法及装置
US20220121668A1 (en) Method for recommending document, electronic device and storage medium
US9331973B1 (en) Aggregating content associated with topics in a social network
US20150154287A1 (en) Method for providing recommend information for mobile terminal browser and system using the same
WO2017196407A1 (en) Forking digital content items between digital topical environments
CN104090757A (zh) 针对浏览器的富媒体信息展示方法
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
US20130185670A1 (en) Graphical view of social content streams
US9275476B1 (en) Multi-way and multi-thread conversation system
Liu et al. Analyzing and assessing reviews on JD. com

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150916