CN112585594A - 智能意外文档发现通知 - Google Patents

智能意外文档发现通知 Download PDF

Info

Publication number
CN112585594A
CN112585594A CN201880096801.9A CN201880096801A CN112585594A CN 112585594 A CN112585594 A CN 112585594A CN 201880096801 A CN201880096801 A CN 201880096801A CN 112585594 A CN112585594 A CN 112585594A
Authority
CN
China
Prior art keywords
documents
user
document
cloud
collaborators
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880096801.9A
Other languages
English (en)
Inventor
桑多尔·多恩布什
德瓦基·哈努曼特
迈克尔·科拉格罗索
迈克尔·普罗考皮奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN112585594A publication Critical patent/CN112585594A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/908Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/101Collaborative creation, e.g. joint development of products or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种将文档通知给基于云的内容管理平台的用户的方法包括标识第一文档集,其中第一文档集由基于云的内容管理平台托管并且不包括由用户最近打开的一个或多个文档;基于相应文档和用户的当前工作的文档集之间的话题性的重叠量、相应文档的查看事件的数量、以及与相应文档相关联的协作事件的数量标识来自用户的第一文档集中的一个或多个目标文档,其中用户的当前工作的文档集包括用户在最后预定时间段内经由基于云的内容管理平台访问的文档;以及提供由基于云的内容管理平台托管的用户的云存储的图形用户界面(GUI)以呈现给用户,该GUI标识一个或者多个目标文档。

Description

智能意外文档发现通知
技术领域
本公开的各方面和实施方式涉及基于云的内容管理平台,并且更具体地,涉及来自于基于云的内容管理平台的文档发现通知。
背景技术
基于云的内容管理平台提供了用于存储文档和编辑应用(例如,文字处理器、演示文稿和电子表格应用)以对文档进行协作编辑的云存储。因此,基于云的内容管理平台的用户能够通过网络协作以在云存储中创建和存储文档并且编辑文档、对文档进行评论或共享文档。用户将首先经由由基于云的内容管理平台提供的主屏幕访问与用户账户相关联的文档。从主屏幕,用户能够定位文档中的一个文档并访问所定位的文档。基于云的内容管理平台能够附加地提供一个或多个应用,诸如在线日历、电子邮件和信使应用。因此,用户能够为项目安排会议并通过电子邮件或即时消息彼此通信以促进在线协作。
发明内容
下文是本公开的简要综述以便提供对本公开的一些方面的基本理解。本综述不是本公开的广泛概述。它既不旨在标识本公开的关键或决定性要素,也不旨在刻划本公开的特定实施方式的任何范围或权利要求的任何范围。其唯一目的是以简化形式呈现本公开的一些概念作为稍后呈现的更详细描述的序言。
在一些实施方式中,公开了一种用于向基于云的内容管理平台的用户通知与所述用户相关联的电子文档的状态变化或在与所述用户相关联的电子文档中做出的评论的系统和方法。在实施方式中,确定与所述用户经由所述基于云的内容管理平台访问的文档相关联的评论集。所述评论集包括在最后预定时间段内由其他用户添加到每个文档的一个或多个评论。从所述评论集中选择一个或多个评论以通知所述用户。所述选择基于所述用户与和来自于所述评论集的每个评论相关联的评论话题的交互以及所述评论话题的特性。评论话题是包括第一评论和对所述第一评论答复而添加的第二评论的多个评论的群组。确定与所述一个或多个所选择的评论相关联的一个或多个文档。提供由所述基于云的内容管理平台托管的所述用户的云存储的图形用户界面(GUI)以用于呈现给所述用户。所述GUI标识所述一个或多个文档。对于每个所标识的文档,将相应所选择的评论与所标识的文档相关联。
当标识所述一个或多个电子文档和相应所选择的评论的所述GUI被呈现给所述用户时,所述用户可以经由所述GUI提供与在所述GUI中标识的文档和/或评论中的一个或多个有关的一个或多个输入,从而使所述用户与存储在所述基于云的内容管理平台中的所述文档之间能够进行持续的交互。
在一些其他实施方式中,公开了一种用于将文档通知给基于云的内容管理平台的系统和方法。标识第一文档集。所述第一文档集由所述基于云的内容管理平台托管并且不包括由所述用户最近打开的一个或多个文档。基于相应文档和用户的当前工作的文档集之间的话题性的重叠量、所述相应文档的查看事件的数量以及与所述相应文档相关联的协作事件的数量识别来自所述用户的第一文档集中的一个或多个目标文档。所述用户的当前工作的文档集包括所述用户在最后预定时间段内经由所述基于云的内容管理平台访问的文档。提供了由所述基于云的内容管理平台托管的所述用户的云存储的图形用户界面(GUI)以用于呈现给所述用户。所述GUI标识所述一个或多个目标文档。
本公开提供一种将文档通知给基于云的内容管理平台的用户的方法。所述方法可以包括由处理器标识第一文档集,其中所述第一文档集由所述基于云的内容管理平台托管并且不包括由所述用户最近打开的一个或多个文档。所述方法可以包括由所述处理器基于相应文档和用户的当前工作的文档集之间的话题性的重叠量、所述相应文档的查看事件的数量、以及与所述相应文档相关联的协作事件的数量标识来自所述用户的第一文档集中的一个或多个目标文档,其中所述用户的当前工作的文档集包括所述用户在最近预定时间段内经由所述基于云的内容管理平台访问的文档。所述方法可以包括由所述处理器提供由所述基于云的内容管理平台托管的所述用户的云存储的图形用户界面(GUI)以呈现给所述用户,所述GUI标识所述一个或多个目标文档。
标识所述第一文档集可以包括基于所述用户的一个或多个协作者的最近事件和指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的第二文档集;确定与所述用户的当前工作的文档集中的文档相关的第三文档集;通过组合所述第二文档集和所述第三文档集并且消除由所述用户最近打开的一个或多个文档来生成所述第一文档集。基于所述用户的一个或多个协作者的最近事件以及指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的所述第二文档集可以包括通过标识将查看事件、编辑事件或评论事件中的至少一个提供给在预定时间段内在所述基于云的内容管理平台中与所述用户共享的文档的所述基于云的内容管理平台的一个或者多个其他用户来确定所述一个或多个协作者;基于与所述基于云的内容管理平台相关联的社交网络中的每个协作者的重要性来确定该协作者的重要性权重;以及确定所述第二文档集,所述第二文档集包括具有所述一个或多个协作者的近期事件以及指配给所述一个或多个协作者的重要性权重的一个或多个文档。确定与所述用户的当前工作的文档集中的文档相关的所述第三文档集可以包括:标识所述用户的当前工作的文档集中的每个文档的关键文本;和确定包括具有所述关键文本的一个或者多个文档的所述第三文档集。所述第二文档集或所述第三文档集中的至少一个可以包括所述用户尚未访问的一个或多个文档。
生成所述第一文档集可以包括下述中的至少一个:消除所述用户尚未访问并且具有小于预定数量的一个或多个协作者的事件的一个或多个文档;和/或消除不可由经由所述基于云的内容管理平台执行的搜索发现的一个或多个文档。标识所述用户的所述一个或多个目标文档可以包括下述中的至少一个:确定与其他用户或所述一个或多个协作者的相应文档相关联的查看事件的数量;和/或鉴于所述用户与所述相应文档的交互事件的数量、所述一个或多个其他用户与所述相应文档的交互事件的数量以及所述用户执行所述相应文档中牵涉的一个或者多个其它用户的交互事件的可能性,确定协作事件的数量,其中交互事件是响应于另一用户的事件而生成的事件。标识所述用户的所述一个或多个目标文档可以包括:对于所述第一文档集中的每个文档,将所述相应文档和所述用户的当前工作的文档集之间的话题性的重叠量、所述相应文档的查看事件的数量以及与所述相应文档相关联的所述协作事件的数量作为输入应用于机器学习模型;以及从所述机器学习模型获得输出,所述输出指示所述用户对所述相应文档感兴趣的概率。
所述GUI可以包括一个或多个建议卡。每个建议卡可以标识相应的或每个目标文档。每个建议卡可以包括下述中的至少一个:标题信息,包括相应文档的文档类型和标题;所述相应文档的图像表示;动作按钮,提供对所述相应文档的访问;以及/或者原因文本,描述用于标识所述相应文档的原因。
当标识所述一个或多个电子文档和相应所选择的评论的所述GUI被呈现给所述用户时,所述用户可以经由所述GUI提供与所述GUI中标识的所述文档和/或评论中的一个或多个有关的一个或者多个输入。以这种方式,所述GUI可以使所述用户与存储在所述基于云的内容管理平台中的所述文档之间能够进行持续的交互。
本公开提供一种系统,所述系统包括存储器设备和可操作地耦合到所述存储器设备的处理设备。所述处理设备可以被配置成标识第一文档集,其中所述第一文档集由所述基于云的内容管理平台托管并且不包括由所述用户最近打开的一个或多个文档。所述处理设备可以被配置成基于相应文档与用户的当前工作的文档集之间的话题性重叠量、所述相应文档的查看事件的数量、以及与所述相应文档相关联的协作事件的数量标识来自所述用户的所述第一文档集中的一个或多个目标文档,其中所述用户的当前工作的文档集包括所述用户在最近预定时间段内经由所述基于云的内容管理平台访问的文档。所述处理设备可以被配置成由所述基于云的内容管理平台托管的所述用户的云存储的图形用户界面(GUI)以呈现给所述用户,所述GUI标识所述一个或多个目标文档。
所述处理设备可以被配置成使得,标识所述第一文档集,所述处理设备被配置成:基于所述用户的一个或多个协作者的最近事件和指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的第二文档集;确定与所述用户的当前工作的文档集中的文档相关的第三文档集;并且通过组合所述第二文档集和所述第三文档集并且消除由所述用户最近打开的一个或多个文档来生成所述第一文档集。
所述处理设备可以被配置成使得,基于所述用户的一个或多个协作者的最近事件以及指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的所述第二文档集,所述处理设备可以被配置成,通过标识将查看事件、编辑事件或评论事件中的至少一个提供给在预定时间段内在所述基于云的内容管理平台中与所述用户共享的文档的所述基于云的内容管理平台的一个或者多个其他用户来确定所述一个或多个协作者;基于与所述基于云的内容管理平台相关联的社交网络中的相应协作者的重要性来确定每个协作者的重要性权重;并且确定所述第二文档集,所述第二文档集包括具有所述一个或多个协作者的近期事件以及指配给所述一个或多个协作者的重要性权重的一个或多个文档。
所述处理设备可以被配置成使得,确定与所述用户的当前工作的文档集中的文档相关的所述第三文档集,所述处理设备可以被配置成,标识所述用户的当前工作的文档集中的每个文档的关键文本;并且确定包括具有所述关键文本的一个或者多个文档的所述第三文档集。所述处理设备可以被配置成使得,标识所述用户的所述一个或者多个目标文档,所述处理设备可以被配置成进行下述中的至少一个:确定与其他用户或所述一个或多个协作者的相应文档相关联的查看事件的数量;或鉴于所述用户与所述相应文档的交互事件的数量、所述一个或多个其他用户与所述相应文档的交互事件的数量以及所述用户执行所述相应文档中牵涉的一个或者多个其它用户的交互事件的可能性,确定所述协作事件的数量,其中交互事件是响应于另一用户的事件而生成的事件。
所述GUI可以包括一个或多个建议卡,每个建议卡可以标识每个或者相应的目标文档。每个建议卡可以包括下述中的至少一个:标题信息,包括相应文档的文档类型和标题;所述相应文档的图像表示;动作按钮,提供对所述相应文档的访问;以及/或者原因文本,描述用于标识所述相应文档的原因。
本公开提供了一种非暂时性计算机可读介质,所述非暂时性计算机可读介质存储指令,所述指令在被执行时,使处理设备:标识第一文档集,其中所述第一文档集由所述基于云的内容管理托管平台并且不包括由所述用户最近打开的一个或多个文档;基于相应文档和用户的当前工作的文档集之间的话题性的重叠量、所述相应文档的查看事件的数量以及与所述相应文档相关联的协作事件的数量来标识来自所述用户的所述第一文档集中的一个或多个目标文档,其中所述用户的当前工作的文档集包括所述用户在最后预定时间段内经由所述基于云的内容管理平台访问的文档;并且提供由所述基于云的内容管理平台托管的所述用户的云存储的图形用户界面(GUI)以呈现给所述用户,所述GUI标识所述一个或多个目标文档。
所述指令当被执行以标识所述第一文档集时可以使所述处理设备:基于所述用户的一个或多个协作者的最近事件和指配给所述一个或多个协作者的权重重要性确定与所述一个或多个协作者相关联的第二文档集;确定与所述用户的当前工作的文档集中的文档有关的第三文档集;并且通过组合所述第二文档集和所述第三文档集并且消除由所述用户最近打开的一个或多个文档来生成所述第一文档集。
所述指令在被执行时基于所述用户的一个或多个协作者的最近事件以及指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的所述第二文档集可以使所述处理装置:通过标识将查看事件、编辑事件或评论事件中的至少一个提供给在预定时间段内在所述基于云的内容管理平台中与所述用户共享的文档的所述基于云的内容管理平台的一个或多个其他用户来确定所述一个或多个协作者;基于与所述基于云的内容管理平台相关联的社交网络中的每个协作者的重要性来确定该协作者的重要性权重;以及确定所述第二文档集,所述第二文档集包括具有所述一个或者多个协作者的最近事件和指配给所述一个或者多个协作者的重要性权重的一个或者多个文档。
所述指令在被执行时,确定与所述用户的当前工作的文档集中的文档有关的所述第三文档集,使所述处理设备:标识所述用户的当前工作的文档集中的每个文档的关键文本;并且确定包括具有所述关键文本的一个或多个文档的所述第三文档集。
所述GUI可以包括一个或多个建议卡,每个建议卡标识相应目标文档或每个目标文档。每个建议卡可以包括下述中的至少一个:标题信息,包括相应文档的文档类型和标题;以及所述相应文档的图像表示;动作按钮,提供对所述相应文档的访问;以及/或者原因文本,描述用于标识所述相应文档的原因。
附图说明
从下面给出的详细描述以及从本公开的各方面和实施方式的附图,将更全面地理解本公开的方面和实施方式,然而,不应将本公开限于特定方面或实施方式,但仅用于解释和理解。
图1图示实现本公开的一些方面的系统架构的示例。
图2图示向用户通知电子文档和/或电子文档的事件或者其他状态变化的建议卡的示例用户界面。
图3图示根据本公开的一种实施方式的用于选择向基于云的内容管理平台的用户通知的文档的方法的各方面的流程图。
图4描绘根据本公开的一种实施方式的用于确定与所选择的一个或多个评论相关联的文档的方法的各方面的流程图。
图5描绘根据本公开的另一实施方式的用于为基于云的内容管理平台的用户预测文档的方法的各方面的流程图。
图6描绘根据本公开的一种实施方式的用于基于多个预测场景模型为用户预测文档的方法的各方面的流程图。
图7图示根据本公开的一种实施方式的用于选择文档以用于建议的方法的各方面的流程图。
图8描绘根据本公开的一个或多个方面进行操作的示例计算系统的框图。
具体实施方式
基于云的内容管理平台除了别的以外,可以为电子文档以及诸如文字处理器、演示文稿和电子表格应用的编辑应用提供云存储。用户可以登录基于云的内容管理平台,并且被呈现有基于云的内容管理平台的主屏幕。本文使用的主屏幕是指列出与用户账户相关联的被存储在云存储中的文档的图形用户界面(GUI)。本文使用的云存储是指与用户账户相关联的在线电子文档的储存库。此类文档可以包括由用户和/或用户为其成员的一个或多个组所拥有或所创建的文档、和/或与用户和/或一个或多个用户组共享的文档。用户可以从主屏幕选择文档并且使用由基于云的内容管理平台提供的编辑应用来访问文档。除了别的以外,如本文所使用的访问文档是指打开、查看、编辑文档或者向文档添加评论等。除了别的以外,这里使用的评论是指添加到文档的特定部分的帖子、与文档的一部分上的建议编辑关联地添加的帖子、或与文档的特定部分关联地向用户指配任务的帖子。
随着更多用户经由基于云的内容管理平台协作,存储在云存储中的文档的数目已指数地增长。因此,用户可能需要花费大量时间来从基于云的内容管理平台的主屏幕中定位并检索用户感兴趣的文档。此外,用户甚至可能忘记用户先前已打开或需要的文档,或者用户可能没有完全意识到用户可用的所有文档。这在协作工作系统中尤为严重,在协作工作系统中,多个用户可以潜在地创建、编辑、共享或评论文档,并且基于云的内容管理平台的文档数量可能非常庞大,以至于用户只意识到小比例的文档可用。
本公开的各方面和实施方式尤其通过预测与用户账户相关联的文档当中的用户可能感兴趣的文档来解决上述缺陷。与用户账户相关联的文档是指可以由用户访问和/或查看的文档。本公开的预测技术可以预测由于最近添加到评论话题的评论而可能引起用户感兴趣的包含评论话题的文档。预测技术可能会考虑用户与评论话题的交互以及评论话题的特征。而且,本公开的预测技术可以预测意外文档。如本文所使用的意外文档是指用户最近未访问或查看过(即,用户可能不知道(例如,因为用户之前未访问过该文档))或不再记得这样的文档(例如,因为已经比自从用户上次与该文档交互以来的已确定或预定的时间段长)并且用户可能会感兴趣的文档。意外文档也可以称为目标文档。为了预测目标或意外文档,预测技术可以考虑文档与用户正在工作的文档的相关水平、文档在其他用户当中的流行水平和/或涉及文档的协作水平。除了别的之外,可以使用启发式方法或机器学习方法来实现预测技术。
本公开的各方面和实施方式还通过利用GUI组件向用户通知预测文档来解决上述缺陷,该GUI组件解释通知的原因并提供对文档的快速访问。本公开的通知技术可以生产每个预测文档的建议卡(呈现关于相应文档的信息的GUI组件)。通知技术可能涉及提取预测原因并将该原因插入建议卡中。另外,通知技术可以为用户提供用于快速访问文档的用户界面组件,诸如智能按钮。
因此,本公开的各方面和实施方式给用户提供对用户可能感兴趣的文档的快速访问。结果,消除了对费时搜索的需求,从而减少用于搜索的处理和网络资源。
可以通过本公开的各方面和实施方式解决的技术问题是用户通过计算机网络经由基于云的内容管理平台可访问的文档的数目的持续增长已使定位并检索文档的过程变得更加资源密集。例如,在云存储中定位特定文档可能涉及用户人工地审阅文档的大型语料库直到找到所期望的文档为止。这可能导致网络资源和处理资源的低效使用。例如,网络资源可以通过将语料库中的每个文档从云存储转移到用户设备而被消耗,随之处理资源可以通过在用户设备处打开每个文档以允许由用户进行人工审阅而被消耗。这在移动用户设备具有受限网络资源和/或处理资源的情况下可能是一个特别问题。
另一个技术问题是文档的内容不是固定的,而是能够随着时间变化的,使得用户即使意识到特定文档的存在,他们也不能确信文档包含什么,以及文档的内容是否可能是用户感兴趣的。即使用户先前已访问了文档,他们也不知道文档的当前内容是否与当他们上次访问文档时的内容相同。这意味着用户可能必须检索并访问文档以便查看自他们上次访问文档以来文档的内容是否已被修改并且用户是否仍然对当前内容感兴趣,而且这再次需要使用网络资源和处理资源(如果例如自用户上次访问文档以来文档中没有显著变化则浪费了网络资源和处理资源)。
为了解决以上标识的技术问题,本公开的各方面和实施方式可以通知用户有关用户可能感兴趣的文档,而不需要用户的明确动作。这可能会显著地减少从云存储中定位和检索文档所需的网络资源和处理资源。而且,这可以向用户提供关于例如存储在云存储中的电子文档的状态和/或关于状态变化的通知。替代地或附加地,本公开的各方面和实施方式可以提供有限数量的通知(即,建议卡),从而减少发送通知时所需的网络资源和处理资源的数量。替代地或另外,本公开的各方面和实施方式可以允许用户更容易和可靠地定位感兴趣的特定文档,从而显著地减少在从基于云的存储检索文档时所需的网络带宽和处理资源。
本公开的各方面和实施方式可以仅在预测文档可能是用户感兴趣的程度上向用户通知有关文档的信息。至少与其中向用户通知每个文档事件的情况相比,这可以减少发送通知所需的资源,并且可以导致更加用户友好或较少干扰的用户界面。
因此,本公开的各方面和实施方式减少或节省文档搜索所需的计算资源和网络带宽,同时向用户提供比常规搜索引擎能够提供的文档范围更广的文档。
图1图示实现本公开的一些方面的系统架构100的示例。
系统架构100包括经由网络130连接到用户设备120A-120Z的基于云的环境110。基于云的环境110是指托管经由网络130向多个用户设备120A-120Z提供一个或多个服务(例如,内容管理)的应用的物理机器的合集。网络130可以是公用网络(例如,因特网)、专用网络(例如,局域网(LAN)或广域网(WAN))或它们的组合。网络130可以包括无线基础设施,该无线基础设施可以由诸如与网络130连接的无线保真(WiFi)热点和/或能够使用各种数据处理装备、通信塔等来实现的无线载波系统的一个或多个无线通信系统来提供。附加地或替选地,网络130可以包括有线基础设施(例如,以太网)。
基于云的环境110可以包括服务器112和数据存储114。数据存储114可以与服务器112分离并通信地耦合到服务器112,或者数据存储114可以是服务器112的一部分。在一些实施方式中,数据存储114可以作为用户设备120A-120Z的一部分被包括。数据存储114可以包括用于为每个用户存储文档的云存储。数据存储114可以存储与存储在云存储中的文档相关联的元数据。这种元数据可以包括用户的访问控制列表(例如,创建者或拥有者是谁、谁能够查看和编辑、已经与谁共享了文档)、以及与文档相关联的事件。本文使用的事件是指访问文档而引发的用户活动(例如,打开事件、查看事件、编辑事件或评论事件)。对于每个事件,数据存储114可以存储与事件相关联的元数据,诸如事件的类型、事件的创建者、内容和时间戳。对于评论事件,数据存储器114可以另外存储关于相关联的评论话题的信息。评论话题是一组多个评论,其具有第一评论和作为第一评论的回复而添加的第二评论。这样的信息的一些示例包括话题中的评论的数量、与评论话题中的每个评论相关联的用户、评论话题的状态(例如,打开、关闭、如果打开、打开了多长时间)以及在评论话题中的评论之间的关系(例如,哪个评论是开始该评论话题的初始评论和哪个评论是对该评论的回复)。数据存储114还可以存储预测场景模型及其输出,如在下面关于预测引擎116详细解释的。
服务器112可以包括物理机器(例如,服务器机器、台式计算机等),这些物理机器包括通信地耦合到存储器设备和输入/输出(I/O)设备的一个或多个处理设备。服务器112可以托管基于云的内容管理平台115并且可以包括一个或多个处理设备。在可替代实施方式中,基于云的内容管理平台115可以由用户设备120A-120Z托管(例如,作为独立应用)并且在对等环境中作为对等体来操作。在其它可替代实施方式中,用户设备120A-120Z上的应用可以与基于云的内容管理平台115交互并且可以执行内容管理平台115的功能性中的一些。
基于云的内容管理平台115可以使用户能够访问文档并查看基于云的内容管理平台的主屏幕用户界面(UI)作为相应的UI 124A-124Z。另外,在一些实施例中,基于云的内容管理平台115可以提供UI124A-124Z,其包括建议卡200以向用户通知用户感兴趣的文档。基于云的内容管理平台115可以进一步提供建议卡200,以使用户能够快速访问文档或在没有打开文档的情况下对文档执行动作。
在实施方式中,基于云的内容管理平台115的UI 124A-124Z可以是由web浏览器渲染并且在用户设备120A-120Z上显示在web浏览器窗口中的网页。在另一实施方式中,UI124A-124Z可以由移动应用或桌面应用提供。例如,UI 124A-124Z可以由在用户设备120A-120Z上执行的本机应用显示。本机应用可以与web浏览器分离。
服务器112包括预测引擎116,以预测要向用户建议的文档并向用户通知这些文档。在实施方式中,预测引擎116可以使用预测场景模型来确定要建议给用户的文档。预测引擎116可以采用启发式方法或机器学习方法来实现预测场景模型,如关于图3至图5详细讨论的。
预测场景模型可以是用于预测用户可能有兴趣的被通知的文档或事件的模型。预测引擎116可以在预测应该向用户通知哪个文档或事件时利用多个预测场景模型。预测场景模型的一些示例可能与常规、目标或意外文档发现和/或评论有关。每个预测场景模型可以定制于特定场景。例如,基于常规文档发现的预测场景模型可以被设计为在用户经由基于云的内容管理平台115例行访问文档的场景下预测文档。在这种情况下,预测引擎116可以获得来自于基于常规文档发现的预测方案模型的输出,与用户不经常访问和最近访问的其他文档相比,用户经常访问和最近访问的文档具有更高的概率。基于目标或意外发现的预测场景模型可以在用户没有意识到或忘记了可能对用户有帮助的文档(即,目标或意外文档)的场景下操作,因为存在经由基于云的内容管理平台115可用的太多文档。可能对用户有帮助的文档可能包括与用户当前正在工作的文档有关、用户的协作者最近在工作以及在其他用户中很流行的文档。下面关于图5进一步描述预测引擎116基于目标或意外发现的预测场景模型的使用。
另外,基于评论的预测场景模型可以在用户与来自特定评论话题(例如,用户积极牵涉的评论话题(例如,用户创建的评论话题、或者用户已经订阅回复)、其中牵涉许多用户的评论话题)的评论交互的场景下操作。下面相对于图3至图4进一步描述预测引擎116基于评论的对此预测场景模型的使用。另外,可能存在针对用户对提及该用户或来自该用户频繁地与其交互的其他用户的电子邮件、聊天或日历事件做出响应的场景的预测场景模型。在这样的场景下,预测场景模型可以使与用户频繁地与其交互的其他用户的会议的日历事件排名高于对基于云的内容管理平台115的普通用户开放的其他日历事件。
预测引擎116可以将输入数据提供给预测场景模型并从该模型获得输出数据。输入数据可以在预测场景模型当中变化,如关于图3至图5进一步描述的。如将在下面更详细地讨论的,预测场景模型的输入可以是来自与文档相关联的各种信号的数据,这些信号表示该模型所基于的特定场景。预测场景模型的输出数据可以是预测场景得分,该预测场景得分表示用户根据相应场景对文档感兴趣的概率。如果建议,则预测方案得分也可以表示用户可能与文档如何进行交互。在使用多个预测场景模型的情况下,预测引擎116可以从每个模型获得预测场景得分,并且基于来自如下面相对于图7所详细描述的不同类型的预测场景模型的预测得分来确定总体文档得分。预测引擎116然后可以使用总体文档得分以确定用于通知的一个或多个文档。
在一些实施方式中,预测引擎116可以基于总体文档得分和/或预测得分生成针对通知被选择的每个文档的建议卡(例如,参见图2)。该建议卡可以包括描述用于向用户通知文档的原因的原因文本209以及使用户能够快速访问文档的一个或多个智能按钮210(210A,210B)。
用户设备120A-120Z可以包括通信地耦合到存储器设备和I/O设备的一个或多个处理设备。用户设备120A-120Z可以是台式计算机、膝上型计算机、平板计算机、移动电话(例如,智能电话)或任何合适的计算设备。如在上面所讨论的,用户设备120A-120Z可以均包括web浏览器和/或客户端应用(例如,移动应用或桌面应用)。用户可以使用基于云的内容管理平台115经由web浏览器或客户端应用查看建议卡200或云存储的包括建议卡200的主屏幕。例如,一旦用户登录到云存储,就可以向用户呈现建议卡200,以在主屏幕上进行通知。用户可以选择建议卡200以访问由建议卡200表示的文档,或者选择智能按钮(例如,图2的210A或210B)以在没有打开文档的情况下直接从建议卡200响应与文档相关联的事件。这样,与用户相关联的用户设备120A可以发送显示建议卡200的请求并传送用户选择。通常,在适当的情况下,在一种实施方式中描述为由基于云的内容管理平台115和/或预测引擎116执行的功能也可以在其他实施方式中在用户设备120A至120Z上执行。另外,归因于特定组件的功能性可以通过一起操作的不同或多个组件来执行。
图2图示呈现建议卡200以向用户通知电子文档和/或存储在用户的云存储中的电子文档的事件和/或其他状态变化的用户界面的示例。云存储由基于云的内容管理平台115托管。在一种实施方式中,建议卡200可以作为基于云的内容管理平台的主屏幕的一部分呈现给用户。在用户成功登录到基于云的内容管理平台115的云存储之后,可以向用户提供这样的主屏幕。
在一些实施方式中,除了诸如列表或表格的其他可能形式之外,建议卡200可以采用卡的形式(即,类似于卡的盒子),如图2中所示。建议卡200表示文档以及与该文档相关联的事件。预测引擎116可以构建建议卡200,以通知用户关于被预测为用户感兴趣的文档的建议。建议卡200可以允许用户快速访问建议卡200中表示的文档。在其他实施方式中,预测引擎116可以组成建议卡200以通知用户以及使用户能够响应由建议卡200表示的事件。当预测引擎116使用一个预测场景模型时,预测引擎116可以选择具有最高预测场景得分的文档来生成建议卡200。在预测引擎116使用多个预测场景模型的情况下,预测引擎116可以基于总体文档得分来确定要通知用户哪些文档,使用例如关于图7中所示和所描述的方法确定该总体文档得分,其并入文档的所有可用预测方案得分的。预测引擎116可以限制要呈现给用户的建议卡200的数量。在实施方式中,预测引擎116可以约束基于特定类型的预测场景模型的建议卡200的数量和位置。例如,预测引擎116可以基于目标或意外发现从预测场景模型中获取最多一个文档,并将此类文档仅放置在第三位置之后。预测引擎116还可以并入时间上的多样性(例如,示出一些文档现在要打开,而一些文档在呈现建议卡时要在接下来的几个小时内打开)。下面参考图3至图7描述用于选择文档以向用户建议或通知的方法的各种实施方式的详细说明。如图2中所图示,建议卡200包括多个部分,诸如文档信息部分202、文档缩略图部分204和事件部分206。
文档信息部分202可以包括关于文档的信息,诸如文档的标题、文档的类型(例如,word、电子表格、演示幻灯片)以及溢出菜单选项(例如,垂直定向的椭圆形)。这样的文档信息可以被表示为图标或文本。当用户选择溢出菜单选项(诸如用于共享文档、将文档添加到收藏夹、在用户的云存储中定位文档以及移除建议卡200的选项)时,预测引擎116可以呈现更多选项。文档缩略图部分204可以包括文档的特定部分的缩略图。预测引擎116可以选择与建议卡200的事件相关联的部分。例如,当事件是评论事件时,预测引擎116可以采用添加了评论事件的段落的片段。在另一实施方式中,在没有对文档的一部分的任何引用的情况下,缩略图可以是文档的第一页的图像或者是示出文档的类型和文档的标题的默认图像。在一些实施方式中,预测引擎116可以响应于用户对文档缩略图部分204的选择来打开文档。
事件部分206可以包括事件的细节。在一些实施方式中,预测引擎116可以添加与事件相关联的其他用户的信息(例如,姓名和简档图片)、事件的内容以及描述通知用户事件和/或文档的原因的原因文本。例如,在图2中,事件部分206包括简档图片和创建评论事件以及评论事件的内容-“This is looking good+SimonSmith,could you take a lookat this when you have a minute?(这看起来很好,+SimonSmith,你有时间你能看一下这个吗?)”的姓名“Ben DuPree”。在姓名“Ben DuPree”的下面,事件部分206进一步包括原因文本(“Suggested because you created the comment thread of this comment(因为您创建该评论的评论话题所以建议)”)209以及评论事件的时间戳。
在实施方式中,预测引擎116可以基于用作对预测场景模型的输入的数据来确定事件和原因文本,该数据对模型的输出(即,预测场景得分)贡献最大。例如,预测引擎116可以基于评论来使用预测场景模型,该评论采用指定用户是否已经创建与评论事件相关联的评论话题的数据。然后,预测引擎116可以基于来自评论的信息来组成事件部分206。此外,如果预测引擎116确定该标准的得分是其他标准中得分最高的,则预测引擎116可以撰写原因文本,诸如“Suggested because you created the comment thread of this comment”以解释通知用户有关评论事件的理由。在另一个示例中,预测引擎116可以基于目标或意外发现来使用预测方案模型,该目标或意外发现利用指定文档的话题性和用户当前工作的文档集重叠量的数据。话题性的重叠可以表示文档与用户当前正在工作的文档集如何相关的度量或相似度得分,并且可以例如根据预定义的一组准则(诸如重叠水平、存储的数据库中标识为与公共字段或话题相关的单词或短语的发生率、Jaccard相似度、余弦距离、欧几里得距离等)来确定。
如果预测引擎116确定来自该准则的得分是其他准则中得分最高的,则预测引擎116可以撰写原因文本,诸如“Suggested based on documents for Project X(基于针对项目X的文档进行建议)”。在另一实施方式中,预测引擎116可以基于文档的最新事件来撰写原因文本。例如,如果与文档相关联的最新事件是已经附有文档的日历事件,则预测引擎116可以将作为日历文本的安排的会议时间的“12:30pm today(今天的12:30pm)”作为原因文本。
预测引擎116可以基于使文档被选择以进行通知的预测场景模型来确定原因文本。在实施方式中,当预测引擎116使用多个预测场景模型并且文档具有来自图7的高总体文档得分并且从特定预测场境模型对总体文档得分的贡献最大时,则预测引擎116可以在诸如“Suggested based on a serendipitous discovery(基于意外发现而建议)”的原因文本中提及对特定预测方案模型的描述,。
事件部分206可以进一步包括一个或多个智能按钮210(210A,210B),以使用户能够快速访问文档或响应经由建议卡200向用户建议的事件。在实施方式中,预测引擎116可以在事件部分206中包括打开按钮(使用户能够打开文档)或预览按钮(使用户能够预览文档而无需使用基于云的内容管理平台115的应用打开文档)。预测引擎116还可以响应于检测到对建议卡200的任何部分的用户选择(例如,双击)使用户能够打开建议卡200的文档。在另一种实施方式中,预测引擎116可以基于建议卡200中包括的事件的类型来选择一个或多个智能按钮210(210A,210B)。例如,如果经由建议卡200通知用户的事件是评论事件,则预测引擎116可以选择回复智能按钮210A或解决智能按钮210B。预测引擎116可以使用户能够直接回复建议卡200内的评论事件,而无需经由回复智能按钮210A打开文档。在实施方式中,响应于预测引擎116检测到用户对回复智能按钮210A的选择,预测引擎116可以在建议卡200内提供文本框以供用户键入回复的内容并且提供添加按钮以将回复内容添加到相应评论话题。
另外,预测引擎116可以使用户能够关闭来自建议卡200的评论话题,而无需用户打开文档。在另一示例中,如果经由建议卡200向用户通知电子邮件或聊天事件,则预测引擎116可以包括回复按钮和定位项目按钮。定位项目按钮可以使用户能够找到通过呈现突出显示电子邮件的收件箱或突出显示聊天消息的聊天窗口正被通知用户的电子邮件或聊天消息。因此,预测引擎116可以生成任何其他智能按钮,该智能按钮提供用户对事件部分206中描述的事件进行的响应的快捷方式。在一些实施方式中,预测引擎116可以限制特定类型(210A,210B)的智能按钮210的数量(例如,最多一个日历事件动作可以被包括在要呈现的最后一组建议卡中)。
图3图示根据本公开的一种实施方式的用于预测或选择用于通知基于云的内容管理平台115的用户的文档的方法300的各方面的流程图。
方法300可以由图1的预测引擎116执行。在另一实施方式中,方法300可以由由用户设备120的一个或多个处理设备执行的客户端应用执行。可以为基于云的内容管理平台115的每个用户执行方法300。此外,当用户经由基于云的内容管理平台115请求服务器112访问用户的云存储或主屏幕时,可以执行方法300。在一些实施方式中,可以执行方法300以通过使用基于评论的预测场景模型经由基于云的内容管理平台115向用户通知在与用户相关联的文档中做出的评论。
为了简化说明,方法在本文中被描绘和描述为一系列动作。然而,根据本公开的动作可以以各种次序发生和/或同时发生,并且同时在本文中未呈现和描述其它动作。此外,可能不要求所有示出的动作来实现根据所公开的主题的方法。此外,本领域的技术人员应当理解和领会的是,这些方法能可替选地经由状态图或事件被表示为一系列相关状态。附加地,应当理解的是,本说明书中公开的方法能够被存储在制品上以促进将此类方法输送并转移到计算设备。如本文中所使用的术语“制品”旨在涵盖可从任何计算机可读设备或存储介质访问的计算机程序。
在框302处,预测引擎116可以确定与用户经由基于云的内容管理平台115访问的文档相关联的评论集。预测引擎116可以将已与用户共享的文档或由用户创建的文档标识为用户有权访问的文档。为了标识这样的文档,预测引擎116可以查询文档的访问控制列表,其将用户列为创建者、查看者、编辑者或订户(即,与文档共享的用户)。根据所标识的文档,预测引擎116可以确定其他用户添加到每个文档的评论。对于每个评论,预测引擎116可以确定与相应文档有关的信息,诸如时间戳和创建相应评论的用户。然后,预测引擎116可以编译评论集,该评论集包括由其他用户添加到该用户在最近预定时间段内访问的文档的评论(即,最近评论)。例如,用户可能使用基于云的内容管理平台115正在工作于多个项目并经由文档进行协作。在这种情况下,当用户经由基于云的内容管理平台115登录云存储时,预测引擎116可以确定用户已访问的文档(例如,用户正在工作的文档)。然后,预测引擎116可以标识协作者对文档做出的评论,并且在那些评论之中,确定在最近两天内做出的评论。这样,预测引擎116可以确定用户可能会对响应感兴趣的评论的候选。
在框304处,预测引擎116可以基于与所考虑的相应评论所属的评论话题有关的信息从在框302处确定的评论集中选择一个或多个评论以通知用户。评论话题是多个评论的群组,其具有第一评论和对第一评论的答复而添加的第二评论。预测引擎116可以基于用户与和每个评论相关联的评论话题的交互从集合中选择评论。在一个实施方式中,预测引擎116可以为来自框302的评论集中的每个评论标识与相应评论相关联的评论话题。然后,预测引擎116可以确定用户与评论话题的交互,以便选择要通知用户的评论。例如,在一些实施方式中,预测引擎116可以确定用户是否已经在评论话题中添加初始评论(即,开始评论话题的评论)。预测引擎116还可以确定用户是否已将任何评论添加到评论话题作为对评论话题中的初始评论或在评论话题中的任何其他评论的回复。
在框304处,预测引擎116可以进一步基于与每个评论相关联的评论话题的特性来执行用于通知的评论的选择。评论话题的特性可以以各种方式来测量。评论话题的特性的一些示例是评论话题的状态(评论话题是打开还是关闭)、评论话题中包括的评论的数量、评论话题中牵涉的不同用户的数量、用户添加或关闭的评论话题中的评论的比例、其他用户添加的评论话题中的评论的比例以及评论话题保持打开的时间段的长度。
预测引擎116可以进一步基于指配给添加或生成评论的每个用户(即,任何其他用户)的重要性权重来执行在304选择评论以用于通知。预测引擎116可以基于与基于云的内容管理平台115相关联的社交网络中的相应用户的重要性来确定重要性权重。除了别的之外,社交网络的一些示例可以是基于云的内容管理平台115的用户的组织图(即,与图表中较高位置相关联的较高的用户权重)、基于来自用户响应历史的频率和新近度的协作者图(即,对更频繁的协作者的权重较高)、包括其他用户(即,对具有更高亲和力得分的用户的权重较高)的亲和力得分(例如,基于亲和力的相似度度量)的亲和度图和声誉图(即,对更受欢迎的用户的权重较高)。
在框304处选择评论时,预测引擎116可以基于用户与评论话题的交互以及评论话题的特性来确定来自框302的集合中的每个评论的评论得分。在另一实施方式中,预测引擎116可以进一步为添加相应评论的每个用户并入重要性权重。评论得分可以指示用户对相应评论或包含相应评论的文档感兴趣的概率。预测引擎116可以基于评论得分来选择一个或多个评论以用于通知。预测引擎116可以基于评论使用预测场景模型来确定评论得分。预测引擎116可以采用启发式方法或机器学习方法来构建预测场景模型。在启发式方法中,预测引擎116可以将加权和应用于预测场景模型,并将加权和进一步归一化为介于0和1之间。预测引擎116可以为每个准则指配介于0和1之间的权重和数值,其表示用户与评论话题的交互和评论话题的特性。预测引擎116可以更新指配的权重和数值以更好地反映用户的兴趣。
在机器学习方法中,预测引擎116可以训练机器学习模型。在下文中,基于评论的预测场景模型也可以称为机器学习模型。预测引擎116可以包括能够训练预测场景模型的训练引擎。预测场景模型可以是与由训练引擎使用训练数据创建的模型人工制品相对应的机器学习模型,该训练数据包括训练输入和对应的目标输出(即,针对相应训练输入的正确答案)。在一些实施方式中,预测引擎116可以生成训练数据,该训练数据包括一个或多个训练输入和一个或多个目标输出。针对其他用户添加到牵涉到用户的文档的评论,训练输入可以包括指示用户与评论话题的交互以及评论话题的特性的数据。在另一种实施方式中,目标输入可以另外包括指示添加评论的其他用户的重要性权重的数据。目标输出可以包括响应,诸如对评论的回复、关闭相应评论所属的评论话题、接受或拒绝与评论相关联的建议编辑、将评论中指配的待办任务标记为用户已完成、或者没有响应。在另一个实施方式中,训练数据可能不特定于特定用户,而是特定于基于云的内容管理平台115的各种用户。
训练引擎可以在训练数据中找到将训练输入映射到目标输出(即,要预测的答案)的模式,并提供捕获这些模式的机器学习模型。机器学习模型可以由例如单个级别的线性或非线性运算(例如,支持向量机[SVM])组成,或者可以是深度网络(即,由多个级别的非线性操作组成的机器学习模型)。深度网络的示例是具有一个或多个隐藏层的神经网络,并且这种机器学习模型可以通过例如根据反向传播学习算法等调整神经网络的权重来训练。为了方便起见,尽管一些实施方式可能采用SVM或其他类型的学习机代替神经网络或除神经网络之外,本公开的其余部分也将实现称为神经网络。一旦预测引擎116确定机器学习模型已准备好使用,预测引擎116就可以提供用于用户与评论话题的交互和评论话题的特性的数据作为经训练的机器学习模型(即,预测场景模型)的输入。然后,预测引擎116可以从经训练的机器学习模型获得输出,该输出指示用户将对来自评论话题的特定评论感兴趣的可能性,例如,作为具有介于0和1的数值的评论得分。
在一些实施方式中,在框304处,预测引擎116可以在确定评论得分时进一步考虑关于与评论相关联的文档、评论本身以及用户活动的信息。关于与来自框302的集合中的每个评论相关联的文档的信息的一些示例可以包括相应文档中牵涉的用户的数量、对相应文档具有不同类型的访问的用户的数量、文档中事件的新近度、特定类型的事件(例如,编辑、查看或评论)的新近度、由用户开始或关闭的文档中的评论话题的比例。对于关于评论的信息,预测引擎116可以通过在评论文本中明确提及用户来进一步考虑评论文本的长度以及评论是否针对用户。
在获得评论得分之后,预测引擎116可以基于评论得分对来自框302的评论集中的每个评论进行排名。在一种实施方式中,与具有较低评论得分的评论相比,预测引擎116可以给评论指配具有较高排名的较高评论得分。然后,预测引擎116可以基于排名从评论集中选择评论的子集。
在框306处,预测引擎116可以确定与来自框304的一个或多个所选择的评论相关联的一个或多个文档。下面将相对于图4详细描述框306的确定文档的实施方式。
在框308处,预测引擎116可以利用基于云的内容管理平台115基于用户账户提供用于呈现给用户的GUI。用户账户可以定义存储在基于云的内容管理平台115上的哪些文档与用户相关联(用户有权访问)。此类文档的存储在本文中称为用户的云存储。预测引擎116可以在用户登录到基于云的内容管理平台115时提供GUI。在另一实施方式中,预测引擎116可以提供GUI作为基于云的内容管理平台的主屏幕的一部分。GUI可以标识与所选择的评论相关联的文档。对于在GUI中被标识的每个文档,GUI可以进一步标识与相应文档相关联的相应所选择的评论。如果多个所选择的评论与一个文档相关联,则预测引擎116可以从多个评论中选择最近评论或具有最高排名的评论。在另一实施方式中,预测引擎116可以从在文档中的其他评论话题当中具有最高排名的评论话题确定具有最高排名的评论。下面将相对于图4详细描述评论话题的排名。
在一些实施方式中,GUI可以包括图2的一个或多个建议卡200以标识文档和评论。建议卡可以标识文档以及与该文档相关联的评论,如上面相对于图2所详细说明的。例如,建议卡200可以包括文档的标题信息,诸如文档信息部分202中的文档的文档类型和标题、文档缩略图部分204中的文档的图像表示(例如,缩略图)以及用于在没有打开文档的情况下回复来自建议卡的评论的一个或多个智能按钮210(210A,210B)、在没有打开文档的情况下关闭来自于建议卡的评论的另一个或者多个智能按钮210(210A、210B)、用于评论的内容的文本以及描述在事件部分206中选择相应评论的原因的文本。
因此,当标识一个或多个电子文档以及相应所选择的评论的GUI呈现给用户时,用户可以经由GUI(例如,经由智能按钮210A,210B)提供与GUI中标识的文档和/或评论中的一个或者多个有关的一个或者多个输入。这使得能够经由基于云的内容管理平台115在用户与存储在云存储中的文档之间进行交互。
图4描绘根据本公开的一种实施方式的用于在图3的框306处确定与在图3的框304处选择的评论相关联的文档的方法400的各方面的流程图。可以使用基于评论的预测场景模型来执行方法400。
在框402处,预测引擎116可以标识与在图3的框304处选择的评论中的至少一个相关联的文档集。预测引擎116可以在数据存储114中查询包含在图3的框304处选择的任何评论的文档。
一旦已经标识文档,则在框404处,预测引擎116可以基于从框304选择的评论的评论得分来确定每个文档的文档得分。文档得分可以指示用户可能有兴趣与文档进行交互的概率。在实施方式中,预测引擎116可以根据预测场景模型将最高文档得分指配给具有最高评论得分的评论的文档。在文档与从框304选择的多个评论相关联并且多个评论可以属于文档中的不同评论话题的另一示例中,预测引擎116可以从每个文档中标识评论话题集,其中每个评论话题与来自框304的所选择的评论中的至少一个相关联。然后,预测引擎116可以基于与该评论话题相关联的所选择的评论的评论得分来确定每个评论话题的评论话题得分。评论话题得分可以指示用户对评论话题感兴趣的概率。在一种实施方式中,预测引擎116可以基于评论使用加权和作为预测场景模型,以计算评论话题得分。在另一实施方式中,预测引擎116可以根据基于评论的预测场景模型将每个评论得分假定为独立事件,并且将独立事件的概率确定为评论话题得分。一旦预测引擎116确定每个文档中的评论话题的评论话题得分,则预测引擎116可以基于评论话题得分的加权和作为基于评论的预测方案模型来确定每个文档的文档得分。
在框406处,预测引擎116可以基于文档得分对在框402处标识的文档集中的每个文档进行排名。在框408处,预测引擎116可以基于排名从框402的文档集中选择一个或多个文档。在图3的框308处,预测引擎116可以将所选择的文档呈现给用户以经由建议卡200进行通知。
图5描绘根据本公开的另一实施方式的用于为基于云的内容管理平台115的用户预测文档的方法500的各方面的流程图。
方法500可以由图1的预测引擎116执行。在另一实施方式中,方法500可以由由用户设备120的一个或多个处理设备执行的客户端应用执行。可以为基于云的内容管理平台115的每个用户执行方法500。此外,当用户经由基于云的内容管理平台115请求服务器112访问用户的云存储或主屏幕时,可以执行方法500。在一些实施方式中,可以执行方法500以通知基于云的内容管理平台115的用户通过使用基于目标或者意外发现的预测场景模型经由基于云的内容管理平台115建议的文档。在一种实施方式中,方法500可以与方法300同时执行。
在框502处,预测引擎116可以标识第一文档集。在一些实施方式中,第一集合中的文档由基于云的内容管理平台115托管。此外,第一文档集可以排除用户最近打开的文档。因此,预测引擎116可以选择用户可能不再记得或可能根本没有打开的基于云的内容管理平台115的文档作为候选以用于建议。例如,用户可能不再记得的文档可能包括例如下述中的至少一个:从缓存或历史中已经期满或者可能没有采取任何动作(诸如被打开、读取、编辑、修改、或在确定或预先确定的时间段内与用户以其它方式互动)的文档。
在一些实施方式中,预测引擎116可以基于来自基于云的内容管理平台115的协作者的事件(即,协作水平)来确定第一文档集。例如,预测引擎116可以标识与协作者相关联的文档集,或者协作者可以打开、查看或编辑的文档。预测引擎116可以从该文档集中进一步确定通过协作者具有最近事件(例如,打开、查看、编辑或评论事件)的文档作为候选文档以用于建议。在实施方式中,预测引擎116可以将已工作在同一文档上的基于云的内容管理平台115的任何用户定义为协作者。例如,预测引擎116可以通过标识基于云的内容管理平台115的另一个用户来确定协作者,该另一个用户相对于在预定时间段内经由基于云的内容管理平台115与用户共享的文档已经执行查看、编辑或者评论事件。在一个实施方式中,预测引擎116可以基于协作者或任何其他用户的查看的数量(即,流行水平)来确定第一文档集。在一些实施方式中,预测引擎116可以基于指配给每个协作者的重要性权重进一步标识候选文档以用于建议,如关于图3的框304所详细描述的。
在将第一文档集确定为候选以用于建议时,预测引擎116可以进一步将与文档相关的文档并入用户的当前工作的文档集中(即,相关水平)。预测引擎116可以确定用户的当前工作的文档集。用户的当前工作的文档集可以包括用户在最后预定时间段内经由基于云的内容管理平台115访问的文档。例如,用户在过去的一周内经由基于云的内容管理平台115已经打开、查看或编辑的任何文档可以被视为用户的当前工作的文档集。在另一种实施方式中,预测引擎116可以仅使用特定类型的访问(例如,编辑)来定义用户的当前工作的文档集。一旦预测引擎116标识出用户的当前工作的文档集,预测引擎116即可确定用户的当前工作的集合中的每个文档的关键文本。关键文本可以被索引并且表示文档内容的话题。可以从相应文档的标题或内容中提取关键文本。关键文本可以是单词、短语或句子。关键文本可以由与文档相关联的用户手动键入,或者可以经由基于云的内容管理平台115自动生成。关键文本可以用于查询存储在数据存储114中的相关联的文档。预测引擎116可以在数据存储114中查询与用户的当前工作的文档集的关键文本相关联的任何文档。这样,预测引擎116可以将与用户的当前工作的集合中的文档相关的文档集确定为候选以用于建议。
在一些实施方式中,与协作者相关联的文档集以及与用户的当前工作的集合相关的另一文档集可以包括用户尚未访问的文档。以此方式,预测引擎116可以选择用户没有意识到的文档,因为用户从未访问过那些文档作为候选以用于建议。在实施方式中,预测引擎116可以从这两个集合中过滤出用户最近打开的文档,以便选择用户可能不再记得的文档作为候选以用于建议。因此,预测引擎116可以通过组合与协作者相关联的文档集和与用户的当前工作的集合相关的文档集并且过滤出用户最近打开的文档来生成合并的文档集(即,第一文档集)以用于建议。在实施方式中,预测引擎116可以进一步过滤出对于用户而言可能没有意义的文档,因为少于阈值数量的协作者正在工作在该文档上。因此,预测引擎116可以从第一集合中排除用户没有访问并且具有由少于预定数量的协作者执行的事件的文档。在另一实施方式中,预测引擎116还可以消除被设置为不可由经由基于云的内容管理平台115执行的搜索(例如,经由文档的元数据中的标签)发现的文档。
在框504处,预测引擎116可以标识来自第一文档集中的一个或多个目标文档以向用户建议。目标或意外文档可能是用户可能不知道的文档(例如,因为用户可能未打开、编辑或以其他方式与其交互)或不再记得(例如,由于其时间长于自从用户最后与该文档交互以来的已确定或预先确定的时间段)的文档,并且可能是用户感兴趣的。在一种实施方式中,预测引擎116可以基于来自于框502的集合的相应文档与用户的当前工作的文档集的相关水平、用户当中的相应文档的流行水平、与相应文档相关联的协作水平等中的至少一个来标识目标文档。
预测引擎116可以将相关水平测量为相应文档与用户的当前工作的文档集之间的话题性的重叠量。话题性的重叠可以表示文档如何与用户的当前工作的文档集相关的度量或相似度得分,并且可以例如根据预定义的一组准则(诸如重叠水平、与公共字段或主题有关的在存储的数据库中标识的单词或者短语的发生率、Jaccard相似度、余弦距离、欧几里得距离等)被确定。除了别的之外,预测引擎116可以从指配给文档的关键文本或文档中重复的特定术语或文档内容中标识文档的话题性。然后,预测引擎116可以测量相应文档的话题性与用户的当前工作的集合中的文档如何相似。
预测引擎116可以基于预定时间段内的查看事件的数量来确定文档的流行水平。查看事件可以由任何用户,或者可以由用户的社交网络中的用户(例如,协作者、朋友或群组成员)经由基于云的内容管理平台115进行。
预测引擎116可以基于与相应文档相关联的协作事件的数量来测量文档的协作水平。协作事件是交互事件(即,响应于另一用户的事件而生成的事件),该交互事件是在使用文档进行协作的语境下在用户之间来回交换的。协作事件可以以评论话题(例如,发帖评论并回复评论)、建议编辑(例如,建议编辑并接受或拒绝该建议)或共享文档(例如,共享文档并打开文档)的形式发生。因此,在一种实施方式中,预测引擎116可以鉴于用户的交互事件的数量、其他用户的交互事件的数量以及用户与在相应的文档中所牵涉的其他用户执行交互事件的可能性来确定协作事件的数量。预测引擎116可以基于用户的过去响应历史来估计用户与其他人执行交互事件的可能性。
在一些实施方式中,预测引擎116可以基于相关水平、流行水平或协作水平中的至少一个来确定来自框502的第一集合中的每个文档的目标得分或意外得分。然后,预测引擎116可以使用目标得分或意外得分来选择具有高得分的文档作为目标文档以建议给用户。目标得分或意外得分可以指示在用户没有意识到或已经忘记可能对用户有帮助的相应文档的情况下用户对相应文档感兴趣的概率。预测引擎116可以在确定目标得分或意外得分时采用启发式方法或机器学习方法。在启发式方法中,预测引擎116可以将加权和应用为预测场景模型,并将加权和进一步归一化为介于0和1之间。预测引擎116可以为每个相关水平、流行水平和协作水平指配介于0和1之间的权重和数值。
在机器学习方法中,预测引擎116可以训练机器学习模型。在一些实施方式中,预测引擎116可以生成训练数据,该训练数据包括一个或多个训练输入和一个或多个目标输出。在下文中,基于目标或意外发现的预测场景模型也可以称为机器学习模型。训练输入可以包括指示来自框502的第一集合中的每个文档的相关水平、流行水平和/或协作水平的数据。目标输出可以包括用户的响应,如打开、查看、编辑或共享响应文档,或者没有响应。在另一种实施方式中,训练数据可能不是特定于特定用户,而是特定于基于云的内容管理平台115的各种用户。一旦预测引擎116确定机器学习模型已准备好使用,则预测引擎116可以向经训练的机器学习模型提供当前输入(例如,用于针对来自于块502的第一集合中的文档的相关水平、流行水平和协作水平的当前数据)。然后,预测引擎116可以从经训练的机器学习模型获得输出,作为具有介于0和1之间的数值的目标得分或意外得分。在一个实施方式中,预测引擎116可以针对来自于块502的第一集合中的每个文档,将相应文档和用户的当前工作的文档集之间的话题性的重叠量、相应文档的查看事件的数量和/或与相应文档相关联的协作事件的数量作为输入应用于经训练的机器学习模型。然后,预测引擎116可以从经训练的机器学习模型获得输出。输出可以指示用户对相应文档感兴趣的可能性。
在框506处,预测引擎116可以提供由基于云的内容管理平台115托管的用户的云存储的GUI 200,以呈现给用户。GUI 200可以标识一个或多个目标文档。在一些实施方式中,GUI 200可以包括一个或多个建议卡。每个建议卡可以标识每个目标文档。此外,每个建议卡可以包括文档信息部分202中的标题信息(例如,相应文档的类型和标题)、文档缩略图部分204中的相应文档的图像表示(例如,缩略图)以及一个或多个智能按钮210(210A,210B),其提供对相应文档的访问(例如,打开、查看、编辑)以及原因文本,该原因文本描述在事件部分206中标识相应文档的原因,如在上面关于图2详细描述的。
图6描绘根据本公开的一种实施方式的用于基于多个预测场景模型为用户预测文档的方法600的各方面的流程图。
方法600可以由预测引擎116执行。在另一实施方式中,方法600可以由由用户设备120的一个或多个处理设备执行的客户端应用执行。当用户请求服务器112经由基于云的内容管理平台115访问云存储或主屏幕时可以执行方法600。当预测引擎116利用多个预测场景模型来预测用于建议给用户的文档时,可以执行方法600。预测方案模型的示例包括基于在上面关于图2所述的常规、目标或意外发现和评论的预测方案模型。在实施方式中,响应于接收到来自用户的访问基于云的内容管理平台的云存储或主屏幕的请求,预测引擎116可以实时运行多个预测场景模型。在另一个实施方式中,预测引擎116可以周期性地运行所有或一些预测场景模型,并将预测得分存储在数据存储114中。
预测引擎116可以从每个预测场景模型获得输出(例如,预测场景得分)。在预测引擎116利用两个预测场景模型的实施方式中,在框602处,预测引擎116可以从第一预测场景模型确定用于第一文档集的第一预测场景得分。在一些实施方式中,预测引擎116可以将与第一预测场景模型所需的输入数据相关联的文档集标识为第一文档集。预测引擎116可以通过提供与来自第一集合的每个文档相关联的所需信息作为输入来运行第一预测场景模型,并且获得每个文档的预测得分。预测场景得分可以表示用户在预测场景模型的相应场景下对相应文档感兴趣的概率。这样的预测得分可以在0到1的范围内。在实施方式中,预测引擎116可以通过提供表示用户与文档中的评论话题的交互以及每个文档的评论话题的特性的数据作为输入来运行基于评论的预测方案模型。预测引擎116可以随后获得文档的预测场景得分。
在框604处,预测引擎116可以使用第二预测场景模型来确定第二文档集的第二预测场景得分。预测引擎116可以通过提供表示每个文档的相关、协作和流行的水平的数据作为输入来运行基于目标或意外发现的预测方案模型。预测引擎116可以随后获得文档的预测场景得分。在一些实施方式中,在一个预测场景模型中使用的文档集可以与另一模型的文档集不同,因为不同模型可以基于不同场景。例如,在运行基于评论的预测场景模型时,预测引擎116可以使用来自具有最近由其他用户添加的评论的文档的数据;然而对于基于目标或意外发现的预测场景模型,预测引擎116可以使用来自具有其他用户最近添加的评论的文档的数据,但排除用户最近打开的那些。在另一个示例中,基于目标或意外发现的预测方案模型中使用的文档集和基于常规模型中的文档集可能是互斥的,因为在明确排除用户最近打开的文档的场景下构建前一个模型;而后一个模型考虑用户最近以任何其他方式打开或访问的文档。
在框606处,预测引擎116可以基于相应的第一预测场景得分和第二预测场景得分从第一文档集和第二文档集中选择文档以用于建议。将关于图7详细讨论框606的实施方式。在一些实施方式中,预测引擎116可以进一步在主屏幕GUI上为从框606中选择的文档提供多个建议卡。
图7图示根据本发明的一种实施方式的用于在图6的框606处选择文档以用于建议的方法700的各方面的流程图。
在框702处,预测引擎116可以从图6的框602和604中标识在多个预测场景模型中使用的每个场景的权重。在框704处,预测引擎116还可标识每一场景的任何衰减因子。在一些实施方式中,可以由预测引擎116初始地预先设置衰减因子的值。例如,预测引擎可以利用较小数值(例如,0.01)初始地设置目标或意外发现场景的衰减因子。在框708中计算总体文档得分时,衰减因子可以用于从特定预测场景模型中指数地减小预测场景得分的贡献。在一些实施方式中,预测引擎116可以更新每个场景的权重和衰减因子。在框706处,预测引擎116可以从图6的框602和604确定指配给第一和第二文档集中的每个文档的预测场景得分。每个预测场景得分都与不同的预测场景模型相关联。在实施方式中,一些文档可以仅具有被指配的一个预测得分,而其他文档可以具有一个以上的预测得分。
在框708处,预测引擎116可以基于预测场景得分以及与每个场景相对应的权重和衰减因子来计算每个文档的总体文档得分。预测引擎116可以为每个场景添加预测场景得分、权重和任何衰减因子的乘积,以确定总体文档得分。在实施方式中,预测引擎116可以在计算总体文档得分时进一步考虑不同预测场景得分的标准偏差。
在框710处,预测引擎116可以基于总体文档得分对文档进行排名。在实施方式中,预测引擎116可以以总体文档得分的升序或降序对文档进行排名。预测引擎116可以在框712处基于排名选择有限数量的文档以用于建议。
图8描绘了根据本公开的一个或多个方面操作的示例计算系统的框图。在各个说明性示例中,计算机系统800可以与图1的系统架构100内的计算设备中的任一个相对应。在一个实施方式中,计算机系统800可以是服务器112。在另一实施方式中,计算机系统800可以是用户设备120A-120Z中的每一个。
在某些实施方式中,计算机系统800可以(例如,经由诸如局域网(LAN)、内联网、外联网、或互联网的网络)连接到其它计算机系统。计算机系统800可以在客户端-服务器环境中以服务器或客户端计算机的能力操作,或者在对等或分布式网络环境中作为对等计算机操作。计算机系统800可以由能够(顺序的或以其它方式)执行指定要由该设备采取的动作的一组指令的个人计算机(PC)、平板PC、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、web设备、服务器、网络路由器、交换机或桥接器、或任何设备来提供。另外,术语“计算机”应当包括单独地或联合地执行一组(或多组)指令,以执行本文中描述的方法中的任何一种或多种的计算机的任何集合。
在另一个方面中,计算机系统800可以包括可以经由总线808彼此通信的处理设备802、易失性存储器804(例如,随机存取存储器(RAM))、非易失性存储器806(例如,只读存储器(ROM)或电可擦除可编程ROM(EEPROM))、和数据存储设备816。
处理设备802可以由诸如以下各项的一个或多个处理器提供:通用处理器(诸如例如,复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、实现其它类型的指令集的微处理器,或实现各种类型的指令集的组合的微处理器)或专用处理器(诸如例如,专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、或网络处理器)。
计算机系统800还可以包括网络接口设备822。计算机系统800还可以包括视频显示单元810(例如,LCD)、字母数字输入设备812(例如,键盘)、光标控制设备814(例如,鼠标)、和信号生成设备820。
数据存储设备816可以包括非暂时性计算机可读存储介质824,在该非暂时性计算机可读存储介质上可以存储对本文中描述的方法或功能中的任何一个或多个进行编码的指令826,该指令包括实现图1的预测引擎116以用于实现本文中描述的方法的指令。
指令826还可以在其由计算机系统800执行期间完全地或部分地驻留在易失性存储器804内和/或在处理设备802内,因此,易失性存储器804和处理设备802还可以构成机器可读存储介质。
虽然计算机可读存储介质824在说明性示例中作为单个介质被示出,但是术语“计算机可读存储介质”应当包括存储一组或多组可执行指令的单个介质或多个介质(例如,集中式或分布式数据库,和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当包括能够存储或编码由计算机执行的一组指令的任何有形介质,所述指令使计算机执行本文中描述的方法中的任何一种或多种。术语“计算机可读存储介质”应当包括但不限于固态存储器、光介质、和磁介质。
在上面的描述中,阐述了许多细节。然而,对于受益于本公开的本领域的普通技术人员而言将显而易见的是,能够在没有这些具体细节的情况下实践本公开。在一些情况下,众所周知的结构和设备是以框图形式而不是详细地示出,以便避免使本公开模糊。
已经在对计算机存储器内的数据比特的操作的算法和符号表示方面呈现了详细描述的一些部分。这些算法描述和表示是由数据处理领域的技术人员使用来最有效地将其工作的实质传达给本领域的其它技术人员的手段。算法在这里且一般地被认为是导致期望结果的步骤的自相一致序列。这些步骤是要求物理量的物理操纵的步骤。通常,尽管不一定,但是这些量采取能够被存储、转移、组合、比较并以其它方式操纵的电信号或磁信号的形式。出于通用的原因,有时将这些信号称为比特、值、元素、符号、字符、项、数字等已经证明是方便的。
然而,应当记住的是,所有这些和类似的术语将与适当的物理量相关联并且仅仅是应用于这些量的方便标签。除非另有明确说明,否则如从以下讨论中显而易见,应当理解的是,,在整个说明书中,利用诸如“接收”、“显示”、“排名”、“标识”、“确定”、“通知”、“预测”、“建议”、“提供”、“呈现”等的术语的讨论指的是计算机系统或类似的电子计算设备的动作和过程,所述计算机系统或类似的电子计算设备将表示为计算机系统的寄存器和存储器内的物理(例如,电子)量的数据操纵并转换成类似地表示为计算机系统存储器或寄存器或其它这种信息存储、传输或显示设备内的物理量的其它数据。
为了简化说明,方法在本文中被描绘和描述为一系列动作。然而,根据本公开的动作可以以各种次序发生和/或同时发生,并且同时在本文中未呈现和描述其它动作。此外,可能不要求所有示出的动作来实现根据所公开的主题的方法。此外,本领域的技术人员应当理解和领会的是,这些方法能可替选地经由状态图或事件被表示为一系列相关状态。附加地,应当理解的是,本说明书中公开的方法能够被存储在制品上以促进将此类方法输送并转移到计算设备。如本文中所使用的术语“制品”旨在涵盖可从任何计算机可读设备或存储介质访问的计算机程序。
本公开的某些实施方式还涉及一种用于执行本文的操作的装置。此装置能够被构造用于预定目的,或者它能够包括通过在计算机中存储的计算机程序选择性地激活或者重新配置的通用计算机。这种计算机程序能够被存储在计算机可读存储介质中,所述计算机可读存储介质诸如但不限于包括软盘、光盘、CD-ROM、和磁光盘的任何类型的盘、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、磁卡或光卡,或适合于存储电子指令的任何类型的介质。
贯穿本说明书对“一个实施方式”或“实施方式”的参考意味着结合该实施方式一起描述的特定特征、结构或特性被包括在至少一个实施方式中。因此,短语“在一个实施方式中”或“在实施方式中”贯穿本说明书在各个地方中的出现不一定全部都指代相同的实施方式。此外,术语“或”旨在意指包含性“或”而不是排他性“或”。此外,单词“示例”或“示例性”在本文中用于意指用作示例、实例或图示。在本文中描述为“示例性”的任何方面或设计不一定被解释为优于其它方面或设计为优选的或有利的。相反,单词“示例”或“示例性”的使用旨在以具体方式呈现构思。
应当理解的是,以上描述旨在为说明性的,而不是限制性的。在阅读和理解以上描述后,许多其它实施方式对于本领域的技术人员而言将是显而易见的。因此,应当参考所附权利要求连同此类权利要求所赋予的等同物的完全范围来确定本公开的范围。
除以上描述之外,可以向用户提供有允许用户关于本文中描述的系统、程序或特征是否以及何时可以使得能够收集用户信息(例如,关于用户的社交网络、社交动作或活动、专业、用户的偏好、或用户的当前位置的信息)并且用户是否被从服务器发送了内容或通信做出选择的控制。此外,某些数据可以在它被存储或者使用之前被以一个或多个方式处理,使得个人可识别的信息被移除。例如,可以处理用户的身份,使得对用户来说不能够确定个人可识别的信息,或者用户的地理位置可以在获得位置信息的情况下被一般化(诸如到城市、邮政编码、或州级别),使得不能够确定用户的特定位置。因此,用户可以具有对收集关于用户的什么信息、如何使用该信息并且向用户提供什么信息的控制。

Claims (20)

1.一种将文档通知给基于云的内容管理平台的用户的方法,所述方法包括:
由处理器标识第一文档集,其中所述第一文档集由所述基于云的内容管理平台托管并且不包括由所述用户最近打开的一个或多个文档;
由所述处理器基于相应文档和用户的当前工作的文档集之间的话题性的重叠量、所述相应文档的查看事件的数量、以及与所述相应文档相关联的协作事件的数量标识来自所述用户的所述第一文档集中的一个或多个目标文档,其中所述用户的当前工作的文档集包括所述用户在最近预定时间段内经由所述基于云的内容管理平台访问的文档;以及
由所述处理器提供由所述基于云的内容管理平台托管的所述用户的云存储的图形用户界面(GUI)以呈现给所述用户,所述GUI标识所述一个或多个目标文档。
2.根据权利要求1所述的方法,其中标识所述第一文档集包括:
基于所述用户的一个或多个协作者的最近事件和指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的第二文档集;
确定与所述用户的当前工作的文档集中的文档相关的第三文档集;以及
通过组合所述第二文档集和所述第三文档集并且消除由所述用户最近打开的一个或多个文档来生成所述第一文档集。
3.根据权利要求2所述的方法,其中基于所述用户的一个或多个协作者的最近事件以及指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的所述第二文档集包括:
通过标识将查看事件、编辑事件或评论事件中的至少一个提供给在预定时间段内在所述基于云的内容管理平台中与所述用户共享的文档的所述基于云的内容管理平台的一个或者多个其他用户来确定所述一个或多个协作者;
基于与所述基于云的内容管理平台相关联的社交网络中的每个协作者的重要性来确定该协作者的重要性权重;以及
确定所述第二文档集,所述第二文档集包括具有所述一个或多个协作者的近期事件以及指配给所述一个或多个协作者的重要性权重的一个或多个文档。
4.根据权利要求2或者3所述的方法,其中确定与所述用户的当前工作的文档集中的文档相关的所述第三文档集包括:
标识所述用户的当前工作的文档集中的每个文档的关键文本;和
确定包括具有所述关键文本的一个或者多个文档的所述第三文档集。
5.根据权利要求2、3或者4所述的方法,其中所述第二文档集或所述第三文档集中的至少一个包括所述用户尚未访问的一个或多个文档。
6.根据权利要求2、3、4或者5所述的方法,其中生成所述第一文档集包括以下之一:
消除所述用户不具有访问权并且具有小于预定数量的一个或多个协作者的事件的一个或多个文档;或
消除被设置为不可由经由所述基于云的内容管理平台执行的搜索发现的一个或多个文档。
7.根据任何前述权利要求所述的方法,其中标识所述用户的所述一个或多个目标文档包括以下之一:
确定其他用户或所述一个或多个协作者的与所述相应文档相关联的查看事件的数量;或
鉴于所述用户与所述相应文档的交互事件的数量、所述一个或多个其他用户与所述相应文档的交互事件的数量以及所述用户执行与所述相应文档中牵涉的一个或者多个其它用户的交互事件的可能性,确定协作事件的数量,其中交互事件是响应于另一用户的事件而生成的事件。
8.根据权利要求1至6中的任一项所述的方法,其中标识所述用户的所述一个或多个目标文档包括:
对于所述第一文档集中的每个文档,
将所述相应文档和所述用户的当前工作的文档集之间的话题性的重叠量、所述相应文档的查看事件的数量以及与所述相应文档相关联的协作事件的数量作为输入应用于机器学习模型;和
从所述机器学习模型获得输出,所述输出指示所述用户对所述相应文档感兴趣的概率。
9.根据任意前述权利要求所述的方法,其中所述GUI包括一个或多个建议卡,每个建议卡标识每个目标文档,并且每个建议卡包括:
标题信息,所述标题信息包括相应文档的文档类型和标题;
所述相应文档的图像表示;
动作按钮,所述动作按钮提供对所述相应文档的访问;以及
原因文本,所述原因文本描述用于标识所述相应文档的原因。
10.一种系统,包括:
存储器设备;和
处理设备,所述处理设备可操作地耦合到所述存储器设备,所述处理设备用于:
标识第一文档集,其中所述第一文档集由所述基于云的内容管理平台托管并且不包括由所述用户最近打开的一个或多个文档;
基于相应文档和用户的当前工作的文档集之间的话题性的重叠量、所述相应文档的查看事件的数量、以及与所述相应文档相关联的协作事件的数量标识来自所述用户的所述第一文档集中的一个或多个目标文档,其中所述用户的当前工作的文档集包括所述用户在最近预定时间段内经由所述基于云的内容管理平台访问的文档;以及
提供由所述基于云的内容管理平台托管的所述用户的云存储的图形用户界面(GUI)以呈现给所述用户,所述GUI标识所述一个或多个目标文档。
11.根据权利要求10所述的系统,其中为了标识所述第一文档集,所述处理设备进一步用于:
基于所述用户的一个或多个协作者的最近事件和指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的第二文档集;
确定与所述用户的当前工作的文档集中的文档相关的第三文档集;并且
通过组合所述第二文档集和所述第三文档集并且消除由所述用户最近打开的一个或多个文档来生成所述第一文档集。
12.根据权利要求10所述的系统,其中为了基于所述用户的一个或多个协作者的最近事件以及指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的所述第二文档集,所述处理设备进一步用于:
通过标识将查看事件、编辑事件或评论事件中的至少一个提供给在预定时间段内在所述基于云的内容管理平台中与所述用户共享的文档的所述基于云的内容管理平台的一个或者多个其他用户来确定所述一个或多个协作者;并且
基于与所述基于云的内容管理平台相关联的社交网络中的每个协作者的重要性来确定该协作者的重要性权重;
确定所述第二文档集,所述第二文档集包括具有所述一个或多个协作者的近期事件以及指配给所述一个或多个协作者的重要性权重的一个或多个文档。
13.根据权利要求10所述的系统,其中为了确定与所述用户的当前工作的文档集中的文档相关的所述第三文档集,所述处理设备进一步用于:
标识所述用户的当前工作的文档集中的每个文档的关键文本;并且
确定包括具有所述关键文本的一个或者多个文档的所述第三文档集。
14.根据权利要求10所述的系统,其中为了标识所述用户的所述一个或多个目标文档,所述处理设备进一步用于以下之一:
确定其他用户或所述一个或多个协作者的与所述相应文档相关联的查看事件的数量;或者
鉴于所述用户与所述相应文档的交互事件的数量、所述一个或多个其他用户与所述相应文档的交互事件的数量以及所述用户执行与所述相应文档中牵涉的一个或者多个其它用户的交互事件的可能性,确定协作事件的数量,其中交互事件是响应于另一用户的事件而生成的事件。
15.根据权利要求10所述的系统,其中所述GUI包括一个或多个建议卡,每个建议卡标识每个目标文档,并且每个建议卡包括:
标题信息,所述标题信息包括相应文档的文档类型和标题;
所述相应文档的图像表示;
动作按钮,所述动作按钮提供对所述相应文档的访问;以及
原因文本,所述原因文本描述用于标识所述相应文档的原因。
16.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质存储指令,所述指令在执行时,使所述处理设备:
标识第一文档集,其中所述第一文档集由所述基于云的内容管理平台托管并且不包括由所述用户最近打开的一个或多个文档;
基于相应文档与用户的当前工作的文档集之间的话题性的重叠量、所述相应文档的查看事件的数量、以及与所述相应文档相关联的协作事件的数量标识来自所述用户的所述第一文档集中的一个或多个目标文档,其中所述用户的当前工作的文档集包括所述用户在最近预定时间段内经由所述基于云的内容管理平台访问的文档;并且
提供由所述基于云的内容管理平台托管的所述用户的云存储的图形用户界面(GUI)以呈现给所述用户,所述GUI标识所述一个或多个目标文档。
17.根据权利要求16所述的计算机可读介质,其中为了标识所述第一文档集,所述指令进一步使所述处理设备:
基于所述用户的一个或多个协作者的最近事件和指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的第二文档集;
确定与所述用户的当前工作的文档集中的文档相关的第三文档集;并且
通过组合所述第二文档集和所述第三文档集并且消除由所述用户最近打开的一个或多个文档来生成所述第一文档集。
18.根据权利要求16所述的计算机可读介质,其中为了基于所述用户的一个或多个协作者的最近事件以及指配给所述一个或多个协作者的重要性权重来确定与所述一个或多个协作者相关联的所述第二文档集,所述指令进一步使所述处理设备:
通过标识将查看事件、编辑事件或评论事件中的至少一个提供给在预定时间段内在所述基于云的内容管理平台中与所述用户共享的文档的所述基于云的内容管理平台的一个或者多个其他用户来确定所述一个或多个协作者;
基于与所述基于云的内容管理平台相关联的社交网络中的每个协作者的重要性来确定该协作者的重要性权重;并且
确定所述第二文档集,所述第二文档集包括具有所述一个或多个协作者的近期事件以及指配给所述一个或多个协作者的重要性权重的一个或多个文档。
19.根据权利要求16所述的计算机可读介质,其中为了确定与所述用户的当前工作的文档集中的文档相关的所述第三文档集,所述指令进一步使所述处理设备:
标识所述用户的当前工作的文档集中的每个文档的关键文本;并且
确定包括具有所述关键文本的一个或者多个文档的所述第三文档集。
20.根据权利要求16所述的计算机可读介质,其中所述GUI包括一个或多个建议卡,每个建议卡标识每个目标文档,并且每个建议卡包括:
标题信息,所述标题信息包括相应文档的文档类型和标题;
所述相应文档的图像表示;
动作按钮,所述动作按钮提供对所述相应文档的访问;以及
原因文本,所述原因文本描述用于标识所述相应文档的原因。
CN201880096801.9A 2018-07-23 2018-08-21 智能意外文档发现通知 Pending CN112585594A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862702252P 2018-07-23 2018-07-23
US62/702,252 2018-07-23
PCT/US2018/047370 WO2020023066A1 (en) 2018-07-23 2018-08-21 Intelligent serendipitous document discovery notifications

Publications (1)

Publication Number Publication Date
CN112585594A true CN112585594A (zh) 2021-03-30

Family

ID=63586899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880096801.9A Pending CN112585594A (zh) 2018-07-23 2018-08-21 智能意外文档发现通知

Country Status (4)

Country Link
US (1) US20210165829A1 (zh)
EP (1) EP3827394A1 (zh)
CN (1) CN112585594A (zh)
WO (1) WO2020023066A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7298208B2 (ja) * 2019-03-13 2023-06-27 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US20220237387A1 (en) * 2019-05-18 2022-07-28 Exxonmobil Upstream Research Company Method And System For Generating A Surprisingness Score For Sentences Within Geoscience Text
US11048383B2 (en) * 2019-08-16 2021-06-29 Dropbox, Inc. Contact cards with dynamic interaction information
US11729122B2 (en) * 2020-12-23 2023-08-15 Atlassian Pty Ltd. Content suggestion system for real-time communication environments

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101023426A (zh) * 2004-07-23 2007-08-22 联邦科学和工业研究组织 集成浏览历史和媒体播放列表的方法和系统
CN101631311A (zh) * 2008-07-17 2010-01-20 科塔企业有限责任公司 用于共享权限启用的移动简档的简档服务
CN101702795A (zh) * 2008-07-17 2010-05-05 多明戈企业有限责任公司 共享权限使能的移动简档的系统和方法
CN102349087A (zh) * 2009-03-12 2012-02-08 谷歌公司 自动提供与捕获的信息例如实时捕获的信息关联的内容
US20140372526A1 (en) * 2013-06-12 2014-12-18 Cloudon Ltd Systems and methods for supporting social productivity using thresholding
US20150262069A1 (en) * 2014-03-11 2015-09-17 Delvv, Inc. Automatic topic and interest based content recommendation system for mobile devices
CN105074741A (zh) * 2012-12-20 2015-11-18 微软技术许可有限责任公司 建议相关项
US9230014B1 (en) * 2011-09-13 2016-01-05 Sri International Method and apparatus for recommending work artifacts based on collaboration events
CN105359138A (zh) * 2013-06-14 2016-02-24 微软技术许可有限责任公司 与浏览相关联的相关内容显示
US20160371258A1 (en) * 2015-06-22 2016-12-22 Microsoft Technology Licensing, Llc Systems and methods for creating unified document lists
CN106663242A (zh) * 2014-07-18 2017-05-10 微软技术许可有限责任公司 在文档中标识和显现相关的报告工件
US20170235820A1 (en) * 2016-01-29 2017-08-17 Jack G. Conrad System and engine for seeded clustering of news events
CN107111803A (zh) * 2015-01-09 2017-08-29 微软技术许可有限责任公司 企业社交上下文中针对个性化活动的行动和内容发现
US20180081503A1 (en) * 2016-09-19 2018-03-22 Google Inc. Recommending a document for a user to access

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7440943B2 (en) * 2000-12-22 2008-10-21 Xerox Corporation Recommender system and method
US8688673B2 (en) * 2005-09-27 2014-04-01 Sarkar Pte Ltd System for communication and collaboration
US7693836B2 (en) * 2005-12-27 2010-04-06 Baynote, Inc. Method and apparatus for determining peer groups based upon observed usage patterns
US20090216734A1 (en) * 2008-02-21 2009-08-27 Microsoft Corporation Search based on document associations
US8666961B1 (en) * 2010-03-19 2014-03-04 Waheed Qureshi Platform for generating, managing and sharing content clippings and associated citations
US9519883B2 (en) * 2011-06-28 2016-12-13 Microsoft Technology Licensing, Llc Automatic project content suggestion
US20130275429A1 (en) * 2012-04-12 2013-10-17 Graham York System and method for enabling contextual recommendations and collaboration within content
US8959109B2 (en) * 2012-08-06 2015-02-17 Microsoft Corporation Business intelligent in-document suggestions
US20150019559A1 (en) * 2013-07-11 2015-01-15 Salesforce.Com, Inc. Systems and methods for identifying categories with external content objects in an on-demand environment
US9842113B1 (en) * 2013-08-27 2017-12-12 Google Inc. Context-based file selection
US20150193521A1 (en) * 2014-01-09 2015-07-09 Google Inc. Methods for Generating an Activity Stream
US9420017B2 (en) * 2014-01-10 2016-08-16 Kuhoo Edson Information organization, management, and processing system and methods
US20160042080A1 (en) * 2014-08-08 2016-02-11 Neeah, Inc. Methods, Systems, and Apparatuses for Searching and Sharing User Accessed Content
US9569728B2 (en) * 2014-11-14 2017-02-14 Bublup Technologies, Inc. Deriving semantic relationships based on empirical organization of content by users
US10114824B2 (en) * 2015-07-14 2018-10-30 Verizon Patent And Licensing Inc. Techniques for providing a user with content recommendations
US10839136B2 (en) * 2016-09-07 2020-11-17 Box, Inc. Generation of collateral object representations in collaboration environments
US10607273B2 (en) * 2016-12-28 2020-03-31 Google Llc System for determining and displaying relevant explanations for recommended content
US10776755B2 (en) * 2016-12-29 2020-09-15 Dropbox, Inc. Creating projects in a content management system
US11334596B2 (en) * 2018-04-27 2022-05-17 Dropbox, Inc. Selectively identifying and recommending digital content items for synchronization

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080288536A1 (en) * 2004-07-23 2008-11-20 Commonwealth Scientific And Industrial Research Organisation Method and System for Integrating Browsing Histories with Media Playlists
CN101023426A (zh) * 2004-07-23 2007-08-22 联邦科学和工业研究组织 集成浏览历史和媒体播放列表的方法和系统
CN101631311A (zh) * 2008-07-17 2010-01-20 科塔企业有限责任公司 用于共享权限启用的移动简档的简档服务
CN101702795A (zh) * 2008-07-17 2010-05-05 多明戈企业有限责任公司 共享权限使能的移动简档的系统和方法
CN102349087A (zh) * 2009-03-12 2012-02-08 谷歌公司 自动提供与捕获的信息例如实时捕获的信息关联的内容
US9230014B1 (en) * 2011-09-13 2016-01-05 Sri International Method and apparatus for recommending work artifacts based on collaboration events
CN105074741A (zh) * 2012-12-20 2015-11-18 微软技术许可有限责任公司 建议相关项
US20140372526A1 (en) * 2013-06-12 2014-12-18 Cloudon Ltd Systems and methods for supporting social productivity using thresholding
CN105359138A (zh) * 2013-06-14 2016-02-24 微软技术许可有限责任公司 与浏览相关联的相关内容显示
US20150262069A1 (en) * 2014-03-11 2015-09-17 Delvv, Inc. Automatic topic and interest based content recommendation system for mobile devices
CN106663242A (zh) * 2014-07-18 2017-05-10 微软技术许可有限责任公司 在文档中标识和显现相关的报告工件
CN107111803A (zh) * 2015-01-09 2017-08-29 微软技术许可有限责任公司 企业社交上下文中针对个性化活动的行动和内容发现
US20160371258A1 (en) * 2015-06-22 2016-12-22 Microsoft Technology Licensing, Llc Systems and methods for creating unified document lists
US20170235820A1 (en) * 2016-01-29 2017-08-17 Jack G. Conrad System and engine for seeded clustering of news events
US20180081503A1 (en) * 2016-09-19 2018-03-22 Google Inc. Recommending a document for a user to access

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王妍;唐杰;: "基于深度学习的论文个性化推荐算法", 中文信息学报, no. 04, 15 April 2018 (2018-04-15), pages 118 - 123 *
邬登峰;白琳;王涛;李慧;许舒人;: "基于多粒度特征和混合算法的文档推荐系统", 计算机系统应用, no. 03, 15 March 2018 (2018-03-15), pages 11 - 19 *

Also Published As

Publication number Publication date
WO2020023066A1 (en) 2020-01-30
EP3827394A1 (en) 2021-06-02
US20210165829A1 (en) 2021-06-03

Similar Documents

Publication Publication Date Title
US11914947B2 (en) Intelligent document notifications based on user comments
US20220391051A1 (en) Intelligent people-centric predictions in a collaborative environment
CN111512328B (zh) 协作文档访问记录和管理
US20190179878A1 (en) Generating organization-specific tags for communications from various sources of an organization using an expanded knowledge graph for organization-specific content
US10387840B2 (en) Model generator for historical hiring patterns
US20210165829A1 (en) Intelligent serendipitous document discovery notifications
US20170068906A1 (en) Determining the Destination of a Communication
US11922188B2 (en) Intelligent home screen of cloud-based content management platform
US20100223581A1 (en) Visualization of participant relationships and sentiment for electronic messaging
US10783181B1 (en) Systems and methods for digital content provision
CN107660295B (zh) 剧集及时通知
US20180247214A1 (en) Network node analysis and link generation system
US20200012727A1 (en) Organizing objects in a feed to facilitate interaction between fans and content owners
US11074515B2 (en) Query and ranking prediction using network action
US9952748B1 (en) Contextual recommendations based on interaction within collections of content
US9705966B1 (en) Story development and sharing architecture
US11797880B1 (en) Systems and methods for digital content provision
EP3433731A1 (en) Computerized content recommendation based on container interactions
US10713267B1 (en) Network analysis system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination