CN115398421A - 在屏幕共享时的内容识别 - Google Patents

在屏幕共享时的内容识别 Download PDF

Info

Publication number
CN115398421A
CN115398421A CN202180027217.XA CN202180027217A CN115398421A CN 115398421 A CN115398421 A CN 115398421A CN 202180027217 A CN202180027217 A CN 202180027217A CN 115398421 A CN115398421 A CN 115398421A
Authority
CN
China
Prior art keywords
content item
content
communication session
participants
shared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180027217.XA
Other languages
English (en)
Inventor
E·R·塞克索尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN115398421A publication Critical patent/CN115398421A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/176Support for shared access to files; File sharing support
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1822Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1827Network arrangements for conference optimisation or adaptation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1069Session establishment or de-establishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/155Conference systems involving storage of or access to video conference sessions

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

在本文中由数据处理系统执行的用于在多个参与者的多个计算设备之间进行通信会话的技术包括:在多个参与者的多个计算设备之间建立通信会话,其中,与所述通信会话相关联的媒体内容被提供给所述多个参与者的所述计算设备中的每个计算设备;经由网络连接从第一参与者的所述计算设备接收第一媒体流,所述第一媒体流包括要与所述多个参与者共享的第一内容项的呈现;对所述第一媒体流的像素数据执行图像分析,以识别所述第一内容项的特征;基于所述第一内容项的所述特征来识别与所述第一内容项相关联的第一文件;以及向所述参与者提供对与第所述一内容项相关联的所述第一文件的访问。

Description

在屏幕共享时的内容识别
背景技术
常规的通信平台提供了一种用于进行在线通信会话的环境,其中,参与者中的至少一部分参与者可以彼此远离地定位,并且可以与通信会话的其他参与者共享音频和/或视频内容。一些常规的通信平台促进“屏幕共享”,其中,第一参与者可以与通信会话的其他参与者共享第一参与者的计算设备的桌面或类似工作空间的至少一部分的呈现和/或在第一参与者的计算设备上运行的应用窗口的呈现。第一参与者可以与其他参与者共享内容项,诸如但不限于幻灯片演示或文档。通信会话的参与者可能希望稍后参考共享内容。然而,除非共享内容的参与者将内容分发给通信会话的参与者,否则共享的内容常常对其他参与者是不可用的。对于通信平台,针对新的和批准的机制的重要领域是自动地识别在通信会话期间共享的内容项,并且向通信会话的参与者提供对内容项的访问。
发明内容
根据本公开的示例性数据处理系统可以包括处理器以及存储可执行指令的计算机可读介质。所述指令使得所述处理器执行包括以下的操作:在多个参与者的多个计算设备之间建立通信会话,其中,与所述通信会话相关联的媒体内容被提供给所述多个参与者的所述计算设备中的每个计算设备;经由网络连接从所述多个参与者中的第一参与者的所述计算设备接收第一媒体流,所述第一媒体流包括要与所述多个参与者共享的第一内容项的呈现;对所述第一媒体流的像素数据执行图像分析以识别所述第一内容项的特征;基于所述第一内容项的所述特征来识别与所述第一内容项相关联的第一文件;以及向所述通信会话的所述参与者提供对与所述第一内容项相关联的所述第一文件的访问。
根据本公开的一种由数据处理系统执行以用于在多个参与者的多个计算设备之间进行通信会话的示例性方法,包括:在多个参与者的多个计算设备之间建立通信会话,其中,与所述通信会话相关联的媒体内容被提供给所述多个参与者的所述计算设备中的每个计算设备;经由网络连接从所述多个参与者中的第一参与者的所述计算设备接收第一媒体流,所述第一媒体流包括要与所述多个参与者共享的第一内容项的呈现;对所述第一媒体流的像素数据执行图像分析以识别所述第一内容项的特征;基于所述第一内容项的所述特征来识别与所述第一内容项相关联的第一文件;以及向所述通信会话的所述参与者提供对与所述第一内容项相关联的所述第一文件的访问。
根据本公开的示例性存储器设备存储指令,所述指令当在数据处理系统的处理器上运行时,使得所述数据处理系统通过以下操作在多个参与者的多个计算设备之间进行通信会话:在多个参与者的多个计算设备之间建立通信会话,其中,与所述通信会话相关联的媒体内容被提供给所述多个参与者的所述计算设备中的每个计算设备;经由网络连接从所述多个参与者中的第一参与者的所述计算设备接收第一媒体流,所述第一媒体流包括要与所述多个参与者共享的第一内容项的呈现;对所述第一媒体流的像素数据执行图像分析以识别所述第一内容项的特征;基于所述第一内容项的所述特征来识别与所述第一内容项相关联的第一文件;以及向所述通信会话的所述参与者提供对与所述第一内容项相关联的所述第一文件的访问。
提供本发明内容是为了以简化形式介绍概念的选择,这些概念将在下文的详细描述中进一步描述。本发明内容并非旨在识别所要求保护的主题的关键特征或基本特征,也并不旨在用于限制所要求保护的主题的范围。此外,所要求保护的主题并不限于解决在本公开的任何部分中指出的任何或所有缺点的实现方式。
附图说明
附图仅通过示例而非限制的方式描绘了根据本教导的一种或多种实现方式。在图中,相似的附图标记指代相同或相似的元件。此外,应当理解,附图不一定按比例绘制。
图1A、1B、1C、1D、1E、1F、1G、1H、1I、1J、1K、1L和1M是图示了可以在通信会话中的参与者的客户端设备上显示的用户界面的示例的图。
图2示出了可以实现在本文中所公开的技术的示例性计算环境。
图3是可以由在图2中所示的通信平台实现的示例性通信会话管理单元的框图。
图4是可以在图2中所示的客户端设备上实现的示例性通信会话管理应用的框图。
图5是示出了由用于进行通信会话的数据处理系统执行的示例性过程的实现方式的流程图。
图6是示出了示例性软件架构的框图,其各个部分可以与在本文中所描述的各种硬件架构结合使用,其可以实现在本文中所描述的特征中的任意特征;以及
图7是示出了被配置为从机器可读介质读取指令并且执行在本文中所描述的特征中的任意特征的示例性机器的组件的框图。
图8示出了用于存储针对通信会话的信息的示例性数据结构。
图9示出了用于存储针对通信会话的会议概要信息的示例性数据结构。
图10是示出了可以生成以支持通信会话的示例性媒体流的图。
图11示出了可以由通信平台的共享内容识别单元用于识别共享和/或相关内容项的示例性孪生神经网络(SNN)。
具体实施方式
在以下详细描述中,通过示例的方式阐述了许多具体细节,以便提供对相关教导的透彻理解。然而,应当明显的是,可以在没有这样的细节的情况下实践本教导。在其他情况下,公知的方法、过程、组件和/或电路已经在没有细节的相对较高的水平上进行了描述,以避免不必要地模糊本教导的各方面。
提供了用于在屏幕共享的同时提供内容识别的技术。这些技术可以通过使得用户能够参与在线通信会话的通信平台来实施,诸如但不限于用于商业的Microsoft Teams或Microsoft Skype。在本文中所公开的技术解决了如何有效地向通信会话的参与者提供对由所述通信会话的参与者共享的内容项的访问的技术问题。在由常规的通信平台提供的通信会话中,参与者必须记住经由电子邮件或者其他方式将共享的内容项手动地传播给通信会话的其他参与者。其他参与者常常无权访问所述共享的内容项。因此,如果共享所述内容项的参与者不记得手动地共享该内容项,则所述会议的其他参与者可能无法访问可以从通信会话传达重要信息的该资源。在本文中所公开的技术通过分析从所述通信会话的所述参与者的所述客户端设备接收到的一个或多个媒体流的像素数据来提供对该问题的技术解决方案。所述通信平台能够从该像素数据中提取所述内容项的特征,并且将这些特征与所述通信平台能访问的文档的特征相关以识别与共享的内容项相关联的文件。如果所述通信平台能够识别与所述共享的内容项相关联的文件,则所述通信平台可以向所述通信会话的所述参与者自动地提供对所述共享的内容项的访问。所述通信平台可以将到所述内容项的链接或者所述内容项的副本分发给所述参与者中的每个参与者和/或将所述内容项的副本存储在所述通信会话的所述参与者中的每个参与者能访问的服务器上的存储器位置中。
在本文中所公开的技术为通信会话的参与者提供了若干技术益处。所述通信平台通过自动地识别共享和/或相关的内容项并且向所述通信会话的所述参与者提供对那些内容项的访问来提供经改善的用户体验。自动地识别共享的和/或相关的内容项并且向所述通信会话的参与者提供经改善的信息传播。此外,所述通信平台可以将所述共享和/或相关的内容项的副本存储在会议概要中,所述会议概要在所述通信会话已经完成之后仍然存在,以提供集中的信息库,参与者可以在所述通信会话已经完成之后很久才回顾所述信息库。
图1A-1M示出了可以在由通信平台提供的通信会话的参与者的客户端设备的显示器上呈现的通信平台应用的用户界面110的各个方面。所述客户端设备可以由客户端设备205来实现,并且所述通信平台可以由在图2中所图示的通信平台230来实现,这两者都将在下文的示例中更详细地描述。用户界面110可以由在所述客户端设备上运行的应用(诸如在图2中所图示的通信平台应用245) 在所述参与者的所述客户端设备上呈现。所述通信平台应用可以替代地是具有用户界面的基于云的应用235,所述用户界面可以作为网页被提供给所述参与者的所述客户端设备,以用于在所述客户端设备上的浏览器应用中呈现。
用户界面100包括能够被用于呈现与在线通信会话相关联的内容的内容窗格115。在图1A中,内容窗格115包括表示所述会议的三个参与者的呈现:Anne、Caleb和Jae。这些表示可以利用该示例性实现方式中的所述参与者中的每个参与者的名字进行标记。所述参与者中的每个参与者的所述表示可以是所述参与者中的每个参与者的静止照片和/或可以是由所述参与者的客户端设备捕获的所述参与者中的相应参与者的视频流。在该示例中,用户界面100包括会议概要部分120,会议概要部分120能够被用于显示与所述在线通信会话相关的内容。在图1A中所示的示例包括抄本部分 125、内容部分130和文件部分135。抄本部分125能够被用于显示所述通信会话的抄本的至少一部分和/或到所述抄本的链接,所述链接可以由用户点击或者以其他方式激活以使得用户界面100显示所述抄本。所述通信平台可以被配置为使用自然语言处理技术处理从所述通信会话的所述参与者的所述客户端设备中的每个客户端设备接收到的媒体流,以生成包括在所述通信会话期间发生的所述会话的文本表示的抄本。在一些实现方式中,所述通信平台可以被配置为识别在整个所述通信会话期间哪个参与者正在特定时间讲话。所述抄本可以被划分为片段,每个片段都利用标签进行注释,所述标签指示哪个参与者正在针对所述抄本的每个片段讲话。
内容部分130可以被用于显示在所述通信会话期间共享的内容。例如,如果第一参与者与所述通信会话的所述参与者共享幻灯片演示,则可以根据在本文中所公开的技术自动地识别所述幻灯片演示并且将其分发给所述通信会话的所述参与者。将所述内容分发给所述通信会话的参与者的一种方式是通信平台将所述内容的副本或链接与所述通信会话相关联,并且所述通信会话的所述参与者能够经由所述通信平台应用来访问与所述通信会话相关联的所述内容。图8和图9分别示出了可以被用于表示所述通信会话和与通信会话相关联的会议概要信息的数据结构的示例。这些数据结构将在随后的其中内容和文件与所述通信会话相关联的示例中更详细地描述。除了或者替代将内容与所述通信会话相关联,将内容分发给所述通信会话的参与者的另一种方式是经由电子邮件、文本消息和/或其他方式向所述参与者中的每个参与者发送内容的副本或者到内容的链接。所述通信平台可以通过网络连接将所述内容的副本推送到所述通信会话的所述参与者中的每个参与者的所述客户端设备上的所述通信平台应用。内容部分135可以包括上传按钮170以允许参与者将共享的内容上传到会议概要120的内容部分130。图1J和图1K将在下文的示例中更详细地讨论。
文件部分135可以被用于显示可能与所述通信会话的所述内容相关或有关但是在所述通信会话期间未共享的内容。在文件部分135中所包括的所述内容可以由所述通信平台使用在本文中所公开的技术自动地识别。以下示例包括讨论所述通信平台可以如何识别可能与所述通信会话的内容相关和/或有关的文件的额外细节。文件部分135也可以包括已经由所述通信会话的一个或多个参与者上传的文件。所述通信平台应用的用户界面110可以提供允许通信会话的参与者在所述通信会话之前、期间和/或之后上传与所述通信会话相关联的文件的元素。在所述在线会议已经发生之后,所述通信会话可以持续至少预定时间段,以允许参与者访问与所述通信会话相关联的这样的内容和/或文件。所述通信会话平台可以允许参与者恢复在线会议。例示说明了文件如何与所述通信会话相关联以及如何添加到与所述通信会话相关联的会议概要信息的示例将关于图8和图9更详细地讨论。文件部分135可以包括上传按钮175以允许参与者将内容上传到会议概要120的文件部分135。图1L和图1M将在以下示例中更详细地讨论。
图1B图示了用户界面110的示例,在其中在图1A中图示的在线会议继续,并且参与者Anne 与参与者Jae和Caleb共享其屏幕。在该示例中的共享的内容是用于月度计划会议演示的幻灯片集合。在内容窗格115中呈现了所述共享的内容。所述通信平台可以被配置为在从客户端设备接收的媒体流中检测参与者何时共享内容项,以对所述第一媒体流的像素数据执行图像分析来识别所述第一内容项的特征,识别与所述共享的内容项相关联的文件,以及向所述通信会话的所述参与者提供对与所述内容项相关联的所述文件的访问。
图1C示出了用户界面110的示例,其中,在图1B中所图示的所述在线会议可以继续,并且参与者Anne继续与参与者Jae和Caleb共享其屏幕。在图1C中所图示的示例中,所述通信平台已经开始生成针对所述在线通信会话的所述抄本。在该示例性实现方式中,可以在所述在线通信会话发生时基本实时地生成所述抄本,并且可以将所述抄本的副本和/或到所述抄本的链接添加到会议会话部分120的抄本部分125。在其他实现方式中,可以在完成所述在线会议会话之后生成所述抄本,并且一旦可用,则所述抄本可以被添加到会议会话部分120的抄本部分125。
所述通信平台可以在所述通信平台的一个或多个数据处理系统的存储器中维护通信会话信息,以跟踪所述通信会话和与所述通信会话相关联的内容。图8和图9提供了所述通信平台可以使用维护通信会话信息的示例性数据结构。这些数据结构可以被存储在关系数据库或者其他可搜索和可更新的数据存储中,其允许所述通信平台为通信会话创建新条目并且访问或修改针对现有通信会话的记录。
图8示出了用于存储针对每个通信会话的信息的示例性通信会话信息810数据结构。通信会话信息810可以包括独有地标识所述通信会话的会话标识符和标识所述通信会话的所述参与者中的每个参与者的参与者信息。所述参与者信息可以包括针对被邀请参加所述在线通信会话但是无法出席所述会议的参与者的信息。所述通信平台可以允许这些参与者访问与所述通信会话相关联的所述内容和/或文件,即使其无法出席。
图9示出了可以由所述通信平台用于存储与所述通信会话相关联的信息的示例性会议概要信息910数据结构。在一些实现方式中,会议概要信息910可以被包含在通信会话信息810中。在其他实现方式中,诸如示例,会议概要信息910可以由所述通信平台作为单独的记录来维护。返回参考图1C,可以在所述会议进行时基本实时地创建所述在线通信会话的所述抄本。所述通信平台可以创建针对所述通信会话的会议概要信息910记录(如果尚不存在的话),并且将抄本信息添加到标识所述抄本的位置的会议概要信息910。所述会议概要信息包括存储所述抄本的文件位置。所述会议概要信息也可以包括针对要被包含在用户界面110的内容部分130中的文件的内容信息和针对要被包含在用户界面110的文件部分135中的文件的文件信息。会议概要信息910可以包括针对要被包含在内容部分130和文件部分135中的文件的标题和文件位置。
在图1D中所图示的示例中,来自2020年3月的月度计划会议幻灯片文档的幻灯片被显示在用户界面110的内容窗格115中。在图1D中所图示的示例示出了来自前述示例的月度计划会议的示例,其中,所述通信平台已经将内容项添加到内容部分130。在该示例中,所述在线通信会话已经完成,但是所述在线通信会话的所述参与者可以仍然访问与被存储在所述通信平台上的所述通信会话相关的内容。
内容部分130中的第一项是会议记录。所述通信平台可以生成所述会议的音频记录和/或视频记录,其用作所述通信会话的记录,随后可以由所述通信会话的所述参与者来回放。除了所述会议记录之外,在图1C中所共享的2020年3月的月度计划会议的幻灯片演示已经由所述通信平台使用将在以下示例中更详细讨论的技术来识别。
与2020年3月的月度计划会议相关联的所述文件已经与所述通信会话相关联,并且可供所述通信会话的参与者访问。所述参与者可以下载所述文件以允许所述参与者在所述客户端设备上或者在另一计算设备上查看所述文件的所述内容。也可以通过点击内容部分130中的所述文件的表示来访问被显示在用户界面110的内容窗格115中的文件。在图1D中所示的示例中,包括所述幻灯片的所述文件已经被更新以包括为针对所述幻灯片中的每张幻灯片讨论的通信会话的抄本125的一部分。例如,所述幻灯片演示可以包括允许将注释添加到所述幻灯片中的每张幻灯片的注释部分。所述通信平台可以被配置为确定在所述通信会话期间的特定时间期间正在显示哪张幻灯片,并且将该时间段与在所述时间段期间发生的所述讨论的抄本的相关部分相关联。能够将所述抄本的相关部分插入到所述文档的注释部分中,如在图1D中所示的。尽管在图1D中所图示的示例包括在其中插入了相关的抄本部分的幻灯片集合,但是所述抄本的部分也可以被插入到其他类型的文档中。例如,如果在所述会议期间共享了文本文档,则可以将所述抄本的一部分作为评论或注释插入到所述文档,在所述文档中在与所述抄本的所述部分相对应的所述通信会话的时间段期间显示的位置处。
文件部分135也包括所述通信平台识别为与月度计划会议相关的两个文件的表示。第一文件是2020年度项目目标幻灯片的集合,并且第二文件是项目X白皮书。所述通信平台基于在所述通信会话期间共享的所述内容的特征,将这些文件识别为可能与月度计划会议相关。由所述通信平台用于识别在文件部分135中所显示的文件的技术将在以下示例中更详细地讨论。
图1E示出了另一示例性实现方式,其中,可以更新抄本125以包括在所述通信会话期间共享的内容项的部分。在图1E中所图示的示例中,抄本125的所述内容被显示在内容窗格125中,并且抄本125已经被更新为包括来自在所述通信会话期间讨论的2020年3月计划会议幻灯片的幻灯片。可以通过点击抄本125而在用户界面110的内容窗格115中查看抄本125。参与者也可以经由用户界面110来访问通信会话,并且下载抄本125以在所述通信平台应用的外部查看。
所述通信平台可以被配置为基于内容项的相应部分被共享的时间,将所述共享的内容的部分与所述抄本的部分相关。在图1E中所图示的示例中,来自2020年3月的月度计划会议幻灯片中的针对“项目X”的幻灯片已经被添加到所述抄本。所述通信平台可以被配置为通过分析从参与者共享所述内容项的客户端设备接收到的媒体流的像素数据来识别在所述通信会话期间共享的文档部分。所述内容项的共享的部分的特性能够与所述文档相关以识别相关部分。例如,可以识别来自幻灯片集合中的一张幻灯片或幻灯片集合并且将其添加到抄本,或者可以将来自文档的一个段落或段落集合或者一个页面或页面集合添加到所述抄本。文档可以包括可以被复制到所述抄本的文本和/或图像内容。在一些实现方式中,除了或替代来自所述内容项的摘录,可以将到所述内容项的链接添加到所述抄本。在所述通信平台无法识别与在所述通信会话期间共享的所述内容项相关联的所述文件的情况下,所述通信平台可以将从所述媒体流的所述像素数据中提取的图像添加到所述抄本中,而不是从所述文档提取的部分。
图1F示出了用于已经完成的通信会话的用户界面110的示例。所述通信平台可以被配置为允许参与者稍后访问被包含在该概要页面上的通所述信会话信息。参与者可以将额外文件添加到文件部分135以与通信会话的其他参与者共享。参与者也可以经由来自内容部分130的抄本和/或内容项。用户界面110可以在内容窗格115中显示所述抄本,如在图1E的示例中,或者在内容窗格115中的其他内容项,如在图1D的示例中。概要屏幕也可以包括额外信息(未示出),诸如哪些参与者加入了所述在线通信会话、所述在线通信会话的日期和时间、所述通信会话的持续时间、关于哪些参与者共享和/或上传与所述通信会话相关联的文件的信息。
图1G示出了可以与用户界面110一起使用以提示参与者上传共享的内容的上传共享内容界面 140的示例。通信平台230可以识别在所述通信会话期间共享的内容,并且向所述参与者提供机会以向所述通信会话的所述参与者提供对该内容的访问。上传共享内容界面140可以被显示给在所述通信会话期间共享内容的参与者。在参与者尚未授权自动文件上传在演示期间共享的内容项的情况下,可以向所述参与者显示上传共享内容界面140。在一些实现方式中,所述通信平台可以允许参与者配置应用于其用户会话的通信平台的各种操作参数。例如,参与者可能能够将所述通信平台配置为自动地上传用户在通信会话期间共享的任何内容项。如果该选项对于特定参与者不可用或者被关闭,则所述通信平台可以提示所述参与者上传所述内容项。在所述参与者经由其客户端设备上的通信平台应用正在参与所述通信会话的实现方式中,所述通信平台应用可以经由网络连接向所述通信平台应用发送信号以使得所述通信平台应用显示上传共享界面140。在所述参与者经由基于云的应用正在参与所述通信会话的实现方式中,所述通信平台能够使得基于所述云的应用呈现上传共享内容界面140。
在图1G中所图示的示例中,所述通信平台已经识别出与在前述示例中所图示的通信会话相关的单个文档。所述通信平台将文件“2020年3月计划会议.ppt”识别为已经被所述参与者共享。如果所述通信平台已经识别出共享的多于一个的内容项,则上传共享文件接口140可以包括多个内容项。如果参与者不希望上传特定内容项,则参与者可以取消选中内容项旁边的复选框,或者可以点击“取消”按钮以取消对任何内容项的上传。参与者可以点击“上传内容”按钮以使得所述通信平台将(一个或多个)内容项的副本上传到与所述通信平台相关联的存储位置,所述通信会话的参与者可以从所述存储位置访问所述内容项。所述通信平台可以更新与所述通信会话相关联的会议概要信息910以包括与所述内容项的上传副本相关联的标题、文件名、文件位置、文件类型和/或其他信息。
图1H示出了可以与用户界面110一起使用以提示参与者上传所述通信平台已经识别为可能与所述通信会话相关或有关的内容的上传相关内容界面145的示例。通信平台230可以识别可能与所述通信会话相关的内容,并且向参与者提供机会以向所述通信会话的参与者提供对该内容的访问。上传相关内容界面145可以被用于填充会议概要120的文件部分135。在一些实现方式中,所述通信平台可以向会议组织者显示上传相关内容界面145以允许会议组织者确定是否将相关内容与所述通信会话相关联。在上传相关内容界面145上列出的相关文件可以由所述通信平台使用将在以下示例中详细描述的各种技术来识别。
在图1H中所图示的示例中,所述通信平台已经识别了可能与在前述示例中例示说明的所述通信会话相关的两个文档。所述通信平台将“2020年度项目目标幻灯片.ppt”和“项目X白皮书”识别为与所述通信会话相关的内容。如果所述通信平台已经识别了被共享的超过一个的内容项,则上传相关内容界面145可以包括多个内容项。如果参与者不希望上传特定内容项,则参与者可以取消选中内容项旁边的复选框,或者可以点击“取消”按钮以取消对任何内容项的上传。参与者可以点击“上传内容”按钮以使得所述通信平台将(一个或多个)内容项的副本上传到与所述通信平台相关联的存储位置,所述通信会话的参与者可以从所述存储位置访问所述内容项。所述通信平台可以更新与所述通信会话相关联的会议概要信息910以包括与所上传的所述内容项的副本相关联的标题、文件名、文件位置、文件类型和/或其他信息。
在图1I中所图示的示例中,所述通信平台已经确定参与者在通信会话中进行了屏幕共享,但是无法定位到被共享的内容项。在图1I中,可以向参与者显示上传共享内容界面150。参与者被要求上传在所述通信会话期间共享的一个内容项或多个内容项。用户可以点击“取消”按钮以取消对任何内容项的上传。否则,用户可以点击“选择内容”按钮以选择与一个或多个共享的内容项相关联的一个或多个文件。一旦用户已经选择了内容项,则在图1K示出上传共享内容界面160,其类似于上传共享内容界面140。如果所述通信平台已经识别出被共享的超过一个的内容项,则上传共享文件界面140可以包括多个内容项。如果参与者不希望上传特定内容项,则参与者可以取消选中内容项旁边的复选框,或者可以点击“取消”按钮以取消对任何内容项的上传。参与者可以点击“上传内容”按钮以使得通信平台上传(一个或多个)内容项的副本。
在图1J中所图示的示例中,响应于参与者点击与会议概要120的内容部分130相关联的按钮 170,所述通信平台可以显示上传共享内容界面160。参与者被要求上传要使得对所述通信会话的参与者可用的一个或多个内容项。用户可以点击“取消”按钮以取消对任何内容项的上传。否则,用户可以点击“选择内容”按钮以选择与一个或多个共享内容项相关联的一个或多个文件。一旦用户已经选择了内容项,就可以显示在图1K中所图示的上传共享内容界面160,其可以被用于上传如在前文示例中所讨论的所选择的内容项。
在图1L中所图示的示例中,响应于参与者点击与会议概要120的文件部分135相关联的按钮 175,所述通信平台可以显示上传相关内容界面165。参与者被要求上传要使得对通信会话的参与者可用的一个或多个内容项。用户可以点击“取消”按钮以取消对任何内容项的上传。否则,用户可以点击“选择内容”按钮以选择与一个或多个共享内容项相关联的一个或多个文件。一旦用户已经选择了内容项,就可以显示在图1M中所图示的上传共享内容界面180,其可以被用于上传所选择的内容项。参与者可以点击“上传内容”按钮以使得通信平台上传(一个或多个)内容项的副本。经上传的内容项将被显示在会议概要120的文件部分135下,所述文件部分对所述通信会话的参与者中的每个参与者都是可用的。
参与者的用户界面110可以随着内容项被上传到在前述示例中所讨论的会议概要120的部分中的任何部分而动态地更新。
图2示出了可以在其中实现在本文中所公开的技术的示例性计算环境200。计算环境200可以包括通信平台230、网络220、内容存储服务240、转录服务250和客户端设备205a-205c。网络220 可以包括一个或多个公共和/或专用网络,并且可以至少部分地由互联网来实施。
客户端设备205a-205c是可以具有呈现和/或捕获与通信会话相关联的一种或多种类型的媒体流的能力的计算设备。这样的媒体流可以包括音频、视频、图像、文本内容和/或其他类型的内容。基于相应远程设备的硬件和/或软件配置,客户端设备205a-205h中的每个客户端设备可以具有不同的能力。尽管在图2中所图示的示例包括三个客户端设备,但是通信会话可以包括少于三个客户端设备或者可以包括多于三个客户端设备。客户端设备205a-205c可以被实现为便携式电子设备,诸如移动电话、平板计算机、膝上型计算机、便携式数字助理设备、便携式游戏控制台和/或其他这样的设备。客户端设备205a-205h也可以在具有其他形状因子的计算设备中实现,诸如车载计算系统、视频游戏控制台、台式计算机和/或其他类型的计算设备。
客户端设备205a-205c可以包括促进在客户端设备与通信平台230之间的通信的通信平台应用 245。所述通信平台应用可以经由通信平台230提供实时语音通信、视频通信、基于文本的通信或者其组合。也可以使用客户端应用来共享其他类型的内容,诸如文件和/或其他内容。所述应用可以被配置为经由网络220接收与所述通信会话相关联的媒体流,并且经由所述计算设备的一个或多个用户界面组件来呈现那些媒体流。计算设备205a-205c可以包括一个或多个输入组件,包括麦克风和/ 或其他音频输入组件、相机或其他图像和/或视频输入组件、键盘、触摸屏界面和/或其他输入设备以用于接收文本和/或其他输入。应用可以处理来自输入组件的输入以生成一个或多个媒体流,所述媒体流包括与使用计算设备的通信会话的参与者相关联的内容,并且可以将一个或多个媒体流发送给通信平台230。应用也可以被配置为向通信平台230发送信号,请求允许参与者加入由通信平台230托管的通信会话。在一些实现方式中,应用可以是被托管在通信平台230上的基于云的应用235,并且通信平台230可以提供由客户端设备上的网络浏览器或者其他类似应用呈现的用户界面。基于云的应用235的功能可以与通信平台应用245的功能基本相同。
在通信会话期间,通信平台230可以从客户端设备205a-205c中的每个客户端设备接收一个或多个媒体流。所述通信平台可以通过对(一个或多个)媒体流的像素数据执行图像分析来分析从客户端设备接收到的(一个或多个)媒体流,以识别由所述通信会话的参与者共享的第一内容项的特征。所述媒体流可以包括音频、视频、图像、文本内容和/或其他类型的媒体流。
如至少在图1B和图1C中所图示的示例中所图示的,参与者可以与通信会话的其他参与者共享内容项。与该参与者相关联的客户端设备205可以生成包括共享内容项的视频和/或一系列静止图像的媒体流。可以经由通信平台230基本上实时地生成媒体流并且将其传输给通信会话的其他参与者。通信平台230可以被配置为从客户端设备205a-205c中的每个客户端设备接收(一个或多个) 媒体流。
图10示出了说明可以被生成以支持通信会话的示例性媒体流的图。客户端设备205a-205b可以生成一个或多个客户端设备媒体流1010a、1010b和1010c。通信平台230可以接收(一个或多个) 客户端设备媒体流1010a、1010b和1010c并且生成(一个或多个)共享媒体流1020,共享媒体流 1020被传输到通信会话的参与者中的每个参与者。通信平台230可以将从客户端设备205a、205b 和205c接收到的音频合并成单个音频流,所述音频流在一个流中包括来自所有参与者的所有音频。通信平台230可以将从客户端设备205a、205b和205c接收到的视频内容合并成单个视频流。所述视频流可以包括被允许并且参与私人通信子会话的参与者中的每个参与者的表示,或者可以包括被确定为正在讲话的参与者的表示。所述视频流也可以包括正在由所述通信会话的参与者共享的内容项的呈现。通信平台应用245然后可以在用户界面110中呈现(一个或多个)共享媒体流1020的内容的至少一部分。在一些实现方式中,来自(一个或多个)共享媒体流的内容可以被显示在用户界面110的内容窗格115中。
内容存储服务240是基于云的服务,其可以可选地用于代表通信会话的参与者中的一个或多个参与者和/或代表通信平台230来存储内容项。内容存储服务240可以提供对内容项的在线存储、对内容项的共享、用于将内容恢复到客户端设备的备份和恢复服务和/或其他服务。在一些实现方式中,内容存储服务240可以由
Figure BDA0003878002330000081
实现或者可以由
Figure BDA0003878002330000082
实现。
转录服务250是基于云的服务,其可以可选地用于生成针对通信会话的抄本125。通信平台 230可以将与所述通信会话相关联的一个或多个音频流传输到转录服务250,并且转录服务250可以将抄本125传输到通信平台230。通信平台230可以被配置为执行对被提供给转录服务250的(一个或多个)音频流的预处理。例如,通信平台230可以使用免费无损音频编解码器(FLAC)对(一个或多个)音频流进行编码,所述FLAC提供对所述音频信号的无损压缩或者由转录服务250支持的另一种编码。抄本125可以提供参与者在通信会话期间所说的内容的书面记录。转录服务250可以被配置为提供不仅包括在通信会话期间所说的内容而且也包括在通信会话期间谁所说的内容的日记化的抄本。在一些实现方式中,转录服务250的功能可以由通信平台130来实现。在一些实现方式中,转录服务250可以基本实时地生成针对所述通信会话的抄本。当从客户端设备205接收到客户端设备媒体流1010时,通信平台230可以将一个或多个音频流传输到转录服务250。转录服务250 可以持续地更新抄本125,并且随着抄本被更新而将经更新的版本发送给通信平台230。
图3是可以由通信平台230实现的示例性通信会话管理单元305的框图。通信会话管理单元 305可以包括调度单元310、认证单元315、流生成单元320、流分析单元325、用户界面单元330、共享内容识别单元335、相关内容识别单元340以及操作参数配置单元345。通信会话管理单元305 能够由处理器可执行程序代码、硬件或者其组合来实现,并且可以由图6的示例性软件架构600和/ 或在图7中所图示的示例性计算设备700来实现。
调度单元310可以被配置为提供用于调度在线会议或者其他这样的通信会话的单元。调度单元310可以提供界面,用户可以通过所述界面来邀请一个或多个参与者参加所述在线会议。调度单元310可以接收调度单元310可以用于以电子方式向一个或多个参与者发送邀请的联系信息,诸如用户电子邮件地址或者其他联系信息。调度单元310也可以被配置为接收来自参与者的响应,所述响应指示参与者是否已经接受了对所述在线通信会话的邀请。调度单元310也可以为参与者提供提议针对所述在线通信会话的替代日期和/或时间的能力。
认证单元315可以被配置为响应于来自参与者的客户端设备205的、被允许进入通信会话的请求来认证参与者。认证单元315可以被配置为接受被包括在要被允许进入通信会话的请求中的参与者标识符和会话标识符,以确定所述参与者是否应当被允许进入所述通信会话。在一些实现方式中,认证单元315可以请求针对参与者的认证凭证(诸如用户名和密码)以认证用户。公司或其他实体可以使用这样的配置来确保未被授权参与所述通信会话的第三方没有获得对所述通信会话的邀请。认证单元315也可以支持其他认证技术,诸如但不限于联合认证,以用于确定参与者的身份。
流生成单元320可以被配置为从通信会话的参与者的客户端设备205接收一个或多个媒体流,并且基于所接收到的媒体流来生成一个或多个媒体流。流生成单元320可以被配置为接收(一个或多个)客户端设备媒体流1010a、1010b和1010c并且生成(一个或多个)共享媒体流1020,所述(一个或多个)共享媒体流1020被传输到所述通信会话的参与者中的每个参与者,如在图10中所图示的。流生成单元320也可以生成一个或多个音频流以传输到转录服务240。通信平台230可以将从客户端设备205a、205b和205c接收到的音频合并成单个音频流,所述音频流在一个流中包括来自所有参与者的所有音频。通信平台230可以将从客户端设备205a、205b和205c接收到的视频内容合并成单个视频流。所述视频流可以包括被允许和参与私有通信子会话的参与者中的每个参与者的表示,或者可以包括被确定为正在讲话的参与者的表示。所述视频流也可以包括正在由通信会话的参与者共享的内容项的呈现。
流分析单元325被配置为对从客户端设备205接收到的一个或多个媒体流的像素数据执行图像分析以识别共享内容项的特征。在一些实现方式中,所述通信平台的通信平台应用235或者参与者的客户端设备205的通信平台应用245可以向通信平台230提供参与者正在屏幕共享的指示,这可以触发流分析单元325开始分析从该参与者的计算设备接收到的媒体流,并且也可以触发流生成单元320以为所述参与者中的每个参与者生成包括共享内容的媒体流。用户界面110可以包括允许参与者发起屏幕共享的按钮或者其他用户界面元素,以及允许参与者结束屏幕共享的按钮或者其他用户界面元素。
流分析单元325可以被配置为从一个或多个媒体流提取像素数据,并且识别所提取的像素数据中的共享内容项的特征。为了识别内容项的文本元素,流分析单元325可以被配置为对所提取出的像素数据执行一种或多种文本识别技术以识别所述内容项的文本特征。流分析单元325可以利用一种或多种光学字符识别(OCR)技术、一种或多种光学字识别技术、一种或多种智能字符识别(ICR) 技术和/或一种或多种智能字识别(IWR)识别技术。流分析单元325可以使用被训练用于识别图像中的文本内容的一个或多个机器学习模型来从像素数据中提取文本信息。所提取出的文本信息可以包括由通信会话的参与者共享的内容项的标题、头部、文本内容和/或其他文本元素。流分析单元325 可以被配置为生成像素数据的数学表示,所述像素数据表示在与共享的内容项相关联的像素数据中识别出的一个或多个文本项。数学表示在本文中也被称为特征向量,并且可以被提供给一个或多个机器学习模型以识别具有相似特征的内容项和/或相关内容项。关于共享内容识别单元335和相关内容识别单元340更详细地讨论了对共享内容项和相关内容项的识别。
流分析单元325也可以被配置为从通信会话的参与者共享的内容项的像素数据中提取图像特征信息。内容项可能不仅仅包括文本内容。所述内容项可以包括照片、标志、图画、渲染、图表和/ 或其他非文本内容。流分析单元325可以被配置为分析所述像素数据并且识别在其中所包括的非文本内容。流分析单元325可以被配置为生成像素数据的数学表示,所述像素数据表示在与共享内容项相关联的像素数据中识别出的一个或多个非文本项。所述数学表示在本文中也被称为特征向量。所述数学表示可以是表示在像素数据中所包括的非文本项的各种属性的数值向量。可以将非文本项的表示与其他内容项的表示进行比较,以识别非文本内容项的来源。可以使用各种技术从像素数据中提取图像特征,诸如但不限于尺度不变特征变换(SIFT)、加速鲁棒特征(SURF)、二元鲁棒独立基本特征(BRIEF)、定向FAST和旋转BRIEF(ORB)或DAISY。在一些实现方式中,可以使用一个或多个机器学习模型来分析从媒体流中提取的特征以提取特征信息。
用户界面单元330可以被配置为生成可以由客户端设备205上的web浏览器或类似应用所呈现的用户界面,诸如在前文的示例中所例示说明的用户界面110。用户界面110允许用户参与通信会话和/或访问与通信会话相关联的内容。图1A-1M包括用户界面110的各个方面的示例。在通信平台 230提供基于云的应用以让参与者参与通信会话和/或访问与通信会话相关联的内容的实现方式中,用户界面单元330可以被配置为在针对通信平台应用235的实现方式中生成用户界面110。在这样的实现方式中,用户界面单元330可以生成可以由客户端设备205上的web浏览器或者其他应用所呈现的网页或者其他内容。在其他实现方式中,客户端设备205可以包括通信平台应用245,并且用户界面110可以在客户端设备205上生成,如将关于图4所讨论的。
共享内容识别单元335可以被配置为基于由流分析单元325确定的内容项的特征来识别与由通信会话的参与者共享的内容项相关联的文件。共享内容识别单元235可以被配置为访问一个或多个存储位置中的文件以确定被存储在一个或多个存储位置中的文件是否与通信会话的参与者共享的内容项相关。在一些实现方式中,共享内容识别单元235可以访问与共享所述内容的参与者相关联的内容存储服务240处的存储位置、与通信会话的其他参与者相关联的存储位置、与和参与者相关联的群组、团队或租着相关联的存储位置、与通信会话相关联的存储位置,或者这些存储位置中的两个或更多个存储位置的组合。
共享内容识别单元335被配置为将共享内容项的识别的特征与被存储在上文所描述的位置中的一个或多个位置中的内容项相关。所述内容项可以与所述通信会话的参与者中的一个或多个参与者、通信会话或者这两者相关联。共享内容识别单元335可以被配置为计算针对共享内容项和在上文所讨论的一个或多个位置中找到的内容项中的每个内容项的相关性分数。所述相关性分数可以提供共享内容项与在通信平台230能访问的存储位置之一中找到的特定内容项有多相似的数学表示。
共享内容识别单元335可以被配置为确定在共享内容项与共享内容识别单元335能访问的候选内容项之间的相关性分数。在一些实现方式中,针对包括与共享内容项更紧密匹配的特征的候选项的相关性分数可能更高。在其他实现方式中,所述相关性分数可以表示在候选内容项与共享内容项之间的“距离”,并且较低的相关性分数表示在候选内容项与共享内容项之间的更接近的匹配。
在一些实现方式中,共享内容识别单元335可以利用孪生神经网络(SNN)来识别共享内容项。SNN是一类神经网络,其包括两个相同的子网,其具有相同的配置以及相同的参数和权重。图 11图示了包括子网1130a和子网1130b的示例性SNN 1100。子网1130a能够对第一输入1115a进行操作,并且子网1130b能够对第二输入1115b进行操作。第一输入1115a可以是共享内容项,并且第二输入1115b可以是被存储在上文所存储的存储位置之一中的候选内容项。子网1130a和1130b 被配置为接收数值向量作为输入。能够使用词嵌入信息将第一输入1115a和第二输入1115b的文本内容从文本转换为向量化表示,所述词嵌入信息是使用与将由SNN 1100评估训练数据的域相关联的文本历史数据进行训练的。词嵌入将在下文的示例中更详细地讨论。
子网130a和130b可以被实现为各种类型的神经网络。例如,子网130a和130b可以被实现为双向长短期记忆(BiLSTM)神经网络或者其他类型的神经网络。对子网1130a和1130b的仅有限制是子网1130a和1130b必须共享相同的网络架构和配置,从而当设置有相同的输入时其将输出相同的值。其他类型的顺序神经网络可以被用于实现SNN的神经网络,诸如但不限于卷积神经网络(CNN) 或递归神经网络(RNN)。
子网130a基于第一输入1115a来输出第一输出1125a,并且子网1130b基于第二输入1115b来输出第二输出1125b。第一输入1115a可以是将被识别的共享内容项,并且第二输入1115b可以是将被认为是针对共享内容项的可能匹配的候选内容项。如上文所讨论的,流分析单元325可以被配置为分析所述内容项以生成所述共享内容项的特征的数学表示,在本文中也被称为特征向量。共享内容识别单元335可以被配置为识别位于上文所讨论的存储位置中的一个或多个存储位置的候选内容项,并且使用与流分析单元325用于生成针对共享内容项的特征向量的相同技术生成针对那些内容项中的每个内容项的特征向量。可以使用各种技术从像素数据中提取图像特征,诸如但不限于:尺度不变特征变换(SIFT)、加速鲁棒特征(SURF)、二元鲁棒独立基本特征(BRIEF)、定向FAST 和旋转BRIEF(ORB)或DAISY。可以使用各种技术从像素数据中提取文本特征,诸如但不限于:一种或多种光学字符识别(OCR)技术、一种或多种光学字识别技术、一种或多种智能字符识别(ICR) 技术和/或一种或多种智能字识别(IWR)识别技术。
子网1130a输出第一输出1125a,并且子网1130b输出第二输出1125b。所述输出可以包括输出向量,所述输出向量包括表示所述输出的各个方面的数值。第一输出1125a和第二输出1125b作为输入被提供给比较器单元1140。比较器单元1140被配置为计算在第一输出1125a与第二输出1125b 之间的“距离”,并且输出该距离作为相似度值1135(在此也被称为“相关性分数”)。SNN 1100为相似的输入产生较小的距离,而为不同的输入产生较大的距离。例如,如果候选内容项和共享内容项紧密匹配,则两个输入之间的距离应当相对较小。SNN 1100将该距离作为相似度值1145输出。所述相似度值是表示在第一输出1125a与第二输出1125b之间的距离的数值。
比较器140可以被配置为使用提供差异的数字表示的各种技术来确定在第一输出125a与第二输出125b之间的距离。在一些实现方式中,比较器单元140可以被配置为确定相似度值135并且将其输出作为第一输出125a的向量值与第二输出125b的向量值之间的余弦差。
共享内容识别单元335可以基于与所述候选内容项中的每个候选内容项相关联的相关性分数对候选内容项进行排序。共享内容识别单元235可以选择候选内容项,所述候选内容项是指示与共享内容项最接近的匹配的相关性分数。共享内容识别单元335可以针对在通信会话期间共享的内容项中的每个内容项来重复相关候选内容项的过程。
共享内容识别单元335可以将所选择的候选项的列表提供给用户界面单元330以生成在图1G 中所图示的上传共享内容界面140。共享内容识别单元335可以响应于用户激活上传共享内容界面 140上的上传内容按钮,从用户界面单元330接收要被上传到通信平台230并且与所述通信会话相关联的所选择的内容项的列表。共享内容识别单元335可以将所述内容项中的每个内容项复制到所述通信会话的参与者能访问的存储器位置。所述存储器位置可以在通信平台230上或者可以在内容存储服务240的服务器上。共享内容识别单元335也可以更新与所述通信会话相关联的会议概要信息910以包括已经被上传的一个或多个文件的位置。
相关内容识别单元340可以被配置为识别可能与所述通信会话的主题相关的一个或多个内容项。相关内容识别单元340可以被配置为从流分析单元325获得与在所述通信会话期间共享的一个或多个内容项相关联的特征数据。相关内容识别单元340也可以被配置为分析所述通信会话的抄本 125以识别可能与通信会话125相关的主题。相关内容识别单元340可以被配置为访问上文所讨论的各种存储位置以识别可能与共享内容项相关的内容项。相关内容识别单元340可以利用与上文关于共享内容识别单元335所讨论的那些技术相似的技术来将共享内容项与一个或多个候选内容项进行比较。然而,不是选择与共享内容项匹配的候选内容项,而是相关内容识别单元340可以通过候选内容项各自的相关性分数对所述候选内容项进行排名,并且选择不具有最高相关性分数的一个或多个候选内容项,而是替代地选择具有第二高、第三高或第四高相关性分数的一个或多个候选内容项。这些候选文档与共享内容项不匹配,但是与共享内容项共享了足够多的特性,以至于通信会话的参与者可能对其感兴趣。可以选择的候选内容项的数量是可配置的并且可以随实现方式而变化。
相关内容识别单元340也可以被配置为在公共可用的数据库和/或互联网上执行搜索查询,以识别可能与通信会话的主题相关的候选内容项。相关内容识别单元340可以识别抄本125和/或共享内容中的主题相关词和/或短语以用作用于构建搜索查询的术语。相关内容识别单元340可以执行一个或多个搜索查询,所述一个或多个搜索查询返回与所述通信会话相关联的候选文档。相关内容识别单元340可以将所述候选项的列表提供给用户界面单元330以生成在图1H中所图示的上传相关内容界面145。响应于用户激活在上传相关内容界面145上的上传内容按钮,相关内容识别单元340 可以从用户界面单元330接收要被上传到通信平台230并且与所述通信会话相关联的所选择的内容项的列表。相关内容识别单元340可以将所述内容项中的每个内容项复制到所述通信会话的参与者能访问的存储器位置。所述存储器位置可以在通信平台230上或者可以在内容存储服务240的服务器上。相关内容识别单元340也可以更新与所述通信会话相关联的会议概要信息910以包括已经被上传的一个或多个文件的位置。
操作参数配置单元345可以被配置为提供允许用户配置由通信平台230托管的通信会话的操作参数中的至少一些操作参数的界面。这些操作参数可以包括针对所述会议的服务质量要求,诸如音频质量和/或视频质量要求。所述操作参数也可以指示参与者是否允许所述通信平台自动地上传由共享内容识别单元335识别的共享内容和/或由相关内容识别单元340识别的相关内容。操作参数配置单元345也可以提供允许参与者配置所述通信会话的其他方面的界面,诸如是实时地还是在通信会话完成之后生成抄本、是否可以更新抄本以包括共享内容项、是否可以更新共享内容项以包括抄本的摘录、和/或与所述通信会话相关的其他操作参数。
图4是可以在客户端设备205上实现的示例性通信平台应用405的框图。通信平台应用405 可以包括调度单元410、认证单元415、流生成单元420、用户界面单元430、流分析单元425、共享内容识别单元435以及操作参数配置单元445。通信平台应用405能够由处理器可执行程序代码、硬件或者其组合来实现,并且可以由图6的示例性软件架构600和/或在图7中所图示的示例性计算设备700来实现。
通信平台应用405的调度单元410可以被配置为响应于参与者接受对通信会话中的参与者的邀请而将通信会话添加到参与者的日历。可以将所述邀请从通信平台230发送给所述参与者。
认证单元415可以被配置为经由用户界面单元430来呈现提示用户提供认证凭证的界面。认证单元415可以请求针对参与者的认证凭证(诸如用户名和密码)来认证所述用户。公司或者其他实体可以使用这样的配置来确保未被授权参与通信会话的第三方没有获得对所述通信会话的邀请。认证单元415也可以支持其他认证技术,诸如但不限于联合认证,以用于确定参与者的身份。在一些实现方式中,认证单元415可以被配置为在客户端设备205处认证用户,并且向通信平台230发送应当允许用户参与通信会话和/或访问与通信会话相关联的内容的指示。在其他实现方式中,认证单元415可以向通信平台230提供认证凭证或者从其导出的信息以认证所述用户。通信平台230可以向用户提供所述认证是否成功的指示。
流生成单元420可以被配置为:从与客户端设备205相关联的一个或多个麦克风接收音频数据,从一个或多个相机接收(一幅或多幅)图像和/或视频内容或者其组合,以及生成一个或多个媒体流以用于传输到通信平台230。流生成单元420也可以生成包括(一幅或多幅)图像和/或视频的媒体流以支持屏幕共享。(一幅或多幅)图像和/或视频可以包括被呈现在客户端设备205上的桌面的至少一部分或者与参与者想要从中共享内容的应用相关联的应用窗口。通信平台应用405的用户界面110可以包括允许参与者开始屏幕共享并且选择要共享什么内容的控件,诸如客户端设备205 的桌面的视图或者针对在客户端设备205上运行的应用的应用窗口。
流分析单元425可以被配置为与通信平台305的流分析单元325类似地操作。流分析单元425 可以分析由流生成单元420生成的一个或多个媒体流的内容以通过分析来自一个或多个媒体流的像素数据来识别共享内容项的特征。流分析单元425可以使用各种OCR和图像特征提取技术来分析所述像素数据。
用户界面单元430可以被配置为生成可以在客户端设备205的显示器上呈现的用户界面。用户界面单元430可以被配置为生成允许用户参与通信会话和/或从其客户端设备205访问与通信会话相关联的内容的用户界面110。图1A-1M是可以由用户界面单元340实现的用户界面的示例。用户界面单元430可以被配置为呈现其他用户界面来代替或补充在图1A-1M中所图示出的用户界面110 的示例中的一个或多个示例。
共享内容识别单元435可以被配置为与通信平台305的共享内容识别单元335类似地操作,除了共享内容识别单元435可以被配置为确定由参与者共享的内容项是否位于在客户端设备205的本地存储器中。如果通信平台230不能够定位与共享内容项相关联的文件,则共享内容识别单元435 从通信平台230的共享内容识别单元435接收指示。共享内容识别单元435然后可以响应于从通信平台230接收到指示来尝试识别共享内容项在客户端设备205上的位置。共享内容识别单元435可以将所选择的候选项的列表提供给用户界面单元430以生成在图1G中所图示的上传共享内容界面 140。响应于用户激活在上传共享内容界面140上的上传内容按钮,客户端设备205的共享内容识别单元435可以从用户界面单元430接收要被上传到通信平台230并且与所述通信会话相关联的所选择的内容项的列表。共享内容识别单元435可以将所述内容项中的每个内容项的副本发送给通信平台230,通信平台230可以所述该副本存储在通信会话的参与者能访问的存储器位置中。所述存储器位置可以在通信平台230上或者可以在内容存储服务240的服务器上。通信平台230也可以更新与所述通信会话相关联的会议概要信息910以包括已经从共享内容识别单元435接收到的一个或多个文件的位置。
共享内容识别单元435可以被配置为通过尝试确定当参与者正在屏幕共享时参与者在客户端设备205上激活了哪些应用来尝试识别共享内容项。共享内容识别单元435分析与共享内容相关联的像素数据以如在前文的示例中识别共享内容项的特征,但是也可以从客户端设备205的操作系统请求识别当前正在客户端设备205上运行哪些应用的信息。共享内容识别单元435可以被配置为识别可以与可以共享的内容项相关联的应用,诸如但不限于:文档查看器或编辑器、幻灯片放映或演示查看器或编辑器、图像查看器或编辑器、视频查看器或编辑器、和/或可以被用于编辑和/或查看可以由通信会话的参与者共享的内容项的其他类型的应用。共享内容识别单元435可以被配置为联系通信平台230和/或另一在线资源,诸如但不限于搜索引擎,以确定当共享内容识别单元435不包括针对该特定应用的信息时正在由客户端设备205运行什么类型的应用。共享内容识别单元435可以消除与编辑或查看可以被共享的各种类型的内容项之一无关联的应用,并且考虑可能已经被参与者用于共享内容项的应用的列表。共享内容识别单元435然后可以通过客户端设备205的持久存储设备进行搜索,诸如但不限于客户端设备205的硬盘驱动器和/或固态驱动器。共享内容识别单元435 可以被配置为响应于共享内容识别单元435识别一个或多个共享内容项目而显示图1G的上传共享内容界面140。共享内容识别单元435可以被配置为响应于共享内容识别单元435不能够识别一个或多个共享内容项而显示图1I的上传共享内容界面150。
操作参数配置单元445可以被配置为提供允许用户配置由通信平台230托管的通信会话的操作参数中的至少一些操作参数的界面。这些操作参数可以包括针对所述会议的服务质量要求,诸如音频质量和/或视频质量要求。所述操作参数也可以指示参与者是否允许通信平台自动地上传由共享内容识别单元435或者由通信平台230识别出的共享内容和/或由通信平台230识别出的相关内容。操作参数配置单元445也可以提供允许参与者配置通信会话的其他方面的界面,诸如是实时地还是在通信会话完成之后生成抄本、是否可以更新抄本以包括共享内容项、是否可以更新共享内容项以包括抄本的摘录和/或与通信会话相关的其他操作参数。操作参数配置单元445可以被配置为响应于参与者改变一个或多个操作参数而向通信平台230传输指示。
图5是图示了由数据处理系统执行的用于进行通信会话的示例性过程500的实现方式的流程图。过程500可以由通信平台230、通信会话管理单元305和/或计算设备700来实现。过程500包括识别共享内容和/或针对通信会话的相关内容,并且提供对共享内容和/或与通信会话的参与者相关的内容的访问。所述共享内容可以由通信会话的参与者作为屏幕共享进行共享。在该上下文中的屏幕共享指示参与者的客户端设备205正在提供包括客户端设备205的桌面的呈现以及在其上显示的内容或者与正在客户端设备205上运行的应用相关联的应用窗口的(一幅或多幅)图像和/或视频。
过程500可以包括在多个参与者的多个计算设备之间建立通信会话的操作510,其中,与所述通信会话相关联的媒体内容被提供给所述多个参与者的所述计算设备中的每个计算设备。如在图10 中所示的,每个客户端设备205可以将一个或多个客户端设备媒体流1010传输到通信平台230,并且通信平台230可以从客户端设备媒体流1010生成一个或多个共享媒体流1020,并且将一个或多个共享媒体流1020传输到客户端设备205中的每个客户端设备。
过程500可以包括经由网络连接从所述多个参与者中的第一参与者的计算设备接收第一媒体流的操作520,所述第一媒体流包括要与所述多个参与者共享的第一内容项的呈现。如在前文示例中所讨论的,通信会话的参与者可以经由屏幕共享来共享内容项。该参与者的客户端设备205可以生成被包含在客户端设备媒体流1010中的媒体流,在其中包括共享内容项的呈现。所述呈现可以是所述内容项的图像、图像系列或者视频。
过程500可以包括对所述第一媒体流的像素数据执行图像分析以识别所述第一内容项的特征的操作530。能够分析所述第一媒体流的所述像素数据以识别所述内容项的文本和非文本特征,如在前文的示例中所讨论的。
过程500可以包括基于第一内容项的特征来识别与第一内容项相关联的第一文件的操作540。如在前文的示例中所讨论的,通信平台230可以使用各种技术来识别与共享的内容项相关联的文件,包括但不限于将所述共享的内容项的文本和/或非文本特征与第一内容项相关联以确定哪个文件表示共享内容项以及存储该文件的位置。通信平台230可以确定在共享内容项与被存储在通信平台230 能访问的各种存储器位置中的多个候选内容项之间的相关性分数,如上文所讨论的。通信平台230 可以通过按照候选内容项的相关性分数对候选内容项进行排名并且通过基于候选内容项的相关性分数来选择与共享内容项最密切匹配的候选内容项,来确定候选内容项之一与共享内容项相匹配。
过程500可以包括向通信会话的参与者提供对与第一内容项相关联的第一文件的访问的操作 550。通信平台230可以访问与共享内容项相关联的文件,并且将与第一内容项相关联的文件的副本存储在所述通信会话的参与者能访问的存储器中。通信平台230可以提供到所述文件的链接,并且可以将所述链接添加到通信平台应用的用户界面120的会议概要120,使得参与者可以访问所述内容项。通信平台230也可以经由电子邮件、文本消息或者通过用于将共享内容项的文件的副本分发给通信会话的参与者的其他方式将内容项的副本传输到通信会话的参与者的计算设备205。
过程500可以包括与识别相关内容相关联的额外可选操作。这样的额外操作可以包括:将识别出的第一内容项的特征与经由公共或私有网络连接能访问的第二多个内容项相关,基于与第一内容项相关联的相关性分数来识别多个第二文档的一个或多个第二内容项,以及将一个或多个第二内容项中的每个第二内容项的副本或链接存储在能由所述多个参与者访问的数据处理系统的存储器中。
过程500也可以包括与将抄本125与内容项相关所相关联的额外可选操作。这样的额外操作可以包括确定文档的第一部分在第一媒体流中显示的第一时间,访问通信会话的抄本,所述抄本提供通信会话的口头内容的时间编码的文本表示,以及基于第一内容项的第一部分在第一媒体流中显示的第一时间而将第一内容项的第一部分与所述抄本的第一部分相关。过程500也可以包括与将抄本125的摘录添加到共享内容项、将共享内容项的摘录添加到抄本125或者这两者有关的额外操作。这样的额外操作可以包括至少将第一内容项的第一部分插入到抄本的第一部分中,至少将抄本的第一部分插入到第一内容项的第一部分中,或者这两者。
过程500可以包括将共享内容项目的副本传输到通信会话的参与者的额外操作。这样的额外操作可以包括通过网络连接向通信会话的多个参与者发送第一内容项的副本或者到第一内容项的副本的链接。
过程500可以包括在不能够定位与所述第一内容项相关联的文件的情况下可以执行的额外操作。这样的额外操作可以包括:确定所述第一内容项不能够被识别、不能够被定位或者这两者,从所述第一媒体流中提取所述第一内容项的第一部分的图像,以及将所述图像存储在所述多个参与者能访问的、与所述通信会话相关联的存储器中。
结合图1A-5和图8-11所描述的系统、设备和技术的详细示例将在下文中呈现以例示说明本公开以及其益处。这样的使用示例不应当被解释为对本公开的逻辑过程实施例的限制,也不应当将用户界面方法与在本文中所描述的那些的变化视为在本公开的范围之外。应当理解,对显示或呈现项目(诸如但不限于在显示设备上呈现图像、经由一个或多个扬声器呈现音频和/或振动设备)的引用包括发布导致或合理预期会导致设备或系统显示或呈现所述项目的指令、命令和/或信号。在一些实施例中,在图1A-5和图8-11中所描述的各种特征在相应模块中实现,所述模块也可以被称为和/或包括逻辑、组件、单元和/或机构。模块可以构成软件模块(例如,被体现在机器可读介质上的代码) 或者硬件模块。
在一些示例中,硬件模块可以机械地、电子地或者利用其任意合适的组合来实现。例如,硬件模块可以包括被配置为执行特定操作的专用电路或逻辑。例如,硬件模块可以包括专用处理器,诸如现场可编程门阵列(FPGA)或者专用集成电路(ASIC)。硬件模块也可以包括由软件临时配置以执行特定操作的可编程逻辑或电路,并且可以包括用于这样的配置的机器可读介质数据和/或指令的一部分。例如,硬件模块可以包括被包含在可编程处理器内的软件,所述可编程处理器被配置为运行软件指令的集合。将意识到,以机械方式在专用和永久配置的电路中或者在临时配置的电路(例如,由软件配置)中实现硬件模块的决定可能受成本、时间、支持和工程考虑的驱动。
因此,短语“硬件模块”应当被理解为涵盖能够执行特定操作并且可以以特定物理方式来配置或布置的有形实体,即物理构造、永久配置(例如、硬连线)和/或临时配置(例如,编程)用于以特定方式操作或者执行在本文中所描述的特定操作的的实体。如在本文中所使用的,“硬件实现的模块”指代硬件模块。考虑到其中硬件模块被临时配置(例如,被编程)的示例,硬件模块者的每个硬件模块不需要在任何一个时间实例上被配置或实例化。例如,在硬件模块包括通过软件配置成为专用处理器的可编程处理器的情况下,可编程处理器可以在不同的时间分别被配置为不同的专用处理器(例如,包括不同的硬件模块)。软件可以相应地配置一个或多个特定处理器,例如,以在一个时间实例构成特定硬件模块并且在不同时间实例构成不同的硬件模块。使用一个或多个处理器实现的硬件模块可以被称为“处理器实现的”或者“计算机实现的”。
硬件模块可以向其他硬件模块提供信息以及从其他硬件模块接收信息。因此,所描述的硬件模块可以被认为是通信地耦合的。在同时存在多个硬件模块的情况下,可以通过在两个或更多个硬件模块之间的信号传输(例如,通过适当的电路和总线)来实现通信。在其中多个硬件模块在不同时间被配置或实例化的实施例中,在这样的硬件模块之间的通信可以例如通过在多个硬件模块可以访问的存储器设备中存储和取回信息来实现。例如,一个硬件模块可以执行操作并且将输出存储在存储器设备中,并且然后另一硬件模块可以访问存储器设备以取回和处理所存储的输出。
在一些示例中,方法的操作中的至少一些操作可以由一个或多个处理器或处理器实现的模块来执行。此外,一个或多个处理器也可以操作用于支持相关操作在“云计算”环境中或者作为“软件即服务”(SaaS)的执行。例如,所述操作中的至少一些操作可以由多台计算机(作为包括处理器的机器的示例)和/或在多台计算机之间执行,其中这些操作能经由网络(例如,互联网)和/或经由一个或多个软件接口(例如,应用程序接口(API))进行访问。所述操作中的特定操作的执行可以被分布在处理器之间,所述处理器不仅驻留在单个机器内,而且跨多台机器来部署。处理器或处理器实现的模块可以位于单个地理位置(例如,在家庭或办公室环境中,或者服务器场内),或者可以跨多个地理位置分布。
图6是图示了示例性软件架构602的框图600,其各个部分可以结合在本文中所描述的各种硬件架构使用,其可以实现上文所描述的特征中的任意特征。图6是软件架构的非限制性示例,并且将意识到,可以实现许多其他架构以促进在本文中所描述的功能。软件架构602可以在诸如图7的机器700的硬件上云行,机器700包括处理器710、存储器730和输入/输出(I/O)组件750等。代表性硬件层604被图示出并且能够表示例如图7的机器700。代表性硬件层604包括处理单元606 和相关联的可执行指令608。可执行指令608表示软件架构602的可执行指令,包括在本文中所描述的方法、模块等的实现。硬件层604也包括存储器/存储设备610,其也包括可执行指令608和伴随数据。硬件层604也可以包括其他硬件模块612。由处理单元608保持的指令608可以是由存储器/存储设备610保持的指令608的一部分。
示例性软件架构602可以被概念化为层,每个层提供各种功能。例如,软件架构602可以包括层和组件,诸如操作系统(OS)614、库616、框架618、应用620和呈现层644。在操作上,应用620和/或层内的其他组件可以调用API调用624到其他层并且接收对应的结果626。所图示的层本质上是代表性的,并且其他软件架构可以包括额外的或者不同的层。例如,一些移动或专用操作系统可能不提供框架/中间件618。
OS 614可以管理硬件资源并且提供公共服务。OS 614可以包括例如内核628、服务630和驱动器632。内核628可以充当在硬件层604与其他软件层之间的抽象层。例如,内核628可以负责存储器管理、处理器管理(例如,调度)、组件管理、网络、安全设置等。服务630可以为其他软件层提供其他公共服务。驱动器632可以负责控制底层硬件层604或者与其进行接口。例如,驱动器 632可以包括显示驱动器、相机驱动器序、存储器/存储设备驱动器、外围设备驱动器(例如,经由通用串行总线(USB))、网络和/或无线通信驱动器、音频驱动器等,这取决于硬件和/或软件配置。
库616可以提供可以由应用620和/或其他组件和/或层使用的公共基础设施。库616通常提供由其他软件模块使用以执行任务而不是直接与OS 614交互的功能。库616可以包括系统库634(例如,C标准库),其可以提供诸如存储器分配、字符串操纵、文件操作的功能。另外,库616可以包括API库636,诸如媒体库(例如,支持对图像、声音和/或视频数据格式的呈现和操纵)、图形库(例如,用于在显示器上渲染2D和3D图形的OpenGL库)、数据库(例如,SQLite或者其他关系数据库函数)和web库(例如,提供web浏览功能的WebKit)。库616也可以包括多种其他库638,以为应用620和其他软件模块提供许多功能。
框架618(有时也被称为中间件)提供了可以由应用620和/或其他软件模块使用的更高级别的公共基础设施。例如,框架618可以提供各种图形用户界面(GUI)功能、高级资源管理或者高级定位服务。框架618可以为应用620和/或其他软件模块提供宽泛的其他API。
应用620包括内置应用640和/或第三方应用642。内置应用640的示例可以包括但不限于:联系人应用、浏览器应用、定位应用、媒体应用、消息传递应用和/或游戏应用。第三方应用642可以包括由除特定平台的供应商之外的实体开发的任意应用。应用620可以使用经由OS 614、库616、框架618和呈现层644可用的功能来创建用户界面以与用户交互。
一些软件架构使用虚拟机,如由虚拟机648所图示的。虚拟机648提供执行环境,其中,应用/模块能够像在硬件机器(诸如图7的机器700)上执行一样来执行。虚拟机648可以由主机OS (例如,OS 614)或管理程序来托管,并且可以具有管理虚拟机648的操作以及与主机操作系统的互操作的虚拟机监视器646。可能不同于虚拟机外部的软件架构602的软件架构在虚拟机648内执行,诸如OS 614、库672、框架654、应用656和/或呈现层658。
图7是示出了示例性机器700的组件的框图,机器700被配置为从机器可读介质(例如,机器可读存储介质)读取指令并且执行在本文中所描述的任何特征。示例性机器700是计算机系统的形式,在其之内可以执行用于使得机器700执行在本文中所描述的特征中的任意特征的指令716(例如,软件组件的形式)。因此,指令716可以被用于实现在本文中所描述的模块或组件。指令716使得未编程和/或未配置的机器700作为被配置为执行所描述的特征的特定机器来操作。机器700可以被配置为作为独立设备来操作或者可以被耦合(例如,联网)到其他机器。在联网部署中,机器700 可以在服务器-客户端网络环境中以服务器机器或客户端机器的容量来操作,或者作为对等或分布式网络环境中的节点来操作。机器700可以被体现为例如服务器计算机、客户端计算机、个人计算机 (PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、游戏和/或娱乐系统、智能手机、移动设备、可穿戴设备(例如,智能手表)和物联网(IoT)设备。此外,尽管仅图示出了单个机器700,但是术语“机器”包括单独或联合执行指令716的机器的集合。
机器700可以包括处理器710、存储器730和I/O组件750,其可以经由例如总线702通信地耦合。总线702可以包括多条总线,经由各种总线技术和协议来耦合机器700的各种元件。在示例中,处理器710(包括例如中央处理单元(CPU)、图形处理单元(GPU)、数字信号处理器(DSP)、 ASIC或者其合适的组合)可以包括执行指令716并且处理数据的一个或多个处理器712a至712n。在一些示例中,一个或多个处理器710可以执行由一个或多个其他处理器710提供或标识的指令。术语“处理器”包括多核处理器,所述多核处理器包括可以同时执行指令的核心。尽管图7示出了多个处理器,但是机器700可以包括具有单个核心的单个处理器、具有多个核心的单个处理器(例如,多核处理器)、每个具有单个核心的多个处理器、每个具有多个核心的多个处理器,或者其任意组合。在一些示例中,机器700可以包括在多台机器之间分布的多个处理器。
存储器/存储设备730可以包括主存储器732、静态存储器734或者其他存储器以及存储单元 736,处理器710能诸如经由总线702对其进行访问。存储单元736和存储器732、734存储体现在本文中所描述的功能中的任意一项或多项功能的指令716。存储器/存储设备730页可以存储用于处理器710的临时、中间和/或长期数据。在执行期间,指令716也可以完全或部分地驻留在存储器732、 734内、在存储单元736内、在处理器710的至少一个处理器内(例如,在命令缓存器或高速缓存存储器内)、在I/O组件750中的至少一个I/O组件的存储器内或者其任意适当的组合。因此,存储器732、734、存储单元736、处理器710中的存储器和I/O组件750中的存储器是机器可读介质的示例。
如在本文中所使用的,“机器可读介质”指代能够临时或永久地存储使得机器700以特定方式操作的指令和数据的设备,并且可以包括但不限于:随机存取存储器(RAM)、只读存储器(ROM)、缓存存储器、闪存、光存储介质、磁存储介质和设备、高速缓存、网络可访问或云存储、其他类型的存储和/或其任意合适的组合。术语“机器可读介质”适用于单个介质或者多个介质的组合,其被用于存储指令(例如,指令716)以供机器700执行,使得指令当由机器700的一个或多个处理器 710执行时使得机器700执行在本文中所描述的特征中的一个或多个特征。因此,“机器可读介质”可以指代单个存储设备,以及包括多个存储装置或设备的“基于云”的存储系统或存储网络。术语“机器可读介质”不包括信号自身。
I/O组件750可以包括适于接收输入、提供输出、产生输出、传输信息、交换信息、捕获测量结果等的多种硬件组件。在特定机器中所包括的特定I/O组件750将取决于机器的类型和/或功能。例如,诸如移动电话的移动设备可以包括触摸输入设备,而无头服务器或IoT设备可能不包括这样的触摸输入设备。在图7中图示出的I/O组件的特定示例绝不是限制性的,并且其他类型的组件可以被包含在机器700中。I/O组件750的分组仅仅是为了简化该讨论,并且分组绝不是限制性的。在各种示例中,I/O组件750可以包括用户输出组件752和用户输入组件754。用户输出组件752可以包括例如用于显示信息的显示组件(例如,液晶显示器(LCD)或投影仪)、声学组件(例如,扬声器)、触觉组件(例如,振动电机或力反馈设备)和/或其他信号生成器。用户输入组件754可以包括例如字母数字输入组件(例如,键盘或触摸屏)、定点组件(例如,鼠标设备、触摸板或者其他定点工具)和/或触觉输入组件(例如,提供位置和/或触摸力或触摸手势的物理按钮或触摸屏),该触觉输入组件被配置为接收各种用户输入,诸如用户命令和/或选择。
在一些示例中,I/O组件750可以包括生物识别组件756、运动组件758、环境组件760和/或位置组件762,以及宽泛的其他物理传感器组件。生物识别组件756可以包括例如检测身体表情(例如,面部表情、声音表情、手势或身体姿势或眼睛跟踪)、测量生物信号(例如,心率或脑电波)以及识别个人(例如,经由基于语音、视网膜、指纹和/或面部的识别)的组件。运动组件758可以包括例如加速度传感器(例如,加速度计)和旋转传感器(例如,陀螺仪)。环境组件760可以包括例如照明传感器、温度传感器、湿度传感器、压力传感器(例如,气压计)、声学传感器(例如,用于检测环境噪声的麦克风)、物理接近传感器(例如、附近物体的红外感测)和/或可以提供与周围物理环境对应的指示、测量或信号的其他组件。位置组件762可以包括例如位置传感器(例如,全球定位系统(GPS)接收器)、高度传感器(例如,可以从中导出高度的气压传感器)和/或方向传感器 (例如,磁力计)。
I/O组件750可以包括通信组件764,实现可用于经由相应的通信耦合772和782将机器700 耦合到(一个或多个)网络770和/或(一个或多个)设备780的各种技术。通信组件764可以包括一个或多个网络接口组件或与(一个或多个)网络770接口的其他合适的设备。通信组件764可以包括例如适于提供有线通信、无线通信、蜂窝通信、近场通信(NFC)、蓝牙通信、Wi-Fi和/或经由其他模态通信的组件。设备780可以包括其他机器或各种外围设备(例如,经由USB耦合)。
在一些示例中,通信组件764可以检测标识符或包括适于检测标识符的组件。例如,通信组件764可以包括射频识别(RFID)标签阅读器、NFC检测器、光学传感器(例如,一维或多维条形码或其他光学代码)和/或声学检测器(例如,识别标记的音频信号的麦克风)。在一些示例中,可以基于来自通信组件762的信息来确定位置信息,例如但不限于经由互联网协议(IP)地址的地理位置、经由Wi-Fi、蜂窝、NFC、蓝牙或其他无线站识别和/或信号三角测量的位置。
尽管已经描述了各种实施例,但是该描述旨在是示例性的,而不是限制性的,并且应当理解,在实施例的范围内的更多实施例和实现方式是可能的。尽管在附图中示出了许多可能的特征组合并且在该详细描述中进行了讨论,但是所公开的特征的许多其他组合也是可能的。除非特别限制,否则任何实施例的任何特征都可以与任何其他实施例中的任何其他特征或元素组合使用或替代任何其他特征或元素。因此,应当理解,本公开中所示和/或讨论的任何特征可以以任何合适的组合一起实施。因此,除了根据所附权利要求及其等同物之外,实施例不受限制。此外,可以在所附权利要求的范围内进行各种修改和改变。
尽管前文已经描述了被认为是最佳模式和/或其他示例的内容,但是应当理解,可以在其中进行各种修改,并且可以以各种形式和示例来实现在本文中所公开的主题,并且这些教导可以应用在许多应用中,在本文中仅描述了其中的一些。所附权利要求旨在对落入本教导的真实范围内的任何和所有应用、修改和变化提出权利要求。
除非另有说明,否则在本说明书中(包括在随后的权利要求中)阐述的所有测量值、值、额定值、位置、幅度、尺寸和其他规格都是近似的而不是精确的。其旨在具有与其所涉及的功能以及其所涉及的领域中的惯例一致的合理范围。
保护范围仅由以下权利要求限制。当根据本说明书和随后的审查历史进行解释时,该范围旨在并且应当被解释为与权利要求中使用的语言的普通含义一致,并且包括所有结构和功能等价物。尽管如此,权利要求中的任何一项均不旨在涵盖未能满足《专利法》第101、102或103条要求的主题,也不应以这种方式对其进行解释。特此否认对这样的主题的任何意外涵盖。
除上文所描述的之外,任何已陈述或说明的内容均无意或不应当被解释为使任何组件、步骤、特征、对象、利益、优势或等同物奉献给公众,无论是否在权利要求书中被提及。
应当理解,在本文中所使用的术语和表达具有与这些术语和表达相对于其对应的调查和研究的相应领域所赋予的普通含义,除非在本文中另外阐述了特定含义。诸如“第一”和“第二”等关系术语可仅用于将一个实体或动作与另一个区分开来,而不必要求或暗示这样的实体或动作之间的任何实际的这种关系或次序。术语“包括”、“包含”或者其任何其他变体旨在涵盖非排他性包含,使得包括元素列表的过程、方法、物品或装置不仅包括那些元素,而且可能包括未明确列出的其他元素或这样的过程、方法、物品或装置所固有的元素。在没有进一步约束的情况下,以“一”或“一个”开头的元素不排除在包括该元素的过程、方法、物品或装置中存在附加相同元素。
提供本公开的摘要以允许读者快速确定技术公开的性质。提交时理解其不会被用来解释或限制权利要求的范围或含义。此外,在上述详细描述中,可以看出,为了简化公开的目的,在各种示例中将各种特征组合在一起。该公开方法不应当被解释为反映权利要求需要比每个权利要求中明确列举的更多特征的意图。相反,如以下权利要求所反映的,发明主题不在于单个公开示例的所有特征。因此,以下权利要求在此并入详细说明中,每个权利要求作为单独要求保护的主题独立存在。

Claims (15)

1.一种数据处理系统,包括:
处理器;以及
计算机可读介质,其存储用于使得所述处理器执行包括以下的操作的可执行指令:
在多个参与者的多个计算设备之间建立通信会话,其中,与所述通信会话相关联的媒体内容被提供给所述多个参与者的所述计算设备中的每个计算设备;
经由网络连接从所述多个参与者中的第一参与者的所述计算设备接收第一媒体流,所述第一媒体流包括要与所述多个参与者共享的第一内容项的呈现;
对所述第一媒体流的像素数据执行图像分析以识别所述第一内容项的特征;
基于所述第一内容项的所述特征来识别与所述第一内容项相关联的第一文件;以及
向所述通信会话的所述参与者提供对与所述第一内容项相关联的所述第一文件的访问。
2.根据权利要求1所述的数据处理系统,其中,所述计算机可读介质还存储用于使得所述处理器执行以下操作的可执行指令:
基于所述第一内容项的所识别的特征来识别与所述第一内容项相关联的所述第一文件的第一存储位置;
在所识别的第一存储位置处访问与所述第一内容项相关联的所述第一文件;以及
将所访问的与所述第一内容项相关联的第一文件存储在所述多个参与者能访问的第二存储位置中。
3.根据权利要求2所述的数据处理系统,其中,为了识别所述第一内容项的所述第一存储位置,所述计算机可读介质还存储用于使得所述处理器执行以下操作的可执行指令:
使所述第一内容项的所识别的特征和与所述多个参与者中的一个或多个参与者、所述通信会话或者这两者相关联的第一多个内容项相关,以产生针对所述多个内容项中的每个内容项的相关性分数;以及
基于与所述第一内容项相关联的所述相关性分数来识别多个第一内容项中的所述第一内容项。
4.根据权利要求3所述的数据处理系统,其中,所述计算机可读介质还存储用于使得所述处理器执行以下操作的可执行指令:访问基于服务器的存储设备中的与所述多个参与者中的所述一个或多个参与者、所述通信会话或者这两者相关联的的所述第一多个内容项。
5.根据权利要求1所述的数据处理系统,其中,所述计算机可读介质还存储用于使得所述处理器执行以下操作的可执行指令:
使所述第一内容项的所识别的特征与经由公共或私有网络连接能访问的第二多个内容项相关;
基于与所述第一内容项相关联的所述相关性分数来识别多个第二文档的一个或多个第二内容项;以及
将所述一个或多个第二内容项中的每个第二内容项的副本或者到所述一个或多个第二内容项中的每个第二内容项的链接存储在所述多个参与者能访问的所述数据处理系统的存储器中。
6.根据权利要求1所述的数据处理系统,其中,所述计算机可读介质还存储用于使得所述处理器执行以下操作的可执行指令:
确定所述文档的第一部分被显示在所述第一媒体流中的第一时间;
访问所述通信会话的抄本,所述抄本提供所述通信会话的口头内容的时间编码的文本表示;以及
基于所述第一内容项的第一部分被显示在所述第一媒体流中的所述第一时间,使所述第一内容项的所述第一部分与所述抄本的第一部分相关。
7.根据权利要求6所述的数据处理系统,其中,所述计算机可读介质还存储用于使得所述处理器执行以下操作的可执行指令:至少将所述第一内容项的所述第一部分插入到所述抄本的所述第一部分中。
8.根据权利要求6所述的数据处理系统,其中,所述计算机可读介质还存储用于使得所述处理器执行以下操作的可执行指令:至少将所述抄本的所述第一部分插入到所述第一内容项的所述第一部分中。
9.根据权利要求1所述的数据处理系统,其中,为了提供对与所述第一内容项相关联的所述第一文件的访问,所述计算机可读介质还存储用于使得所述处理器执行以下操作的可执行指令:通过所述网络连接将所述第一内容项的副本或者到所述第一内容项的所述副本的链接发送给所述通信会话的所述多个参与者。
10.根据权利要求1所述的数据处理系统,还包括被配置为使得所述处理器执行以下操作的指令:
从所述第一参与者的用户设备接收所述第一内容项被本地存储在所述用户设备上的指示;以及
响应于从所述用户设备接收到所述第一内容项被本地存储在所述用户设备上的所述指示,提示所述用户上传所述第一内容项。
11.根据权利要求1所述的数据处理系统,还包括被配置为使得所述处理器执行以下操作的指令:
确定所述第一内容项不能够被识别、不能够被定位或者这两者;
从所述第一媒体流中提取所述第一内容项的第一部分的图像;以及
将所述图像存储在所述多个参与者能访问的、与所述通信会话相关联的存储器中。
12.一种由数据处理系统执行的用于在多个参与者的多个计算设备之间进行通信会话的方法,所述方法包括:
在多个参与者的多个计算设备之间建立通信会话,其中,与所述通信会话相关联的媒体内容被提供给所述多个参与者的所述计算设备中的每个计算设备;
经由网络连接从所述多个参与者中的第一参与者的所述计算设备接收第一媒体流,所述第一媒体流包括要与所述多个参与者共享的第一内容项的呈现;
对所述第一媒体流的像素数据执行图像分析以识别所述第一内容项的特征;
基于所述第一内容项的所述特征来识别与所述第一内容项相关联的第一文件;以及
向所述通信会话的所述参与者提供对与所述第一内容项相关联的所述第一文件的访问。
13.根据权利要求12所述的方法,还包括:
基于所述第一内容项的所识别的特征来识别与所述第一内容项相关联的所述第一文件的第一存储位置;
在所识别的第一存储位置处访问与所述第一内容项相关联的所述第一文件;以及
将所访问的与所述第一内容项相关联的第一文件存储在所述多个参与者能访问的第二存储位置中。
14.根据权利要求13所述的方法,其中,识别所述第一内容项的所述第一存储位置还包括:
使所述第一内容项的所识别的特征和与所述多个参与者中的一个或多个参与者、所述通信会话或者这两者相关联的第一多个内容项相关,以产生针对所述多个内容项中的每个内容项的相关性分数;以及
基于与所述第一内容项相关联的所述相关性分数来识别多个第一内容项中的所述第一内容项。
15.根据权利要求14所述的方法,还包括:
访问基于服务器的存储设备中的、与所述多个参与者中的所述一个或多个参与者、所述通信会话或者这两者相关联的所述第一多个内容项。
CN202180027217.XA 2020-04-10 2021-02-17 在屏幕共享时的内容识别 Pending CN115398421A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/846,252 2020-04-10
US16/846,252 US11159590B1 (en) 2020-04-10 2020-04-10 Content recognition while screen sharing
PCT/US2021/018430 WO2021206809A1 (en) 2020-04-10 2021-02-17 Content recognition while screen sharing

Publications (1)

Publication Number Publication Date
CN115398421A true CN115398421A (zh) 2022-11-25

Family

ID=74856964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180027217.XA Pending CN115398421A (zh) 2020-04-10 2021-02-17 在屏幕共享时的内容识别

Country Status (4)

Country Link
US (1) US11159590B1 (zh)
EP (1) EP4133386A1 (zh)
CN (1) CN115398421A (zh)
WO (1) WO2021206809A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114205665B (zh) * 2020-06-09 2023-05-09 抖音视界有限公司 一种信息处理方法、装置、电子设备及存储介质
CN111880695B (zh) * 2020-08-03 2024-03-01 腾讯科技(深圳)有限公司 一种屏幕共享方法、装置、设备及存储介质
US11695808B2 (en) * 2021-08-31 2023-07-04 Cisco Technology, Inc. Virtual collaboration with multiple degrees of availability
JP7226600B1 (ja) * 2022-01-31 2023-02-21 株式会社リコー 記録情報作成システム、記録情報作成方法、プログラム
EP4231632A1 (en) * 2022-02-17 2023-08-23 Ricoh Company, Ltd. Display system, display method, and carrier medium

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8489669B2 (en) * 2000-06-07 2013-07-16 Apple Inc. Mobile data processing system moving interest radius
CA2515488C (en) 2003-02-10 2013-04-16 Raindance Communications, Inc. Methods and apparatus for providing egalitarian control in a multimedia collaboration session
US9342814B2 (en) 2009-04-07 2016-05-17 Clearslide, Inc. Presentation access tracking system
US9066200B1 (en) * 2012-05-10 2015-06-23 Longsand Limited User-generated content in a virtual reality environment
US9953301B2 (en) 2013-04-03 2018-04-24 Salesforce.Com, Inc. Searchable screen sharing sessions
US20150033140A1 (en) 2013-07-23 2015-01-29 Salesforce.Com, Inc. Providing active screen sharing links in an information networking environment
US20160255139A1 (en) * 2016-03-12 2016-09-01 Yogesh Chunilal Rathod Structured updated status, requests, user data & programming based presenting & accessing of connections or connectable users or entities and/or link(s)
US10614153B2 (en) * 2013-09-30 2020-04-07 Google Llc Resource size-based content item selection
US9326026B2 (en) * 2013-10-31 2016-04-26 At&T Intellectual Property I, Lp Method and apparatus for content distribution over a network
US9916328B1 (en) 2014-07-11 2018-03-13 Google Llc Providing user assistance from interaction understanding
US10091260B2 (en) 2015-03-23 2018-10-02 Adobe Systems Incorporated Copy and paste for web conference content
US10554611B2 (en) * 2015-08-10 2020-02-04 Google Llc Privacy aligned and personalized social media content sharing recommendations
US9864734B2 (en) * 2015-08-12 2018-01-09 International Business Machines Corporation Clickable links within live collaborative web meetings
US10809895B2 (en) 2016-03-11 2020-10-20 Fuji Xerox Co., Ltd. Capturing documents from screens for archival, search, annotation, and sharing
US10075672B2 (en) * 2016-12-20 2018-09-11 Facebook, Inc. Optimizing video conferencing using contextual information
US10334053B2 (en) * 2017-04-18 2019-06-25 Facebook, Inc. Private communication sessions in an online social networking system
US10579970B2 (en) 2017-09-07 2020-03-03 Atlassian Pty Ltd Automatically detecting and storing digital data items associated with digital calendar items
US11038973B2 (en) * 2017-10-19 2021-06-15 Dropbox, Inc. Contact event feeds and activity updates
WO2020251385A1 (en) * 2019-06-14 2020-12-17 Ringcentral, Inc., (A Delaware Corporation) System and method for capturing presentation gestures
US11475458B2 (en) * 2019-07-31 2022-10-18 Adobe Inc. In-app lead nurturing within an electronic document

Also Published As

Publication number Publication date
EP4133386A1 (en) 2023-02-15
US11159590B1 (en) 2021-10-26
WO2021206809A1 (en) 2021-10-14
US20210320953A1 (en) 2021-10-14

Similar Documents

Publication Publication Date Title
US11159590B1 (en) Content recognition while screen sharing
US12026948B2 (en) Techniques for presentation analysis based on audience feedback, reactions, and gestures
CN114641975B (zh) 用于会议的多通道音频和/或多个数据流的节流和优先级排序
CN107004020B (zh) 终端设备及其数据处理方法
US20220141532A1 (en) Techniques for rich interaction in remote live presentation and accurate suggestion for rehearsal through audience video analysis
US9024974B2 (en) Augmented reality system, apparatus and method
US20160335152A1 (en) Self-Stabilizing Network Nodes in Mobile Discovery System
JP2015519645A (ja) ソーシャルネットワークのグループの創設
US11769500B2 (en) Augmented reality-based translation of speech in association with travel
US20210126806A1 (en) Method for recognizing and utilizing user face based on profile picture in chatroom created using group album
CN113014863A (zh) 认证用户的方法及系统以及计算机可读记录介质
US10157190B2 (en) Image action based on automatic feature extraction
US9600720B1 (en) Using available data to assist in object recognition
CN115812217A (zh) 用于评论的基于出行的增强现实内容
WO2023158468A1 (en) Intelligent meeting agent
US11689694B2 (en) Information processing apparatus and computer readable medium
US20190222891A1 (en) Systems and methods for managing presentation services
US11373057B2 (en) Artificial intelligence driven image retrieval
US8718337B1 (en) Identifying an individual for a role
US11841911B2 (en) Scalable retrieval system for suggesting textual content
WO2023167726A1 (en) Image transformation infrastructure
US20230061210A1 (en) Method and system of automated question generation for speech assistance
US20200112566A1 (en) Systems, methods and apparatuses for integrating a service application within an existing application
US20230254353A1 (en) Media streaming from source in online meeting screen-share
US20240257420A1 (en) Transforming Content Across Visual Mediums Using Artificial Intelligence and User Generated Media

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination