CN107636651A - 使用自然语言处理生成主题索引 - Google Patents

使用自然语言处理生成主题索引 Download PDF

Info

Publication number
CN107636651A
CN107636651A CN201680029976.9A CN201680029976A CN107636651A CN 107636651 A CN107636651 A CN 107636651A CN 201680029976 A CN201680029976 A CN 201680029976A CN 107636651 A CN107636651 A CN 107636651A
Authority
CN
China
Prior art keywords
theme
subset
content
content item
dialog events
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680029976.9A
Other languages
English (en)
Other versions
CN107636651B (zh
Inventor
布赖恩·大卫·马什
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN107636651A publication Critical patent/CN107636651A/zh
Application granted granted Critical
Publication of CN107636651B publication Critical patent/CN107636651B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1069Session establishment or de-establishment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data

Abstract

公开了用于为会话事件生成主题索引并且基于主题索引生成内容项的系统和方法。方法包括由处理设备从对应于会话事件的第一内容项中提取多个主题,并且生成会话事件的主题索引。主题索引将多个主题中的每一个与来自第一内容项的内容片段相关联。方法还包括识别多个主题内的一个或多个主题的子集,并且生成包括主题子集的一个或多个主题中的每一个的相应内容片段的第二内容项。

Description

使用自然语言处理生成主题索引
技术领域
本公开涉及会议领域,并且具体地涉及生成会话事件的主题索引。
背景技术
诸如互联网上的媒体协作(例如,视频会议、远程医疗等)的会话事件正变得越来越普遍,因为利用宽带连接的宽带接入和应用激增。支持会话事件的应用可以是基于浏览器的,也可以独立于浏览器运行。
发明内容
以下呈现本公开的各个方面的简要总结以便提供对这些方面的基本理解。该总结不是本公开的广泛概述。其意图既不是识别本公开的关键或重要元素,也不是描述本公开的具体实施方式的任何范围或权利要求的任何范围。其唯一目的是以简化的形式呈现本公开的一些概念,作为稍后呈现的更详细的描述的序言。
在本公开的一个方面中,一种方法包括:由处理设备从对应于会话事件的第一内容项中提取多个主题,并且生成该会话事件的主题索引。该主题索引将所述多个主题中的每一个与来自第一内容项的内容片段相关联。该方法还包括识别所述多个主题内的一个或多个主题的子集,并且生成包括该主题子集的所述一个或多个主题中的每一个的相应内容片段的第二内容项。
公开了用于执行上述方法以及这里描述的各种实施方式的操作的计算设备。还公开了存储用于执行与上述方法和本文描述的各种实施方式相关联的操作的指令的计算机可读介质。
附图说明
在附图中,通过示例而非限制的方式来示出本公开,其中:
图1示出根据本公开的实施方式的示例系统架构;
图2是示出根据本公开的实施方式的会议平台和内容索引组件的框图;
图3A是示出根据本公开的实施方式的包括主题索引的内容项记录的框图;
图3B是示出根据本公开的实施方式的主要主题索引的框图;
图4是示出根据本公开的实施方式的媒体协作服务/应用的示例性图形用户界面窗口的框图;
图5是示出根据本公开的实施方式的用于生成会话事件的主题索引的方法的流程图;
图6是示出根据本公开的实施方式的媒体协作界面的框图;
图7A是示出根据本公开的实施方式的使用主题索引用于从第一媒体项生成第二媒体项的框图;
图7B是示出根据本公开的实施方式的使用主题索引用于从多个媒体项生成媒体项的框图;
图8是示出根据本公开的实施方式的用于排名主题的方法的流程图;和
图9是示出根据本公开的实施方式的示例性计算机系统的框图。
具体实施方式
本公开的方面和实施方式涉及基于自然语言处理技术来生成用于会话事件的主题索引。所公开的系统和方法可以应用于实况内容、预先记录的内容和媒体协作。实况内容是指实时广播或流传输的内容(例如,有或没有无意的延迟,或者创建内容的指定时间限制内(例如,小于50微秒))。预先记录的内容是指从其创建时间起以有意延迟进行广播或流传输的内容(例如,在内容创建和内容广播或流传输之间没有指定的时间限制)。媒体协作(例如,音频和/或视频会议、音频和/或视频聊天、音频和/或视频会议室、音频和/或视频聊天室等)是指参与者/用户之间的通信,其中内容/媒体流(例如,实况音频和/或视频内容,记录的音频和/或视频内容等)由一个或多个参与者/用户的设备传送,并且可以被组合成合成内容/媒体流。
如本文所使用的,术语“会话事件”是指在两个或更多个用户之间进行的会话,其中会话的口头语言和/或书面语言使用两个或更多个用户的相应客户端设备在两个或更多个用户之间交换。会话事件可以包括实况或预先记录的内容,并且可以以诸如视频和/或音频会议、基于文本的聊天、幻灯片放映演示、在线讲座/研讨会、短消息服务通信、音频通信等的媒体协作的形式。
如本文所使用的,术语“内容项”包括音频剪辑、电影剪辑、电视剪辑和音乐视频以及诸如视频博客的内容、短的原始视频、图片、照片、其他多媒体内容等。内容项还可以指代其他类型的内容,包括产品的表示(例如,来自在线商家的产品列表)、文章(例如,评论、新闻文章、产品描述等)、聊天会话、幻灯片演示或可以使用显示器和/或音频设备呈现的任何其他类型的背景数据。
这里在各种实施方式中描述了允许使用自然语言处理(NLP)技术从会话事件中提取主题的技术。NLP用于从与会话事件(例如,实况视频/音频流、预先记录的视频/音频流、基于文本的会话等)相关联的内容中执行主题提取。例如,可以使用各种知识提取技术将说出或键入的语言解析为概念主题。主题可用于生成主题索引,主题索引又可以用于查找与会话事件相关联的内容的感兴趣部分。主题还可以用于为会话事件的集合建立“主要”主题索引,使得关键字搜索可以返回到与感兴趣的主题相关的视频和/或视频的部分。此外,主题索引可用于生成内容推荐、生成会话事件的突出显示、多个会话事件的剪辑等。
这里描述的一些实施方式可以被集成到在各种客户端设备上操作的用户界面中。用户界面可以在一个部分中显示视频内容,并且还显示索引主题的列表。对于实况视频流,当NLP从视频流中提取主题时,该列表可以实时更新。在一些实施方式中,会话事件的用户/参与者可以点击列表中的主题,这可能导致视频流从对应于讨论主题时的时间开始。
相应地,实施方式提供了若干优点,包括但不限于在会话事件发生时实时地对会话事件进行索引,在没有来自编辑者的输入的情况下自动索引和识别会话事件的部分,并且利用来自会话事件参与者的直接或间接反馈以促进索引。
图1示出了根据本公开的实施方式的示例系统架构100。系统架构100包括客户端设备110A-110Z、网络105、数据存储106、会议服务器120、自然语言处理(NLP)服务器130和自然语言数据库140。系统架构100的各种设备可以经由网络105彼此连接。在一个实施方式中,网络105可以包括公共网络(例如,互联网)、专用网络(例如,局域网(LAN)或广域网WAN))、有线网络(例如,以太网)、无线网络(例如,802.11网络或Wi-Fi网络)、蜂窝网络(例如,长期演进(LTE)网络)、路由器、集线器、交换机、服务器计算机和/或其组合。
在一个实施方式中,数据存储106可以是存储器(例如,随机存取存储器)、高速缓存、驱动器(例如,硬盘驱动器)、闪存驱动器、数据库系统或能够存储数据的另一类型的组件或者设备。数据存储106还可以包括也可以跨越多个计算设备(例如,多个服务器计算机)的多个存储组件(例如,多个驱动器或多个数据库)。在一些实施方式中,数据存储106可以是基于云的。系统架构100的一个或多个设备可以利用数据存储106来存储公共和私有数据,并且数据存储106可以被配置为为私有数据提供安全存储。数据存储106可以是客户端设备110A-110Z、会议服务器120和NLP服务器130中的任何一个之间的一部分或在客户端设备110A-110Z、会议服务器120和NLP服务器130中的任何之间分布。
在一个实施方式中,客户端设备110A-110Z可以包括诸如个人计算机(PC)、膝上型计算机、移动电话、智能电话、平板计算机、上网本计算机等的一个或多个计算设备。客户端设备110A-110Z也可以被称为“用户设备”或“移动设备”。个人用户可以与一个或多个客户端设备(例如,一个或多个客户端设备110A-110Z)相关联(例如拥有和/或使用)。客户端设备110A-110Z可以由在不同地理位置处的不同用户拥有和使用。参与媒体协作(例如,视频会议)的用户在这里可以被称为“会议参与者”。
客户端设备110A-110Z可以分别实现用户界面111A-111Z。用户界面111A-111Z中的每一个可以允许相应客户端设备110A-110Z的用户向会议服务器120和NLP服务器130中的一个或多个发送和接收信息。例如,用户界面111A-111Z中的一个或多个可以是可以访问、检索、呈现和/或导航由会议服务器120提供的内容(例如,诸如超文本标记语言(HTML)页面的web页面)的web浏览器界面。在一个实施方式中,用户界面111A-111Z中的一个或多个可以是允许相应客户端设备110A-110Z的用户向会议服务器120和/或NLP服务器130发送和接收信息的独立应用(例如,移动app、会议软件等)。在一个实施方式中,用户界面111A-111Z中的一个或多个可以是允许会议参与者参与视频会议、音频会议、聊天和/或即时消息中的一个或多个的会议界面。关于图4更详细地描述示例用户界面(例如,图形用户界面窗口)。
每个客户端设备110A-110Z还包括媒体查看器112A-112Z。在一个实施方式中,媒体查看器112A-112Z可以是允许用户查看诸如图像、视频、web页面、文档等内容的应用。例如,媒体查看器112A可以是可以访问、检索、呈现和/或导航由web服务器提供的内容(例如,诸如超文本标记语言(HTML)页面的web页面、数字媒体项等)的web浏览器。媒体查看器112A可以向用户渲染、显示和/或呈现内容。媒体查看器112A还可以显示嵌入在web页面中的嵌入式媒体播放器(例如,可以提供关于由在线商家销售的产品的信息的web页面)。在另一示例中,媒体查看器112A可以是允许用户查看数字媒体项(例如,数字视频、数字图像、电子书等)的独立应用(例如,移动app)。在一个实施方式中,媒体观看器112A-112Z可以进一步允许视频从一个或多个源接收并在相应的用户界面111A-111Z内显示。例如,客户端设备110A可以从会议服务器120接收视频数据,其可以对应于由一个或多个附加客户端设备生成的视频流。媒体查看器112A可以基于接收到的视频数据生成用于显示(例如,在用户界面111A内)的对应于每个视频流的视频。在一些实施方式中,用户界面111A-111Z分别与媒体查看器112A-112Z集成。
在一个实施方式中,会议服务器120可以是一个或多个计算设备(诸如机架安装服务器、路由器计算机、服务器计算机、个人计算机、大型计算机、膝上型计算机、平板计算机、桌面型计算机等)、数据存储(例如,硬盘、存储器、数据库)、网络、软件组件、硬件组件或其组合,其可以适于实现本文所述的各种特征。在一些实施方式中,会议服务器120可以使用例如流传输视频或IP语音(VoIP)技术来实现媒体协作服务,诸如音频和/或视频会议(例如,在客户端设备110A-110Z的用户之中),并且可以用于个人、娱乐、商业、教育或面向学术的互动。会议服务器120可以专用于提供视频会议服务,或可以提供视频会议服务以及包括例如新闻服务、社交网络服务和/或内容托管服务的其他服务。
在一个实施方式中,会议服务器120包括会议平台200。如图2所示,会议平台200包括托管模块202、接口模块204和内容档案206。或多或少的组件可以被包括在会议平台200中而不失一般性。例如,两个或更多个模块可以被组合成单个模块,或者模块中的一个可以被分成两个或更多个模块。在一个实施方式中,一个或多个模块可以驻留在不同的计算设备上(例如,不同的服务器计算机上,在单个客户端设备上,分布在多个客户端设备中等)。
在一个实施方式中,托管模块202可以被会议平台200利用来发起和支持诸如音频/视频会议、聊天室、视频聊天等的媒体协作。例如,托管模块202可以接收来自用户的创建媒体协作会话的请求,可以允许用户在接收到来自用户的请求时加入预先存在的媒体协作会话,可以便于向用户发送允许用户加入预先存在的媒体协作会话的邀请等。
在一个实施方式中,会议平台200可以利用接口模块204从各种参与者的一个或多个客户端设备110A-110Z中接收多个音频和/或视频流,并生成包括与每个接收到的流相关联的数据的复合流。然后可以在媒体协作会话(例如,视频会议)中将复合流提供给各种参与者的一个或多个客户端设备110A-110Z。在一些实施方式中,复合流可以包括格式化数据,客户端设备110A-110Z可以使用格式化数据用于提取单个视频流并且布置视频流用于由相应用户界面111A-111Z呈现。相应地,视频会议的每个用户/参与者可以同时观看单个界面/屏幕内的一些或全部内容流,如图6所示。
在一些实施方式中,由会议平台200托管的媒体协作中的一个或多个参与者可以提供/投影音频内容(例如,参与者口头的语音、音乐等),其在被客户端设备(例如,客户端设备110A-110Z中的一个)时可以被客户端设备发送或以其他方式提供作为可以并入媒体协作中的音频流。在一些实施方式中,可以独立于视频流(例如,在媒体协作期间提供仅音频输入的参与者)来提供这样的音频流,而在其他实施方式中,可以结合视频流(例如,组合流、参与者讲话的合并同步视频和音频)提供这样的音频流。
在一个实施方式中,会议平台200可以利用内容档案206来存储媒体协作数据(例如,存储视频和/或音频流数据、聊天数据等),其可以由一个或多个参与者经由他们各自的客户端设备在晚些时候访问。在一些实施方式中,内容档案可以与数据存储106组合。内容档案可以存储与公共会话事件(例如,公共视频聊天、公共音频聊天、公共基于文本的聊天、公共演示等)相关联的内容,使得公共会话事件可在晚些时候搜索和检索。
在一个实施方式中,图1中所示的NLP服务器130包括内容索引组件250。如图2所示,内容索引组件250包括内容提取模块252、主题识别模块254、关联模块256和内容生成模块258。更多或更少的组件可以包括在内容索引组件250中而不失一般性。例如,两个或更多个模块可以被组合成单个模块,或者模块中的一个可以被分成两个或更多个模块。在一个实施方式中,一个或多个模块可以驻留在不同的计算设备上(例如,不同的服务器计算机上,在单个客户端设备上,分布在多个客户端设备中等)。
在一个实施方式中,内容索引组件250可以利用内容提取模块252和主题识别模块254来识别会话事件内的会话主题。例如,内容提取模块252可以被用来将音频转录成由主题识别模块254从其提取主题标识符的文本。可以利用各种算法/技术用于识别和提取来自口头和书面语言的场境(contextual)信息,包括但不限于,语音识别和处理、语音分割、主题分割以及单词分割和消歧。在一些实施方式中,内容索引组件250可以访问图1中所示的自然语言数据库140,其可以包括单词和短语的数据库以促进主题提取/识别。
在一个实施方式中,内容索引组件250可以利用关联模块256将内容项的部分/片段与所标识的主题相关联。可以通过生成一个或多个内容项记录280A-280Z(例如,其存储在数据存储106中)来进行关联。每个内容记录280A-280Z包括相应的内容标识符282A-282Z和相应的主题索引284A-284Z。
图3A和图3B示出了用于将内容项与主题索引相关联的不同数据结构。在一个实施方式中,内容项记录300可以对应于单个内容项(例如,内容项记录280A-280Z中的一个或多个)。内容标识符310可以是可以用于定位或索引内容项的规范标识符(例如,如果内容项是电影,则内容标识符310是电影的名称)。在一些实施方式中,内容标识符310是内容的唯一标识符(例如,序列号)。内容项记录300还包括主题索引320,该主题索引320包括一个或多个主题标识符325A-325Z。每个主题标识符325A-325Z还可以与内容项的内容片段330A-330Z相关联。例如,如果内容项是视频剪辑,则内容片段330A可以对应于在视频剪辑内发生的剪辑的部分(例如,从内容项的两分钟标记开始的一分钟长的剪辑)。关于内容片段330A-330Z的大小/长度和在内容项内的位置的信息可以被包括在主题索引320内,从而使得内容项本身和内容项内的片段可通过主题来搜索。
在一些实施方式中,主要主题索引350可以与内容项记录300相似,除了主要主题索引包括分别与内容标识符列表365A-365Z相关联的多个主题标识符360A-360Z之外。对于列表中的每个内容标识符,内容标识符列表365A-365Z可以包括与内容相关的信息,诸如主题相关片段及其在其相应内容项内的位置。在一些实施方式中,主题标识符360A-360Z还可以包括可以用于确定主题的相关性的关联分数/排名。关于图8更详细地描述主题的评分。
在一个实施方式中,内容索引组件250可以利用图2中所示的内容生成模块来基于与一个或多个其他内容项相关联的内容索引从一个或多个其他内容项生成内容项。生成的内容项可以是在事件期间或之后确定的会话事件的重要时刻的事后总结或升级,或者可以是在事件期间实时确定的事件中的重要时刻的总结的实时视图。在事实之后和实时生成的内容项即使它们涉及相同的事件也可以是实质不同的。内容生成模块258的功能将参考图5和图7更详细地描述。
一般地,在一个实施方式中被描述为由会议服务器120或NLP服务器130中的任何一个执行的功能也可以适当地在其他实施方式中由一个或多个客户端设备110A-110Z执行。例如,客户端设备110A可以实现执行内容索引组件250的功能的软件应用。另外,属于特定组件的功能可以由不同或者一起操作的多个组件执行。在一些实施方式中,NLP服务器130可以作为通过适当的应用编程接口提供给其他系统或设备的服务来访问。
会议平台200和内容索引组件250被分别描述为由会议服务器120和NLP服务器130实现,但是可以由客户端设备110A-110Z、会议服务器120或NLP服务器130中的任何一个来实现。作为示例,客户端设备(例如,客户端设备110A)可以被编程为执行会议平台200和/或内容索引组件250的一些或全部功能。作为另一个示例,会议平台200和内容索引组件250可以在会议服务器中被组合在一起。在其中在客户端设备上实现会议平台200和/或内容索引组件250的实施方式中,关于会议平台200和/或内容索引组件250描述的“接收”、“传送”、“检索”、“识别”、“确定”等任何功能被理解为是指由客户端设备内的子系统或子模块执行的功能,而不是跨网络(例如,网络105)执行的功能,如本领域的普通技术人员所理解的。
图4是示出根据本公开的实施方式的媒体协作服务/应用的示例性图形用户界面(GUI)窗口400的图。在一个实施方式中,GUI窗口400包括主区域402、缩略图区域404A-404C、头部区域406、聊天区域408和选项区域410。在一些实施方式中,少于全部缩略图区域404A-404C可以在GUI窗口400中呈现,或者可以呈现附加缩略图区域。GUI窗口400可以与客户端设备的媒体查看器(例如,客户端设备110A的用户界面111A和媒体查看器112A)组合地生成用于显示为用户界面。
在一些实施方式中,每个区域可以包含、描绘或以其他方式呈现由媒体协作中的特定参与者提供的媒体内容(例如,视频内容)。例如,主区域402可以是媒体播放器并且可以呈现由第一参与者(例如,在视频会议中的第一或主要参与者的“房间”、由第一参与者共享的视频剪辑等)传送的视频流,而每个缩略图区域404A-404C可以包含由一个或多个附加参与者传送的视频流的缩小版本,与附加参与者相关联的静态图像(例如,头像等),与附加参与者相关联的视频流的缩小版本或其组合。应该注意的是,尽管GUI窗口400的区域被描绘为矩形,但是一个或多个区域可以具有一些其他形状(例如,圆形、梯形等)。此外,GUI窗口400的形状、大小和/或布局可以取决于将在其上呈现GUI窗口400的设备。例如,如图4所示,GUI窗口400以适合于移动设备的方式被格式化。
在一个实施方式中,主区域402和缩略图区域404A-404C中的每一个可以与由视频协作中的一个或多个参与者(例如,视频会议参与者)的相应客户端设备生成的视频流相关联。此外,在某些实施方式中,特定区域可以取决于与该区域相关联的参与者是否正在讲话(例如,使用接口模块204)来改变(例如,从缩略图区域到主区域)或交换显示在不同区域中的视频流。这样的改变可以自动执行(例如,不需要接收任何用户请求或检测到任何用户交互)。在一些实施方式中,会议平台200可以接收视频流并识别(例如,使用接口模块204)哪个视频流对应于当前发言者或一般关注的焦点(例如,视频流对应于托管媒体协作的参与者、讲话者的音量级别、特定参与者的托管选择等)。在一些实施方式中,实现GUI窗口400的客户端设备可以接收由会议平台200的接口模块204生成的复合内容流(例如,包括由一个或多个客户端设备110A-110Z生成的视频/音频流数据)。客户端设备可以被配置为从复合内容流提取内容(例如,一个或多个视频/音频流)。在一个实施方式中,复合内容流包括指定对应于GUI窗口400的区域的几何特性的元数据,使得视频流可以从复合内容流提取并映射到GUI窗口400内的适当区域。
在一个实施方式中,缩略图区域404A-404C中的一个可以变换或转换到主区域402中(例如,响应于参与者在缩略图区域上选择/点击或以其他方式激活缩略图区域),反之亦然。在一些实施方式中,当特定参与者在视频会议期间正在讲话时,参与者的视频流可以被显示在主区域402内。例如,如果对应于第一参与者的视频流被显示在主区域402中并且第一参与者没有讲话,第二参与者的视频流可以从缩略图区域404A-404C中的一个“升级”到主区域402,而第一参与者的视频流“降级”到缩略图区域404A-404C中的一个。
在一个实施方式中,复合内容流可以包括实时聊天数据。例如,聊天数据可以被显示在聊天区域308内。聊天区域308可以向用户/参与者提供机会输入聊天消息并且传送聊天消息(例如,传送到会议服务器120,其将聊天消息路由到其他参与者的客户端设备)。在一个实施方式中,可以向用户呈现可用或相关聊天的列表。在一个实施方式中,可以向用户呈现与聊天讨论相关联的主题的列表。响应于接收到用户对主题中的一个的选择,用户可以被呈现与该主题相关的类似聊天的列表,或者当前聊天讨论可以滚动到其中讨论所选主题的部分。
在一个实施方式中,选项区域410可以向用户提供可选择的选项。例如,可选择的选项可以允许用户调整媒体协作的设置(例如,显示特征、音量等),邀请另外的用户参与媒体协作,接收内容推荐,提供内容推荐,对媒体协作期间呈现的媒体协作和/或内容进行评价或投票,请求与媒体协作的主题相关的内容(例如,当前讨论的主题)等。关于图5更详细地描述与主题索引的生成和利用相关的选项。
图5是示出根据本公开的实施方式的用于生成会话事件的主题索引的方法500的流程图,并且图8是示出根据本公开的实施方式的用于排名主题的方法800的流程图。方法500和800可以通过包括硬件(例如,电路、专用逻辑、可编程逻辑、微代码等)、软件(例如,在处理设备上运行以执行硬件模拟的指令)或者其组合的处理逻辑来执行。在一些实施方式中,方法500和800可以由如关于图1和图2所描述的内容索引组件250来执行。在描述方法500和800时,参考图6、图7A和图7B以示出各种实施方式。要注意的是,图6、图7A和图7B意图用于示出目的,并且不被认为是限制性实施方式。
根据系统架构(例如,系统架构100)的各种实施方式,可以对媒体协作,并且特别是会话事件(例如,视频会议、音频会议、实况视频广播、基于文本的聊天、其组合等)来执行方法500和/或800的操作。在一个实施方式中,诸如由客户端设备(例如,客户端设备110A-110Z)生成/捕获的视频流的内容流可以被传送到会议服务器(例如,会议服务器120的会议平台200),其然后被传送到NLP服务器(例如,NLP服务器130的内容索引组件250)用于主题提取。在另一个实施方式中,内容流在被会议服务器接收之前被传送到NLP服务器用于主题提取,然后被传送到客户端设备(例如,作为组合内容流)。在另一个实施方式中,内容流由第一客户端设备(例如,客户端设备110A)生成/捕获,并且被传送到执行主题提取的会议服务器120。在另一个实施方式中,内容流由第一客户端设备(例如,客户端设备110A)生成/捕获,并且被传送到一个或多个附加设备(其中第一客户端设备和/或一个或多个附加客户端设备执行主题提取)。
参考图5,当从对应于第一会话事件的第一内容项中提取多个主题时,方法500在框510处开始。在一些实施方式中,框510由内容提取模块252和主题识别模块254执行。在一个实施方式中,第一会话事件可以对应于实况视频记录、预先记录的视频、视频会议、视频聊天、音频会议、音频聊天、基于文本的聊天或其组合。在一些实施方式中,如果会话事件包括音频分量,则将口语转录成文本(例如,使用内容提取模块252),并且可以使用主题识别模块254从文本中提取一个或多个主题的列表。在其他实施方式中,如果会话事件完全是基于文本的(诸如聊天消息序列),则主题识别可以直接执行而不需要转录。在一些实施方式中,在会话事件期间实时发生主题提取。
在一个实施方式中,会话事件可以是经由在用户的相应客户端设备上实现的媒体协作界面(例如,用户界面111A-111Z)多个用户可访问的媒体协作。例如,媒体协作界面可以类似于GUI窗口600,如图6所示。GUI窗口600包括主区域602,其可以显示会话事件的参与者相关联的视频流、实况视频流、预先记录的内容(例如,点播内容)、静态图像(例如,以幻灯片放映的形式)、伴随音频的演示、其组合等。缩略图604A-604C可以表示媒体协作的各种参与者的视频流(例如,与缩略图604A相关联的第一参与者、与缩略图604B相关联的第二参与者等)。在一个实施方式中,主区域602的视频流的缩略图版本被显示为缩略图(例如,缩略图604C)。
在一些实施方式中,主区域602是呈现实况视频流的媒体播放器,实况视频流可以是与会话事件的参与者相关联的视频流、实况广播等。在其他实施方式中,呈现在主区域602中的内容可以对应于预先记录的视频、预先记录的音频剪辑、演示等。在这样的实施方式中,主区域602可以包括回放区域610,回放区域610可以显示为覆盖主区域602或与主区域602相邻。回放区域610包括回放指示符612和全屏切换614,以在全屏模式和窗口模式(如所图示)之间切换主区域602。也可以向GUI窗口600的用户呈现赞成指示符606和不赞成指示符608(例如,覆盖主区域602、与主区域602相邻等),以允许用户对会话事件评级。在其他实施方式中,主区域602被完全省略(例如,如果会话事件不包括视频流)。
在一些实施方式中,GUI窗口600可以包括聊天窗口616。会话事件的各种参与者可以在其相应客户端设备处(例如,使用消息字段618)输入消息,该消息可以被传送到会议服务器(例如,会议服务器120)并且可用于会话事件的一些或全部参与者。在一些实施方式中,聊天窗口616与在主区域602中呈现的内容一起被显示。
回头参考图5,在框520处,为第一会话事件(例如,使用关联模块256)生成第一主题索引。第一主题索引将多个主题中的每一个与来自第一内容项的内容片段相关联。例如,为第一会话事件生成第一内容项记录(例如,内容记录280A-280Z或内容项记录300中的一个),其中第一内容项记录包括第一内容标识符(例如,内容标识符282A-282Z或内容标识符310中的一个)和第一主题索引(例如,主题索引284A-284Z或主题索引320中的一个)。第一主题索引可以在将内容呈现给一个或多个用户之前已经被生成,可以在呈现内容的同时被实时生成,或者可以在呈现内容之后被生成。在一个实施方式中,所生成的主题索引被添加到主题索引(例如,存储在数据存储106中)的数据库中,其中数据库的一个或多个主题索引对应于会话事件(例如,与会话事件相关联的内容)。数据库的每个会话事件可以由会话事件的至少一个相应主题搜索。在一些实施方式中,主题和内容片段可以与其他数据相关联,诸如讨论主题的讲话者/作者的身份(例如,用户名)、讨论主题的日期/时间(例如,讨论主题开始的时间、讨论主题的相关时间持续时间等)、与主题相关的情感数据(例如,会话事件中的参与者的赞成/不赞成)、表达情感的参与者的身份(例如,用户名)或其他相关数据。例如,可以执行搜索以识别与用户A对其表达负面情绪的的主题T相关的内容片段。
在一个实施方式中,如果内容是预先记录的内容,则用户的客户端设备可以使用GUI窗口600来接收内容并且呈现内容。客户端设备还可以接收与内容相关联的内容记录(例如,内容标识符可以是用于识别内容的规范标识符),并且GUI窗口600可以生成用于显示的来自主题列表620中的主题索引的主题列表。
在一个实施方式中,如果内容是实况内容(例如,实况视频流、实况音频流、实时聊天等),则可以为内容生成内容记录,并且在内容被流传输时主题索引可以实时更新。例如,在从会话事件的内容项(例如,使用内容提取模块252和主题识别模块254)提取新主题时,新主题可被添加到主题列表620。例如,如果内容项是实况视频流(例如,呈现在主区域602中),则可以从实况视频流中提取主题(例如,通过处理口语)并添加到主题索引,其可以被添加到主题列表620。作为另一示例,如果内容项是聊天(例如,在聊天窗口616中呈现),则主题可以从聊天消息中提取并添加到主题索引,其可以被添加到主题列表620。
回头参考图5,在框530处,识别包括来自多个主题的一个或多个主题的主题子集,在一些实施方式中,指定主题对应于指定为感兴趣的主题。在一些实施方式中,子集可以包括单个主题。例如,基于用户反馈,单个主题可以被指定为最感兴趣的主题。在一些实施方式中,子集可以包括多个主题。例如,基于用户反馈,主题可以已经被指定为在最感兴趣的主题之中。参照图8更详细地描述基于用户反馈识别主题的子集。在一些实施方式中,可以从客户端设备接收内容请求,其中内容请求包括主题指示符和讲话者的标识符(例如,谁可以是与该主题相关联的讲话者)。可以基于主题指示符和讲话者的标识符来识别主题的子集。
在框540处,生成第二内容项。第二内容项包括子集的每个主题的相应内容片段(第一内容项的内容片段)。作为示例,图7A示出了根据主题索引(例如,关于图5描述的第一主题索引)已经被索引的第一内容项700。可以基于N个主题(主题1到主题N)对第一内容项700进行索引,使得每个内容片段710A-710Z对应于N个主题中的一个或多个。在一些实施方式中,多于一个的内容片段710A-710Z可以对应于相同主题(例如,内容片段710B和内容片段710F都可对应于主题“dinosaurs(恐龙)”)。在一些实施方式中,相同的主题可以在特定内容项中多次出现。
在一些实施方式中,内容片段710A-710Z中的每一个可以对应于视频流(例如,实况视频流或预先记录的视频流)、音频流(例如,实况音频流或预先记录的音频流)、演示(例如,幻灯片放映)或基于文本的聊天的内容片段。例如,如果第一内容项是视频和/或音频流,则每个内容片段710A-710Z可以具有开始时间和结束时间(例如,内容片段710A具有开始时间T0和结束时间T1)。内容片段710A-710Z的每一个的开始和结束时间可以与主题索引一起存储,使得可以通过主题来定位第一内容项内的相关时间。作为另一个示例,如果第一内容项是幻灯片放映,则内容片段710A-710Z可以都对应于幻灯片放映的一个或多个幻灯片。作为另一个示例,如果第一内容项是基于文本的聊天,则内容片段710A-710Z可以都对应于基于文本的聊天的一个或多个消息(例如,在聊天窗口616中显示的一个或多个消息)。在一些实施方式中,内容片段710A-710Z中的每一个可以对应于第一内容项700内的连续和相邻序列,使得内容片段710A-710Z共同定义第一内容项(例如,每个片段是一起形成整个视频的视频剪辑)。在一些实施方式中,内容片段710A-710Z可以对应于与主题已经相关联的片段,使得内容片段710A-710Z不整体共同定义第一内容项700(例如,第一内容项700的“无主题”片段不被索引)。
主题子集包括用于识别对应于主题标识符的内容片段的主题标识符。例如,如果主题子集715包括主题1、4和6,则内容生成模块258可以生成第二内容项720,该第二内容项720包括对应于主题1、4和6的内容片段,即分别是内容片段710A、710D和710F。所生成的内容项可以被存储(例如,在数据存储106中)和/或被传送到请求使内容项生成的客户端设备(例如,客户端设备110A-110Z中的一个)(例如,客户端设备可以已经提交了对第一内容项700的精彩片段的请求)。在一个实施方式中,内容片段710A、710D和710F可以基于内容片段的相关性(例如,用户生成的评分/评级)、内容片段的持续时间、人类编辑者等中的一个或多个按时间顺序排列在第二内容项720中。
在一个实施方式中,可以使用主要主题索引(例如,主要主题索引350)来从多个内容项中生成内容项,如图7B所示,以便从多个内容项中产生主题相关部分/剪辑的蒙太奇。第一内容项750可以包括内容片段755A-755C,其中每个分别对应于主题1、2和3。类似地,第二内容项760和第三内容项770可以分别都包括内容片段765A-765C和内容片段775A-775B。主题子集780包括单个主题(主题2),虽然多于一个的主题可以被包括在该子集中。可以生成包括内容片段755B、765C和775B的第四内容项790。在一个实施方式中,内容片段755B、765C和775B可以基于内容片段的相关性(例如,用户生成的评分/评级)、内容片段的持续时间、人类编辑者等中的一个或多个按时间顺序排列在第四内容项790中。
在一个实施方式中,(例如,基于来自主题列表620的用户选择在客户端设备处)可以接收包括至少一个主题指示符的内容请求。至少一个主题指示符可以用于识别主题索引内的主题子集。在一些实施方式中,内容请求可以导致生成内容项,如上面关于框540所描述的,并且生成的内容项可以被传送给用户的客户端设备(例如,用于在GUI窗口600内呈现)。在其他实施方式中,内容请求可以改变在GUI窗口600中呈现给用户的内容,而不一定导致生成新的内容项。用户可以从GUI窗口600的主题列表620中选择一个或多个主题指示符(例如,主题指示符622),其可以自动用作内容请求。在一些实施方式中,该请求可以使得当前呈现的内容移动到与所选主题相关的部分或从该部分回放。例如,如果选择了主题指示符622,则主区域602或聊天窗口616中的一个或多个可以呈现与该主题相关的内容的一部分。例如,602的视频流可以从其中主题对应于“dinosaurs”的较早部分开始回放。作为另一个示例,聊天窗口616可以滚动到其中主题对应于“dinosaurs”的较早部分,如图6所示。
在一些实施方式中,GUI窗口600可以包括选项624。用户可以选择选项624以找到相似内容(例如,基于一个或多个所选主题或会话事件的最相关主题),并且客户端设备可以(例如,向会议服务器或向另一个源)提交对内容的搜索请求。例如,GUI窗口600可以显示类似内容的列表(例如,与当前或选择的主题相关的其他视频)和/或向用户自动呈现不同的内容(例如,在主区域602中)。
在一些实施方式中,GUI窗口600可以包括选项626。用户可以选择选项626以查找与当前聊天相似的其他聊天。例如,响应于用户选择选项626,GUI窗口600可以基于当前聊天主题、所选聊天主题等显示其他可用聊天的列表和/或将用户自动转移到另一个聊天。例如,如果当前主题(基于正在被实时更新的主题索引)是“dinosaurs”,则可以向用户呈现加入与“dinosaurs”相关的不同聊天的选项。
在一些实施方式中,GUI窗口600可以包括选项628。用户可以选择选项628来搜索主题。例如,GUI窗口600可以向用户呈现用户可以键入要搜索的主题的输入字段。在一个实施方式中,主题被传送到NLP服务器,该NLP服务器从主要主题索引(例如,主要主题索引350)中识别内容项并且返回内容项列表(其可以包括视频、音频、或基于文本的内容项中的一个或多个)。可以呈现内容项列表然后用于GUI窗口600显示。
在一些实施方式中,GUI窗口600可以包括选项630。用户可以选择选项630来观看精彩片段。例如,当前显示的内容(例如,在主区域602中,在聊天窗口616中等)可以被该内容的示出内容的感兴趣部分的精彩片段替换,同时省略不太感兴趣的部分。精彩片段可以已经以与关于图7A所描述的相似的方式为内容生成。内容的感兴趣部分可以根据各种实施方式来确定,诸如关于图8所描述的那些。
在一些实施方式中,GUI窗口600可以包括用于推荐内容的推荐区域632。例如,可以基于来自与会话事件(例如,会话事件的当前主题,由用户选择的主题等)相关联的主题索引的主题来生成内容推荐。
参考图8,当在实况视频广播期间从多个用户接收到反馈时,方法800在框810处开始。需要说明的是,方法800不限于实况视频广播,也可以适于预先记录的内容等。在一个实施方式中,在实况视频广播期间接收反馈。例如,接收实况视频广播的客户端设备的用户可以在实况视频广播期间指示赞成或不赞成。例如,实现GUI窗口600的客户端设备的用户可以在实况视频馈送的广播期间一次或多次点击赞成指示符606或不赞成指示符608中的一个。作为另一个示例,可以基于在会话事件期间口头地(例如,用户发声他们的赞成/不赞成)、非口头地(例如,如果用户在消息字段618中键入他/她喜欢/不喜欢在主区域602中呈现的内容、切换到不同的内容、将内容指定为“喜欢的内容”等)等做出的评论来确定赞成或不赞成。赞成或不赞成数据可以由会议服务器(例如,会议服务器120)或NLP服务器(例如,NLP服务器130)来收集。
在框820处,为实况视频广播生成主题索引,其中多个主题中的每一个与实况视频广播的内容片段相关联(例如,第一主题与第一内容片段相关联,第二主题与第二内容片段相关联等)。可以根据本文描述的任何实施例,诸如关于图5所描述的那些(例如,框520)来生成(例如,使用关联模块256)主题索引。
在框830处,基于从多个用户接收的反馈对多个主题中的每一个进行评分。在一些实施方式中,可以基于用户提供他/她的赞成或不赞成的定时将分数映射到特定主题。例如,如果在由图7A的第一内容项700的T1和T2定义的持续时间期间选择了赞成指示符606的用户选择,则这可以用作主题2的赞成指示符。在一些实施方式中,可以对于主题计算分数,作为对于该主题已经接收到赞成指示的次数与作为对于该主题已经接收到不赞成指示的次数之间的差(例如,对于从多个客户端设备收集的赞成和不赞成指示)。在其它实施方式中,可以利用对主题评分的其他方式。对于每个主题,为主题生成的分数可以存储在主题索引中(例如,与相应的主题标识符325A-325Z一起存储,或者与相应的主题标识符360A-360Z一起存储)。
在框840处,从多个主题中识别主题的子集。例如,通过确定主题满足评分条件来识别来自多个主题的主题。所有这些满足评分条件的主题可以包含在子集中。在一些实施方式中,评分条件可以是主题超过阈值分数。在一些实施方式中,评分条件可以是主题排名在阈值排名之上(例如,被识别的主题对应于顶部10个评分最高的主题)。在一些实施方式中,人类编辑者可以确定是否应该将更多或更少的主题添加到主题子集(例如,使用客户端设备110A-110Z中的一个)。
在框850处,从与子集的每个主题相关联的内容片段中生成内容项。内容项可以根据本文所描述的实施方式中的任一个来生成,诸如关于图5(例如,框540)、图7A和图7B所描述的那些。
为了简化说明,将本公开的方法的各种实施方式描绘和描述为一系列动作。然而,根据本公开的动作可以以各种顺序和/或同时,并且可以与本文未呈现和描述的其他动作一起发生。此外,为实现根据所公开的主题的方法,并非可能需要所有示出的动作。此外,本领域的技术人员将会理解并认识到,方法可以可替选地经由状态图来表示为一系列相互关联的状态或一系列事件。此外,应该理解的是,本说明书中公开的方法的实施方式能够被存储在制品上,以便于将这样的方法传递和转移到计算设备。这里使用的术语“制品”旨在包含可从任何计算机可读设备或存储介质访问的计算机程序。
图9示出了以计算机系统900的示例性形式的机器的图形表示,在该计算机系统900内可以执行用于使机器执行这里讨论的任何一个或多个方法的指令集。在替代实施方式中,机器可以连接(例如,联网)到LAN、内联网、外联网或互联网中的其他机器。该机器可以在客户端-服务器网络环境中以服务器或客户端机器的能力操作,或作为对等(或分布式)网络环境中的对等机器操作。机器可以是个人计算机(PC)、平板计算机、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、web设备、服务器、网络路由器、交换机或桥接器,或者能够(顺序或以其他方式)执行指定了该机器要采取的动作的指令集的任何机器。此外,虽然仅示出单个机器,但是术语“机器”也应被理解为包括单独或联合执行指令集(或多个指令集)以执行本文讨论的任何一个或多个方法的机器的任何集合。计算机系统900的一些或全部组件可以被客户端设备110A-110Z、数据存储106、会议服务器120、NLP服务器130或自然语言数据库140中的一个或多个执行或示出。
示例性计算机系统900包括经由总线908彼此通信的处理设备(处理器)902、主存储器904(例如,只读存储器(ROM)、闪存、诸如同步DRAM(SDRAM)或Rambus DRAM(RDRAM)的动态随机存取存储器(DRAM)等)、静态存储器906(例如,闪存、静态随机存取存储器(SRAM)等)以及数据存储设备918。
处理器902表示一个或多个通用处理设备,诸如微处理器、中央处理单元等。更具体地说,处理器902可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器,或实现其他指令集的处理器或实现指令集组合的处理器。处理器902还可以是一个或多个专用处理设备,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、DSP、网络处理器等。处理器902被配置为执行用于执行这里讨论的操作和步骤的指令926。
计算机系统900还可以包括网络接口设备922。计算机系统900还可以包括视频显示单元910(例如,液晶显示器(LCD)、阴极射线管(CRT)或触摸屏屏幕)、字母数字输入设备912(例如,键盘)、光标控制设备914(例如,鼠标)和信号生成设备920(例如,扬声器)。
数据存储设备918可以包括非暂时性计算机可读存储介质924,在其上存储实施本文描述的方法或功能中的任何一个或多个的一个或多个指令集926(例如,软件)。在由计算机系统900执行期间,指令926还可以完全或至少部分地驻留在主存储器904内和/或处理器902内,主存储器904和处理器902也构成计算机可读存储介质。指令926可以进一步经由网络接口设备922通过网络974(例如,网络105)被传送或接收。
在一个实施方式中,指令926包括用于一个或多个内容索引组件250的指令,该内容索引组件250可以对应于关于图1和图2描述的同名对应部件。虽然计算机可读存储介质924在示例性实施方式中被示出为单个介质,但是术语“计算机可读存储介质”或“机器可读存储介质”应当被认为包括存储一个或多个指令集的单个介质或者多个介质(例如,集中式或分布式数据库,和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”或“机器可读存储介质”也应该被认为包括能够存储、编码或携带指令集以供机器执行并且使机器执行本公开的方法中的任何一个或多个的任何暂时性或非暂时性计算机可读存储介质。因此,术语“计算机可读存储介质”应被认为包括但不限于固态存储器、光学介质和磁性介质。
在前面的描述中,阐述了许多细节。然而,对于受益于本公开内容的本领域普通技术人员而言显而易见的是,可以在没有这些具体细节的情况下实践本公开。在一些情况下,为了避免混淆本公开,以框图形式而不是详细地示出公知的结构和设备。
详细描述的一些部分可能已经根据对计算机存储器内的数据位的操作的算法和符号表示来呈现。这些算法描述和表示是数据处理领域的技术人员用来最有效地将其工作的实质传达给本领域其他技术人员的手段。本文中的算法一般被认为是导致期望结果的自洽的步骤序列。这些步骤是需要对物理量进行物理操纵的步骤。通常,但不一定,这些量采取能够被存储、传送、组合、比较和以其他方式操纵的电或磁信号的形式。主要出于常用的原因,有时将这些信号称为比特、值、元素、符号、字符、术语、数字等被证明是方便的。
然而,应该记住的是,所有这些和类似的术语都与适当的物理量相关联,并且仅仅是适于这些量的方便的标签。除非特别声明,否则从以下讨论中可以明显看出,在整个说明书中,利用诸如“接收”、“传送”、“生成”、“引起”、“添加”、“减去”、“插入”、“包括”、“移除”、“提取”、“分析”、“确定”、“启用”、“识别”、“修改”等的术语是指计算机系统或类似的电子计算设备的动作和过程,其将在计算机系统的寄存器和存储器内表示为物理(例如,电子)量的数据操纵和转换成类似地表示为计算机系统存储器或寄存器或其它这样的信息存储、传输或显示设备内的物理量的其它数据。
本公开还涉及用于执行本文的操作的装置、设备或系统。该装置、设备或系统可以为了所需目的而专门构造,或者可以包括通过计算机中存储的计算机程序选择性地激活或重新配置的通用计算机。这样的计算机程序可以存储在计算机或机器可读存储介质中,例如但不限于包括软盘、光盘、光盘只读存储器(CD-ROM)的任何类型的盘以及磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、磁卡或光卡或适于存储电子指令的任何类型的介质。
在这里讨论的系统收集关于用户的个人信息或者可以利用个人信息的情况下,可以向用户提供控制程序或特征是否收集用户信息(例如,关于用户的社交网络、社交行为或活动、专业、用户的偏好或用户的当前位置),或者控制是否和/或如何从内容服务器接收可能与用户更相关的内容的机会。另外,某些数据在存储或使用之前可以以一种或多种方式进行处理,因此可以删除个人可识别信息。例如,可以对用户的身份进行处理,使得不能为用户确定个人可识别信息,或者在获得位置信息的情况下可以将用户的地理位置一般化(例如到城市、邮政编码或州级),使得不能确定用户的特定位置。因此,用户可以控制如何收集关于用户的和由内容服务器使用的信息。
这里使用词语“示例”或“示例性”来表示用作示例、实例或说明。在此描述为“示例”或“示例性”的任何方面或设计不一定被解释为比其他方面或设计优选或有利。相反,使用词语“示例”或“示例性”意图以具体的方式呈现概念。如在本申请中所使用的,术语“或”旨在表示包含性的“或”而不是排他性的“或”。也就是说,除非另有规定,或者从上下文清楚的,“X包括A或B”意在表示任何自然的包含性排列。也就是说,如果X包含A,X包括B;或者X包括A和B,则在上述任何情况下都满足“X包括A或B”。另外,除非另有说明或者从上下文来看清楚是指单数形式,否则本申请和所附权利要求书中使用的冠词“一(a/an)”通常应解释为表示“一个或多个”。在整个说明书中对“实施方式”或“一个实施方式”的引用意指结合实施方式描述的特定特征、结构或特性被包括在至少一个实施方式中。因此,贯穿本说明书的各个地方出现的短语“实施方式”或“一个实施方式”并不一定都指相同的实施方式。而且,应注意的是,参照附图中的某些元素所使用的“A-Z”符号并不旨在限于特定数量的元素。因此,“A-Z”被解释为具有一个或多个存在于特定实施方式中的元件。
应该理解的是,以上描述旨在是说明性的而不是限制性的。在阅读和理解以上描述之后,许多其他实施方式对于本领域技术人员来说将是显而易见的。因此,本公开的范围应该参考所附权利要求以及这些权利要求的等同物的全部范围来确定。

Claims (20)

1.一种方法,包括:
由处理设备从对应于第一会话事件的第一内容项中提取多个主题;
由所述处理设备生成所述第一会话事件的第一主题索引,其中所述第一主题索引将所述多个主题中的每一个与来自所述第一内容项的内容片段相关联;
由所述处理设备识别所述多个主题内的一个或多个主题的第一子集;和
由所述处理设备生成包括所述第一子集的所述一个或多个主题中的每一个的相应内容片段的第二内容项。
2.根据权利要求1所述的方法,还包括:
从客户端设备接收包括至少一个主题指示符的内容请求,其中识别主题的所述第一子集包括基于所述至少一个主题指示符来识别主题的所述第一子集;和
将所述第二内容项传送到所述客户端设备。
3.根据权利要求1所述的方法,
从客户端设备接收包括主题指示符和讲话者的标识符的内容请求,其中识别主题的所述第一子集包括基于所述主题指示符和所述讲话者的标识符来识别主题的所述第一子集;和
将所述第二内容项传送到所述客户端设备。
4.根据权利要求1所述的方法,其中所述第一内容项是实况视频广播,并且其中所述方法还包括:
在所述实况视频广播期间从多个用户接收反馈;和
基于所述反馈为所述多个主题中的每一个主题生成分数,其中识别主题的所述第一子集包括对于所述多个主题中的每一个主题:
响应于确定该主题的相应分数满足评分条件,在主题的所述第一子集中包括该主题,其中满足所述评分条件包括以下中的至少一个:满足阈值排名或排名在阈值排名之上。
5.根据权利要求1所述的方法,还包括:
将所述第一主题索引添加到主题索引数据库中,所述主题索引数据库中的每个主题索引对应于多个会话事件中的一个,其中所述多个会话事件中的每一个都可通过所述会话事件的至少一个相应主题来搜索。
6.根据权利要求5所述的方法,还包括:
接收一个或多个主题指示符;
基于所述一个或多个主题指示符来识别所述多个会话事件的第二子集;和
对于所述第二子集中的每个会话事件,识别对应于所述一个或多个主题指示符的一个或多个内容片段,其中生成所述第二内容项包括从所述一个或多个内容片段中生成所述第二内容项。
7.根据权利要求1所述的方法,其中在所述第一会话事件期间实时生成所述第一主题索引。
8.根据权利要求1所述的方法,其中所述会话事件是实况视频记录、预先记录的视频、视频聊天、视频会议或基于文本的聊天中的一个。
9.一种系统,包括:
存储器;和
处理设备,所述处理设备通信地耦合到所述存储器,其中所述处理设备用于:
从对应于第一会话事件的第一内容项中提取多个主题;
为所述第一会话事件生成第一主题索引,其中所述第一主题索引将所述多个主题中的每一个与来自所述第一内容项的内容片段相关联;
识别所述多个主题内的一个或多个主题的第一子集;和
生成包括所述第一子集的所述一个或多个主题中的每一个的相应内容片段的第二内容项。
10.根据权利要求9所述的系统,其中所述处理设备还用于:
从客户端设备接收包括至少一个主题指示符的内容请求,其中识别主题的所述第一子集包括基于所述至少一个主题指示符来识别主题的所述第一子集;和
将所述第二内容项传送到所述客户端设备。
11.根据权利要求9所述的系统,其中所述处理设备还用于:
从客户端设备接收包括主题指示符和讲话者的标识符的内容请求,其中为了识别主题的所述第一子集,所述处理设备还基于所述主题指示符和所述讲话者的所述标识符来识别主题的所述第一子集;和
将所述第二内容项传送到所述客户端设备。
12.根据权利要求9所述的系统,其中所述第一内容项是实况视频广播,并且其中所述处理设备还用于:
在所述实况视频广播期间从多个用户接收反馈;
基于所述反馈为所述多个主题中的每一个生成分数;和
对于所述多个主题中的每一个主题:
响应于确定该主题的相应分数满足评分条件,在主题的所述第一子集中包括该主题,其中满足所述评分条件包括以下中的至少一个:满足阈值排名或排名在阈值排名之上。
13.根据权利要求9所述的系统,其中所述处理设备还用于:
将所述第一主题索引添加到主题索引数据库中,所述主题索引数据库中的每个主题索引对应于多个会话事件中的一个,其中所述多个会话事件中的每一个都可通过所述会话事件的至少一个相应主题来搜索。
14.根据权利要求13所述的系统,其中所述处理设备还用于:
接收一个或多个主题指示符;
基于所述一个或多个主题指示符识别所述多个会话事件的第二子集;
对于所述第二子集中的每个会话事件,识别对应于所述一个或多个主题指示符的一个或多个内容片段;和
从所述一个或多个内容片段中生成所述第二内容项。
15.一种非暂时性计算机可读存储介质,其具有在其上存储的指令,所述指令当由处理设备执行时使所述处理设备执行操作,所述操作包括:
从对应于第一会话事件的第一内容项中提取多个主题;
生成所述第一会话事件的第一主题索引,其中所述第一主题索引将所述多个主题中的每一个与来自所述第一内容项的内容片段相关联;
识别所述多个主题内的一个或多个主题的第一子集;和
生成包括所述第一子集的所述一个或多个主题中的每一个的相应内容片段的第二内容项。
16.根据权利要求15所述的非暂时性计算机可读存储介质,其中所述操作还包括:
从客户端设备接收包括至少一个主题指示符的内容请求,其中识别主题的所述第一子集包括基于所述至少一个主题指示符来识别主题的所述第一子集;和
将所述第二内容项传送到所述客户端设备。
17.根据权利要求15所述的非暂时性计算机可读存储介质,其中所述操作还包括:
从客户端设备接收包括主题指示符和讲话者的标识符的内容请求,其中识别主题的所述第一子集包括基于所述主题指示符和所述讲话者的所述标识符来识别主题的所述第一子集;和
将所述第二内容项传送到所述客户端设备。
18.根据权利要求15所述的非暂时性计算机可读存储介质,其中所述第一内容项是实况视频广播,并且其中所述操作还包括:
在所述实况视频广播期间从多个用户接收反馈;和
基于所述反馈为所述多个主题中的每一个生成分数,其中识别主题的所述第一子集包括对于所述多个主题中的每一个主题:
响应于确定该主题的相应分数满足评分条件,在主题的所述第一子集中包括该主题,其中满足所述评分条件包括以下中的至少一个:满足阈值排名或排名在阈值排名之上。
19.根据权利要求15所述的非暂时性计算机可读存储介质,其中所述操作还包括:
将所述第一主题索引添加到主题索引数据库中,所述主题索引数据库中的每个主题索引对应于多个会话事件中的一个,其中所述多个会话事件中的每一个都可通过所述会话事件的至少一个相应主题来搜索。
20.根据权利要求19所述的非暂时性计算机可读存储介质,其中所述操作还包括:
接收一个或多个主题指示符;
基于所述一个或多个主题指示符来识别所述多个会话事件的第二子集;和
对于所述第二子集中的每个会话事件,识别对应于所述一个或多个主题指示符的一个或多个内容片段,其中生成所述第二内容项包括从所述一个或多个内容片段中生成所述第二内容项。
CN201680029976.9A 2015-08-24 2016-08-23 使用自然语言处理生成主题索引 Active CN107636651B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/833,599 US10621231B2 (en) 2015-08-24 2015-08-24 Generation of a topic index with natural language processing
US14/833,599 2015-08-24
PCT/US2016/048187 WO2017035136A1 (en) 2015-08-24 2016-08-23 Generation of a topic index with natural language processing

Publications (2)

Publication Number Publication Date
CN107636651A true CN107636651A (zh) 2018-01-26
CN107636651B CN107636651B (zh) 2021-11-16

Family

ID=56843068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680029976.9A Active CN107636651B (zh) 2015-08-24 2016-08-23 使用自然语言处理生成主题索引

Country Status (5)

Country Link
US (1) US10621231B2 (zh)
EP (1) EP3341857B1 (zh)
KR (1) KR102047923B1 (zh)
CN (1) CN107636651B (zh)
WO (1) WO2017035136A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110471886A (zh) * 2018-05-09 2019-11-19 富士施乐株式会社 用于基于检测桌子周围的文件和人来搜索文件和人的系统
US10621231B2 (en) 2015-08-24 2020-04-14 Google Llc Generation of a topic index with natural language processing
CN112118215A (zh) * 2019-06-20 2020-12-22 国际商业机器公司 基于话题确定的方便实时会话
CN114218438A (zh) * 2021-12-23 2022-03-22 北京百度网讯科技有限公司 视频数据处理方法、装置、电子设备和计算机存储介质

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11050845B2 (en) 2016-02-25 2021-06-29 At&T Intellectual Property I, L.P. Method and apparatus for providing configurable event content
US10506089B2 (en) * 2016-08-12 2019-12-10 International Business Machines Corporation Notification bot for topics of interest on voice communication devices
US10950275B2 (en) * 2016-11-18 2021-03-16 Facebook, Inc. Methods and systems for tracking media effects in a media effect index
US10303928B2 (en) 2016-11-29 2019-05-28 Facebook, Inc. Face detection for video calls
US10554908B2 (en) 2016-12-05 2020-02-04 Facebook, Inc. Media effect application
US10148910B2 (en) * 2016-12-30 2018-12-04 Facebook, Inc. Group video session
US11128675B2 (en) * 2017-03-20 2021-09-21 At&T Intellectual Property I, L.P. Automatic ad-hoc multimedia conference generator
US10679182B2 (en) * 2017-05-17 2020-06-09 International Business Machines Corporation System for meeting facilitation
WO2019032994A1 (en) * 2017-08-10 2019-02-14 Facet Labs, Llc ORAL, FACIAL AND GESTURE COMMUNICATION DEVICES AND COMPUTER INTERACTION ARCHITECTURE WITH DIGITAL MULTIMEDIA CONTENT
US10558827B2 (en) 2018-02-23 2020-02-11 Microsoft Technology Licensing, Llc Automatic method and system for identifying consensus and resources
US20190268385A1 (en) * 2018-02-23 2019-08-29 Microsoft Technology Licensing, Llc Automatic method and system for identifying consensus and resources
CN110633406B (zh) * 2018-06-06 2023-08-01 北京百度网讯科技有限公司 事件专题的生成方法、装置、存储介质和终端设备
US20200162698A1 (en) * 2018-11-20 2020-05-21 International Business Machines Corporation Smart contact lens based collaborative video conferencing
US11829723B2 (en) 2019-10-17 2023-11-28 Microsoft Technology Licensing, Llc System for predicting document reuse
EP4200840A1 (en) * 2020-08-18 2023-06-28 Cognius AI Pte Ltd System and a method to create conversational artificial intelligence
EP4285241A1 (en) * 2021-01-26 2023-12-06 Microsoft Technology Licensing, LLC Collaborative content recommendation platform
US11513664B2 (en) * 2021-01-26 2022-11-29 Microsoft Technology Licensing, Llc Collaborative content recommendation platform
WO2023229056A1 (ko) * 2022-05-23 2023-11-30 주식회사 엔씨소프트 비디오 데이터를 이용하여 외부 전자 장치의 화면을 표시하기 위한 정보를 송신하기 위한 전자 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102646134A (zh) * 2012-03-29 2012-08-22 百度在线网络技术(北京)有限公司 一种用于确定消息记录中的消息会话的方法和设备
US8392409B1 (en) * 2006-01-23 2013-03-05 Symantec Corporation Methods, systems, and user interface for E-mail analysis and review
US20150006703A1 (en) * 2011-08-30 2015-01-01 Open Text S.A. System and method of browsing offline and queried content
US20150186368A1 (en) * 2013-12-30 2015-07-02 Verizon and Redbox Digital Entertainment Services, LLC Comment-based media classification

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434520B1 (en) 1999-04-16 2002-08-13 International Business Machines Corporation System and method for indexing and querying audio archives
US7382933B2 (en) 2005-08-24 2008-06-03 International Business Machines Corporation System and method for semantic video segmentation based on joint audiovisual and text analysis
US7801910B2 (en) 2005-11-09 2010-09-21 Ramp Holdings, Inc. Method and apparatus for timed tagging of media content
US7640272B2 (en) 2006-12-07 2009-12-29 Microsoft Corporation Using automated content analysis for audio/video content consumption
US8756233B2 (en) 2010-04-16 2014-06-17 Video Semantics Semantic segmentation and tagging engine
US9183270B2 (en) * 2010-05-17 2015-11-10 Wal-Mart Stores, Inc. Social genome
US20110289088A1 (en) 2010-05-19 2011-11-24 Frank N. Magid Associates, Inc. System and method for ranking content interest
US8423555B2 (en) * 2010-07-09 2013-04-16 Comcast Cable Communications, Llc Automatic segmentation of video
GB2502736A (en) 2011-02-23 2013-12-04 Bottlenose Inc System and method for analyzing messages in a network or across networks
US8698872B2 (en) * 2011-03-02 2014-04-15 At&T Intellectual Property I, Lp System and method for notification of events of interest during a video conference
US9641898B2 (en) * 2013-12-24 2017-05-02 JBF Interlude 2009 LTD Methods and systems for in-video library
US20150193482A1 (en) * 2014-01-07 2015-07-09 30dB, Inc. Topic sentiment identification and analysis
US10621231B2 (en) 2015-08-24 2020-04-14 Google Llc Generation of a topic index with natural language processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8392409B1 (en) * 2006-01-23 2013-03-05 Symantec Corporation Methods, systems, and user interface for E-mail analysis and review
US20150006703A1 (en) * 2011-08-30 2015-01-01 Open Text S.A. System and method of browsing offline and queried content
CN102646134A (zh) * 2012-03-29 2012-08-22 百度在线网络技术(北京)有限公司 一种用于确定消息记录中的消息会话的方法和设备
US20150186368A1 (en) * 2013-12-30 2015-07-02 Verizon and Redbox Digital Entertainment Services, LLC Comment-based media classification

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10621231B2 (en) 2015-08-24 2020-04-14 Google Llc Generation of a topic index with natural language processing
CN110471886A (zh) * 2018-05-09 2019-11-19 富士施乐株式会社 用于基于检测桌子周围的文件和人来搜索文件和人的系统
CN112118215A (zh) * 2019-06-20 2020-12-22 国际商业机器公司 基于话题确定的方便实时会话
CN114218438A (zh) * 2021-12-23 2022-03-22 北京百度网讯科技有限公司 视频数据处理方法、装置、电子设备和计算机存储介质

Also Published As

Publication number Publication date
EP3341857B1 (en) 2021-05-26
WO2017035136A1 (en) 2017-03-02
CN107636651B (zh) 2021-11-16
US20170060917A1 (en) 2017-03-02
KR102047923B1 (ko) 2019-11-22
EP3341857A1 (en) 2018-07-04
KR20170134588A (ko) 2017-12-06
US10621231B2 (en) 2020-04-14

Similar Documents

Publication Publication Date Title
CN107636651A (zh) 使用自然语言处理生成主题索引
US20220294836A1 (en) Systems for information sharing and methods of use, discussion and collaboration system and methods of use
US10656782B2 (en) Three-dimensional generalized space
CN108027832A (zh) 使用关键字缩放的自动摘要的可视化
US20210369042A1 (en) Natural conversation storytelling system
US20170371496A1 (en) Rapidly skimmable presentations of web meeting recordings
EP2083546A1 (en) A system and method for real time local music playback and remote server lyric timing synchronization utilizing social networks and wiki technology
JP2019003604A (ja) ビデオベースの通信におけるコンテンツキュレーションのための方法、システム及びプログラム
US9838824B2 (en) Social media processing with three-dimensional audio
CN108141499A (zh) 惯性音频滚动
US20140272820A1 (en) Language learning environment
WO2010018586A2 (en) A method and a system for real time music playback syncronization, dedicated players, locating audio content, following most listened-to lists and phrase searching for sing-along
WO2013016312A1 (en) Web-based video navigation, editing and augmenting apparatus, system and method
US11107465B2 (en) Natural conversation storytelling system
Yew et al. Knowing funny: genre perception and categorization in social video sharing
US11609738B1 (en) Audio segment recommendation
WO2018094952A1 (zh) 一种内容推荐方法与装置
Evans et al. Creating object-based experiences in the real world
Kerr Experiments in sound: generating sonic landscapes in online spaces
US20220114210A1 (en) Social media video sharing and cyberpersonality building system
WO2018069580A1 (en) Interactive collaboration tool
Topkara et al. Tag me while you can: Making online recorded meetings shareable and searchable
Euritt et al. ‘And if we don’t stop him, I don’t know who will’: recoding intimacy in My Dad Wrote a Porno
Milojevic et al. Media-Tech Companies as Agents of Innovation: From Radical to Incremental Innovation in a Cluster
WO2018115878A1 (en) A method and system for digital linear media retrieval

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant