CN109155050A - 用于识别匹配内容的系统和方法 - Google Patents
用于识别匹配内容的系统和方法 Download PDFInfo
- Publication number
- CN109155050A CN109155050A CN201680085619.4A CN201680085619A CN109155050A CN 109155050 A CN109155050 A CN 109155050A CN 201680085619 A CN201680085619 A CN 201680085619A CN 109155050 A CN109155050 A CN 109155050A
- Authority
- CN
- China
- Prior art keywords
- content item
- frame
- content
- social networking
- networking system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services; Handling legal documents
- G06Q50/184—Intellectual property management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
Abstract
系统、方法和非易失性计算机可读介质可以确定第一内容项被提供用于通过社交网络系统发布。确定第一内容项中的与包括在第二内容项中的内容匹配的至少一些部分,第二内容项通过社交网络系统可访问。确定第一内容项的部分包括来自第二内容项的至少一些受版权保护的内容。将至少一个通知提供给第二内容项的发布者,其中,该通知指示第一内容项的发布者潜在侵犯版权,并且其中,该通知识别第一内容项中的与第二内容项中的受版权保护的内容匹配的至少一些部分。
Description
技术领域
本技术涉及内容匹配的领域。更具体地,本技术涉及用于识别匹配内容项的技术。
背景技术
现今,为了各种各样的目的,人们经常应用计算装置(或者系统)。用户可以使用他们的计算装置例如彼此交互,访问内容,共享内容,并且创建内容。在一些情况下,内容项可以包括来自社交网络成员的帖子。该帖子可包括文本和媒体内容项,诸如,图像、视频和音频。该帖子可发布到社交网络,供其他人使用。
发明内容
本公开内容的各种实施方式可以包括被配置为确定提供第一内容项用于通过社交网络系统发布的系统、方法和非易失性计算机可读介质。确定与包括在第二内容项中的内容匹配的第一内容项的至少一些部分,第二内容项通过社交网络系统可访问。确定第一内容项的部分包括来自第二内容项的至少一些受版权保护的内容。将至少一个通知提供给第二内容项的发布者,其中,该通知指示第一内容项的发布者潜在的侵犯版权,并且其中,该通知识别与第二内容项中的受版权保护的内容匹配的第一内容项的至少一些部分。
在实施方式中,系统、方法和非易失性计算机可读介质被配置为确定各自包括与第一内容项中的帧匹配的至少一个帧的一组候选内容项,该组候选内容项包括第二内容项并且确定与第二内容项中的连续帧序列匹配的第一内容项中的至少一个连续帧序列。
在实施方式中,系统、方法和非易失性计算机可读介质被配置为:确定用于第一内容项中的帧的指纹;至少部分基于为给定帧识别与给定帧匹配的其他内容项中的一个或多个帧的搜索索引确定与用于帧的指纹相关联的一个或多个指纹,其中,搜索索引中的每个指纹参考通过社交网络系统可获得的至少一个内容项;并且至少部分基于通过一个或多个指纹参考的内容项确定该组候选内容项。
在实施方式中,系统、方法和非易失性计算机可读介质被配置为:确定第一内容项中的至少一个第一帧与第二内容项中的至少一个第一帧匹配;以及确定第一内容项中的至少一个第二帧与第二内容项的至少一个第二帧匹配,其中,第一内容项中的第一帧邻近于第一内容项中的第二帧,并且其中,第二内容项中的第一帧邻近于第二内容项中的第二帧。
在实施方式中,系统、方法和非易失性计算机可读介质被配置为确定第一内容项中的第一帧的指纹与第二内容项中的第一帧的指纹之间的汉明距离达到阈值。
在实施方式中,系统、方法和非易失性计算机可读介质被配置为:确定该组候选内容项的排序,该排序至少部分基于与第一内容项中的帧匹配的至少一段候选内容项中的多个帧;并且去除与第一内容项中至少阈值数量的帧不匹配的该组候选内容项中的候选内容项。
在实施方式中,系统、方法和非易失性计算机可读介质被配置为确定第二内容项的发布者将第二内容项的一个或多个部分识别为受版权保护的内容。
在实施方式中,系统、方法和非易失性计算机可读介质被配置为提供用于至少查看第一内容项和第二内容项的界面。
在实施方式中,该界面包括播放确定匹配的第一内容项和第二内容项这两者的相应部分的至少一个选项,其中,同步执行播放相应部分。
在实施方式中,该界面提供指示包括与来自第二内容项的内容匹配的内容的第一内容项的总播放时间量的信息。
应当理解,从附图和以下详细说明中所公开的技术的许多其他特征、应用、实施方式和/或变化将是清晰可见的。在不偏离所公开的技术的原理的情况下,可以采用本文中描述的结构、系统、非易失性计算机可读介质和方法的其他和/或可替换的实现方式。
附图说明
图1示出了根据本公开内容的实施方式的被配置为提供访问各个内容项的示例性内容提供器模块的示例性系统。
图2示出了根据本公开内容的实施方式的内容匹配模块的实例。
图3示出了根据本公开内容的实施方式的界面的示例图。
图4示出了根据本公开内容的各种实施方式的用于提交发布到社交网络系统的内容项的示例性过程。
图5示出了根据本公开内容的各种实施方式的用于确定内容项之间的匹配的示例性过程。
图6示出了根据本公开内容的实施方式的包括可以在各种情形下利用的示例性社交网络系统的示例性系统的网络图。
图7示出了根据本公开内容的实施方式的可以在各种情形下利用的计算机系统或者计算装置的实例。
为了说明目的,附图仅描述了所公开的技术的各种实施方式,其中,附图使用相同参考标号来识别相同元件。本领域的技术人员从以下讨论中将容易认识到,在不偏离本文描述的所公开的技术的原理的情况下,可以采用附图中示出的结构和方法的替换实施方式。
具体实施方式
用于识别匹配内容的方法
现今,为了各种各样的目的,人们经常应用计算装置(或者系统)。用户可以使用他们的计算装置例如彼此交互,访问内容,共享内容,并且创建内容。在一些情况下,内容项可以包括来自社交网络成员的帖子。该帖子可包括文本和媒体内容项,诸如,图像、视频和音频。该帖子可发布到社交网络,供其他人使用。
在常规方法下,用户可将各种内容项发布到社交网络系统。在一些情况下,这种内容项(例如,视频)可包括从通过社交网络系统发布的受版权保护的内容项拷贝或复制的内容。例如,上传到社交网络系统的视频可以是受版权保护的视频的副本。在这个实例中,可以标记上传视频并且可采取适当动作。在一些情况下,只有上传视频的一部分可包括已经从受版权保护的视频拷贝的内容。例如,上传视频可以是包括电影预告片部分的电影批评家的视频。在常规方法下,完整的上传视频可标记为侵犯版权并且视频的拷贝部分的版权所有者可需要审查完整视频以确定是否发生侵犯版权。因此,这种常规方法在解决计算机技术中出现的这些和其他问题中可能没有效果。
基于计算机技术的改进方法克服了与在计算机技术领域具体出现的常规方法相关的前述和其他缺点。在各种实施方式中,可对上传到社交网络系统的内容项采指纹并存储。社交网络系统可以确定通过社交网络系统发布的任何其他内容项是否全部或部分与上传的内容项匹配。与发布的内容项匹配的上传的内容项的任何部分可能是侵犯版权。在各种实施方式中,社交网络系统可以识别与任何发布的和/或受版权保护的内容项匹配的上传的内容项的相应部分。可以关于可能的侵犯版权通知这些内容项的发布者(例如,版权拥有者)。在一些实施方式中,这种发布者可访问识别与发布者的内容项匹配的上传视频的部分的界面。发布者可以访问该界面以播放被识别为发布者的版权可能侵犯的上传视频的部分。发布者还可以访问该界面以将上传视频标记为侵犯版权,例如,以便不采取行动(例如,由于内容项的合法使用),或者以便准予授权使用受版权保护的部分。
图1示出了根据本公开内容的实施方式的被配置为提供访问各个内容项的示例性内容提供器模块102的示例性系统100。如图1的实例所示,内容提供器模块102可以包括内容上传模块104、内容模块106和内容匹配模块108。在一些情况下,示例性系统100可以包括至少一个数据存储器110。这个附图和本文中的所有附图中示出的部件(例如,模块、元件等)仅是示例性的,并且其他实现可包括额外的、更少的、集成的或者不同的部件。可以不示出一些部件,以免混淆相关细节。
在一些实施方式中,内容提供器模块102可以部分地或完全实现为软件、硬件或它们的任何组合。通常,如本文中讨论的模块可以与软件、硬件、或者它们的任何组合相关联。在一些实现中,可以通过软件程序、软件过程、硬件和/或它们的任何组合实施或执行模块的一个或多个功能、任务和/或操作。在一些情况下,内容提供器模块102可以部分地或完全实现为在一个或多个计算装置或系统上运行的软件,诸如在用户或客户端计算装置上。在一个实例中,内容提供器模块102或其至少一部分可以实现为在用户计算装置或客户端计算系统(诸如图6的用户装置610)上运行的应用程序(例如,app)、程序或小程序等或者可以在应用程序(例如,app)、程序或小程序等内实现。在另一实例中,内容提供器模块102或者它的至少一部分可以使用包括诸如网络服务器或者云服务器的一个或多个服务器的一个或多个计算装置或者系统实现。在一些情况下,内容提供器模块102可以部分地或完全在诸如图6的社交网络系统630的社交网络系统(或服务)内实现或者被配置为结合该社交网络系统进行操作。
如示例性系统100中所示,内容提供器模块102可以被配置为与至少一个数据存储器110通信和/或操作。至少一个数据存储器110可以被配置为存储并保持各种类型的数据。例如,数据存储器110可以存储描述通过社交网络系统的用户发布的各种内容项的信息,例如,这种信息包括对应于这种内容项的指纹(例如,散列码)。在一些实现中,至少一个数据存储器110可以存储与社交网络系统(例如,图6的社交网络系统630)相关联的信息。与社交网络系统相关联的信息可以包括关于用户、社交连接、社交交互、位置、领域范围面积、地图、地点、事件、页面、组、帖子、通信、内容、推送、账号设置、隐私设置、社交图谱的数据、以及各种其他类型的数据。在一些实现中,至少一个数据存储器110可以存储与用户相关联的信息,诸如用户标识符、用户信息、个人资料信息、用户指定设置、由用户产生或发布的内容以及各种其他类型的用户数据。
内容提供器模块102可以被配置为提供用户访问通过社交网络系统发布的内容项。例如,用户可以与通过在用户的计算装置上运行的软件应用程序(例如,社交网络应用程序)提供的界面进行交互。这个界面可以包括用于将内容项发布或上传至社交网络系统的选项。当发布内容项时,可以利用内容上传模块104将描述内容项的数据从计算装置传送至社交网络系统。例如,这种内容项可包括文本、图像、音频和视频。社交网络系统然后可以通过社交网络系统发布例如一个或多个新闻推送中包括的内容项。通过软件应用程序提供的界面还可以例如使用内容模块106用于访问发布的内容项。例如,内容模块106可以包括用户的新闻推送中的发布的内容项。在这个实例中,用户可以在浏览新闻推送的同时访问发布的内容项。在另一实例中,对于发布内容项的用户,用户可以通过界面搜索内容项,和/或使用与内容项对应的检索词来访问内容项。内容匹配模块108可以被配置为识别已经或正在发布到社交网络系统的匹配内容项。以下参考图2将提供关于内容匹配模块108的更多细节。
图2示出了根据本公开内容的实施方式的内容匹配模块202的实例。在一些实施方式中,图1的内容匹配模块108可以实现为内容匹配模块202。如图2所示,内容匹配模块202可以包括指纹模块204、匹配模块206、片段匹配模块208和通知模块210。
在各种实施方式中,指纹模块204被配置为确定用于内容项的相应指纹。例如,当内容项最初上传到社交网络系统时,可以确定用于内容项的指纹。在一些实施方式中,如下所述,指纹模块204还可以从各自被配置为使用一个或多个技术确定用于内容项的指纹的一个或多个指纹服务获得用于内容项的指纹。在一些情况下,上传内容项的用户或实体可选择指示内容项正在被上传以保护受版权保护的内容的选项,而无需将内容项发布到社交网络系统。
在一些实施方式中,指纹模块204被配置为确定用于内容项的一些或所有帧(或图像)的指纹。在一个实例中,指纹模块204可以确定用于内容项中的每个帧的相应指纹。在另一实例中,指纹模块204可以特定速率(例如,每秒一帧)确定用于帧的相应指纹。当确定指纹时,指纹模块204可以利用已经训练成基于通过帧捕捉的内容或主题生成相应指纹的模型或分类器。在一些实施方式中,指纹是提供帧的紧凑形态的保相似散列码。该分类器可以基于任何机器学习技术,包括但不限于深度卷积神经网络。在这种实施方式中,可以通过比较两个帧的相应指纹确定来自第一内容项的帧与来自第二内容项的帧之间的匹配。在一些实施方式中,可以通过计算来自第一内容项的帧的指纹与来自第二内容项的帧的指纹之间的汉明距离执行该比较。当达到阈值汉明距离时,可以识别相似的帧。确定用于内容项的指纹可以存储在例如图1的数据存储器110中,并且为了识别相似的内容项的目的进行检索。
在各种实施方式中,匹配模块206被配置为确定内容项之间的相互关系的测量。在一个实例中,这种测量可以分数的形式提供。例如,在一些实施方式中,匹配模块206可以为上传的内容项确定各自包括与上传的内容项中的帧匹配的至少一个帧的一组内容项。在一些实施方式中,可以使用为内容项中的给定帧识别与给定帧匹配的其他内容项中的一个或多个帧的搜索索引来确定该组内容项。
在一些实施方式中,匹配模块206可以基于内容项如何与上传的内容项紧密匹配将该组内容项中的内容项排序。例如,这个排序可以基于内容项与上传的内容项之间的匹配帧的数量来完成。在一些实施方式中,当将内容项排序时,匹配模块206确定在与包括在该组内容项中的内容项中的帧匹配的上传的内容项的至少一个片段(例如,帧的部分)中包括的帧的数量。该片段可以具有某个长度(例如,基于多个帧或时间段)。例如,匹配模块206可以确定包括在上传的内容项的20秒片段(以每秒一帧)中的帧、这些帧中的8个与该组中的第一内容项中的帧匹配,且这些帧中的15个与该组中的第二内容项中的帧匹配。包括在该组内容项中的每个内容项可以基于内容项中的匹配帧的数量被分配相应的分数。在这个实例中,分配给第一内容项的分数可以是8,因为第一内容项包括评估的20个帧中的8个匹配帧。此外,分配给第二内容项的分数可以是15,因为第二内容项包括评估的20个帧中的15个匹配帧。这种分数可用于将该组内容项排序。在第一内容项和第二内容项中匹配的帧可以是连续的或非连续的。被分配至少阈值分数(例如,至少6个匹配帧)的该组中的内容项可以被识别为候选内容项。片段匹配模块208可以用于在候选内容项上执行后期处理以确定上传的内容项的至少一些部分包括也在候选内容项中的内容。
在一些实施方式中,用于给该组内容项中的内容项评分的片段可以从其他指纹服务获得。例如,在一些实施方式中,音频指纹服务可以用于确定用于上传的内容项或者用于上传的内容项的部分的一个或多个音频指纹。通常,在考虑音频信号的任何感官特性的同时,可以基于与内容项对应的一个或多个音频信号来确定音频指纹。用于生成音频指纹的一个示例性方法是基于2014年1月13日提交并题为“基于音频指纹检测失真的音频信号(Detecting distorted audio signals based on audio fingerprinting)”的美国申请号14/153,404中描述的离散余弦变换(DCT),其全部内容通过引证结合于本文中。在这种实施方式中,匹配模块206可以从音频指纹服务获得上传的内容项的至少一个片段,该上传的内容项包括与该组内容项的一个或多个内容项中的音频内容匹配的音频内容。如上所述,这种片段可用于将该组内容项排序并且确定候选内容项。相似地,在一些实施方式中,视频指纹服务可以用于确定用于上传的内容项或者用于上传的内容项的部分(例如,用于内容项的每个帧或者一组帧)的一个或多个视频指纹。在一个实例中,用于上传的内容项的视频指纹可以基于与内容项对应的一个或多个视频信号来确定。可以通过分析视频序列期间的内容项中的例如包括关键帧分析、颜色、跨帧视频中的变化、以及运动变化(例如,光流)的视觉特征来确定视频指纹。在这种实施方式中,匹配模块206可以从视频指纹服务获得上传的内容项的至少一个片段,该上传的内容项包括与该组内容项的一个或多个内容项中的内容匹配的内容(例如,视频或运动)。如上所述,这种片段可用于将该组内容项排序并且确定候选内容项。
如所提到的,被分配至少阈值分数(例如,至少6个匹配帧)的该组中的内容项可以被识别为候选内容项。片段匹配模块208可以用于在候选内容项上执行后期处理以确定上传的内容项的至少一些部分(或者所有部分)包括也在候选内容项中的内容。在一些实施方式中,片段匹配模块208通过获得用于上传的内容项中的每个帧的相应指纹以及用于候选内容项中的每个帧的相应指纹确定这些部分。在这种实施方式中,片段匹配模块208使用相应指纹执行上传的内容项和候选内容项的逐帧比较以便确定匹配帧的一个或多个最长序列。每个序列可以与匹配帧开始的开始时间和匹配帧结束的结束时间相关联。如上所述,这种比较可以通过确定两个帧的指纹之间的汉明距离是否达到阈值来完成。例如,片段匹配模块208可以确定上传的内容项的帧1至50与候选内容项的帧50至100匹配。在一些情况下,在匹配帧的两个或更多个序列之间可能存在不匹配的多个帧。在这种情况下,片段匹配模块208可以应用平滑技术,以便在界面中将匹配帧的两个或更多个序列显示为连续的匹配帧序列。例如,片段匹配模块208可以确定上传的内容项的帧1至50以及55至100分别与候选内容项的帧50至100以及105至150匹配。在这个实例中,片段匹配模块208可以应用平滑技术,以便在界面中将上传的内容项的所有帧1至100显示为与候选内容项的帧50至150匹配的连续帧序列。
一旦针对每个候选内容项确定了所有匹配帧序列,则通知模块210可以通知发布者潜在的版权侵犯。例如,通知模块210可以确定上传的内容项是受版权保护的内容并且第一候选内容项的部分和第二候选内容项的部分与上传的内容项中的内容匹配。在这个实例中,通知模块210可以将第一候选内容项的发布者和第二候选内容项的发布者潜在的侵犯版权通知给上传的内容项的发布者。在另一实例中,通知模块210可确定上传的内容项与第一候选内容项中的内容匹配并且第一候选内容项通过其发布者已被识别为受版权保护的内容。在这个实例中,通知模块210可以将上传的内容项的发布者的潜在的版权侵犯通知给第一候选内容项的发布者。在一些实施方式中,如图3的实例中所示,通知的发布者可以访问由通知模块210提供的界面,该通知模块识别确定潜在版权侵犯的内容项的相应部分。发布者可以访问该界面以播放内容项的匹配部分。例如,发布者还可以访问该界面以将某些内容项标记为版权侵犯,以便不采取行动(例如,由于内容项的合法使用),或者以便准予授权使用受版权保护的部分。
图3示出了根据本公开内容的实施方式的界面300的示例图。如所提到的,当他们的受版权保护的内容被潜在侵犯时,可以通知内容项的发布者。在一些实施方式中,这种发布者能够例如通过在计算装置上运行的软件应用程序(例如,社交网络应用程序和/或网络浏览器)访问界面300。
界面300可以提供访问发布者的受版权保护的内容项302以及可能对发布者的版权潜在侵权的任何内容项304。发布者可以通过界面300重放内容项302、304的任何部分。界面300还包括指示内容项304的哪部分与发布者的内容项302匹配的视觉信息306。例如,视觉信息306可以指示内容项304的哪部分307与发布者的内容项302匹配的视频播放状态栏306的形式呈现。这种部分307例如可以使用与状态栏306中的非匹配部分不同的阴影或颜色指示。在一些实施方式中,状态栏306的长度对应于潜在侵权内容项304的长度。界面300还可以提供指示内容项304的多少量与发布者的内容项302匹配的信息308(例如,“2:18中的0:58与您的视频匹配”)。在各种实施方式中,发布者可以通过界面300选择选项310以播放被确定为匹配的发布者的内容项302和内容项304这两者的相应部分。可以通过界面300执行相应部分的播放并且可以同步执行。依据查看该播放,发布者可以选择选项312以报告匹配内容项304侵犯版权。一旦被报告,可从社交网络系统去除内容项304(或者可以防止访问内容项304)。进一步地,可以将侵犯版权通知给内容项304的发布者。在一些实施方式中,报告了阈值数量的侵犯版权的发布者被禁止访问社交网络系统和/或被禁止将内容项发布到社交网络系统。在一些实施方式中,例如,发布者可以能够选择对内容项304不采取动作的选项(例如,由于合理使用)或者准予授权使用受版权保护的部分。
图4示出了根据本公开内容的各种实施方式的用于提交发布到社交网络系统的内容项的示例性处理400。应当理解,除非另有说明,否则在本文中讨论的各种实施方式的范围内,可以存在以类似或者可替换的顺序、或者同时执行的额外的、较少的、或者可替换的步骤。
在框402中,将内容项上传到社交网络系统。在框404中,使用一个或多个指纹技术和/或服务为上传的内容项采指纹。在框406中,确定上传内容项的用户或实体是否将内容项识别为受版权保护。如果内容项被识别为受版权保护,则在框407中,描述内容项的信息被存储在版权数据库中。在判断匹配内容项之间是否发生侵犯版权时,可以参考这个版权数据库。在框408中,确定上传的内容项与通过社交网络系统可获得的任何其他内容项之间是否存在任何潜在的侵犯版权。在框410中,确定通过社交网络系统可获得的任何内容项是否与上传的内容项匹配。如上所述,如果确定匹配,则在框412中,通知适当的内容项的相应的发布者(或者版权拥有者)。在一些情况下,上传的内容项不可公开共享。例如,上传的内容项可保密发布到新闻推送或者发布给社交网络系统的一个或多个用户。在这种情况下,社交网络系统可以将消息发送至上传的内容项的发布者以警告发布者未授权使用受版权保护的内容。消息可以进一步要求发布者删除上传的内容项或者寻求版权拥有者的同意使用。如果发布者赞成寻求同意,则拥有内容项(或者内容项的部分)的版权的社交网络系统的用户被通知并且能够查看上传的内容项。在一些情况下,上传的内容项的发布者被匿名,使得仅为版权拥有者示出上传的内容项而没有可识别发布者的任何信息。版权拥有者则具有同意上传的内容项的发布或者从社交网络系统删除内容项的选项。在框414中,如果确定不匹配,则允许上传的内容项通过社交网络系统发布或发帖。
图5示出了根据本公开内容的各种实施方式的用于确定内容项之间的匹配的示例性处理500。应当理解,除非另有说明,否则在本文中讨论的各种实施方式的范围内,可以存在以类似或者可替换的顺序、或者同时执行的额外的、较少的、或者可替换的步骤。
在框502中,确定第一内容项被提供用于通过社交网络系统发布。在框504中,确定与包括在第二内容项中的内容匹配的第一内容项的至少一些部分,第二内容项通过社交网络系统可访问。在框506中,确定第一内容项的部分包括来自第二内容项的至少一些受版权保护的内容。在框508中,将至少一个通知提供给第二内容项的发布者,其中,该通知指示第一内容项的发布者潜在的侵犯版权,并且其中,该通知识别与第二内容项中的受版权保护的内容匹配的第一内容项的至少一些部分。
预期了可以存在与本公开内容的各种实施方式相关联的许多其他用途、应用和/或变化。例如,在一些情况下,用户可以选择是否选择加入利用所公开的技术。所公开的技术还可以保证维护各种隐私设置和偏好并且可以防止泄露保密信息。在另一实例中,本公开内容的各种实施方式随着时间的推移可以获悉、改善和/或精炼。
社交网络系统-示例性实现方式
图6示出了根据本公开内容的实施方式的可以在各种情形下利用的示例性系统600的网络图。系统600包括一个或多个用户装置610、一个或多个外部系统620、社交网络系统(或服务)630和网络650。在实施方式中,结合上述实施方式讨论的社交网络服务、提供者和/或系统可实现为社交网络系统630。为了说明的目的,由图6示出的系统600的实施方式包括单个外部系统620和单个用户装置610。然而,在其他实施方式中,系统600可包括更多的用户装置610和/或更多的外部系统620。在某些实施方式中,社交网络系统630由社交网络提供商操作,而外部系统620与社交网络系统630分开,这是因为这些系统可以由不同的实体操作。然而,在各种实施方式中,社交网络系统630和外部系统620共同操作,以便将社交网络服务提供给社交网络系统630的用户(或成员)。在这个意义上,社交网络系统630提供平台或骨干,其他系统(诸如,外部系统620)可使用该平台或骨干来通过互联网将社交网络服务和功能提供给用户。
用户装置610包括一个或多个计算装置(或系统),其可以从用户接收输入并且经由网络650传输和接收数据。在一个实施方式中,用户装置610是执行例如微软Windows兼容操作系统(OS)、苹果OS X和/或Linux分布的常规计算机系统。在另一实施方式中,用户装置610可以是计算装置或者具有计算机功能的装置,诸如,智能手机、平板电脑、个人数字助理(PDA)、移动电话、便携式计算机、可佩戴装置(例如,一副眼镜、手表、手链等)、照相机、电器等。用户装置610被配置为经由网络650通信。用户装置610可以执行应用程序,例如,允许用户装置610的用户与社交网络系统630交互的浏览器应用程序。在另一实施方式中,用户装置610通过由用户装置610的本地操作系统(例如,iOS和ANDROID)提供的应用程序编程接口(API)与社交网络系统630交互。用户装置610被配置为使用有线和/或无线通信系统经由可包括局域网和/或广域网的任何组合的网络650与外部系统620和社交网络系统630通信。
在一个实施方式中,网络650使用标准通信技术和协议。因此,网络650可以包括使用诸如以太网、802.11、微波存取全球互通(WiMAX)、3G、4G、CDMA、GSM、LTE、数字用户线路(DSL)等技术的链路。同样,网络650中使用的网络协议可以包括多协议标签交换(MPLS)、传输控制协议/互联网协议(TCP/IP)、用户数据报协议(UDP)、超文本传输协议(HTTP)、简单邮件传输协议(SMTP)、以及文件传输协议(FTP)等。可以使用包括超文本标记语言(HTML)和可扩展标记语言(XML)的技术和/或格式表示通过网络650交换的数据。此外,可以使用诸如安全套接层(SSL)、传输层安全(TLS)以及互联网协议安全(IPsec)等常规加密技术来将所有或一些链路加密。
在一个实施方式中,用户装置610可以通过使用浏览器应用程序612处理从外部系统620和社交网络系统630接收的标记语言文档614显示来自外部系统620和/或社交网络系统630的内容。标记语言文档614识别内容以及描述该内容的格式或展示的一个或多个指令。通过执行包括在标记语言文档614中的指令,浏览器应用程序612使用由标记语言文档614描述的格式或展示来显示识别的内容。例如,标记语言文档614包括用于生成和显示具有多个帧的网页的指令,这些帧包括从外部系统620和社交网络系统630检索到的文本和/或图像数据。在各种实施方式中,标记语言文档614包括数据文件,该数据文件包括可扩展标记语言(XML)数据、可扩展超文本标记语言(XHTML)数据或者其他标记语言数据。此外,标记语言文档614可包括JavaScript对象表示法(JSON)数据、具有填充的JSON(JSONP)以及JavaScript数据,以便促进外部系统620和用户装置610之间的数据交换。在用户装置610上的浏览器应用程序612可使用JavaScript编译器来解码标记语言文档614。
标记语言文档614还可以包括或者链接至应用程序或应用程序框架,诸如,FLASHTM或UnityTM应用程序、SilverLightTM应用程序框架等。
在一个实施方式中,用户装置610还包括一个或多个插件616,其包括表示用户装置610的用户是否登录到社交网络系统630上的数据,该插件能够修改从社交网络系统630传送到用户装置610的数据。
外部系统620包括一个或多个网络服务器,其包括使用网络650传送到用户装置610的一个或多个网页622a、622b。外部系统620与社交网络系统630分离。例如,外部系统620与第一域相关联,而社交网络系统630与单独的社交网络域相关联。包含在外部系统620中的网页622a、622b包括识别内容并包括指定所识别的内容的格式或展示的指令的标记语言文档614。如上所述,应当理解,可以存在许多变化或者其他可能性。
社交网络系统630包括用于社交网络的一个或多个计算装置,该社交网络包括多个用户,并且向社交网络的用户提供与社交网络的其他用户通信和交互的能力。在一些情况下,社交网络可以由图谱表示,即,包括矢线和节点的数据结构。其他数据结构也可用于表示社交网络,包括但不限于数据库、对象、类、元元素、文件或者任何其他数据结构。社交网络系统630可以由运营商监管、管理或控制。社交网络系统630的运营商可以是人类、自动化应用程序或用于管理内容、调节政策以及在社交网络系统630内收集使用度量的一系列应用程序。可以使用任何类型的运营商。
用户可加入社交网络系统630,然后添加与社交网络系统630中的他们希望连接的任意数量的其他用户的连接。如本文中使用的,术语“好友”指的是社交网络系统630中的用户经由社交网络系统630与其形成连接、关联或关系的任何其他用户。例如,在实施方式中,如果社交网络系统630中的用户表示为社交图谱中的节点,则术语“好友”可以指的是在两个用户节点之间形成的并直接连接两个用户节点的矢线。
基于用户的共同特征(例如,作为相同教育机构的校友的用户),连接可由用户明确添加或者可由社交网络系统630自动创建。例如,第一用户特别选择具体的其他用户作为好友。在社交网络系统630中的连接通常在两个方向上但不需要在两个方向上,因此,术语“用户”和“好友”取决于参考体系。在社交网络系统630的用户之间的连接通常是双边的(“双向的”)或者“相互的”,但是连接也可以是单向的或“单边的”。例如,如果Bob和Joe都是社交网络系统630的用户并彼此连接,那么Bob和Joe均为彼此的连接。另一方面,如果Bob希望连接至Joe以查看Joe传送至社交网络系统630的数据,但是Joe不希望形成相互连接,则可创建单边连接。用户之间的连接可以是直接连接;然而,社交网络系统630的一些实施方式允许经由一个或多个连接等级或分离程度的间接连接。
除了在用户之间建立和保持连接并允许在用户之间交互以外,社交网络系统630还向用户提供对由社交网络系统630支持的各种类型的项目采取动作的能力。这些项目可包括社交网络系统630的用户可能属于的组或网络(即,个人、实体和概念的社交网络)、用户可能感兴趣的事件或日历条目、用户可经由社交网络系统630使用的基于计算机的应用程序、允许用户经由社交网络系统630提供的服务或通过社交网络系统630购买或出售项目的业务、以及与用户可在社交网络系统630线上或线下执行的广告的交互。这些仅是用户可影响社交网络系统630的项目的几个实例,并且可以具有很多其他实例。用户可以与能够在社交网络系统630中或者在外部系统620中表示的、与社交网络系统630分开的或者经由网络650与社交网络系统630耦接的任何事物交互。
社交网络系统630也能够链接各种实体。例如,社交网络系统630使用户能够通过API、网络服务或其他通信信道彼此交互以及与外部系统620或其他实体交互。社交网络系统630生成和保持包括由多个矢线互连的多个节点的“社交图谱”。社交图谱中的每个节点可表示可以作用于另一节点和/或可以由另一节点作用的实体。社交图谱可包括各种类型的节点。节点类型的实例包括用户、非人实体、内容项目、网页、组、活动、消息、概念以及可以由社交网络系统630中的对象表示的任何其他事情。社交图谱中的两个节点之间的矢线可以表示在这两个节点之间的特定类型的连接或关联,这可以因节点关系或者因由一个节点在另一个节点上进行的活动而产生。在一些情况下,可以对节点之间的矢线加权。矢线的权重可以表示与矢线相关联的属性,诸如,节点之间的连接或关联的强度。不同类型的矢线可以设置有不同权重。例如,可以给在一个用户“喜欢”另一用户时创建的矢线提供一个权重,同时可以给在用户与另一用户成为好友时创建的矢线提供不同的权重。
例如,当第一用户将第二用户识别为好友时,在社交图谱中生成将表示第一用户的节点和表示第二用户的第二节点连接的矢线。因为各种节点彼此相关或交互,因此社交网络系统630修改连接各种节点的矢线以反映关系和交互。
社交网络系统630还包括用户生成的内容,该内容增强用户与社交网络系统630的交互。用户生成的内容可包括用户可以添加、上传、发送或“发帖”到社交网络系统630的任何事物。例如,用户将帖子从用户装置610传送至社交网络系统630。帖子可包括数据(诸如,状态更新或其他文本数据)、位置信息、图像(诸如,照片)、视频、链路、音乐或其他相似数据和/或媒体。第三方还可以将内容添加至社交网络系统630。内容“项目”表示为社交网络系统630中的对象。以此方式,鼓励社交网络系统630的用户通过各种通信信道发布文本和各种媒体类型的内容项来彼此通信。这种通信增加用户彼此的交互并且增加用户与社交网络系统630交互的频率。
社交网络系统630包括网络服务器632、API请求服务器634、用户个人资料存储器636、连接存储器638、动作记录器640、活动日志642和授权服务器644。在本发明的实施方式中,社交网络系统630可包括用于各种应用程序的额外的、更少的或不同的部件。未示出其他部件,诸如,网络接口、安全机构、负载平衡器、故障转移服务器、管理和网络操作控制台等,以便不使系统的细节晦涩。
用户个人资料存储器636保持有关用户账户的信息,包括传记、人口统计和其他类型的描述信息,诸如,由用户声明的或由社交网络系统630推断的工作经历、教育背景、爱好或偏好、位置等。将该信息存储在用户个人资料存储器636中,以便独特地识别每个用户。社交网络系统630还在连接存储器638中存储描述不同用户之间的一个或多个连接的数据。连接信息可表示具有相似或共同工作经历、组成员、爱好或教育背景的用户。此外,社交网络系统630包括在不同用户之间的用户定义的连接,允许用户指定他们与其他用户的关系。例如,用户定义的连接允许用户生成与和用户的现实关系平行的其他用户的关系,诸如,朋友、同事、合作伙伴等。用户可从预定的连接类型中选择,或根据需要定义他们自己的连接类型。还在连接存储器638中存储与社交网络系统630中的其他节点(例如,非人实体、储存区、集群中心、图像、兴趣、页面、外部系统、概念等)的连接。
社交网络系统630保持关于用户可以与之交互的对象的数据。为了保持该数据,用户个人资料存储器636和连接存储器638存储由社交网络系统630保持的相应类型的对象的实例。每个对象类型具有适于存储适合对象类型的信息的信息字段。例如,用户个人资料存储器636包括具有适于描述用户账号以及与用户账号相关的信息的字段的数据结构。当创建特定类型的新对象时,社交网络系统630初始化对应类型的新数据结构,将唯一对象标识符分配给该数据结构,并且根据需要开始将数据添加至对象。例如,当用户变成社交网络系统630的用户时,可能发生这种情况,社交网络系统630在用户个人资料存储器636中生成用户个人资料的新实例,将唯一标识符分配给用户账号,并且开始使用由用户提供的信息填充用户账号的字段。
连接存储器638包括适用于描述用户与其他用户的连接、与外部系统620的连接或者与其他实体的连接的数据结构。连接存储器638还可使连接类型与用户连接相关联,用户的连接可与用户的隐私设置一起用于调节对关于用户的信息的访问。在本发明的实施方式中,用户个人资料存储器636和连接存储器638可实现为联合数据库。
存储在连接存储器638、用户个人资料存储器636和活动日志642中的数据使社交网络系统630能够生成使用节点来识别各种对象并且使用连接节点的矢线来识别不同对象之间的关系的社交图谱。例如,如果第一用户在社交网络系统630中建立与第二用户的连接,则来自用户个人资料存储器636的第一用户和第二用户的用户账号可用作社交图谱中的节点。在由连接存储器638存储的第一用户与第二用户之间的连接是与第一用户和第二用户相关联的节点之间的矢线。继续这个实例,第二用户然后可以在社交网络系统630内向第一用户发送消息。发送可被存储的消息的动作是社交图谱中表示第一用户和第二用户的两个节点之间的另一矢线。此外,可在社交图谱中识别和包含消息本身,作为连接至表示第一用户和第二用户的节点的另一节点。
在另一实例中,第一用户可在由社交网络系统630保持的图像(或者替换地,在由社交网络系统630外部的另一系统保持的图像)中标记第二用户。图像本身可表示作为社交网络系统630中的节点。该标记动作可在第一用户和第二用户之间创建矢线并且在各个用户与图像之间创建矢线,该图像也是社交图谱中的节点。在又一实例中,如果用户确认参加一个事件,则用户和事件是从用户个人资料存储器636获得的节点,其中,事件的参加是可从活动日志642中检索的节点之间的矢线。通过生成并保持社交图谱,社交网络系统630包括描述多种不同类型的对象以及这些对象之间的交互和连接的数据,从而提供社交相关信息的丰富来源。
网络服务器632经由网络650将社交网络系统630链接至一个或多个用户装置610和/或一个或多个外部系统620。网络服务器632为网页以及其他网页相关的内容(诸如,Java、JavaScript、Flash、XML等)服务。网络服务器632可包括邮件服务器或其他消息功能,用于在社交网络系统630与一个或多个用户装置610之间接收和路由消息。这些消息可以是即时消息、队列消息(例如,电子邮件)、文本和SMS消息或者任何其他合适的消息格式。
API请求服务器634允许一个或多个外部系统620和用户装置610通过调用一个或多个API功能来从社交网络系统630中调用访问信息。API请求服务器634还可允许外部系统620通过调用API来将信息发送至社交网络系统630。在一个实施方式中,外部系统620经由网络650将API请求发送至社交网络系统630,并且API请求服务器634接收API请求。通过调用与API请求相关联的API,API请求服务器634处理该请求,以生成合适的响应,API请求服务器634经由网络650将该响应传送至外部系统620。例如,响应于API请求,API请求服务器634收集与用户相关联的数据(诸如,登录到外部系统620内的用户连接),并且将收集的数据传送给外部系统620。在另一实施方式中,用户装置610以与外部系统620相同的方式经由API与社交网络系统630通信。
动作记录器640能够从网络服务器632接收有关用户在社交网络系统630上或社交网络系统630外的动作的通信。动作记录器640使用有关用户动作的信息填充活动日志642,能够使社交网络系统630发现由其用户在社交网络系统630内并且在社交网络系统630外部采取的各种动作。特定用户相对于社交网络系统630上的另一节点采取的任何动作可通过在活动日志642中或相似数据库中或其他数据存储库中保持的信息而与每个用户账号相关联。所识别并存储的用户在社交网络系统630内采取的动作的实例可包括例如,添加与另一用户的连接,将消息发送至另一用户,读取来自另一用户的消息,查看与另一用户相关联的内容,参加另一用户发布的事件,发布图像,尝试发布图像,或者与另一用户或另一对象交互的其他动作。当用户在社交网络系统630内采取动作时,在活动日志642中记录该动作。在一个实施方式中,社交网络系统630保持活动日志642作为条目的数据库。当在社交网络系统630内采取动作时,动作的条目被添加至活动日志642。活动日志642可被称为动作日志。
此外,用户动作可以与在社交网络系统630外部的实体内发生的概念和动作相关联,诸如,与社交网络系统630分开的外部系统620。例如,动作记录器640可以从网络服务器632接收描述用户与外部系统620交互的数据。在这个实例中,外部系统620根据社交图谱中的结构化动作和对象报告用户的交互。
用户与外部系统620交互的动作的其他实例包括表示对外部系统620或另一实体感兴趣的用户、将评论发布至讨论外部系统620或外部系统620内的网页622a的社交网络系统630的用户、将统一资源定位符(URL)或与外部系统620相关联的其他标识符发布至社交网络系统630的用户、参加与外部系统620相关联的事件的用户、或者与外部系统620相关的用户的任何其他动作。因此,活动日志642可包括描述在社交网络系统630的用户与和社交网络系统630分开的外部系统620之间的交互的动作。
授权服务器644执行社交网络系统630的用户的一个或多个隐私设置。用户的隐私设置确定如何可以分享与用户相关联的特定信息。隐私设置包括与用户相关联的特定信息的规范以及可以与其分享信息的一个或多个实体的规范。可与其分享信息的实体的实例可包括其他用户、应用程序、外部系统620或者可潜在访问该信息的任何实体。用户可以分享的信息包括用户账号信息,诸如,个人资料照片、与用户相关联的电话号码、用户的连接、用户采取的动作(诸如,添加连接、改变用户个人资料信息)等。
隐私设置规范可以以不同的粒度级别来提供。例如,隐私设置可识别与其他用户共享的特定信息;隐私设置识别工作电话号码或相关信息的特定集合,诸如,包括个人资料照片、住宅电话号码以及状态的个人信息。可替换地,隐私设置可应用于与用户相关联的所有信息。还可以以各种粒度等级来指定可访问特定信息的实体集合的规范。可以分享信息的各种实体集合可以包括例如用户的所有好友、好友的所有好友、所有应用程序或者所有外部系统620。一个实施方式允许该组实体的规范包括实体的列举。例如,用户可以提供允许访问某些信息的一系列外部系统620。另一实施方式允许规范包括一组实体以及不允许访问信息的异常。例如,用户可以允许所有外部系统620访问用户的工作信息,但是规定不允许访问个人信息的一系列外部系统620。某些实施方式调用不允许访问某些信息的异常列表,即,“阻止列表”。阻止属于由用户规定的阻止列表的外部系统620访问在隐私设置中规定的信息。信息的规范的粒度以及与其分享信息的实体的规范的粒度的各种组合是可行的。例如,所有个人信息可与好友分享,而所有工作信息可与好友的好友分享。
授权服务器644包含用以确定与用户相关联的某些信息是否可以由用户的好友、外部系统620和/或其他应用程序和实体访问的逻辑。外部系统620可需要授权服务器644的授权以访问用户的更隐私和敏感的信息,诸如,用户的工作电话号码。根据用户的隐私设置,授权服务器644确定是否允许另一用户、外部系统620、应用程序或者另一实体访问与用户相关联的信息,包括有关用户采取的动作的信息。
在一些实施方式中,社交网络系统630可以包括内容提供器模块646。内容提供器模块646可以例如被实现为图1的内容提供器模块102。如上所述,应当理解,可以存在许多变化或者其他可能性。
硬件实现
通过各种机器和计算机系统架构以及各种网络和计算环境可以实现上述处理和特征。图7示出了根据本发明的实施方式的可用于实现在本文中描述的一个或多个实施方式的计算机系统700的实例。计算机系统700包括用于使计算机系统700执行本文中讨论的处理和特征的指令组。计算机系统700可连接(例如,联网)至其他机器。在网络部署中,计算机系统700可在客户端-服务器网络环境中的服务器机器或客户端机器的能力中运行,或者作为对等(或分布式)网络环境中的对等机器运行。在本发明的实施方式中,计算机系统700可以是社交网络系统630、用户装置610、以及外部系统720、或者其部件。在本发明的实施方式中,计算机系统700可以是在构成所有或一部分社交网络系统630的多个服务器中的一个服务器。
计算机系统700包括处理器702、高速缓冲存储器704以及存储在计算机可读介质上的针对本文中描述的处理和特征的一个或多个可执行模块和驱动器。此外,计算机系统700包括高性能输入/输出(I/O)总线706和标准I/O总线708。主桥710使处理器702耦接至高性能I/O总线706,然而I/O总线桥712使这两个总线706和708彼此耦接。系统存储器714和一个或多个网络接口716耦接至高性能I/O总线706。计算机系统700可进一步包括视频存储器以及耦接至视频存储器的显示装置(未示出)。大容量存储器718和I/O端口720耦接至标准I/O总线708。计算机系统700可以可选地包括键盘和定位装置、显示装置、或者耦接至标准I/O总线708的其他输入/输出装置(未示出)。共同地,这些元件旨在表示广泛类别的计算机硬件系统,包括但不限于基于由位于加利福尼亚的圣克拉拉的英特尔公司制造的x86兼容处理器以及由位于加利福尼亚的森尼韦尔的超微半导体(Advanced Micro Devices)(AMD)公司制造的x86兼容处理器以及任意其他合适处理器的计算机系统。
操作系统管理并控制计算机系统700的操作,包括向软件应用程序(未示出)输入数据以及从软件应用程序输出数据。操作系统提供在系统上执行的软件应用程序与系统的硬件部件之间的接口。可以使用任何合适的操作系统,诸如,LINUX操作系统、从加利福尼亚库比蒂诺(Cupertino)苹果电脑公司可商购的Apple Macintosh操作系统、UNIX操作系统、操作系统、BSD操作系统等。其他实现方式是可行的。
下面将更详细地描述计算机系统700的元件。具体地,网络接口716在计算机系统700与任何广泛的网络之间提供通信,诸如,以太网(例如,IEEE 802.3)网络、背板等。大容量存储器718为数据和编程指令提供永久存储,以便执行由以上识别的相应计算系统实现的上述处理和特征,而当由处理器702执行时,系统存储器714(例如,DRAM)为数据和编程指令提供暂时存储。I/O端口720可以是提供额外的外围装置之间的通信的一个或多个串联和/或并联的通信端口,这些外围装置可耦接至计算机系统700。
计算机系统700可包括各种系统架构,并且计算机系统700的各种部件可被重新布置。例如,高速缓冲存储器704可与处理器702在芯片上。可替换地,高速缓冲存储器704和处理器702可共同封装为“处理器模块”,其中,处理器702被称为“处理器核心”。此外,本发明的某些实施方式可能既不需要也不包括所有以上部件。例如,耦接至标准I/O总线708的外围装置可耦接至高性能I/O总线706。此外,在一些实施方式中,只可存在单个总线,其中,计算机系统700的部件耦接至该单个总线。此外,计算机系统700可包括额外的部件,诸如,额外的处理器、存储装置或存储器。
通常,本文中描述的处理和特征可实现为操作系统或特定应用程序的部分、部件、程序、对象、模块、或者被称为“程序”的一系列指令。例如,一个或多个程序可用于执行本文中描述的特定处理。通常该程序在计算机系统700中包括各种存储器以及存储装置中的一个或多个指令,当由一个或多个处理器读取和执行时,这些指令使得计算机系统700执行操作,以执行在本文中描述的处理和特征。本文中描述的处理和特征可以在软件、固件、硬件(例如,专用集成电路)或者它们的任何组合中实现。
在一个实现方式中,本文中描述的处理和特征实现为由计算机系统700单独或共同地在分布式计算环境中运行的一系列可执行模块。上述模块可以由硬件、存储在计算机可读介质(或机器可读介质)上的可执行模块或这两者的组合来实现。例如,模块可包括由硬件系统中的处理器(诸如,处理器702)执行的多个或一系列指令。最初,一系列指令可存储在存储装置上,诸如,大容量存储器718。然而,该一系列指令可存储在任何合适的计算机可读存储介质上。此外,该一系列指令不需要本地存储,并且可经由网络接口716从远程存储装置(诸如,网络上的服务器)接收。将指令从存储装置(诸如,大容量存储器718)中复制到系统存储器714内,然后由处理器702访问和执行。在各种实现方式中,一个或多个模块可以由一个或多个位置中的一个或多个处理器执行,诸如,并行处理环境中的多个服务器。
计算机可读介质的实例包括但不限于,可记录类型的介质,诸如,易失性和非易失性存储器装置;固态存储器;软盘和其他可移动磁盘;硬盘驱动器;磁性介质;光盘(例如,光盘只读存储器(CD ROMS)、数字多用光盘(DVD));其他相似的非易失性(或暂时性)的、有形的(或非有形的)存储介质;或者适用于存储、编码或承载由计算机系统700执行的以执行本文中描述的处理和特征中一个或多个中的任一个的一系列指令的任何类型的介质。
为了说明性目的,阐述了很多具体细节以便提供说明书的详尽理解。然而,对于本领域技术人员显而易见的是,可在没有这些具体细节的情况下,实践本公开内容的实施方式。在某些情况下,以框图的形式示出了模块、结构、处理、特征以及装置,以免描述晦涩难懂。在其他情况下,示出了功能框图和流程图以表示数据和逻辑流程。可以通过除了本文中明确描述和描绘的方式以外的方式不同地组合、分开、去除、重新排列以及替换框图和流程图的部件(例如,模块、方框、结构、装置、特征等)。
在该说明书中参考“一个实施方式”、“实施方式”、“其他实施方式”、“一系列实施方式”、“一些实施方式”、“各种实施方式”等意味着结合实施方式描述的特定特征、设计、结构或特性包括在本公开内容的至少一个实施方式中。例如,在说明书的不同地方出现短语“在一个实施方式中”、“在实施方式中”,不必均表示相同的实施方式,也不必是与其他实施方式互相排斥的单独的或可替换的实施方式。此外,无论是否明确引用“实施方式”等,都描述了各种特征,这些特征可以不同地组合并且包含在一些实施方式中,但是还可以在其他实施方式中不同地省略。类似地,描述的各个特征可以是一些实施方式而不是其他实施方式的偏好或要求。
本文中使用的语言主要出于可读性和指导性目的而选择,并且选择其不是为了划定或限制发明主题。因此,其目的在于,本发明的范围不受到这个详细描述的限制,而是受到根据其在应用程序上发行的任何权利要求的限制。因此,本发明的实施方式的公开内容旨在是说明而非限制在所附权利要求中陈述的本发明的范围。
Claims (20)
1.一种计算机实现的方法,包括:
通过社交网络系统,确定第一内容项被提供用于通过所述社交网络系统发布;
通过所述社交网络系统,确定所述第一内容项中的与包括在第二内容项中的内容匹配的至少一些部分,所述第二内容项能够通过所述社交网络系统来访问;
通过所述社交网络系统,确定所述第一内容项的所述部分包括来自所述第二内容项的至少一些受版权保护的内容;以及
通过所述社交网络系统,将至少一个通知提供给所述第二内容项的发布者,其中,所述通知指示所述第一内容项的发布者潜在侵犯版权,并且其中,所述通知识别所述第一内容项中的与所述第二内容项中的受版权保护的内容匹配的至少一些部分。
2.根据权利要求1所述的计算机实现的方法,其中,确定所述第一内容项中的与包括在所述第二内容项中的内容匹配的至少一些部分进一步包括:
通过所述社交网络系统,确定均包括与所述第一内容项中的帧匹配的至少一个帧的一组候选内容项,所述一组候选内容项包括所述第二内容项;以及
通过所述社交网络系统,确定所述第一内容项中的与所述第二内容项中的连续帧序列匹配的至少一个连续帧序列。
3.根据权利要求2所述的计算机实现的方法,其中,确定均包括与所述第一内容项中的帧匹配的至少一个帧的所述一组候选内容项进一步包括:
通过所述社交网络系统,确定用于所述第一内容项中的帧的指纹;
通过所述社交网络系统,至少部分基于为给定帧识别与该给定帧匹配的其他内容项中的一个或多个帧的搜索索引来确定与用于帧的所述指纹相关联的一个或多个指纹,其中,所述搜索索引中的每个指纹参考能够通过所述社交网络系统获得的至少一个内容项;以及
通过所述社交网络系统,至少部分基于通过所述一个或多个指纹参考的所述内容项确定所述一组候选内容项。
4.根据权利要求2所述的计算机实现的方法,其中,确定所述第一内容项中的与所述第二内容项中的连续帧序列匹配的至少一个连续帧序列进一步包括:
通过所述社交网络系统,确定所述第一内容项中的至少一个第一帧与所述第二内容项中的至少一个第一帧匹配;以及
通过所述社交网络系统,确定所述第一内容项中的至少一个第二帧与所述第二内容项中的至少一个第二帧匹配,其中,所述第一内容项中的所述第一帧与所述第一内容项中的所述第二帧相邻,并且其中,所述第二内容项中的所述第一帧与所述第二内容项中的所述第二帧相邻。
5.根据权利要求4所述的计算机实现的方法,其中,确定所述第一内容项中的至少一个第一帧与所述第二内容项中的至少一个第一帧匹配进一步包括:
通过所述社交网络系统,确定所述第一内容项中的所述第一帧的指纹与所述第二内容项中的所述第一帧的指纹之间的汉明距离达到阈值。
6.根据权利要求2所述的计算机实现的方法,其中,确定均包括与所述第一内容项中的帧匹配的至少一个帧的所述一组候选内容项进一步包括:
通过所述社交网络系统,确定所述一组候选内容项的排序,所述排序至少部分基于至少一段候选内容项中的与所述第一内容项中的帧匹配的帧的数量;以及
通过所述社交网络系统,去除所述一组候选内容项中的与所述第一内容项中的至少阈值数量的帧不匹配的候选内容项。
7.根据权利要求1所述的计算机实现的方法,其中,确定所述第一内容项的所述部分包括来自所述第二内容项的至少一些受版权保护的内容进一步包括:
通过所述社交网络系统,确定所述第二内容项的发布者将所述第二内容项的一个或多个部分标示为受版权保护的内容。
8.根据权利要求1所述的计算机实现的方法,其中,将所述至少一个通知提供给所述第二内容项的所述发布者进一步包括:
通过所述社交网络系统,提供用于至少查看所述第一内容项和所述第二内容项的界面。
9.根据权利要求8所述的计算机实现的方法,其中,所述界面包括播放确定匹配的所述第一内容项和所述第二内容项这两者的相应部分的至少一个选项,其中,同步执行播放所述相应部分。
10.根据权利要求8所述的计算机实现的方法,其中,所述界面提供指示包括与来自所述第二内容项的内容匹配的内容的所述第一内容项的总播放时间量的信息。
11.一种系统,包括:
至少一个处理器;以及
存储指令的存储器,当通过所述至少一个处理器执行时,所述指令使得所述系统执行:
确定第一内容项被提供用于通过社交网络系统发布;
确定所述第一内容项中的与包括在第二内容项中的内容匹配的至少一些部分,所述第二内容项能够通过所述社交网络系统来访问;
确定所述第一内容项的所述部分包括来自所述第二内容项的至少一些受版权保护的内容;以及
将至少一个通知提供给所述第二内容项的发布者,其中,所述通知指示所述第一内容项的发布者潜在侵犯版权,并且其中,所述通知识别所述第一内容项中的与所述第二内容项中的受版权保护的内容匹配的至少一些部分。
12.根据权利要求11所述的系统,其中,确定所述第一内容项中的与包括在所述第二内容项中的内容匹配的至少一些部分进一步使得所述系统执行:
确定均包括与所述第一内容项中的帧匹配的至少一个帧的一组候选内容项,所述一组候选内容项包括所述第二内容项;以及
确定所述第一内容项中的与所述第二内容项中的连续帧序列匹配的至少一个连续帧序列。
13.根据权利要求12所述的系统,其中,确定均包括与所述第一内容项中的帧匹配的至少一个帧的所述一组候选内容项进一步使得所述系统执行:
确定用于所述第一内容项中的帧的指纹;
至少部分基于为给定帧识别与该给定帧匹配的其他内容项中的一个或多个帧的搜索索引来确定与用于帧的所述指纹相关联的一个或多个指纹,其中,所述搜索索引中的每个指纹参考能够通过所述社交网络系统获得的至少一个内容项;以及
至少部分基于通过所述一个或多个指纹参考的所述内容项确定所述一组候选内容项。
14.根据权利要求12所述的系统,其中,确定所述第一内容项中的与所述第二内容项中的连续帧序列匹配的至少一个连续帧序列进一步使得所述系统执行:
确定所述第一内容项中的至少一个第一帧与所述第二内容项中的至少一个第一帧匹配;以及
确定所述第一内容项中的至少一个第二帧与所述第二内容项中的至少一个第二帧匹配,其中,所述第一内容项中的所述第一帧与所述第一内容项中的所述第二帧相邻,并且其中,所述第二内容项中的所述第一帧与所述第二内容项中的所述第二帧相邻。
15.根据权利要求14所述的系统,其中,确定所述第一内容项中的至少一个第一帧与所述第二内容项中的至少一个第一帧匹配进一步使得所述系统执行:
确定所述第一内容项中的所述第一帧的指纹与所述第二内容项中的所述第一帧的指纹之间的汉明距离达到阈值。
16.一种非易失性计算机可读存储介质,包括指令,当通过计算系统的至少一个处理器执行时,所述指令使得所述计算系统执行一种方法,所述方法包括:
确定第一内容项被提供用于通过所述社交网络系统发布;
确定所述第一内容项中的与包括在第二内容项中的内容匹配的至少一些部分,所述第二内容项能够通过所述社交网络系统来访问;
确定所述第一内容项的所述部分包括来自所述第二内容项的至少一些受版权保护的内容;以及
将至少一个通知提供给所述第二内容项的发布者,其中,所述通知指示所述第一内容项的发布者潜在侵犯版权,并且其中,所述通知识别所述第一内容项中的与所述第二内容项中的受版权保护的内容匹配的至少一些部分。
17.根据权利要求16所述的非易失性计算机可读存储介质,其中,确定所述第一内容项中的与包括在所述第二内容项中的内容匹配的至少一些部分进一步使得所述计算系统执行:
确定均包括与所述第一内容项中的帧匹配的至少一个帧的一组候选内容项,所述一组候选内容项包括所述第二内容项;以及
确定所述第一内容项中的与所述第二内容项中的连续帧序列匹配的至少一个连续帧序列。
18.根据权利要求17所述的非易失性计算机可读存储介质,其中,确定均包括与所述第一内容项中的帧匹配的至少一个帧的所述一组候选内容项进一步使得所述计算系统执行:
确定用于所述第一内容项中的帧的指纹;
至少部分基于为给定帧识别与该给定帧匹配的其他内容项中的一个或多个帧的搜索索引来确定与用于帧的所述指纹相关联的一个或多个指纹,其中,所述搜索索引中的每个指纹参考能够通过所述社交网络系统获得的至少一个内容项;以及
至少部分基于通过所述一个或多个指纹参考的所述内容项确定所述一组候选内容项。
19.根据权利要求17所述的非易失性计算机可读存储介质,其中,确定所述第一内容项中的与所述第二内容项中的连续帧序列匹配的至少一个连续帧序列进一步使得所述计算系统执行:
确定所述第一内容项中的至少一个第一帧与所述第二内容项中的至少一个第一帧匹配;以及
确定所述第一内容项中的至少一个第二帧与所述第二内容项中的至少一个第二帧匹配,其中,所述第一内容项中的所述第一帧与所述第一内容项中的所述第二帧相邻,并且其中,所述第二内容项中的所述第一帧与所述第二内容项中的所述第二帧相邻。
20.根据权利要求19所述的非易失性计算机可读存储介质,其中,确定所述第一内容项中的至少一个第一帧与所述第二内容项中的至少一个第一帧匹配进一步使得所述计算系统执行:
确定所述第一内容项中的所述第一帧的指纹与所述第二内容项中的所述第一帧的指纹之间的汉明距离达到阈值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/076,524 US20170270625A1 (en) | 2016-03-21 | 2016-03-21 | Systems and methods for identifying matching content |
US15/076,524 | 2016-03-21 | ||
PCT/US2016/023638 WO2017164853A1 (en) | 2016-03-21 | 2016-03-22 | Systems and methods for identifying matching content |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109155050A true CN109155050A (zh) | 2019-01-04 |
Family
ID=59855755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680085619.4A Pending CN109155050A (zh) | 2016-03-21 | 2016-03-22 | 用于识别匹配内容的系统和方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20170270625A1 (zh) |
JP (1) | JP2019509577A (zh) |
KR (1) | KR20180122438A (zh) |
CN (1) | CN109155050A (zh) |
AU (1) | AU2016398632A1 (zh) |
BR (1) | BR112018069306A2 (zh) |
CA (1) | CA3018542A1 (zh) |
IL (1) | IL261873A (zh) |
MX (1) | MX2018011454A (zh) |
WO (1) | WO2017164853A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110032652A (zh) * | 2019-03-07 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 媒体文件查找方法和装置、存储介质及电子装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180322901A1 (en) * | 2017-05-03 | 2018-11-08 | Hey Platforms DMCC | Copyright checking for uploaded media |
US20190199519A1 (en) * | 2017-12-26 | 2019-06-27 | Microsoft Technology Licensing, Llc | Detecting and treating unauthorized duplicate digital content |
US11645249B1 (en) * | 2018-11-12 | 2023-05-09 | Amazon Technologies, Inc. | Automated detection of duplicate content in media items |
KR102270607B1 (ko) * | 2018-12-31 | 2021-06-30 | 주식회사 아임클라우드 | 웹 사이트에 대한 이미지 권리 확인 감사 시스템 및 방법 |
KR102221712B1 (ko) * | 2018-12-31 | 2021-03-02 | 주식회사 아임클라우드 | 권리 확인된 이미지 융합을 통한 신규 이미지 생성 시스템 및 방법 |
KR102443200B1 (ko) * | 2018-12-31 | 2022-09-14 | 주식회사 아임클라우드 | 권리 확인된 이미지 융합을 통한 신규 이미지 생성 시스템 및 방법 |
CN114270412A (zh) * | 2019-05-09 | 2022-04-01 | 澳特摩比利亚Ii有限责任公司 | 用于媒体处理和显示的方法、系统和计算机程序产品 |
CN115605905A (zh) * | 2020-05-07 | 2023-01-13 | 索尼集团公司(Jp) | 信息处理装置、信息处理系统和程序 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090037975A1 (en) * | 2007-07-30 | 2009-02-05 | Ishikawa Mark M | System and Method for Authenticating Content |
US20120042277A1 (en) * | 1999-04-19 | 2012-02-16 | Catherine Lin-Hendel | Dynamic array presentation and multiple selection of digitally stored objects and corresponding link tokens for simultaneous presentation |
US20130276138A1 (en) * | 2001-04-05 | 2013-10-17 | Audible Magic Corporation | Copyright detection and protection system and method |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5200392B2 (ja) * | 2007-02-28 | 2013-06-05 | ヤマハ株式会社 | コンテンツ提供サーバ及びそのプログラム |
US20080133767A1 (en) * | 2006-11-22 | 2008-06-05 | Metis Enterprise Technologies Llc | Real-time multicast peer-to-peer video streaming platform |
US9177209B2 (en) * | 2007-12-17 | 2015-11-03 | Sinoeast Concept Limited | Temporal segment based extraction and robust matching of video fingerprints |
JP5510912B2 (ja) * | 2008-02-01 | 2014-06-04 | 学校法人金沢工業大学 | 引用判定支援装置および引用判定支援プログラム |
EP2304649B1 (en) * | 2008-07-23 | 2017-05-10 | Jastec Co | Frame based video matching |
US9633014B2 (en) * | 2009-04-08 | 2017-04-25 | Google Inc. | Policy based video content syndication |
US8082486B1 (en) * | 2011-06-09 | 2011-12-20 | Storify, Inc. | Source attribution of embedded content |
US8601596B2 (en) * | 2011-12-13 | 2013-12-03 | Facebook, Inc. | Using social signals to identify unauthorized content on a social networking system |
US9978106B2 (en) * | 2012-04-24 | 2018-05-22 | Facebook, Inc. | Managing copyrights of content for sharing on a social networking system |
JP6393495B2 (ja) * | 2014-03-20 | 2018-09-19 | 日本ユニシス株式会社 | 画像処理装置および物体認識方法 |
-
2016
- 2016-03-21 US US15/076,524 patent/US20170270625A1/en not_active Abandoned
- 2016-03-22 KR KR1020187029904A patent/KR20180122438A/ko not_active Application Discontinuation
- 2016-03-22 JP JP2018549478A patent/JP2019509577A/ja active Pending
- 2016-03-22 BR BR112018069306A patent/BR112018069306A2/pt not_active Application Discontinuation
- 2016-03-22 MX MX2018011454A patent/MX2018011454A/es unknown
- 2016-03-22 CN CN201680085619.4A patent/CN109155050A/zh active Pending
- 2016-03-22 WO PCT/US2016/023638 patent/WO2017164853A1/en active Application Filing
- 2016-03-22 AU AU2016398632A patent/AU2016398632A1/en not_active Abandoned
- 2016-03-22 CA CA3018542A patent/CA3018542A1/en not_active Abandoned
-
2018
- 2018-09-20 IL IL261873A patent/IL261873A/en unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120042277A1 (en) * | 1999-04-19 | 2012-02-16 | Catherine Lin-Hendel | Dynamic array presentation and multiple selection of digitally stored objects and corresponding link tokens for simultaneous presentation |
US20130276138A1 (en) * | 2001-04-05 | 2013-10-17 | Audible Magic Corporation | Copyright detection and protection system and method |
US20090037975A1 (en) * | 2007-07-30 | 2009-02-05 | Ishikawa Mark M | System and Method for Authenticating Content |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110032652A (zh) * | 2019-03-07 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 媒体文件查找方法和装置、存储介质及电子装置 |
CN110032652B (zh) * | 2019-03-07 | 2022-03-25 | 腾讯科技(深圳)有限公司 | 媒体文件查找方法和装置、存储介质及电子装置 |
Also Published As
Publication number | Publication date |
---|---|
US20170270625A1 (en) | 2017-09-21 |
WO2017164853A1 (en) | 2017-09-28 |
BR112018069306A2 (pt) | 2019-01-22 |
KR20180122438A (ko) | 2018-11-12 |
CA3018542A1 (en) | 2017-09-28 |
AU2016398632A1 (en) | 2018-10-11 |
IL261873A (en) | 2018-10-31 |
JP2019509577A (ja) | 2019-04-04 |
MX2018011454A (es) | 2019-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109155050A (zh) | 用于识别匹配内容的系统和方法 | |
CN109155776A (zh) | 用于识别匹配内容的系统和方法 | |
CN109661822A (zh) | 用于识别匹配内容的系统和方法 | |
US10698945B2 (en) | Systems and methods to predict hashtags for content items | |
CN109690538A (zh) | 用于识别匹配内容的系统和方法 | |
CN109804369A (zh) | 管理媒体内容项的系统和方法 | |
CN108431823A (zh) | 用卷积神经网络处理内容的系统和方法 | |
US9705896B2 (en) | Systems and methods for dynamically selecting model thresholds for identifying illegitimate accounts | |
US10154312B2 (en) | Systems and methods for ranking and providing related media content based on signals | |
US20180012236A1 (en) | Systems and methods for analyzing interaction-bait content based on classifier models | |
US20180129940A1 (en) | Systems and methods for similar account determination | |
US9734502B2 (en) | Systems and methods for dynamically identifying illegitimate accounts based on rules | |
CN107636677A (zh) | 用于提供选定视频片段的播放的系统和方法 | |
US10762436B2 (en) | Systems and methods for recommending pages | |
US20180060755A1 (en) | Systems and methods for recommending pages | |
CN108351751A (zh) | 用于内容展示的系统和方法 | |
CN110431590A (zh) | 内容参与的系统和方法 | |
CN108292422A (zh) | 用于基于触发修改与帖子相关的隐私设置的系统和方法 | |
US10102387B2 (en) | Systems and methods for identifying illegitimate accounts based on clustering | |
US10455033B2 (en) | Systems and methods for evaluating user activity | |
US20190213282A1 (en) | Systems and methods for determining awareness of an entity on a social networking system | |
CN109219831B (zh) | 基于分层架构为视频提供数据分析的系统和方法 | |
US10497006B2 (en) | Systems and methods for processing potentially misidentified illegitimate incidents | |
EP3223228A1 (en) | Systems and methods for identifying matching content in a social network | |
EP3223229A1 (en) | Systems and methods for identifying matching content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190104 |
|
WD01 | Invention patent application deemed withdrawn after publication |