CN107257982A - 在没有人工干预的情况下算法上识别对儿童适合的内容 - Google Patents
在没有人工干预的情况下算法上识别对儿童适合的内容 Download PDFInfo
- Publication number
- CN107257982A CN107257982A CN201680011504.0A CN201680011504A CN107257982A CN 107257982 A CN107257982 A CN 107257982A CN 201680011504 A CN201680011504 A CN 201680011504A CN 107257982 A CN107257982 A CN 107257982A
- Authority
- CN
- China
- Prior art keywords
- content
- entity
- children
- content item
- score value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/454—Content or additional data filtering, e.g. blocking advertisements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Fuzzy Systems (AREA)
- Automation & Control Theory (AREA)
- Computer Graphics (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Stored Programmes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
实施方式公开了在没有人工干预的情况下算法上识别对儿童适合的内容。一种方法包括由处理设备识别对应于与儿童相关的话题的实体;由该处理设备,针对所识别的实体中的每个来确定儿童的亲和度分值;以及由所述处理设备,基于针对与内容相对应的所识别的实体的儿童的亲和度分值来选择内容。
Description
技术领域
本公开涉及一种内容共享平台的领域,并且具体地涉及一种在没有人工干预的情况下算法上识别对儿童适合的内容。
背景技术
在互联网上,社交网络允许用户互相连接并互相共享信息。许多社交网络包括内容共享的方面,其允许用户上传、观看、和共享诸如视频内容、图像内容、音频内容、文本内容等(其可以被统称为“媒体项”或“内容项”)的内容。这样的可观看并且可共享的媒体项可以包括音频片段、电影片段、电视片段、和音乐视频,以及诸如视频博客、原始短视频、图片、照片、其它多媒体内容等的业余内容。用户可以使用计算设备(诸如智能电话、蜂窝电话、膝上型计算机、台式计算机、上网本、平板计算机、联网电视),以使用、播放、和/或消费媒体项(例如,观看数字视频和/或收听数字音乐)。
发明内容
以下是本公开的简化发明内容,以便提供对本公开的一些方面的基本理解。这个发明内容不是本公开的扩展性概述。其无意表示本公开的关键或必要的要素,也无意本对本公开的具体实施方式的任何范围或权利要求的任何范围加以界定。本发明的唯一目的在于以简化方式呈现本公开的一些概念,从而作为稍后所呈现的更详细的描述的前叙。
在本公开的一个方面中,一种方法包括由处理设备识别对应于与儿童相关的话题的实体;由该处理设备,针对所识别的实体中的每个来确定儿童的亲和度分值;以及由该处理设备,基于针对与该内容相对应的所识别的实体的儿童的亲和度分值来选择内容。
在一个实施方式中,该实体可以包括人、地方、或事物中的至少一个。在另一个实施方式中,方法中的识别该实体进一步包括从知识图中选择实体,该知识图包括具有关于实体的库集的结构化信息和这些实体的库集之间的关系连接的知识库,其中该实体的库集包括该实体。
此外,方法中的识别该实体可以进一步包括访问与针对儿童的内容相关的外部数据源,从该外部数据源提取针对儿童的话题,将所提取的话题与从该知识图确定的实体的库集协调,以及利用来自所提取的话题的协调的实体,从该知识图扩展该实体。在一个实施方式中,该外部数据源包括发布针对儿童安全的和儿童感兴趣的内容的评级和评论的受信网站。
在另一个实施方式中,方法中的确定该儿童的亲和度分值进一步包括识别注释有该实体的内容项;基于共同收看信号和共同出现信号识别与所识别的内容项相关的其它内容项;将所识别的其它内容项与所识别内容项合并,以生成单个组的内容项;通过在该单个组的内容项中注释的该实体将该单个组的内容项分组,以形成针对每个实体的实体分组;以及针对具有实体分组的每个实体,基于该实体分组中的内容项的注释集中性、注释相关性、平均质量、受欢迎度、或平均相关度权重中的至少一个,计算针对该实体的儿童的亲和度分值。此外,该方法可以包括针对语言、质量、受欢迎度、或内容评级中的至少一个过滤所识别内容项。
此外,方法中的选择该内容可以进一步包括基于内容的类别、上传状态,或与内容相关联的内容项的数量中的至少一个识别一组候选内容;针对每个候选内容:识别该候选内容中的每个内容项的实体注释;针对该候选内容中的每个内容项确定平均评级和观看计数;以及从通过所识别的实体注释加权的所述候选内容的所有内容项汇集平均评级和观看计数,以针对该候选内容生成汇集分值。此外,方法中的选择该内容可以包括归一化来自所有候选内容的汇集分值;以及基于该归一化的归总分值,排名该候选内容。
在另外的实施例中,所选择的内容包括内容共享平台的频道。此外,所选择的内容可以包括该内容共享平台的播放列表。
公开了一种用于执行以上描述的方法以及本文中描述的各种实施方式的操作的计算设备。还公开了存储用于执行与以上描述的方法以及本文中描述的各种实施方式相关联的操作的指令的计算机可读介质。
附图说明
在附图中的图中以示例的方式而不是以限制的方式图本公开示。
图1是图示可以在其中实施本公开的实施方式的示例性网络架构的框图。
图2是根据实施方式图示根据本公开一个实施方式的儿童的内容系统140的框图。
图3A和图3B是根据实施方式图示用于识别与儿童相关的和/或令儿童感兴趣的所考虑实体的方法的流程图。
图4是根据实施方式图示用于向内容共享平台的实体分配儿童的亲和度分值的方法的示图。
图5是根据实施方式图示用于使用内容共享平台的实体的儿童的亲和度分值而针对儿童的内容界面策划儿童的内容的方法的流程图。
图6图示根据本公开实施方式的来自内容共享平台、为儿童提供内容建议的儿童的主屏UI的示例截屏。
图7是根据实施方式图示计算机系统的实施方式的框图。
具体实施方式
本公开的方面和实施方式针对在没有人工干预的情况下算法上识别对儿童适合的内容。该事实方式被描述为内容共享平台的儿童的内容系统,其中该儿童的内容系统使能够识别、策划、和呈现对儿童适合和对儿童相关的内容。儿童的内容可以是指对于儿童而言是安全(例如,非成人、暴力、或明示(explicitly))和/或娱乐(例如,相关或有趣的)的一个或多个内容项。
本公开的实施方式可以识别令儿童感兴趣的内容。例如,儿童的内容系统可以识别令儿童感兴趣的实体(例如,人、地方、或事物),针对这些实体算法上为不同年龄组选择并生成内容(例如,频道、播放列表、视频等),针对适合度(例如,基于内容评级)过滤该内容,根据受欢迎度和其它量度排名所过滤的内容,以及将内容发布至内容共享平台的儿童的内容界面。内容评级可以是指适合的观看观众的指示,诸如“一般观众”、“儿童”、“青少年”、“成人”、和/或任何其它适合内容评级。例如,内容评级可以包括指示符Y、G、PG、Teen、Mature等中的一个。在一个实施方式中,儿童的内容界面可以包括与内容共享平台相关联的儿童的具体应用的主屏。
针对儿童的现有的内容策划解决方案并未使识别、策划、和呈现对儿童适合和对儿童相关的内容的过程自动化。针对儿童的内容策划的现有解决方案提供了一种白名单方法,其中小组的内容是从整个内容库集中人工挑选出来的。然而,在当前的内容共享平台中,可能存在是比适用于人们查看的内容更多的上传至平台的内容(例如,每分钟将300小时的视频上传至平台)。不同于本公开的方面,将不会算法上执行这些现有解决方案,这些现有解决方案并未使用大量的内容,和/或并不具有高的传入率、新内容以及大量基础内容。此外,现有解决方案并未使用不具有来自内容发布方的内容评级的内容(例如,与具有相对应的所发布内容评级的传统剧院电影或电视节目相比)。
本公开经常出于简明的目的而引用视频。然而,本公开的教导通常被广泛地应用至媒体项,并且能够被应用至各种类型的内容或媒体项,该内容或媒体项包括例如视频、音频、文本、图像、节目介绍等。
图1图示根据本公开的一个实施方式的示例系统架构100。系统架构100包括客户端设备110A至110Z、网络105、数据存储106、内容共享平台120、和服务器130。在一个实施方式中,网络105可以包括公共网络(例如,互联网)、私有网络(例如,局域网(LAN)或广域网(WAN))、有线网络(例如,以太网)、无线网络(例如,802.11网络或Wi-Fi网络)、蜂窝网络(例如,长期演进型(LTE)网络)、路由器、集线器、交换机、服务器计算机,和/或它们的组合。在一个实施方式中,数据存储106可以是存储器(例如,随机存取存储器)、高速缓存、驱动器(例如,硬盘)、闪速存储器、数据库系统,或能够存储数据的另一个类型的组件或设备。数据存储106还可以包括还可以跨多个计算设备(例如,多个服务器计算机)的多个存储组件(例如,多个驱动器或多个数据库)。
客户端设备110A至110Z可以各自包括诸如个人计算机(PC)、膝上型计算机、移动电话、智能电话、平板计算机、上网本计算机、联网电视等的计算设备。在一些实施方式中,客户端设备110A至110Z还可以被称作为“用户设备”。每个客户端设备包括媒体观看器111。在一个实施例中,媒体观看器111可以是允许用户观看诸如图像、视频、网页、文档等的内容的应用。例如,媒体观看器111可以是能够访问、检索、呈现、和/或导航由web服务器服务的内容(例如,诸如超文本标记语言(HTML)页面的网页、数字媒体项等)的web浏览器。媒体观看器111可以向用户渲染、显示、和/或呈现该内容(例如,网页、媒体观看器)。媒体观看器111还可以显示在网页(例如,可以提供关于由在线商家销售的产品的信息的网页)中嵌入的嵌入式媒体播放器(例如,播放器或HTML5播放器)。在另一个示例中,媒体观看器111可以是允许用户观看数字媒体项(例如,数字视频、数字图像、电子书等)的独立应用。根据本公开的方面,媒体观看器111可以是允许用户观看并且搜索对儿童适合的内容的儿童专用应用。
可以由服务器130和/或内容共享平台120向客户端设备110A至110Z提供媒体观看器111。例如,媒体观看器111可以是在由内容共享平台120提供的网页中嵌入的嵌入式媒体播放器。在另一个示例中,媒体观看器111可以是从服务器130下载的应用。
通常,如果合适的话,还能够对其它实施方式中的客户端设备110A至110Z执行在一个实施方式中描述的、作为由内容共享平台120执行的功能。此外,归因于特定组件的功能能够由共同操作的不同或多个组件来执行。内容共享平台120还能够作为通过适合应用编程接口向其它系统或设备提供的服务而被访问,并且因此并不限于在网站中使用。
在一个实施方式中,内容共享平台120可以是可以被用于向用户提供有对媒体项的访问和/或向用户提供媒体项的一个或多个计算设备(诸如机架式服务器、路由器计算机、服务器计算机、个人计算机、大型计算机、膝上型计算机、平板计算机、台式计算机等)、数据存储(例如,硬盘、存储器、数据库)、网络、软件组件、和/或硬件组件。例如,内容共享平台120可以允许用户消费、上传、搜索、赞成(“喜欢”)、不喜欢、和/或评论媒体项。内容共享平台120还可以包括可以被用于向用户提供有对媒体项的访问的网站(例如,网页)或应用后端软件。
在本公开的实施方式中,“用户”可以被表示为单个个体。然而,本公开的其它实施方式涵盖了是由一组用户和/或自动源控制的实体的“用户”。例如,在社交网络中聚合为团体的一组个体用户可以被认为“用户”。在另一个示例中,自动消费者可以是内容共享平台的诸如话题频道的自动迁移管道(ingestion pipeline)。
内容共享平台120可以包括多个频道(例如,频道A至Z)。频道能够是从共同源可得到的数据内容或者具有共同话题、题目、或实质的数据内容。数据内容能够是由用户选择的数字内容、由用户可得到的数字内容、由用户上传的数字内容、由内容提供方选择的内容、由广播方选择的数字内容等。例如,频道X能够包括视频Y和Z。频道能够与所有者相关联,该所有者是能够在该频道上执行动作的用户。不同活动能够基于所有者的动作与频道相关联,所有者的动作诸如所有者使数字内容在频道上可得到、所有者选择(例如,喜欢)与另一个频道相关联的数字内容、所有者评论与另一个频道相关联的数字内容等。与频道相关联的活动能够被收集到对该频道馈送的活动中。除了频道的所有者以外的用户能够订阅其中他们感兴趣的一个或多个频道。“订阅”的概念还可以被称作为“喜欢”、“关注”、“成为好友”等。
一旦用户订阅了一个频道,用户就能够被呈现有来自该频道的活动馈送的信息。如果用户订阅了多个频道,则对用户向其订阅的每个频道馈送的活动能够被组合成聚合(syndicated)活动馈送。能够向用户呈现来自聚合活动馈送的信息。频道可以具有其自己的馈送。例如,当导航至内容共享平台上的频道的主页时,由那个频道产生的馈送项可以被示出在频道主页上。用户可以具有聚合馈送,这是至少由来自该用户向其订阅的所有的频道的内容项的子集组成的馈送。聚合馈送还可以包括来自用户并未订阅的频道的内容项。例如,内容共享平台120或其它社交网络可以将推荐内容项插入到用户的聚合馈送中,或者可以在聚合馈送中插入与用户的相关连接相关联的内容项。
每个频道可以包括一个或多个媒体项121。媒体项121的示例能够包括但并不限于数字视频、数字电影、数字照片、数字音乐、网站内容、社交媒体最新报道、电子书(ebook)、电子杂志、数字报纸、数字音频书、电子期刊、web博客、简易信息聚合(Real SimpleSyndicator)(RSS)馈送、电子连环画、软件应用等。在一些实施方式中,媒体项121还被称作为内容项。
媒体项121可以经由互联网和/或经由移动设备应用被消费。出于清楚和简明起见,在线视频(在下文中,还被称作为视频)贯穿本文而被使用为媒体项121的示例。这里所使用的是,“媒体”、“媒体项”、“在线媒体项”、“数字媒体”、“数字媒体项”、“内容”和“内容项”能够包括能够使用经配置以向实体呈现数字媒体项的软件、固件或硬件来执行或加载的电子文件。在一个实施方式中,内容共享平台120可以使用数据存储106来存储媒体项121。
在一个实施方式中,服务器130可以是一个或多个计算设备(诸如,机架式服务器、服务器计算机等)。在一个实施方式中,服务器130可以被包括在内容共享平台120中。服务器130可以包括儿童的内容系统140。儿童的内容系统140使能够在本公开的实施方式中识别、策划、和呈现对儿童适合的和对儿童相关的内容。儿童的内容可以是指对儿童是安全的(例如,非成人或非明示的)和/或给儿童娱乐的(例如,相关的)的一个或多个内容项。
本公开的实施方式可以识别令儿童感兴趣的内容。例如,儿童的内容系统140可以识别以下实体(例如,人、地方、或事物):令儿童感兴趣的、针对这些实体算法上确定用于不同年龄组的内容的、针对适合度过滤内容的(例如,如上所述的基于内容评级)、根据受欢迎度和其它量度排名所过滤的内容,以及向内容共享平台120的儿童的内容界面发布内容。内容可以是指视频、频道、播放列表等。播放列表可以包括能够在内容共享平台上以顺序或打乱的次序被播放(例如,流传送)的内容项(例如,视频)的列表。在一个实施方式中,儿童的内容界面可以包括与内容共享平台120相关联的儿童的专用应用的主屏。
在一些实施方式中,服务器130的儿童的内容系统140可以与内容共享平台120和/或与其它第三方社交网络服务器150进行交互以提供本公开的实施方式。以下关于图2更为详细地描述儿童的内容系统140及其具体功能的进一步描述。
虽然关于内容共享平台和在内容共享平台上促进内容项的社交网络共享讨论了本公开的实施方式,但是实施方式还可以通常被应用至提供用户之间的连接的任何类型的社交网络。本公开的实施方式并不限于向用户提供频道订阅的内容共享平台。
在其中这里讨论的系统收集关于用户的个人信息或者可以会利用个人信息的情况下,用户可以被提供有以控制内容共享平台120是否收集用户信息(例如,关于用户的社交网络、社交动作或活动、职业、用户的偏好、或用户的当前位置的信息),或者以控制是否和/或如何从内容服务器接收可以与用户更相关的内容的机会。此外,某些数据可以在其被存储或使用之前以一个或多个方式来处理,使得个人可识别信息被去除。例如,用户的身份可以被处理使得没有个人可识别信息能够针对用户被确定,或者可以在获得位置信息的那里用户的地理位置被一般化(诸如,被处理为城市、ZIP码、或州的级别),使得不能够确定用户的特定位置。因此,用户可以具有对如何由内容共享平台120收集和由内容共享平台120使用关于该用户的信息的控制。
图2是图示根据本公开的一个实施方式的儿童的内容系统140的框图。如以上所述,儿童的内容系统140可以与单个社交网络交互,或者可以在多个社交网络之中被利用(例如,被提供为由其它第三方社交网络利用的内容共享平台的服务)。在一个实施方式中,儿童的内容系统140包括儿童的实体做种模块210、儿童的亲和度分值模块220、儿童的内容策划模块230、和UI生成模块240。在不失一般性的情况下,更多或更少的组件可以被包括在儿童的内容系统140中。例如,这些模块中两个可以被组合成单个模块,或者这些模块中的一个可以被划分成两个或更多个模块。在一个实施方式中,这些模块中的一个或多个可以驻留在不同计算设备上(例如,在单个客户端设备上,或在多个客户端设备之中分布的不同服务器计算机等)。此外,这些模块中的一个或多个可以驻留在不同内容共享平台、第三方社交网络、和/或外部服务器上。
儿童的内容系统140被通信耦合至数据存储106。例如,儿童的内容系统140可以经由网络(例如,经由如图1所示的网络105)被耦合至数据存储106。在另一个示例中,儿童的内容系统140可以被直接耦合至其中儿童的内容系统140驻留的服务器(例如,可以被直接耦合至服务器130)。数据存储106可以是能够存储设备的存储器(例如,随机存取存储器)、高速缓存、驱动器(例如,硬盘驱动器)、闪速存储器、数据库系统、或另一个类型的组件或设备。数据存储106还可以包括还可以跨多个计算设备(例如,多个服务器计算机)的多个存储组件(例如,多个驱动器或多个数据库)。数据存储106包括内容项数据290、知识图(KG)数据291、和儿童的亲和度分值数据292。
如以上所讨论的,儿童的内容系统140使能够在本公开的实施方式中识别、策划、和呈现对儿童适合的和对儿童相关的内容。儿童的内容可以是指对于儿童是安全的(例如,非成人或非明示的)和/或给儿童娱乐(例如,相关的)的一个或多个内容项。
本公开的实施方式最初所关注的是识别令儿童感兴趣的话题。儿童的实体做种模块210可以识别令儿童可能感兴趣或与儿童相关的实体。实体可以是指人、地方、或事物(例如,电视节目、电影、歌曲、图书、物件、动物等)。数据存储106可以维持知识图(KG),该知识图(KG)是具有关于语义实体的库集的结构化信息以及语义实体的库集之间的关系连接的知识库。每个语义实体(还被称作为“实体”)具有一个或若干个类型。数据存储106的内容项数据290中维持的每个内容项可以被注释有与该内容项相关联的一个或多个实体。例如,“爱探险的朵拉(Dora the Explorer)”是一个话题、电视节目、电影系列、和获奖作品。如果内容项数据290的内容项是Dora the Explorer电视剧集,则这个内容项将被注释有在KG数据291中存储的Dora the Explorer实体。
此外,KG数据291可以包括集合的更高层级的抽象,并且可以将实体分组成集合,诸如“儿童的电视节目”或“音乐家”。涉及到之前的示例,“Dora the Explorer”实体可以在KG数据291中被分组成儿童的电视节目集合(以及其它不同的集合)。
儿童实体做种模块210可以利用KG数据291的实体识别令儿童感兴趣的实体(和集合),并且还由此利用这些所识别的实体定位可以令儿童感兴趣的内容和内容项(例如,被注释有所识别的实体的内容项)。例如,KG数据291中的一些实体类型和集合是对儿童相关的,诸如儿童的电视节目集合或针对5至7岁的电影集合。这些实体类型和集合提供了已经生成且策划的列表(在某些情况下,按年龄分段),但是这些实体类型和集合被限制为有限组的域。除了这些直接源之外,儿童的实体做种模块还可以对KG数据291运行查询,以推断感兴趣的实体。儿童的文学文艺体裁集合中的图书主题的分布是这样的示例(例如,热门主题是“动物”、“冒险”、和“家庭”)。
在其它实施方式中,儿童的实体做种模块210还可以使用KG数据291以及其它外部数据源250,以识别令儿童感兴趣的实体。外部数据源250可以包括但并不限于针对对儿童是安全的和/或另儿童感兴趣的内容(例如,电视节目、电影、游戏、应用、网站、图书、音乐等)发布评级和评论的网站和应用。儿童的实体做种模块210可以访问外部数据源250(例如,经由网络105)并且从外部数据源250提取话题。
在一个实施方式中,基于在外部数据源250处存储、维持、和/或呈现数据的格式,话题从外部数据源250被提取。例如,如果外部数据源250以目录格式维持数据,则儿童的实体做种模块210可以从外部数据源250下载每个根类别,并且然后提取指向每个根类别中的子类别的链路。诸如与每个链路相关联的内容评级和年龄分组的信息还可以被提取。
来自外部数据源250的所提取的话题然后能够与KG数据291中维持的相对应的实体协调。作为结果,来自KG数据291的一组扩展的实体可以被识别为与儿童相关和/或另儿童感兴趣的。
在另一个实施方式中,儿童的实体做种模块210可以依赖于内容共享平台的内容的库集(例如,内容项数据290),以识别令儿童感兴趣的实体。儿童的实体做种模块210可以首先识别与诸如Y评级或TV-Y评级的特定内容评级相关联的该组的内容项。注释实体该组的内容项之间被识别并且被用于增添与儿童相关的和/或令儿童感兴趣的实体的列表。在一些实施方式中,内容项的质量(例如,用户评级)和受欢迎度(例如,观看的数量)被用于选择所注释的实体。
在一个实施方式中,被识别为与儿童相关的和/或令儿童感兴趣的该组扩展的实体被传递至儿童的亲和度分值模块220,以针对每个所识别的实体生成儿童的亲和度分值。儿童的亲和度分值模块220可以根据该组的实体如何被生成、以各种方式针对每个实体来确定儿童的亲和度分值。
当该组的实体从具有来自外部数据源250的可能补充的KG数据291进行做种时,儿童的亲和度分值模块220可以首先识别已经被注释有这些实体的所有内容项。然后,高级别过滤可以被应用以去除例如某些语言内容项(例如,非英语语言的内容项)、具有成人或X评级的内容、观看数量低于阈值的内容项、和/或具有低质量(例如,在5分中的低于3.0分之外)的内容项。
儿童的亲和度分值模块220然后可以将所得到的一组内容项和与该组的内容项相关的任何内容项合并。内容项可以基于信号被认为与彼此相关,该信号包括但并不限于由用户共同收看的数量以及共同出现的数量(例如,在播放列表中)。在一些实施方式中,相关内容项还用高级别进行过滤,以去除某些语言、成人内容、低受欢迎度、和低质量的内容。
然后所得到单个组的合并内容项被检查,以识别与该单个组相关联的实体注释。该内容项然后可以根据实体注释被分组。在一些实施方式中,因为内容项可以具有与该内容项相对应的多个不同的实体注释,所以内容项可以出现在多个分组中。针对每个所得的实体,可以基于函数来计算该实体的儿童的亲和度分值,该函数考虑到该分组中的每个内容项对实体的注释分值、该分组中的内容项的平均质量、该分组中的内容项的平均受欢迎度、和平均相关度权重。在一个实施方式中,该函数随内容项汇集这些信号。
注释分值可以是指示注释实体对于内容项有多重要/相关的从0到1的数字,其中较高数值表示该实体与内容项更重要/相关。质量可以是用户评级内容项的分值(例如,在1至5的标度上)。受欢迎度可以指示内容项的观看的数量。平均相关度权重可以(例如,根据共同收看和共同出现)指示内容项在分组内彼此多么相关。在一些实施方式中,具有下降到低于阈值的注释分值的内容项可以过滤到分组之外。作为被应用到实体分组的函数的结果是针对特定实体的儿童的亲和度分值。
在一个实施方式中,当直接从内容共享平台的内容的库集中识别令儿童感兴趣和与儿童相关的实体时,这些实体可以从该库集中的一组内容项(例如,TV-Y评级的内容项等)的注释被识别出。每个内容项可以具有针对特定实体的注释分值。这个注释分值可以是从0到1的数字,这些数字指示注释的实体对于内容项有多么重要/相关,其中较高数值表示该实体与内容项更重要/相关。
对于每个所识别的实体,儿童的实体做种模块210可以随该组内容项汇集与该实体相关联的注释分值,其中每个注释分值可以通过与特定注释分值相关联的内容项的观看计数而加权(例如,更为受欢迎的内容项的注释分值在汇集对特定实体的注释分值中赋予较重权重)。汇集针对每个实体的加权注释分值的结果是该实体的根据该组内容项的总体儿童的亲和度分值(还被称作为总体受欢迎度分值)。该总体儿童的亲和度分值可以例如在数据存储106的儿童的亲和度分值数据292中被存储为该实体的儿童的亲和度分值。
针对每个实体的儿童的亲和度分值还可以是特定于集合的(collectionspecific)。如果要针对集合中的每个实体计算儿童的亲和度分值,则儿童的实体做种模块210可以首先识别KG数据291中、所识别的实体是成员的集合。针对实体的总体儿童的亲和度分值可以与关联于实体/集合对的集合成员分值相乘(或者所执行的一些其它函数)。该集合分值可以表示集合中的实体成员的强度,其中较高分值指示与集合更重要/相关的关系。所得到的成员可以被认为是该实体的基于集合的儿童的亲和度分值。
在一些实施方式中,被识别为令儿童感兴趣的所得到的实体还被用于基于内容项针对这样的实体具有的注释而直接向内容项(例如,视频和其它的内容共享平台内容)分配儿童的亲和度分值。
儿童的内容策划模块230然后可以在KG数据291中利用对实体所计算的儿童的亲和度分值,以为内容共享平台策划儿童的内容。以下描述根据识别内容共享平台的对儿童相关和令儿童感兴趣的频道讨论内容策划。在其它实施方式中,不同类型的内容还可以被识别,包括但并不限于播放列表和个体内容项(例如,视频)。在一个实施方式中,儿童的内容策划模块230策划儿童的内容,用于在儿童专用应用的主屏或内容共享平台的网页上显示。在其它实施方式中,儿童的内容策划模块230可以出于其它目的来策划儿童的内容,诸如为了搜索结果、推荐、收看下一个/相关内容等。
在选择可以被认为令儿童感兴趣或与儿童相关的频道时,儿童的内容策划模块230可以首先识别一组候选频道。该组候选频道可以基于满足一个或多个预定资格被选择。该资格可以包括但并不限于类别、上传状态、频道中内容项的数量、评论状态、和/或频道的内容评级(例如,Y或G)中的一个或多个。
该类别资格可以包括被归类在一个或多个类别中的频道。该类别可以是在儿童的内容界面的主屏上显示的预定类别,并且可以包括诸如节目、音乐、学习、开拓、自己动手(do-it-yourself)、爱好、科学、实验、恐龙等的类别。在一些实施方式中,类别可以基于用户的具体兴趣而被个性化。
所上传的状态资格可以包括选择满足特定上传状态约束的那些频道作为候选,该上传状态约束诸如最近视频的上传时间小于时间的预定阈值。例如,频道可以在其包括在一年以内被上传至该频道的至少一个内容项时被选择作为候选频道。类似地,频道资格中的内容项的数量可以导致频道在这些频道包括超过频道中的内容项的预定阈值数量时被选择作为候选。这个防止并不活跃的频道或具有少量内容项的频道被选择作为候选频道。
最后,评论状态资格可以包括选择具有被设定为指示以前已经发生以检查频道中的内容项的频道的人工或自动评论的标志(或其它标记)的那些频道。频道中的内容项的检查可以确定内容项的素材是否对儿童适合和/或是否与儿童相关。例如,与税收相关的内容项可以根据内容评级对儿童是适合的,但是可能不是与儿童相关的。
一旦选择了候选频道集合,然后儿童的内容策划模块230就可以识别针对每个候选频道中的内容项注释的实体以及针对每个实体的儿童的亲和度分值(如以上所述的由儿童的亲和度分值模块220计算的)。针对候选频道中的每个内容项,确定该内容项的平均儿童的亲和度分值以及该内容项的观看计数。在一个实施方式中,观看计数可以被使用为对儿童的亲和度分值的加权因子,使得具有较高观看计数的内容项具有比具有较低观看计数的内容项更多地加权的所相关联的平均儿童的亲和度分值。所得到的加权儿童的亲和度分值被分配给该内容项。
针对每个候选频道,针对该频道中的内容项的所加权的儿童的亲和度分值被汇集,以生成用于该候选频道的儿童的亲和度分值。在一个实施方式中,候选频道的儿童的亲和度分值然后被归一化。然后基于候选频道的所得的儿童的亲和度分值对候选频道排名,其中具有最高分值的频道被排名在第一位等。来自排名的前N个频道然后可以被选择,用于在儿童的内容界面(例如,内容共享平台的儿童的应用的主屏,或者在儿童的应用的主屏内的第二类别中)上显示。
然后可以将所选择的频道提供至UI生成模块240。UI生成模块240可以将格式和其它UI要素相关联,以生成将所选择频道显示为令儿童感兴趣的和/或与儿童相关的内容的页面或屏幕。在一些实施方式中,在所选择频道被显示在UI中之前存在所选择频道的可选的人工(例如,人为)评论。在另外的实施方式中,可以生成和/或选择播放列表,用于在UI中显示。以下进一步讨论的图6提供了儿童的界面的儿童的主屏UI 600,其提供被策划为令儿童感兴趣的和/或与儿童相关的内容(例如,频道)。
图3A和图3B是根据本公开的一些实施方式图示用于识别被认为与儿童相关的和/或令儿童感兴趣的实体的方法300、350的流程图。方法300、350可以通过处理包括硬件(例如,电路系统、专用逻辑件、可编程逻辑件、微代码等)、软件(例如,在处理设备上运行的、以执行硬件仿真的指令)、或它们的组合的逻辑件来执行。
为了简明起见,这个公开的方法被描绘并且被描述为一系列动作。然而,依据这个公开的动作能够以各种顺序和/或同时发生,并且在本文中未呈现并且未描述的其它动作情况下能够发生。此外,并非所有所图示的动作可以被需要,以实施根据所公开的主题的方法。此外,本领域技术人员将会理解到并且显而易见的是,该方法可能可替选地被表示为经由状态图或事件的一系列的中间状态。另外,应当显而易见的是,这个说明书中公开的方法能够被存储在制成品上,以促进将这样的方法输送和转移至计算设备。如本文所使用的术语“制成品”旨在涵盖能够来自任何计算机可读设备或存储介质访问的计算机程序。在一个实施方式中,方法300、350可以由如图2所示的儿童的实体做种模块210来执行。
参考图3A,方法300使用KG数据以及可选地外部数据源来识别被认为与儿童相关和/或令儿童感兴趣的实体。方法300在框305处开始,此刻KG数据中的实体和集合被识别,该实体和集合利用儿童的话题标记的。在框310处,所识别的实体和集合被添加至实体种子列表。然后,在框315处,在KG数据上运行查询,以推断出令儿童感兴趣和/或与儿童相关的实体。在框320处,所推断的实体还被添加至实体种子列表。
在本公开的实施方式中,框325至340可选地由儿童的种子实体模块210来执行。在框325处,识别包括令儿童感兴趣和/或与儿童相关的话题的外部数据源。在一个实施方式中,在该外部数据源处所维持的数据的格式还被识别。然后,在框330处,根据所识别的格式从外部数据源提取话题。在框335处,所提取的话题与KG数据中相对应的实体协调。最后,在框340处,与所提取话题协调的相对应的实体被添加至实体种子列表。
参考图3B,方法350使用在内容共享平台处维持的内容的库集来识别被认为与儿童相关和/或令儿童感兴趣的实体。方法300在框355处开始,此刻从由内容共享平台维持的内容的库集识别一组内容项。在一个实施方式中,所识别组的内容项是与对儿童适合的内容评级(例如,Y或G评级)相关联的那些内容项。
随后,在框360处,针对该组中的每个内容项,识别针对该内容项注释的实体。在一些实施方式中,内容项的质量(例如,用户评级)和/或受欢迎度(例如,观看的数量)被用于识别实体注释。最后,在框365处,所识别的实体被添加至实体种子列表。
图4是根据本公开实施方式图示用于向内容共享平台的实体分配儿童的亲和度分值的方法400的流程图。方法400可以通过处理包括硬件(例如,电路系统、专用逻辑件、可编程逻辑件、微代码等)、软件(例如,在处理设备上运行的、以执行硬件仿真的指令)、或者它们的组合的逻辑件来执行。在一个实施方式中,方法400可以由如图2所示的儿童的亲和度分值模块220来执行。
方法400在框410处开始,此刻实体种子列表被接收,该实体种子列表包括被识别为令儿童感兴趣和/或与儿童相关的一个或多个实体。然后,在框420处,识别利用来自该实体种子列表的实体注释的所有内容项。在一个实施方式中,该内容项包括由内容共享平台存储和/或维持的那些内容项。
在框430处,所识别的内容项被过滤,以去除没有满足预定资格的内容项。在一个实施方式中,该预定资格可以包括但并不限于内容项的语言(例如,英语)、内容项的内容评级(例如,除成人或X之外的任何内容评级)、内容项的受欢迎度(例如,观看计数)(例如,大于观看的阈值数量)、和内容项的质量(例如,在5分中的大于3.0分之外)。在一个实施方式中,框430处的过滤可以可选地在方法400的处理中的稍后时间处执行,或者恰好在选择内容以在内容共享平台的儿童的内容界面中显示之前执行。
在框440处,识别与所过滤(可选地)的内容项相关的其它内容项。在一些实施方式中,内容项之间的关系是基于内容项的共同收看和/或共同出现的。在一个实施方式中,相关的内容项还基于以上关于框430所讨论的预定资格被过滤。然后,在框450处,原始的和相关的内容项被一起合并成单个组的内容项。
随后,在框460处,识别与该单个集合中的内容项相对应的实体注释。然后,在框470处,根据所识别实体将来自该单个集合的内容项分组。由于内容项可以被注释有多个实体,能够的是所以内容项可以在所识别实体的分组之中多次出现。
最后,在框480处,针对每个实体分组,为该实体计算儿童的亲和度分值。在一个实施方式中,该实体的儿童的亲和度分值使用用于分组中的内容项的注释分值、分组中的内容项的平均质量、分组中的内容项的平均受欢迎度、和分组中的内容项之间的平均相关度权重中的函数进行计算。
图5是根据本公开实施方式图示用于使用内容共享平台的实体的儿童的亲和度分值、针对儿童的内容界面来策划儿童的内容的方法500的流程图。方法500可以通过处理包括硬件(例如,电路系统、专用逻辑件、可编程逻辑件、微代码等)、软件(例如,在处理器上运行的、以执行硬件仿真的指令)、或者它们的组合的逻辑件来执行。在一个实施方式中,方法500可以由如图2所示的儿童的内容策划模块230来执行。
虽然方法500被描述为针对儿童的内容界面策划频道,但是还可以使用方法500来策划其它类型的内容,诸如播放列表、个体视频等。参考图5,在框510处,方法500基于预定初始资格识别候选内容频道的集合。在一个实施方式中,该预定初始资格可以包括但并不限于频道的类别、频道的上传状态、频道中的内容项的数量、和频道的内容评论状态。
在框520处,识别针对候选频道注释的实体。此外,用于所识别实体中的每个的儿童的亲和度分值还被确定。在一个实施方式中,实体的儿童的亲和度分值可以使用关于图4所描述的方法400来计算。
在框530处,针对每个候选频道中的每个内容项,计算用于该内容项的平均儿童的亲和度分值。在一个实施方式中,该平均儿童的亲和度分值可以基于针对内容项注释的所有实体来计算,其中用于内容项的平均儿童的亲和度分值通过该内容项的观看计数而被加权。然后,在框540处,针对每个候选频道,汇集针对该频道中的内容项的加权平均儿童的亲和度分值。
随后,在框550处,所汇集的加权平均儿童的亲和度分值被分配为用于该候选频道的儿童的亲和度分值。在框560处,针对该候选频道的儿童的亲和度分值被归一化。然后,在框570处,根据针对候选频道的归一化的儿童的亲和度分值排名候选频道。最后,在框580处,排名前N个候选频道被选择作为该内容共享平台的儿童的内容界面的所策划的内容。在一个实施方式中,N的值可以是频道的预定百分比的预定数字。
图6图示根据本公开实施方式的从内容共享平台为儿童提供内容建议的儿童的主屏UI 600的示例截屏。图6图示向观看儿童的内容共享平台的部分的主屏页面的用户所提供的儿童的主屏UI 600的示例截屏。
儿童的主屏UI 600可以包括在UI 600顶部上运行的导航条,其包括类别图标610和推荐图标615。类别图标610可以包括节目图标611、音乐图标612、学习图标613、和开拓图标614。如之前所讨论的,UI 600中提供的类别可以在本公开的实施方式中变化而并不限于本文所描述的那些。在UI 600中还显示搜索图标620。
当类别图标610或推荐图标615中的一个被选择时,一个或多个内容图标630被再现在UI 600中。内容图标630与(例如,由用户)经由UI 600选择的类别图标610或推荐图标615相对应。内容图标630可以与诸如频道或播放列表的内容,或诸如视频的内容项相对应。针对特定类别图标610显示的内容图标630可以是儿童的内容系统根据以上关于图1至图5描述的处理来为儿童策划的内容。例如,如图6所示,内容图标630与内容共享平台中通过使用针对该内容共享平台的实体的儿童的亲和度分值来被选择为令儿童感兴趣的和/或与儿童相关的频道相对应。在一些实施方式中,一个或多个类别图标可以指代个体视频。
图7以计算机系统700的示例性形式图示了机器的图形表示形式,在该计算机系统700中可以执行用于使该机器执行本文中讨论的一个或多个方法的指令集。在可替换实施方式中,该机器可以被连接(例如,被联网)至局域网(LAN)、内联网、外联网、或互联网中的其它机器。该机器可以在客户端-服务器网络环境中以服务器或客户端机器的能力进行操作,或者可以操作为在对等(或分布式)网络环境中作为对等端机器。该机器可以是能够(顺序或以其它形式)执行指定要由该机器所采取的动作的指令集的个人计算机(PC)、平板PC、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、web电器、服务器、网络路由器、交换机或桥接器,或者任何机器。另外,虽然仅图示单个机器,但是术语“机器”还应当被理解为包括单独或联合执行一个指令集(或多个指令集)以执行本文中讨论的方法中的任何一个或多个的机器的任何集合。在一个实施方式中,计算机系统700可以表示服务器,诸如如关于图1和图2描述的、执行儿童的内容系统140的服务器102。
示例性计算机系统700包括经由总线708互相通信的处理设备702、主存储器704(例如,只读存储器(ROM)、闪速存储器、动态随机存取存储器(DRAM)(诸如同步DRAM(SDRAM)或Rambus DRAM(RDRMA)等)、静态存储器706(例如,闪速存储器、静态随机存取存储器(SRAM)等)、和数据存储设备718。在本文中所描述的各种总线上所提供的任何的信号可以与其它信号进行时间复用并且在一个或多个共用总线上被提供。此外,电路组件或模块之间的互连可以被示出为总线或单独信号线路。这些总线中的每个可以可替选地是一个或多个单独信号线路并且单独信号线路中的每个可以可替选地是总线。
处理设备702表示一个或多个通用处理设备,诸如微处理器、中央处理器等。更具体地,处理设备可以是复杂指令集计算(CISC)微处理器、精简指令集计算机(RISC)微处理器、超长指令字(VLIW)微处理器、或实施其它指令集的处理器、或实施指令集的组合的处理器。处理设备702还可以是一个或多个专用处理设备,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、网络处理器等。处理设备702被配置为执行用于执行本文讨论的操作和步骤的处理逻辑726。
计算机系统700可以进一步包括网络接口设备722。计算机系统700还可以包括视频显示单元710(例如,液晶显示器(LCD)或阴极射线管(CRT))、字母数字输入设备712(例如,键盘)、光标控制设备714(例如,鼠标)、和信号生成设备720(例如,扬声器)。
数据存储设备718可以包括计算机可读存储介质724(还被称作为机器可读存储介质),其上被存储体现本文中讨论的功能的方法中的任何一个或多个的一个或多个的指令集726(例如,软件)。指令726还可以在其被计算机系统700执行的期间完全或至少部分地驻留主存储器704中和/或处理器设备702中;主存储器704和处理器设备702还构成机器可读存储介质。指令726可以进一步经由网络接口设备722在网络774上发送和接收。
计算机可读存储介质724还可以被用于存储指令,以执行如本文中描述的用于逻辑上而不需要人工干预对儿童适合的内容的方法。虽然计算机可读存储介质724在示例性实施方式中被示出为单个介质,但是术语“机器可读存储介质”应当被理解为包括存储一个或多个指令集的单个介质或多个介质(例如,集中式或分布式数据库、和/或相关联的高速缓存和服务器)。机器可读存储介质包括用于以可由机器(例如,计算机)读取的形式(例如,软件、处理应用)来存储信息的任何机制。机器可读介质可以包括但并不限于磁性存储介质(例如,软盘);光学存储介质(例如,CD-ROM)、磁性光学存储介质;只读存储器(ROM);随机存取存储器(RAM);可擦除可编程存储器(例如,EPROM或EEPROM);闪速存储器;或者对存储电子指令适合的另一类型的存储介质。
以前的描述阐述了诸如具体系统、组件、方法等的示例的许多具体细节,以便提供对本公开若干方面的良好理解。然而,对于本领域技术人员将会显而易见的是,本公开的至少一些实施方式可以在没有这些细节的情况下进行实践。在其它情况下,众所周知的组件或方法没有被详细描述或者以简单框图的形式进行呈现,以便避免对本公开造成不必要的混淆。因此,所阐述的具体细节仅是示例性的。特定实施方式可以与这些示例性细节方面有所变化并且仍然被被认为是在本公开的范围之内。
贯穿该说明书对于“一个实施方式”或“实施方式”的引用意旨结合该实施方式所描述的特定特征、结构、或特性被包括在至少一个实施方式中。因此,贯穿本说明书各处出现的短语“在一个实施方式中”或“在实施方式中”没有必要全部指代相同的实施方式。此外,术语“或”旨在表示包含“或”而非排除“或”。
虽然方法的操作在这里以特定顺序被示出并描述,但是每个方法的操作的顺序可以有所改变而使得某些操作可以以相反顺序执行或者某些操作可以至少部分与其它操作同时执行。在另一个实施方式中,不同操作的指令或子操作可以以间断和/或交替的方式来进行。
Claims (24)
1.一种方法,包括:
由处理设备识别对应于与儿童相关的话题的实体;
由所述处理设备,针对所识别的实体中的每个实体来确定儿童的亲和度分值;以及
由所述处理设备,基于针对与所述内容相对应的所识别的实体的儿童的亲和度分值来选择内容。
2.根据权利要求1所述的方法,其中,所述实体包括人、地方、或事物中的至少一个。
3.根据权利要求1所述的方法,其中,识别所述实体进一步包括从知识图中选择所述实体,所述知识图包括具有关于实体的库集的结构化信息和所述实体的库集之间的关系连接的知识库,其中,所述实体的库集包括所述实体。
4.根据权利要求3所述的方法,其中,识别所述实体进一步包括:
访问与针对儿童的内容相关的外部数据源;
从所述外部数据源提取针对儿童的话题;
将所提取的话题与从所述知识图确定的所述实体的库集协调;以及
利用来自所提取的话题的经协调的实体,从所述知识图扩展所述实体。
5.根据权利要求4所述的方法,其中,所述外部数据源包括发布针对儿童安全的和儿童感兴趣的内容的评级和评论的受信网站。
6.根据权利要求1所述的方法,其中,确定所述儿童的亲和度分值进一步包括:
识别注释有所述实体的内容项;
基于共同收看信号和共同出现信号识别与所识别的内容项相关的其它内容项;
将所识别的其它内容项与所识别内容项合并,以生成单个组的内容项;
通过在所述单个组的内容项中注释的所述实体将所述单个组的内容项分组,以形成针对每个实体的实体分组;以及
针对具有实体分组的每个实体,基于所述实体分组中的内容项的注释集中性、注释相关性、平均质量、受欢迎度、或平均相关度权重中的至少一个,计算针对所述实体的儿童的亲和度分值。
7.根据权利要求6所述的方法,进一步包括针对语言、质量、受欢迎度、或内容评级中的至少一个过滤所识别的内容项。
8.根据权利要求1所述的方法,其中,选择所述内容进一步包括:
基于内容的类别、上传状态,或与内容相关联的内容项的数量中的至少一个识别一组候选内容;
针对每个候选内容:
识别所述候选内容中的每个内容项的实体注释;
针对所述候选内容中的每个内容项确定平均评级和观看计数;以及
从通过所识别的实体注释加权的所述候选内容的所有内容项汇集所述平均评级和所述观看计数,以针对所述候选内容生成汇集分值;
归一化来自所有所述候选内容的所述汇集分值;以及
基于所述归一化的汇集分值,排名所述候选内容。
9.根据权利要求1所述的方法,其中,所选择的内容包括内容共享平台的频道。
10.根据权利要求1所述的方法,其中,所选择的内容包括所述内容共享平台的播放列表。
11.一种系统,包括:
存储器;以及
处理设备,所述处理设备被耦合至所述存储器,其中,所述处理设备用于:
识别对应于与儿童相关的话题的实体;
针对所识别的实体中的每个实体来确定儿童的亲和度分值;以及
基于针对与所述内容相对应的所识别的实体的儿童的亲和度分值来选择内容。
12.根据权利要求11所述的系统,其中,所述实体包括人、地方、或事物中的至少一个。
13.根据权利要求11所述的系统,其中,用于识别所述实体的所述处理设备进一步包括从知识图中选择所述实体的所述处理设备,所述知识图包括具有关于实体的库集的结构化信息和所述实体的库集之间的关系连接的知识库,其中,所述实体的库集包括所述实体。
14.根据权利要求13所述的系统,其中,用于识别所述实体的所述处理设备进一步包括用于以下操作的所述处理设备:
访问与针对儿童的内容相关的外部数据源;
从所述外部数据源提取针对儿童的话题;
将所提取的话题与从所述知识图确定的所述实体的库集协调;以及
利用来自所提取的话题的经协调的实体,从所述知识图扩展所述实体。
15.根据权利要求11所述的系统,其中,用于确定儿童的亲和度分值的所述处理设备进一步包括用于以下操作的所述处理设备:
识别注释有所述实体的内容项;
基于共同收看信号和共同出现信号识别与所识别的内容项相关的其它内容项;
将所识别的其它内容项与所识别内容项合并,以生成单个组的内容项;
通过在所述单个组的内容项中注释的所述实体将所述单个组的内容项分组,以形成针对每个实体的实体分组;以及
针对具有实体分组的每个实体,基于所述实体分组中的内容项的注释集中性、注释相关性、平均质量、受欢迎度、或平均相关度权重中的至少一个,计算针对该实体的儿童的亲和度分值。
16.根据权利要求15所述的系统,其中,所述处理进一步用于针对语言、质量、受欢迎度、或内容评级中的至少一个过滤对所识别的内容项。
17.根据权利要求11所述的系统,其中,用于选择所述内容的所述处理设备进一步包括用于以下操作的所述处理设备:
基于内容的类别、上传状态,或与内容相关联的内容项的数量中的至少一个识别一组候选内容;
针对每个候选内容:
识别所述候选内容中的每个内容项的实体注释;
针对所述候选内容中的每个内容项确定平均评级和观看计数;以及
从通过所识别的实体注释加权的候选内容的所有内容项汇集平均评级和观看计数进行平均以针对该候选内容生成汇集分值;
归一化来自所有所述候选内容的所述汇集分值;以及
基于所述归一化的汇集分值,排名所述候选内容。
18.一种存储指令的非暂时性机器可读存储介质,所述指令在被执行时使处理设备执行操作,所述操作包括:
由所述处理设备识别对应于与儿童相关的话题的实体;
由所述处理设备,针对所识别的实体中的每个实体来确定儿童的亲和度分值;以及
由所述处理设备,基于针对与内容相对应的所识别实体的儿童的亲和度分值来选择所述内容。
19.根据权利要求18所述的非暂时性机器可读存储介质,其中,识别所述实体进一步包括从知识图中选择所述实体,所述知识图包括具有关于实体的库集的结构化信息和所述实体的库集之间的关系连接的知识库,其中,所述实体的库集包括所述实体。
20.根据权利要求19所述的非暂时性机器可读存储介质,其中,识别所述实体进一步包括:
访问与针对儿童的内容相关的外部数据源;
从所述外部数据源提取针对儿童的话题;
将所提取的话题与从所述知识图确定的所述实体的库集协调;以及
利用来自所提取的话题的经协调的实体,从所述知识图扩展所述实体。
21.根据权利要求18所述的非暂时性机器可读存储介质,其中,确定所述儿童的亲和度分值进一步包括:
识别注释有所述实体的内容项;
基于共同收看信号和共同出现信号识别与所识别的内容项相关的其它内容项;
将所识别的其它内容项与所识别内容项合并,以生成单个组的内容项;
通过在所述单个组的内容项中注释的所述实体将所述单个组的内容项分组,以形成针对每个实体的实体分组;以及
针对具有实体分组的每个实体,基于所述实体分组中的内容项的注释集中性、注释相关性、平均质量、受欢迎度、或平均相关度权重中的至少一个,计算针对所述实体的儿童的亲和度分值。
22.根据权利要求21所述的非暂时性机器可读存储介质,其中,所述操作进一步包括针对语言、质量、受欢迎度、或内容评级中的至少一个过滤所识别的内容项。
23.根据权利要求18所述的非暂时性机器可读存储介质,其中,选择所述内容进一步包括:
基于内容的类别、上传状态,或与内容相关联的内容项的数量中的至少一个识别一组候选内容;
针对每个候选内容:
识别所述候选内容中的每个内容项的实体注释;
针对所述候选内容中的每个内容项确定平均评级和观看计数;以及
从通过所识别的实体注释加权的所述候选内容的所有内容项汇集所述平均评级和所述观看计数,以针对所述候选内容生成汇集分值;
归一化来自所有所述候选内容的所述汇集分值;以及
基于所述归一化的汇集分值,排名候选内容。
24.根据权利要求18所述的非暂时性机器可读存储介质,其中,所选择内容包括内容共享平台的频道或者所述内容共享平台的播放列表中的至少一个。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/628,288 | 2015-02-22 | ||
US14/628,288 US11049029B2 (en) | 2015-02-22 | 2015-02-22 | Identifying content appropriate for children algorithmically without human intervention |
PCT/US2016/017028 WO2016133731A1 (en) | 2015-02-22 | 2016-02-08 | Identifying content appropriate for children algorithmically without human intervention |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107257982A true CN107257982A (zh) | 2017-10-17 |
Family
ID=56689441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680011504.0A Pending CN107257982A (zh) | 2015-02-22 | 2016-02-08 | 在没有人工干预的情况下算法上识别对儿童适合的内容 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11049029B2 (zh) |
EP (1) | EP3259921A4 (zh) |
JP (2) | JP6538866B2 (zh) |
KR (1) | KR102044619B1 (zh) |
CN (1) | CN107257982A (zh) |
DE (1) | DE112016000851B4 (zh) |
GB (1) | GB2552750A (zh) |
WO (1) | WO2016133731A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427499A (zh) * | 2018-04-26 | 2019-11-08 | 腾讯科技(深圳)有限公司 | 多媒体资源的处理方法、装置及存储介质和电子装置 |
CN111919210A (zh) * | 2018-06-29 | 2020-11-10 | 谷歌有限责任公司 | 用于并入到审查媒体语料库中的媒体源度量 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10361936B2 (en) | 2015-08-19 | 2019-07-23 | Google Llc | Filtering content based on user mobile network and data-plan |
US11200288B1 (en) * | 2017-07-31 | 2021-12-14 | Apple Inc. | Validating interests for a search and feed service |
CN111221983B (zh) | 2020-01-15 | 2023-08-04 | 北京百度网讯科技有限公司 | 时序知识图谱生成方法、装置、设备和介质 |
US20230113941A1 (en) * | 2021-10-07 | 2023-04-13 | Dell Products L.P. | Data confidence fabric view models |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020073050A (ko) * | 2001-03-14 | 2002-09-19 | (주) 젠터닷컴 | 방송프로그램 추천 자동화 시스템 및 방법과 그 프로그램소스를 저장한 기록매체 |
KR20050004812A (ko) * | 2002-03-19 | 2005-01-12 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 복수의 추천 스코어들을 사용하는 추천 시스템 |
CN1879413A (zh) * | 2003-11-12 | 2006-12-13 | 皇家飞利浦电子股份有限公司 | 节目推荐系统 |
JP2010055391A (ja) * | 2008-08-28 | 2010-03-11 | Fujifilm Corp | 商品分析装置、商品提案装置、商品分析方法及びプログラム |
US20120060176A1 (en) * | 2010-09-08 | 2012-03-08 | Chai Crx K | Smart media selection based on viewer user presence |
US20120109966A1 (en) * | 2010-11-01 | 2012-05-03 | Jisheng Liang | Category-based content recommendation |
CN102804222A (zh) * | 2010-12-28 | 2012-11-28 | 株式会社Neopad | 用于提供用户定制内容的方法和系统 |
US20140280140A1 (en) * | 2013-03-14 | 2014-09-18 | The Directv Group, Inc. | Method and system for displaying recommended content such as movies associated with a cluster |
CN104102713A (zh) * | 2014-07-16 | 2014-10-15 | 百度在线网络技术(北京)有限公司 | 推荐结果的展现方法和装置 |
US10255253B2 (en) * | 2013-08-07 | 2019-04-09 | Microsoft Technology Licensing, Llc | Augmenting and presenting captured data |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070079211A (ko) * | 2006-02-01 | 2007-08-06 | 삼성전자주식회사 | 멀티미디어 컨텐츠 추천 장치 및 방법 |
JP4709671B2 (ja) | 2006-03-20 | 2011-06-22 | 日本放送協会 | 知識メタデータ生成装置及び知識メタデータ生成プログラム |
US20130132194A1 (en) | 2011-11-17 | 2013-05-23 | Giridhar Rajaram | Targeting advertisements to users of a social networking system based on events |
US9075766B2 (en) | 2012-07-12 | 2015-07-07 | Salesforce.Com, Inc. | Computer implemented methods and apparatus for determining whether to continue relationships in an online social network |
US20140052540A1 (en) | 2012-08-20 | 2014-02-20 | Giridhar Rajaram | Providing content using inferred topics extracted from communications in a social networking system |
US9225788B2 (en) | 2012-10-05 | 2015-12-29 | Facebook, Inc. | Method and apparatus for identifying common interest between social network users |
JP5823943B2 (ja) | 2012-10-10 | 2015-11-25 | 株式会社Ubic | フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム |
KR20140089876A (ko) | 2013-01-07 | 2014-07-16 | 삼성전자주식회사 | 대화형 인터페이스 장치 및 그의 제어 방법 |
US10356135B2 (en) | 2013-01-22 | 2019-07-16 | Facebook, Inc. | Categorizing stories in a social networking system news feed |
US9946739B2 (en) | 2013-03-15 | 2018-04-17 | Neura Labs Corp. | Intelligent internet system with adaptive user interface providing one-step access to knowledge |
-
2015
- 2015-02-22 US US14/628,288 patent/US11049029B2/en active Active
-
2016
- 2016-02-08 KR KR1020177026912A patent/KR102044619B1/ko active IP Right Grant
- 2016-02-08 WO PCT/US2016/017028 patent/WO2016133731A1/en active Application Filing
- 2016-02-08 CN CN201680011504.0A patent/CN107257982A/zh active Pending
- 2016-02-08 EP EP16752798.5A patent/EP3259921A4/en not_active Withdrawn
- 2016-02-08 DE DE112016000851.1T patent/DE112016000851B4/de active Active
- 2016-02-08 JP JP2017543797A patent/JP6538866B2/ja active Active
- 2016-02-08 GB GB1715297.6A patent/GB2552750A/en not_active Withdrawn
-
2019
- 2019-06-06 JP JP2019106103A patent/JP6901523B2/ja active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020073050A (ko) * | 2001-03-14 | 2002-09-19 | (주) 젠터닷컴 | 방송프로그램 추천 자동화 시스템 및 방법과 그 프로그램소스를 저장한 기록매체 |
KR20050004812A (ko) * | 2002-03-19 | 2005-01-12 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 복수의 추천 스코어들을 사용하는 추천 시스템 |
CN1879413A (zh) * | 2003-11-12 | 2006-12-13 | 皇家飞利浦电子股份有限公司 | 节目推荐系统 |
JP2010055391A (ja) * | 2008-08-28 | 2010-03-11 | Fujifilm Corp | 商品分析装置、商品提案装置、商品分析方法及びプログラム |
US20120060176A1 (en) * | 2010-09-08 | 2012-03-08 | Chai Crx K | Smart media selection based on viewer user presence |
US20120109966A1 (en) * | 2010-11-01 | 2012-05-03 | Jisheng Liang | Category-based content recommendation |
CN102804222A (zh) * | 2010-12-28 | 2012-11-28 | 株式会社Neopad | 用于提供用户定制内容的方法和系统 |
US20140280140A1 (en) * | 2013-03-14 | 2014-09-18 | The Directv Group, Inc. | Method and system for displaying recommended content such as movies associated with a cluster |
US10255253B2 (en) * | 2013-08-07 | 2019-04-09 | Microsoft Technology Licensing, Llc | Augmenting and presenting captured data |
CN104102713A (zh) * | 2014-07-16 | 2014-10-15 | 百度在线网络技术(北京)有限公司 | 推荐结果的展现方法和装置 |
Non-Patent Citations (3)
Title |
---|
CHEEKULA S K ET AL: ""Entity recommendations using hierarchical knowledge bases"", 《CEUR WORKSHOP PROCEEDINGS(2015)》 * |
PERETZ SHOVAL ET AL: ""AN ONTOLOGY- CONTENT-BASED FILTERING METHOD"", 《INFORMATION THEORIES & APPLICATIONS》 * |
马刚主编: "《基于语义的Web数据挖掘》", 31 January 2014, 大连:东北财经大学出版社 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427499A (zh) * | 2018-04-26 | 2019-11-08 | 腾讯科技(深圳)有限公司 | 多媒体资源的处理方法、装置及存储介质和电子装置 |
CN110427499B (zh) * | 2018-04-26 | 2023-08-29 | 腾讯科技(深圳)有限公司 | 多媒体资源的处理方法、装置及存储介质和电子装置 |
CN111919210A (zh) * | 2018-06-29 | 2020-11-10 | 谷歌有限责任公司 | 用于并入到审查媒体语料库中的媒体源度量 |
Also Published As
Publication number | Publication date |
---|---|
KR20170120661A (ko) | 2017-10-31 |
DE112016000851T5 (de) | 2017-11-09 |
JP2018511115A (ja) | 2018-04-19 |
JP6901523B2 (ja) | 2021-07-14 |
KR102044619B1 (ko) | 2019-11-13 |
JP2019145178A (ja) | 2019-08-29 |
EP3259921A1 (en) | 2017-12-27 |
GB201715297D0 (en) | 2017-11-08 |
WO2016133731A1 (en) | 2016-08-25 |
DE112016000851B4 (de) | 2021-11-25 |
US11049029B2 (en) | 2021-06-29 |
US20160247078A1 (en) | 2016-08-25 |
EP3259921A4 (en) | 2018-02-14 |
GB2552750A (en) | 2018-02-07 |
JP6538866B2 (ja) | 2019-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8793593B2 (en) | Integrating structured objects and actions generated on external systems into a social networking system | |
US9032290B2 (en) | Tool for creating structured objects and actions on a social networking system | |
JP6023203B2 (ja) | ソーシャル・ネットワーキング・システム上の構造化オブジェクトおよびアクション | |
US8909515B2 (en) | Dynamic sentence formation from structured objects and actions in a social networking system | |
US10356462B1 (en) | Recommending a composite channel | |
CN107257982A (zh) | 在没有人工干预的情况下算法上识别对儿童适合的内容 | |
US20130073568A1 (en) | Ranking structured objects and actions on a social networking system | |
US9723367B1 (en) | Identifying content appropriate for children via a blend of algorithmic content curation and human review | |
US9979995B2 (en) | Visual hot watch spots in content item playback | |
CN106063282B (zh) | 合并内容频道 | |
US20140057239A1 (en) | Methods and apparatuses for facilitating online knowledge transfers | |
Li et al. | Exploring the success determinants of crowdfunding for cultural and creative projects: An empirical study based on signal theory | |
Bartolome et al. | A Literature Review of Video-Sharing Platform Research in HCI | |
US20130124624A1 (en) | Enabling preference portability for users of a social networking system | |
Tozman | Learning on demand: How the evolution of the web is shaping the future of learning | |
US11403337B2 (en) | Identifying videos with inappropriate content by processing search logs | |
Jamnekar et al. | A hybrid approach for movie recommendation based on user behaviour | |
Chen et al. | Growing and Shaping the User Base: The Transformation of TikTok | |
CN115730111B (zh) | 内容分发方法、装置、设备及计算机可读存储介质 | |
Wirtz | Social Media Business | |
Xia | A content analysis of tweets about MOOC experiences | |
Paraicu et al. | Online Music Application with Recommendation System | |
Lin et al. | Addressing cold-start in app recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: American California Applicant after: Google limited liability company Address before: American California Applicant before: Google Inc. |