CN113474770A - 基于语义等效话题的内容项的多语言分组 - Google Patents

基于语义等效话题的内容项的多语言分组 Download PDF

Info

Publication number
CN113474770A
CN113474770A CN202080013512.5A CN202080013512A CN113474770A CN 113474770 A CN113474770 A CN 113474770A CN 202080013512 A CN202080013512 A CN 202080013512A CN 113474770 A CN113474770 A CN 113474770A
Authority
CN
China
Prior art keywords
user device
language
tag
user
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080013512.5A
Other languages
English (en)
Inventor
S·E·马蒙
C·D·拉芬
A·A·苏瓦尼
G·D·拉姆库玛
D·J·休斯
P·比鲁德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Inc filed Critical Apple Inc
Publication of CN113474770A publication Critical patent/CN113474770A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Library & Information Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

在一些具体实施中,计算设备可呈现话题的多语言分组。例如,计算设备可为计算设备的用户确定主要语言和次要语言。计算设备可请求包括标签语言映射的配置,该标签语言映射可用于将对应于次要语言的话题标签翻译为对应于主要语言的话题标签。当计算设备接收到与次要语言相关联的加标签的内容项时,计算设备可以将对应于加标签的内容项的次要语言标签翻译成主要语言的语义上等效的话题标签。然后,计算设备可基于对应于已翻译内容项标签的话题来将主要语言内容项和次要语言内容项分组为多语言分组。然后,计算设备可以呈现内容项的多语言话题分组。

Description

基于语义等效话题的内容项的多语言分组
技术领域
本公开整体涉及用于图形用户界面的多语言支持。
背景技术
内容递送系统通常为识别内容项的内容的主题(例如,话题)的内容项生成话题标签并将其存储在元数据中。话题标签通常是与内容项语言相同的字词(例如,体育、政治、娱乐等)。因此,法语语言中与政治相关的内容项可以用话题标签“politique”标记,而英语语言中与政治相关的内容项可以用话题标签“politics”标记。由于“politique”标签和“politics”是不同的标签,因此将内容项按话题标签分组以供呈现的客户端设备(例如,用户设备)可以将标记为“politique”的内容项与标记为“politics”的内容项分开分组,即使“politique”和“politics”在语义上是等效的。
发明内容
在一些具体实施中,计算设备可呈现话题的多语言分组。例如,计算设备可为计算设备的用户确定主要语言和次要语言。计算设备可请求包括标签语言映射的配置,该标签语言映射可用于将对应于次要语言的话题标签翻译为对应于主要语言的话题标签。当计算设备接收到与次要语言相关联的加标签的内容项时,计算设备可以将对应于加标签的内容项的次要语言标签翻译成主要语言的语义上等效的话题标签。然后,计算设备可基于对应于已翻译内容项标签的话题来将主要语言内容项和次要语言内容项分组为多语言分组。然后,计算设备可以呈现内容项的多语言话题分组。
特定具体实施提供了至少以下优点。通过将与语义上等效的话题相关联的内容项分组到单个话题分组中,可以改善以多种语言消费内容的用户的用户体验。用户可以在单个位置更有效地定位和消费与单个话题相关联的所有内容项,尽管以不同的语言。
在下面的附图和具体实施方式中阐述了一种或多种具体实施的细节。其他特征、方面和潜在优点将在具体实施方式和附图以及权利要求书中显而易见。
附图说明
图1是用于基于语义上等效的话题标签对内容项进行多语言分组的示例性系统的框图。
图2示出了用于呈现按话题标签分组的内容项的示例性图形用户界面。
图3示出了用于基于语义上等效的话题标签来呈现内容项的多语言分组的示例性图形用户界面。
图4是用于基于语义上等效的话题标签对内容项进行多语言分组的示例性过程的流程图。
图5是可实现图1至图4的特征和过程的示例性计算设备的框图。
各个附图中的类似参考符号指示类似的元素。
具体实施方式
图1是用于基于语义上等效的话题标签对内容项进行多语言分组的示例性系统100的框图。例如,系统100可被配置为将与次要语言相关联的话题标签翻译成与主要语言相关联的语义等效的话题标签,使得与两种或更多种不同语言相关联的内容项可根据语义相似性分组。
在一些具体实施中,系统100可包括用户设备110。例如,用户设备110可以是计算设备,诸如智能电话、平板电脑、智能手表、膝上型计算机、台式计算机、车载信息娱乐系统、或任何其他计算设备。
在一些具体实施中,用户设备110可包括新闻应用程序112。例如,新闻应用程序112可以是在用户设备110上安装和/或运行的软件应用程序,其可以从内容服务器(例如,服务器设备130上的内容服务器132)请求和接收各种内容项(例如,新闻文章、视频、评论文章、博客等)。
在一些具体实施中,用户设备110可包括列入白名单的话题标签114。例如,列入白名单的标签114可以包括用户设备110可为用户设备110的用户自动订阅的话题标签。例如,用户设备110可以基于用户的内容消费行为来为用户自动订阅在列入白名单的标签114中识别的话题(例如,标签)。例如,如果用户定期消费体育相关内容,但尚未提供明确的输入来订阅体育话题,则用户设备110可为用户自动订阅体育话题标签。用户设备110不能为用户订阅与不包括在列入白名单的标签114中的话题标签相对应的话题。用户设备110可以响应于配置请求从服务器设备130上的内容服务器132获得列入白名单的标签114,如下面进一步描述的。
在一些具体实施中,用户设备110可包括标签语言映射116。例如,标签语言映射可为定义如何将对应于次要语言的标签翻译为对应于主要语言的语义等效标签的数据对象或文件。如果用户设备110的用户具有多个次要语言,则用户设备110可存储多个标签语言映射文件(例如,每个次要语言一个标签语言映射文件)。用户设备110可以响应于配置请求从服务器设备130上的内容服务器132获得标签语言映射116,如下面进一步描述的。
为了配置新闻应用程序112以处理来自内容服务器的内容项,新闻应用程序112可通过网络120将配置请求118发送到服务器设备130上的内容服务器132。例如,配置请求118可包括与用户设备110相关联的语言偏好(例如,主要语言、次要语言)等等。例如,配置请求118可包括识别用户设备110的用户的主要语言的信息。主要语言(例如,法语、英语、中文等)可以例如对应于用户设备110的语言设置,该语言设置指定应当使用哪个语言在用户设备110的各个图形用户界面上呈现信息。
次要语言(例如,法语、英语、中文等)可以由用户设备110基于用户的历史内容消费行为来暗示。例如,如果用户的主要语言是法语,但是用户也消费英语内容项,则用户设备110可以确定用户的次要语言是英语。在一些具体实施中,用户设备110可为用户确定多个次要语言。例如,如果用户的主要语言是法语,但是用户也消费英语和德语内容项,则用户设备110可以确定用户的次要语言是英语和德语。新闻应用程序112可在配置请求118中包括用户的主要语言和所有次要语言。
在一些具体实施中,系统100可包括服务器设备130。例如,服务器设备130可以是联网计算设备。服务器设备130可包括内容服务器132。例如,内容服务器132可以是向客户端设备(例如,用户设备110)上的新闻应用程序(例如,新闻应用程序112)提供配置和/或内容的软件服务器。例如,响应于通过网络120从用户设备110接收到配置请求118,内容服务器130可为配置请求118中识别的每个次要语言选择标签语言映射136(例如,类似于标签语言映射116进行配置)。例如,每个选定标签语言映射136将定义如何将对应次要语言的标签翻译成对应于主要语言的标签。因此,如果配置请求110将法语识别为主要语言并且将英语和德语识别为次要语言,则内容服务器132可以选择将英语标签映射到语义等效的法语标签的第一标签语言映射136以及将德语标签映射到语义等效的法语标签的第二标签语言映射136。为简单起见,下面的描述将使用法语作为主要语言,并且使用单个次要语言(英语)。因此,响应于接收到将法语识别为主要语言并且将英语识别为次要语言的配置请求118,内容服务器132可以选择将英语话题标签映射到语义上等效的法语话题标签的标签语言映射136。
在一些具体实施中,响应于配置请求118,内容服务器132可以将配置138发送到用户设备110上的新闻应用程序112。例如,配置138可包括选定标签语言映射136和列入白名单的标签134等等。在接收到配置138时,用户设备可将选定标签语言映射136和列入白名单的标签134分别存储为标签语言映射116和列入白名单的标签114。
在一些具体实施中,用户设备110可包括标签订阅114。标签订阅114可包括用户已明确订阅的话题标签。例如,用户设备110的用户可提供明确指示用户希望订阅一个或多个特定话题的用户输入。响应于该明确订阅输入,新闻应用程序112可以存储与标签订阅114中的用户识别的话题相对应的话题标签。标签订阅114可包括已由用户设备110和/或新闻应用程序112为用户自动订阅的话题标签。例如,用户设备110的用户可提供用户输入,用户设备110和/或新闻应用程序112可使用该用户输入来暗示对一个或多个特定话题的兴趣。例如,用户的历史内容消费行为可包括指示用户喜欢消费体育相关内容或更具体地讲篮球相关内容的模式。当新闻应用程序112和/或用户设备110检测到该模式时,如果这些话题被包括在列入白名单的标签114中,则新闻应用程序112可以为用户自动订阅体育话题和/或篮球话题,并将与这些话题对应的话题标签存储在标签订阅114中。
在一些具体实施中,新闻应用程序112可将内容请求140发送到内容服务器132。例如,内容请求140可以是对与标签订阅114相关联的内容项的请求。因此,当将内容请求140发送到内容服务器132时,新闻应用程序112可以包括在内容请求140中的标签订阅114中识别的一个或多个话题标签。
在一些具体实施中,服务器设备130可包括加标签的内容项132。例如,加标签的内容项132可包括已加有表示每个内容项的主题的话题标签的内容项。话题标签可例如存储在对应内容项的元数据中。
在一些具体实施中,内容服务器132可以将加标签的内容142发送到新闻应用程序112。例如,响应于接收到标识用户设备110的用户已经订阅的话题标签的内容请求140,内容服务器132可以从加标签的内容项132中选择包括内容请求140中包括的话题标签中的一个或多个话题标签的内容项。例如,由于用户消费与两种不同语言(例如,法语和英语)相关联的内容,因此包括在内容请求140中的话题标签可以包括法语话题标签和英语话题标签。此外,内容请求140可以包括语义上等效的法语话题标签和英语话题标签(例如,法语“politique”语义上等效于英语“politics”)。因此,内容服务器132可选择与政治相关的法语内容项和英语内容项。在基于包括在内容请求140中的话题标签选择内容项之后,内容服务器132可以将加标签的内容142中的选定加标签的内容项发送到新闻应用程序112。
响应于接收到加有标签的内容142,新闻应用程序112可通过话题标签将加有标签的内容142中的内容项进行分组,并在用户设备110的显示器上呈现内容项分组,如下所述。
图2示出了用于呈现按话题标签分组的内容项的示例性图形用户界面200。例如,GUI 200可由用户设备110上的新闻应用程序112生成。GUI 200示出了当新闻应用程序112不基于语义等效对内容项进行分组时,可如何呈现与不同语言相关联的内容项(例如,新闻文章、评论文章等)。例如,新闻应用程序112可生成GUI 200,而无需将次要语言话题标签翻译成对应的主要语言话题标签。
如GUI 200所示,用户设备200的用户已订阅法语话题“politique”和英语话题“politics”。由于在该实施方案中,新闻应用程序112不是基于语义相似性进行分组的,因此新闻应用程序112将严格地基于话题标签对与每个话题相关联的内容项进行分组。由于法语话题标签“politique”与英语话题标签“politics”不同,因此即使话题在语义上相似,新闻应用程序112也将为这些话题标签生成两个不同的话题分组210(“politique”)和220(“politics”)。因此,即使法语212、214和216以及英语内容项222和224都通过内容和/或话题相关,但与政治(例如,“politique”)相关的法语内容项212、214和216也将和与政治(例如,“politics”)相关的英语内容项222和224分开呈现。
遗憾的是,GUI 200所示的内容的布置和呈现可能会使用户感到困惑,该用户可能期望将所有与政治相关的内容项分组和呈现在一起。特别是如果“politics”内容组通过其他内容/话题分组与“politique”内容组分开。为了防止这种混淆并且使用户更容易找到该用户感兴趣的内容,新闻应用程序112可通过确定语义上等效的话题标签并基于语义上等效的话题对内容项进行分组,而不是通过话题标签对内容项进行严格分组。
图3示出了用于基于语义上等效的话题标签来呈现内容项的多语言分组的示例性图形用户界面300。例如,GUI 300可由用户设备110上的新闻应用程序112生成。GUI 300示出了当新闻应用程序112被配置为基于语义上等效的话题标签对内容项进行分组时,与不同语言相关联的内容项(例如,新闻文章、评论文章等)可如何在同一话题分组中呈现。例如,新闻应用程序112可通过使用将英语话题标签映射到语义上等效的法语话题标签的标签语言映射116将次要语言话题标签翻译为对应的主要语言话题标签来生成GUI 300,如上所述。
如上所述,新闻应用程序112可接收加有法语语言话题标签(例如,“politique”)的法语语言内容项和加有英语语言话题标签(例如,“politics”)的英语语言内容项。由于新闻应用程序112被配置为通过话题标签对内容项进行分组,因此新闻应用程序112可被配置为在对内容项进行分组之前,使用存储在用户设备110上的标签语言映射116中的次要语言标签至主要语言标签映射来将次要语言标签翻译成对应的主要语言标签。例如,在对内容项进行分组以在GUI 300上呈现之前,新闻应用程序112可确定内容项222和224与次要语言英语相关联,并且基于在标签语言映射116中找到的“politics”和“politique”之间的映射来将与内容项222和224相关联的英语语言“politics”标签翻译成对应的(例如,语义上等效的)主要语言(例如,法语)话题标签“politique”。在将英语“politics”翻译为法语“politique”之后,新闻应用程序112可以基于现在与内容项212、214、216、222和224中的每一个相关联的法语“politique”话题标签来将英语和法语内容项212、214、216、222和224分组在同一内容分组302中,如图3所示。
示例性过程
为了使读者能够清楚地理解本文所述的技术概念,以下过程描述了以特定顺序执行的具体步骤。然而,特定过程的一个或多个步骤可以被重新安排和/或省略,同时保持在本文公开的技术的预期范围内。此外,可以组合、重新组合、重新安排、省略和/或并行执行不同的过程和/或其步骤,以创建也在本文公开的技术的预期范围内的不同处理流程。此外,尽管为了清楚起见,下面的过程可以省略或简要概述本文中公开的技术的一些细节,但是以上段落中描述的细节可以与下面描述的过程步骤组合以获得对这些过程和本文所公开的技术的更完整和全面的理解。
图4是用于基于语义上等效的话题标签对内容项进行多语言分组的示例性过程400的流程图。例如,过程400可由用户设备110执行,以在单个语义上等效的话题分组中呈现与不同语言的不同话题标签相关联的内容项。
在步骤402处,用户设备110可确定主要用户语言和次要用户语言。例如,用户设备110可基于用户设备110的语言设置来确定主要用户语言。用户设备110可基于用户的行为模式来推断次要语言。具体地讲,用户设备110可基于用户在一段时间内消费的内容的语言来推断一个或多个次要语言。
在步骤404处,用户设备110可存储用于将次要语言标签翻译为主要语言标签的标签语言映射。例如,用户设备110可向服务器设备130发送配置数据请求。配置数据请求可识别用户的主要语言和用户的一个或多个次要语言。服务器设备130可选择标签语言映射对象或文件(该标签语言映射对象或文件包括用户的次要语言的话题标签到用户的主要语言的话题标签的映射),并将选定标签语言映射发送到用户设备110。用户设备110可将标签语言映射存储在用户设备110上以供稍后用于将次要语言标签翻译成主要语言标签。
在步骤406处,用户设备110可接收加标签的内容。例如,用户设备110可以请求与用户已经(例如,自动或明确地)订阅的话题标签相关联的内容。服务器设备130可选择与所请求的话题标签相关联的内容项并将加标签的内容项发送到用户设备110。例如,每个加标签的内容项都可以加有描述对应加标签的内容项的内容的话题标签。
在步骤408处,用户设备110可将与所接收的内容项相关联的次要语言标签翻译成主要语言标签。例如,当加标签的内容项与用户的次要语言相关联时,加标签的内容项将用用户的次要语言的话题标签进行标记。用户设备110可将次要语言标签与标签语言映射进行比较,以确定对应于(例如,映射到)与内容项相关联的次要语言标签的主要语言标签。然后,用户设备110可将所确定的主要语言标签与内容项相关联。
在步骤410处,用户设备110可基于所翻译的语言标签来对加标签的内容进行分组。例如,用户设备110可基于与内容项相关联的主要语言标签(包括已翻译的主要语言标签)来对加标签的内容项进行分组。例如,可将与相同主要语言话题标签相关联的所有内容项分组在一起。
在步骤412处,用户设备110可在用户设备110的显示器上呈现已分组的内容项。例如,用户设备110可在GUI 300上呈现已分组的内容项,如上所述。
图形用户界面
本公开在上文描述了用于实现各种特征、过程或工作流的各种图形用户界面(GUI)。这些GUI可被呈现在各种电子设备上,包括但不限于膝上型计算机、台式计算机、计算机终端、电视系统、平板电脑、电子书阅读器和智能电话。这些电子设备中的一者或多者可包括触敏表面。触敏表面可处理多个同时的输入点,包括处理与每个输入点的压力、程度或位置相关的数据。此类处理可促进利用多个手指所进行的手势,该手势包括捏合和轻扫。
当本公开指“选择”GUI中的用户界面元素时,这些术语被理解为包括在用户界面元素上方利用鼠标或其他输入设备来点击或“悬停”,或利用一个或多个手指或触笔来在用户界面元素上触摸、轻击或做手势。用户界面元素可以是虚拟按钮、菜单、选择器、开关、滑动条、刷子、旋钮、缩略图、链接、图标、单选框、复选框和用于从用户接收输入或向用户提供反馈的任何其他机构。
隐私
如上所述,本发明技术的一个方面在于收集和使用可从各种来源获得的数据,以自动订阅用户感兴趣的话题并请求与用户感兴趣的话题相关联的内容项。本公开预期,在一些实例中,这些所采集的数据可包括唯一地识别或可用于联系或定位特定人员的个人信息数据。此类个人信息数据可包括人口统计数据、基于定位的数据、电话号码、电子邮件地址、社交媒体ID、家庭地址、与用户的健康或健身等级相关的数据或记录(例如,生命信号测量、药物信息、锻炼信息)、出生日期、或任何其他识别信息或个人信息。
本公开认识到在本发明技术中使用此类个人信息数据可用于使用户受益。例如,该个人信息数据可用于递送用户较感兴趣的目标内容。此外,本公开还预期个人信息数据有益于用户的其他用途。例如,健康和健身数据可用于向用户的总体健康状况提供见解,或者可用作使用技术来追求健康目标的个人的积极反馈。
本公开设想负责采集、分析、公开、传输、存储或其他使用此类个人信息数据的实体将遵守既定的隐私政策和/或隐私实践。具体地,此类实体应当实行并坚持使用被公认为满足或超出对维护个人信息数据的隐私性和安全性的行业或政府要求的隐私政策和实践。此类政策应该能被用户方便地访问,并应随着数据的采集和/或使用变化而被更新。来自用户的个人信息应当被收集用于实体的合法且合理的用途,并且不在这些合法使用之外共享或出售。此外,应在收到用户知情同意后进行此类采集/共享。此外,此类实体应考虑采取任何必要步骤,保卫和保障对此类个人信息数据的访问,并确保有权访问个人信息数据的其他人遵守其隐私政策和流程。另外,这种实体可使其本身经受第三方评估以证明其遵守广泛接受的隐私政策和实践。此外,应当调整政策和实践,以便采集和/或访问的特定类型的个人信息数据,并适用于包括管辖范围的具体考虑的适用法律和标准。例如,在美国,对某些健康数据的收集或获取可能受联邦和/或州法律的管辖,诸如健康保险流通和责任法案(HIPAA);而其他国家的健康数据可能受到其他法规和政策的约束并应相应处理。因此,在每个国家应为不同的个人数据类型保持不同的隐私实践。
不管前述情况如何,本公开还预期用户选择性地阻止使用或访问个人信息数据的实施方案。即本公开预期可提供硬件元件和/或软件元件,以防止或阻止对此类个人信息数据的访问。例如,就内容递送服务而言,本发明技术可被配置为在注册服务期间或之后任何时候允许用户选择“选择加入”或“选择退出”参与对个人信息数据的收集。除了提供“选择加入”和“选择退出”选项外,本公开设想提供与访问或使用个人信息相关的通知。例如,可在下载应用时向用户通知其个人信息数据将被访问,然后就在个人信息数据被应用访问之前再次提醒用户。
此外,本公开的目的是应管理和处理个人信息数据以最小化无意或未经授权访问或使用的风险。一旦不再需要数据,通过限制数据收集和删除数据可最小化风险。此外,并且当适用时,包括在某些健康相关应用程序中,数据去标识可用于保护用户的隐私。可在适当时通过移除特定标识符(例如,出生日期等)、控制所存储数据的量或特异性(例如,在城市级别而不是在地址级别收集位置数据)、控制数据如何被存储(例如,在用户之间聚合数据)、和/或其他方法来促进去标识。
因此,虽然本公开广泛地覆盖了使用个人信息数据来实现一个或多个各种所公开的实施方案,但本公开还预期各种实施方案也可在无需访问此类个人信息数据的情况下被实现。即,本发明技术的各种实施方案不会由于缺少此类个人信息数据的全部或一部分而无法正常进行。例如,可通过基于非个人信息数据或绝对最低数量的个人信息诸如与用户相关联的设备所请求的内容、对内容递送服务可用的其他非个人信息或公开可用的信息来推断偏好,从而选择内容并将该内容递送至用户。
示例性系统架构
图5是可实现图1至图4的特征和过程的示例性计算设备500的框图。计算设备500可包括存储器接口502、一个或多个数据处理器、图像处理器和/或中央处理单元504以及外围接口506。存储器接口502、一个或多个处理器504和/或外围接口506可以是独立部件,或者可集成到一个或多个集成电路中。计算设备500中的各种部件可由一条或多条通信总线或信号线耦接。
传感器、设备和子系统可耦接到外围设备接口506以促进多个功能。例如,运动传感器510、光传感器512和接近传感器514可耦接到外围接口506以促进取向、照明和接近功能。其他传感器516还可连接到外围设备接口506,诸如全球导航卫星系统(GNSS)(例如,GPS接收器)、温度传感器、生物识别传感器、磁力仪或其他感测设备,以促进相关功能。
可利用相机子系统520和光学传感器522(如电荷耦合设备(CCD)或互补金属氧化物半导体(CMOS)光学传感器)来促进相机功能,诸如拍摄照片和视频剪辑。摄像机子系统520和光学传感器522可(例如,通过执行面部识别分析)用于收集要在用户认证期间待使用的用户图像。
可通过一个或多个无线通信子系统524来促进通信功能,这些无线通信子系统可包括射频接收器和发射器和/或光学(例如,红外)接收器和发射器。通信子系统524的具体设计与实现可取决于计算设备500旨在通过其操作的一个或多个通信网络。例如,计算设备500可包括设计用于通过GSM网络、GPRS网络、EDGE网络、Wi-Fi或WiMax网络以及BluetoothTM网络操作的通信子系统524。具体地,无线通信子系统524可包括托管协议,使得设备100可被配置作为其他无线设备的基站。
音频子系统526可耦接到扬声器528和麦克风530以促进支持语音的功能,诸如讲话者识别、语音复制、数字记录和电话功能。音频子系统526可被配置为促进例如处理语音命令、声纹鉴别和语音认证。
I/O子系统540可包括触摸表面控制器542和/或(一个或多个)其它输入控制器544。触摸表面控制器542可耦接到触摸表面546。触摸表面546和触摸表面控制器542可例如使用多种触敏技术的任何一种(触敏技术包括但不限于电容性、电阻性、红外和表面声波技术)以及用于确定与接触表面546接触的一个或多个点的其它接近传感器阵列或其它元件来检测接触和运动或其中断。
(一个或多个)其它输入控制器544可耦接到其它输入/控制设备548,诸如一个或多个按钮、摇臂开关、拇指滚轮、红外端口、USB端口和/或指针设备(诸如触笔)。一个或多个按钮(未示出)可包括用于扬声器528和/或麦克风530的音量控制的增大/减小按钮。
在一种具体实施中,将按钮按下并持续第一持续时间能够解除触摸表面546的锁定;并且将按钮按下并持续比第一持续时间长的第二持续时间可打开或关闭计算设备500的电源。将按钮按下并持续第三持续时间可激活使用户能够向麦克风530说出命令以使设备执行所说的命令的语音控制或语音命令模块。用户可自定义一个或多个按钮的功能。例如,还可以使用触摸表面546实现虚拟或软按钮和/或键盘。
在一些具体实施中,计算设备500可呈现记录的音频和/或视频文件,诸如MP3、AAC和MPEG文件。在一些具体实施中,计算设备500可包括MP3播放器的功能,诸如iPodTM
存储器接口502可耦接到存储器550。存储器550可包括高速随机存取存储器和/或非易失性存储器,诸如一个或多个磁盘存储设备、一个或多个光学存储设备和/或闪存存储器(例如,NAND、NOR)。存储器550可存储操作系统552,诸如Darwin、RTXC、LINUX、UNIX、OS X、WINDOWS或嵌入式操作系统(诸如VxWorks)。
操作系统552可包括用于处理基础系统服务以及用于执行硬件相关任务的指令。在一些具体实施中,操作系统552可以是内核(例如,UNIX内核)。在一些具体实施中,操作系统552可包括用于执行语音认证的指令。例如,操作系统552可实现多语言内容分组特征,如参考图1-图4所述。
存储器550还可以存储通信指令554,以促进与一个或多个附加设备、一个或多个计算机和/或一个或多个服务器的通信。存储器550可包括促进图形用户界面处理的图形用户界面指令556;促进与传感器相关的处理和功能的传感器处理指令558;促进与电话相关的过程和功能的电话指令560;促进与电子消息处理相关的过程和功能的电子消息处理指令562;促进与网页浏览相关的过程和功能的网页浏览指令564;促进与媒体处理相关的过程和功能的媒体处理指令566;促进与GNSS和导航相关的过程和指令的GNSS/导航指令568;和/或促进与相机相关的过程和功能的相机指令570。
存储器550可存储软件指令572以促进其他过程和功能,诸如参考图1至图4所述的多语言内容分组过程和功能。
存储器550还可存储其它软件指令574,诸如促进与网络视频相关的方法和功能的网络视频指令;和/或促进与网络购物相关的过程和功能的网络购物指令。在一些具体实施中,媒体处理指令566分为音频处理指令和视频处理指令,以分别用于促进与音频处理相关的过程和功能以及与视频处理相关的过程和功能。
上面所识别的指令和应用程序中的每一者可对应于用于执行上述一个或多个功能的指令集。这些指令不需要作为独立软件程序、进程或模块来实现。存储器550可包括附加指令或更少的指令。此外,可在硬件和/或软件中,包括在一个或多个信号处理和/或专用集成电路中实现计算设备500的各种功能。
为了帮助专利局和本申请中发布的任何专利的任何读者解译所附权利要求书,申请人希望注意到它们并不意欲所附权利要求书中的任一个或权利要求要素调用35U.S.C.112(f),除非在特定权利要求中明确使用字词“用于……的装置”或“用于……的步骤”。

Claims (21)

1.一种方法,所述方法包括:
由用户设备确定与所述用户设备相关联的主要语言;
由所述用户设备确定与所述用户设备相关联的次要语言;
由所述用户设备存储用于将与所述次要语言相关联的第一话题标签翻译为与所述主要语言相关联的第二话题标签的标签语言映射;
由所述用户设备从服务器设备接收加标签的内容项,其中所述加标签的内容项中的每一个与一个或多个话题标签相关联,其中所述加标签的内容项中的至少一个与所述次要语言的至少一个话题标签相关联;
由所述用户设备基于所述标签语言映射来确定所述次要语言的所述至少一个话题标签具有所述主要语言的等效话题标签;
由所述用户设备将所述次要语言的所述至少一个加标签的内容项与所述主要语言的与所述等效话题标签相关联的其他内容项分组在一起;以及
由所述用户设备在所述用户设备的显示器上呈现所分组的内容项,其中所分组的内容项包括所述主要语言的第一内容项和所述次要语言的第二内容项。
2.根据权利要求1所述的方法,所述方法还包括:
由所述用户设备基于所述标签语言映射来将与所述至少一个带标签的内容项相关联的所述次要语言的所述至少一个话题标签翻译为所述主要语言的对应话题标签;以及
由所述用户设备基于所述主要语言的所述对应话题标签来将所述次要语言的所述至少一个加标签的内容项与所述主要语言的其他内容项分组在一起。
3.根据权利要求1所述的方法,所述方法还包括:
由所述用户设备向所述服务器设备发送对所述标签语言映射的请求,所述请求识别所述主要语言和所述次要语言;以及
由所述用户设备接收所述标签语言映射。
4.根据权利要求1所述的方法,所述方法还包括:
由所述用户设备基于所述用户设备的用户的历史内容消费行为来推断所述次要语言。
5.根据权利要求1所述的方法,所述方法还包括:
由所述用户设备从所述服务器设备接收列入白名单的标签,其中所述列入白名单的标签是所述用户设备能够为用户自动订阅的话题标签的排他性集合。
6.根据权利要求5所述的方法,所述方法还包括:
由所述用户设备确定所述用户设备的所述用户已经消费了与特定话题标签相关联的内容;
由所述用户设备确定所述用户当前未订阅以接收与所述特定话题标签相关联的内容;
由所述用户设备确定所述特定话题标签被包括在所述列入白名单的标签中;以及
响应于确定所述特定话题标签被包括在所述列入白名单的标签中,由所述用户设备为所述用户自动订阅以接收与所述特定话题标签相关联的内容。
7.根据权利要求5所述的方法,所述方法还包括:
由所述用户设备确定所述用户设备的所述用户已经消费了与特定话题标签相关联的内容;
由所述用户设备确定所述用户当前未订阅以接收与所述特定话题标签相关联的内容;
由所述用户设备确定所述特定话题标签未被包括在所述列入白名单的标签中;以及
响应于确定所述特定话题标签未被包括在所述列入白名单的标签中,阻止所述用户设备为所述用户自动订阅以接收与所述特定话题标签相关联的内容。
8.一种包括一个或多个指令序列的非暂态计算机可读介质,所述一个或多个指令序列当由一个或多个处理器执行时使得所述处理器执行包括以下各项的操作:
由用户设备确定与所述用户设备相关联的主要语言;
由所述用户设备确定与所述用户设备相关联的次要语言;
由所述用户设备存储用于将与所述次要语言相关联的第一话题标签翻译为与所述主要语言相关联的第二话题标签的标签语言映射;
由所述用户设备从服务器设备接收加标签的内容项,其中所述加标签的内容项中的每一个与一个或多个话题标签相关联,其中所述加标签的内容项中的至少一个与所述次要语言的至少一个话题标签相关联;
由所述用户设备基于所述标签语言映射来确定所述次要语言的所述至少一个话题标签具有所述主要语言的等效话题标签;
由所述用户设备将所述次要语言的所述至少一个加标签的内容项与所述主要语言的与所述等效话题标签相关联的其他内容项分组在一起;以及
由所述用户设备在所述用户设备的显示器上呈现所分组的内容项,其中所分组的内容项包括所述主要语言的第一内容项和所述次要语言的第二内容项。
9.根据权利要求8所述的非暂态计算机可读介质,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备基于所述标签语言映射来将与所述至少一个带标签的内容项相关联的所述次要语言的所述至少一个话题标签翻译为所述主要语言的对应话题标签;以及
由所述用户设备基于所述主要语言的所述对应话题标签来将所述次要语言的所述至少一个加标签的内容项与所述主要语言的其他内容项分组在一起。
10.根据权利要求8所述的非暂态计算机可读介质,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备向所述服务器设备发送对所述标签语言映射的请求,所述请求识别所述主要语言和所述次要语言;以及
由所述用户设备接收所述标签语言映射。
11.根据权利要求8所述的非暂态计算机可读介质,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备基于所述用户设备的用户的历史内容消费行为来推断所述次要语言。
12.根据权利要求8所述的非暂态计算机可读介质,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备从所述服务器设备接收列入白名单的标签,其中所述列入白名单的标签是所述用户设备能够为用户自动订阅的话题标签的排他性集合。
13.根据权利要求12所述的非暂态计算机可读介质,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备确定所述用户设备的所述用户已经消费了与特定话题标签相关联的内容;
由所述用户设备确定所述用户当前未订阅以接收与所述特定话题标签相关联的内容;
由所述用户设备确定所述特定话题标签被包括在所述列入白名单的标签中;以及
响应于确定所述特定话题标签被包括在所述列入白名单的标签中,由所述用户设备为所述用户自动订阅以接收与所述特定话题标签相关联的内容。
14.根据权利要求12所述的非暂态计算机可读介质,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备确定所述用户设备的所述用户已经消费了与特定话题标签相关联的内容;
由所述用户设备确定所述用户当前未订阅以接收与所述特定话题标签相关联的内容;
由所述用户设备确定所述特定话题标签未被包括在所述列入白名单的标签中;以及
响应于确定所述特定话题标签未被包括在所述列入白名单的标签中,阻止所述用户设备为所述用户自动订阅以接收与所述特定话题标签相关联的内容。
15.一种系统,所述系统包括:
一个或多个处理器;以及
非暂态计算机可读介质,所述非暂态计算机可读介质包括一个或多个指令序列,所述一个或多个指令序列当由所述一个或多个处理器执行时使所述处理器执行包括以下项的操作:
由用户设备确定与所述用户设备相关联的主要语言;
由所述用户设备确定与所述用户设备相关联的次要语言;
由所述用户设备存储用于将与所述次要语言相关联的第一话题标签翻译为与所述主要语言相关联的第二话题标签的标签语言映射;
由所述用户设备从服务器设备接收加标签的内容项,其中所述加标签的内容项中的每一个与一个或多个话题标签相关联,其中所述加标签的内容项中的至少一个与所述次要语言的至少一个话题标签相关联;
由所述用户设备基于所述标签语言映射来确定所述次要语言的所述至少一个话题标签具有所述主要语言的等效话题标签;
由所述用户设备将所述次要语言的所述至少一个加标签的内容项与所述主要语言的与所述等效话题标签相关联的其他内容项分组在一起;以及
由所述用户设备在所述用户设备的显示器上呈现所分组的内容项,其中所分组的内容项包括所述主要语言的第一内容项和所述次要语言的第二内容项。
16.根据权利要求15所述的系统,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备基于所述标签语言映射来将与所述至少一个带标签的内容项相关联的所述次要语言的所述至少一个话题标签翻译为所述主要语言的对应话题标签;以及
由所述用户设备基于所述主要语言的所述对应话题标签来将所述次要语言的所述至少一个加标签的内容项与所述主要语言的其他内容项分组在一起。
17.根据权利要求15所述的系统,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备向所述服务器设备发送对所述标签语言映射的请求,所述请求识别所述主要语言和所述次要语言;以及
由所述用户设备接收所述标签语言映射。
18.根据权利要求15所述的系统,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备基于所述用户设备的用户的历史内容消费行为来推断所述次要语言。
19.根据权利要求15所述的系统,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备从所述服务器设备接收列入白名单的标签,其中所述列入白名单的标签是所述用户设备能够为用户自动订阅的话题标签的排他性集合。
20.根据权利要求19所述的系统,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备确定所述用户设备的所述用户已经消费了与特定话题标签相关联的内容;
由所述用户设备确定所述用户当前未订阅以接收与所述特定话题标签相关联的内容;
由所述用户设备确定所述特定话题标签被包括在所述列入白名单的标签中;以及
响应于确定所述特定话题标签被包括在所述列入白名单的标签中,由所述用户设备为所述用户自动订阅以接收与所述特定话题标签相关联的内容。
21.根据权利要求19所述的系统,其中所述指令使得所述处理器执行包括以下各项的操作:
由所述用户设备确定所述用户设备的所述用户已经消费了与特定话题标签相关联的内容;
由所述用户设备确定所述用户当前未订阅以接收与所述特定话题标签相关联的内容;
由所述用户设备确定所述特定话题标签未被包括在所述列入白名单的标签中;以及
响应于确定所述特定话题标签未被包括在所述列入白名单的标签中,阻止所述用户设备为所述用户自动订阅以接收与所述特定话题标签相关联的内容。
CN202080013512.5A 2019-03-22 2020-03-17 基于语义等效话题的内容项的多语言分组 Pending CN113474770A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962822638P 2019-03-22 2019-03-22
US62/822,638 2019-03-22
US16/818,894 US11556714B2 (en) 2019-03-22 2020-03-13 Multi-language grouping of content items based on semantically equivalent topics
US16/818,894 2020-03-13
PCT/US2020/023084 WO2020197841A1 (en) 2019-03-22 2020-03-17 Multi-language grouping of content items based on semantically equivalent topics

Publications (1)

Publication Number Publication Date
CN113474770A true CN113474770A (zh) 2021-10-01

Family

ID=72515385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080013512.5A Pending CN113474770A (zh) 2019-03-22 2020-03-17 基于语义等效话题的内容项的多语言分组

Country Status (4)

Country Link
US (1) US11556714B2 (zh)
EP (1) EP3884401A1 (zh)
CN (1) CN113474770A (zh)
WO (1) WO2020197841A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11704371B1 (en) * 2022-02-07 2023-07-18 Microsoft Technology Licensing, Llc User centric topics for topic suggestions

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0012211D0 (en) 2000-05-19 2000-07-12 Gemstar Dev Limited A targeted advertising system
US20070022134A1 (en) 2005-07-22 2007-01-25 Microsoft Corporation Cross-language related keyword suggestion
US8069182B2 (en) * 2006-04-24 2011-11-29 Working Research, Inc. Relevancy-based domain classification
US9129225B2 (en) 2011-05-25 2015-09-08 Nokia Technologies Oy Method and apparatus for providing rule-based recommendations
US9569421B2 (en) 2012-10-31 2017-02-14 Excalibur Ip, Llc Method and system for improved language identification using language tags
US9959364B2 (en) 2014-05-22 2018-05-01 Oath Inc. Content recommendations
US9661100B2 (en) 2014-06-30 2017-05-23 Yahoo! Inc. Podcasts in personalized content streams
US20170279905A1 (en) 2016-03-24 2017-09-28 Jive Software, Inc. Influence analysis of interactive content
US10789316B2 (en) 2016-04-08 2020-09-29 Pearson Education, Inc. Personalized automatic content aggregation generation
US10831801B2 (en) * 2017-05-12 2020-11-10 International Business Machines Corporation Contextual-based high precision search for mail systems

Also Published As

Publication number Publication date
US11556714B2 (en) 2023-01-17
EP3884401A1 (en) 2021-09-29
US20200302121A1 (en) 2020-09-24
WO2020197841A1 (en) 2020-10-01

Similar Documents

Publication Publication Date Title
US12074954B2 (en) Generating application configurations based on user engagement segments
US11475029B2 (en) Presenting user information suggestions
CN107209905B (zh) 针对个性化和任务完成服务而对应用去主题归类
CN114141329A (zh) 保护隐私的个性化健身推荐
US11900057B2 (en) Correcting input based on user context
US20220019689A1 (en) Privacy Preserving Server-Side Personalized Content Selection
US9930162B2 (en) Techniques for enhancing content on a mobile device
US10681162B2 (en) Segmenting users based on user engagement
US11281735B2 (en) Determining importance of investment identifier to content of content item
US12013906B2 (en) Client-side personalization of search results
US10693986B2 (en) Notification extensions for applications
US20160077673A1 (en) Intelligent Canvas
US9065872B1 (en) Sharing service management
US12041309B2 (en) Screen recording from a remote device
US11232171B2 (en) Configuring applications using multilevel configuration
US11556714B2 (en) Multi-language grouping of content items based on semantically equivalent topics
US11899731B2 (en) Personalized translation of content identifiers
US10528709B1 (en) Notifying applications of screen recording
US11650867B2 (en) Providing access to related content in media presentations
US20220413685A1 (en) Electronic device for folder operation, and operating method therefor
US9848287B1 (en) Adaptable schema based payloads
CN116324676A (zh) 联系人自动完成键盘

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination