CN107526761B - 用于识别并为用户呈现多语言媒体内容项目的方法、系统和介质 - Google Patents

用于识别并为用户呈现多语言媒体内容项目的方法、系统和介质 Download PDF

Info

Publication number
CN107526761B
CN107526761B CN201611242924.8A CN201611242924A CN107526761B CN 107526761 B CN107526761 B CN 107526761B CN 201611242924 A CN201611242924 A CN 201611242924A CN 107526761 B CN107526761 B CN 107526761B
Authority
CN
China
Prior art keywords
content item
video content
language
user
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611242924.8A
Other languages
English (en)
Other versions
CN107526761A (zh
Inventor
马塞尔·菲利普·戈登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN107526761A publication Critical patent/CN107526761A/zh
Application granted granted Critical
Publication of CN107526761B publication Critical patent/CN107526761B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2668Creating a channel for a dedicated end-user group, e.g. insertion of targeted commercials based on end-user profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/278Content descriptor database or directory service for end-user access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及用于识别并为用户呈现多语言媒体内容项目的方法、系统和介质。在一些实施例中,该方法包括:接收视频内容项目;识别与该视频内容项目相关联的第一语言;识别该视频内容项目内的内容;基于所识别的该视频内容项目内的内容确定该视频内容项目是并非是语言特定的多语言内容项目的可能性;接收针对媒体内容的请求;确定与该针对媒体内容的请求相关联的第二语言,其中该第二语言不同于该第一语言;响应于确定不同于该第一语言的该第二语言,基于所确定的可能性确定是否呈现该媒体内容项目;并且响应于该针对媒体内容的请求,使得该视频内容项目响应于确定该视频内容项目被认为是并非是语言特定的多语言内容而被呈现。

Description

用于识别并为用户呈现多语言媒体内容项目的方法、系统和 介质
技术领域
所公开的主题涉及用于识别并为用户呈现多语言媒体内容项目的方法、系统和介质。
背景技术
许多用户从具有大量集合的视频内容项目的服务访问视频内容。这些集合经常包括已经由来自各个国家的用户所上传并且包含各种语言的音频内容和/或文本内容的视频内容。这样,视频内容可能会被提供给可能无法理解所述内容的用户。对于一些视频内容而言,对于这些服务来讲,为用户呈现包含了以所述用户所能够理解的语言的音频和/或文本内容的视频内容可能是很重的。
在一些情况下,这些集合包含的视频内容既不含有口头和/或文本内容或者又有可能被认为对于不能理解所述口头和/或文本内容的特定语言的用户而言是可以享用的。然而,这些服务通常并无法轻易地为用户提供针对这种以不同于用户的语言的语言的内容的访问。例如,视频提供服务可以基于用户所标示的特定语言偏好,基于国家地域扩展,和/或基于特定于国家的网站而对包括视频内容项目的搜索结果进行排名。在另一个示例中,视频提供服务可以从搜索结果的列表中去除包括以不同于用户所标示的语言偏好的语言的内容的视频内容。
因此,期望提供一种用于识别并为用户呈现多语言媒体内容项目的新的方法、系统和媒体。
发明内容
提供了用于识别并为用户呈现多语言媒体内容项目的方法、系统和媒体。
依据所公开主题的一些实施例,提供了一种用于为用户呈现媒体内容项目的方法,所述方法包括:接收视频内容项目;使用硬件处理器识别与所述视频内容项目相关联的第一语言;识别所述视频内容项目内的内容;基于所识别的所述视频内容项目内的内容确定所述视频内容项目是并非是语言特定的多语言内容项目的可能性;接收针对媒体内容的请求;确定与所述针对媒体内容的请求相关联的第二语言,其中所述第二语言不同于所述第一语言;响应于确定不同于所述第一语言的所述第二语言,基于所确定的可能性确定是否呈现所述媒体内容项目;并且响应于所述针对媒体内容的请求,使得所述视频内容项目响应于确定所述视频内容项目被认为是并非是语言特定的多语言内容而被呈现。
在一些实施例中,识别所述视频内容分段内的内容进一步包括:识别与所述视频内容项目相关联的音频内容中所包含的单词,并且识别与所述视频内容项目相关联的图像内容中所包含的单词。
在一些实施例中,所述方法进一步包括响应于针对媒体内容的请求而使得包括所述视频内容项目的多个视频内容项目得以被呈现并且同时呈现语言指示符,其中与所述视频内容项目相关联的语言指示符指示所述视频内容项目是多语言内容。
在一些实施例中,识别所述视频内容项目内的内容进一步包括取回与所述视频内容项目相关联的元数据,其中所述元数据包括字幕元数据。
在一些实施例中,确定与所述视频内容项目相关联的第一语言的方法进一步包括取回与所述视频内容项目相关联的元数据,其中所述元数据包括与所述视频内容项目相关联的语言标识符。
在一些实施例中,确定与所述视频内容项目相关联的第一语言进一步包括确定与上传了所述视频内容项目的用户设备相关联的位置。
在一些实施例中,基于所述视频内容项目内所识别内容中的单词的数量而确定所述视频内容项目是多语言内容的可能性。
在一些实施例中,基于所述视频内容项目内所识别内容中的单词的密度而确定所述视频内容项目是多语言内容的可能性。
在一些实施例中,确定所述视频内容项目是多语言内容的可能性进一步包括将所确定的可能性与多语言阈值分数进行比较。
在一些实施例中,确定所述视频内容项目是多语言内容的可能性进一步包括确定与涉及所述视频内容项目的内容相关联的多语言内容标识符。
在一些实施例中,所述方法进一步包括:接收针对被确定为多语言内容的视频内容项目的用户反应元数据;并且基于所接收到的用户反应元数据更新所确定的可能性。
在一些实施例中,所述用户反应元数据包括所述视频内容项目在停止之前被呈现的时间量。
在一些实施例中,所述方法进一步包括:基于与提供所述用户反应元数据的用户设备相关联的语言标识符,来选择所述用户反应元数 据的一部分;并且基于所选择的该部分的用户反应元数据来更新所确定的可能性。
在一些实施例中,所述方法进一步包括:在所述视频内容项目被呈现的同时,使得呈现用于查询所述视频内容项目是否为多语言内容的推荐提示。
依据所公开主题的一些实施例,提供了一种用于为用户呈现媒体内容的系统,所述系统包括硬件处理器,其被配置为:接收视频内容项目;识别与所述视频内容项目相关联的第一语言;识别所述视频内容项目内的内容;基于所识别的所述视频内容项目内的内容确定所述视频内容项目是并非是语言特定的多语言内容项目的可能性;接收针对媒体内容的请求;确定与所述针对媒体内容的请求相关联的第二语言,其中所述第二语言不同于所述第一语言;响应于确定不同于所述第一语言的所述第二语言,基于所确定的可能性确定是否呈现所述媒体内容项目;并且响应于所述针对媒体内容的请求,使得所述视频内容项目响应于确定所述视频内容项目被认为是并非是语言特定的多语言内容而被呈现。
依据所公开主题的一些实施例,提供了一种包含计算机可执行指令的非瞬态计算机可读存储介质,所述计算机可执行指令在被处理器所执行时使得所述处理器实施一种用于为用户呈现媒体内容的方法,所述方法包括:接收视频内容项目;识别与所述视频内容项目相关联的第一语言;识别所述视频内容项目内的内容;基于所识别的所述视频内容项目内的内容确定所述视频内容项目是并非是语言特定的多语言内容项目的可能性;接收针对媒体内容的请求;确定与所述针对媒体内容的请求相关联的第二语言,其中所述第二语言不同于所述第一语言;响应于确定不同于所述第一语言的所述第二语言,基于所确定的可能性确定是否呈现所述媒体内容项目;并且响应于所述针对媒体 内容的请求,使得所述视频内容项目响应于确定所述视频内容项目被认为是并非是语言特定的多语言内容而被呈现。
依据所公开主题的一些实施例,提供了一种用于为用户呈现媒体内容的系统,所述系统包括:用于接收视频内容项目的装置;用于识别与所述视频内容项目相关联的第一语言的装置;用于识别所述视频内容项目内的内容的装置;用于基于所识别的所述视频内容项目内的内容确定所述视频内容项目是并非是语言特定的多语言内容项目的可能性的装置;用于接收针对媒体内容的请求的装置;用于确定与所述针对媒体内容的请求相关联的第二语言的装置,其中所述第二语言不同于所述第一语言;用于响应于确定不同于所述第一语言的所述第二语言,基于所确定的可能性确定是否呈现所述媒体内容项目的装置;和用于响应于所述针对媒体内容的请求,使得所述视频内容项目响应于确定所述视频内容项目被认为是并非是语言特定的多语言内容而被呈现的装置。
附图说明
在结合以下附图进行考虑时,所公开主题的各种目标、特征和优势能够参考所公开主题的以下详细描述而被更为全面地理解,其中同样的附图标记识别同样的要素。
图1示出了依据所公开主题的一些实施例的用于向与许多不同语言中的任意语言相关联的用户呈现作为搜索结果的视频内容项目(包括被认为是多语言内容项目的内容项目)的用户界面的示例。
图2示出了依据所公开主题的一些实施例的适用于这里所描述的用于识别并为用户呈现多语言媒体内容项目的机制的实施方式的说明性系统的示意图。
图3示出了依据所公开主题的一些实施例的能够在图2的服务器和/或用户设备中使用的硬件的详细示例。
图4示出了依据所公开主题的一些实施例的用于确定视频内容项目是多语言内容项目的可能性的处理的示例。
图5示出了依据所公开主题的一些实施例的用于为与许多不同语言中的任意语言相关联的用户呈现媒体内容项目(包括被认为是多语言内容项目的内容项目)的处理的示例。
具体实施方式
依据所公开主题的各个实施例,提供了用于识别并为用户呈现多语言媒体内容项目的机制(其可以包括方法、系统和介质)。
在所公开的主题的一些实施例中,这里所述的机制能够:通过确定视频内容项目是否包含单词以及以在何种程度上包含单词,而确定该视频内容项目对于表述或理解与关联于该视频内容项目的语言不同的语言的用户而言是否有可能被享用(例如,该视频内容项目可能不是语言特定的或者可以被认为是多语言内容项目)。例如,具有来自标题元数据的以英文书写的标题并且从根据用户资料数据已经指示了英语的语言偏好的用户所上传的视频内容在该视频内容项目内却可能并不包含话音内容和文本内容。在另一个示例中,视频内容项目能够被上传,其中英语的语音标识符已经与该视频内容项目相关联,但是该视频内容项目内却可能包含少于阈值数量的话音内容和少于阈值数量的文本内容。在这样的示例中,这些机制能够确定该视频内容项目并不包含单词并且因此该视频内容项目可能能够由并不讲英语的用户所享用。在一些实施例中,该机制能够指示该视频内容项目是多语言内容项目(例如,多语言标识符)。该机制随后例如能够为并不讲英语或不理解英语的用户(例如,具有包括非英语语言偏好的用户资料的用户,已经访问了视频提供网站的非英语版本的用户,等等)在搜索结果和/或推荐中呈现该多语言视频内容项目。
在一些实施例中,在确定视频内容项目可能并非是语言特定(例如,不依赖语言型、语言不可知型、和/或其它方式的多语言内容)并且为讲许多不同语言中的任意语言的用户呈现该视频内容项目时,这里所描述的机制能够确定那些用户针对该视频内容项目的反应并且根 据他们的反应更新该视频内容项目并非是语言特定的可能性。例如,用户利用西班牙语搜索术语搜索视频内容项目,则该机制能够为用户呈现与英语相关联的视频内容项目(例如,由具有英语语言偏好的用户账户所上传的视频内容项目)和/或与多语言标识符相关联的视频内容项目。在这样的示例中,如果用户选择了该视频内容项目并且使得其进行播放,但是确定该用户仅在短时间(例如,几秒钟)后就停止了该视频内容项目,则该机制能够确定该视频内容项目仅被短时间播放并且相应地更新该视频内容项目并非是语言特定的可能性(例如,通过减小该视频内容项目为不依赖语言型、语言不可知型、和/或以其它方式的多语言内容的可能性)。在这样的示例中,该机制随后在与包含非英语搜索术语的搜索相关联的搜索结果中以较不频繁的方式呈现该视频内容项目。
转向图1,依据所公开主题的一些实施例而图示了用于向与许多不同语言中的任意语言相关联的用户呈现作为搜索结果的视频内容项目的用户界面的示例100。如所示出的,在一些实施例中,用户界面100能够包括搜索要素102、一个或多个可选择视频内容要素104,以及视频内容元数据106,后者可以包括视频内容信息文本108和语言图标110。
搜索要素102可以是用于用户界面100的任意适当搜素要素。在一些实施例中,搜索要素102可以包括任意适当的图标、链接和/或任意其它适当对应用户界面要素。注意到,搜索要素102在用户界面100中的位置仅是作为示例,并且搜索要素102能够位于任意适当的位置。在一些实施例中,搜索要素102能够被省略。
可选择视频内容项目104可以是适于在用户界面100中表示视频内容项目的任意可选择要素。在一些实施例中,可选择视频内容项目104可以是适于使得相关联的视频内容项目得以被播放的任意可选择要素。例如,可选择视频内容项目104可以是超级链接、可选择图标、可 选择照片、任意其它适当的可选择要素,或者它们的任意适当组合。在一些实施例中,可选择视频内容项目104可以包可任意适当数量的可选择视频内容要素(例如,一个、两个、五个、是个和/或任意其它适当数量)。在一些实施例中,可选择视频内容项目104可以以任意适当位置、组合、模式或排列被呈现于用户界面100中。在一些实施例中,可选择视频内容项目104能够被省略。
视频内容元数据106和视频内容信息108可以包括任意适当的信息。例如,在一些实施例中,视频内容元数据106和视频内容信息108可以包括标题、与视频内容项目相关联的日期、视频内容项目的长度、任意其它适当信息,或者它们的任意适当组合。在一些实施例中,视频内容元数据106和/或视频内容信息108能够被省略。
语言图标110可以是与一个或多个视频内容项目104相关联的语言的任意适当表示形式。例如,如图1所示,语言图标110可以包括标示出与相对应的视频内容项目相关联的语言的信息。在这样的示例中,语言图标可以包含能够表示相关联的视频内容项目包含西班牙语内容的字母“ES”,能够表示相关联的视频内容项目包含法语内容的字母“FR”,和/或能够表示相关联的视频内容项目包含英语内容的字母“EN”。在一些实施例中,与多种语言相关联的视频内容项目能够由主要语言或者被确定为在该视频内容项目内所包含的内容中使用最多的语言所表示。在一些实施例中,与一个或多个视频内容项目104相关联的语言能够在元数据中进行表示而并不在用户界面100中显示。
在一些实施例中,如这里所描述的,响应于确定视频内容项目是多语言内容项目,语言图标110可以包括标示出多语言内容标识符已经与相对应的视频内容项目相关联的信息,诸如图1所示的字母“ALL”。应当注意的是,能够示出任意适当的语言图标来标示出内容项目是语言不可知型的、不依赖语言型的或者以其它方式被认为是多语言的内容。
转向图2,示出了能够依据所公开主题的一些实施例的用于识别并为用户呈现多语言媒体内容项目的硬件的示例200。如所图示的,硬件200可以包括一个或多个服务器,诸如内容服务器202和数据服务器204,以及通信网络210,和/或一个或多个用户设备212,诸如用户设备214和216。
在一些实施例中,内容服务器202可以是用于存储媒体内容并且向用户设备212传递内容的任意适当服务器。例如,内容服务器202可以是经由通信网络210向用户设备212流传输媒体内容的服务器。内容服务器202所提供的媒体内容可以是任意适当内容,诸如视频内容、音频内容、电子书、文档、图像和/或任意其它适当类型的媒体内容。作为更为具体的示例,媒体内容可以包括电视节目、电影、卡通、声效、流直播内容(例如,流广播节目、直播音乐会和/或任意其它适当类型的流直播内容),和/或任意其它适当类型的媒体内容。媒体内容能够由任意适当实体所创建并上传至内容服务器202。在一些实施例中,内容服务器202能够被省略。
在一些实施例中,数据服务器204可以是用于存储和/或传送与一个或多个视频内容项目相关的信息的任意适当服务器。作为更为具体的示例,在一些实施例中,数据服务器204能够存储和/或传送视频内容元数据。作为另一个更为具体的示例,在一些实施例中,数据服务器204能够存储和/或传送与一个或多个视频内容项目并非是语言特定的可能性相关的信息。在该示例中,每个内容项目能够与多语言内容标识符相关联,其中,在该可能性大于特定阈值时指定“1”而在其它情况下则指定为“0”。作为又另一个更为具体的示例,在一些实施例中,数据服务器204能够存储和/或传送与关联于某些语言(例如,语言偏好标识符)的用户如何对关联于与和该用户相关联的语言偏好标识符相同的语言和/或不同语言的视频内容项目作出反应相关的信息。在一些实施例中,数据服务器204能够被省略。
通信网络210在一些实施例中可以是一种或多种有线和/或无线网络的任意适当组合。例如,通信网络210可以包括互联网、企业内部网、广域网(WAN)、局域网(LAN)、无线网、数字订户线路(DSL)网络、帧中继网络、异步传输模式(ATM)网络、虚拟专用网络(VPN)和/或任意其它适当通信网络中的任意一种或多种。用户设备212能够通过一个或多个通信链路218而连接至通信网络210,后者能够经由一个或多个通信链路(例如,通信链路220和/或222)链接至内容服务器202和数据服务器204。通信链路218、220和/或222可以是适于在用户设备212和服务器202和/或204之间传输数据的任意通信链路,诸如网络链路、拨号链路、无线链路、硬线链路、任意其它适当通信链路,或者这样的链路的任意适当组合。
用户设备212可以包括适用于请求媒体内容、搜索媒体内容、播放媒体内容、接收播放媒体内容的输入、提供媒体内容偏好(例如,语言偏好、口头语言偏好、书写语言偏好等)和/或任意其它适当功能的任意一个或多个用户设备。例如,在一些实施例中,用户设备212可以被实施为移动设备,诸如移动电话、平板计算机、膝上计算机、交通工具(例如,汽车、船只、飞机或者任意其它适当交通工具)娱乐系统、便携式媒体播放器,和/或任意其它适当移动设备。作为另一个示例,在一些实施例中,用户设备212可以被实施为非移动设备,诸如台式计算机、机顶盒、电视机、流媒体播放器、游戏机,和/或任意其它适当的非移动设备。
虽然内容服务器202和数据服务器204被图示为分立的设备,但是内容服务器202和数据服务器204所执行的功能在一些实施例中能够使用任意适当数量的设备来执行。例如,在一些实施例中,内容服务器202或数据服务器204所执行的功能能够在单个服务器上执行。作为另一个示例,在一些实施例中,能够使用多个设备来实施内容服务器202和/或数据服务器204所执行的功能。
虽然图2中示出了两个用设备214和216以免使得示图过于复杂,但是在一些实施例中能够使用任意适当数量的用户设备和/或任意适当类型的用户。
内容服务器202、数据服务器204和用户设备212在一些实施例中能够使用任意适当硬件来实施。例如,在一些实施例中,设备202、204和212能够使用任意适当的通用计算机或专用计算机来实施。作为另一个示例,移动电话可以使用专用计算机来实施。任何这样的通用计算机或专用计算机都能够包括任意适当的硬件。例如,转向图3,如示例硬件300中所示,这样的硬件可以包括硬件处理器302、存储器和/或存储部304、输入设备控制器306、输入设备308、显示/音频驱动器310、显示和音频输出电路312、(多个)通信接口314、天线316和总线318。
硬件处理器302可以包括任意适当的硬件处理器,在一些实施方式中诸如微处理器、微控制器、(多个)数字信号处理器、专用逻辑,和/或用于控制通用计算机或专用计算机的功能的任意其它适当电路。在一些实施例中,硬件处理器302能够由存储在服务器(例如,诸如服务器202或204之一)的存储器和/或存储部304中的服务器程序所控制。例如,该服务器程序能够使得硬件处理器302执行如这里所描述的用于向与任意的许多不同语言相关联的用户呈现媒体内容项目的机制和/或执行任意其它适当动作。在一些实施例中,硬件处理器302能够由存储在用户设备212的存储器和/或存储部304中的计算机程序所控制。例如,该计算机程序能够使得硬件处理器302呈现媒体内容项目、请求媒体内容项目,和/或执行这里所描述的用于识别并向用户呈现多语言媒体内容项目的机制。
存储器和/或存储部304可以是在一些实施方式中用于存储应用信息、程序、数据、媒体内容和/或任意其它适当内容的任意适当存储器 和/或存储部。例如,存储器和/或存储部304可以包括随机访问存储器、只读存储器、闪存、硬盘存储、光学媒体和/或任意其它适当存储设备。
在一些实施方式中,输入设备控制器306可以是用于控制一个或多个输入设备308并且从其接收输入的任意适当电路。例如,输入设备控制器306能够是用于从触摸屏、从键盘、从鼠标、从一个或多个按钮、从语音识别电路、从麦克风、从相机、从光学传感器、从加速计、从温度传感器、从近场传感器和/或任意其它类型的输入设备接收输入的电路。
在一些实施方式中,显示/音频驱动器310可以是用于控制一个或多个显示/音频输出设备312并且驱动针对其的输出的任意适当电路。例如,显示/音频驱动器310可以是用于驱动触摸屏、平板显示器、阴极射线管显示器、投影仪、一个或多个扬声器和/或任意其它适当的显示和/或呈现设备的电路。
(多个)通信接口314可以是用于与一个或多个通信网络进行对接的任意适当电路,上述通信网络诸如图2所示的网络210。例如,(多个)接口314可以包括网络接口卡电路、无线通信电路,和/或任意其它适当类型的通信网络电路。
天线316可以是用于与通信网络(例如,通信网络210)进行无线通信的任意适当的一个或多个天线。在一些实施方式中,天线316可以被省略。
在一些实施例中,总线318可以是用于在组件302、304、306、310和314中的两个或更多之间进行通信的任意适当机制。
依据一些实施方式,硬件300中能够包括任意其它适当的组件。
转向图4,依据所公开主题的一些实施例而示出了用于识别并为用户呈现多语言媒体内容项目的处理的说明性示例400。
在一些实施例中,过程400能够由任意设备或设备的组合所执行。例如,过程400能够至少部分由内容服务器202、数据服务器204、一个或多个用户设备212和/或任意其它适当设备所执行。
过程400能够在402通过接收与第一语言相关联的视频内容项目作为开始。在一些实施例中,过程400能够使用任意适当技术或技术的组合来接收视频内容项目。例如,过程400能够在内容服务器202和/或数据服务器204利用通信网络210从用设备212接收视频内容项目。在这样的示例中,用户设备212能够利用用于访问与过程400相关联的服务的应用、web浏览器和/或任意其它适当的软件应用。在另一个示例中,过程400能够接收多个内容项目以便上传至用户所生成的播放列表、内容项目频道或者任意其它适当位置,该内容项目能够在那里由媒体服务的用户所访问并播放。
在一些实施例中,过程400能够确定所接收的视频内容项目与第一语言相关联。在一些实施例中,过程400能够使用任意适当的信息来确定所接收的视频内容项目与第一语言相关联。例如,过程400能够基于用户信息来确定所接收的视频内容项目与第一语言相关联,上述用户信息诸如包含在cookie文件、用户资料、用户偏好和/或任意其它适当的用户信息来源中所包含的信息。在这样的示例中,用户信息的来源能够与网站、web浏览器、移动设备应用和/或任意其它适当的用户信息来源相关联。作为更为具体的示例,用户信息的来源可以是与web浏览器相关联的用户偏好,并且该用户偏好中能够有语言偏好,诸如西班牙语语言偏好。在这样更为具体的示例中,基于该用户信息,过程400能够确定所接收的视频内容项目与西班牙语相关联。
在一些实施例中,过程400能够使用与所接收的视频内容项目相关联的元数据来确定所接收的视频内容项目与第一语言相关联。例如,在接收到与元数据相关联的视频内容项目时,过程400能够确定该元数据是否包含识别该视频内容项目中所包含内容的语言的信息并且确定该视频内容项目与这样的语言相关联。作为更为具体的示例,如果视频内容项目与识别该视频内容项目中所包含内容的语言为英语的元数据相关联,则过程400能够将该视频内容项目与英语语言标识符进行关联。作为另一个更为具体的示例,如果视频内容项目与指示该视频内容项目包含意大利语字幕的元数据相关联,则过程400能够将该视频内容项目与意大利语语言标识符进行关联。除此之外或可替换地,过程400能够确定哪种语言在视频内容项目内更为普遍(例如,音频内容中的口头英语和字幕内容中的意大利语文本)并且选择适当的语言标识符。在一些实施例中,过程400能够为视频内容项目指定多个语言标识符(例如,英语语言标识符和意大利语语言标识符)。
在一些实施例中,过程400能够基于被用来上传所接收视频内容项目的用户设备的位置来确定所接收的视频内容项目与第一语言相关联。例如,过程400能够确定被用来上传该视频内容项目的用户设备的互联网协议地址(IP地址)与法国的一个地区相关联,并且基于与该IP地址相关联的位置而将该视频内容项目与法语语言标识符进行关联。作为另一个示例,过程400能够接收到被用来上传视频内容项目的用户设备的地理坐标(例如,使用全球定位系统所确定),确定该地理坐标对应于美国的位置,并且基于该坐标将该视频内容项目与英语语言标识符进行关联。
应当注意的是,在接收视频内容项目之前,这些机制将为用户提供以对利用用户信息提供同意和/或授权的机会,诸如接收用户设备的地理坐标以及利用来自cookie文件、用户资料和/或用户偏好的用户信息。例如,在加载应用以便播放诸如移动设备的计算设备上的媒体内容时,这样的应用能够提示用户提供该同意和/或授权。在更为具体的 示例中,响应于下载了用于播放媒体内容的应用并且在计算设备上加载该应用,用户能够被提示有用于请求(或要求)该用户针对该机制利用用户信息提供同意和/或授权的消息。
在404,过程400能够使用任意技术或技术组合来识别视频内容的音频和/或图像数据中的内容。例如,过程400能够利用任意适当的话音识别技术或者用于针对任意一种或多种适当语言而识别音频数据中的单词的技术来识别视频内容项目的音频数据中的单词。在这样的示例中,过程400能够识别音频数据中的一个单词、多个单词或者无单词。此外,在这样的示例中,过程400能够从视频内容项目的音频数据的任意部分识别单词,诸如视频内容项目的音频数据的第一部分、最后部分或者其全部。作为另一个示例,过程400能够利用任意适当的文本识别技术或者用于针对任意一种或多种适当语言识别图像数据中的单词的技术来识别视频内容项目的图像数据中的单词。作为更为具体的示例,过程400能够利用光学字符识别、智能字符识别和/或任意其它适当的文本识别处理。
在406,过程400能够确定该视频内容项目是多语言内容项目的可能性(例如,将该内容项目指定为不依赖语言型或语言不可知型的)。在一些实施例中,过程400能够使用任意适当的技术或技术组合和/或任意适当的信息来确定该视频内容项目并非是语言特定的可能性。例如,过程400能够基于在404从该视频内容项目所识别的单词的存在而确定该视频内容项目并非是语言特定的可能性。作为更为具体的示例,如果在404没有识别出单词或者如果单词非常少(例如,少于阈值单词数量),则过程400能够确定该视频内容项目可能并非是语言特定并且指示该视频内容项目是多语言内容项目(例如,使用与该视频内容项目相关联的多语言标识符)。作为另一个更为具体的示例,如果在404识别出许多单词(例如,多于阈值单词数量),则过程400能够确定该视频内容项目可能是是语言特定的。
在一些实施例中,过程400能够基于在404所识别单词的数量来确定该视频内容项目并非是语言特定的可能性。例如,过程400能够确定视频内容项目中的原始单词数量。作为更为具体地实例,该原始单词数量能够与预先确定的阈值单词数量进行比较。在这样的更为具体的示例中,如果原始单词数量超过预先确定的阈值单词数量,则过程400能够确定该视频内容项目可能是是语言特定的。作为另一个更为具体的示例,过程400能够基于视频内容项目的原始单词数量和持续时间来确定该视频内容项目的单词密度。在这样的另一个更为具体的示例中,过程400能够将视频内容项目的单词密度与预先确定的阈值单词密度进行比较以便确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。
在一些实施例中,过程400能够计算指示视频内容项目是多语言内容项目(例如,不依赖语言型或语言不可知型)的可能性的可能性分数。在一些实施例中,过程400能够计算范围处于任意数值之间的可能性分数。例如,该可能性分数可以是从0至1的范围内的任意数值。在一些实施例中,过程400能够计算可能性分数,而使得高的可能性分数指示视频内容项目是并非是语言特定的多语言内容项目为高可能性(例如,可以被与许多语言中的任意语言相关联的用户所享用),而低的可能性分数则指示该视频内容项目是多语言内容项目为低可能性。
在一些实施例中,过程400能够基于视频内容项目包含如在404所识别的单词的时间的一部分,来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。例如,如果该视频内容项目中的大部分都包含特定语言的口头单词,则过程400能够确定该视频内容项目很可能是是语言特定的(例如,可以被与对应于该视频内容项目中所讲语言的语言标识符相关联的用户所享用)。在更为具体的示例中,如果该视频内容项目中的75%包含特定语言的口头单词,则过程400该视频内容项目很可能是是语言特定的。
在一些实施例中,过程400能够基于视频内容项目中在404所识别的单词的密度,来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。例如,如果过程400在404识别出100个单词并且该视频内容项目的长度为5分钟,则过程400能够确定在404所识别的单词的密度为每分钟20个单词。在这样的示例中,过程400能够基于该每分钟20个单词的单词密度,来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。
在一些实施例中,过程400能够基于用户输入来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。例如,过程400能够为一个或多个用户设备的一个或多个用户呈现视频内容项目,并且呈现请求该用户设备的用户指示该视频内容项目是否是语言特定的查询。更具体地,该查询能够请求用户设备的用户选择或识别应当与该视频内容项目相关联的特定语言。在这样的示例中,过程400能够基于用户设备的用户中的指示该视频内容项目是语言特定的比例,来确定该视频内容项目是语言特定的可能性。作为更为具体的示例,过程400能够向10个用户设备的用户呈现视频内容项目,并且如果9个用户指示该视频内容项目是语言特定,则过程400能够确定该视频内容项目是语言特定是有高的可能性。
在一些实施例中,过程400能够基于在404所识别的有关内容的多种因素,来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。例如,过程400能够基于在404所识别的音频数据中的内容的振幅,来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。在这样的示例中,过程400能够将高振幅的单词与该视频内容项目是语言特定的高可能性进行关联。作为另一个示例,过程400能够基于在404所识别的音频数据中的单词相对于音频数据中的其它声音的振幅的振幅,来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。在这样的示例中,过程400能够响应于确定在404 所识别的音频数据中的单词的振幅相对于音频数据中的其它声音的振幅很高而确定该视频内容项目是语言特定是高可能性。作为更为具体的示例,如果该视频内容项目是电视情景喜剧,则过程400能够确定在该电视情景喜剧中所识别的单词的振幅(例如,该电视情景喜剧中的演员之间的对话)相对于音频数据中的非口语音频(例如,声效)很高,并且确定该视频内容项目很可能是是语言特定的。作为另一个示例,过程400能够识别与所识别单词相关联的音频频率。作为更为具体的示例,过程400能够将某些音频频率(例如,音符)的存在与该视频内容项目是语言特定的任意适当可能性进行关联。
在一些实施例中,过程400能够利用音频指纹和/或数字视频指纹,来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。例如,过程400能够利用任意适当的音频指纹和/或数字指纹技术或技术组合来识别该视频内容项目的内容,并且基于所识别的内容来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。作为更为具体的示例,过程400能够将视频内容项目的内容识别为特定电视节目,并且基于被识别为该特定电视节目的另外一个或多个视频内容项目也并非是语言特定的预定可能性,来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。作为另一个更为具体的示例,过程400能够将视频内容项目的内容识别为特定艺术家的歌曲,并且基于被识别为该特定艺术家的歌曲的另外一个或多个视频内容项目也并非是语言特定的预定可能性,来确定该视频内容项目是并非是语言特定的多语言内容项目的可能性。
在408,过程400能够基于所确定的该视频内容项目是并非是语言特定的多语言内容项目的可能性,而使得该视频内容项目得以在与402处的和所述视频内容项目相关联的第一语言不同的语言相关联的针对用户的推荐和/或搜索结果中被呈现。在一些实施例中,过程400能够使用任意适当技术或技术组合和/或任意适当信息而使得该视频内容项目得以在搜索结果和/或推荐中被呈现。例如,如果过程400在406确定视 频内容图像很可能是并非是语言特定的多语言内容项目,则过程400能够使得该视频内容项目得以在针对与许多不同语言中的任意语言相关联的用户的推荐和/或搜索结果中被呈现,和/或不考虑与该搜索和/或推荐请求相关联的用户的语言。作为另一个示例,如果过程400在406确定视频内容图像可能是语言特定,则过程400能够禁止或防止该视频内容项目在针对与和关联于该视频内容项目的语言不同的语言相关联的用户的推荐和/或搜索结果中被呈现。作为又另一个示例,如果过程400确定该视频内容项目具有是语言特定的适度可能性,则过程400能够使得该视频内容项目得以在针对与许多不同语言中的任意语言相关联的一些用户的推荐和/或搜索结果中被呈现,但是并不向其它这样的用户进行呈现(例如,过程400使得视频内容项目被呈现给测试用户群组)。
在一些实施例中,过程400能够利用任意适当的用户界面而使得视频内容项目得以在搜索结果和/或推荐中被呈现。例如,过程400能够使得视频内容项目得以在如图1所示的用户界面100中被呈现。在这样的示例中,过程400能够使得视频内容项目被呈现为可选择视频内容要素104之一,并且能够进一步使得一个或多个语言图标110被呈现。在更为具体的示例中,一个或多个语言图标110能够表示与在402与视频内容项目相关联的第一语言。在再更为具体的示例中,如果与视频内容项目相关联的第一语言为英语,则如图1所示,相对应的语言图标能够显示“EN”。在另一个更为具体的示例中,语言图标110能够表示如在406所确定的该视频内容项目可能是并非是语言特定的多语言内容项目。在另一个再更为具体的示例中,如果过程400在406确定该视频内容项目可能是并非是语言特定的多语言内容项目,则如图1所示,相对应的语言图标能够显示“ALL”。
在一些实施例中,过程400能够使得视频内容项目得以作为该视频内容项目的任意适当表示形式在搜索结果和/或推荐中被呈现。例如,该视频内容项目可以被呈现为图像、可选择图标、超级链接、网页菜 单项、广告、缩略图,视频内容项目的任意其它适当表示形式,或者它们的任意适当组合。
在一些实施例中,过程400能够出于任意适当的原因而呈现视频内容项目。例如,过程400能够响应于针对视频内容的请求而呈现视频内容项目。在另一个示例中,过程400能够将视频内容项目作为一系列视频内容项目(例如,播放列表)的一部分进行呈现。在又另一个示例中,过程400能够将视频内容项目作为针对用户的推荐(例如,表示所推荐内容项目的推荐卡片或推荐界面)来呈现。在又另一个示例中,过程400能够在呈现另一个视频内容项目之后自动呈现该视频内容项目。在另外的示例中,视频内容项目能够作为广告被呈现。
在410,过程400能够针对与许多语言中的任意语言相关联的用户而接收用户反应元数据。在一些实施例中,用户反应元数据可以是指示用户如何对视频内容项目做出反应的任意形式的数据或数据组合。例如,用户反应元数据可以包括下述数据,该数据指示视频内容项目每隔多久地在相对短时间播放后(在这里有时被称作“短暂点击”的行为)被停止。作为另一个示例,用户反应元数据可以包括指示视频内容项目在其被停止和/或另一个项被选择之前播放了多少的数据。作为又另一个示例,用户反应元数据可以包括指示视频内容项目每隔多久地被播放至其末尾。作为又另一个示例,在视频内容项目在与web浏览器相关联的网站上进行播放的情况下,用户反应元数据可以包括指示该web浏览器每隔多久地在视频内容项目结束之前离开该网站(这里有时称之为“弹出率”)的数据。作为另外的示例,用户反应元数据可以包括指示视频内容项目当其在推荐和/或搜索结果中被呈现时每隔多久地被选择和/或播放的数据。
在一些实施例中,过程400能够针对与任意适当语言相关联的用户接收用户反应元数据。例如,过程400能够针对与和在402的关联于视频内容项目的第一语言不同的语言相关联的用户接收用户反应元数 据。作为更为具体的示例,如果与视频内容项目相关联的第一语言是英语,则过程400能够针对与英语以外的(例如,在用户的语言偏好中所指示)任意语言相关联的用户接收用户反应元数据。作为另一个更为具体的示例,如果与视频内容项目相关联的第一语言是英语,则过程400能够针对与法语语言相关联(例如,具有针对法语内容的语言偏好)的用户接收用户反应元数据。
在一些实施例中,过程400能够针对与作为语言群组的一部分的语言相关联的用户接收用户反应元数据。作为更为具体的示例,过程400能够针对与一种作为基于拉丁的语言(例如,意大利语、法语和/或西班牙语)的语言相关联的用户接收用户反应元数据。
在一些实施例中,过程400能够选择要针对其接收用户反应元数据的一种或多种语言。例如,过程400能够选择一种与关联于针对视频内容项目的请求的语言相同的要针对其接收用户反应元数据的语言。作为更为具体的示例,响应于与西班牙语语言相关联的用户设备请求视频内容项目,过程400能够选择西班牙语偏好以针对其接收用户反应元数据。
在412,过程400能够使用任意适当技术或技术组合和/或任意适当信息,而基于用户反应元数据来更新视频内容项目是并非是语言特定的多语言内容项目的可能性。在一些实施例中,例如,过程400能够响应于如在410所接收的用户反应元数据指示了与关联于该视频内容项目的第一语言以外的语言相关联的用户针对视频内容项目做出了喜欢或不喜欢的反应,而更新所确定的可能性。作为更为具体的示例,过程400能够响应于用户反应元数据指示了与关联于该视频内容项目的第一语言以外的语言相关联的用户针对该视频内容项目做出了不喜欢的反应,而减小所确定的可能性。作为再更为具体的示例,如果过程400在410从与关联于该视频内容项目的第一语言以外的语言相关联的用户接收到指示相对高的弹出率和/或相对大数量的短暂点击的用户反 映元数据,则过程400能够减小该视频内容项目是并非是语言特定的多语言内容项目的可能性。
在一些实施例中,过程400能够通过将两种或更多语言之间的用户反应元数据进行比较,来更新视频内容项目是并非语言特定的多语言内容项目的可能性。例如,过程400能够将与第一语言相关联的用户的用户反应元数据与关联于不同语言的用户的用户反应元数据进行比较。作为更为具体的示例,如果在402与视频内容项目相关联的第一语言是英语,则过程400能够将关联于英语语言偏好的用户的用户反应元数据与关联于日语语言偏好的用户的用户反应元数据进行比较。在这样的示例中,如果关联于日语语言偏好的用户的用户反应元数据类似于关联于英语语言偏好的用户的用户反应元数据(例如,用户反应元数据指示出类似比例或较低比例的短暂点击和/或弹出率),则过程400能够增大视频内容项目是并非语言特定的多语言内容项目的可能性。
在一些实施例中,过程400能够通过将针对该视频内容项目的一种或多种语言之间的用户反应元数据与针对其它视频内容项目的用户反应元数据进行比较,来更新该视频内容项目是并非语言特定的多语言内容项目的可能性。例如,如果在402与视频内容项目相关联的第一语言是英语,并且如果在410所接收的用户反应元数据是针对关联于日语语言偏好的用户,则过程400能够将所接收到的用户反应元数据与关联于日语语言标识符的一个或多个其它视频内容项目的用户反应元数据进行比较。在这样的示例中,如果针对在402与英语语言标识符相关联的视频内容项目的用户反应元数据类似于关联于日语语言标识符的一个或多个其它视频内容项目的用户反应元数据,则过程400能够增大该与英语相关联的视频内容项目是并非语言特定的多语言内容项目的可能性。作为另一个示例,如果在402与视频内容项目相关联的第一语言是法语,并且如果在410所接收的用户反应元数据是针对关联于西班牙语语言偏好的用户,则过程400能够将所接收到的用户反应元数据与关联于西班牙语语言标识符的若干其它视频内容项目的用户反应元数据 进行比较。在更为具体的示例中,如果针对在402与法语语言标识符相关联的视频内容项目的用户反应元数据并不类似于关联于西班牙语语言标识符的视频内容项目的平均的或中位的用户反应元数据,则过程400能够减小与法语语言标识符相关联的视频内容项目是并非语言特定的多语言内容项目的可能性。
转向图5,依据所公开主题的一些实施例而示出了用于为与许多语言中的任意语言相关联的用户呈现媒体内容项目的过程的示例500。
在一些实施例中,过程500能够由任意设备或设备的组合所执行。例如,过程500能够利用内容服务器202、数据服务器204、一个或多个用户设备212、和/或以上结合图2所描述的任意其它适当设备所执行。
过程500能够在502通过接收针对媒体内容的请求而开始。在一些实施例中,该请求能够使用诸如超文本传输协议(HTTP)的任意适当的通信协议,任意适当的流传输协议、文件传输协议(FTP)、对应于数字直播网络联盟(DLNA)标准的协议、和/或任意其它适当协议而被接收。
在一些实施例中,过程500能够接收起源于任意适当来源的请求。例如,所接收的请求能够起源于来自用户设备所访问的搜索引擎的搜索查询。作为更为具体的示例,参考图1,所接收的请求能够源自于用户在用户界面100中向搜索要素102中输入了“dancevideo”。作为另一个示例,所接收的请求能够响应于用户选择了视频内容项目进行观看而源自于用户设备上的web浏览器。作为同样参考图1的更为具体的示例,所接收的请求能够响应于用户选择了视频内容图标104之一而源自于呈现用户界面100的web浏览器。作为另一个示例,所接收的请求能够源自于执行的软件(例如,web浏览器)的计算设备请求视频内容项目。作为更为具体的示例,所接收的请求能够源自于web浏览器访问了具有对于视频推荐所指定的区域的网页。作为再另一个示例,托管网 页的服务器设备能够响应于用户设备请求该网页而发起针对一个或多个所推荐视频内容项目的请求。作为又另一个示例,该请求能够源自于由被用来接收和/或播放视频内容项目的用户设备所执行的软件应用。在这样的示例中,该软件应用能够响应于视频内容项目被停止或者视频内容项目被播放至其结尾而请求所推荐的视频内容项目。
在504,过程500能够使用任意适当技术或技术组合以及任意适当信息来确定与针对媒体内容的请求相关联的语言。例如,过程500能够使用以上结合图4的过程400所描述的技术,基于与用户相关联的信息来确定与针对媒体内容的请求相关联的语言。
作为另一个示例,过程500能够基于导致针对媒体内容的请求的用户设备所访问的顶级域,来确定与针对媒体内容的请求相关联的语言。作为更为具体的示例,如果用户设备访问与特定语言相关联的顶级域,则过程500能够确定针对媒体内容的请求与相同的特定语言相关联。在这样的更为具体的示例中,如果用户设备访问与法语语言相关联的顶级域“.fr”,则过程500能够确定针对媒体内容的请求也与法语语言相关联。可替换地,如果用户设备访问与意大利语语言相关联的顶级域“.it”,则过程500能够确定针对媒体内容的请求也与意大利语语言相关联。
在506,过程500能够基于如在504所确定的与针对媒体内容的请求相关联的语言而选择一个或多个视频内容项目以便呈现给用户。在一些实施例中,过程500能够使用任意适当技术或技术组合以及任意适当信息来选择要呈现给用户的一个或多个视频内容项目。例如,过程500能够选择与和如在504所确定的关联于针对媒体内容的请求的语言的相同的语言相关联的一个或多个视频内容项目。作为另一个示例,过程500能够选择与和如在504所确定的关联于针对媒体内容的请求的语言的不同语言相关联的一个或多个视频内容项目。
在一些实施例中,过程500能够至少部分基于一个或多个视频内容项目是并非语言特定的多语言内容项目的可能性来选择要在用户设备上呈现的一个或多个视频内容项目。例如,过程500能够至少部分基于如以上在图4的406结合过程400所描述的每个视频内容项目是并非语言特定的多语言内容项目的可能性来选择一个或多个视频内容项目。在这样的示例中,如果一个或多个视频内容项目是并非语言特定的多语言内容项目存在相对高的可能性,过程500能够选择与和关联于针对媒体内容的请求的语言的不同的语言相关联的一个或多个视频内容项目。作为更为具体的示例,在过程500确定针对媒体内容的请求与法语相关联的情况下,在视频内容项目是并非语言特定的多语言内容项目存在相对高的可能性的情况下,过程500能够选择与英语相关联的视频内容项目。作为可替换示例,如果过程400在406确定一个或多个视频内容项目是并非语言特定的多语言内容项目存在相对低的可能性,过程500能够选择与和关联于针对媒体内容的请求的语言相同语言相关联的一个或多个视频内容项目。
在508,过程500能够使得一个或多个所选择的视频内容项目被呈现给用户。在一些实施例中,过程500能够使得一个或多个所选择的视频内容项目以任意适当格式被呈现给用户。例如,过程500能够使得一个或多个所选择的视频内容项目经由用户界面被呈现给用户,上述用户界面诸如图1所示的用户界面100。在这样的示例中,过程500能够将一个或多个视频内容项目作为可选择视频内容要素104进行呈现。作为另一个示例,过程500能够通过使得视频内容项目得以被回放而使得所选择的视频内容项目得以被呈现。在这样的示例中,过程500能够使用web浏览器、web浏览器扩展或插件、移动设备应用、和/或适于播放视频内容的任意其它软件应用而使得视频内容项目得以被播放。
在一些实施例中,过程500能够使得一个或多个所选择的视频内容项目被呈现给任意适当设备的用户。例如,返回参考图2,过程500能 够使得一个或多个所选择的视频内容项目得以被呈现给任意适当用户设备212的用户。
在510,过程500能够确定用户针对一个或多个所呈现视频内容项目的反应。在一些实施例中,过程500能够使用任意适当的技术或技术组合以及任意适当信息来确定用户针对一个或多个所呈现视频内容项目的反应。例如,过程500能够通过确定一个或多个视频内容项目中的每一个在该视频内容项目被停止之前所播放的时间量来确定用户反应。作为另一个示例,过程500能够基于一个或多个视频内容项目中的哪一个——如果有的话——被选择进行观看,来确定用户针对一个或多个所呈现视频内容项目的反应。作为又另一个示例,过程500能够在一个或多个视频内容项目在web浏览器上进行呈现的情况下基于该web浏览器是否在视频内容项目播放至其末尾之前或者在预定时间量之前转向另一个网页来确定用户针对一个或多个所呈现视频内容项目的反应。作为又另一个示例,过程500能够基于一个或多个所呈现视频内容项目中的任一个是否在没有停止的情况下被播放至其末尾来确定用户针对一个或多个所呈现视频内容项目的反应。
在512,过程500能够基于所确定的用户反应以及所确定的与针对媒体内容的请求相关联的语言来更新一个或多个所呈现视频内容项目的用户反应元数据。在一些实施例中,过程500能够使用任意适当的技术或技术组合以及任意适当信息而基于所确定的用户反应以及所确定的与针对媒体内容的请求相关联的语言来更新所呈现视频内容项目的用户反应元数据。例如,过程500能够更新对应于具体类型的所确定用户反应的所呈现视频内容项目的用户反应元数据。作为更为具体的示例,如果过程500确定所呈现视频内容项目之一在被停止之前播放了相对短的时间(例如,少于该视频内容项目的阈值比例),则过程500能够针对该视频内容项目更新涉及到短暂点击数量的用户反应元数据。作为另一个更为具体的示例,如果过程500确定所呈现视频内容项目之一被播放至其末尾,则过程500能够针对该视频内容项目更新涉及到弹 出率的用户反应元数据。作为又另一个更为具体的示例,如果视频内容项目作为推荐而被呈现并且过程500确定该视频内容项目并未被选择和/或播放,则过程500能够更新指示出当该视频内容项目在推荐中进行呈现时该视频内容项目会每隔多久地被选择和/或播放的用户反应元数据。
在一些实施例中,过程500能够更新与在504所确定的关联于针对媒体内容的请求的语言相关联的用户反应元数据。例如,如果视频内容项目与第一语言相关联(例如,如以上结合图4所描述的过程500所确定的)并且过程500确定针对媒体内容的请求与第二语言相关联,则过程500能够更新仅与第二语言相关联的用户反应元数据和/或与不同于第一语言的所有语言相关联的用户反应元数据。作为更为具体的示例,如果视频内容项目与英语语言标识符相关联,并且如果过程500接收到针对媒体内容的请求并且确定该请求与中文语言标识符相关联,则过程500能够更新与中为语言相关联的用户反应元数据和/或与英语语言以外的所有语言相关联的用户反应元数据(例如,并非与英语语言标识符相关联的所有用户的用户反应元数据)。
在一些实施例中,以上所描述的图4和5中的过程的框能够以任意顺序或次序执行或实施而并不局限于图中所示出并描述的顺序和次序。而且,上述图4和5中的过程的一些框在适当情况下能够基本上同时被执行或实施,或者被并行执行或实施以便减少延时和处理时间。除此之外或可替换地,以上所描述的图4和5的一些框能够被省略。
虽然这里所公开的实施例已经涉及到视频内容的呈现,但是应当理解的是,这里所描述的机制也能够被应用于仅有视频的内容、仅有音频的内容、具有视频和音频要素的组合的内容、三维内容,和/或任意其它适当媒体内容。
在一些实施方式中,能够使用任意适当的计算机可读介质来存储用于执行这里所描述的功能和/或过程的指令。例如,在一些实施方式中,计算机可读介质能够是瞬态或非瞬态的。例如,非瞬态计算机可读介质能够包括诸如磁性媒体(诸如硬盘、软盘等)、光学媒体(诸如紧凑盘、数字视频盘、蓝光盘等)、半导体媒体(诸如闪存、电可擦除只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)等)之类的媒体,在传输期间并不丢失或清空任何持久性假设的任意适当媒体和/或任意适当有形媒体。作为另一个示例,瞬态计算机可读介质可以包括网络上的信号,线路、导体、光纤、电路中的信号,在传输期间丢失或清空任何持久性假设的任意适当介质,和/或任意适当非有形介质。
因此,提供了用于识别并为用户呈现多语言媒体内容项目的方法、系统和介质。
虽然已经在以上说明性实施方式中描述并图示了本发明,但是所要理解的是,本公开仅是通过示例而进行,并且能够对本发明的实施方式的细节进行很多改变而并不背离仅由后续权利要求所限定的本发明的精神和范围。所公开实施方式的特征能够以各种方式进行组合和重新排列。

Claims (16)

1.一种用于为用户呈现媒体内容的方法,该方法包括:
确定视频内容项目是否与第一语言标识符相关联,其中,所述第一语言标识符指示与所述视频内容项目内的内容相关联的第一语言;
基于所述视频内容项目内的所述内容,确定所述视频内容项目是并非语言特定的多语言内容项目的可能性;
基于所确定的可能性,修改与所述视频内容项目相关联的所述第一语言标识符以反映所述视频内容项目是并非语言特定的;
响应于接收查询,确定与和所述查询相关联的用户账户相关联的第二语言标识符,其中,所述第二语言标识符不同于所述第一语言标识符;并且
基于反映所述视频内容项目被认为是并非语言特定的多语言内容项目的所修改的第一语言标识符,使得所述视频内容项目响应于请求查询而被呈现。
2.根据权利要求1所述的方法,进一步包括通过识别与所述视频内容项目相关联的音频内容中所包含的单词来识别视频内容分段中的内容。
3.根据权利要求1所述的方法,进一步包括通过识别与所述视频内容项目相关联的图像内容中所包含的单词来识别视频内容分段中的内容。
4.根据权利要求1所述的方法,进一步包括:
响应于所述查询,使得包括所述视频内容项目的多个视频内容项目得以被呈现,并且同时呈现语言指示符,其中,与所述视频内容项目相关联的所述语言指示符指示所述视频内容项目是多语言内容项目。
5.根据权利要求1所述的方法,进一步包括通过取回与所述视频内容项目相关联的元数据来识别所述视频内容项目内的内容,其中,所述元数据包括字幕元数据。
6.根据权利要求1所述的方法,进一步包括通过确定与上传了所述视频内容项目的用户设备相关联的位置来确定与所述视频内容项目相关联的所述第一语言。
7.根据权利要求1所述的方法,其中,
基于所述视频内容项目内的所述内容中的单词的数量,来确定所述视频内容项目是多语言内容项目的可能性。
8.根据权利要求1所述的方法,其中,
基于所述视频内容项目内的所述内容中的单词的密度,来确定所述视频内容项目是多语言内容项目的可能性。
9.根据权利要求1所述的方法,其中,确定所述视频内容项目是多语言内容项目的可能性进一步包括:
将所确定的可能性与多语言阈值分数进行比较。
10.根据权利要求1所述的方法,其中,确定所述视频内容项目是多语言内容项目的可能性进一步包括:
确定与涉及所述视频内容项目的内容相关联的多语言内容标识符。
11.根据权利要求1所述的方法,进一步包括:
接收针对被认为是多语言内容项目的视频内容项目的用户反应元数据;并且
基于所接收到的用户反应元数据,来更新所确定的可能性。
12.根据权利要求11所述的方法,其中,所述用户反应元数据包括:
所述视频内容项目在被停止之前所被呈现的时间量。
13.根据权利要求11所述的方法,进一步包括:
基于与提供了所述用户反应元数据的用户设备相关联的语言标识符,来选择所述用户反应元数据的一部分;并且
基于所选择的部分的所述用户反应元数据,来更新所确定的可能性。
14.根据权利要求1所述的方法,进一步包括:
在所述视频内容项目被呈现的同时,使得呈现用于查询所述视频内容项目是否为多语言内容项目的推荐提示。
15.一种用于为用户呈现媒体内容的系统,所述系统包括硬件处理器,所述硬件处理器被配置为:
确定视频内容项目是否与第一语言标识符相关联,其中,所述第一语言标识符指示与所述视频内容项目内的内容相关联的第一语言;
基于所述视频内容项目内的所述内容,来确定所述视频内容项目是并非语言特定的多语言内容项目的可能性;
基于所确定的可能性,修改与所述视频内容项目相关联的所述第一语言标识符以反映所述视频内容项目是并非语言特定的;
响应于接收查询,确定与和所述查询相关联的用户账户相关联的第二语言标识符,其中,所述第二语言标识符不同于所述第一语言标识符;并且
基于反映所述视频内容项目被认为是并非语言特定的多语言内容项目的所修改的第一语言标识符,使得所述视频内容项目响应于请求查询而被呈现。
16.一种包含计算机可执行指令的非瞬态计算机可读存储介质,所述计算机可执行指令在被处理器所执行时使得所述处理器实施一种用于为用户呈现媒体内容的方法,所述方法包括:
确定视频内容项目是否与第一语言标识符相关联,其中,所述第一语言标识符指示与所述视频内容项目内的内容相关联的第一语言;
基于所述视频内容项目内的所述内容,来确定所述视频内容项目是并非语言特定的多语言内容项目的可能性;
基于所确定的可能性,修改与所述视频内容项目相关联的所述第一语言标识符以反映所述视频内容项目是并非语言特定的;
响应于接收查询,确定与和所述查询相关联的用户账号相关联的第二语言标识符,其中,所述第二语言标识符不同于所述第一语言标识符;并且
基于反映所述视频内容项目被认为是并非语言特定的多语言内容项目的所修改的第一语言标识符,使得所述视频内容项目响应于请求查询而被呈现。
CN201611242924.8A 2016-06-21 2016-12-29 用于识别并为用户呈现多语言媒体内容项目的方法、系统和介质 Active CN107526761B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/188,483 2016-06-21
US15/188,483 US9848215B1 (en) 2016-06-21 2016-06-21 Methods, systems, and media for identifying and presenting users with multi-lingual media content items

Publications (2)

Publication Number Publication Date
CN107526761A CN107526761A (zh) 2017-12-29
CN107526761B true CN107526761B (zh) 2020-03-31

Family

ID=59327995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611242924.8A Active CN107526761B (zh) 2016-06-21 2016-12-29 用于识别并为用户呈现多语言媒体内容项目的方法、系统和介质

Country Status (3)

Country Link
US (2) US9848215B1 (zh)
CN (1) CN107526761B (zh)
DE (2) DE202016008293U1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9848215B1 (en) * 2016-06-21 2017-12-19 Google Inc. Methods, systems, and media for identifying and presenting users with multi-lingual media content items
KR102081221B1 (ko) * 2017-12-18 2020-02-25 애니포인트미디어 주식회사 방송 서비스의 반송률 측정 장치
US10860648B1 (en) * 2018-09-12 2020-12-08 Amazon Technologies, Inc. Audio locale mismatch detection
JP2020046957A (ja) * 2018-09-19 2020-03-26 富士ゼロックス株式会社 表示制御装置、表示装置、及びプログラム
US11335060B2 (en) * 2019-04-04 2022-05-17 Snap Inc. Location based augmented-reality system
CN113746874B (zh) * 2020-05-27 2024-04-05 百度在线网络技术(北京)有限公司 一种语音包推荐方法、装置、设备及存储介质
US11750878B2 (en) * 2020-05-29 2023-09-05 The Nielsen Company (Us), Llc Methods and apparatus to identify alternate language versions of media based on signature matching
CN112699671B (zh) * 2020-12-31 2023-11-17 百果园技术(新加坡)有限公司 一种语言标注方法、装置、计算机设备和存储介质
US20230084294A1 (en) * 2021-09-15 2023-03-16 Google Llc Determining multilingual content in responses to a query

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103761261A (zh) * 2013-12-31 2014-04-30 北京紫冬锐意语音科技有限公司 一种基于语音识别的媒体搜索方法及装置
CN103984772A (zh) * 2014-06-04 2014-08-13 百度在线网络技术(北京)有限公司 文本检索字幕库生成方法和装置、视频检索方法和装置
WO2015157711A1 (en) * 2014-04-10 2015-10-15 Google Inc. Methods, systems, and media for searching for video content
CN105009570A (zh) * 2013-03-15 2015-10-28 索尼公司 通过解析描述性隐藏式说明数据来定制对信息的显示

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9020326B2 (en) 2005-08-23 2015-04-28 At&T Intellectual Property Ii, L.P. System and method for content-based navigation of live and recorded TV and video programs
US8230475B2 (en) * 2007-11-16 2012-07-24 At&T Intellectual Property I, L.P. Methods and computer program products for subcontent tagging and playback
US9398322B2 (en) * 2011-04-27 2016-07-19 Time Warner Cable Enterprises Llc Multi-lingual audio streaming
US8941709B2 (en) * 2011-07-11 2015-01-27 Bank Of America Corporation Video-assisted self-service transaction device
US20160171109A1 (en) * 2014-12-12 2016-06-16 Ebay Inc. Web content filtering
US9848215B1 (en) * 2016-06-21 2017-12-19 Google Inc. Methods, systems, and media for identifying and presenting users with multi-lingual media content items

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105009570A (zh) * 2013-03-15 2015-10-28 索尼公司 通过解析描述性隐藏式说明数据来定制对信息的显示
CN103761261A (zh) * 2013-12-31 2014-04-30 北京紫冬锐意语音科技有限公司 一种基于语音识别的媒体搜索方法及装置
WO2015157711A1 (en) * 2014-04-10 2015-10-15 Google Inc. Methods, systems, and media for searching for video content
CN103984772A (zh) * 2014-06-04 2014-08-13 百度在线网络技术(北京)有限公司 文本检索字幕库生成方法和装置、视频检索方法和装置

Also Published As

Publication number Publication date
US20170366827A1 (en) 2017-12-21
DE202016008293U1 (de) 2017-06-28
DE102016125806A1 (de) 2017-12-21
US9848215B1 (en) 2017-12-19
US10313713B2 (en) 2019-06-04
CN107526761A (zh) 2017-12-29
DE102016125806B4 (de) 2022-10-27
US20180109821A1 (en) 2018-04-19

Similar Documents

Publication Publication Date Title
CN107526761B (zh) 用于识别并为用户呈现多语言媒体内容项目的方法、系统和介质
US11523187B2 (en) Methods, systems, and media for aggregating and presenting content relevant to a particular video game
US11423074B2 (en) Systems and methods for determining whether a negation statement applies to a current or past query
US20180121547A1 (en) Systems and methods for providing information discovery and retrieval
US10430835B2 (en) Methods, systems, and media for language identification of a media content item based on comments
US10088983B1 (en) Management of content versions
CN107515870B (zh) 一种搜索方法和装置、一种用于搜索的装置
US20190220899A1 (en) Information processing method and device, display terminal, and storage medium
US11126629B2 (en) System and method for mining playlist data for use in providing digital media or other content
US20140297285A1 (en) Automatic page content reading-aloud method and device thereof
CN113707179A (zh) 一种音频识别方法、装置、设备及介质
US20230179831A1 (en) Method and device for personalizing generic multimedia content
CN108875315B (zh) 变换指纹以检测未授权媒体内容项的方法、系统和介质
US9466072B1 (en) Systems, methods, and media for controlling the presentation of search results with advertisement indications
CN117312654A (zh) 召回方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

CB02 Change of applicant information
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant