CN104247440A - 产生具有声轨的视频数据 - Google Patents

产生具有声轨的视频数据 Download PDF

Info

Publication number
CN104247440A
CN104247440A CN201380020858.8A CN201380020858A CN104247440A CN 104247440 A CN104247440 A CN 104247440A CN 201380020858 A CN201380020858 A CN 201380020858A CN 104247440 A CN104247440 A CN 104247440A
Authority
CN
China
Prior art keywords
data
video data
video
product
descriptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380020858.8A
Other languages
English (en)
Inventor
亚当·詹姆斯·布莱斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life on Show Ltd
Original Assignee
Life on Show Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life on Show Ltd filed Critical Life on Show Ltd
Publication of CN104247440A publication Critical patent/CN104247440A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0276Advertisement creation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4622Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8166Monomedia components thereof involving executable data, e.g. software
    • H04N21/8173End-user applications, e.g. Web browser, game
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/9201Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
    • H04N5/9202Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal the additional signal being a sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/274Storing end-user multimedia data in response to end-user request, e.g. network recorder
    • H04N21/2743Video hosting of uploaded data from client
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor

Abstract

一种产生具有声轨(114)的视频数据的方法,该方法包括:接收(204)与产品或服务相关的视频数据(112);获得(208,212)与产品或服务相关的描述性数据;基于描述性数据产生(214,216)音频数据;向视频数据的至少一部分添加(218)音频数据,作为声轨;以及存储(220)和/或播放添加有声轨的视频数据。本发明还包括被配置为使用该方法的系统和相关计算机程序元件。

Description

产生具有声轨的视频数据
技术领域
本发明涉及产生具有声轨的视频数据。
背景技术
由于基于互联网的服务向更为媒体导向的观众发展,使用包括视频的数字内容变得越来越重要。视频正变为互联网传播内容的一种越来越普遍的方式,因此为了使得搜索引擎能够传送准确的针对性结果,它们覆盖视频内容中包括的视觉和音频信息。基于视频的服务(例如YouTubeTM)已经能够分析来自被提交的视频内容的音频,并可以使用这种技术来管理受版权保护的音乐,期望其他的通用万维网(WWW)搜索引擎也提供这种功能。因此,搜索引擎应能够基于视频的音频内容,针对给定搜索决定什么内容是相关的,然后基于它们的搜索准则,向用户传送混合的(文本和视频二者)针对性结果。
对于一些产品/服务,视频内容并非总是可用,这使得当涉及基于视频的搜索时,这种产品/服务的供应商或销售商处于劣势。通常,产生视频内容是耗时且昂贵的。在其它情况下,视频内容可能可用,但是不包括任何描述性的音频信息(例如,只有音乐声轨),这种描述性的音频信息可以帮助搜索引擎将其返回作为相关结果。通常,由解说员向视频添加这种描述性的音频内容,该过程同样趋于是耗时且昂贵的。
发明内容
本发明的实施例旨在至少解决上述问题中的一部分。本发明的实施例可以自动地结合单独的服务以便自动并加速传输能够在基于视频的搜索引擎中发现的视频内容。在本发明的许多实施例中,自动化整个视频产生处理,且系统能够在几秒内产生描述性的音频数据并将其嵌入视频中。
根据本发明的第一方面,提供了一种产生具有声轨的视频数据的方法,该方法包括:
接收与产品或服务相关的视频数据;
获得与产品或服务相关的描述性数据;
基于描述性数据产生音频数据;
向视频数据的至少一部分添加音频数据,作为声轨;以及
存储和/或播放添加有声轨的视频数据。
该方法可以包括对视频数据中的至少一帧执行图像分析,以便获得与产品或服务相关的标识符。例如,如果产品是车辆,则该方法可以包括应用图像分析技术,以便识别该车辆的号码或牌照(或任何其它类似标识符)。于是,获得描述性数据的步骤可以包括使用该标识符来搜索车辆数据库,检索与匹配该标识符的车辆相关的信息,例如,型号规格。如果执行图像分析的步骤没有导致获得标识符,则该方法可以包括获得与针对产品或服务的标识符相关的用户输入。
该方法可以包括基于描述性数据产生文本或语句。产生音频数据的步骤可以包括基于所产生的文本或语句来产生语音。
可以将添加有声轨的视频数据保存为文件,文件的名称包括描述性数据中的至少一部分。
该方法可以包括从多个可用的数据集选择音频数据。例如,数据集可以包括不同语言的音频数据或表示不同市场消息的音频数据。
根据本发明的另一方面,提供了一种计算机程序元件,包括:计算机代码装置,用于令计算机执行实际上如本文所述的方法。该元件可以包括计算机程序产品。
根据本发明的备选方面,提供了一种向视频数据添加声轨的方法,该方法包括:
接收与产品或服务相关的视频数据;
获得与产品或服务相关的描述性数据;
基于描述性数据产生音频数据;
与视频数据中的至少一部分一起回放音频数据作为声轨。
根据本发明的又一方面,提供了一种配置为产生包括声轨的视频数据的系统,该系统包括:
被配置为接收与产品或服务相关的视频数据的装置;
被配置为获得与产品或服务相关的描述性数据的装置;
被配置为基于描述性数据产生音频数据的装置;
被配置为向视频数据的至少一部分添加音频数据作为声轨的装置;以及
被配置为存储和/或播放添加有声轨的视频数据的装置。
附图说明
参考附图,现将示例性地描述本发明的实施例,附图中:
图1示出了根据本发明的实施例配置的计算系统的框图,该计算系统包括运行应用的计算设备;以及
图2是示出了通过应用执行的示例步骤的流程图。
具体实施方式
图1示出了具有处理器102和存储器104的示例计算设备100。该计算机还包括其它标准组件,例如用户接口106和通信接口108。计算设备100的存储器104包括用于处理视频数据112以便产生数据114的应用110,数据114包括具有声轨的视频数据。计算机的通信接口108允许计算机通过网络(包括互联网116)与至少一个远程计算设备118进行通信。
通常,计算设备100的用户例如通过从可移除存储介质(例如,DVD、存储棒或摄像机)或经由互联网116从远程资源下载视频文件/视频流,来启动应用110并将视频数据112加载到该应用。然后,该应用处理数据文件,该处理可以包括经由互联网从远程资源/服务获得或在本地获得其它数据,以便产生具有声轨数据的视频114。然后,以任何适合方式使用数据114,例如,经由互联网传输并上传到适合网站或可由搜索引擎通过其它方式进行访问。
图2示出了可以通过应用110的示例实施例执行的步骤。本领域技术人员应理解,可以使用任何适合的编程语言和/或数据结构来编码这些步骤。还应理解,在备选实施例中,可以省略一部分步骤和/或对一部分步骤进行重新排序。尽管示例应用涉及用于销售汽车/车辆的服务,但是应认识到,对基于本发明的系统的多种其它使用是可能的。
应用110在步骤202开始进行操作,通常是在计算设备100的用户启动该应用时。可能需要例如对用户进行认证等的标准安全步骤。该应用可以包括图形用户界面,将该图形用户界面设计为尽可能简单和简约。在步骤204,视频数据112被加载到该应用。这可以通过多种方式来进行,例如,通过从存储介质(例如,DVD或计算设备的硬盘)选择文件,或通过从可从网站下载的多个视频中选择视频或选择来自摄像机的实时馈送。在示例实施例中,视频示出了要销售的车辆。在一些情况下,视频可以包括由系统产生的车辆的轨道视图,这种系统在本发明人于2012年3月9日提交的国际专利申请No.PCT/GB2012/000232中进行了描述,该申请的内容通过引用合并于此。此外,可以将本文所述的视频/声轨产生方法作为该早期系统的一部分(可选部分)。
在步骤206,应用110分析视频数据112的至少一部分,以尝试发现可以识别该视频所示车辆的信息。在一个实施例中,该应用尝试读取该视频所示车辆的号码/牌照,然而应理解,在缺少牌照的情况下可以在目标车辆的外部使用其它唯一的标识符,例如,位数多到足以不可能发生偶然复制的随机产生号码。在该处理阶段可以执行从视频数据提取静态图像,该应用可以使用传统的号码识别设备,例如,可在www.ndi-rs.com获得的号码识别设备。在其它实施例中,该系统可以通过识别车身上的汽车商标,或通过将该车辆的形状或其他特征与车辆设计信息的数据库进行比较,来分析车辆的至少一个图像,以尝试确定其制造商/型号。
因此,在步骤208,该应用110提供直接从视频数据112提取车辆的登记详情的能力。由于图像识别是困难的研究领域,对字母和符号的检测并非完全100%可靠,优选地本发明包括用于增加识别系统可靠性的验证算法。传统地,对单个源图像执行牌照识别,操作的成功取决于多个因素,例如,图像的分辨率、图像格式和图像尺寸、牌照相对摄像机的角度、牌照到镜头的距离和牌照上字体大小;以及例如照明强度、牌照整洁程度等外部因素。在一些实施例中,可以提醒用户从视觉上检查通过识别软件确定的牌照是否与车辆的牌照相对应。
在另一实施例中,可以从视频数据112提取车辆的多个静止视图,该多个静止视图以变化的角度示出了车辆,其中一部分(假如4个)视图包括车辆牌照。可以在由用户确定的系统配置文件中规定(存储)样本尝试的数目。当完成了一定次数的尝试识别时,可以通过系统分析多个结果和置信程度,将多个结果和置信程度整合为“全局”置信程度。如果这个程度在预定度量程度之上,则登记匹配车辆登记的置信度增加。
如果在步骤206应用110无法确定车辆的牌照,则控制进行到步骤210,提示用户手动输入标识符数据。
当在步骤208或210分别自动地或手动地输入了登记号码时,该车辆相关的其它数据在一些情况下可以由用户输入(或从其它源检索),例如,车辆的记录里程、非标准设备的详情、状况信息等。在步骤212,可以调用web服务以便自动从至少一个外部源(例如,国家牌照/车辆数据库)检索针对该车辆登记的数据。可以获得的数据示例包括:制造商、型号、颜色等。例如,标识符VF07EDK=Audi,A4,敞篷,黑色等。
在步骤214,该应用110使用在步骤212获得的与车辆相关的数据来产生描述性文本。这可以通过远程资源(例如,www.NDI-RS.com)以算法的方式来实现。该处理可以涉及识别描述性数据的至少一个特征,并将所述特征插入模板语句。例如,对于上述示例中登记为VF07EDK的车辆,该方法将该信息用于与模板组合,以便产生至少一个语句(基于检索到的信息而获得的特征由斜体示出):“2007年3月上牌Audi A4敞篷具有2.0升发动机。该车辆的颜色为黑色。”应理解,可以使用备选的/附加的信息,例如,颜色、里程、非标准设备、对使用情况的主观评价等。还应理解,可以提供使用文本编辑器来手动添加文本的选项,以这种方式键入的文本也可由格式化的文本围绕以便形成语句。
在步骤216,应用110使用在步骤214产生的描述性文本数据,以便产生与该描述相对应的音频数据。这可以通过使用已知的文本语音产生技术来进行,并可以涉及使用基于远程web的服务,例如,WWW.SitePal.com(在一些情况下可以包括可选的视觉化身)。音频数据可以准确对应于在步骤214产生的文本/描述,或可以向所述文本/描述施加一些变化,例如,扩大在语句之间插入的间隔,以便更好地匹配视频剪辑的持续时间等。
在步骤218,将在步骤216产生的音频数据添加到/叠加到视频数据112中的至少一部分。这可以通过使用标准技术来进行。例如,如果在步骤216产生的音频是MP3数据形式且视频数据是MP4数据形式,则可以将MP3音频文件与MP4视频文件相融合,保存得到的合并后MP4视频文件,意味着系统产生了音轨并将音轨覆盖在单个MP4文件上。备选地,MP3音频文件可以在运行时与MP4视频文件相联结,提供在需要时改变音频的能力,意味着可以使用同一视频,而不需要产生并存储具有不同音轨的多个视频。这使得能够针对全球范围将文本转换为不同语言,或根据观看视频的环境(例如,B2C或B2B环境)而具有不同市场消息。应理解,可以使用备选的音频/视频数据格式。可以对音频数据施加某些改变,例如,添加标准介绍/联系人详情解说、声效和/或音乐等。
在步骤220,该应用110将具有在步骤218添加的声轨的视频数据保存为数据114。优选地,可以将描述性数据中的一部分用于文件名称。例如,如果将车辆识别为BMW 535,则文件名称可以包括“bmw_535”。这可以进一步改善搜索引擎发现视频数据的几率。可以通过应用110以任何适合方式来存储并使用这种数据,所述适合方式可以包括将数据传送到应用的上传模块,以将数据和任何其它相关内容上传到媒体服务器,以供潜在的消费者和/或搜索引擎访问。在备选实施例中,在步骤216产生的视频数据和音频数据可以单独存储和检索,但可以同时回放/同步回放,这种同时回放包括:向视频数据添加作为声轨的音频数据。在此之后,可以在步骤222结束该应用的操作。
本领域技术人员应认识到,可以通过应用110提供多种变型和可选特征。可以通过在菜单条上提供的下拉式菜单等来访问用户设置。这种设置可以包括选择可以使用的视频格式。还可以包括其它设置,并且本发明不应受限于这方面。还应理解,应用该系统的产品或服务的类型可以与以上具体示例不同。例如,可以提供这样的实施例,其中通过产生与位置、周边设施(例如,当地学校)、房产详情(例如,卧室、浴室和/或车库等的数目)等相关的描述/音轨,来帮助销售房产。另一示例是浴室产品,其中该系统可以产生产品描述,例如,“具有不锈钢配件的淋浴盆”等。
因此,本发明的实施例提供了一种自动产生具有声轨的视频数据的方法,仅需要极少的用户交互/不需要用户交互。相较于传统的视频产生技术,该方法更快捷且更节约成本,附加优点在于可以通过适合的搜索引擎来检索视频数据中包括的得到的音频信息。
应当注意,上述实施例说明了而不是限制了本发明,并且在不背离所附权利要求限定的本发明的范围的情况下本领域技术人员能够设计许多备选实施例。在权利要求中,括号中的任何附图标记不应视为限制权利要求。词语“包括”等不排除除任一权利要求或整个说明书中列出的那些元件或步骤以外的其他元件或步骤的存在。在本说明书中,“包括”意味着“包括或由...组成”。元件的单数形式不排除该元件的复数形式,反之亦然。本发明可以由包括若干不同元件的硬件以及适当编程的计算机来实现。在列举了若干装置的设备权利要求中,这些装置的中若干装置可以由同一硬件来实现。在不同从属权利要求中记载特定手段的事实并不表示不能有利地使用这些手段的组合。

Claims (12)

1.一种产生具有声轨(114)的视频数据的方法,所述方法包括:
接收(204)与产品或服务相关的视频数据(112);
获得(208,212)与所述产品或服务相关的描述性数据;
基于所述描述性数据产生(214,216)音频数据;
向所述视频数据的至少一部分添加(218)所述音频数据,作为声轨;以及
存储(220)和/或播放添加有声轨的视频数据。
2.根据权利要求1所述的方法,包括对视频数据(112)中的至少一帧执行图像分析(208),以便发现与所述产品或服务相关的标识符。
3.根据权利要求2所述的方法,其中所述产品是车辆,且所述方法包括对视频数据的至少一帧执行(208)图像分析技术,以便获得所述车辆的标识符,例如,号码或牌照。
4.根据权利要求3所述的方法,其中所述获得(212)描述性数据的步骤包括:使用所述标识符来搜索车辆的数据库,以及检索与匹配所述标识符的车辆相关的信息,例如,型号规格。
5.根据权利要求2到4中任一权利要求所述的方法,其中如果所述执行图像分析的步骤没有导致发现标识符,则所述方法包括获得(210)与针对所述产品或服务的标识符相关的用户输入。
6.根据前述权利要求中的任一权利要求所述的方法,包括基于所述描述性数据产生(214)文本或语句。
7.根据权利要求6所述的方法,其中所述产生音频数据的步骤包括基于所产生的文本或语句来产生(216)语音。
8.根据前述权利要求中的任一权利要求所述的方法,其中将添加有声轨的视频数据保存为文件,所述文件的名称包括所述描述性数据中的至少一部分。
9.根据前述权利要求中的任一权利要求所述的方法,还包括从多个可用的数据集选择音频数据。
10.根据权利要求9所述的方法,其中所述数据集包括不同语言的音频数据或表示不同市场消息的音频数据。
11.一种计算机程序元件,包括:计算机代码装置,用于令计算机执行根据上述权利要求中的任一权利要求所述的方法。
12.一种配置为产生包括声轨的视频数据(114)的系统,所述系统包括:
被配置为接收与产品或服务相关的视频数据(112)的装置(100);
被配置为获得与所述产品或服务相关的描述性数据的装置(100);
被配置为基于所述描述性数据产生音频数据的装置(100);
被配置为向所述视频数据的至少一部分添加所述音频数据作为声轨的装置(100);以及
被配置为存储和/或播放添加有声轨的视频数据的装置(100)。
CN201380020858.8A 2012-04-18 2013-03-21 产生具有声轨的视频数据 Pending CN104247440A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1206779.9A GB2501275A (en) 2012-04-18 2012-04-18 Method of generating video data with associated soundtrack
GB1206779.9 2012-04-18
PCT/GB2013/050740 WO2013156751A1 (en) 2012-04-18 2013-03-21 Generating video data with a soundtrack

Publications (1)

Publication Number Publication Date
CN104247440A true CN104247440A (zh) 2014-12-24

Family

ID=46209226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380020858.8A Pending CN104247440A (zh) 2012-04-18 2013-03-21 产生具有声轨的视频数据

Country Status (8)

Country Link
US (1) US20150104156A1 (zh)
EP (1) EP2839667A1 (zh)
CN (1) CN104247440A (zh)
BR (1) BR112014026020A2 (zh)
CA (1) CA2870780A1 (zh)
GB (1) GB2501275A (zh)
IN (1) IN2014MN02258A (zh)
WO (1) WO2013156751A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105828220A (zh) * 2016-03-23 2016-08-03 乐视网信息技术(北京)股份有限公司 一种向视频文件中添加音频文件的方法和装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10140364B1 (en) 2013-08-23 2018-11-27 Google Llc Dynamically altering shared content
GB2519537A (en) * 2013-10-23 2015-04-29 Life On Show Ltd A method and system of generating video data with captions

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070277196A1 (en) * 2006-02-24 2007-11-29 Steengaard Bodil H Methods of user behavior learning and acting in a pervasive system
WO2010146558A1 (en) * 2009-06-18 2010-12-23 Madeyoum Ltd. Device, system, and method of generating a multimedia presentation
US20110057816A1 (en) * 2009-05-08 2011-03-10 Citysync, Ltd Security systems
CN102103877A (zh) * 2009-12-22 2011-06-22 索尼公司 用于编辑图像/视频数据的图像/视频数据编辑设备和方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6998527B2 (en) * 2002-06-20 2006-02-14 Koninklijke Philips Electronics N.V. System and method for indexing and summarizing music videos
WO2004090752A1 (en) * 2003-04-14 2004-10-21 Koninklijke Philips Electronics N.V. Method and apparatus for summarizing a music video using content analysis
US20070297454A1 (en) * 2006-06-21 2007-12-27 Brothers Thomas J Systems and methods for multicasting audio
US8996376B2 (en) * 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8122468B2 (en) * 2008-11-07 2012-02-21 At&T Intellectual Property I, L.P. System and method for dynamically constructing audio in a video program
US9501329B2 (en) * 2009-05-08 2016-11-22 Rackspace Us, Inc. Methods and systems for cloud computing management
US20130093886A1 (en) * 2011-10-18 2013-04-18 Ariel Inventions, Llc Method and system for using a vehicle-based digital imagery system to identify another vehicle

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070277196A1 (en) * 2006-02-24 2007-11-29 Steengaard Bodil H Methods of user behavior learning and acting in a pervasive system
US20110057816A1 (en) * 2009-05-08 2011-03-10 Citysync, Ltd Security systems
WO2010146558A1 (en) * 2009-06-18 2010-12-23 Madeyoum Ltd. Device, system, and method of generating a multimedia presentation
CN102103877A (zh) * 2009-12-22 2011-06-22 索尼公司 用于编辑图像/视频数据的图像/视频数据编辑设备和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105828220A (zh) * 2016-03-23 2016-08-03 乐视网信息技术(北京)股份有限公司 一种向视频文件中添加音频文件的方法和装置

Also Published As

Publication number Publication date
GB201206779D0 (en) 2012-05-30
BR112014026020A2 (pt) 2017-06-27
IN2014MN02258A (zh) 2015-07-24
US20150104156A1 (en) 2015-04-16
CA2870780A1 (en) 2013-10-24
EP2839667A1 (en) 2015-02-25
WO2013156751A1 (en) 2013-10-24
GB2501275A (en) 2013-10-23

Similar Documents

Publication Publication Date Title
US8458184B2 (en) Tagging media assets, locations, and advertisements
US8861937B2 (en) Methods and apparatus to access media
CN104050217B (zh) 媒体内容替换方法和系统
US8112279B2 (en) Automatic creation of audio files
US10880023B2 (en) Vehicle-based media system with audio advertisement and external-device action synchronization feature
CN101233753A (zh) 遥控系统、遥控器和遥控方法
US20230154486A1 (en) Audio Playout Report for Ride-Sharing Session
US20230291772A1 (en) Filtering video content items
US20140279079A1 (en) Method and user interface for classifying media assets
CN104247440A (zh) 产生具有声轨的视频数据
CN105354285A (zh) 嵌入搜索引擎中的知识搜索方法、装置以及搜索引擎
US11700285B2 (en) Filtering video content items
US20220414808A1 (en) Methods, systems, and media for rights management of embedded sound recordings using composition clustering
KR102486563B1 (ko) Nft 기술이 적용된 목소리데이터 관리플랫폼 제공 시스템 및 제공 방법
KR101984856B1 (ko) 음원에 대한 문의를 공유하는 방법 및 장치
FR2926432A1 (fr) Systeme et procede de programmation a distance d'un adjoint de poste de telediffusion.
CN108875315A (zh) 变换指纹以检测未授权媒体内容项的方法、系统和介质
FR2996934A1 (fr) Procede de navigation dans un contenu audio comprenant des extraits musicaux

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141224

WD01 Invention patent application deemed withdrawn after publication