WO2009082934A1

WO2009082934A1 - Procédé de traitement vidéo et système associé

Info

Publication number: WO2009082934A1
Application number: PCT/CN2008/073564
Authority: WO
Inventors: Zhiping Meng
Original assignee: Zhiping Meng
Priority date: 2007-12-18
Filing date: 2008-12-17
Publication date: 2009-07-09
Also published as: CN101207807A; CN101207807B

Description

一种处理视频的方法及其系统本申请要求于 2007年 12 月 18 日提交中国专利局，申请号为 200710172506.0, 发明名称为 "一种处理视频的方法及其系统" 的中国专利申请的优先权，其全部内容通过引用结合在本申请中。技术领域

本发明实施例涉及视频技术领域，尤其涉及一种处理视频的方法及其系统。背景技术

随着网络技术的不断发展，各种各样的基于网页的应用也越来越多。网络视频以及各种其它视频形式都在快速发展，对于视频的应用也就显得越来越重要了。现阶段一些大型的视频网站，每天的流量超过千万 IP, 网络视频已经成为一种高效和灵活的视频形式，但是包括视频广告等很多技术还处于发展过程中，特别是针对点播节目的广告技术。因此，虽然网络上看视频的人数众多，但是广告收入却非常微薄。

如何让视频在播放时候进行增值就是我们必须考虑的问题。现有的网络视频广告形式还非常筒单，主要包括：播放视频前进行广告利用緩沖期播放、播放视频后播放广告、背景图片等方式。但这些方式对于视频广告来说并不理想，产生广告效率低下、广告效果不佳的问题。例如，如果采用视频前播放 10秒緩沖广告的方法，以视频播放 10分钟为例，广告的时长只占到了整个视频播放时长的 1/60。如何改变这种低效率的广告方式，以及改善用户的广告体验成了我们当前必须解决的问题。

另一方面，视频搜索成了一个热门的话题，如何才能准确地搜出我们关心的视频变得越来越重要。现有的视频搜索方式都离不开视频名字或视频筒介的搜索，实际上还是基于视频标题的搜索，而且很明显，视频标题的搜索并不能代表整个视频的内容，如何才能对视频中的具体内容或对象进行搜索呢？曾经有人提出过对视频或图片中的对象进行自动识别的方法，经过了几十年的研究，现在已经可以对类似人脸、指纹等特定的目标物体进行自动识别，但是根本无法对广义的任何物体进行识别，这种做法在短时间内是根本无法实现的。由于人工智能（Artificial Intelligence, AI ) 的限制，计算机还不能想人那样思考问题，这也是导致上述方法不能实现的根本原因。

由于视频数量的发展，视频中对象的商业价值会变得越来越大，但是现有的自动识别技术还远远达不到对视频中对象进行广泛识别的要求。因此有没有可替代的识别方案，便成为本发明研究的重点。

专利号 CN200710097774.0, 提出了一种在视频资源中使用信息集的方法，该方法提出了视频媒体和其它媒体进行互动操作的方案，但是没有提出生成视频内容描述文件和视频功能文件的具体视频处理方法。专利号 CN200710123453.3 , 提供了利用广告描述文件来控制广告播放的方法，但是该方案并没有提出广告内容描述文件的概念，也不能对视频对象进行搜索，在功能管理上也没有配合数据库进行管理，因此还具有改良的余地。在以上两个专利的基础上，本发明实施例提出了更具体、高效地处理视频的方法以及相关系统。发明内容

本发明实施例提供了一种处理视频的方法及其系统，以实现对视频对象进行有效处理和管理。

为了实现上述目的，本发明的实施例包括以下方法和相关系统：一种处理视频的方法，包括以下步骤：

处理视频文件，生成和视频内容对应的内容描述文件；处理所述内容描述文件，为内容描述文件中一条或多条记录添加功能描述，生成功能描述文件；

在视频播放前或视频播放中，解析所述功能描述文件，实现功能描述文件内的描述功能。

所述处理视频文件，生成和视频内容对应的内容描述文件，包括以下步骤：

打开视频文件；

记录下视频中具体对象的描述信息；

并把具体对象的描述信息形成记录保存到内容描述文件中；所述内容描述文件可以是一个单独的生成文件或保存在内存中的文件，并可以将该文件整体或依次将每条记录上传到内容描述数据库进行存储。

所述记录下视频中具体对象的描述信息，至少包括： 1 )所述具体对象的关键字信息； 2 )所述具体对象的开始播放和结束播放信息；所述具体对象的开始播放和结束播放信息可以表示为所述具体对象出现的开始帧和结束帧信息和 /或所述具体对象出现的开始时间和结束时间信息。

所述记录下视频中具体对象的描述信息，还可以包括对象在视频帧中的位置信息和 /或区域信息。

所述处理所述内容描述文件，为内容描述文件中一条或多条记录添加功能描述，生成功能描述文件，包括以下步骤：

从内容描述数据库或内容描述文件中找到需要添加功能描述的记录；

加入功能描述，并形成功能描述文件；其中，所述加入功能描述的过程可以是先将功能描述信息加入内容描述数据库，然后通过内容描述数据库为对应的视频产生功能描述文件；所述加入功能描述的过程也可是先将内容描述文件从内容描述数据库中提取出来，然后结合每条记录的功能描述为视频生成功能描述文件。

一种生成视频内容描述文件的编辑系统，包括视频播放模块和参数编辑模块：

所述视频内容描述文件的编辑系统，其功能在于可以通过打开视频文件，在视频播放的过程中对视频进行编辑，并生成视频内容描述文件；所述内容描述文件至少包括：视频中对象的关键字信息、视频中对象的开始和结束信息；

所述视频播放模块至少包括播放视频功能，并且视频播放模块可以感知鼠标在视频中的点击位置和 /或时间信息和 /或帧位置信息，并将位置和时间信息保存在内存中；

所述参数编辑界面至少包括关键字区域，用于输入视频内容对应的关键字信息；

所述视频内容描述文件的编辑系统会生成一个至少含有视频中对象的关键字信息和视频中对象开始和结束信息，所述开始和结束信息可以用开始时间结束时间表示或开始帧结束帧表示。

一种通过网络获取功能描述信息，并生成功能描述文件的方法，包括以下步骤：

处理视频文件，生成和视频内容对应的内容描述文件；将内容描述文件按记录保存到内容描述数据库中；

通过网页提供内容描述数据库的检索操作，并将被检索到的记录用网页形式提供给用户；

所述用户选择需要处理的条目，根据用户需求为该记录添加功能描述，并将增加的功能描述保存到内容描述数据库中；

处理内容描述数据库，生成和视频对应的功能描述文件。

一种视频中对象搜索的方法，包括以下步骤：

处理视频文件，记录下视频中具体对象的关键字信息、在视频中的开始和结束信息，并在内容描述文件中保存一条所述具体对象的记录；

将处理好的内容描述文件按记录保存在内容描述数据库中；用户利用输入关键字的方法搜索内容描述数据库中关键字字段，返回命中的记录。

所述返回命中的记录中包括视频中某一具体对象在视频中的开始和结束信息；

提取所述具体对象在视频中的开始和结束信息，并播放所述具体对象在视频中出现到结束的片段。

一种将视频中对象导入搜索引擎的方法，包括以下步骤：打开视频文件；

记录下视频中具体对象的关键字信息、在视频中的开始和结束信息，并在内容描述文件中保存一条所述具体对象的记录；

用户播放视频时，获取视频中具体对象的关键字信息、具体对象的开始和结束信息，并在所述具体对象在视频中出现到结束的这段时间内，将关键字信息导入搜索引擎，并返回搜索结果。

一种将视频和网页结合的播放器系统，包括视频播放模块、功能描述文件解析模块和浏览器模块：

所述将视频和网页结合的播放器系统，可以通过视频播放模块播放视频，并在视频播放的时候，通过功能描述文件解析模块解析视频对应的功能描述文件，并根据功能描述文件中的 URL取回网页，并将所述网页在浏览器模块中播放；

视频播放模块具体包括视频解码程序，用于解析并播放视频文件；

功能描述文件解析模块用于解析功能描述文件，解析出需要取回 URL的位置；

浏览器模块用于浏览从 URL取回的网页。

与现有技术相比，本发明实施例具有以下优点：

本发明实施例中，通过对视频的分析生成内容描述文件，并通过数据库的方式来管理内容描述文件生成的表项，然后根据实际需求生成视频的功能描述文件，该功能描述文件可以通过网络获取的信息自动生成，这样就大大筒化了对视频处理的流程，提高视频处理的效率。本发明实施例还提出了视频对象搜索的方案，可以对视频中出现的对象进行快速搜索，并播放视频中含有搜索对象的片段。这样，视频内容可以被轻松提取，有效管理，并可以很方便的设置广告和各种功能，使视频中内容的潜在价值得到充分利用。通过本发明实施例，还可以通过视频内容描述文件编辑系统，高效的编辑视频生成视频描述文件，而且可以通过视频和网页结合的播放器系统进行播放。视频成为了一级媒体，其它的相关媒体在视频的基础上进行播放，成为二级媒体。附图说明

图 1是本发明中处理视频方法的流程图；

图 2是本发明中利用网站生成视频功能描述文件示意图；图 3是本发明中利用关键字搜索视频中对象并播放的流程图；图 4是本发明中将视频描述文件导入搜索引擎的流程图；图 5是本发明中视频和网页结合的播放器系统示意图；图 6是本发明中视频和网页结合的播放器界面示意图；图 7是本发明中生成视频内容描述文件的编辑系统示意图；图 8是本发明中生成视频内容描述文件的编辑系统界面示意图；图 9是本发明中视频对象运动轨迹拟合算法示意图；

图 10是本发明中视频对象运动轨迹平面投影示意图。具体实施方式

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

本发明的基本构思为：对视频进行预处理，生成视频的内容描述文件，然后将内容描述文件加载到数据库中进行集中管理，然后再根据对视频的实际需要，生成和视频对应的功能描述文件，这一个过程可以自动完成。通过内容描述文件和功能描述文件的生成，可以产生很多复杂的应用。这些应用可以让视频中有价值的对象被充分利用起来，产生巨大的商业价值。

本发明中处理视频方法的流程图，如图 1所示，对于任何一个需要编辑的文件，必须先将其打开，把需要编辑的部分调入内存中，即打开视频文件 110, 然后通过视频内容描述编辑系统对打开的视频文件进行编辑，并记录下视频中具体对象的描述信息 120, 并把具体对象的描述信息形成记录保存到内容描述文件中 130。在本发明的内容描述文件中，可以记录视频中对象出现的开始或结束信息（包括时间或帧的信息），视频中对象的关键字。在此基础上可以选择地记录下对象出现的位置或轨迹。这里可以采用三种方法来记录视频中对象的位置或轨迹：

第一种，采用专利号 CN200610046026.5的方法对视频对象进行提取，采用矩形或橢圓的方法来标识视频中对象的范围，在每次运动的拐点处（即运动轨迹发生较大改变时），加入关键帧，然后采用内插的方法来拟合整个对象在视频中运动的轨迹；

第二种，也可以采用图 9中的改良算法，更方便地对对象运动的轨迹进行提取；

第三种，采用人工手动的方法标记视频中对象在出现的第一帧的位置，然后通过跟踪算法自动跟踪物体运动的方向，形成物体运动的轨迹，例如可以采用基于运动补偿的 Snake视频对象跟踪算法。

为了能够很好地管理内容描述文件，可以将内容描述文件加载到内容描述数据库 140, 在数据库中分对象条目进行保存。获取视频功能描述信息并由数据库生成功能描述文件 150, 例如通过从网络上获取对象的功能描述而自动生成视频的功能描述文件，首先，通过网站和内容描述数据库相连，可以在网站上生成视频对象的开始结束信息、视频源信息、关键字信息等多种信息，如果登陆网站的用户需要在视频对象上加入广告信息，则可以通过视频描述数据库选择需要加入广告的视频对象，然后把编辑好的广告和视频对象建立关联（这里的关联信息，实际上就是视频对象的功能描述信息），然后把需要加载广告的视频对象逐一加好，最后由内容描述数据库针对每一个不同的视频对象生成一个对应的视频功能描述文件，该文件和视频——对应。再将视频相关功能描述文件和视频提供给视频用户，并对功能描述文件解析，实现预先设定功能 160, 例如广告功能。

这里的内容描述数据库实际上是一个保存内容描述文件的存储管理概念，实际上内容描述数据库是一个可选的部件。这里完全可以将每一个视频生成一个内容描述文件，这一文件同样可以被编辑，加入功能描述，从而形成功能描述文件。功能描述文件可以在视频描述文件的基础上添加功能描述而成，功能描述当然也可以保存在生成内容描述文件中，加入了功能描述的内容描述文件实际上就是功能描述文件了。这里之所以提出内容描述文件和功能描述文件两个描述文件的概念，主要是为了将内容的提取和功能描述的添加这两个过程进行分离，而这种内容和功能的分离，可以提高编辑效率和方便功能加入。

由于自动识别视频中的对象，在现阶段根本不可行，因此在利用视频内容描述文件编辑系统来编辑视频时，需要人工来识别视频中的对象，来加入关键字，例如，视频中出现"可口可乐"，则可以添加"饮料"、 "可口可乐"等相关的关键字到该对象（可口可乐）生成的内容描述文件的记录中去。关于对象在视频中的出现和结束，也需要人工参与，但是非常筒单，只需要几次点击，然后加入关键字即可，具体流程参考图 7和其详细叙述。

对于视频中对象的区域信息生成的具体流程和详细说明参考图 7 和其详细叙述。

图 2为本发明中利用网站生成视频功能描述文件示意图，也包含整个系统从视频制作加工到生成内容描述文件到生成功能描述文件到最终用户的系统结构。总体来说包括这样几个部分，视频资源库 210 (例如视频网站、电视台等拥有大量视频的系统）、视频内容描述文件编辑系统 220、内容描述数据库 240、视频功能获取网站 250 (例如，一个视频广告交易平台，该平台和内容描述数据库相连，广告商可以在交易平台上选择需要添加广告的视频对象，然后自动生成视频功能描述文件，用于在视频播放时自动投放广告）、视频和网页结合的播放器系统 270。通过以上系统及网站的配合，才能为视频主动添加并实现服务功能。具体步骤如图 2所示，首先，从视频资源库 210 中提取视频文件，并将视频文件放入视频内容描述文件编辑系统 220 , 然后通过对视频文件的编辑生成内容描述文件 230, 所述内容描述文件 230被加载到内容描述数据库 240中，可以在内容描述数据库 240 中查看每一个视频对象是在哪一个视频文件中，并且可以看到其开始和结束信息及关键字信息。这时，需要将视频对象信息发布到视频功能获取网站 250上，通过网站输入的方法，为相关的视频对象添加适当的功能，例如，可以在视频功能获取网站上查到汽车相关的视频对象 100个，如果为这 100个对象购买汽车广告，则会将汽车广告的信息放入对应视频的视频功能描述文件 260中，这样这 100个含有汽车的视频在播放时，如果汽车对象出现，则会马上在视频和网页结合的播放器系统 270中播放加入的汽车广告。由图 2还可以看出，视频文件和该视频文件对应的视频功能描述文件 260在视频播放时要传输到同一个用户的视频和网页结合的播放器系统才能正常播放视频和实现功能描述文件定义的功能。

这里的视频功能获取网站 250 可以提供内容描述数据库的检索操作，并将被检索到的记录用网页形式提供给用户，例如，在网站中搜索"车"，会将关键字为 "车"的内容描述数据库的记录返回到用户所在此不作更细致描述。

图 3为本发明中利用关键字搜索视频中对象并播放的流程图。要完成对视频对象的搜索，首先需要处理视频文件，记录下视频中具体对象的关键字信息、在视频中的开始和结束信息，并在内容描述文件中保存一条所述具体对象的记录，生成视频内容描述文件 310; 然后将视频描述文件导入内容描述数据库中 320; 最后，通过软件接口或网页接口连接数据库接口，搜索对象关键字，返回搜索结果，搜索结果中包含有视频对象的开始和结束信息 330, 并可以按照开始和结束信息播放选定的对象 340。这里面需要应用到对视频中指定时间段或指定视频帧的播放技术，但是这项技术在含有 "飞梭 "条的视频播放器中均得到解决，在此不再赘述。这种视频对象搜索方式可以只播放视频中搜索对象从开始出现到对象消失的全部过程，而不播放其它不含有搜索对象的视频内容，可以大大提高视频搜索和编辑效率。图 4为本发明中将视频描述文件导入搜索引擎的流程图。生成视频内容描述文件 230之后，就会建立起一个视频和该视频内容描述文件 230的——对应关系，而视频内容描述文件 230中又含有一个或多个视频对象记录，每一个视频对象记录包含这个视频对象的关键字和开始结束等关键信息，如果将视频内容描述文件 230中的视频对象指向某个具体的搜索引擎，就可以回返对这个视频对象关键字搜索的结果。对于该方法来说，实际上就是将内容描述文件 230的对象记录按时间先后将关键字导入到搜索引擎 430或知识库（Wikipedia ), 并返回结果，以上过程可以自动完成，可以让用户在观看视频同时获取更多相关信息。这里视频播放模块 410和普通的视频播放器相同。

图 5为本发明中视频和网页结合的播放器系统示意图，该系统包括视频播放模块 610、功能描述文件解析模块 620和浏览器模块 630: 视频和网页结合的播放器系统 600可以通过视频播放模块 610播放视频，并在视频播放的时候，通过功能描述文件解析模块 620解析视频对应的功能描述文件，并根据功能描述文件中的 URL ( Uniform Resource Locator, 统一资源定位符 )取回网页，并将所述网页在浏览器模块 630中播放；

视频播放模块 610具体包括视频解码程序，用于解析并播放视频文件，通过网络和视频资源库相连；其中视频资源库用于存储视频；功能描述文件解析模块 620用于解析功能描述文件，解析出需要取回 URL的位置，并和功能描述文件服务器 520相连；其中功能描述文件服务器 520 用于存储功能描述文件；功能描述文件解析模块 620还和浏览器模块 630相连，将 URL输入浏览器模块 630;

浏览器模块 630用于浏览从 URL取回的网页，这里 URL可以是放在广告网站 530中的某条广告地址。

图 6为本发明中播放器示意图，包含视频播放界面 650和 Web 界面 640,这种界面最大特点就是播放器中含有 Web界面，并且 Web 界面 640还会跟着视频对象的不断变化而变化。这一点是以视频为主导来驱动 Web的改变的，和现有的技术以 Web为主导来驱动视频的改变有根本的区别。

图 7为本发明中生成视频内容描述文件的编辑系统示意图，生成视频内容描述文件的编辑系统 700包括视频播放模块 710和参数编辑模块 720:

视频内容描述文件的编辑系统 700, 其功能在于可以通过打开视频文件，在视频播放的过程中对视频进行编辑，并生成视频内容描述文件；其中内容描述文件至少包括：视频中对象的关键字信息、视频中对象的开始和结束信息；

视频播放模块 710 至少包括播放视频功能，并且视频播放模块 710 可以感知鼠标在视频中的点击位置和 /或时间信息和 /或帧位置信息，将位置和时间信息保存在内存中；并可以将点击位置和 /或时间信息和 /或帧位置信息显示在参数编辑模块 720 中，显示效果如图 8 中所示。视频播放模块 710和视频资源库 210相连用于获取视频，并且视频播放模块 710还和参数编辑模块 720相连，将获取视频内参数传递到参数编辑模块 720;

参数编辑模块 720至少包括关键字区域，用于输入视频内容对应的关键字信息；参数编辑模块 720可以从视频播放模块 710处获取视频内参数结合关键字信息可以生成内容描述文件 230。这里关键字信息（视频外参数）来自手工输入设备 730从编辑系统 700的外部进行输入。生成的内容描述文件 230可以保存在内容描述数据库 240中。

利用图 7系统编辑视频生成内容描述文件时，内容描述文件可以选择是否记录下视频对象在视频中的相对位置。对于记录下的视频对象的相对位置的情况，可以再利用图 9中算法，跟踪视频对象的运动轨迹。

对于不需要记录视频对象在视频中位置的情况，编辑时通常按以下步骤完成：

第一步，打开视频资源库 210中视频进行播放；

第二步，发现有价值的视频对象，例如有广告价值的任何视频对象，并暂停播放视频；第三步，在参数编辑模块 720中获取视频对象出现信息，如时间，通过手工输入设备 730输入关键字信息到参数编辑模块 720, 然后继续播放视频，直到所述有价值的视频对象消失时，再次暂停，并在参数编辑模块 720中获取视频对象结束信息；

第四步，将所述有价值的视频对象和关键字以及开始和结束信息保存到内容描述文件 230, 并形成关于所述有价值视频对象的一条记录。

对于需要记录视频对象在视频中位置的情况，编辑时通常按以下步骤完成：

第一步，打开视频资源库 210中视频进行播放；

第二步，发现有价值的视频对象，例如有广告价值的任何视频对象，并暂停播放视频；

第三步，在参数编辑模块 720中获取视频对象出现时间信息，并点击视频中视频对象的中心位置，获取视频对象在视频中的相对位置，并将其坐标保存到参数编辑模块 720中；

第四步，继续播放视频，发现视频对象运动方向有改变时，再次暂停，获取视频对象出现时间信息，并点击视频中视频对象中心位置，再次获取视频对象在视频中的相对位置，并将其时间信息和坐标保存到参数编辑模块 720中；

第五步，重复第四步，直到视频对象在视频中消失；

第六步，通过手工输入设备 730输入关键字信息到参数编辑模块

720;

第七步，将所述有价值的视频对象、及其位置信息、关键字、开始和结束信息保存到内容描述文件 230, 并形成关于所述有价值视频对象的一条记录。

图 8为本发明中生成视频内容描述文件的编辑系统界面示意图。界面主要包括两部分，分别为视频播放界面 820 (后台有一套解码设备）和参数编辑界面 810。视频播放界面 820可以通过开始、结束和暂停按钮来控制视频播放。而参数编辑界面 810主要显示来自视频播放的参数，包括视频对象开始和结束的时间、对象位置等信息，并且参数编辑界面 810还用来输入视频对象的关键字信息，例如，视频中出现一个车的对象时，可以在关键字中输入"车"。总体来说，参数编辑界面 810要完成对视频对象的编辑，至少要包括关键字、对象位置、开始和结束等视频对象信息。然后才能将这些对象信息生成视频内容描述文件，并最终生成视频功能描述文件。如果为了方便起见，也可以将视频功能描述信息在参数编辑界面 810中加入，例如，需要激活的 URL的信息等，这样可以直接生成视频功能描述文件。

例如，图 8中，车在时间 0012: 1211时出现在 A ( 30, 100 )位置，车在时间 0013: 2019时出现在 B ( 100, 100 )位置，就可以得到图 8中参数编辑界面 810所能得到数据。

图 9为本发明中视频对象运动轨迹拟合算法示意图。对于视频对象的跟踪，其目的只有一个，知道视频中对象的位置。有时候，对象的精确轮廓变的没有意义，因此本发明关注的是视频中对象的中' -位置，并且可以通过这个中心位置对对象进行跟踪。图 9中展示了一个矩形从在视频帧 S1中 A点出现，并沿 C点、 D点运动到了帧 S2中 B点的过程，其中 A、 B、 C、 D均为运动矩形的中点。 XY坐标表示帧平面， T坐标表示时间轴，假设 S 1到 S2帧之间还有数个帧，如何才能标记出矩形运动的轨迹呢？本发明使用二次线性内插的方法来解决。图 10为视频对象运动轨迹平面投影示意图，将矩形的全部中心轨迹投影到 XT平面会得到矩形运动中心沿 X轴方向的投影在时间轴上构成的曲线。同理可以得到矩形中心在 YT平面上投影曲线。而且可以记录下 C点的时间坐标 S3 (及 S3帧的位置，由于帧之间的时间差是一定的，帧的位置可以决定时间的相对位置），以及记录下 D 点的时间坐标 S4。这样图 10中 XT平面的四个点就出现了：

( Sl、 Ax )、（S3、 Cx )、（S4、 Dx )、（S2、 Bx )

然后采用内插公式将以上四点拟合为一条在 XT平面上的连续曲线 M, 根据选取的内容方法不同可以得到不同的集合效果，例如，曲线三阶导数连续等。采用同样的方法可以得到一条在 YT平面上的连续曲线 N。最后将 XT中得到的拟合曲线 M和在 YT平面上的拟合曲线 N,在坐标系 XYT中合成，即可得到一条在 XYT坐标系下连续的曲线 L, L也可以大概表示出矩形的运动轨迹。由于这种运动轨迹的提取，可以使视频在播放时感知视频对象的位置，通过对视频的对象的感知，则可以在视频中建立跟踪视频对象的热点区域，这个区域为 ^艮多视频的引用提供的可能，例如，视频购物，我们可以通过点击视频中的对象，完成对视频的购买等。本发明实施例所描述的技术可以用硬件、软件、或组合执行。如果用软件执行，则该技术可以直接指包含程序代码的计算机可读介质，该程序代码在对视频序列进行编码的设备中执行。在该种情况下，计算机可读介质可以包括 RAM ( Random Access Memory , 随机存储器）、 SDRAM ( Synchronous Dynamic RAM, 同步动态随机存储器）、 ROM ( Read Only Memory,只读存储器；)、 NVRAM ( non-volatile RAM 非易失性随机存储器）、 EEPROM ( Electrically-Erasable Programmable Read-Only Memory, 电可擦除只读存储器）、 FLASH (闪存）等。

以上公开的仅为本发明的几个具体实施例，但是，本发明并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims

权利要求

1、一种处理视频的方法，其特征在于，包括以下步骤：处理视频文件，生成和视频内容对应的内容描述文件；处理所述内容描述文件，为内容描述文件中一条或多条记录添加功能描述，生成功能描述文件；

2、如权利要求 1所述处理视频的方法，其特征在于，所述处理视频文件，生成和视频内容对应的内容描述文件，包括以下步骤：打开视频文件；

记录下视频中具体对象的描述信息；

3、如权利要求 2所述处理视频的方法，其特征在于，所述记录下视频中具体对象的描述信息，至少包括： 1 )所述具体对象的关键字信息； 2 )所述具体对象的开始播放和结束播放信息；

所述具体对象的开始播放和结束播放信息可以表示为所述具体对象出现的开始帧和结束帧信息和 /或所述具体对象出现的开始时间和结束时间信息；

4、一种生成视频内容描述文件的编辑系统，其特征在于，包括视频播放模块和参数编辑模块：

所述视频播放模块至少包括播放视频功能，并且视频播放模块可以感知鼠标在视频中的点击位置和 /或时间信息和 /或帧位置信息，并将位置和时间信息保存在内存中；所述视频播放模块和视频资源库相连用于获取视频，并且所述视频播放模块还和参数编辑模块相连，将获取视频内参数传递到参数编辑模块；

所述参数编辑模块至少包括关键字区域，用于输入视频内容对应的关键字信息；所述参数编辑模块可以从视频播放模块处获取视频内参数结合关键字信息可以生成内容描述文件。

5、一种通过网络获取功能描述信息，并生成功能描述文件的方法，其特征在于，包括以下步骤：

处理内容描述数据库，生成和视频对应的功能描述文件。

6、一种视频中对象搜索的方法，其特征在于，包括以下步骤：处理视频文件，记录下视频中具体对象的关键字信息、在视频中的开始和结束信息，并在内容描述文件中保存一条所述具体对象的记录；

7、如权利要求 6所述视频中对象搜索的方法，其特征在于，所述返回命中的记录中包括视频中某一具体对象在视频中的开始和结束信息；

8、一种将视频中对象导入搜索引擎的方法，其特征在于，包括以下步骤：

打开视频文件；

9、一种将视频和网页结合的播放器系统，其特征在于，包括视频播放模块、功能描述文件解析模块和浏览器模块：

视频播放模块具体包括视频解码程序，用于解析并播放视频文件，通过网络和视频资源库相连；所述视频资源库用于存储视频；功能描述文件解析模块用于解析功能描述文件，解析出需要取回 URL 的位置，并和功能描述文件服务器相连；所述功能描述文件服务器用于存储功能描述文件；功能描述文件解析模块还和浏览器模块相连，将 URL输入浏览器模块；

浏览器模块用于浏览从 URL取回的网页。

10、一种在视频中跟踪运动对象的算法，其特征在于，包括以下步骤：

获取视频中连续运动对象在多个非连续帧中的参考点坐标，以及这多个参考点对应帧的时间坐标；

通过内插的方法，利用参考点坐标和时间参数，生成穿过所述参考点的连续曲线；所述连续曲线具有跟踪所述运动对象的性质。