CN101834837A

CN101834837A - 基于宽带网络的旅游景区景点在线景观视频主动信息服务系统

Info

Publication number: CN101834837A
Application number: CN200910242545A
Authority: CN
Inventors: 杜军平; 孙波; 王宝增; 王肃
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2009-12-18
Filing date: 2009-12-18
Publication date: 2010-09-15

Abstract

本发明从互联网、电信网络和广电网络采集视频资源，通过视频信息的分类和挖掘，向各类用户提供基于宽带网络的视频智能推拉服务。系统将需检索的视频信息进行特征提取、视频标注等处理，利用智能匹配技术，根据用户需求在打上标签的视频源数据库中进行检索，将视频流根据用户终端类型进行处理后传输。本发明提出的方法为用户提供的服务效率高，实时性好，具有较高的应用价值。

Description

基于宽带网络的旅游景区景点在线景观视频主动信息服务系统

技术领域

本发明属于旅游信息化领域，具体涉及依据用户兴趣模型为用户提供个性化主动视频服务。

背景技术

中国已成为世界第四大入境旅游接待国、亚洲最大的出境旅游客源国，并将形成世界上最大的国内旅游市场，因此对旅游信息化的要求也越来越高。一般的旅游信息服务系统为用户提供的服务形式简单，有以下两种方式：

1.系统主动向用户派发信息。这种方式类似于在大街上免费向路人发放报纸，以达到推广信息的目的，例如邮件信息广告。此种方法操作简单易行，但是大部分用户对此比较反感，所以该种方法在操作过程当中难点便在于如何选择用户，以及如何把握频度。目前此种方法依然存在，但已经退出了主流。

2.用户主动到系统信息平台来获取自己需要的信息。这是当前主流网络信息提供方式，例如门户信息网站。此种方法操作看似简单，实际上却很复杂，需要收集各种信息，并加以分类。此种方式是信息服务的主流，被绝大多数信息服务平台采用。采用该方法的系统平台缺乏主动性、智能性。

本发明从互联网、电信网络和广电网络采集视频资源，通过视频信息的分类和挖掘，建立用户兴趣模型，向各类用户提供个性化的视频智能推拉服务。本发明能提高旅游信息服务的质量，使信息服务更好地满足用户需求。

发明内容

本发明提出了一种旅游景区景点在线景观视频主动服务系统；系统从互联网、电信网、广电网采集视频资源，采用基于本体的多媒体融合技术加以描述，并采用聚类方法对视频分类与挖掘处理；系统通过显式和隐式两种方法采集用户兴趣信息，并依据获得的用户信息采用朴素贝叶斯方法建立用户兴趣模型，依据用户兴趣模型为用户提供个性化主动视频服务。本发明为数字旅游服务的智能化、个性化提供了解决方案。如图1所示，本发明的技术方案是这样实现的：

1.采集旅游相关视频信息；

2.对视频分类并存储；

3.采集用户兴趣信息；

4.基于采集到的用户兴趣信息构建用户兴趣信息模型；

5.基于用户兴趣模型为用户提供个性化旅游视频服务。

本发明有以下一些技术特征：

(1)步骤1所述的视频信息是指从电信网、互联网及广电网中采集的旅游相关视频信息，并将采集到的各种视频信息存储到视频库中；

(2)步骤2所述的过程采用基于时间的视频聚类技术对视频加以分类；

(3)步骤3所述的采集用户兴趣信息过程采用隐式及显式两种方法，显式方法即为用户直接向系统提交个人兴趣描述的方法，隐式方法即为提取并分析用户历史操作记录，从中提取出反映用户兴趣信息的内容；

(4)步骤4所述的构建用户兴趣模型的方法是采用朴素贝叶斯方法构建用户兴趣模型；

(5)步骤5所述的个性化旅游视频服务是指用户获得的旅游视频服务都是经过基于用户兴趣模型的方法处理，使不同的用户获得不同的服务，最大限度的满足用户的兴趣需求。

本发明提出了一种基于用户兴趣模型的旅游信息个性化服务方法，此方法切实可行，能满足用户的需求。

附图说明

图1旅游景区景点在线景观视频主动信息服务系统；

图2基于“三网融合”技术的旅游视频智能推拉；

图3旅游景区景点在线景观视频主动信息服务系统结构；

图4视频智能推拉系统结构；

图5旅游景观多媒体信息本体的构建；

图6基于本体的多媒体信息语义检索系统；

图7旅游视频标注框架；

图8视频推送、拉取模型；

图9用户兴趣信息获取方式；

图10视频搜索排序模块工作流程图；

图11用户反馈模块工作流程图；

图12系统前台架构；

图13用户服务模型；

图14旅游视频推送服务流程图；

图15视频拉取服务流程图。

具体实施方式

旅游景区景点在线景观视频主动信息服务系统如图1所示。系统从互联网、电信网络和广电网络采集视频资源，通过视频信息的分类和挖掘，向各类用户提供视频智能推拉服务。系统将需检索的视频信息进行特征提取、视频标注等处理，利用智能匹配技术根据用户需求在打上标签的视频源数据库中进行检索，将视频流根据用户终端类型进行处理后传输。基于“三网融合”技术的旅游视频智能推拉如图2所示。本发明针对在线景观视频主动信息服务系统中涉及的视频标注、智能推送和基于本体的多媒体信息融合及语义检索等关键技术进行了研究。

系统结构：系统中用户界面主要用于用户登录、注册、描述用户的视频查询要求、对推送的视频进行反馈评价；兴趣知识库是通过监控用户的行为，再经过分析后总结抽象出的有关用户的知识，是一系列能体现用户习惯和兴趣的引导图。此外，模型中有四个功能模块相互协作：用户兴趣获取、视频搜索排序、用户反馈和视频推拉模块。系统结构如图3所示。

用户兴趣获取：主动从用户兴趣知识库中提取用户的兴趣引导图，据此分析用户的需求，避免无用搜索。

视频搜索排序：根据用户兴趣搜索用户所需视频，并进行相关兴趣度排序，截取用户可以接受的推送视频数量。

用户反馈：收集用户对推送视频的反馈评价信息，并更新到兴趣知识库。

视频推送拉取：将按照用户兴趣进行搜索排序得到的视频整理后，推送给终端用户。

1.视频智能推拉模型引入

在主流的视频服务网站中，视频获取方式是按“拉”(Pull)的模型进行的：服务器根据用户发送的服务请求进行处理并返回用户所需的结果。在“推”(Push)系统中，服务器把视频“推”给用户机系统。虽然两者数据传输的方向都是从服务器流向用户，但操作的发起者是不同的。从视频源与用户的关系分析，信息的流动可分为两种模式：即信息推送与信息拉取模式。

视频智能推拉技术是将推送模式与拉取模式结合，使二者优势互补，并且结合了人工智能、知识发现和智能Agent及数据库等技术，在用户需求模糊的情况下，主动向用户提供有价值的视频服务。视频智能推拉技术的产生，可以提高网络及数据库的智能水平，从而在根本上解决“推送”和“拉取”技术应用过程中所遇到的难题，即如何从海量视频资源中提取有用视频，为不同用户提供个性化的视频主动服务等。视频智能推拉技术如图4所示。

视频智能推送：采用多模块相互协作的方式，结合人工智能、机器学习方法，可以获取和预测用户的兴趣或偏好，从而有针对性地向用户主动推送所需视频，以满足不同用户的个性化需求。

视频智能拉取：应用知识工程的知识推理搜索方法，可提高搜索引擎的快速性和准确度，从而用户可以更及时地拉取所需的最新动态视频。

视频推拉结合：视频推送与拉取相结合，可取长补短。根据Pull的历史趋势，加强Push的针对性；利用Pull历史和Push的功能，提高Pull的效率。这样既可及时地、主动地将最新视频推送给用户，又可有针对性、选择性地满足用户个性化需求。

知识发现功能：采用知识发现的方法和技术，可从用户所选择“推送-拉取”的视频标签和摘要信息中提取用户兴趣知识，发现隐藏在大量数据中的内在规律。综上所述，视频智能推拉技术能够较好地解决面向个性化的旅游景观视频获取问题。

2.基于本体的多媒体信息融合及语义检索

本发明采用基于本体的描述方法处理旅游景观多媒体信息的元数据，分析旅游景观本体模型的核心概念及概念间的关系。出于本体资源可重用性和开发协同性的考虑，所有媒体概念和属性类本体按照不同的媒体格式分别定义在不同的本体文件里，在文件中利用owl：imports属性在各个本体文件之间实现资源调用，如图5。所有的owl文档存储于关系数据库中，通过查询获取关系数据库中相关信息的存储地址。

本发明选用OWL(Web Ontology Language)作为本体形式化描述语言，OWL的优点是定义完备，以Web资源为描述对象，而且是W3C的推荐标准，而多媒体信息资源适合于网络传播和浏览。

对于概念、概念的层级关系、属性的定义域和值域以及实例部分的编码，可以通过本体构建工具进行操作，再通过导出功能获取owl代码，但是对多媒体信息的语义特征描述的部分则需要在MPEG-7框架下进行编码。为了在owl建模语言中结合MPEG-7提供的描述语言对多媒体信息进行描述，我们采用将MPEG-7多媒体标准映射到RDFS的方法，生成基于RDFS的MPEG-7语义元数据通用参考模型，实现广泛的信息共享和互操作性。因为MPEG-7与RDFS的语法都是基于XML的，所以基于RDFS结构对MPEG-7进行扩展可以呈现MPEG-7的隐含语义。

具体方法是：首先将MPEG-7中的XML Schema结构转换到RDFS框架中(称为XSD2RDFS转换)，构建MPEG-7RDFS多媒体语义元数据参考模型，借助RDFS框架捕获MPEG-7的隐含语义，使得XMLSchema中原来隐含的语义变得清晰。XML Schema和RDFS之间的转换如表1所示。然后，将XML表示的多媒体实例映射到RDF。最后以MPEG-7 RDFS作为集成中心，集成不同来源的多媒体元数据。

表1 XSD2RDFS转换关系

XML Schema	RDFS	相同的语义信息
XML Schema	RDFS	相同的语义信息	Element\|attribute	Rdf：Property	命名一个属性
Element@substitution-Group	Rdfs： subPropertyOf	可以替代更具一般关系的关系	Element\|attribute	Rdf：Property	命名一个属性
Element@substitution-Group	Rdfs： subPropertyOf	可以替代更具一般关系的关系	element@type	Rdfs：range	数据类型
extension@base\|restriction@base	Rdfs：subClassOf	派生的基类型	element@type	Rdfs：range	数据类型

通过集成不同来源的多媒体元数据，即使同一主题的所有信息以不同的名字、不同的媒体形式存储在不同的多媒体系统中，通过语义检索和推理，也可以检索到同一主题的所有相关信息。因此，在基于本体的多媒体信息融合基础上，建立了基于本体的多媒体信息语义检索系统。系统采用三层体系结构，分别是语义元数据生成与管理层、数据存储与管理层和应用层，如图6所示。语义元数据生成与管理层的主要功能是多媒体数据的抽取并根据MPEG-7RDFS多媒体语义元数据参考模型进行语义标注、语义元数据编辑。语义元数据生成模块采集多媒体数据并抽取相关元数据；语义标注模块采用基于半监督学习的旅游视频标注算法等实现对多媒体内容的语义概念标注。

数据存储与管理层采用关系数据库对多媒体库及其索引库、语义元数据库及其索引库进行存储和管理。后端处理模块则包括聚类和索引子模块、安全访问控制子模块。通过对多媒体信息的自动聚类，便于建立索引，从而提高检索效率。根据用户兴趣和访问历史，为用户建立并动态维护信息目录，实现智能化的信息推送。应用层提供基于语义的检索、基于内容的检索和基于文本的检索等多种检索方式。基于文本的检索根据用户提交的关键词进行查询；基于内容的检索采用相关反馈检索技术实现基于多媒体特征的查询；基于语义的检索采用自然语言理解、基于本体的概念推理等技术实现反映主题语义的检索。

3.基于半监督学习方法的旅游视频标注

利用混合高斯模型(GMM)作为基本模型，以最大似然线性回归(MLLR)方法进行模型自适应更新，建立视频标注框架，如图7。

4.基于时间限制的视频预聚类

为了能有效地利用视频中概念的时间相关性和局部聚集性特点，对视频集中的镜头进行了预聚类处理。预聚类主要是根据镜头之间的视觉相似程度以及它们在时间上的相关性，以过分割的形式进行的。过分割的目的在于使所得聚类中每个镜头表示的语义概念尽可能一致。为了减少计算量，利用关键帧提取技术，以有限的关键帧集合替代镜头中的全部帧，计算镜头间的特征差异。同时，在聚类过程中考虑概念的时间相关性，即由于“语义鸿沟”的存在，对于在时间上间隔很远的两个镜头，即使它们之间的视觉相似度很高，也很难确定是否表达的是同一个概念，因此考虑镜头之间的时间限制，在聚类的相似度度量中引入了时间窗参数T，最终的镜头差异度量定义如下：

D (S_{i}, S_{j}) = \{\begin{matrix} \min_{\underset{1 < m < M^{'}}{1 < k < K^{'}}} d (f_{ik}, f_{jm}), ifi - j \leq T \\ \infty, otherwise \end{matrix} - - - (1)

其中d()是任意两个关键帧之间的特征差异。当两个镜头之间的特征差异小于某个给定门限时，则认为它们是相似的，或者说属于同一个镜头聚类。

5.聚类中的概念统一化方法

经过预聚类后，假设同一聚类中镜头表达的是相同的概念。这样，只要保证分类器具有一定的准确性，在聚类中那些错分的孤立样本(镜头)就可以通过一个概念统一化过程进行更正。对一个具有N个镜头的聚类C1＝{x₁，x₂，...，x_N}，概念统一化的目标就是从给定的待标注概念集合{l₁，l₂，...，l_M}中找到合适的标注l_i赋给聚类C1中的全部镜头。假设在同一个聚类中各镜头所对应的特征矢量之间是相互条件独立的，则聚类后验概率可以表示为：

P (l_{k} | Cl) = P (l_{k} | x_{1}, x_{2}, \cdot \cdot \cdot, x_{N}) = \frac{P (l_{k}) Π_{i = 1}^{N} P (x_{i} | l_{k})}{Σ_{j = 1}^{M} P (l_{j}) Π_{i = 1}^{N} P (x_{i} | l_{j})} = \frac{\frac{Π_{i = 1}^{N} P (l_{k} | x_{i})}{P {(l_{k})}^{N - 1}}}{Σ_{j = 1}^{M} \frac{Π_{i = 1}^{N} P (l_{j} | x_{i})}{P {(l_{j})}^{N - 1}}} - - - (2)

其中P(l_i)是概念l_i的先验概率分布，P(x_k|l_i)是镜头x_k标注为概念l_i的条件概率。根据所估计的聚类后验概率P(l_k|C1)，聚类类别可通过最大后验概率准则确定。同时计算分类结果的置信度得分：

ψ (Cl) = \sqrt{P_{\max} P_{m \arg in}} - - - (3)

其中Pmax＝{P(l_i|C1)，i＝1，2，...，N}，即取聚类标号所对应的最大后验概率。Pmargin＝Pmax-max{P(l_j|C1)，i！＝j，j＝1，2，...，N}，即最接近最大后验概率的竞争概念的后验概率。

6.基于GMM的互适应方法及标号更正

首先设定门限保证选择样本的准确性；然后按照置信度的不同，对未标注样本的预测结果进行标号更正；更正后的样本作为自适应数据集，对分类器模型进行自适应的更新。

7.基于最小熵准则的聚类调整

由于某特定概念在底层特征空间上分布的复杂多样性，而镜头集的预聚类是在没有结合任何语义信息的情况下以过分割方式进行的，因此不可避免的存在着错误。在这种情况下，简单的将所有聚类的镜头赋于同一类别标号，将会人为地引入错误。在这里采用最小熵准则，利用分类结果对聚类进行调整，使调整后的聚类信息在语义概念上更为一致。定义聚类中的语义熵：

e n_{c} = - \underset{i &Element; {0,1, \cdot \cdot \cdot, M}}{Σ} \frac{N_{i}}{Σ N_{i}} \log (\frac{N_{i}}{Σ N_{i}}) - - - (4)

Ni为在聚类中各个样本属于不同待标注概念的个数。当聚类中语义熵较大时，说明该聚类中的预测结果较不一致。因此通过聚类分裂可获得具有良好一致性的子聚类，此时再假设这些子聚类具有相同标号比较合理。子聚类是通过递归方式获得的，在每一次递归过程中按如下公式确定最优的分割点：

k = \underset{s}{\arg \min} ({en}_{{f (x_{1}), f (x_{2}), \cdot \cdot \cdot, f (x_{s})})} + {en}_{{f (x_{s + 1}), f (x_{s + 2}), \cdot \cdot \cdot, f (x_{N})})}, 1 \leq s \leq N - - - (5)

8.视频推送和拉取模型建立

推送模型和拉取模型采用分布式的结构，将用户需求分解作用到若干个子搜索，再将各个搜索返回的结果进行综合整理，并结合用户兴趣知识库进行相关度排序，推送给用户。推送、拉取模型如图8所示。在视频推送过程中，根据用户兴趣知识库中用户的基本信息、需求信息、兴趣爱好等，提取搜索关键字并作用于各个视频数据库，最后将排序后的视频有选择地发送给相应的用户。在视频拉取过程中，用户有比较大的自主性，可以针对视频类别、查找的关键字以及视频摘要进行相关搜索。根据用户输入的拉取视频关键字，选择要查看的视频类别，包括景区宣传、景点介绍、酒店介绍、旅游产品展示等，同时结合其兴趣爱好，通过多个子搜索从相应的数据库中找到相关视频。

9.用户兴趣信息获取

系统采用显式和隐式两种用户兴趣信息获取方式。显式获取用户兴趣信息是由用户参与，直接向系统提交用户兴趣信息。隐式获取用户兴趣信息是用户不直接参与，在用户使用系统的过程中，通过分析用户的行为，间接获得用户的兴趣信息。显式获取用户兴趣信息是通过用户对自己的兴趣爱好的描述，向系统提交兴趣爱好的文本描述。隐式获取用户兴趣信息主要采用三种方式，一是将用户的视频播放历史记录作为用户兴趣爱好的一种反映；二是将用户的查询记录作为用户兴趣爱好的参考；三是将用户创建的视频收藏夹作为用户兴趣的集中体现。还要记录用户的非感兴趣视频信息作为用户不感兴趣的视频信息描述。图9描述了用户兴趣信息获取的方式。

10.兴趣知识库的创建

本系统关键是进行机器自学习而获取用户的兴趣知识库，将用户在系统平台上的浏览活动记录下来，结合用户注册资料，然后依据一定的算法从中抽取出用户兴趣引导图，建立用户兴趣知识引导库，作为系统已学习到的视频推送经验。兴趣知识引导库中的每条记录由浏览结点的文档名，文档中的关键词向量及对应的关键词的权重向量及父文档名组成。文档中的关键词向量及对应的关键词的权重向量具体处理过程是先将文档变为一个词集，该词集形成关键词向量，词集中每个词的词频形成词频向量，该词频向量进行归一化，形成关键词权重向量。

用户兴趣引导图的抽取方法：在用户的浏览序列中，首先利用文档间的链接关系将用户某一次浏览活动中访问过的全部文档序列划分为若干个浏览区域即有向图，再将浏览区域组成若干个相似类，每个相似类就认为是一个引导图，具体算法如下：

设D中<d1，d2，...，dn>是用户某一次浏览活动中按时间先后顺序访问过的全部文档序列，进行如下定义：

(1)浏览序列：设S＝<di，...，dj>是D中的某个子序列，如果对S中的任一文档dq(i≤q≤j)，都存在文档dp(i≤p＜q)使得dp中有指向dq的超链，且用户是通过这条超链接访问到dq的；并且用户没有通过S中某个文档的超链接访问dj+1；并且用户没有通过第k-1次浏览序列中的某一文档里的超链接访问di，称S为该用户的第k次浏览序列。

(2)浏览区域：以S中的文档为结点，以这些文档之间用户使用过的超链接为边构成的有向图称为该用户的一个浏览区域。

(3)相似性判别规则：设A，B是两个浏览区域，如A和B包含有重叠的部分，即有一些共同的文档；或A0＝A，A1，...，Aj＝B使得Ai-1与Ai(i＝1，…，j)是重叠的，其中j≤k(k是取2或3的常量)，此时A和B在不超过k步传递的意义下是重叠的，则称A，B是相似的。

(4)相似类的兴趣强度公式：相似类是由彼此相似的浏览区域组成，反映了用户的某种特定兴趣的信息需求，设C是一个相似类，i是C中包含的文档个数，L是本次浏览的文档总数，n是C中含有的浏览过程的个数，N是用户浏览过程的总数，则F(C)＝(i/L+n/N)/2是相似类的兴趣强度计算公式。

(5)阀值：由系统指定，由于引导图是用户特别感兴趣的地方，因此阀值一般应明显高于平均兴趣强度值。

根据上面定义的相似性判别规则、用户兴趣强度计算公式和阀值，就可以从用户的浏览活动中自动地抽取引导图。考虑到用户活动的复杂性，提取出的引导图可以再经过用户的确认、编辑，生成有效的引导图。显然引导图反映了用户对特定信息的癖好，就可以据此推送给用户特定的视频。

11.用户兴趣挖掘

用户兴趣挖掘包括用户兴趣建模和用户兴趣模型更新两部分。两部分工作的基础都是已经获得的用户兴趣信息。随着用户兴趣信息的逐渐增多，用户兴趣模型将越来越完善。用户兴趣模型是系统提供个性化视频推拉联播服务的主要支持部分。所以构建一个好的用户模型对于服务质量是至关重要的。好的模型不仅要提高准确率还要有更好的效率。判断视频是否为用户所感兴趣的视频的过程可以看成是对视频分类的过程，要么归为用户感兴趣的类中，要么归为用户不感兴趣的类中。

直接根据视频内容分类不仅十分复杂，难以实现而且效率不高，为此将与视频相关的文本信息作为视频内容的描述，通过对文本进行分类，以达到对视频分类的目的。系统利用朴素贝叶斯方法建立用户兴趣模型。贝叶斯定理是计算概率的一种方法，根据贝叶斯定理，对于事件X与Y，且已知X和Y的概率，则概率P(X|Y)用公式表示为：

P {X | Y} = \frac{P {X} \times P (Y | X)}{P {Y}} - - - (6)

贝叶斯公式更形式化的定义为：设X₁，X₂...X_n为样本空间S的一个划分，Y为一个事件，且P(Y)＞0，P(X_i)＞0(i＝1，2...n)，则：

P (X_{i} | Y) = \frac{P (X_{i}) P (Y | X_{i})}{Σ_{j = 1}^{n} P (X_{j}) P (Y | X_{j})} - - - (7)

朴素贝叶斯方法是贝叶斯方法的一种简化，其前提是假设事件之间是相互独立的。利用贝叶斯方法建立用户A的兴趣模型的系统流程。

收集用户A感兴趣的视频的内容描述文本，和用户A不感兴趣的视频的内容描述文本，建立用户A的兴趣集和非兴趣集。采用分词技术提取特征源中的独立字符串，例如将“山峰”作为TOKEN串并统计提取出的TOKEN串出现的次数，即字频。用此方法分别处理兴趣集和非兴趣集中的所有视频描述文本。使每一个视频描述文本集对应一个哈希表，hashtable_interest对应兴趣集，hashtable_dislike对应非兴趣集。表中存储TOKEN串到字频的映射关系。计算每个哈希表中TOKEN串出现的概率P＝(相应TOKEN串的字频)/{对应哈希表的长度}。综合考虑hashtalbe_interest和hashtable_dislike，推断出新的视频描述信息属于兴趣视频描述的概率。

事件S：该视频描述属于兴趣视频描述，即该视频属于兴趣视频，t₁，t₂...，t_n代表TOKEN串，则P{S/t_i}表示在兴趣描述中出现TOKEN串ti时，该视频属于兴趣视频的概率。

设P1(t_i)＝(t_i在hashtable_interest中的值)，P2(t_i)＝(t_i在hashtable_dislike中的值)，则P{S/t_i}＝P1(t_i)/[P1(t_i)+P1(t_i)]，i＝1，2，...n

建立新的哈希表hashtable_probability存储TOKEN串t_i到P(S|t_i)的映射。形式为表2所示：

表2hashtable_probability

TOKEN串	兴趣视频概率
TOKEN串	兴趣视频概率	爬山	P(S\|t₁)
游泳	P(S\|t₂)	爬山	P(S\|t₁)
游泳	P(S\|t₂)	长城	P(S\|t₃)

根据建立的哈希表hashtable_probability可以根据一个视频的内容描述信息估算出其为用户感兴趣视频的可能性。对于一个视频，首先提取有关其内容描述的文本内容，根据文本内容生成TOKEN串，查询与用户A相关的hashtable_probability得到该TOKEN串的键值。假设用该视频内容描述共得到n个TOKEN串t₁，t₂...，t_n，hashtable_probability中对应的值为P₁，P₂...P_n，P(S|t₁，t₂...，t_n)表示在视频描述中同时出现多个TOKEN串t₁，t₂...，t_n时，该视频属于用户A感兴趣的视频的概率。由复合公式得：

P (S | t_{1}, t_{2}, \cdot \cdot \cdot t_{n}) = \frac{P_{1} \times P_{2} \times \cdot \cdot \cdot \times P_{n}}{[P_{1} \times P_{2} \times \cdot \cdot \cdot \times P_{n} + (1 - P_{1}) \times (1 - P_{2}) \times \cdot \cdot \cdot \times (1 - P_{n})]} - - - (8)

通过计算得到P(S|t₁，t₂...，t_n)，根据系统设定的阀值就可以判断用户是否对该视频感兴趣，依此也可对用户所感兴趣的视频进行排序。哈希表hashtable_probability即为用户A的兴趣模型。

12.视频搜索排序

系统的视频搜索排序的功能是按照兴趣知识库中用户引导图的关键词或用户主动输入，在视频库中搜索视频并进行形似度排序，然后将结果传送给视频推送模块。视频搜索排序模块的工作流程如图10所示。首先将感知的用户当前对视频的需求进行适当处理，即根据用户兴趣知识库中的引导信息来生成向搜索引擎服务器的特定请求，并接受其返回的搜索结果，然后综合搜索引擎返回的结果，形成n个与用户相关性更强的URL，将这些URL涉及的视频内容获取，然后对每个视频标签或摘要提取形成关键词向量及权重向量，再跟该用户引导图中的关键词向量及权重向量进行比较，利用相似度筛选出面向用户需求的视频，最后选出相似度最高的N个视频传送给视频推送模块。两向量W，P的相似度R可以利用余弦来衡量：

R = \cos (W, P) = \frac{\underset{k}{Σ} w_{k} p_{k}}{| p | \cdot | w |} - - - (9)

13.视频推拉结果反馈调整

反馈调整可以通过两种方式进行，即显性的用户在客户端界面上修改兴趣方式和隐性地通过分析用户浏览行为来调整兴趣的方式。用户对相关视频的浏览即是对系统的一种隐性反馈，对反馈结果进行分析可以使推送的内容更加符合用户的需求；反馈也可以主动接受获取用户的各种评价，然后调整用户的兴趣引导图，并更新到对应的兴趣知识库。反馈的工作流程如图11所示。在显性反馈时，对用户的反馈信息进行量化，把用户对推送视频的评价分为五个等级：很满意(+2)、满意(+1)、一般(0)、不满意(-1)、很不满意(-2)，用评价值f表示。隐性反馈时，由用户的行为决定反馈更新，不同行为具有不同意义，如表3所示。

表3用户行为的意义

用户行为	动作意义	等级
用户行为	动作意义	等级	加入收藏夹	高度相关	+2(很满意)
下载视频	非常相关	+1(满意)	加入收藏夹	高度相关	+2(很满意)
下载视频	非常相关	+1(满意)	浏览视频	一般相关	0(一般)
忽略视频	不相关	-1(不满意)	浏览视频	一般相关	0(一般)
忽略视频	不相关	-1(不满意)	删除视频	很不相关	-2(很不满意)

设a(0-1之间的实数)为学习速度，用于控制调整的步调。则反馈学习中用户兴趣调整公式为：

P＝P+a*f*D

其中P为用户兴趣的矢量表示，D为用户评价文档的矢量表示。

根据用户的反馈信息，对相应用户兴趣知识库进行调整，能够更精确的描述用户的兴趣和需求。

14.系统前台设计与实现

系统前台采用B/S结构设计，其总体架构如图12所示。旅游景区景点在线景观视频主动服务系统作为系统应用的总平台，主要实现视频推送、视频拉取功能以及虚拟旅游、随团旅游、自助旅游、游客信息、用户模块的接入功能。通过区分登录用户与非登录用户，向用户提供差分服务。将所有的非登录用户视为同一个用户，并在系统中为其创建一个用户，作为系统的默认用户，记录用户的操作记录，分析非注册用户的行为，了解大众兴趣趋向。对于注册用户，通过分析其个人的用户操作记录，为其创建用户兴趣模型，从而为其提供更为优质的服务。用户服务模型如图13所示。

15.用户服务模块

旅游视频推拉联播服务是系统实现的主要目的。可以将视频推拉联播服务分为视频推送服务，视频拉取服务，和视频网络联播服务三部分。视频推送服务就是根据用户的兴趣，主动将相关的视频推送给用户；视频拉取服务就是满足用户的视频查询需要，在用户以查询方式拉去视频的时候，系统将用户拉取到的视频结合用户的兴趣对视频组排序，然后再将排序后的视频推送给用户；视频网络联播服务就是由系统给定需要网络联播的内容，主要包括旅游资讯、旅游推广等信息，投放到地图平台、旅游视频网站和用户主页上，形成网络联播，扩大旅游宣传。

旅游视频推送服务的核心就是主动向用户推送用户想要的视频内容，使用户获得信息的方式更简单，更直接。推送服务的主要流程如图14所示。系统根据用户的兴趣模型从视频库中提取出用户最有可能感兴趣的视频信息，但其中必定存在用户曾经观看过的视频和用户收藏夹中的视频，将这些视频再次推送给用户已经意义不大，效果也不会好，所以就需要根据用户收藏夹中收藏的视频信息和用户观看记录将已被观看过的视频过滤掉。只需将那些用户不曾看过的与用户兴趣相关的视频和系统随机添加的“杂质”视频推送给用户。

旅游视频拉取服务采用“拉中有推”的方式，由用户进行查询，系统接收查询并进行查询操作。在用户进行视频拉取过程当中，系统结合用户兴趣模型，将排序后的结果推送给用户。在常规查询过程中，由于查询结果数据量比较大造成用户很难找到自己希望的数据的情况经常出现。系统结合用户兴趣模型对查询结果排序后，便可以在很大程度上避免这种情况的发生。提高了查询命中率，节约了用户时间。如图15所示，为旅游视频拉取服务流程图。

视频网络联播服务就是将联播内容推送到可能对此感兴趣的用户主页中去。由数量庞大的用户主页和视频网站、网络地图构成一个网络联播系统，为用户提供网络联播服务。在为一个需要网络联播的内容选择要推送到的用户主页时，结合考虑该用户的兴趣与此联播内容是否相关，尽量选择相关性比较高的用户作为联播对象，这样既可以提高联播效益，又可以节约联播资源(不必将所有的联播内容推送到所有的用户主页中去)。

Claims

1.旅游景区景点在线旅游视频主动信息服务系统，其特征在于，该方法包括：

采集视频资源；

对采集到的视频分类、特征处理、标注；

用户进入系统获得视频服务；

系统根据用户兴趣模型为用户提供主动服务(视频检索服务，相关推荐服务，主动推送服务)；

系统提取用户的操作记录，据此数据建立用户兴趣模型。

2.根据权利要求1所述的方法，其特征在于，采集来自于互联网、电信网、和广电网不同网络的旅游相关视频信息。

3.根据权利要求1所述的方法，其特征在于，采用基于本体的多媒体信息融合技术描述视频资源，选用OWL(Web Ontology Language)作为本体形式化描述语言。

4.根据权利要求1所述的方法，其特征在于，采用基于时间的视频预聚类技术对视频进行分类处理，并选用基于最小熵准则的方法对聚类进行调整。

5.根据权利要求1所述的方法，其特征在于，用户获得的主动视频服务内容包括视频拉取服务、视频推送服务和视频网络联播服务。

6.根据权利要求1所述的方法，其特征在于，系统通过显示和隐式两种方式相结合的方法采集用户兴趣信息。

7.根据权利要求1所述的方法，其特征在于，系统采用朴素贝叶斯方法构建用户兴趣模型。