CN101894351A

CN101894351A - 基于多智能Agent的旅游多媒体信息个性化服务系统

Info

Publication number: CN101894351A
Application number: CN2010102484701A
Authority: CN
Inventors: 王肃; 杜军平; 梁美玉
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2010-08-09
Filing date: 2010-08-09
Publication date: 2010-11-24

Abstract

本发明提出并建立基于多智能Agent框架结构的旅游多媒体信息个性化服务系统。本系统采用智能Agent技术，通过不断自主学习，发现和挖掘用户的兴趣，采用基于向量夹角的K-近邻算法实现自动用户兴趣建模。针对系统工作流程的每一阶段，划分功能相对独立的模块，再将各模块包装成Agent代理，形成多代理框架，在此框架下，各代理分工协作，从而实现多媒体信息服务的智能化与个性化等特点。系统主要包括用户接口Agent、过滤排序Agent、兴趣学习Agent、监控Agent和信息检索Agent五个功能模块。该发明提出的方法对于建立高质量智能化的旅游信息服务具有很高的理论意义和应用价值。

Description

基于多智能Agent的旅游多媒体信息个性化服务系统

技术领域

本发明属于旅游信息化领域，具体涉及集成多种技术，如智能代理技术、数据挖掘技术、智能信息处理技术等，建立基于多智能Agent的旅游多媒体信息个性化服务系统。

背景技术

伴随着旅游业的蓬勃发展，对旅游信息化建设的要求也越来越高。目前主流的旅游信息服务系统是通过建立Web服务站点向旅游者提供各种信息集合服务，旅游者通过浏览相关内容来获取信息。但是这种服务方式是被动的，没有充分考虑用户个体间的个性化需求，无法提供个性化的旅游信息化产品和服务。通用的多媒体搜索引擎提供信息检索服务，例如百度、搜狗，也无法提供差异服务，不能满足人们日益增长的个性化的需求，有效地返回用户感兴趣的相关旅游信息，而且经常伴随大量重复或不相关信息。因此开发一种更为主动和智能的旅游信息个性化服务成为旅游者的迫切需求。

本发明采用智能代理、数据挖掘以及智能信息处理等技术，设计和实现基于多智能Agent的旅游多媒体信息个性化服务系统。根据用户兴趣模型的分析结果，有针对性地向旅游用户主动推送个性化的信息服务。全国风景名胜区每年的游客接待量都在数亿人次，建立旅游多媒体信息主动服务系统，在全国风景名胜区内建立集旅游目的地资源推介、旅游资讯、公益宣传为一体的旅游目的地信息服务，将加速旅游数字化的进程，可带来良好的经济效益和社会效益。

发明内容

本发明提出并建立基于多智能Agent框架结构的旅游多媒体信息个性化服务系统。系统采用Agent技术，通过不断自主学习，发现用户的兴趣，通过Agent技术实现用户兴趣与多媒体文档信息的有效匹配，从而能够满足人们在对旅游信息检索时的个性化要求。本发明的技术方案是这样实现的：

1.用户兴趣信息抽取和预处理；

2.基于向量夹角的改进的K-近邻算法的用户兴趣建模；

3.用户兴趣模型动态更新；

4.基于多智能Agent的旅游多媒体信息个性化服务系统。

本发明有以下一些技术特征：

(1)步骤1所述的用户兴趣信息抽取和预处理，是指通过抽取用户兴趣信息并进行预加工处理，从而获取用户兴趣特征向量集以及多媒体信息处理后产生的用于描述多媒体内容的特征向量集，可作为兴趣模型建立和更新的基础。

(2)步骤2所述采用基于向量夹角的改进的K-近邻算法的自动用户兴趣建模的方法，是指在完成用户兴趣信息采集之后，利用采集的信息，采用改进的K-近邻分类算法构建用户兴趣模型。

(3)步骤3所述的用户兴趣模型动态更新是为了反映用户的实时个性化需求，实现针对每个用户建立的兴趣模型必须具有自学习能力。用户可以主动输入或者修改其兴趣关键字和兴趣描述，还可以通过用户反馈学习调整兴趣模型，使模型不断地预测用户的真实兴趣。

(3)步骤4所述的基于多智能Agent的旅游多媒体信息个性化服务系统是指针对系统工作流程的每一阶段，划分功能相对独立的模块，再将各模块包装成Agent代理，形成多代理框架，在此框架下，各代理分工协作，从而实现多媒体信息服务的智能化与个性化。系统包括用户接口Agent、过滤排序Agent、兴趣学习Agent、监控Agent和信息检索Agent五个功能模块。本发明所述的旅游多媒体个性化信息服务的智能化除了体现在可以定期为用户主动推荐有价值的多媒体信息外，系统还可以在用户收看或者搜索多媒体信息的同时，结合用户兴趣库中的用户兴趣知识，为用户提供智能化的个性化信息服务。

本发明提出并建立基于多智能Agent的旅游多媒体信息个性化服务系统，对于建立高质量智能化的旅游信息服务具有很高的理论意义和应用价值，对多媒体信息个性化服务系统的方案设计及算法研究有指导意义。

附图说明

图1用户兴趣信息抽取流程；

图2特征向量提取；

图3用户兴趣建模过程；

图4用户兴趣判定过程；

图5改进的k-近邻算法；

图6用户反馈学习流程图；

图7基于多智能Agent的旅游多媒体信息个性化服务系统框架；

图8过滤Agent工作流程图；

图9信息检索Agent功能结构图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚，以下参照附图并举实例对本发明做进一步详细地说明。本发明采用的开发和实现平台是NET(C#)平台。

1.用户兴趣信息抽取和预处理

用户兴趣建模时，首先要获取能体现用户兴趣的有用信息，然后才能对用户兴趣进行特征化的描述，从中归纳出可计算的模型。模型还要可以不断地更新和维护，以反映用户兴趣的变化。用户兴趣信息抽取流程如图1所示。

用户兴趣信息可以通过两种方式获得：一种方式是可以通过用户主动输入或者修改其兴趣关键词的方式来提供自己的兴趣，或是通过用户对访问内容的反馈来获得用户兴趣；另一种方式是通过监控用户的行为来评估和推测用户兴趣。前一种方式直接，透明度高，花费时间相对较少且可靠性较高，但是过多的用户参与或系统主动询问会占用用户大量的时间；而后一种方式比较隐蔽，无需用户主动参与。本系统将这两种方法结合起来获取用户兴趣信息，通过前一种方式来获取静态用户信息，而通过后一种方式来获取动态用户信息。

通过用户信息采集，系统可以获得用户感兴趣的内容，而这些内容则可能是文档、图片、视频等多媒体信息。如何对这些信息进行处理，从中挖掘出用户感兴趣的内容是用户兴趣建模的关键。具体步骤如下：

(1)页面规范化处理：首先将网页中的标记符号补全；然后删除与文本内容无关的信息，包括超链接、脚本、网页框架结构等。

(2)Web文本的表示：采用向量空间模型(VSM)表示Web文本。VSM的基本思想是采用向量来表示一个文本，对该Web文本内容的处理过程将可以转化为空间向量的运算。

(3)特征向量提取：首先获取Web正文，然后对文本内容进行分词处理，词频统计以及特征向量提取。系统采用基于词典的分词方法进行文本特征词的自动抽取，处理过程如图2所示。

(4)权值计算：在确定了文档的特征向量后，需要计算特征向量中的特征项(关键词)的权重。关键词的权重表示的是这个关键词在它所在的文档中的重要程度。

当某词在这篇文档中出现的频率越高，而在其他文档中出现的次数越少，则表明该词对于这篇文档的区分能力越强，所以其权重就越大。计算公式为：

W (t, d) = \frac{tf (t, d) \times \log (N / n_{t} + 0.01)}{\sqrt{Σ_{t &Element; d} {[tf (t, d) \times \log (N / n_{t} + 0.01)]}^{2}}} - - - (1)

式(1)中，W(t，d)为关键词t在文档d中的权重，而f(t，d)为词t在文本d中的词频，n_t为训练文本集中出现t的文本数，N为训练文本的总数。

2.基于向量夹角改进的K-近邻算法(KNN)的用户兴趣建模

在完成用户兴趣信息采集之后，需要利用这些信息，构建用户兴趣判定模型。用户兴趣建模过程如图3所示。随着用户信息数据以及多媒体信息数据的不断增多，为保证兴趣分类效率和准确度不受影响，本系统提出了改进的K-近邻算法的改进方案。

用户兴趣判定的基本思想是将已分类的兴趣向量构成训练集，与未分类的文档向量相比较。改进的K-近邻算法的基本思路是：考虑在训练文本集中与未分类文本距离最近(最相似)的K篇文本向量，根据这K篇文本所属的兴趣类别判定新文本的类别。处理流程如图4所示。

2.1基于分类效率的改进

在训练阶段不进行任何计算，只是把训练实例存储起来，当有新的实例到来时，才进行相应的计算。

假设待分类的实例y(属性维度为m)，训练数据库的的大小为n，计算该实例与每个训练实例的时间复杂度为O(m*n)，对n个计算结果排序，其时间复杂度为O(n*log n)(采用快速排序算法)，则总的时间消耗为O(m*n+n*log n)。分类的效率取决于数据库的大小n。

改进的方法：减小n值，即压缩每个待分类的实例寻找k个近邻的搜索范围，把部分分类阶段的计算转移到训练阶段完成，以减少分类每个新实例的计算量，进而提高算法的效率。下面以属性维度m＝2为例，给出改进后的KNN算法描述，如图5所示。

改进后的K-近邻算法描述：训练阶段：在训练数据库中随机选取一个实例作为基准中心实例0；计算训练数据库中其它实例到中心实例的距离，并递增排序；给参数r赋值(设为离中心实例最远距离的1/5)。

分类阶段：

给定一个要分类的新实例y：

(1)计算实例y到中心0的距离d；

(2)从排序好的实例中提取距离中心实例为[d-r，d+r]的所有实例，然后在这个范围内找出距离实例

y小于或等于r的全部实例，递增排序后选取距离y最近的k个实例，x₁...x_k；

(3)返回y的分类标记：

f (y) &LeftArrow; \arg \max_{v &Element; V} Σ_{i = 1}^{k} δ (v, f (x_{i})) - - - (2)

改进后的算法在训练阶段增加了排序过程，其时间复杂度为O(m*n+n*log n)。这个计算过程只需要进行一次，可以为以后分类新实例所共用。在分类阶段的第二步，首先要进行查找操作(采用二分查找算法)，其时间复杂度为O(log n)。如图5所示，假设圆环中含有实例个数为n₁，计算这n₁个实例到待分类实例的距离的时间复杂度为O(m*n₁)。假设半径为r的圆内有n₂个实例，则对其排序的时间复杂度为O(n₂*log n₂)，进而第2步总的时间为O(1ogn+m*n₁+n₂*log n₂)。在具体的应用环境下，n₁，n₂都远远小于数据库的大小n，改进后的算法在效率上会显著高于原始KNN算法。

2.2基于分类精度的改进

假设每个实例由20个属性描述，但这些属性中仅有2个与分类相关，这样近邻间的距离会被大量不相关的属性所支配。我们采用的解决该问题的方法是，当计算两个实例间的距离时，根据每个属性对分类的贡献程度，对每个属性进行加权。经过属性加权改进的KNN算法，两个m维向量X，Y的相似度表示为如下：

Sim (X, Y) = Σ_{i = 1}^{m} w_{i} * Sim (X_{i}, Y_{i}) - - - (3)

其中w_i为实例第i个属性的权值。

假设已经得到了一个属性权重集合，并可以应用这些权值到公式(3)中去判断实例间的相似度。寻找一个最优的属性权重集合，当使用这个集合去判断实例相似性时，得到的误判次数是最低的。这个最优的权重集合与已有的训练数据集和待分类的新实例都密切相关。针对大型的数据库，可以假定训练数据集可以完全代表一个待分类的新实例，因此就可以仅从训练数据集中设法得到这个最优属性权重集合，这也正是本系统尝试的改进方向。

2.3二次规划问题引入

二次规划问题可以定义如下：

Max | Min : Σ_{j = 1}^{n} c_{j} x_{j} + Σ_{j = 1}^{n} Σ_{k = j}^{n} C_{jk} x_{j} x_{k} - - - (4)

约束集Constraint_i(i＝1，...，m)是以下三种形式中的一种：

Σ_{j = 1}^{n} a_{ij} x_{j} \leq b_{i}

Σ_{j = 1}^{n} a_{ij} x_{j} = b_{i}

Σ_{j = 1}^{n} a_{ij} x_{j} &GreaterEqual; b_{i}

其中x_j≥0(j＝1，...，n)。

式(4)中，x₁，...，x_n为目标函数中的变量；m是约束的个数。

2.4求解最优属性权重集

系统将某一多媒体内容分类为“感兴趣”和“不感兴趣”两个简单类别，所以求解最优属性权重集是分类问题中最简单的二元分类问题，进而将求解KNN算法的属性权重集问题归类为一个二次规划问题。

假设同一属性类间实例的相似度为1，不同类别间实例的相似度为0。在训练过程中求解属性权重集合，并可以利用式(3)去求解相似度。

基于上述假设，求解属性权重集的问题可以被看作一个最优问题，目的是使利用式(3)计算的相似度与对比属性类别而得出的真实相似度的误差最小。由于二次规划问题中目标函数只有一个，所以相似对的误差需要累加到目标函数。因为最终目标是求解最小的个体误差，所以这里采用误差的平方累加替代直接的算术累加。将问题转化为下面的二次规划问题。

设训练数据库中有n个实例，每个实例有m个属性，约束如式(5)所示：

Σ_{k = 1}^{m} S_{ijk} W_{k} + L_{ij} - M_{ij} = R_{ij} (i, j = 1 . . . n, i < j) - - - (5)

其中S_ijk表示实例i和j的第k个属性的相似度；

是利用式(3)得出的实例i与j的相似度；R_ij是实例i与j的真实相似度；L_ij和M_ij分别表示不同的误差变量集合，根据这两个集合计算所得的相似度分别小于和大于真实相似度。

根据上面的定义，目标函数最终目的是最小化每一个L_ij和M_ij，因此选择使用L_ij和M_ij的累加平方和替代算数和来表示目标函数，这样做可以有效避免局部L_ij和M_ij的值过大。目标函数如式(6)所示：

Min Σ_{i = 1}^{n} Σ_{j = i + 1}^{n} (L_{ij}^{2} + M_{ij}^{2}) - - - (6)

2.5复杂性分析和简化

在式(5)和式(6)中，有m个属性权重变量和n*(n-1)误差变量。式(5)中含有n*(n-1)个约束等式。因此上述的二次规划问题共有n*(n-1)+m个变量和n*(n-1)个约束。

该二次规划问题与训练数据库的大小并不线性相关。当训练数据库极其庞大时，求解属性权重集十分复杂。针对这个问题，采用与前面提出的改进方案相结合的方法来求解这个二次规划问题。

在求解最优属性集过程中，每个实例要与训练数据库中的其他实例进行比较。如果可以选择与训练数据库的一个子集做比较，则可以在很大程度上简化上述二次规划问题。可以直接利用2.1的结果，选择落入距离实例点半径为r的圆内的n₂个实例，作为训练数据库的一个代表子集。这样就得到了含有m个属性权重变量，n*n₂误差变量，n*n₂个约束等式的二次规划问题。由于n₂远小于n-1，因而可以极大地简化求解过程。

3.用户兴趣模型动态更新

针对每个用户建立的兴趣模型必须具有自学习能力。一方面用户可以主动输入或者修改其兴趣关键字和兴趣描述；另一方面可以通过用户反馈学习调整兴趣模型，使模型不断地预测用户的真实兴趣。

反馈调整可以通过两种方式进行，即显性的用户在客户端界面上修改兴趣的方式及隐性的用户通过分析用户浏览行为来调整兴趣的方式。用户对相关多媒体的浏览即是对系统的一种隐性反馈，对反馈结果进行分析可以使推送的内容更加符合用户的需求。用户兴趣模型更新过程如图6所示。

在显性反馈时，提供给用户量化后的反馈选项，将用户对推送多媒体的评价分为五个等级：很满意(+2)、满意(+1)、一般(0)、不满意(-1)、很不满意(-2)，用评价值f表示。隐性反馈时，由用户的行为决定反馈更新，不同行为具有不同的意义，如表1所示。

表1用户行为的意义

用户行为	动作意义	等级
			加入收藏夹	高度相关	+2(很满意)
下载多媒体	非常相关	+1(满意)
			浏览多媒体	一般相关	0(一般)
忽略多媒体	不相关	-1(不满意)
			删除多媒体	很不相关	-2(很不满意)

设a(0-1之间的实数)为学习速度，则反馈学习中用户兴趣调整公式为：

Q＝Q+a*f*P (7)

其中Q为用户兴趣矢量，P为用户评价的矢量表示。

根据用户的显性和隐形反馈信息，对相应用户兴趣进行调整，能够更精确地描述用户的兴趣和需求。

4.基于多智能Agent的旅游多媒体信息个性化服务系统

采用智能Agent技术，通过不断自主学习，发现和判定用户的兴趣，并将工作流程中的各个阶段封装成相对独立的代理Agent，彼此相互协作，共同完成提供旅游多媒体信息个性化服务的任务。在实现过程中，着重解决了以下问题：收集整合多媒体信息资源和用户信息；采用精度相对可观的算法建立用户兴趣模型，并实现用户兴趣与多媒体文档的有效匹配；能够为用户准确、及时搜索和推荐与旅游主题相关的多媒体信息。

4.1总体结构

基于多智能Agent的旅游多媒体信息个性化服务系统如图7所示。在逻辑上划分为三层：信息交互层、信息过滤层和信息搜索层。

信息交互层主要是为人机交互提供一个通信接口。它的主要功能包括：用户注册、系统登陆、查看所推送给用户的多媒体信息以及提供反馈相关信息。系统还可以通过该层采集用户兴趣建模的数据信息。

信息过滤层主要是对信息搜索层的返回结果进行过滤，去除其中和用户兴趣无关或相关度低的信息；并通过从信息交互层反馈过来的信息不断调整用户兴趣模型，进而有根据地调整给用户所推送的信息，实现个性化的智能信息服务。

信息搜索层在本地多媒体资源库或者互联网资源中查找用户可能感兴趣的相关信息，得到一系列结果文档集合返回给信息过滤层。

按照系统的功能层次划分，分别由不同的Agent模块相互协作实现系统功能。系统主要包括用户接口Agent、过滤排序Agent、兴趣学习Agent、监控Agent和信息检索Agent五个相对独立的功能模块。兴趣学习Agent和用户进行交互，信息检索Agent、过滤排序Agent对搜索返回结果进行处理。

用户接口Agent是实现用户与系统进行交互的通讯接口，它能及时将用户所需的信息发送给用户。过滤排序Agent根据不同用户的个人兴趣描述，对信息检索层检索返回的结果文档进行分析加工，过滤掉与用户兴趣相关度较低的文档。兴趣学习Agent根据用户的行为和反馈信息，进行用户兴趣的知识学习，为不同的用户生成不同的用户兴趣描述文件。监控Agent用于记录用户的活动，并实时做出反应，主动把用户检索请求发送给信息交互平台，信息检索Agent响应并进行处理。信息检索Agent将用户请求信息经分析后提交关键词给搜索引擎进行处理，并将搜索引擎返回的文档内容交给过滤排序Agent进行二次处理。用户兴趣库存储不同用户的兴趣信息。本地信息库用于存储用户的相关信息，包括用户行为信息、本地信息资源等。

4.2工作流程

对于新用户，我们设计了一个初始简单定义的用户兴趣模板。用户第一次注册后，系统会为其建立一个初始用户兴趣模型。当用户成为正式用户后，可以根据其行为信息对其兴趣内容进行修正和调整。针对每一个在线用户，会分别产生对应于该用户的一个用户接口Agent、过滤排序Agent、兴趣学习Agent、监控Agent和信息检索Agent。系统各Agent模块的工作流程如下：

(1)若用户在兴趣注册页面对兴趣信息进行主动修改，监控Agent通知信息检索Agent进行相关的信息搜索，转(3)。

(2)用户接口Agent接受用户的信息拉取请求，或者定期从用户兴趣库中提取用户兴趣偏好，并进一步将需求信息整理，转(3)。

(3)信息检索Agent接收到请求信息后，将查询请求处理为符合搜索引擎语法要求的格式，并对本地资源或者提交给各搜索引擎对网络资源进行检索，把返回结果发送给过滤排序Agent。

(4)过滤排序Agent结合用户兴趣模型对检索结果进行兴趣相关度计算并排序，将满足一定兴趣阀值的结果推送给用户。

(5)用户接口Agent进一步把待推送的信息输出给用户，同时收集用户的反馈意见，并将用户的反馈结果传送给兴趣学习Agent。

(6)兴趣学习Agent根据用户反馈和浏览行为更新调整用户兴趣模型。

基于以上的工作流程以及各Agent功能模块，系统能够根据用户的兴趣有针对性地筛选和过滤出用户感兴趣的信息推荐给用户。

4.3主要功能模块

4.3.1用户接口Agent

用户接口Agent提供用户注册、登录、查看系统推送信息、提交信息搜索请求以及进行用户反馈等功能，是实现用户与系统之间进行交互的平台。用户接口Agent在用户登陆后被激活，负责传递由信息过滤层过滤后的信息给系统用户。用户接口Agent还负责收集用户的反馈意见，并将其传送到兴趣学习Agent，以便更新调整用户兴趣模型。

4.3.2过滤排序Agent

过滤排序Agent是信息源和用户之间的中介，在信息源和用户都不掌握对方的需求知识的情况下，通过兴趣分类算法和用户兴趣模型对搜索引擎返回的结果进行过滤。由于传统的搜索引擎单一地按照搜索关键词进行查询，这样势必会带来大量的冗余信息。我们将搜索返回结果结合用户兴趣库中特定用户的兴趣进行过滤和排序后，再返回给用户。过滤Agent的工作流程图如图8所示。

过滤排序Agent把信息检索Agent返回的结果进行预处理，提取文档特征向量；然后从用户兴趣库中提取该用户的兴趣向量集合，依据用户兴趣建模的分类算法，对结果向量进行兴趣分类判定和兴趣相关度计算；最后根据分类结果进行过滤和排序，将满足一定阀值的结果推送给用户。

系统将兴趣判定问题转化为文档向量分类问题，并采用向量空间模型(VSM)表示多媒体信息文档。系统采用了一种基于向量夹角的改进的K-近邻算法分类方法。

4.3.3兴趣学习Agent

兴趣学习Agent可以从两个方面获取用户兴趣信息：一方面通过用户注册信息和用户对收看的信息内容的反馈评价；另一方面通过记录用户的行为(如收藏、浏览、下载、删除以及对相关主题的浏览次数等)获取有用信息。系统中用户兴趣模型的建立分为两个阶段：首先是根据用户提供的初始注册信息建立体现用户兴趣的特征向量；然后利用兴趣学习Agent的学习功能，分析用户的反馈信息和行为偏好，进而对用户的兴趣模型进行修改，对用户特征向量中的不同特征词进行权重调整。若兴趣关键词的权值越高，则表示用户对该特征词所代表的信息越感兴趣。这样系统就能够在一定程度上反馈出用户的个性化需求。

4.3.4监控Agent

监控Agent用于记录用户行为动作。用户登陆系统后，监控Agent则被激活，并适时记录下用户的所有活动。系统将这些行为信息进行量化表示，并存储于本地信息库，用于调整用户兴趣模型。监控Agent还负责对本系统为用户提供的个人兴趣站点进行动态监控。若发现该站点用户个人兴趣发生改变，则通知信息检索Agent去提取信息，然后交由过滤排序Agent处理后主动推送给用户。

4.3.5信息检索Agent

信息检索Agent接受其他Agent模块的搜索请求，然后对请求信息进行预处理分析后，提交给搜索引擎执行搜索操作，并将搜索引擎返回的结果文档提交给过滤排序Agent进行二次处理。信息检索Agent完成的主要工作如下：对信息检索关键字进行预处理，采用分词技术对搜索请求进行词语切分，提取搜索关键字；为确保正常使用搜索功能，与系统制定搜索引擎进行交互和协调。

通用搜索引擎由搜索器、索引器和用户接口等几部分组成。信息检索Agent需要克服不同搜索引擎之间的用户接口、查询技术和搜索结果表示方法的差异，获取多个搜索引擎的返回结果。信息检索Agent的功能结构如图9所示。

关键字提取模块：使用现有分词技术处理检索请求，提取检索关键词。

检索格式转换模块：结合搜索引擎格式库中的不同搜索引擎检索格式具体要求，把检索关键词转换为搜索引擎能够处理的检索格式。

搜索引擎调用模块：协调调用系统默认或者用户指定的搜索引擎，采用多线程并发执行的模式，使它们能够同时处理检索请求，并提取返回结果。

结果预处理模块：由于不同搜索引擎返回结果的格式不同，因此结果预处理模块需要对返回结果进行统一化处理。该模块还负责删除返回结果中的重复信息和无效链接。

Claims

1.基于多智能Agent的旅游多媒体信息个性化服务系统，其特征在于，该方法包括：

用户兴趣信息抽取和预处理；

基于向量夹角的K-近邻算法的用户兴趣建模；

用户兴趣模型动态更新；

基于多智能Agent的旅游多媒体信息个性化服务系统。

2.根据权利要求1所述的方法，其特征在于，通过抽取用户兴趣信息并进行预加工处理，从而获取用户兴趣特征向量集，以及多媒体信息处理后产生的用于描述多媒体内容的特征向量集，可作为兴趣模型建立和更新的基础。

3.根据权利要求1所述的方法，其特征在于，在完成用户兴趣信息采集之后，利用采集的信息，采用基于向量夹角的改进的K-近邻算法来自动构建用户兴趣模型。

4.根据权利要求1所述的方法，其特征在于，为了反映用户的实时个性化需求，实现针对每个用户建立的兴趣模型必须具有自学习能力。用户可以主动输入或者修改其兴趣关键字和兴趣描述，还可以通过用户反馈学习调整兴趣模型，使模型不断地预测用户的真实兴趣。

5.根据权利要求1所述的方法，其特征在于，针对系统工作流程的每一阶段，划分功能相对独立的模块，再将各模块包装成Agent代理，形成多代理框架。在此框架下各代理分工协作，从而实现多媒体信息服务的智能化与个性化等特点。系统包括用户接口Agent、过滤排序Agent、兴趣学习Agent、监控Agent和信息检索Agent五个功能模块。本发明所述的旅游多媒体个性化信息服务的智能化除了体现在可以定期为用户主动推荐有价值的多媒体信息外，系统还可以在用户收看或者搜索多媒体信息的同时，结合用户兴趣库中的用户兴趣知识，为用户提供智能化的个性化信息服务。