CN101894170B - 基于语义关联网络的跨模信息检索方法 - Google Patents

基于语义关联网络的跨模信息检索方法 Download PDF

Info

Publication number
CN101894170B
CN101894170B CN2010102529350A CN201010252935A CN101894170B CN 101894170 B CN101894170 B CN 101894170B CN 2010102529350 A CN2010102529350 A CN 2010102529350A CN 201010252935 A CN201010252935 A CN 201010252935A CN 101894170 B CN101894170 B CN 101894170B
Authority
CN
China
Prior art keywords
cross
semantic
association
analysis
relationship network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010102529350A
Other languages
English (en)
Other versions
CN101894170A (zh
Inventor
曾承
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN2010102529350A priority Critical patent/CN101894170B/zh
Publication of CN101894170A publication Critical patent/CN101894170A/zh
Application granted granted Critical
Publication of CN101894170B publication Critical patent/CN101894170B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及信息检索技术领域,尤其涉及一种基于语义关联网络的跨模信息检索方法。本发明通过网页视觉空间分析、多媒体搜索引擎标注关系分析、DeepWeb接口模式分析、复合媒体中不同模态数据的关联分析、用户直接或潜在反馈信息的利用,以及关联推理等六个渠道获取跨模关联知识,并构建跨模关联网络;利用获取的跨模关联知识,通过层次化模糊聚类,获得不同粒度的具有相同语义的多模数据集合;从每个SC中选择出不同模态的典型向量,并构建对应的语义向量包,最后在这三者之间建立映射关系。本发明能降低每种渠道可能存在的误差,有效提高检索准确性;能够支持由用户定义不同粒度语义的跨模检索,能够支持多种模态的数据文件同时作为样例进行检索。

Description

基于语义关联网络的跨模信息检索方法
技术领域
本发明涉及信息检索技术领域,尤其涉及一种基于语义关联网络的跨模信息检索方法。
背景技术
据广电网09年统计,全国主流网站每日更新的文字、图片及视频量大概是310GB/天。《福布斯》报道,人类5000年的文字记载总量是5 EB,而仅09年,全球产生的数字内容就超过了450 EB,其中多媒体数据占据了相当大的比例。“信息爆炸”愈演愈烈,Facebook、Twitter、微博客等应用促使新生信息指数扩张,而当前的互联网仍然无法应对信息过度膨胀与信息精确定位之间的矛盾,尤其是对于多媒体信息,即使是谷歌、百度,以及微软必应等搜索引擎也难以获得满意的检索效果。Outsell公司最新调查显示,全世界平均每人每周要花费9.5小时用于信息检索,其原因是基于关键字的主流检索方式难以有效表达用户检索需求,而返回结果的挑选也相当耗时。
近几年,基于多媒体样例相似性的搜素技术得到了长足发展,甚至出现了商业化产品,如提供商品图片相似搜索的Like,支持提交图片、视频帧,甚至手画图进行检索的GazoPa,以及微软即将发布的基于图片的地理位置搜索Photo2Search等。这些搜索引擎主要是利用颜色、纹理、形状等底层物理特征进行匹配,其视觉感受将远高于传统关键字搜索引擎,但在语义匹配度方面并未改善。因此,语义搜索技术也同时受到广泛关注,如微软的IGroup提供结果语义分类,Hakia能同时显示某一主题的图片、视频、文本介绍、文本新闻等,以及支持自然语言检索,并整合了语义网、语义分类等技术的 Zoom。然而,目前的语义搜索引擎仍然基于关键字,其语义处理过程大多是利用WordNet或本体等,进行概念推理或比较。
人们在日常交往过程中,往往是以多模形式进行信息互递。同时采用视觉、听觉,以及文本等形式表达自己的语义,必然能使对方更快、更准确的理解自己。在人机交互过程中,这种规律也同样存在。跨模检索技术就是力求最大限度地获取不同模态媒体之间的关联性、协同性和互补性,使得多种媒体信息的识别、检索和利用更加充分且有效,并使媒体信息的发现重构、共生新用成为可能,从而达到各种模态媒体信息的融合,共存于一体,使得用户能够更为及时、准确、低成本、多感官的获取所需信息。
发明内容
针对上述存在的技术问题,本发明的目的是提供一种基于语义关联网络的跨模信息检索方法,实现高效跨模检索。
为达到上述目的,本发明采用如下的技术方案:
通过网页视觉空间分析、多媒体搜索引擎标注关系分析、DeepWeb接口模式分析、复合媒体中不同模态数据的关联分析、用户直接或潜在反馈信息的利用,以及关联推理等六个渠道获取跨模信息单元的语义关联知识;
基于以上不同渠道获取的关联知识,进行加权整合,构建统一的跨模语义关联网络;
针对跨模语义关联网络,实施分层模糊聚类;
对每个聚类,寻找其中所有信息单元的典型特征向量,作为该聚类的代表;
对系统中所有信息单元对应的特征向量,建立散列索引;
在每个信息单元,对应特征向量、聚类的典型特征向量、聚类序号之间建立映射关系。
所述网页视觉空间分析包括以下步骤:
将页面划分成不同粒度、具有视觉层次包含关系的若干块;
将以上分析出的块转换成视觉关系树;
利用视觉关系树计算各种模态信息单元之间的语义关联。
所述多媒体搜索引擎标注关系分析包括以下步骤:
针对某个多媒体搜索引擎,采用以下公式计算搜索关键字(或关键字集合)和第v条结果的标注概念集合的语义相似性:         
Figure 18096DEST_PATH_IMAGE001
其中,     
Figure 653214DEST_PATH_IMAGE002
上式中Ku、Tv分别表示搜索概念集合和第v条结果的标注概念集合; 
Figure 994197DEST_PATH_IMAGE003
是一个修正常量,用于防止两个集合的交集 
Figure 190823DEST_PATH_IMAGE004
为空;KM为Kuhn-Munkres算法, 表示从搜索关键字和结果标签中分别选择一个概念,并通过WordNet或者其他本体计算它们的语义相似性;
构建多媒体元搜索引擎,定义一个语义空间来衡量所有结果之间的关联大小,其中横坐标为每条结果标注与检索条件的关联度大小,即 
Figure 56065DEST_PATH_IMAGE006
,纵坐标为搜索引擎排序值。
所述DeepWeb接口模式分析包括以下步骤:
基于同类网页叠加,定位网页中DeepWeb数据区域;
识别后台数据库的数据模式;
利用该表的横轴模式信息,实现不同属性、不同模态数据之间的相互解释;
利用该表的纵轴模式信息,计算不同元组之间的语义关联大小。
所述复合媒体中不同模态数据的关联分析包括以下步骤:
时序媒体的单元分割;
对于音视同步的复合媒体,若分离后不同模态的信息单元仍保持相同时序依赖性,则定义它们的关联值为1,而分割后同模态的各信息单元之间的关联计算公式为:   
Figure 782713DEST_PATH_IMAGE007
Figure 212557DEST_PATH_IMAGE008
是一个表示语义关联退化的常量,x表示信息单元O i O j 之间的间隔。
所述用户直接或潜在反馈信息的利用包括以下步骤:
记录用户在浏览检索结果过程中涉及的各类操作;
基于相同检索需求的反馈信息将被叠加:   
Figure 798390DEST_PATH_IMAGE009
  
Figure 775311DEST_PATH_IMAGE010
其中 
Figure 356466DEST_PATH_IMAGE011
表示信息单元Oi和Oj在相同检索中被施以相同操作的总次数,
Figure 691632DEST_PATH_IMAGE012
代表每种操作的权重,但 
Figure 358237DEST_PATH_IMAGE013
的最大值仅能为1。
针对跨模语义关联网络采用分层模糊聚类方法包括以下步骤:
选择每个节点(信息单元) 
Figure 374734DEST_PATH_IMAGE014
与它的K个最近邻集合 ,并计算 到 
Figure 234478DEST_PATH_IMAGE015
中每个点的距离的平均值 
Figure 789087DEST_PATH_IMAGE016
。则
Figure 141571DEST_PATH_IMAGE014
的K近邻的相对密度为:
Figure 21802DEST_PATH_IMAGE017
当节点 
Figure 895955DEST_PATH_IMAGE014
满足条件 
Figure 316572DEST_PATH_IMAGE018
时,被视为核心节点,而对应的核心节点集合为 ,其中O是所有核心结点的列表,  
Figure 512378DEST_PATH_IMAGE020
是所有聚类的初始状态;
中所有节点的K近邻节点也将被考虑,若满足上述条件,也将被扩展进该聚类中;
以此类推,可以发现核心节点仅能属于一个类,而其他节点可以属于多个类,从而实现模糊化;
最高粒度的聚类结果将被逐层合并,其依据是不同类
Figure 599600DEST_PATH_IMAGE021
Figure 566157DEST_PATH_IMAGE022
之间的相似性计算,如下式:
  
Figure 522611DEST_PATH_IMAGE023
对于每个粒度级别,定义对应的阀值
Figure 872821DEST_PATH_IMAGE024
,并将满足该约束的两个类合并成一个类:
Figure 71459DEST_PATH_IMAGE025
本发明具有以下优点和积极效果: 
1)不同模态数据之间异质异构,仅能在语义层获取关联,而语义鸿沟又难以逾越,通过多个渠道直接或间接获取跨模语义关联知识,能实现跨模检索功能,并能降低每种渠道可能存在的误差,有效提高检索准确性;
2)能够支持由用户定义不同粒度语义的跨模检索;
3)能够支持多种模态的数据文件同时作为样例进行检索;
4)合理的散列索引,使得跨模检索速度很快。
附图说明
图1是本发明中跨模语义关联挖掘示意图。
图2是本发明中基于网页视觉空间关系的跨模语义关联挖掘示意图。
图3是本发明中层次化模糊聚类示例图。
图4是本发明中基于跨模关联聚类的信息单元索引原理图。
具体实施方式
本发明提出了一种基于语义关联网络的跨模信息检索方法, 该方法的原理为:
传统多媒体搜索引擎主要采用特征向量化及向量散列技术构建索引,然后基于向量匹配原理实现检索。但在跨模检索领域,不同模态数据的结构、特征差异较大,导致特征向量的维数迥异。尽管可以通过降维技术使得各种模态对应的向量维数相同,但每一维以及整个特征空间的含义仍然不同, 直接进行向量匹配没有意义。因此,为了实现跨模索引,本专利利用之前获取的跨模关联知识,通过层次化模糊聚类,获得不同粒度的具有相同语义的多模数据集合,称为语义簇(Semantic Cluster, SC);然后,从每个SC中抽取不同模态的典型向量(Typical Vector, TV),并构建对应的语义向量包(Semantic Vector Bunch,SVB),最后在这三者之间建立映射关系。通过在信息单元特征向量上建立散列索引,可以根据搜索样例,定位到对应的SVB,从而获得语义相关的其他模态的向量(如图4)。此时,可以利用层次化模糊聚类的特点,即克服语义鸿沟导致的底层特征相同,但语义不同的情况(通过模糊性使得一个特征向量可属于多个SC);以及灵活的结果范围动态选择机制(通过层次选择),粒度高时查准率提高,但查全率相对降低,粒度低时查全率提高,但准确率相对下降。
本发明主要包括基于语义的跨模检索方法的步骤、六种跨模语义关联挖掘的步骤(如图1),以及针对跨模语义关联网络进行分层模糊聚类的步骤。
图1显示了跨模语义关联挖掘的示意图,其中基于元搜索引擎的标注关系分析、基于网页的视觉空间关系分析、DeepWeb接口模式解析均是从互联网直接挖掘跨模关联知识;而复合媒体分析则是为了降低语义关联的复杂性,提高准确性,对跨模关联网络中的信息单元进行进一步处理和分解;用户反馈和关联推理用于对跨模关联网络进行修正和扩展。
1、基于语义的跨模检索方法,包括以下步骤:
步骤1:通过网页视觉空间分析、多媒体搜索引擎标注关系分析、DeepWeb接口模式分析、复合媒体中不同模态数据的关联分析、用户直接或潜在反馈信息的利用,以及关联推理等六个渠道获取跨模信息单元的语义关联知识;
 该步骤实际上是利用不同渠道获取跨模语义关联知识,每个渠道均可形成一个跨模语义关联子网,网络中每个结点为某种模态的信息单元,而结点与结点之间的边则表示它们的关联大小。
步骤2:基于以上不同渠道获取的关联知识,进行加权整合(根据需求,甚至可以忽略某些渠道的关联知识),构建统一的跨模语义关联网络; 
由于不同关联子网中存在相同信息单元,因此可以对这些子网进行整合,相同结点直接重叠,而相同结点之间的边进行加权求和。
步骤3:针对跨模语义关联网络,实施分层模糊聚类;
聚类后的每个类称为一个语义类,代表具有相似语义的不同模态的信息单元,粒度越细的类,其中包含的信息单元语义相似性越强。由于一个信息单元可能包含若干语义,往往属于多个语义类,因此在每个粒度层采用模糊聚类更为恰当。
步骤4:对每个聚类,寻找其中所有信息单元的典型特征向量,作为该聚类的代表;
每个聚类中存在大量相似特征向量的信息单元,它们在后期检索运算中将会浪费大量计算时间,因此从一群相似特征向量中寻找一个代表,能够提高后期检索的速度。
步骤5:对系统中所有信息单元对应的特征向量,建立散列索引;
散列索引的作用是,当提交检索样例后,能够通过特征向量散列,快速定位到跨模语义关联网中的某个信息单元,从而进入该网络,为后期利用跨模关联知识奠定基础。
步骤6:在每个信息单元、对应特征向量、聚类的典型特征向量、聚类序号之间建立映射关系;
在这四者之间建立映射关系的作用是,当检索样例定位到跨模语义关联网中的某个信息单元时,能够以典型特征向量为桥梁,快速确定其所属的语义类,从而确定检索样例可能涉及的语义。
基于以上步骤,用户可提交单个或多个媒体样例作为搜索条件,系统分别抽取其特征向量后,利用向量散列索引定位到相似的信息单元特征向量,并映射到对应的典型特征向量集合,通过不同样例对应典型特征向量集合之间的交集运算,从而确定满足当前搜索条件的语义类,最终返回这些类中的信息单元即完成检索。用户可通过选择语义类的粒度,来实现查准率和查全率之间的调整。
2、网页视觉空间分析方法的步骤是:
步骤1:将页面划分成不同粒度、具有视觉层次包含关系的若干块(block);
该步骤通过对网页标签(如<table>、<tr>、<div>等)及其位置属性(如height、width、margin、position等)进行分析,计算各区域之间的包含与被包含关系,并映射成块(block)。
步骤2:将以上分析出的块转换成视觉关系树;
图2显示了一个网页转换成视觉关系树的示意图,该步骤利用了步骤1中分析出的块之间的依赖关系,而实际信息单元或链接(如文本内容、图片或视频的URL等)将最终对应视觉关系树的叶节点;
步骤3:利用视觉关系树计算各种模态信息单元之间的语义关联,即通过叶节点之间的路径长度运算。定义任意两个兄弟节点之间关联值为1。由于语义泛化将损失语义, 因此分析树的上行段和下行段被分别定义了不同的权值α 和β 。对于信息单元Oi 和 Oj ,能够采用以下公式计算其语义关联大小:
                 (1)
其中n和m分别表示上行段和下行段的数量。
Web页面为了便于用户浏览及体验,往往将主题语义相关的内容编排在视觉上相近的区域,这种由制作者手工编排的文件蕴含着大量潜在的信息关联知识。在当前的多媒体搜索引擎领域已广泛应用该特性,通过网页DOM树分析,利用环绕文字实现基于关键字的多媒体文件搜索。然而,目前很多网页并未严格遵守W3C的HTML标准设计,尽管视觉表现正常,但DOM树中可能将无联系的内容分到同一子树中,导致关联大小被错误计算。
而利用网页视觉显示通常较为准确的特点,基于视觉空间关系结构,而非代码级别的DOM树结构进行网页分析,获取的信息关联知识准确率更高。图2显示了一个利用网页视觉空间关系进行跨模关联挖掘的例子,其中若某个信息单元,如文本“冰雨”,存在超级链接,则被连接网页的根节点(图2中显示其代号为“57”)将视为“冰雨”的兄弟,即 Rv (“冰雨”, “57”) = 1,从而使得媒体对象的语义关联性可以跨网页计算。
3、基于关键字的商业多媒体搜索引擎中存在大量被标注的多媒体数据,基于多媒体搜索引擎标注关系分析获取跨模关联知识的步骤是:
步骤1:针对某个多媒体搜索引擎,采用以下公式计算搜索关键字(或关键字集合)和第v条结果的标注概念集合的语义相似性:
Figure 645977DEST_PATH_IMAGE001
                  (2)
其中    
Figure 483483DEST_PATH_IMAGE002
上式中Ku、Tv分别表示搜索概念集合和第v条结果的标注概念集合, 
Figure 49593DEST_PATH_IMAGE003
是一个修正常量,用于防止两个集合的交集 
Figure 23366DEST_PATH_IMAGE004
为空。KM为经典的Kuhn-Munkres算法。 
Figure 85737DEST_PATH_IMAGE005
表示从搜索关键字和结果标签中分别选择一个概念,并通过WordNet或者其他本体计算它们的语义相似性:
Figure 472856DEST_PATH_IMAGE027
                (3)
其中 
Figure 780341DEST_PATH_IMAGE028
,
Figure 936516DEST_PATH_IMAGE029
 
Figure 405674DEST_PATH_IMAGE030
上式中 
Figure 952193DEST_PATH_IMAGE031
表示概念 
Figure 561904DEST_PATH_IMAGE032
和 在WordNet中的最近公共父节点,而maxDist是它们的最远距离(即经过根节点)。APS(C)和 
Figure 478224DEST_PATH_IMAGE034
分别表示概念C的先验分数和子孙的总数。 
Figure 574356DEST_PATH_IMAGE035
和 
Figure 958064DEST_PATH_IMAGE036
分别对应概念的泛化和精化过程。
步骤2:构建多媒体元搜索引擎,定义一个语义空间来衡量所有结果之间的关联大小,其中横坐标为每条结果标注与检索条件的关联度大小,即 
Figure 26514DEST_PATH_IMAGE006
,纵坐标为搜索引擎排序值。则任意一个结果可映射为该空间中的一点,而任意两个结果之间的语义关联大小    被转换为它们对应向量的夹角余弦值,如公式(4):
 
Figure 185018DEST_PATH_IMAGE038
           (4)
其中
Figure 637996DEST_PATH_IMAGE039
表示第i个对象的结果排序号。该步骤将Google.image、Yahoo!Video、YouTube等多媒体搜索引擎的接口进行整合,即通过单一检索条件输入,实现多个搜索引擎并行搜索,最终进行结果合并。在合并过程中,将综合考虑每条结果标注的上下文,以及该结果在原搜索引擎中的排序。从而,能够基于每次元搜索,挖掘不同模态结果之间的语义关联性。
4、DeepWeb接口模式解析获取跨模关联知识的步骤是:
步骤1:基于同类网页叠加,定位网页中DeepWeb数据区域;
该步骤对具有检索功能并涉及多媒体文件的站点(如电子商务网站),进行若干次模拟检索,基于之前的网页视觉空间分析技术,比对每次检索结果页面的变化区域和不变区域,将不变区域视为网站表层数据,如固有链接、广告等,而变化区域视为后台数据库中的数据。
步骤2:识别后台数据库的数据模式;
将变化区域中相对不变的文字部分,视为属性名称,从而解析出其后台数据库的近似数据结构,并视为单表,而服务器上可能以多表、甚至文件系统管理。
步骤3:利用该表的横轴模式信息,实现不同属性、不同模态数据之间的相互解释;
因为有些属性是图片或视频等多媒体数据的URL/指针/二进制流,而其他可能存在的属性如标题、注释等能用于解释多媒体数据,并彼此产生关联信息。
步骤4:利用该表的纵轴模式信息,采用公式(2)类似的算法,计算不同元组(即不同信息单元)之间的语义关联大小。
利用公式(2),计算不同元组可能存在的标题、注释等属性之间的相关性,从而获得这些元组中包含的多媒体数据之间的相关性。
5、复合媒体中不同模态数据的关联分析获取跨模关联知识的步骤是:
步骤1:时序媒体的单元分割;
对视频、音频,或者音视频整合的媒体文件,在时序轴上进行分割,将其划分成更小粒度的信息单元,这将利用到一些通用的视频镜头切换识别、基于场景的视/音频分割、关键帧提取、音视数据分离等技术;
步骤2:对于音视同步的复合媒体,若分离后不同模态的信息单元仍保持相同时序依赖性,则定义它们的关联值为1,而分割后同模态的各信息单元之间的关联计算公式为:
Figure 295374DEST_PATH_IMAGE007
                    (5)
Figure 605132DEST_PATH_IMAGE008
是一个表示语义关联退化的常量,x表示信息单元 O i 和 O j 之间的间隔。
6、根据用户直接或潜在反馈信息获取跨模关联知识的步骤是:
步骤1:记录用户在浏览检索结果过程中涉及的各类操作,如点击浏览、打印、下载等;
步骤2:基于相同检索需求的反馈信息将被叠加:
  
Figure 126602DEST_PATH_IMAGE010
        (6)
其中
Figure 966382DEST_PATH_IMAGE011
表示信息单元 Oi和  Oj在相同检索中被施以相同操作的总次数,
Figure 384725DEST_PATH_IMAGE040
代表每种操作的权重,但 
Figure 677166DEST_PATH_IMAGE013
的最大值仅能为1。
7、针对跨模语义关联网络采用分层模糊聚类方法的步骤是:
步骤1:选择每个节点(信息单元)
Figure 471947DEST_PATH_IMAGE014
与它的K个最近邻集合 
Figure 103916DEST_PATH_IMAGE015
,并计算
Figure 755478DEST_PATH_IMAGE014
Figure 237012DEST_PATH_IMAGE015
中每个点的距离的平均值 
Figure 835484DEST_PATH_IMAGE016
。则的K近邻的相对密度为: 
Figure 144422DEST_PATH_IMAGE041
              (7)
步骤2:当节点
Figure 349139DEST_PATH_IMAGE014
满足条件 
Figure 282460DEST_PATH_IMAGE042
时,被视为核心节点,而对应的核心节点集合为 
Figure 387557DEST_PATH_IMAGE019
,其中O是所有核心结点的列表,  
Figure 584183DEST_PATH_IMAGE020
是所有聚类的初始状态;
步骤3:  
Figure 72933DEST_PATH_IMAGE020
中所有节点的K近邻节点也将被考虑,若满足上述条件,也将被扩展进该聚类中;
步骤4:以此类推,可以发现核心节点仅能属于一个类,而其他节点可以属于多个类,从而实现模糊化。此时,最高粒度的模糊聚类计算完毕。
步骤5:最高粒度的聚类结果将被逐层合并,其依据是不同类
Figure 13207DEST_PATH_IMAGE021
之间的相似性计算,如下式:
 
Figure 638541DEST_PATH_IMAGE023
                    (8)
步骤6:对于每个粒度级别,定义对应的阀值
Figure 316384DEST_PATH_IMAGE024
,并将满足该约束的两个类合并成一个类:。在同一粒度下,合并生成的类之间可能存在交集。这就最终形成了一个不同粒度的层次化模糊聚类树(如图3)。
聚类后每个类即对应于一个包含各种模态信息单元特征向量的语义簇SC,它与典型向量TV,以及语义向量包SVB之间的关系如图4所示。
上述实例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出任何的修改和改变,都落入本发明的保护范围。

Claims (7)

1.一种基于语义关联网络的跨模信息检索方法,其特征在于,包括以下步骤:
通过网页视觉空间分析、多媒体搜索引擎标注关系分析、DeepWeb接口模式分析、复合媒体中不同模态数据的关联分析、用户直接或潜在反馈信息的利用,以及关联推理等六个渠道获取跨模信息单元的语义关联知识;
基于以上不同渠道获取的关联知识,进行加权整合,构建统一的跨模语义关联网络;
针对跨模语义关联网络,基于关联知识实施分层模糊聚类;
在每个类中,针对所有信息单元的特征向量进行二次聚类,选出典型特征向量,作为该类的代表;
对系统中所有信息单元对应的特征向量,建立散列索引;
在每个信息单元,对应特征向量、聚类的典型特征向量、聚类序号之间建立映射关系。
2.根据权利要求1所述的基于语义关联网络的跨模信息检索方法,其特征在于,所述网页视觉空间分析包括以下步骤:
将页面划分成不同粒度、具有视觉层次包含关系的若干块;
将以上分析出的块转换成视觉关系树;
利用视觉关系树计算各种模态信息单元之间的语义关联。
3.根据权利要求1所述的基于语义关联网络的跨模信息检索方法,其特征在于,所述多媒体搜索引擎标注关系分析包括以下步骤:
针对某个多媒体搜索引擎,采用以下公式计算搜索关键字集合和第v条结果的标注概念集合的语义相似性:
Sim ( K u T v ) = &cap; K u T v + ( KM + &psi; ) ( &cup; K u T v - &cap; K u T v ) &cup; K u T v
其中,KM=KM<Dist(Cs,C′t)>(Cs∈Ku,C′t∈Tv)
上式中Ku、Tv分别表示搜索概念集合和第v条结果的标注概念集合;ψ是一个修正常量,用于防止两个集合的交集
Figure FDA0000080557560000012
为空;KM为Kuhn-Munkres算法,Dist(Cs,C′t)表示从搜索关键字和结果标签中分别选择一个概念,并通过WordNet或者其他本体计算它们的语义相似性;
构建多媒体元搜索引擎,定义一个语义空间来衡量所有结果之间的关联大小,其中横坐标为每条结果标注与检索条件的关联度大小,即Sim(KuTv),纵坐标为搜索引擎排序值。
4.根据权利要求1所述的基于语义关联网络的跨模信息检索方法,其特征在于,所述DeepWeb接口模式分析包括以下步骤:
基于同类网页叠加,定位网页中DeepWeb数据区域;
识别后台关系数据库的数据模式;
利用后台关系数据库的横轴模式信息,实现不同属性、不同模态数据之间的相互解释;
利用后台关系数据库的纵轴数据信息,计算不同元组之间的语义关联大小。
5.根据权利要求1所述的基于语义关联网络的跨模信息检索方法,其特征在于,所述复合媒体中不同模态数据的关联分析包括以下步骤:
时序媒体的单元分割;
对于音视同步的复合媒体,若分离后不同模态的信息单元仍保持相同时序依赖性,则定义它们的关联值为1,而分割后同模态的各信息单元之间的关联计算公式为:
R D ( O i , O j ) = 1 ( x = 0 ) 1 / x + 1 - &epsiv; ( x &GreaterEqual; 1 )
ε是一个表示语义关联退化的常量,x表示信息单元Oi和Oj之间的间隔。
6.根据权利要求1所述的基于语义关联网络的跨模信息检索方法,其特征在于,所述用户直接或潜在反馈信息的利用,计算对象Oi和Oj之间的关联性大小RF(Oi,Oj),包括以下步骤:
记录用户在浏览检索结果过程中涉及的各类操作;
基于相同检索需求的反馈信息将被叠加:
RF(Oi,Oj)=log3(∑(θ·η)+2)*RF(Oi,Oj)(η>0)
其中η表示信息单元Oi和Oj在相同检索中被施以相同操作的总次数,θ代表每种操作的权重,但RF(Oi,Oj)的最大值仅能为1。
7.根据权利要求1所述的基于语义关联网络的跨模信息检索方法,其特征在于,针对跨模语义关联网络采用分层模糊聚类方法包括以下步骤:
选择每个节点Oi与它的K个最近邻集合SK(Oi),并计算Oi到SK(Oi)中每个点的距离的平均值AVGK(Oi),其中每个节点对应一个信息单元。则Oi的K近邻的相对密度为:
H F ( O i ) = Min O i 1 , . . . ik &Element; s K ( O i ) ( AVG K ( O i ) , AV G K ( O i 1 ) , . . . , AVG K ( O iK ) ) Max O i 1 , . . . ik &Element; s K ( O i ) ( AV G K ( O i ) , AVG K ( O i 1 ) , . . . , AVG K ( O iK ) )
当节点Oi满足条件(1-HF(Oi))<δ,权值δ>0时,被视为核心节点,而对应的核心节点集合为ΘK(Oi)={O|O∈Oi∪(SK(Oi)∧O)},其中O是所有核心结点的列表,ΘK(Oi)是所有聚类的初始状态;
ΘK(Oi)中所有节点的K近邻节点也将被考虑,若满足上述条件,也将被扩展进该聚类中;
以此类推,可以发现核心节点仅能属于一个类,而其他节点可以属于多个类,从而实现模糊化;
最高粒度的聚类结果将被逐层合并,其依据是不同类
Figure FDA0000080557560000031
Figure FDA0000080557560000032
之间的相似性计算,如下式:
Figure FDA0000080557560000033
对于每个粒度级别,定义对应的阀值ξΔ(Δ=1,...,n),并将满足该约束的两个类合并成一个类:
Figure FDA0000080557560000034
CN2010102529350A 2010-08-13 2010-08-13 基于语义关联网络的跨模信息检索方法 Expired - Fee Related CN101894170B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102529350A CN101894170B (zh) 2010-08-13 2010-08-13 基于语义关联网络的跨模信息检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102529350A CN101894170B (zh) 2010-08-13 2010-08-13 基于语义关联网络的跨模信息检索方法

Publications (2)

Publication Number Publication Date
CN101894170A CN101894170A (zh) 2010-11-24
CN101894170B true CN101894170B (zh) 2011-12-28

Family

ID=43103362

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102529350A Expired - Fee Related CN101894170B (zh) 2010-08-13 2010-08-13 基于语义关联网络的跨模信息检索方法

Country Status (1)

Country Link
CN (1) CN101894170B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426578B (zh) * 2011-08-25 2014-07-02 华南理工大学 一种智能语义网中本体概念模糊相似度度量方法
CN102314519B (zh) * 2011-10-11 2012-12-19 中国软件与技术服务股份有限公司 一种基于公安领域知识本体模型的信息搜索方法
US20150286711A1 (en) * 2012-11-27 2015-10-08 Nokia Corporation Method for web information discovery and user interface
CN104317837B (zh) * 2014-10-10 2017-06-23 浙江大学 一种基于主题模型的跨模态检索方法
CN105005578A (zh) * 2015-05-21 2015-10-28 中国电子科技集团公司第十研究所 多媒体目标信息可视化分析系统
CN104850541B (zh) * 2015-06-04 2016-10-26 武汉大学 一种基于位置语义网的语义位置转换方法
CN106021308B (zh) * 2016-05-05 2020-02-04 重庆大学 一种面向时序大数据的查询事件识别与检测方法及系统
CN108108345B (zh) * 2016-11-25 2021-08-10 南京尚网网络科技有限公司 用于确定新闻主题的方法与设备
CN108241986B (zh) * 2016-12-23 2021-12-24 北京国双科技有限公司 一种数据处理方法和终端
CN106709011B (zh) * 2016-12-26 2019-07-23 武汉大学 一种基于空间定位簇的位置概念层次消解计算方法
CN108287853B (zh) * 2017-01-10 2020-11-03 杭州有数金融信息服务有限公司 一种数据关系分析方法及其系统
CN109089133B (zh) * 2018-08-07 2020-08-11 北京市商汤科技开发有限公司 视频处理方法及装置、电子设备和存储介质
CN110879863B (zh) * 2018-08-31 2023-04-18 阿里巴巴集团控股有限公司 跨领域搜索方法和跨领域搜索装置
CN109299315B (zh) * 2018-09-03 2023-03-28 腾讯科技(深圳)有限公司 多媒体资源分类方法、装置、计算机设备及存储介质
CN109726401B (zh) * 2019-01-03 2022-09-23 中国联合网络通信集团有限公司 一种专利组合生成方法及系统
CN110188209B (zh) * 2019-05-13 2021-06-04 山东大学 基于层次标签的跨模态哈希模型构建方法、搜索方法及装置
CN110825891B (zh) * 2019-10-31 2023-11-14 北京小米移动软件有限公司 多媒体信息的识别方法及装置、存储介质
CN111125406B (zh) * 2019-12-23 2023-08-04 天津大学 一种基于自适应聚类学习的视觉关系检测方法
CN111639197B (zh) * 2020-05-28 2021-03-12 山东大学 标签嵌入在线哈希的跨模态多媒体数据检索方法及系统
CN111737430B (zh) * 2020-06-16 2024-04-05 北京百度网讯科技有限公司 实体链接方法、装置、设备以及存储介质
US11941364B2 (en) 2021-09-01 2024-03-26 International Business Machines Corporation Context-driven analytics selection, routing, and management

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452470A (zh) * 2007-10-18 2009-06-10 石忠民 摘要式网络搜索引擎系统及其搜索方法与应用
CN101694657A (zh) * 2009-09-18 2010-04-14 浙江大学 面向Web2.0标签图片共享空间的图片检索聚类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7933856B2 (en) * 2007-10-12 2011-04-26 Los Alamos National Security Llc System and method for knowledge based matching of users in a network

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452470A (zh) * 2007-10-18 2009-06-10 石忠民 摘要式网络搜索引擎系统及其搜索方法与应用
CN101694657A (zh) * 2009-09-18 2010-04-14 浙江大学 面向Web2.0标签图片共享空间的图片检索聚类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Lailil Muflikhah,Baharum Baharudin.Document Clustering using Concept Space and Cosine Similarity Measurement.《2009 International Conference on Computer Technology and Development》.2009,58-62. *
欧伟杰,王科,曾承,李德毅,彭智勇.多源Web服务发现框架.《解放军理工大学学报(自然科学版)》.2008,第9卷(第5期),431-435. *

Also Published As

Publication number Publication date
CN101894170A (zh) 2010-11-24

Similar Documents

Publication Publication Date Title
CN101894170B (zh) 基于语义关联网络的跨模信息检索方法
Chen Information visualisation and virtual environments
US9454599B2 (en) Automatic definition of entity collections
US6965900B2 (en) Method and apparatus for electronically extracting application specific multidimensional information from documents selected from a set of documents electronically extracted from a library of electronically searchable documents
CN105893611B (zh) 一种构建面向社交网络的兴趣主题语义网络的方法
Abebe et al. Generic metadata representation framework for social-based event detection, description, and linkage
Wang et al. A flexible spatio-temporal indexing scheme for large-scale GPS track retrieval
CN101719167B (zh) 一种可互动的影视搜索方法
CN101834837A (zh) 基于宽带网络的旅游景区景点在线景观视频主动信息服务系统
CN102184262A (zh) 基于web的文本分类挖掘系统及方法
CN101364239A (zh) 一种分类目录自动构建方法及相关系统
CN101641674A (zh) 时间序列搜索引擎
CN104199938B (zh) 基于rss的农用土地信息发送方法和系统
CN103455487A (zh) 一种搜索词的提取方法及装置
CN113239111B (zh) 一种基于知识图谱的网络舆情可视化分析方法及系统
JP2005063432A (ja) マルチメディアオブジェクト検索装置およびマルチメディアオブジェクト検索方法
Rehman et al. Building socially-enabled event-enriched maps
Sakouhi et al. Dynamic and multi-source semantic annotation of raw mobility data using geographic and social media data
Chen et al. A unified framework for web link analysis
CN112800083A (zh) 一种面向政府决策的政务大数据分析方法及设备
CN112597370A (zh) 指定需求范围的网页信息自主搜集筛选系统
Cohen et al. Learning to understand the web
Kitamoto Digital typhoon: Near real-time aggregation, recombination and delivery of typhoon-related information
CN114722304A (zh) 异质信息网络上基于主题的社区搜索方法
Chen et al. FRACTURE mining: Mining frequently and concurrently mutating structures from historical XML documents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20101124

Assignee: Wuhan Taile odd Mdt InfoTech Ltd

Assignor: Wuhan University

Contract record no.: 2013420000160

Denomination of invention: Semantic relationship network-based cross-mode information retrieval method

Granted publication date: 20111228

License type: Exclusive License

Record date: 20130922

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111228

Termination date: 20140813

EXPY Termination of patent right or utility model