CN101714159A - 基于mpeg7标准的图像索引的构建方法 - Google Patents
基于mpeg7标准的图像索引的构建方法 Download PDFInfo
- Publication number
- CN101714159A CN101714159A CN 200910186804 CN200910186804A CN101714159A CN 101714159 A CN101714159 A CN 101714159A CN 200910186804 CN200910186804 CN 200910186804 CN 200910186804 A CN200910186804 A CN 200910186804A CN 101714159 A CN101714159 A CN 101714159A
- Authority
- CN
- China
- Prior art keywords
- image
- feature description
- index
- color
- xml
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于MPEG7标准的图像索引的构建方法,其特征在于所述方法包括以下步骤:(1)针对图像库中图像按照MPEG7标准进行分析,提取图像中大小,颜色、纹理、轮廓、形状特征;(2)对图像的大小,颜色、纹理、轮廓、形状特征按照MPEG7标准形成特征描述信息;(3)建立XML方式的索引,将特征描述信息记录入XML索引中或与XML索引关联。该方法提高了进行图像检索时的检索的效率与准确性,也实现了单一特征的检索和多种媒体特征共同检索的方式。
Description
技术领域
本发明属于计算机技术方面的图像处理技术领域,具体涉及一种基于MPEG7标准的图像索引的构建方法。
背景技术
现有技术中最常用的图像或其他媒体信息存储,依然是基于文本标注的。这种方法依赖于人工标注,不但费时费力,而且标注的信息往往不全面、不准确;同时,还存在操作者的主观偏差,不同的人对相同图像或其他媒体的理解不同,导致图像或其他媒体信息不能客观反映图像的实际内容。而常见基于图像或其他媒体内容(视觉特征)的特征提取方法,通常只能在检索时对图像或其他媒体的某一特征进行提取,提取的特征信息也只在某次检索中一次性使用,缺乏一种有效的保存和管理这些特征信息的方法。
另外,MPEG-7标准2001年已被公布,该标准为各类多媒体信息提供一种标准化的描述,这种描述将与内容本身有关,允许快速和有效的查询用户感兴趣的资料。该标准目的是要制定一种针对各类多媒体信息的描述标准。该描述与内容有关,并能够达到快速高效地搜索用户感兴趣的素材。
MPEG-7标准被称为“多媒体内容描述接口”,对MPEG-7而言,需要描述的各种多媒体信息素材包括:静止图片、图形、声音、运动图象,以及有关这些元素如何组合成多媒体表述的组合信息。为此,MPEG-7定义了″标准描述子集合(Standard Set of Descriptors)″用于描述各种类型的多媒体数据,与之相应的″描述方案(Description Schemes)″用于规范多媒体描述子的生成和不同描述子之间的有机联系。这些描述子与所指定的多媒体对象的内容紧密联系,采用提取对象特征的方法为实现基于内容的语义的准确检索提供了接口。在此基础上,MPEG-7定义了一种新的语言-″描述定义语言(Description Definition Language)″用于指定和生成描述方案。该标准规定一个描述各种多媒体信息的描述子的标准集和定义其它的描述子和用于描述子结构和关系的描述方案的标准方式。更重要的是,考虑到面向用户,描述子和描述方案是基于内容。本发明正基于此标准的应用而来。
发明内容
本发明目的在于提供一种基于MPEG7标准的图像索引的构建方法,解决了现有技术中图像索引库手工文字标注索引耗费较多的人力财力、而基于图像内容的标引技术尚不成熟,造成索引效率低、检索命中率低下等问题。
为了解决现有技术中的这些问题,本发明提供的技术方案是:
一种基于MPEG7标准的图像索引的构建方法,其特征在于所述方法包括以下步骤:
(1)针对图像库中图像按照MPEG7标准进行分析,提取图像中大小,颜色、纹理、轮廓、形状特征;
(2)对图像的大小,颜色、纹理、轮廓、形状特征按照MPEG7标准形成特征描述信息;
(3)建立XML方式的索引,将特征描述信息记录入XML索引中或与XML索引关联。
优选的,所述步骤(1)中图像颜色特征通过颜色直方图方法进行提取。
优选的,所述步骤(1)中图像纹理特征通过LBPBH方法进行提取。
优选的,所述LBPBH方法包括以下步骤:
A、将彩色图像转换为灰度图像;
B、将灰度图像的灰度级数由256维降至32维;
C、扫描灰度图像,并使用LBPBH算法分析得到图像中非边缘像素的领域二值表和图像的局部模式;
D、根据图像的局部模式生成统计直方图,通过统计直方图构建全局直方图。
优选的,所述方法中步骤(2)通过构造特征描述子表述图像的大小,颜色、纹理、轮廓、形状特征的特征描述信息。
优选的,所述方法中步骤(2)中特征描述信息还包括对图像进行文字标注的特征描述信息。
优选的,所述步骤(3)中当特征描述子的描述信息为简单数据类型时,直接将特征描述子记录入XML索引中;当特征描述子的描述信息为复杂数据类型时,在XML索引中记录特征描述子的存储地址。
优选的,当特征描述子的描述信息为复杂数据类型时,所述特征描述子存入外部存储或数据库存储或网络存储中。
具体来说,可以建立一个图像或媒体库,利用MPEG7标准,对库中元素进行分析,提取元素的大小,颜色、纹理、轮廓、形状等特征的标准描述信息;对不同的描述信息,定义各自的特征描述子;可根据实际系统的情况,追加部分标注型的特征描述子;
然后,建立XML方式的索引;对各个信息,根据数据量的不同,选择不同的存储方式:名称、大小等简单信息类特征,直接记录与XML索引中;而对纹理、轮廓等数据量较大的信息,可选择外部存储,数据库存储或者网络存储等方式,XML索引中只记录存储信息。
相对于现有技术中的方案,本发明的优点是:
1.本发明技术方案由于采用MEPG7标准,所以本方法中的描述子标准统一,没有人为的主观偏差;而提取图像或其他媒体的特征描述,只在图像或其他媒体元素入库时计算一次,而传统方法每进行一次检索都必须重新计算多有检索对象的特征;由于媒体库中并非记录图像的单一特征,所以在检索时可以采用多种媒体特征共同检索的方式,提高了检索的效率与准确性。
2、相比于传统方法,这种方法大大的降低了检索过程中的重复计算和系统损耗,有效的提高了检索效率和准确性。本方法因不受单一系统平台的限制,故可以应用于跨平台系统的应用之中。此方法可以在多个领域得到应用。例如设计出版业,可利用本方法来管理图片素材库;实验室可以用来进行图谱自动识别和管理;警务、人事等系统可用来进行可视化档案的管理。同时,本方法还能够很容易的扩展应用到其他的多媒体形式,视频、影片、音乐、语音、声音等等各种资源都可以用此方法来进行管理。
综上所述,本发明提供一种能够有效提取、管理和组织图像或其他媒体的特征信息的有效途径。该方法以MPEG7标准与XML数据交换技术为基础,提取图像或其他媒体的大小,颜色、纹理、轮廓、形状等特征的标准描述信息,并对这些信息进行有效地组织和管理。
附图说明
下面结合附图及实施例对本发明作进一步描述:
图1为本发明实施例基于MPEG7标准的图像索引的构建方法流程图;
图2为本发明实施例图像索引的构建时进行图像纹理特征抽取的方法流程图。
具体实施方式
以下结合具体实施例对上述方案做进一步说明。应理解,这些实施例是用于说明本发明而不限于限制本发明的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整,未注明的实施条件通常为常规实验中的条件。
实施例注册商标登录检索系统——XML索引的构建
作为示例,已经实现了“注册商标登录检索系统”。该系统可以对现有注册商标进行特征提取,并进行统一组织存储,针对新有的商标设计,可以快速查看是否已经存在相同或相似的设计。
如图2所示,建立一个图像或媒体库,利用MPEG7标准,对库中元素进行分析,提取元素的大小,颜色、纹理、轮廓、形状等特征,并对这些特征进行MPEG7标准进行描述标准化形成标准描述信息,以图像的这些标准描述信息构建XML方式的索引;具体的,对标准描述信息进行存储,名称、大小信息直接记录与XML索引中,纹理、轮廓存储到预设的本地磁盘中,XML索引中只记录存储信息和地址。
图3是建立XML图像索引库的具体方法流程。针对商标图像的特点,选用颜色直方图描述其颜色特征,使用LBPBH(local binary pattern basedhistogram)方法提取图像的纹理特征。在本实施例中,这些颜色和纹理信息将被存放在磁盘的指定位置,信息的存储位置记入XML索引。由于注册商标及图案有其特殊的表征意义,所以追加商标名、注册者、注册时间等文字描述信息。这些信息内容比较简单,将同图像大小等信息一起,直接记入XML索引。
颜色特征的提取经由如下过程:
为了正确地使用颜色.需要建立颜色模型。当选用的颜色空间有N个基本量时,所建立的颜色模型就是一个N-D坐标系。本实施例的颜色特征提取可以采用如下过程进行:
进行颜色空间转换,将图像从RGB空间转到HSV空间;对HSV进行量化。直接用HSV空间的直方图来描述图像将具有很大的冗余,因此一般都会对HSV空间进行量化,量化后整幅图像的颜色可以用162种(18×3×3)颜色来表示;计算归一化的直方图,从而得到每种颜色占图像的百分比。将各种颜色按其对应的百分比降序排列,以此序列获取主颜色,满足P≥5%或∑P≤60%两个条件之一,则把该颜色作为主颜色。这样就可以通过颜色的相似度来进行检索。
纹理特征的提取经由如下几个过程:
1、图像的灰度化:转换彩色图像为灰度图像
2、图像的量化:将灰度图像的灰度级数由256维降至32维
3、局部模式的建立:使用改进的LBP算法分析图像的局部模式
4、全局直方图的建立:使用图像分割级数构建全局直方图
具体的,如图3所示,先将图像进行灰度化处理,将彩色图像转换为灰度图像,然后对该灰度图像进行量化,将灰度图像的灰度级数由256维降至32维;然后按照改进的LBP算法进行分析处理:扫描灰色图像上所有非边缘像素点,生成每个像素的领域二值表(以3×3矩形区域为例,以其中心像素灰度值为阈值,比较其邻域8个像素的灰度值的大小,产生该区域的二进制模式)。
接下来进行领域二值表的数据处理,本实施例通过判断是否像素的领域二值表属于flat模式,当像素的领域二值表不属于平面模式(flat模式)时,计算像素的领域二值表中出现1的频率,当其频率小于3时,对像素的领域二值表进行均一化处理(uniform模式),标记具体的uniform模式,生成统计直方图,由统计直方图构建全局直方图;否则当其频率大于3时,标记为混合模式,生成统计直方图而构建全局直方图。另外当像素的领域二值表属于flat模式时,直接标记flat模式生成统计直方图。
对提取好的特征信息,建立类似下列的XML索引,简单类型的信息直接记入,复杂信息记录存储位置。
<?xml version=″1.0″encoding=″shift_jis″?>
-<Mpeg7 xmlns=″urn:mpeg:mpeg7:schema:2001″
xmlns:xsi=″http://www.w3.org/2001/XMLSchema-instance″
xmlns:mpeg7=″urn:mpeg:mpeg7:schema:2001″ xmlns:mss=″urn:mss″
xsi:schemaLocation=″urn:mss mss.xsd″>
-<Description xsi:type=″ContentEntityType″>
-<MultimediaContent xsi:type=″MSSImageType″>
-<mss:MSSImage>
-<MediaLocator>
<MediaUri>\...\Pics\Audi.jpg</MediaUri>
</MediaLocator>
-<StillRegion xsi:type=″ImageTextType″textType=″scene″>
-<SpatialLocator>
<Box mpeg7:dim=″4″>0 0 128 128</Box>
</SpatialLocator>
</StillRegion>
-<mss:MSSMetaData>
<mss:Brand>Audi</mss:Brand>
<mss:RegisterYear>2008</mss:RegisterYear>
<mss:Producer>Audi</mss:Producer>
<mss:ProduceArea/>
<mss:Counts>Audi</mss:Counts>
</mss:MSSMetaData>
-<mss:MSSColorData>
<mss:Path>\...\ColorData\Audi.cod</mss:Path>
</mss:MSSColorData>
-<mss:MSSLbpData>
<mss:Path>\...\LbpData\Audi.lbp</mss:Path>
</mss:MSSLbpData>
</mss:MSSImage>
...
</MultimediaContent>
</Description>
</Mpeg7>
上述实例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人是能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种基于MPEG7标准的图像索引的构建方法,其特征在于所述方法包括以下步骤:
(1)针对图像库中图像按照MPEG7标准进行分析,提取图像中大小,颜色、纹理、轮廓、形状特征;
(2)对图像的大小,颜色、纹理、轮廓、形状特征按照MPEG7标准形成特征描述信息;
(3)建立XML方式的索引,将特征描述信息记录入XML索引中或与XML索引关联。
2.根据权利要求1所述的方法,其特征在于所述步骤(1)中图像颜色特征通过颜色直方图方法进行提取。
3.根据权利要求1所述的方法,其特征在于所述步骤(1)中图像纹理特征通过LBPBH方法进行提取。
4.根据权利要求3所述的方法,其特征在于所述LBPBH方法包括以下步骤:
A、将彩色图像转换为灰度图像;
B、将灰度图像的灰度级数由256维降至32维;
C、扫描灰度图像,并使用LBPBH算法分析得到图像中非边缘像素的领域二值表和图像的局部模式;
D、根据图像的局部模式生成统计直方图,通过统计直方图构建全局直方图。
5.根据权利要求1所述的方法,其特征在于所述方法中步骤(2)通过构造特征描述子表述图像的大小,颜色、纹理、轮廓、形状特征的特征描述信息。
6.根据权利要求5所述的方法,其特征在于所述方法中步骤(2)中特征描述信息还包括对图像进行文字标注的特征描述信息。
7.根据权利要求5所述的方法,其特征在于所述步骤(3)中当特征描述子的描述信息为简单数据类型时,直接将特征描述子记录入XML索引中;当特征描述子的描述信息为复杂数据类型时,在XML索引中记录特征描述子的存储地址。
8.根据权利要求7所述的方法,其特征在于当特征描述子的描述信息为复杂数据类型时,所述特征描述子存入外部存储或数据库存储或网络存储中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910186804 CN101714159A (zh) | 2009-12-22 | 2009-12-22 | 基于mpeg7标准的图像索引的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910186804 CN101714159A (zh) | 2009-12-22 | 2009-12-22 | 基于mpeg7标准的图像索引的构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101714159A true CN101714159A (zh) | 2010-05-26 |
Family
ID=42417807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200910186804 Pending CN101714159A (zh) | 2009-12-22 | 2009-12-22 | 基于mpeg7标准的图像索引的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101714159A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163240A (zh) * | 2011-05-20 | 2011-08-24 | 苏州两江科技有限公司 | 基于mpeg-7标准的人脸特征图像索引库的构建方法 |
CN102226908A (zh) * | 2011-05-30 | 2011-10-26 | 苏州两江科技有限公司 | 基于mpeg-7标准的人脸判别方法 |
CN112307233A (zh) * | 2020-10-30 | 2021-02-02 | 圆通速递有限公司 | 基于区块链的云存储中的重复图像删除方法和系统 |
-
2009
- 2009-12-22 CN CN 200910186804 patent/CN101714159A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163240A (zh) * | 2011-05-20 | 2011-08-24 | 苏州两江科技有限公司 | 基于mpeg-7标准的人脸特征图像索引库的构建方法 |
CN102226908A (zh) * | 2011-05-30 | 2011-10-26 | 苏州两江科技有限公司 | 基于mpeg-7标准的人脸判别方法 |
CN112307233A (zh) * | 2020-10-30 | 2021-02-02 | 圆通速递有限公司 | 基于区块链的云存储中的重复图像删除方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8731286B2 (en) | Video detection system and methods | |
CN103065153B (zh) | 一种基于色彩量化和聚类的视频关键帧提取方法 | |
CN103605667B (zh) | 一种图像自动标注算法 | |
US20110103699A1 (en) | Image metadata propagation | |
Clinchant et al. | Comparing machine learning approaches for table recognition in historical register books | |
CN101021855A (zh) | 基于内容的视频检索系统 | |
CN101425082A (zh) | 视频文件内容确定方法及系统 | |
CN101421746A (zh) | 基于椭圆颜色模型的混合的图像分类 | |
CN108427713A (zh) | 一种用于自制视频的视频摘要方法及系统 | |
CN114169381A (zh) | 图像标注方法、装置、终端设备及存储介质 | |
CN112925905B (zh) | 提取视频字幕的方法、装置、电子设备和存储介质 | |
CN111723256A (zh) | 一种基于信息资源库的政务用户画像构建方法及其系统 | |
CN112328905B (zh) | 线上营销内容推送方法、装置、计算机设备及存储介质 | |
CN101714158A (zh) | 基于mpeg7标准的图像检索方法 | |
CN101714159A (zh) | 基于mpeg7标准的图像索引的构建方法 | |
CN110704738A (zh) | 基于法官画像的服务信息推送方法、装置、终端及存储介质 | |
KR20220079026A (ko) | 일반 문서 기반의 멀티미디어 영상 콘텐츠 제작 서비스 제공 장치 | |
CN115730119A (zh) | 一种档案智能化辅助编研方法、系统及相关设备 | |
Bchir et al. | Region-based image retrieval using relevance feature weights | |
CN114495138A (zh) | 一种智能文档识别与特征提取方法、装置平台和存储介质 | |
CN115587200A (zh) | 基于智能相册管家系统的内容分类方法及装置 | |
Mezaris et al. | A test-bed for region-based image retrieval using multiple segmentation algorithms and the MPEG-7 eXperimentation Model: The Schema Reference System | |
CN101789029B (zh) | 一种视频图像的分析方法、装置和数据库 | |
Karray et al. | Indexing video summaries for quick video browsing | |
CN118349529B (zh) | 一种基于深度学习的图片视频存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20100526 |