CN101360174A - 数字图像的分类方法及分类装置 - Google Patents
数字图像的分类方法及分类装置 Download PDFInfo
- Publication number
- CN101360174A CN101360174A CNA2007101382821A CN200710138282A CN101360174A CN 101360174 A CN101360174 A CN 101360174A CN A2007101382821 A CNA2007101382821 A CN A2007101382821A CN 200710138282 A CN200710138282 A CN 200710138282A CN 101360174 A CN101360174 A CN 101360174A
- Authority
- CN
- China
- Prior art keywords
- digital picture
- module
- classification results
- texture
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种数字图像分类方法。首先,该方法针对一数字图像的一候选区域执行一离散余弦变换以产生一组离散余弦变换系数。接着,该方法根据该组离散余弦变换系数产生一组纹理参数。最后,该方法根据该组纹理参数产生该数字图像的一分类结果。
Description
技术领域
本发明涉及图像分类,并且,特别地涉及一种数字图像的分类方法及分类装置。
背景技术
近年来,由于图像科技不断地创新与进步,数字图像的市场亦随的蓬勃发展。如今大部分的相片都已经采用数字化的方式进行拍摄(例如以数字相机拍摄)并且用数字化的格式存储(例如存储在存储卡、光盘或硬盘中)。
一般而言,在拍摄了大量的数字图像之后,使用者会将这些数字图像存储在存储卡中、将其传送至个人计算机的硬盘里或将其烧录成相片光盘。在日积月累之下,存储在各种形式的存储装置的数字图像的数量及类型势必不断地增加。此时,如果不适当地进行管理及分类,这些数字图像会显得相当杂乱且没有秩序。尤其是当使用者要找寻多年前所拍摄的某一张照片时,若没有良好的分类,更是显得相当困难。因此,如何针对图像进行分类就变得相当重要。
在图像的分类技术上,传统的方式是由使用者自行根据相片的内容加以判断。然而,此种必须通过人力一张张去进行辨别的数字图像分类法,不仅相当耗时且效率很低,尤其当图像的数量非常庞大时,若不能采用更有效率、更自动化的分类方法,将难以顺利完成图像的分类工作。
此外,目前虽已有藉由图像的文件名称进行图像分类的方式被广泛地运用,像是许多因特网上的入口网站均具备的图像搜寻功能,就是最好的例子。然而,由于一般使用者在命名图像文件时,其文件名称并不见得和其图像内容直接相关。因此,一般使用者在使用此一图像搜寻功能时,搜寻错误的情况仍时常会发生,可见此种分类方法并不够精确。在实际应用上,虽然此种分类方法可以藉由撷取图像的某些特征值(例如颜色)来改善其搜寻的精确性,但其应用被局限于个人计算机端及服务器端,并且仍无法真正达到数字图像自动分类的功效。
因此,本发明的主要方面在于提供一种数字图像自动分类方法及装置,以解决上述问题。
发明内容
本发明提供一种数字图像的分类方法及分类装置。根据本发明的一具体实施例是一种数字图像分类方法。首先,该方法针对一数字图像的一候选区域执行一离散余弦变换(Discrete Cosine Transform,DCT)以产生一组离散余弦变换系数。接着,该方法根据该组离散余弦变换系数产生一组纹理参数。最后,该方法根据该组纹理参数产生该数字图像的一分类结果。
由于该图像的离散余弦变换系数对应于其纹理特征,根据本发明的数字图像的分类方法及分类装置,是通过离散余弦变换的方式得到该数字图像的纹理信息,并且根据纹理信息来产生该数字图像的分类结果。藉此,该分类方法与分类装置可达到自动分类数字图像甚至自动命名数字图像的功能。
相较于先前技术,根据本发明的方法可由计算机自行执行,因此可改善以人工判断耗时又耗力的缺点。另一方面,根据本发明的方法是根据各张图像本身的纹理特征进行分类,因此其分类结果将远比仅根据文件名称或图像颜色进行分类来得精确。
关于本发明的优点与精神可以藉由以下的发明详述及附图得到进一步的了解。
附图说明
图1示出了根据本发明第一具体实施例的数字图像分类方法的流程图。
图2示出了由数字图像中选出候选区域的流程图。
图3示出了根据本发明第二具体实施例的数字图像分类装置的功能方块图。
图4示出了图3所示的数字图像分类装置进一步包含分割模块、分析模块及色彩空间变换模块的功能方块图。
图5示出了图4所示的数字图像分类装置进一步包含对照表及命名模块。
附图符号说明
S11-S16:流程步骤
10:数字图像分类装置 11:DCT变换模块
12:纹理模块 13:分类模块
14:分割模块 15:分析模块
16:色彩空间变换模块 17:对照表
18:命名模块。
具体实施方式
根据本发明的第一具体实施例是一种数字图像分类方法。请参照图1,图1示出了该数字图像分类方法的流程图。如图1所示,首先,该方法执行步骤S11,针对一数字图像的一候选区域执行一离散余弦变换(DiscreteCosine Transform,DCT)以产生一组离散余弦变换系数。接着,该方法执行步骤S12,根据该组离散余弦变换系数产生一组纹理参数。之后,该方法执行步骤S13,根据该组纹理参数产生该数字图像的一分类结果。
在实际应用中,可以有多个预设分类结果被预先提供,其中,每一个预设分类结果均可各自对应于一组预设纹理参数。上述步骤S13中所述的该分类结果可以是将该组纹理参数与该多组预设纹理参数进行比对后所产生。该分类结果可以是一人物类或一风景类。此外,该组纹理参数可包含下列参数中的至少一个参数:一平滑纹理能量EDC、一垂直纹理/水平纹理能量比EV/EH及一斜向纹理能量ES。
请参照图2,图2示出了上述的候选区域可能的产生方式。如图2所示,该方法可以先执行步骤S14,将该数字图像由一第一色彩空间变换至一第二色彩空间。其中,该第二色彩空间可为一HSV色彩空间。接着,该方法执行步骤S15,根据一目标色彩,利用一色彩分割法将该数字图像分割为一目标区域与一非目标区域。之后,该方法执行步骤S16,利用形态分析及/或八连通分析由该目标区域中选出该候选区域。
在步骤S13产生该数字图像的分类结果之后,该方法可以自一预设的对照表中找出对应于该分类结果的一名称,并且根据该名称来命名该数字图像。
举例而言,假设在一对照表中,与分类结果A相对应的名称为「人物照」,与分类结果B相对应的名称为「风景照」。若使用者根据该方法对三张数字相片进行图像分类所得的分类结果均为A,即可将这三张数字相片依序命名为「人物照001」、「人物照002」及「人物照003」。相反地,若根据该方法对数张数字相片所得的图像分类结果为B时,则这些数字相片可被依序命名为「风景照001」、「风景照002」、…等。
此外,该方法亦可进一步将该分类结果记录在该数字图像的一标记(tag)或一可交换图像文件(Exchangeable Image File,EXIF)图像格式中。经过上述分类程序之后,当使用者或电子装置在进行图像搜寻时,能够根据分类结果更快速地找到想要的图像。
举例而言,假设使用者利用数字相机拍摄了一张数字相片,并将之存储在计算机的硬盘中。若以肤色为目标色彩,则根据本发明的数字图像分类方法可利用色彩分割法将该数字相片分割为肤色区域与非肤色区域。接着,该方法可通过形态分析及/或八连通分析将长宽比及面积等限制条件加入,以从该肤色区域中选出至少一个肤色候选区域。
若仅利用图像色彩为依据所得到的分类结果除了不够精确外,亦可能有误判的情形发生。为了提高数字图像分类的正确率,根据本发明的方法可进一步通过该图像的纹理条件来进一步判断该肤色候选区域是否为真正的肤色区域。易言之,该方法可针对该肤色候选区域执行一离散余弦变换以产生一组离散余弦变换系数及其相对应的一组纹理参数。该组纹理参数即可表示该肤色候选区域的纹理能量分布情形。通过纹理参数的比对即可更精确地判断该肤色候选区域是否为真正的肤色区域。
根据本发明的第二具体实施例是一种数字图像分类装置。该数字图像分类装置应用于一图像显示/存储设备。请参照图3,图3示出了该数字图像分类装置的功能方块图。如图3所示,数字图像分类装置10包含一DCT变换模块11、一纹理模块12及一分类模块13。DCT变换模块11用于对一数字图像的一候选区域执行一离散余弦变换以产生一组离散余弦变换系数。纹理模块12电连接至该DCT变换模块,并用于根据该组离散余弦变换系数产生一组纹理参数。分类模块13电连接至该纹理模块,并用于根据该组纹理参数产生该数字图像的一分类结果。
在实际应用中,如图4所示,数字图像分类装置10可进一步包含一分割模块14及一分析模块15。分割模块14用于利用一色彩分割法将该数字图像分割为一目标区域与一非目标区域。分析模块15电连接至分割模块14,并用于利用形态分析及/或八连通分析由该目标区域中选出该候选区域。此外,图5亦显示数字图像分类装置10可进一步包含一色彩空间变换模块16。在分割模块14分割该数字图像之前,色彩空间变换模块16可用以将该数字图像由一第一色彩空间变换至一第二色彩空间。实际上,该第二色彩空间可以是一HSV色彩空间。
请参阅图5,图5示出了数字图像分类装置10进一步包含一对照表17及一命名模块18的功能方块图。对照表17包含对应于该分类结果的一名称。命名模块18电连接至分类模块13及对照表17,并用于根据该分类结果由对照表17中选出该名称,并根据该名称命名该图像。
此外,该数字图像分类装置亦可进一步包含一记录模块(未显示在图中)。该记录模块电连接至分类模块13,并用于将该分类结果记录在该数字图像的一标记或一可交换图像文件图像格式中。藉此,可以加快图像搜寻时找到欲搜寻的图像的速度。
相较于先前技术,根据本发明的方法可由计算机自行执行,因此可改善以人工判断耗时又耗力的缺点。另一方面,根据本发明的方法是根据各张图像本身的纹理特征进行分类,因此其分类结果将远比仅根据文件名称或图像颜色进行分类来得精确。如上所述,该数字图像分类方法及分类装置可以避免传统图像分类技术的缺点,并能有效达到自动分类数字图像甚至自动命名数字图像的功能。
藉由以上较佳具体实施例的详述,是希望能更加清楚描述本发明的特征与精神,而并非以上述所揭露的较佳具体实施例来对本发明的范畴加以限制。相反地,其目的是希望能涵盖各种改变及具相等性的安排在本发明所欲申请的专利范围的范畴内。因此,本发明所申请的专利范围的范畴应该根据上述的说明作最宽广的解释,以致使其涵盖所有可能的改变以及具相等性的安排。
Claims (18)
1.一种数字图像分类方法,包含下列步骤:
针对一数字图像的一候选区域执行一离散余弦变换以产生一组离散余弦变换系数;
根据该组离散余弦变换系数产生一组纹理参数;以及
根据该组纹理参数产生该数字图像的一分类结果。
2.如权利要求1所述的数字图像分类方法,其中,多个预设分类结果是预先提供,每一个预设分类结果各自对应于一组预设纹理参数,并且该分类结果藉由比对该组纹理参数与该多组预设纹理参数产生。
3.如权利要求1所述的数字图像分类方法,其中,该组纹理参数包含下列参数中的至少一个参数:一平滑纹理能量EDC、一垂直纹理/平纹理能量比EV/EH以及一斜向纹理能量ES。
4.如权利要求1所述的数字图像分类方法,其中,该分类结果是一人物类或一风景类。
5.如权利要求1所述的数字图像分类方法,其中,该候选区域是以下列步骤产生:
(a1)根据一目标色彩,利用一色彩分割法将该数字图像分割为一目标区域与一非目标区域;以及
(a2)利用一形态分析及/或一八连通分析由该目标区域中选出该候选区域。
6.如权利要求5所述的数字图像分类方法,其中,在步骤(a1)之前,该数字图像由一第一色彩空间被变换至一第二色彩空间。
7.如权利要求6所述的数字图像分类方法,其中,该第二色彩空间为一HSV色彩空间。
8.如权利要求1所述的数字图像分类方法,进一步包含下列步骤:
将该分类结果记录在该数字图像的一标记或一可交换图像文件图像格式中。
9.如权利要求1所述的数字图像分类方法,进一步包含下列步骤:
自一对照表找出对应于该分类结果的一名称;以及
根据该名称命名该数字图像。
10.一种应用于一图像显示/存储设备的数字图像分类装置,包含:
一DCT变换模块,用以对一数字图像的一候选区域执行一离散余弦变换以产生一组离散余弦变换系数;
一纹理模块,该纹理模块电连接至该DCT变换模块,并用以根据该组离散余弦变换系数产生一组纹理参数;以及
一分类模块,该分类模块电连接至该纹理模块,并用以根据该组纹理参数产生该数字图像的一分类结果。
11.如权利要求10所述的数字图像分类装置,其中,多个预设分类结果是预先提供,每一个预设分类结果各自对应于一组预设纹理参数,该分类模块藉由比对该组纹理参数与该多组预设纹理参数,自该等预设分类结果中选出该分类结果。
12.如权利要求10所述的数字图像分类装置,其中,该组纹理参数包含下列参数中的至少一个参数:一平滑纹理能量EDC、一垂直纹理/水平纹理能量比EV/EH以及一斜向纹理能量ES。
13.如权利要求10所述的数字图像分类装置,其中,该分类结果是一人物类或一风景类。
14.如权利要求10所述的数字图像分类装置,进一步包含:
一分割模块,用以利用一色彩分割法将该数字图像分割为一目标区域与一非目标区域;以及
一分析模块,该分析模块电连接至该分割模块,并用以利用一形态分析及/或一八连通分析由该目标区域中选出该候选区域。
15.如权利要求14所述的数字图像分类装置,进一步包含:
一色彩空间变换模块,在该分割模块分割该数字图像之前,该色彩空间变换模块将该数字图像由一第一色彩空间变换至一第二色彩空间。
16.如权利要求15所述的数字图像分类装置,其中,该第二色彩空间为一HSV色彩空间。
17.如权利要求10所述的数字图像分类装置,进一步包含:
一记录模块,该记录模块电连接至该分类模块,并用以将该分类结果记录在该数字图像的一标记或一可交换图像文件图像格式中。
18.如权利要求10所述的数字图像分类装置,进一步包含:
一对照表,该对照表包含对应于该分类结果的一名称;以及
一命名模块,该命名模块电连接至该分类模块及该对照表,并用以根据该分类结果由该对照表中选出该名称,并根据该名称命名该图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101382821A CN101360174B (zh) | 2007-08-03 | 2007-08-03 | 数字图像的分类方法及分类装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101382821A CN101360174B (zh) | 2007-08-03 | 2007-08-03 | 数字图像的分类方法及分类装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101360174A true CN101360174A (zh) | 2009-02-04 |
CN101360174B CN101360174B (zh) | 2011-05-25 |
Family
ID=40332502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007101382821A Expired - Fee Related CN101360174B (zh) | 2007-08-03 | 2007-08-03 | 数字图像的分类方法及分类装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101360174B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102982337A (zh) * | 2011-06-08 | 2013-03-20 | 索尼公司 | 信息处理设备、方法以及计算程序产品 |
CN103229213A (zh) * | 2010-11-29 | 2013-07-31 | 汤姆逊许可公司 | 重建图像的自相似纹理区域的方法和设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1323370C (zh) * | 2004-05-28 | 2007-06-27 | 中国科学院计算技术研究所 | 一种色情图像检测方法 |
CN100377177C (zh) * | 2004-12-24 | 2008-03-26 | 中国科学院计算技术研究所 | 图像压缩域上的人体肤色区域检测方法 |
US8154612B2 (en) * | 2005-08-18 | 2012-04-10 | Qualcomm Incorporated | Systems, methods, and apparatus for image processing, for color classification, and for skin color detection |
-
2007
- 2007-08-03 CN CN2007101382821A patent/CN101360174B/zh not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103229213A (zh) * | 2010-11-29 | 2013-07-31 | 汤姆逊许可公司 | 重建图像的自相似纹理区域的方法和设备 |
US9367932B2 (en) | 2010-11-29 | 2016-06-14 | Thomson Licensing | Method and device for reconstructing a self-similar textured region of an image |
CN103229213B (zh) * | 2010-11-29 | 2016-08-10 | 汤姆逊许可公司 | 重建图像的自相似纹理区域的方法和设备 |
CN102982337A (zh) * | 2011-06-08 | 2013-03-20 | 索尼公司 | 信息处理设备、方法以及计算程序产品 |
CN102982337B (zh) * | 2011-06-08 | 2018-02-23 | 索尼公司 | 信息处理设备和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101360174B (zh) | 2011-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107870959B (zh) | 响应于视频搜索查询提供相关视频场景 | |
EP2005364B1 (en) | Image classification based on a mixture of elliptical color models | |
Mojsilovic et al. | Capturing image semantics with low-level descriptors | |
US8078623B2 (en) | Systems and methods for summarizing photos based on photo information and user preference | |
US8520909B2 (en) | Automatic and semi-automatic image classification, annotation and tagging through the use of image acquisition parameters and metadata | |
DE202015009255U1 (de) | Automatische Bildorganisation | |
Liping et al. | A match and tiling approach to content-based video retrieval | |
CN1613090A (zh) | 脸部元数据的生成 | |
JP2005235175A (ja) | コンテンツエンジンのためのexifに基づく画像の特徴セット | |
CN101021855A (zh) | 基于内容的视频检索系统 | |
JP2007206920A (ja) | 画像処理装置および方法、検索装置および方法、プログラム、並びに記録媒体 | |
CN101055592A (zh) | 图像信息生成方法及装置 | |
CN109902198A (zh) | 一种以图搜图的方法、装置及应用系统 | |
Brilakis et al. | Content-based search engines for construction image databases | |
US20110137964A1 (en) | File System Manager Using Tagging Organization | |
Chen et al. | Automatic classification of photographs and graphics | |
CN101360174B (zh) | 数字图像的分类方法及分类装置 | |
Tankoyeu et al. | Event detection and scene attraction by very simple contextual cues | |
Müller et al. | A framework for benchmarking in CBIR | |
CN110765305A (zh) | 媒介信息推送系统及其基于视觉特征的图文检索方法 | |
Khokher et al. | Image retrieval: A state of the art approach for CBIR | |
Paredes et al. | A probabilistic model for user relevance feedback on image retrieval | |
Boll et al. | Metaxa—context-and content-driven metadata enhancement for personal photo books | |
Stottinger et al. | Translating journalists' requirements into features for image search | |
Kumari et al. | A Study and usage of Visual Features in Content Based Image Retrieval Systems. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110525 Termination date: 20190803 |