JP5682569B2 - 色彩解析装置、色彩解析方法、及び色彩解析プログラム - Google Patents

色彩解析装置、色彩解析方法、及び色彩解析プログラム Download PDF

Info

Publication number
JP5682569B2
JP5682569B2 JP2011543938A JP2011543938A JP5682569B2 JP 5682569 B2 JP5682569 B2 JP 5682569B2 JP 2011543938 A JP2011543938 A JP 2011543938A JP 2011543938 A JP2011543938 A JP 2011543938A JP 5682569 B2 JP5682569 B2 JP 5682569B2
Authority
JP
Japan
Prior art keywords
color
natural language
description
image
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011543938A
Other languages
English (en)
Other versions
JPWO2011045920A1 (ja
Inventor
細見 格
格 細見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011543938A priority Critical patent/JP5682569B2/ja
Publication of JPWO2011045920A1 publication Critical patent/JPWO2011045920A1/ja
Application granted granted Critical
Publication of JP5682569B2 publication Critical patent/JP5682569B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5862Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using texture

Description

本発明は、自然言語文の色に関する記述に基づいて色彩を解析する色彩解析装置、色彩解析方法、及び色彩解析プログラムに関する。
近年、デジタルの静止画像/動画像を直接撮影できるデジタルスチルカメラやデジタルビデオカメラが広く普及し、大量のデジタル画像をデータとして蓄積できるとともに、それらのデータを容易に参照できるようになってきている。例えば、静止画像共有サービスのFlickr(http://www.flickr.com)や動画像共有サービスのYouTube(http://www.youtube.com)等のWebサイトでは、世界中から静止画像/動画像を自由に登録し、検索し、閲覧できるサービスを提供している。また、殆どの商品販売サイトやオークションサイトでも、物品を確認/比較するために豊富な写真画像を提供している。
また、監視カメラによる撮影映像もデジタルデータとして蓄積されるようになり、映像解析による人や物の探索を計算機を利用して行うことによって、人や物の探索が効率化されてきている。
デジタル画像を検索する場合、探したい対象の物と同一の物又は類似する物のデジタル画像が手元にあれば、計算機を用いて画像データ同士を照合することによって、高速に類似画像を検索することができる(例えば、非特許文献1参照)。しかし、そのような照合サンプルとしてのデジタル画像を容易に入手したり作成したりすることができない場合がある。例えば、実物を見たことが無く他人から聞いた話や文書上の記述内容等を手掛かりに画像を検索しなければならない場合には、言葉により画像の特徴を記述したものを元に画像を検索しなければならない。
自然言語により記述された問合せ文(クエリ)に基づいて画像を検索する関連手法として、予め各画像に付与しておいた自然言語の語句により記述されたメタデータを問合せ文と照合して検索する方法がある。また、問合せ文に含まれる色や形状に関する自然言語表現をそれぞれ画像の特徴量に変換して検索する方法がある。
メタデータを用いる前者の検索方法を用いる場合、基本的には通常のキーワード検索と同じ処理を行う。例えば、非特許文献2には、文書(ブログ)から自動抽出した画像にツールを使ってメタデータを付与し、文書の全文検索と同様に画像を検索できる方法が開示されている。このようにメタデータを問合せ文と照合する方法では、全ての画像に予め必要十分なメタデータを付与しておく必要があり、運用コストやメタデータの網羅性が課題となる。
また、後者の検索方法として、形状に関する自然言語表現を画像の形状特徴量に変換して検索する方法がある。例えば、非特許文献3には、「角張った」や「すっきりした」等の感覚的な言葉と、画像内に含まれる椅子等の物体の各部分の長さや角度等を記号や数値で表した形状特徴量とを対応づけて検索する方法が開示されている。
一方、後者の検索方法として、色に関する自然言語表現を画像の色彩特徴量に変換して検索する方法がある。例えば、特許文献1には、「青い」や「黄色っぽい」といった言葉による色の表現と、RGBやHSI等の色空間上の値の分布として表した色彩特徴量とをそれぞれ対応づけて、衣服や風景写真等を検索する方法が開示されている。このような色彩特徴量による画像検索方法は、予めメタデータが付与されていない画像の検索を行う場合にも適用できる。また、形状特徴量を用いた画像検索が効果的に行えない場合(例えば、Tシャツやハンカチ等同じ形状の商品を専門に検索する場合や、自然の景色のように形状不定な写真画像を検索する場合等)にも有効である。
特開2009−3581号公報
小早川 他、"ウェーブレット変換を用いた対話的類似画像検索と民俗資料データベースへの適用"、情処学会論文誌、Vol.40,No.3,pp.899−911,1999. 原 他、"もぶろげっと:画像情報を含むBlog記事検索システム"、インタラクティブシステムとソフトウェアに関するワークショップ(WISS2005)論文集、pp.69−74,2005. 原田 他、"感性語句を含む自然言語による画像検索のための形状特徴空間の構築"、情処学会論文誌、Vol.40,No.5,pp.2356−2366,1999.
しかし、特許文献1に記載されたような自然言語文により記述された色の表現を色彩特徴量に変換する方法では、1つの検索対象画像又は画像中の1つの対象物について1色の指定しかできない。例えば、問合せ文において「赤と青の柄模様のセーター」や「白地に青のラインが入ったシャツ」等の複数色の組み合わせで表現される場合には、それら複数色を指定した画像検索を行うことができず、対象物画像を精度よく検索することができない。
そこで、本発明は、上記の課題を解決するためになされたものであって、自然言語で表現された色についての記述に基づいて画像検索を行う場合に、複数の色について記述されている場合であっても、所望の画像を精度よく検索できる色彩解析装置、色彩解析方法、及び色彩解析プログラムを提供することを目的とする。
本発明による色彩解析装置は、自然言語で表現された色についての記述である自然言語記述を、所定の色空間上の値の分布を示すデータに置き換える色彩解析装置であって、自然言語記述に含まれる色同士の関係を示す語句を用いて、当該自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる色が占める領域の割合を決定する色比率判定手段を備えたことを特徴とする。
本発明による色彩解析装置の他の態様は、自然言語で表現された色についての記述である自然言語記述を、所定の色空間上の値の分布を示すデータに置き換える色彩解析装置であって、自然言語記述により特定した色と、予め記憶する所定の色とについて、当該自然言語記述が対象とする画像の領域全体に対して、前記それぞれの色が占める領域の割合を決定する色比率判定手段を備えたことを特徴とする。
本発明による色彩解析方法は、情報処理装置が、自然言語で表現された色についての記述である自然言語記述に含まれる色同士の関係を示す語句を用いて、当該自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる色が占める領域の割合を決定することにより、所定の色空間上の値の分布を示すデータを生成することを特徴とする。
本発明による色彩解析方法の他の態様は、情報処理装置が、自然言語で表現された色についての記述である自然言語記述により特定した色と、予め記憶する所定の色とについて、当該自然言語記述が対象とする画像の領域全体に対して、前記それぞれの色が占める領域の割合を決定することにより、所定の色空間上の値の分布を示すデータを生成することを特徴とする。
本発明による色彩解析プログラムは、コンピュータに、自然言語で表現された色についての記述である自然言語記述に含まれる色同士の関係を示す語句を用いて、当該自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる色が占める領域の割合を決定する処理と、所定の色空間上の値の分布を示すデータを生成する処理とを実行させるためのものである。
本発明による色彩解析プログラムの他の態様は、コンピュータに、自然言語で表現された色についての記述である自然言語記述により特定した色と、予め記憶する所定の色とについて、当該自然言語記述が対象とする画像の領域全体に対して、前記それぞれの色が占める領域の割合を決定する処理と、所定の色空間上の値の分布を示すデータを生成する処理とを実行させるためのものである。
本発明によれば、自然言語で表現された色についての記述に基づいて画像検索を行う場合に、複数の色について記述されている場合であっても、所望の画像を精度よく検索することができる。
本発明による色彩解析装置の機能構成の一例を示すブロック図である。 色彩解析装置に入力される入出力デーと、色彩解析装置を用いた画像検索の例を示す説明図である。 辞書の具体例を示す説明図である。 色比率判定手段による処理の例を示す説明図である。 色彩解析装置のハードウェア構成の例を示すブロック図である。 色彩解析装置が自然言語文を入力して検索対象の画像に含まれる色彩を解析する処理の一例を示す流れ図である。 第2の実施形態における色彩解析装置の機能構成例を示すブロック図である。 第2の実施形態における辞書の具体例を示す説明図である。 第2の実施形態における対象構成知識が含むクラスを示す情報及び各クラス間の関係を示す情報の具体例を示す説明図である。 第2の実施形態における色彩値調整手段が検索対象の画像に含まれる各色の色空間上の領域を補正する処理の実行例を示す説明図である。 第2の実施形態における色比率調整手段が色領域の面積比率を調整する処理の例を示す説明図である。 第3の実施形態における色彩解析装置の機能構成例を示すブロック図である。 第3の実施形態における色領域調整手段が各局所領域の色空間上でのサイズを調整する処理の例を示す説明図である。 色彩解析装置の最小の機能構成例を示すブロック図である。
実施形態1.
以下、本発明の第1の実施形態を、図面を参照して説明する。図1は、本発明による色彩解析装置の機能構成の一例を示すブロック図である。図1に示すように、本実施形態では、色彩解析装置は、辞書101と、自然言語文入力手段102と、色記述抽出手段103と、色比率判定手段104と、画像特徴量生成手段105とを含む。そして、色彩解析装置は、それらの手段を用いて、入力した色に関する自然言語の記述に対応した画像特徴量データを生成できる。すなわち、本発明において、色彩解析装置は、自然言語文の色に関する記述を画像の特徴量に変換する。なお、色彩解析装置は、具体的には、プログラムに従って動作するパーソナルコンピュータ等の情報処理装置によって実現される。
また、本発明による色彩解析装置は、例えば、蓄積されたカメラ撮影映像を対象とした画像検索を行う用途に適用できる。そのような用途に適用することによって、人から聞いた被写体の特徴(聞き込み情報等)から画像検索を行うことが可能になる。また、本発明による色彩解析装置は、特に、希望する服や靴等の商品/備品を検索する用途や、自然言語文から生成した色分布と本来検索したい対象物の色分布とを比較し、人の記憶色と実際の色との差異の分析や、照明による影響の分析/照明の調整等を行う用途に応用できる。
辞書101は、色を表す自然言語の単語(以下、色記述ともいう)や、色と色との関係を表す自然言語の単語(以下、関係語ともいう)を含む辞書である。なお、辞書101は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置に記憶される。
自然言語文入力手段102は、具体的には、プログラムに従って動作する情報処理装置のCPU、及びキーボードやマウス等の入力デバイスによって実現される。自然言語文入力手段102は、ユーザの操作に従って、検索対象の画像について自然言語で記述した問合せ文を入力する機能を備える。なお、自然言語文入力手段102は、特に、検索対象の画像の色彩に関する特徴を記述した問合せ文を入力するものとする。
なお、自然言語文入力手段102は、例えば、検索対象の画像について記述した問合せ文を含むファイルを入力又は受信するものであってもよい。
色記述抽出手段103は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。色記述抽出手段103は、辞書101を用いて、自然言語文入力手段102が入力した問合せ文から、色を表す単語(色記述)を抽出する機能を備える。また、色記述抽出手段103は、辞書101を用いて、自然言語文入力手段102が入力した問合せ文から関係語を抽出する機能を備える。
色比率判定手段104は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。色比率判定手段104は、色記述抽出手段103が抽出した色記述及び関係語に基づいて、問合せ文に含まれる複数の色の間の比率を判定する機能を備える。本実施形態では、色比率判定手段104は、色記述抽出手段103が抽出した色記述に対応する色空間を示す値や関係語に対応する分割比を、辞書101から抽出する。そして、色比率判定手段104は、抽出した色空間を示す値や分割比に基づいて、検索対象の画像内の色領域と色の比率(問合せ文に含まれる色が示す領域の割合)とを求める。
画像特徴量生成手段105は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。画像特徴量生成手段105は、色比率判定手段104が判定した色の比率に基づいて、検索対象の画像の色彩に関する特徴を示す画像特徴量(所定の色空間上の値の分布を示すデータ)を生成する機能を備える。本実施形態では、画像特徴量生成手段105は、色比率判定手段104が求めた色領域と色の比率とを対応付けて含む画像特徴量を生成する。
図2は、色彩解析装置に入力される入出力データと、色彩解析装置を用いた画像検索の例を示す説明図である。図2に示すように、本実施形態では、自然言語文入力手段102は、例えば、ユーザの操作に従って、「青地に黄色のラインが入ったシャツを・・・」等の問合せ文を入力する。図2に示す例のように、本実施形態では、色彩解析装置は、「青地に黄色のライン」といった複数色を用いて記述された検索対象の画像についても、自然言語で記述された文(以下、自然言語文という)から、色空間上の特定範囲を占める1つ以上の局所領域と、各局所領域内の色が検索対象画像の全領域に占める面積の割合(色比率)とを含む画像特徴量データを生成することができる。そして、色彩解析装置が生成した画像特徴量を用いて画像の照合を行うことにより、検索対象の画像検索等を行うことができる。
図3は、辞書101の具体例を示す説明図である。色記述抽出手段103による自然言語文からの色に関する記述(色記述)の抽出、及び色比率判定手段104による自然言語文に記載された各色の色空間上の領域それぞれが占める色比率の決定処理は、図3に示すような内容構成で用意された辞書101を参照することにより実行できる。
例えば、自然言語文入力手段102が入力した自然言語文が「青地に黄色のライン」であった場合、色記述抽出手段103は、図3に例示した辞書101を参照することにより、色名である「青」と「黄」とを抽出できる。また、色記述抽出手段103は、色名の間にある関係を表す関係語「に」を抽出できる。ただし、色記述抽出手段103は、関係を表す語(関係語)として、問合せ文に含まれる2つの色名の間に位置する文字列のみから合致する単語を抽出する。本例では、色記述抽出手段103は、問合せ文から抽出される順に、色記述や関係語を[色名:青]、[関係:に]及び[色名:黄]のように抽出する。
次に、色比率判定手段104が、抽出された一連の語から各色の色空間上での領域及び各領域の色比率を求める処理を説明する。図4は、色比率判定手段104による処理の例を示す説明図である。図4(a)に示すように、入力した自然言語文が「青地に黄色」であれば、色記述抽出手段103は、上記と同様の処理に従って、[色名:青]、[関係:に]及び[色名:黄]を抽出する。ここで、色比率判定手段104は、再び図3に示す辞書101を参照すると、[色名:青]の色空間上の値(図3に示す辞書101ではHSV空間)に色領域幅Wを加えた領域(240,1.0,0.5,0.15)を求めることができる。また、色比率判定手段104は、同様の処理に従って、[色名:黄]の領域(60,1.0,0.5,0.08)を求めることができる。
次いで、色比率判定手段104は、これら求めた2色の色空間上の領域それぞれについて、両色を結びつける関係語[関係:に]が示す色領域の面積分割比を適用して、色間の比率を求める。本例では、[関係:に]に対する分割比として、図3に示す辞書101により0.8:0.2と指定されている。そのため、色比率判定手段104は、[色名:青]の領域が対象画像上に占める面積比率が0.8(80%)であり、[色名:黄]の領域が対象画像上に占める面積比率が0.2(20%)であると判定できる。
また、他の例として、入力した自然言語文に「白地に青と赤」という色の記述があった場合を説明する。この場合も、図4(a)と同様の処理に従って、色比率判定手段104は、図4(b)に示すように、白、青、赤の各色について、それぞれ0.8,0.1,0.1の割合で面積比率を割り当てることができ、ある1つの対象画像を構成する色の色比率を決定することができる。ただし図4(b)に示す例では、色比率判定手段104は、色名同士の結合について、[関係:に]よりも[関係:と]を優先して比率を求めることとしている。
なお、色比率判定手段104は、図3に例示した辞書101に含まれるデフォルト色の値をさらに用いて色領域の面積比率を決定してもよい。例えば、自然言語文から抽出した色に関する記述に含まれる色名の数が0個であったり、色に関する記述が1つしか含まれていなかった場合に限り、色比率判定手段104は、デフォルト色を適用して、色の比率を判定してもよい。また、色比率判定手段104は、例えば、問合せ文に2つ以上の色名が含まれている場合であっても、それら2つ以上の色同士を結び付ける関係語が[関係:と]のように等分割を表す場合には、デフォルト色も等分割対象色の1つに加えて、色の比率を判定してもよい。
図3に示す辞書101の例では、デフォルト色を白としているため、例えば、自然言語文から抽出した色が[色名:赤]のみであった場合には、色比率判定手段104は、デフォルト色を等分割の1色として適用して、色の比率を判定してもよい。この場合、色比率判定手段104は、問合せ文に含まれる色記述や関係語が[色名:白]、[関係:と]及び[色名:赤]に相当すると判断して、式(1)のように、色の比率を判定する。
[HSVW:180,0,1.0,0.1]×[0.5]
[HSVW:0,1.0,0.5,0.1]×[0.5] ・・・ 式(1)
なお、辞書101に含まれる各色に対する色空間を示す値(本例では、HSVを用いた値)や、各関係語に対する分割比の値は、例えば、色彩解析装置を管理するシステム管理者等によって予め入力され登録されているものとする。なお、各関係語に対する分割比の値は、例えば、過去の画像検索の際の履歴を集計して統計値として求めることができる。例えば、本実施形態では、過去の画像検索の履歴を集計した結果、関係語「と」が用いられている場合には、色間の比率が約50パーセントであった旨の統計値が得られ、関係語「に」が用いられている場合には、色間の比率が80:20であった旨の統計値が得られていたものとする。そして、それらの統計値に基づいて、予め辞書101が設定されているものとする。
また、本実施形態では、各色の色空間としてHSV空間を用いる場合を示しているが、色空間を表すものであれば、本実施形態で示したものに限らず、例えば、RGB空間やHLS空間を用いてもよい。
以上の処理に従って、辞書101に記載された対象名によって識別される1画像中の各対象の色について、それぞれ図4のように色の領域と比率とが決定できる。そのため、図1に示した画像特徴量生成手段105は、色比率判定手段104が求めた1つ以上の色領域と色比率との組を画像特徴量として出力できる。
以上のような構成を備えるとともに処理を実行することにより、色彩解析装置は、入力した自然言語文(問合せ文)から、画像を構成する1色又は2色以上の色についての色空間上の領域と占有面積の比率とを含む画像特徴量を生成できる。そのため、図2に示す例のように、2色以上で構成される画像を自然言語文に基づいて検索することが可能となる。
次に、色彩解析装置のハードウェア構成について説明する。図5は、色彩解析装置のハードウェア構成の例を示すブロック図である。図5に示すように、色彩解析装置12は、一般的なコンピュータ装置と同様のハードウェア構成によって実現することができ、CPU(Central Processing Unit)121、主記憶部122、出力部123、入力部124、通信部125、及び補助記憶部126を含む。
主記憶部122は、RAM(Random Access Memory)等のメインメモリであって、データの作業領域やデータの一時退避領域に用いられる。出力部123は、液晶ディスプレイ装置等の表示装置、又はプリンタ等の印刷装置であり、データを出力する機能を備える。入力部124は、キーボードやマウス等の入力デバイスであり、データを入力する機能を備える。また、ファイル読み込みによってデータ入力を行う場合には、入力部124は、外部記録媒体読取装置等であってもよい。通信部125は、周辺機器と接続され、データの送受信を行う機能を備える。補助記憶部126は、ROM(Read Only Memory)やハードディスク装置等である。
また、図5に示すように、以上の各構成要素121〜126は、システムバス127を介して、相互に接続されている。
図5に示す例において、色彩解析装置12の補助記憶部126は、自然言語文として入力された問合せ文に基づいて、検索対象の画像に含まれる色彩を解析するための各種プログラムを記憶している。例えば、補助記憶部126は、コンピュータに、自然言語で表現された色についての記述である自然言語記述に含まれる色同士の関係を示す語句を用いて、当該自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる色が占める領域の割合を決定する処理と、所定の色空間上の値の分布を示すデータを生成する処理とを実行させるための色彩解析プログラムを記憶している。
なお、色彩解析装置12は、色彩解析装置12内部に、図1に示すような機能を実現するプログラムを組み込んだLSI(Large Scale Integration)等のハードウェア部品からなる回路部品を実装して、ハードウェア的に実現してもよい。また、図5に示すように、上記した図1に示すような各構成要素の各機能を提供するプログラムを、コンピュータのCPU121に実行させることにより、ソフトウェア的に実現してもよい。すなわち、CPU121は、補助記憶部126に格納されているプログラムを、主記憶部122にロードして実行し、色彩解析装置12の動作を制御することにより、上述した各機能をソフトウェア的に実現することができる。
次に、動作について説明する。図6は、色彩解析装置が自然言語文を入力して検索対象の画像に含まれる色彩を解析する処理の一例を示す流れ図である。まず、ユーザは、画像検索を行いたい場合、色彩解析装置を操作して、検索したい画像の特徴(特に、色彩)を自然言語を用いて記述した問合せ文(自然言語文)の入力指示を行う。すると、色彩解析装置の自然言語文入力手段102は、ユーザの操作に従って、自然言語文を入力する(ステップS10)。
次いで、色彩解析装置の色記述抽出手段103は、辞書101に基づいて、自然言語文入力手段102が入力した自然言語文から、検索対象の画像についての色記述及び関係語を抽出する(ステップS11)。次いで、色彩解析装置の色比率判定手段104は、色記述抽出手段103が抽出した色記述及び関係語に基づいて、問合せ文に含まれる複数の色の間の比率を判定する(ステップS12)。本実施形態では、色比率判定手段104は、抽出した色記述に対応する色空間を示す値や関係語に対応する分割比を、辞書101から抽出する。そして、色比率判定手段104は、抽出した色空間を示す値や分割比に基づいて、検索対象の画像内の色領域と色の比率とを求める。
次いで、色彩解析装置の画像特徴量生成手段105は、色比率判定手段104が判定した色の比率に基づいて、検索対象の画像の色彩に関する特徴を示す画像特徴量を生成する(ステップS13)。本実施形態では、画像特徴量生成手段105は、色比率判定手段104が求めた色領域と色の比率とを対応付けて含む画像特徴量を生成する。
その後、色彩解析装置が生成した画像特徴量が、画像検索を行う画像検索装置(図示せず)に入力される。そして、画像検索装置は、色彩解析装置が生成した画像特徴量に基づいて、画像検索を行い、検索対象の画像に合致する画像を検索して抽出する。なお、画像検索装置と色彩解析装置とは、同じ1つの情報処理装置を用いて実現されてもよいし、別々の情報処理装置を用いて実現されてもよい。
以上に説明したように、本実施形態によれば、色彩解析装置は、キーボード又はファイルの読み込みによって入力し、又はネットワークを介して通信部を用いて受信した自然言語文から、画像特徴量を表すデータを生成する。そして、ネットワークで接続された画像検索装置(図示せず)、又は色彩解析装置12と同じハードウェア内部で実行される画像検索プログラムを用いて、1色又は2色以上の色で構成された画像の検索を実現できる。
具体的には、色彩解析装置は、入力した自然言語文に含まれる複数の色記述を抽出するとともに関係語を抽出する。そして、色彩解析装置は、抽出した色記述及び関係語に基づいて、複数の色について色領域及び色の比率を求める。そして、色彩解析装置は、求めた色領域及び色の比率とを対応付けて含む画像特徴量を生成する。そのため、自然言語で表現された色についての記述に基づいて画像検索を行う場合に、複数の色について記述されている場合であっても、画像上の色彩特徴量に変換することができる。従って、自然言語で表現された色についての記述に基づいて画像検索を行う場合に、複数の色について記述されている場合であっても、所望の画像を精度よく検索することができる。言い換えれば、検索対象の画像が複数の色で構成されている場合であっても、平易な自然言語による表現に基づいて、所望の画像を精度よく検索することができる。
実施形態2.
次に、本発明の第2の実施形態について、図面を参照して説明する。図7は、第2の実施形態における色彩解析装置の機能構成例を示すブロック図である。図7に示すように、本実施形態では、色彩解析装置は、図1に示した構成要素に加えて、対象構成知識107、対象記述抽出手段108、色彩値調整手段109、及び色比率調整手段110を含む点で、第1の実施形態と異なる。また、本実施形態では、辞書106が含む情報が、第1の実施形態で示した辞書101が含む情報と異なる。
なお、本実施形態において、自然言語文入力手段102、色記述抽出手段103、色比率判定手段104、及び画像特徴量生成手段105の機能は、それぞれ第1の実施形態で示したそれらの機能と同様であるため、説明を省略する。
図8は、第2の実施形態における辞書106の具体例を示す説明図である。図8に示すように、本実施形態では、辞書106は、図3に示した辞書101に比べて、対象名辞書、前置修飾語辞書及び後置修飾語辞書をさらに含む点で、第1の実施形態と異なる。
対象名辞書には、検索対象の画像の特徴となりうる単語のうち、色彩以外の対象名(例えば、衣服等の対象物)が含まれる。例えば、図8に示すように、対象名辞書に含まれる「服名:ジャージ,衣服,青」という記述により、「服名:ジャージ」という単語で示される対象が「衣服」というクラスのインスタンス(例)であることがわかる。また、図8に示す例では、「青」は「服名:ジャージ」に対するデフォルト色であり、画像上でジャージと識別された領域において、第1の実施形態で示した辞書101におけるデフォルト色と同様に利用することができる。
なお、本実施形態では、検索対象の画像に含まれうる対象として、ジャージやジャケット等の衣服を例に説明しているが、本実施形態で示したものに限らず、例えば、カバンやカメラ等の持ち物を対象として解析を行ってもよい。
また、図8に示すように、前置修飾語辞書には、検索対象の画像の特徴となりうる単語のうち、「明るい」や「薄い」等の前置修飾語が含まれる。また、後置修飾語辞書には、検索対象の画像の特徴となりうる単語のうち、「〜っぽい」や「〜系」等の後置修飾語が含まれる。
対象構成知識107は、検索対象の画像に含まれうる対象が属するカテゴリであるクラスを示す情報と、各クラス間の関係を示す情報とを含む。図9は、第2の実施形態における対象構成知識107が含むクラスを示す情報及び各クラス間の関係を示す情報の具体例を示す説明図である。なお、対象構成知識107は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置に記憶される。
図9に示す例おいて、「衣服」や「上衣上着」、「上半身」等がクラスを表しており、クラス間を結ぶ矢印線に付与された「分類」や「上書」、「優先」等がそれぞれ特定の関係(クラス間の関係)を表している。また、クラス間の関係のうち「上書」と「優先」とについては、図9に示すように、それらのクラス間の関係を表す矢印の根元に位置するクラスが、矢印の先に位置するクラスに対して画像上の共有領域の何割を占めるかも記載されている。
また、図9に例示した対象構成知識107では、例えば、共に同じ「上半身」に分類されることで同じ領域を共有する「上衣上着」と「上衣」とについて、「上衣上着」が「上衣」に「優先」するように設定されている。これにより、「上衣上着」と「上衣」とのそれぞれに相当する対象が自然言語文に同時に記載されていた場合には、図9に示す指定により、「上衣上着」に相当する対象の色が共有領域の0.7(70%)を占め、「上衣」に相当する対象の色は同じ共有領域の残り0.3(30%)を占めると判定することができる。一方、「上書」するように設定されている場合には、共有領域において矢印の根元に位置するクラスに相当する対象の色が1.0(100%)、すなわち領域全体を占めると判定することができる。
なお、辞書106に含まれる対象名辞書や、前置修飾語辞書、後置修飾語辞書は、例えば、色彩解析装置を管理するシステム管理者等によって予め入力され登録されているものとする。また、対象構成知識107も、例えば、色彩解析装置を管理するシステム管理者等によって予め入力され登録されているものとする。
図7において、対象記述抽出手段108は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。対象記述抽出手段108は、辞書106を参照することにより、自然言語文入力手段102が入力した自然言語文から、辞書106に含まれる対象名辞書に記載されている対象名を抽出する機能を備える。また、対象記述抽出手段108は、対象名辞書から、抽出した対象名が属するクラスを抽出する機能を備える。また、対象記述抽出手段108は、対象名が属するクラスと、色記述抽出手段103が抽出した対象名に関する色記述(色記述抽出手段103が抽出した色記述のうち、対象記述抽出手段108が抽出した対象名に関連するもの)との対応関係を判定する機能を備える。すなわち、対象記述抽出手段108は、辞書106を用いて、自然言語文から対象の名称を抽出し、当該対象の種類を判別する。
なお、図7に示す例では、色記述抽出手段103の後にプロセスを実行する手段として対象記述抽出手段108を配置しているが、これら色記述抽出手段103と対象記述抽出手段108との前後関係は、図7に示した例に限定されない。例えば、対象記述抽出手段108を色記述抽出手段103の前段に配置してもよい。この場合、まず、対象記述抽出手段108が、自然言語文入力手段102が入力した自然言語文から対象名を抽出する処理を実行してから、色記述抽出手段103が、自然言語文から色記述を抽出する処理を実行することになる。また、色記述抽出手段103及び対象記述抽出手段108による処理を同時に、並行して実行してもよい。
図7において、色彩値調整手段109は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。色彩値調整手段109は、辞書106を参照することにより、自然言語文入力手段102が入力した自然言語文から、色名と色に関する修飾語とを抽出する機能を備える。具体的には、色彩値調整手段109は、前置修飾語辞書に含まれる前置修飾語や、後置修飾語辞書に含まれる後置修飾語を抽出する。また、色彩値調整手段109は、抽出した修飾語や後置修飾語に基づいて、各色の色空間上の領域を補正する機能を備える。すなわち、色彩値調整手段109は、辞書106に含まれる色の修飾語句を用いて、所定の色空間上で自然言語文において自然言語によって表現された色が占める領域の位置又はサイズを調整する。
図10は、第2の実施形態における色彩値調整手段109が検索対象の画像に含まれる各色の色空間上の領域を補正する処理の例を示す説明図である。例えば、図10に示すように、入力した自然言語文に「赤っぽい」という記述がある場合、色彩値調整手段109は、この「赤っぽい」という記述から、[色名:赤]と[後置修飾語:っぽい]との連続した組を抽出する。次いで、色彩値調整手段109は、「赤」に対する色空間上の領域を示す値(0,1.0,0.5,0.1)を、「っぽい」がもつ補正値(0,−0.1,0,0.2)で補正する(本例では、加算する)ことにより、補正後の領域を示す値(0,0.9,0.5,0.3)を求める。そして、色彩値調整手段109は、この補正後の値を「赤っぽい」を示す領域の値とする。
なお、本実施形態では、色比率判定手段104は、色彩値調整手段109が求めた補正値を用いて、検索対象の画像内の色領域と色の比率とを求める。
図7において、色比率調整手段110は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。色比率調整手段110は、辞書106及び対象構成知識107を参照することにより、色比率判定手段104が求めた各色の領域が1つの対象全体に占める面積比率を調整する機能を備える。具体的には、色比率調整手段110は、対象領域が複数の部分対象物の組み合わせによって構成されている場合、それぞれの部分対象物表面を占める色の面積比率を、部分対象物同士の構成比に応じて変更する。すなわち、色比率調整手段110は、対象構成知識107に含まれる対象の種類間の関係を用いて、各対象に相当する画像上の特定領域を占める各色の面積比率を決定する。
図11は、第2の実施形態における色比率調整手段110が色領域の面積比率を調整する処理の例を示す説明図である。図11に示す例では、辞書106には、少なくとも服名として「上衣上着」クラスに属する「ジャケット」と、「上衣」クラスに属する「セーター」とが記載されているものとする。また、対象構成知識107(図11では、単に知識と記載している)には、少なくとも「上衣上着」クラスが「上半身」クラスに「分類」されるという関係を示す情報と、「上衣」クラスが「上半身」クラスに「分類」されるという関係を示す情報と、「上衣上着」クラスが「上衣」クラスに「優先」するという関係を示す情報と、「優先」される側のクラスのインスタンスがもつ色は面積比率が全体の0.7(70%)を占めるということ(優先:0.7)を示す情報とが記載されているものとする。
図11に示す例において、入力した自然言語文が「ベージュのジャケットに赤のセーター」であった場合(step0)、色比率調整手段110は、辞書106の内容に基づいて、ジャケットを占める色についてベージュが100%(色比率1.0)であり、セーターを占める色について赤が100%(色比率1.0)であると判断する(step1)。
次に、色比率調整手段110は、辞書106の内容に基づいて、ジャケットが上衣上着の一種(「上衣上着」クラスのインスタンス)であり、セーターが上衣の一種(「上衣」クラスのインスタンス)であると判断する(step2)。
さらに、色比率調整手段110は、対象構成知識107の内容に基づいて、「上衣上着」クラスと「上衣」クラスとがともに「上半身」クラスに分類されると判断することができる。また、色比率調整手段110は、「上衣上着」クラスが「上衣」クラスと比較して重なり時(上衣上着と上衣とが重複したとき)に「優先」されると判断することができる。また、色比率調整手段110は、「優先」された方の色が「上半身」クラスのインスタンス全体において面積比率「0.7」(70%)を占めると判断することができる。そのため、色比率調整手段110は、ジャケットの色である「ベージュ」が「上半身」全体に占める色比率が1.0×0.7であり、セーターの色である「赤」が「上半身」全体に占める色比率が1.0×(1.0−0.7)であると求めることができる(step3)。そして、色比率調整手段110は、その求めた結果として、色の構成比がベージュ0.7であり、赤0.3であると求めることができる(step4)。
なお、本実施形態では、画像特徴量生成手段105は、色比率調整手段110による面積比率調整後の各色領域に基づいて、画像特徴量を生成する。
なお、本実施形態で示した色彩解析装置は、図5に示した第1の実施形態における色彩解析装置と同様のハードウェア構成により実現可能である。
以上に説明したように、本実施形態によれば、色彩解析装置は、入力した自然言語文から対象名やクラスを抽出し、検索対象の画像に含まれる各色の色空間上の領域を補正する。そして、色彩解析装置は、検索対象の画像に含まれる各色領域の面積比率を調整し、面積比率調整後の各色領域に基づいて、画像特徴量を生成する。そのため、本実施形態によれば、自然言語文から、色の異なる複数の対象物が重なりあっているような場合であっても、画像の色空間における画像特徴量を生成することができる。従って、色の異なる複数の対象物が重なりあっているような画像であっても、自然言語文を用いて検索することが可能になる。
実施形態3.
次に、本発明の第3の実施形態について、図面を参照して説明する。図12は、第3の実施形態における色彩解析装置の機能構成例を示すブロック図である。図12に示すように、本実施形態では、色彩解析装置は、図1に示した構成要素に加えて、色領域調整手段111を含む点で、第1の実施形態と異なる。
なお、本実施形態において、辞書101が含む情報は、第1の実施形態と同様であるため、説明を省略する。また、本実施形態において、自然言語文入力手段102、色記述抽出手段103、色比率判定手段104、及び画像特徴量生成手段105の機能は、それぞれ第1の実施形態で示したそれらの機能と同様であるため、説明を省略する。
図12に示すように、本実施形態では、色彩解析装置は、第1の実施形態で示した構成要素に加えて、色領域調整手段111を新たに備える。色領域調整手段111は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。色領域調整手段111は、色記述抽出手段103が自然言語文から複数の色名を抽出した場合に、抽出した各色名が示す色空間上の局所領域同士の距離に応じて、各局所領域の色空間上でのサイズを調整する機能を備える。すなわち、色領域調整手段111は、自然言語文が対象とする画像の領域全体に対して、自然言語文に含まれる各色が占める領域間の所定の色空間上での距離に応じて、当該自然言語文に含まれる各色が占める領域の大きさ調整する。
図13は、第3の実施形態における色領域調整手段111が各局所領域の色空間上でのサイズを調整する処理の例を示す説明図である。例えば、図13(a)に示すように、色領域調整手段111は、色空間上の局所領域1と局所領域2とのそれぞれの境界色の間の距離がある特定の値となる位置関係となった場合には、局所領域1と局所領域2とについて、ともに色空間上でのそれぞれの中心色から境界色までの距離を変更する処理を特に行わない。一方、図13(b)に示すように、色領域調整手段111は、局所領域1と局所領域2とが特定の距離よりも遠い位置にある場合には、両局所領域における中心色から境界色までの距離を、両局所領域の境界色同士の距離の最小値が特定の値となるまで拡大する処理を行う。また、逆に、図13(c)に示すように、色領域調整手段111は、局所領域1と局所領域2とが特定の距離よりも近い位置にある場合には、両局所領域における中心色から境界色までの距離を、両局所領域の局所領域の距離の最小値が特定の値となるまで、又は両局所領域の重複がなくなるまで縮小する処理を行う。
なお、図13(b),(c)に示す場合において、両局所領域における中心色から境界色までの距離を拡大又は縮小する割合について制限値を設けてもよい。また、局所領域の境界色間の距離を拡大又は縮小するのではなく、中心色間の距離を測り、図13(d)に示すように、色領域調整手段111は、局所領域1と局所領域2とのそれぞれが向き合う側の領域を縮小して重なりを回避する処理を行い、ともに反対側の領域を拡大して色空間上に占める範囲を維持又は増加させてもよい。
なお、本実施形態では、画像特徴量生成手段105は、色領域調整手段111によるサイズ調整後の各色領域に基づいて、画像特徴量を生成する。
なお、本実施形態で示した色彩解析装置は、図5に示した第1の実施形態における色彩解析装置と同様のハードウェア構成により実現可能である。
以上に説明したように、本実施形態によれば、色彩解析装置は、自然言語文から複数の色名を抽出した場合に、各局所領域の色空間上でのサイズを調整する。そして、色彩解析装置は、サイズ調整後の各色領域に基づいて、画像特徴量を生成する。そのため、自然言語で指定された複数の色それぞれが対応する色空間上の局所領域の相対距離に応じて各局所領域のサイズを調整することにより、生成した画像特徴量に適合する画像の対象範囲を広く保ちつつ、自然言語で指定された各色の独立性も保持することができる。従って、自然言語文を入力とし、網羅性が高く且つ自然言語文で入力した要件をよく反映した画像の検索を可能とすることができる。
以上、第1の実施形態〜第3の実施形態において、本発明の好ましい実施形態を参照して説明したが、本発明による色彩解析装置は、上記各実施形態に限定されるものではない。すなわち、本発明による色彩解析装置の構成や機能は、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
次に、本発明による色彩解析装置の最小構成について説明する。図14は、色彩解析装置の最小の機能構成例を示すブロック図である。図14に示すように、色彩解析装置は、最小の構成要素として、色比率判定手段104を含む。図14に示す最小構成の色彩解析装置は、自然言語で表現された色についての記述である自然言語記述を、所定の色空間上の値の分布を示すデータに置き換える処理を行う。また、色比率判定手段104は、自然言語記述に含まれる色同士の関係を示す語句を用いて、当該自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる色が占める領域の割合を決定する機能を備える。
図14に示す最小構成の色彩解析装置によれば、自然言語で表現された色についての記述に基づいて画像検索を行う場合に、複数の色について記述されている場合であっても、所望の画像を精度よく検索することができる。
なお、上記に示した各実施形態では、以下の(1)〜(16)に示すような色彩解析装置の特徴的構成が示されている。
(1)色彩解析装置は、自然言語で表現された色についての記述である自然言語記述(例えば、自然言語文)を、所定の色空間上の値の分布を示すデータ(例えば、画像特徴量)に置き換える色彩解析装置であって、自然言語記述に含まれる色同士の関係を示す語句(例えば、関係語)を用いて、当該自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる色が占める領域の割合(例えば、色の比率)を決定する色比率判定手段(例えば、色比率判定手段104によって実現される)を備えたことを特徴とする。
(2)色彩解析装置は、色比率判定手段の決定結果に基づいて、所定の色空間上の値の分布を示すデータを生成するデータ生成手段(例えば、画像特徴量生成手段105によって実現される)を備え、データ生成手段は、色空間上の値の分布を示すデータとして、所定の色空間上で自然言語記述において自然言語によって表現された色が占める領域(例えば、色領域)と、自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる色が占める面積比率(例えば、色の比率)とを含むデータを生成するように構成されていてもよい。
(3)色彩解析装置は、自然言語の文から色についての記述を特定するための色名、及び色同士の関係を示す語句に関する情報を少なくとも含む辞書(例えば、辞書101)を記憶する辞書記憶手段(例えば、辞書101を記憶する記憶装置)を備えるように構成されていてもよい。
(4)色彩解析装置において、辞書記憶手段は、色同士の関係を示す語句として少なくとも並立助詞(例えば、「と」や「に」等の助詞)を含む辞書を記憶するように構成されていてもよい。
(5)色彩解析装置において、辞書記憶手段は、色の修飾語句に関する情報(例えば、前置修飾語、後置修飾語)をさらに含む辞書を記憶し、辞書に含まれる色の修飾語句を用いて、所定の色空間上で自然言語記述において自然言語によって表現された色が占める領域の位置又はサイズを調整する色彩値調整手段(例えば、色彩値調整手段109によって実現される)をさらに備えるように構成されていてもよい。
(6)色彩解析装置は、自然言語で表現された色についての記述である自然言語記述を、所定の色空間上の値の分布を示すデータに置き換える色彩解析装置であって、自然言語記述により特定した色と、予め記憶する所定の色(例えば、図3に示すデフォルト色)とについて、当該自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれるそれぞれの色が占める領域の割合を決定する色比率判定手段(例えば、色比率判定手段104によって実現される)を備えるように構成されていてもよい。
(7)色彩解析装置において、辞書記憶手段は、画像の一部として識別する対象の名称と当該対象の種類に関する情報(例えば、図8に示す対象名辞書に含まれる情報)とをさらに含む辞書を記憶し、異なる対象の種類間の関係に関する情報を少なくとも含む対象構成知識(例えば、対象構成知識107)を記憶する知識記憶手段(例えば、対象構成知識107を記憶する記憶装置)と、辞書記憶手段が記憶する辞書を用いて、自然言語記述から対象の名称を抽出し、当該対象の種類を判別する対象記述抽出手段(例えば、対象記述抽出手段108によって実現される)と、対象構成知識に含まれる対象の種類間の関係を用いて、各対象に相当する画像上の特定領域を占める各色の面積比率を決定する色比率調整手段(例えば、色比率調整手段110によって実現される)とをさらに備えるように構成されていてもよい。
(8)色彩解析装置は、自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる各色が占める領域間の所定の色空間上での距離に応じて、当該自然言語記述に含まれる各色が占める領域の大きさを調整する色領域調整手段(例えば、色領域調整手段111によって実現される)をさらに備えるように構成されていてもよい。
(9)色彩解析装置は、自然言語で表現された色についての記述である自然言語記述(例えば、自然言語文)を、所定の色空間上の値の分布を示すデータ(例えば、画像特徴量)に置き換える色彩解析装置であって、自然言語記述に含まれる色同士の関係を示す語句(例えば、関係語)を用いて、当該自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる色が占める領域の割合(例えば、色の比率)を決定する色比率判定部(例えば、色比率判定手段104によって実現される)を備えたことを特徴とする。
(10)色彩解析装置は、色比率判定部の決定結果に基づいて、所定の色空間上の値の分布を示すデータを生成するデータ生成部(例えば、画像特徴量生成手段105によって実現される)を備え、データ生成部は、色空間上の値の分布を示すデータとして、所定の色空間上で自然言語記述において自然言語によって表現された色が占める領域(例えば、色領域)と、自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる色が占める面積比率(例えば、色の比率)とを含むデータを生成するように構成されていてもよい。
(11)色彩解析装置は、自然言語の文から色についての記述を特定するための色名、及び色同士の関係を示す語句に関する情報を少なくとも含む辞書(例えば、辞書101)を記憶する辞書記憶部(例えば、辞書101を記憶する記憶装置)を備えるように構成されていてもよい。
(12)色彩解析装置において、辞書記憶部は、色同士の関係を示す語句として少なくとも並立助詞(例えば、「と」や「に」等の助詞)を含む辞書を記憶するように構成されていてもよい。
(13)色彩解析装置において、辞書記憶部は、色の修飾語句に関する情報(例えば、前置修飾語、後置修飾語)をさらに含む辞書を記憶し、辞書に含まれる色の修飾語句を用いて、所定の色空間上で自然言語記述において自然言語によって表現された色が占める領域の位置又はサイズを調整する色彩値調整部(例えば、色彩値調整手段109によって実現される)をさらに備えるように構成されていてもよい。
(14)色彩解析装置は、自然言語で表現された色についての記述である自然言語記述を、所定の色空間上の値の分布を示すデータに置き換える色彩解析装置であって、自然言語記述により特定した色と、予め記憶する所定の色(例えば、図3に示すデフォルト色)とについて、当該自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれるそれぞれの色が占める領域の割合を決定する色比率判定部(例えば、色比率判定手段104によって実現される)を備えるように構成されていてもよい。
(15)色彩解析装置において、辞書記憶部は、画像の一部として識別する対象の名称と当該対象の種類に関する情報(例えば、図8に示す対象名辞書に含まれる情報)とをさらに含む辞書を記憶し、異なる対象の種類間の関係に関する情報を少なくとも含む対象構成知識(例えば、対象構成知識107)を記憶する知識記憶部(例えば、対象構成知識107を記憶する記憶装置)と、辞書記憶部が記憶する辞書を用いて、自然言語記述から対象の名称を抽出し、当該対象の種類を判別する対象記述抽出部(例えば、対象記述抽出手段108によって実現される)と、対象構成知識に含まれる対象の種類間の関係を用いて、各対象に相当する画像上の特定領域を占める各色の面積比率を決定する色比率調整部(例えば、色比率調整手段110によって実現される)とをさらに備えるように構成されていてもよい。
(16)色彩解析装置は、自然言語記述が対象とする画像の領域全体に対して、自然言語記述に含まれる各色が占める領域間の所定の色空間上での距離に応じて、当該自然言語記述に含まれる各色が占める領域の大きさを調整する色領域調整部(例えば、色領域調整手段111によって実現される)をさらに備えるように構成されていてもよい。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記各実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2009年10月16日に出願された日本特許出願2009−239000を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、蓄積されたカメラ撮影映像を対象とした画像検索を行う用途に適用できる。また、本発明は、特に、希望する服や靴等の商品/備品を検索する用途や、自然言語文から生成した色分布と本来検索したい対象物の色分布とを比較し、人の記憶色と実際の色との差異の分析や、照明による影響の分析/照明の調整等を行う用途に応用できる。
101 辞書
102 自然言語文入力手段
103 色記述抽出手段
104 色比率判定手段
105 画像特徴量生成手段
106 辞書
107 対象構成知識
108 対象記述抽出手段
109 色彩値調整手段
110 色比率調整手段
111 色領域調整手段
12 色彩解析装置
121 CPU
122 主記憶部
123 出力部
124 入力部
125 通信部
126 補助記憶部
127 システムバス

Claims (21)

  1. 自然言語で表現された色についての記述である自然言語記述を、所定の色空間上の値の分布を示すデータに置き換える色彩解析装置であって、
    前記自然言語記述に含まれる色同士の関係を示す語句を用いて、当該自然言語記述が対象とする画像の領域全体に対して、前記自然言語記述に含まれる色が占める領域の割合を決定する色比率判定手段を
    備えたことを特徴とする色彩解析装置。
  2. 色比率判定手段の決定結果に基づいて、所定の色空間上の値の分布を示すデータを生成するデータ生成手段を備え、
    前記データ生成手段は、前記色空間上の値の分布を示すデータとして、前記所定の色空間上で前記自然言語記述において自然言語によって表現された色が占める領域と、前記自然言語記述が対象とする画像の領域全体に対して、前記自然言語によって表現された色が占める面積比率とを含むデータを生成する
    請求項1記載の色彩解析装置。
  3. 自然言語の文から色についての記述を特定するための色名、及び色同士の関係を示す語句に関する情報を少なくとも含む辞書を記憶する辞書記憶手段を備えた
    請求項1又は請求項2記載の色彩解析装置。
  4. 前記辞書記憶手段は、色同士の関係を示す語句として少なくとも並立助詞を含む辞書を記憶する
    請求項3記載の色彩解析装置。
  5. 前記辞書記憶手段は、色の修飾語句に関する情報をさらに含む辞書を記憶し、
    前記辞書に含まれる色の修飾語句を用いて、前記所定の色空間上で前記自然言語記述において自然言語によって表現された色が占める領域の位置又はサイズを調整する色彩値調整手段をさらに備えた
    請求項3又は請求項4記載の色彩解析装置。
  6. 自然言語で表現された色についての記述である自然言語記述を、所定の色空間上の値の分布を示すデータに置き換える色彩解析装置であって、
    前記自然言語記述により特定した色と、予め記憶する所定の色とについて、当該自然言語記述が対象とする画像の領域全体に対して、前記それぞれの色が占める領域の割合を決定する色比率判定手段を
    備えたことを特徴とする色彩解析装置。
  7. 前記辞書記憶手段は、画像の一部として識別する対象の名称と当該対象の種類に関する情報とをさらに含む辞書を記憶し、
    異なる前記対象の種類間の関係に関する情報を少なくとも含む対象構成知識を記憶する知識記憶手段と、
    前記辞書記憶手段が記憶する辞書を用いて、前記自然言語記述から前記対象の名称を抽出し、当該対象の種類を判別する対象記述抽出手段と、
    前記対象構成知識に含まれる前記対象の種類間の関係を用いて、前記各対象に相当する画像上の特定領域を占める各色の面積比率を決定する色比率調整手段とを
    さらに備えた請求項3から請求項5のうちのいずれか1項に記載の色彩解析装置。
  8. 前記自然言語記述が対象とする画像の領域全体に対して、前記自然言語記述に含まれる各色が占める領域間の前記所定の色空間上での距離に応じて、当該自然言語記述に含まれる各色が占める領域の大きさを調整する色領域調整手段をさらに備えた
    請求項1から請求項7のうちのいずれか1項に記載の色彩解析装置。
  9. 情報処理装置が、自然言語で表現された色についての記述である自然言語記述に含まれる色同士の関係を示す語句を用いて、当該自然言語記述が対象とする画像の領域全体に対して、前記自然言語記述に含まれる色が占める領域の割合を決定することにより、所定の色空間上の値の分布を示すデータを生成する
    ことを特徴とする色彩解析方法。
  10. 情報処理装置が、前記色空間上の値の分布を示すデータとして、前記所定の色空間上で前記自然言語記述において自然言語によって表現された色が占める領域と、前記自然言語記述が対象とする画像の領域全体に対して、前記自然言語記述に含まれる色が占める面積比率とを含むデータを生成する
    請求項9に記載の色彩解析方法。
  11. 記憶装置が、自然言語の文から色についての記述を特定するための色名、及び色同士の関係を示す語句に関する情報を少なくとも含む辞書を記憶する
    請求項9又は請求項10記載の色彩解析方法。
  12. 記憶装置が、色同士の関係を含む語句として少なくとも並立助詞を含む辞書を記憶する
    請求項11に記載の色彩解析方法。
  13. 記憶装置が、色の修飾語句に関する情報をさらに含む辞書を記憶し、
    情報処理装置が、前記辞書に含まれる色の修飾語句を用いて、前記所定の色空間上で前記自然言語記述において自然言語によって表現された色が占める領域の位置又はサイズを調整する
    請求項11又は請求項12記載の色彩解析方法。
  14. 情報処理装置が、自然言語で表現された色についての記述である自然言語記述により特定した色と、予め記憶する所定の色とについて、当該自然言語記述が対象とする画像の領域全体に対して、前記それぞれの色が占める領域の割合を決定することにより、所定の色空間上の値の分布を示すデータを生成する
    ことを特徴とする色彩解析方法。
  15. 記憶装置が、画像の一部として識別する対象の名称と当該対象の種類に関する情報と、異なる前記対象の種類間の関係に関する情報とをさらに含む辞書を記憶し、
    前記記憶装置が、異なる前記対象の種類間の関係に関する情報を少なくとも含む対象構成知識を記憶し、
    情報処理装置が、前記辞書を用いて、前記自然言語記述から前記対象の名称を抽出し、当該対象の種類を判別し、
    前記情報処理装置が、前記対象構成知識に含まれる前記対象の種類間の関係を用いて、前記各対象に相当する画像上の特定領域を占める各色の面積比率を決定する
    請求項11から請求項13のうちのいずれか1項に記載の色彩解析方法。
  16. 情報処理装置が、前記自然言語記述が対象とする画像の領域全体に対して、前記自然言語記述に含まれる各色が占める領域間の前記所定の色空間上での距離に応じて、当該自然言語記述に含まれる各色が占める領域の大きさを調整する
    求項9から請求項15のうちのいずれか1項に記載の色彩解析方法。
  17. コンピュータに、
    自然言語で表現された色についての記述である自然言語記述に含まれる色同士の関係を示す語句を用いて、当該自然言語記述が対象とする画像の領域全体に対して、前記自然言語記述に含まれる色が占める領域の割合を決定する処理と、
    所定の色空間上の値の分布を示すデータを生成する処理とを
    実行させるための色彩解析プログラム。
  18. 前記コンピュータに、
    前記自然言語記述に含まれる色の修飾語句を用いて、前記所定の色空間上で前記自然言語記述において自然言語によって表現された色が占める領域の位置又はサイズを調整する処理を実行させる
    請求項17記載の色彩解析プログラム。
  19. コンピュータに、
    自然言語で表現された色についての記述である自然言語記述により特定した色と、予め記憶する所定の色とについて、当該自然言語記述が対象とする画像の領域全体に対して、前記それぞれの色が占める領域の割合を決定する処理と、
    所定の色空間上の値の分布を示すデータを生成する処理とを
    実行させるための色彩解析プログラム。
  20. 前記コンピュータに、
    前記自然言語記述から画像の一部として識別する対象の名称を抽出し、当該対象の種類を判別する処理と、
    異なる前記対象の種類間の関係に関する情報を用いて、前記各対象に相当する画像上の特定領域を占める各色の面積比率を決定する処理とを実行させる
    請求項17から請求項19のうちのいずれか1項に記載の色彩解析プログラム。
  21. 前記コンピュータに、
    前記自然言語記述が対象とする画像の領域全体に対して、前記自然言語記述に含まれる各色が占める領域間の前記所定の色空間上での距離に応じて、当該自然言語記述に含まれる各色が占める領域の大きさを調整する処理を実行させる
    請求項17から請求項20のうちのいずれか1項に記載の色彩解析プログラム。
JP2011543938A 2009-10-16 2010-10-12 色彩解析装置、色彩解析方法、及び色彩解析プログラム Active JP5682569B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011543938A JP5682569B2 (ja) 2009-10-16 2010-10-12 色彩解析装置、色彩解析方法、及び色彩解析プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009239000 2009-10-16
JP2009239000 2009-10-16
JP2011543938A JP5682569B2 (ja) 2009-10-16 2010-10-12 色彩解析装置、色彩解析方法、及び色彩解析プログラム
PCT/JP2010/006058 WO2011045920A1 (ja) 2009-10-16 2010-10-12 色彩解析装置、色彩解析方法、及び色彩解析プログラム

Publications (2)

Publication Number Publication Date
JPWO2011045920A1 JPWO2011045920A1 (ja) 2013-03-04
JP5682569B2 true JP5682569B2 (ja) 2015-03-11

Family

ID=43875976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011543938A Active JP5682569B2 (ja) 2009-10-16 2010-10-12 色彩解析装置、色彩解析方法、及び色彩解析プログラム

Country Status (5)

Country Link
US (1) US9400808B2 (ja)
EP (1) EP2490132A4 (ja)
JP (1) JP5682569B2 (ja)
CN (1) CN102667767B (ja)
WO (1) WO2011045920A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5724430B2 (ja) * 2011-02-15 2015-05-27 カシオ計算機株式会社 情報検索装置およびプログラム
WO2013005262A1 (ja) * 2011-07-07 2013-01-10 パイオニア株式会社 画像抽出方法、画像抽出装置、画像抽出システム、サーバー、ユーザー端末、通信システムおよびプログラム
WO2013021889A1 (ja) * 2011-08-05 2013-02-14 楽天株式会社 色名決定装置、色名決定方法、情報記録媒体、ならびに、プログラム
EP2741254B1 (en) * 2011-08-05 2018-07-04 Rakuten, Inc. Color determination device, color determination system, color determination method, information recording medium, and program
JP6019968B2 (ja) * 2012-09-10 2016-11-02 株式会社リコー レポート作成システム、レポート作成装置及びプログラム
WO2015145766A1 (ja) * 2014-03-28 2015-10-01 楽天株式会社 色推定装置、色推定方法及び色推定プログラム
US10409822B2 (en) * 2014-05-06 2019-09-10 Shutterstock, Inc. Systems and methods for presenting ranked search results
ES2929842T3 (es) 2014-05-19 2022-12-02 Avery Dennison Retail Information Services Llc Transferencia térmica de imagen compuesta con marca legible mediante escaneo
CN105574046B (zh) * 2014-10-17 2019-07-12 阿里巴巴集团控股有限公司 一种设置网页色彩的方法及装置
CN104298786B (zh) * 2014-11-12 2018-07-10 广州出益信息科技有限公司 一种图像检索方法及装置
JP6028130B1 (ja) * 2016-02-09 2016-11-16 楽天株式会社 色分類装置、色分類方法、プログラム、ならびに、非一時的なコンピュータ読取可能な情報記録媒体
US11062142B2 (en) 2017-06-29 2021-07-13 Accenture Gobal Solutions Limited Natural language unification based robotic agent control
US11436771B2 (en) * 2020-11-20 2022-09-06 International Business Machines Corporation Graph-based color description generation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108728A (ja) * 1991-10-21 1993-04-30 Hitachi Ltd 画像のフアイリングならびに検索方法
JP2007304738A (ja) * 2006-05-10 2007-11-22 Viva Computer Co Ltd 画像蓄積・検索システムと同システム用の画像蓄積装置及び画像検索装置並びにプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4144961B2 (ja) * 1999-01-14 2008-09-03 富士フイルム株式会社 画像データ通信システム,サーバ・システムおよびその制御方法ならびにサーバ・システムを制御するためのプログラムを格納した記録媒体
JP5170961B2 (ja) * 2006-02-01 2013-03-27 ソニー株式会社 画像処理システム、画像処理装置および方法、プログラム、並びに記録媒体
JP2007206919A (ja) * 2006-02-01 2007-08-16 Sony Corp 表示制御装置および方法、プログラム、並びに記録媒体
JP2007206920A (ja) * 2006-02-01 2007-08-16 Sony Corp 画像処理装置および方法、検索装置および方法、プログラム、並びに記録媒体
US8885236B2 (en) * 2006-06-30 2014-11-11 Geoffrey J. Woolfe Natural language color communication and system interface
US7755646B2 (en) 2006-10-17 2010-07-13 Hewlett-Packard Development Company, L.P. Image management through lexical representations
JP2009003581A (ja) 2007-06-19 2009-01-08 Viva Computer Co Ltd 画像蓄積・検索システム及び画像蓄積・検索システム用プログラム
US20090192990A1 (en) * 2008-01-30 2009-07-30 The University Of Hong Kong Method and apparatus for realtime or near realtime video image retrieval
JP2009239000A (ja) 2008-03-27 2009-10-15 Dainippon Screen Mfg Co Ltd 基板処理システム
US8229210B2 (en) * 2008-04-02 2012-07-24 Bindu Rama Rao Mobile device with color detection capabilities

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108728A (ja) * 1991-10-21 1993-04-30 Hitachi Ltd 画像のフアイリングならびに検索方法
JP2007304738A (ja) * 2006-05-10 2007-11-22 Viva Computer Co Ltd 画像蓄積・検索システムと同システム用の画像蓄積装置及び画像検索装置並びにプログラム

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSNG199900066008; 杉浦 博、外3名: '自然言語による画像データベース検索' 電子情報通信学会技術研究報告 第94巻,第51号, 19940520, p.55-62, 社団法人電子情報通信学会 *
CSNG199900209002; 原田 将治、外3名: '画像検索のための形状特徴空間の構築' 電子情報通信学会技術研究報告 第95巻,第322号, 19951019, p.7-12, 社団法人電子情報通信学会 *
CSNG200100090013; 木本 晴夫: '感性語による画像検索とその精度評価' 情報処理学会論文誌 第40巻,第3号, 19990315, p.886-898, 社団法人情報処理学会 *
JPN6014039762; 杉浦 博、外3名: '自然言語による画像データベース検索' 電子情報通信学会技術研究報告 第94巻,第51号, 19940520, p.55-62, 社団法人電子情報通信学会 *
JPN6014039763; 原田 将治、外3名: '画像検索のための形状特徴空間の構築' 電子情報通信学会技術研究報告 第95巻,第322号, 19951019, p.7-12, 社団法人電子情報通信学会 *
JPN6014039764; 木本 晴夫: '感性語による画像検索とその精度評価' 情報処理学会論文誌 第40巻,第3号, 19990315, p.886-898, 社団法人情報処理学会 *

Also Published As

Publication number Publication date
WO2011045920A1 (ja) 2011-04-21
EP2490132A4 (en) 2016-10-05
US9400808B2 (en) 2016-07-26
JPWO2011045920A1 (ja) 2013-03-04
CN102667767B (zh) 2015-01-07
EP2490132A1 (en) 2012-08-22
US20120195499A1 (en) 2012-08-02
CN102667767A (zh) 2012-09-12

Similar Documents

Publication Publication Date Title
JP5682569B2 (ja) 色彩解析装置、色彩解析方法、及び色彩解析プログラム
US8891860B2 (en) Color name determination device, color name determination method, information recording medium, and program
JP6740457B2 (ja) 商標画像のコンテンツ・ベースの検索及び取得
US20110078176A1 (en) Image search apparatus and method
JP2007286864A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US20080104020A1 (en) Handwritten Query Builder
KR102227896B1 (ko) 영상데이터의 외형서술데이터 획득 방법, 장치 및 프로그램
JP4374902B2 (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
US11615263B2 (en) Content prediction based on pixel-based vectors
Bhardwaj et al. Palette power: Enabling visual search through colors
JP2011203776A (ja) 類似画像検索装置、方法及びプログラム
JP5480008B2 (ja) マンガコンテンツの要約を生成する要約マンガ画像生成装置、プログラム及び方法
JP2003330941A (ja) 類似画像分類装置
JP5790661B2 (ja) 順序判定装置、順序判定方法および順序判定プログラム
JP7088656B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2013016024A (ja) 情報検索方法および装置
EP4195135A1 (en) Information processing device, information processing method, information processing system, and program
JP2012108721A (ja) 画像検索装置、及び画像検索方法
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
JP7380689B2 (ja) 処理装置、処理方法及びプログラム
WO2023058233A1 (ja) 情報処理装置、情報処理方法、情報処理システム、およびプログラム
Hong et al. Information Extraction and Analysis on Certificates and Medical Receipts
JP2011210130A (ja) 画像検索色立体表示システム、画像検索色立体表示方法、プログラムおよび記録媒体
JP2010262578A (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム
JP6805626B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141229

R150 Certificate of patent or registration of utility model

Ref document number: 5682569

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150