JP7532927B2 - 画像処理装置、画像閲覧システム、画像処理プログラム、画像処理方法 - Google Patents

画像処理装置、画像閲覧システム、画像処理プログラム、画像処理方法 Download PDF

Info

Publication number
JP7532927B2
JP7532927B2 JP2020101752A JP2020101752A JP7532927B2 JP 7532927 B2 JP7532927 B2 JP 7532927B2 JP 2020101752 A JP2020101752 A JP 2020101752A JP 2020101752 A JP2020101752 A JP 2020101752A JP 7532927 B2 JP7532927 B2 JP 7532927B2
Authority
JP
Japan
Prior art keywords
color
search
image data
colors
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020101752A
Other languages
English (en)
Other versions
JP2021196761A (ja
Inventor
智雄 山中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2020101752A priority Critical patent/JP7532927B2/ja
Priority to US17/326,853 priority patent/US20220019617A1/en
Publication of JP2021196761A publication Critical patent/JP2021196761A/ja
Application granted granted Critical
Publication of JP7532927B2 publication Critical patent/JP7532927B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19073Comparing statistics of pixel or of feature values, e.g. histogram matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Processing Or Creating Images (AREA)

Description

本開示は、画像データの画素に使用されている色を抽出する画像処理装置に関し、特に、SNS(Social Networking Service)に画像データを投稿する場合の改良に関する。
SNSは、個人の趣味から企業のマーケティング、政府の広報活動まで、様々な目的で利用されている。SNSを利用するサービス利用者は、自身が見たい画像データを検索する際、テキスト検索、画像検索を実行する。こうした検索により、画像データがサービス利用者であるサービス利用者ブラウザーに表示される回数を「インプレッション」という。また、画像データを注視して拡大したり、投稿者のページにアクセスしたり、「いいね!」のアイコンをクリックするなど、サービス利用者が積極的な行動をとった回数を「エンゲージメント」という。これらインプレッション、エンゲージメントを高めることが、情報拡散のひとつの鍵となる。情報拡散を希望する投稿者は、投稿しようとする画像の特徴を言い表すテキスト文字列を作成して、このテキスト文字列と共に、画像データをSNSサービスのサーバーにアップロードすることでインプレッション、エンゲージメントの向上を図る。
特開2001-166908号公報 特開2019-159526号公報
ところで近年、色検索を行い得る検索エンジンの検討が進められている。こうした色検索では、ブラウザーにおいて色見本のパレットを表示し、自身が見たい色の選択を、サービス利用者から受け付ける。パレットから色選択されると、当該選択された色を検索条件として画像データを検索する。色は形状、模様に並ぶデザイン要素の1つであり、これを手掛かりにして購入すべき商品を選ぶサービス利用者が少なからず存在するからである。
当該色検索では、パレットから選ばれた色が検索条件として指定されるので、色検索において多くのサービス利用者に画像データを見てもらうには、色見本に記載された正しい色名を示すテキスト文字列を、画像データと共にSNSサービスのサービスにアップロードせねばならない。しかし、和洋の伝統色の分類は多岐にわたり、服飾、デザイン、美術関連の知識をもたない一般人たるサービス利用者が、この分類における色名を記載する保証はない。間違った知識のまま、色名を示すテキスト文字列を作成して画像データをSNSのサーバーにアップロードしたとしても、インプレッション、エンゲージメントが向上しないという問題がある。また、検索を行う側のサービス利用者も、和洋の伝統色の分類に従い色を正しく選択している保障はなく、画像データの投稿を行う者の間違いと、検索を行う側のサービス利用者の間違いとの相乗効果により、投稿した画像データのインプレッション、エンゲージメントが向上しない状況に陥ってしまう。
画像処理装置を用いて、機械的に色を抽出し、テキスト文字列を生成することも考えられる。しかし、特徴的な色が、画像データの多くの面積を占めているという保証はなく、画像処理装置が機械的に画素の色を抽出して、抽出した色の名前を示すテキスト文字列を生成した場合、画像データに現れる対象物の特徴が、テキスト文字列に表現されない。そうした投稿テキスト文字列を作成して画像データをSNSのサーバーにアップロードしたとしても、インプレッション、エンゲージメントが向上しない。
本開示の目的は、画像閲覧システムにおいてパレットからの色選択による検索条件でサービス利用者が画像データの検索を実行した際、多くのサービス利用者に画像データを閲覧させることができる、画像処理装置を提供することである。
上記課題は、画像閲覧サービスにおける画像データの検索を支援する画像処理装置であって、対象物を表すとされる部位を、画像データから認識する認識手段と、認識された部位をなす画素で使用されている色を抽出する抽出手段と、前記部位からは抽出されなかったものの、サービス利用者が検索に用いる可能性がある色を、当該サービス利用者が検索を行う際の検索傾向に基づき決定する決定手段と、前記抽出手段により抽出された色を示す第1タグ、及び、前記決定手段により決定された色を示す第2タグを生成して、検索用タグとして画像データに付加する付加手段とを備えることを特徴とする画像処理装置により解決される。
前記抽出手段により抽出される色は、前記対象物をなす部位の画素において出現度数が最も高い色、又は、当該出現度数に示される順序に複数の色を並べた際の順位が、所定の順位以上となる色としてもよい。
前記サービス利用者の検索傾向とは、対象物の色として認知されているものを検索条件に選ぶ傾向であり、前記決定手段は、参照テーブルを有し、前記参照テーブルは、現実物の複数の類型のそれぞれを表す色として一般的に認知されている色を示し、判別された対象物の類型に対応する色として、前記参照テーブルに記載されたものを、前記サービス利用者が検索に用いる可能性がある色としてもよい。
前記サービス利用者の検索傾向とは、対象物の階調をなす色に近い色を検索条件に選ぶ傾向であり、前記決定手段は、前記抽出手段により抽出された色の色空間座標を中心座標とし、前記部位の階調を径とした範囲を占める球の表面及び内部に位置する色からなる色の集合を生成し、前記検索に用いられる可能性がある色は、生成された色の集合に含まれる色としてもよい。
前記サービス利用者の検索傾向とは、対象物を表す部位において度数分布をなす色に近い色を検索条件に選ぶ傾向であり、前記決定手段は、前記度数分布における度数が所定値に収束する際の収束点となる第1収束色、第2収束色を求める処理(1)、前記抽出手段により抽出された色の色空間座標、第1収束点の色空間座標、第2収束点の色空間座標を通過する3次元直線を中心軸とし、所定のオフセットを径とした円柱体の表面に位置する色の集合を生成する処理(2)を実行し、前記検索に用いられる可能性がある色は、生成された色の集合に含まれる色としてもよい。
前記サービス利用者の検索傾向とは、対象物を表す部位に使用されている色よりも、彩度及び/又は明度が高い色を検索条件に選ぶ傾向であり、前記決定手段は、HSV色空間において、認識された部位をなす画素で使用されている色が分布している部分空間を規定する処理(1)、前記HSV色空間において、前記部分空間の外側で、彩度又は明度が大きくなる場所に位置する色の集合を生成する処理(2)を含み、前記検索に用いられる可能性がある色は、前記色の集合に含まれる色としてもよい。
前記付加手段が、第1タグ、及び、第2タグを生成するのは、前記抽出手段により抽出された色の色空間座標と、決定手段が決定した色の色空間座標との距離が所定の閾値を上回る場合としてもよい。
前記抽出手段により抽出された色の色空間座標と、決定手段が決定した色の色空間座標との距離が所定の閾値を下回る場合、前記付加手段は、前記画像データに付加すべき単一のタグを生成し、前記単一のタグは、抽出手段により抽出された色と、決定手段により決定された色との中間色、抽出手段により抽出された色並びに決定手段により決定された色を包含する色群、抽出手段により抽出された色そのもの、決定手段により決定された色そのものの何れかを示すとしてもよい。
前記認識手段は、画像データが現実物を撮影又は描写したものかどうかの判定を行い、前記決定手段が、検索に用いられる可能性がある色を決定するのは、画像データが、現実物を撮影又は描写したものと判定された場合としてもよい。
前記色の度数を示すヒストグラムが、所定幅以上の広がりを有しているかどうかの判定を行い、所定幅以上の広がりを有している場合、前記認識手段は、前記画像データにおける一の部位が、現実物を撮影又は描写したものとの判定結果を下すとしてもよい。
前記認識手段は、現実物の複数の類型のそれぞれに対応する学習データを含み、学習データは、対応する類型の現実物を表す特徴量の点群と、対応する類型の現実物を表さない特徴量の点群とを区切る分離面を規定するデータであり、画像データにおいて対象物を表すとされる部位から特徴量を算出して、特徴量を各類型に対応する学習データに適用することで、前記認識手段は、前記画像データにおける一の部位が、現実物を撮影又は描写したものかどうかの判定結果を下すとしてもよい。
前記認識手段は、画像データをなす画素のうち、エッジとなる画素を抽出する処理を行い、前記対象物を表す部位は、エッジとなる画素により囲まれる一群の画素からなるとしてもよい。
同系色をなす画素が占有している領域を、画像データから分離する処理を行い、前記対象物を表す部位は、同系色をなすとして分離された領域の画素から構成されるとしてもよい。
前記対象物をなす画素の色は、Rの値、Gの値、Bの値で表され、前記Rの値、Gの値、Bの値は、RGB色空間を均等に分割することで得られる部分空間のうち、どれに属するかを示すとしてもよい。
また上記課題は、画像処理装置を含み、端末が定めた検索条件に基づきサーバーが検索を実行する画像閲覧システムであって、対象物を表すとされる部位を、画像データから認識し、認識された部位をなす画素で使用されている色を抽出し、前記部位からは抽出されなかったものの、サービス利用者が検索に用いる可能性がある色を、当該サービス利用者が検索を行う際の検索傾向に基づき決定して、抽出された色を示す第1タグ、及び、決定された色を示す第2タグを生成して、検索用タグとして画像データに付加する画像閲覧システムによっても解決される。
ここで前記端末は、パレットを表示して、パレットから検索条件となる色の選択をサービス利用者から受け付け、前記サーバーは、検索条件に合致する第1タグが付加された画像データ、及び/又は、検索条件に合致する第2タグが付加された画像データを含む検索結果画面を端末に表示させるとしてもよい。
前記第1タグは第1ハッシュタグ、前記第2タグは第2ハッシュタグであり、第1ハッシュタグ及び/又は第2ハッシュタグを含む一覧画面が端末に表示されている状態で、サービス利用者が当該ハッシュタグを選択すると、同じ第1ハッシュタグ及び/又は第2ハッシュタグが付加された他の画像データを端末に表示させるとしてもよい。
また上記課題は、画像閲覧サービスにおける画像データの検索を支援する処理をコンピュータに実行させる画像処理プログラムであって、対象物を表すとされる部位を、画像データから認識する認識ステップと、認識された部位をなす画素で使用されている色を抽出する抽出ステップと、前記部位からは抽出されなかったものの、サービス利用者が検索に用いる可能性がある色を、当該サービス利用者が検索を行う際の検索傾向に基づき決定する決定ステップと、前記抽出ステップにより抽出された色を示す第1タグ、及び、前記決定ステップにより決定された色を示す第2タグを生成して、検索用タグとして画像データに付加する付加ステップとをコンピュータに実行させることを特徴とする画像処理プログラムによっても解決される。
更に、上記課題は、画像閲覧サービスにおける画像データの検索を支援する画像処理方法であって、対象物を表すとされる部位を、画像データから認識する認識ステップと、認識された部位をなす画素で使用されている色を抽出する抽出ステップと、前記部位からは抽出されなかったものの、サービス利用者が検索に用いる可能性がある色を、当該サービス利用者が検索を行う際の検索傾向に基づき決定する決定ステップと、前記抽出ステップにより抽出された色を示す第1タグ、及び、前記決定ステップにより決定された色を示す第2タグを生成して、検索用タグとして画像データに付加する付加ステップとを含む画像処理方法によっても解決される。
サービス利用者が注目する対象物を表すとされる部位を、画像データから認識して、認識された部位をなす画素で使用されている色を抽出して、抽出された色を示す第1タグを画像データに付加するので、画像データの中に、サービス利用者が注目する対象物以外のものが映り込んでいたとしても、対象物の色を自動的に抽出して、その対象物に使用されている色を第1タグに示させることができる。
認識された部位をなす画素で使用されていないものの、サービス利用者が検索に用いる可能性がある色をサービス利用者の検索傾向から決定して、決定された色を示す第2タグを画像データに付加するので、画像閲覧サービスを利用するサービス利用者が数万人いて、そのうち何割かの者が誤った色名で検索を実行したとしても、それら何割かのサービス利用者に、第1タグ、第2タグが付加された画像データを閲覧させることができる。第1タグ、第2タグが付加された画像データは、対象物に使用されている色で検索を行ったサービス利用者、誤った色名で検索を実行したサービス利用者の双方に閲覧されるので、画像データのインプレッション、エンゲージメントを高めることができ、色に特徴がある対象物について、効率的に情報発信を行うことができる。
本開示にかかる画像処理装置2000を含む画像閲覧システム1を示す図である。 図2(a)(b)は、プルダウンメニューをクリックしてパレット1011Pを引き出すことで色選択が可能になる検索画面の一例を示す。 端末1011に表示される検索結果画面の一例を示す。 画像処理装置2000の制御系統を示す。 色名及び色コードに、画像のRGB値を対応付けた色見本データの一例を示す。 被写体の複数の類型のそれぞれに対応する学習データの一例を示す。 HOG(Histogram Oriented of Gradient)特徴量を示す図である。 複数の特徴量がプロットされた散布図を示す。 被写体の類型の学習の過程で、ディスプレイデバイス2001に表示される設定画面の一例を示す。 拡張色テーブルの一例を示す。 タグ生成手順のメインルーチンを示すフローチャートである。 図12(a)は、オブジェクトを分離する分離手順を示すフローチャートであり、図12(b)は、拡張色を決定する決定手順を示すフローチャートである。 図13(a)は、エッジ抽出の過程を示す図であり、図13(b)は、色相分離の過程を示す図である。 オブジェクトから抽出色、拡張色が決まる過程を示す。 拡張色を決定する決定手順のフローチャートである。 球体から拡張色を決定する過程を示す図である。 拡張色を決定する決定手順のフローチャートである。 円柱体から拡張色を決定する過程を示す。 拡張色を決定する決定手順のフローチャートである。 明度、彩度が強調された拡張色を決定する過程を示す図である。 色座標間距離に応じたタグ生成手順を示すフローチャートである。 図22(a)~(b)は、色座標間距離に応じて、単一タグの生成、複数タグの生成を切り替える過程を示す。 (a)~(c)は、通し番号を用いた色空間座標表現を示す図である。
[1]第1実施形態
以下、図面を参照しながら、本開示にかかる画像処理装置の実施形態について説明する。図1は、本開示にかかる画像処理装置2000を含む画像閲覧システム1を示す図である。画像閲覧システム1は、図1に示すように、MFP1000と、端末1011、1012、1013、1014と、画像処理装置2000と、SNSサーバー3000(ストレージ3001及び検索エンジン3002を含む)とを備える。
MFP(Multifunction Peripheral)1000は、原稿押えカバー1005と一体になった自動原稿フィーダー1006の載置台に載置された原稿束から一枚ずつ原稿を繰り出し、タッチパネルディスプレイ1001に対する操作に従いスキャナー1004で読み取ることで、各原稿に対応する画像データを得る。画像データは、RGB混色系を用いて画像を表すデータである。画像データはJPEG、TIFF、PDF、コンパクトPDF等のファイル形式で転送・格納に供される。webページで表示される画像データにおいて、各画素には、24ビットの情報量をもつRGB値が割り当てられ、RGB値は、256階調(0~255)のR値、256階調(0~255)のG値、256階調(0~255)のB値の加法混合により、様々な色を表す。こうしたR値、B値、G値は、RGB混色系の色空間(一般にRGB色空間という)において3次元座標をなす。
画像処理装置2000は、MFP1000により読み取られた画像データ、ファイルサーバー1100に蓄積された画像データを取り込み、適切なタグを付加してSNSサーバー3000のストレージにアップロードする。タグとは、画像データファイルに対応付けられる形で、画像データファイルと共に転送・格納に供されるテキスト文字列のことであり、画像データファイルの属性情報、ファイル管理情報に含まれるもの、画像データファイルのリンク情報に格納されるもの、画像データファイルと同一のディレクトリに格納されるもの等、様々な種類がある。一回のテキスト文字列の投稿には字数制限(例えば、200字以内)が存在していて、かかる字数制限の範囲内で、画像投稿を行う者(以下、投稿者という)は2個以上のタグを画像データに付加することができる。
SNSサーバー3000は、公衆ネットワーク3010を通じて画像データの投稿を受け付け、投稿された画像データの閲覧サービスを端末1011、1012、1013、1014に提供する。画像閲覧サービスの提供にあたって、ログイン画面、スタート画面、検索条件設定画面、検索結果表示画面などの様々な画面の画面データを作成し、SNSサービスの利用者が操作する端末1011~1014に送信して、表示させる。
端末1011、1012、1013、1014は、オペレーティングシステムがインストールされており、オペレーティングシステムにおいてブラウザーを起動することで、SNSサーバー3000から提供される様々な画面を、自身のディスプレイに表示させる。ブラウザーに表示される検索条件設定画面の一例を図2(a)に示す。図2(a)の検索画面では、プルダウンメニューをクリックしてパレット1011Pを引き出すことで色選択が可能になる。パレット1011Pにおいて、何れかの色が選択されると、図2(b)に示すように、パレットから選択された1以上の色の色名を示すテキスト文字列(図中では桃色)が、検索欄1011Bに入力される。これにより、「桃色」をキーワードとした検索コマンドがSNSサーバー3000に出力される。
ストレージ3001には、画像閲覧システム1の管理者による管轄下にある複数のネットワークドライブにより構成される。当該ストレージ3001は、アカウント毎のディレクトリを有している。対応するアカウントを有する投稿者が一回投稿を行う度に、アカウント毎のディレクトリにサブディレクトリが形成される。サブディレクトリは、投稿者の一回目の投稿に対応する投稿領域であり、投稿者がアップロードした画像データ、テキスト文字列は、この投稿領域にまとめて格納される。
検索エンジン3002は、SNSサーバー3000により起動されるサービス提供プログラムの1つであり、検索条件を含む検索コマンドが端末1011~1014のブラウザーから送信されると、検索条件に合致するタグが付された画像データがストレージ3001に格納されているかどうかを検索する。
検索エンジン3002による検索では、2以上の色を対象としたAND条件、OR検索の指定が可能であり、AND条件では、2以上の色を示すタグが付加されて投稿された画像データがヒットする。OR条件では、2以上の色を示すタグのうち、どちらかが付加されて投稿された画像データがヒットする。
合致するタグが付された画像データがストレージ3001に存在する場合、検索結果画面を作成して要求元の端末に表示させる。検索結果画面1011Fの一例を図3に示す。本図に示すように、検索結果画面は、検索条件に一致する画像データの縮小画像1021、1022、1023、1024、1025・・・・を複数配置して一覧表示に供するものであり、何れかの縮小画像がクリックされると、クリックされた縮小画像を拡大して表示する。
また検索エンジン3002は、ハッシュタグのクリックによる一覧表示機能的を実行する。ハッシュタグは、ハッシュマーク「#」を文頭に配した文字列であり、端末1011のブラウザーに検索結果画面が表示された際、閲覧者であるSNSユーザーがハッシュタグをクリックすると、SNSサーバー3000は、同じハッシュタグが付加された複数の画像データをストレージ3001から読み出し、端末1011~1014のブラウザーに表示させる。
[2]画像処理装置2000
画像処理装置2000の制御系統を図4に示す。図4に示すように、画像処理装置2000は、オペレーティングシステム(OS)201Sやタグ付加アプリケーション201AがインストールされたHDD、SSDであるストレージ201、ストレージ201にインストールされたOS201S、タグ付加アプリケーション201AがロードされるRAM202、OS201S、タグ付加アプリケーション201Aを構成する実行コードを取り出し、解読して実行するCPU203、タグ付加アプリケーション201Aが動作を行うための諸設定を格納した不揮発メモリ204、MFP1000、SNSサーバー3000とデータ入出力を行うNIC205、周辺ポート206を含み、NICを通じて画像データの入出力をおこなう。かかる入出力において、MFP1000の自動原稿フィーダー1006の読み取りで得られた画像データを取り込んでストレージ201に書き込む。またCPU203は、ストレージ201に書き込まれた画像データをSNSサーバー3000にアップロードする。
不揮発メモリ204には、色見本のデータが格納されている。色見本のデータは、図5に示すように、色名及び色コードに、画像のRGB値を対応付けたデータである。色名は、原色、和色、洋色、web216、パステルカラー、ビビッドカラー、モノトーン、メトロカラーといった種別の色見本において、色名として定義されているテキスト文字列である。色コードは、16進数の3バイトの値を示すテキスト文字列である。画像データに付加されているタグは、この色見本に記載されたテキスト文字列、色コードを用いて作成される。
[3]タグ付加アプリケーション201Aによる制御内容
ストレージ201にインストールされたタグ付加アプリケーション201Aは、RAM202に読み出された画像データに対して画像処理を行い、色見本データに記載されている色名又は色コードを用いて、画像データに付加すべきカラータグを生成する。カラータグとは、パレットからの色選択による、画像データの検索を可能とするハッシュタグのことであり、色名、色コードを示すテキスト文字列にハッシュマークを付加した構造をなす。
(3-1)タグ生成の事前処理
タグ生成に先立ち、実行すべき事前処理として、画像データに示される被写体の教師あり学習がある。教師あり学習は、ディスプレイデバイス2001、キャラクターデバイス2002、ポインティングデバイス2003を用いた対話操作により実現される。
教師あり学習では、画像データのサンプルから特徴量を抽出するのと共に、当該画像データに示される被写体の類型を設定して、画像データに示される被写体の類型を認識するための認識辞書を構築する。認識辞書は、図6に示すように被写体の複数の類型のそれぞれに対応する学習データからなる。図6の一例では、薔薇、ザクロ、ツツジ、乙女椿といった現実物の類型に、ハードマージンSVM(Support Vector Machine)の超平面を規定する識別関数F1、F2、F3、F4、F5・・・・のデータを対応つけた形式になっている。
特徴量としては、機械学習の分野で相応の使用実績があるもの、例えば、図7に示すようなHOG(Histogram Oriented of Gradient)特徴量を用いることが望ましい。
本図のHOG特徴量は、8×8の画素内に見受けられる線分の出現数を、9個の勾配方向(0°,20°,40°,60°,80°,100°,120°,140°,160°)に分けて集計したものである。画像データの多数のサンプルから特徴量の抽出を行うと、図8の散布図が得られる。図8の散布図では、画像データの複数のサンプルから得られた特徴量2011、2012、2013、2014、2015、特徴量2021、2022、2023、2024、2025が、2次元平面にプロットされる。
図6に示す学習データにおける識別関数は、こうして散布図にプロットされた特徴量を、2つの点群2010、2020に分離する超平面2030を規定する。識別関数により決定される図8の超平面2030は、自動原稿フィーダー1006及びスキャナー1004により読み取られた画像データから抽出された特徴量を、画像データの複数のサンプルから得られた特徴量2011、2012、2013、2014、2015からなる点群2010と、対応する類型を表さない特徴量2021、2022、2023、2024、2025の点群2020とに分離する。こうした分離により、スキャナー1004により読み取られた画像データが、どの類型であるかを認識することができる。
図9は被写体の類型の学習の過程で、ディスプレイデバイス2001に表示される設定画面の一例を示す。設定画面は、特徴量抽出の対象となる画像データのサンプルがウィンドウ400に配され、その隣に、テキスト文字列の文字入力を受け付ける入力欄401に配され、この入力欄に入力されたテキスト文字列を、左記のサンプルに現れている対象物の類型であるとして不揮発メモリ204に格納する。図9の設定画面で特徴的なのは、入力欄401の下にパレット402が配されていて、パレット402に一覧表示された複数の色の何れかの指定が可能になる点である。ポインティングデバイス2003を用いた操作で、パレット402に表示された何れかの色が選択されると、当該色を拡張色として、被写体の類型に対応付けたテーブル(図10の拡張色テーブル)を不揮発メモリ204に書き込む。拡張色テーブルは、図10に示すように薔薇、ザクロ、ツツジ、乙女椿といった現実物の類型に、拡張色を対応つけた形式になっている。デザイン、美術等の見識を有さない一般人は、被写体に対する印象に紐付けて、被写体の色を記憶していることが殆どである。そうした紐付けによる記憶は、夕陽は赤い、リンゴは赤いという先入観によるもの(疑似記憶)である。そうした疑似記憶を頼りに検索を実行した場合、抽出色を示すタグが付加された画像が一向にヒットしない。リンゴや夕陽は「赤い」と認知されているものの、実際にリンゴや夕陽を撮影した写真においてこれらは、赤い色の画素で描かれる訳ではない。リンゴ、夕陽の画像からは、赤い色の画素が抽出されず、また抽出されたとしてもその数は少数に過ぎないからである。そこで拡張色テーブルを設けて疑似記憶に紐づけられる色をタグ付加の対象として選ぶことにしている。
(3―2)タグ生成のメインルーチン
タグ付加アプリケーション201Aは、MFP1000の自動原稿フィーダー1006、スキャナー1004により読み取られた画像データのそれぞれについて、タグを生成する。この生成手順を示したのが、図11のフローチャートである。本図において変数max1は、自動原稿フィーダー1006により読み取られた画像データの枚数を示し、変数iは、自動原稿フィーダー1006によって読み取られた複数画像データのそれぞれを示し、1からmax1までの値を変化する。変数max2は、i番目の画像データから分離されたオブジェクトの総数を示し、変数jは、i番目の画像データから抽出された複数のオブジェクトのそれぞれを示し、1からmax2までの値を変化する。
ステップS101において変数iを1に設定して、ステップS102では、画像データiから1以上のオブジェクトを分離する。ここで、オブジェクトとは、現実物を表す一群の画素のことであり、複数の画素がまとまって明暗の階調をなすとか、同系色で統一されている等、何等かのまとまりを有する画素群からなる。以下、変数jを1に設定して(ステップS103)、j番目のオブジェクト(オブジェクトj)の彩度ヒストグラムを生成する(ステップS104)。具体的にいうと、オブジェクトをなす各画素のRGB値をHSV値(色相(Hue)であるH値、彩度(Saturation)であるS値、明度(Value)であるV値からなる)に変換して、同じ彩度をもつ画素の出現数をカウントする。こうすることで、各彩度の出現度数を示す彩度ヒストグラムが得られる。
そして、彩度ヒストグラムにおいて最大度数を示す画素色をHSV値からRGB値に変換して、変換後のRGB値により特定される色を抽出色として抽出し(ステップS105)、ステップS106において、彩度ヒストグラムの広がりが、被写体基準を上回っているかどうかを判定する。ここでの被写体基準は、オブジェクトが、現実物の撮影により得られた被写体かどうかの区別を行うために経験的に設定された値であり、4~8色程度に設定される。現実物の撮影により得られた被写体は環境光の照射、反射により複雑な色調、階調をなす。しかしながら、文書作成アプリケーションで作成された図表やイラスト等は複雑な色調、階調をなさない。そこで、彩度ヒストグラムの広がりと、被写体基準とを比較して、オブジェクトが、現実物の撮影により得られた被写体かどうかを区別する。また、撮影により得られた被写体ではないが、被写体に準ずるもの(自然画の手法等で描写された絵画中の物体等)も、被写体と同様に判断される。こうした描写で表される物体も、被写体と同一に扱うべきだからである。
彩度ヒストグラムに分布の広がりが被写体基準を上回っていて、階調が存在する場合(ステップS106でYes)、拡張色を決定して(ステップS107)、抽出色を示す第1カラータグ、拡張色を示す第2カラータグを画像データiに付加する(ステップS108)。
彩度ヒストグラムに分布の広がりがなく、階調が存在しない場合(ステップS106でNo)、抽出色を示すカラータグを画像データiに付加する(ステップS109)。
ステップS110はループの継続要件が成立するかどうかの判定であり、オブジェクトを指示する変数jがオブジェクト総数max2を下回る場合(ステップS110でYes)、変数jをインクリメントして(ステップS111)、ステップS104に戻る。変数jがオブジェクト総数max2を下回る限り、ステップS104~S111の繰り返しは継続する。これにより、ページjにおける個々のオブジェクトは処理に供される。
変数jがオブジェクト総数max2に達し、全てのオブジェクトの処理が完了すると、継続要件を規定するステップS110がNoになる。ステップS112は、ステップS102~S111のループの継続要件が成立するかどうかの判定であり、画像データを指示する変数iが画像データの総数max1を下回る場合(ステップS112でYes)、変数iをインクリメントして(ステップS113)、ステップS102に戻る。変数iが画像データ総数max1を下回る限り、ステップS102~S113の繰り返しは継続する。これにより、個々の画像データは処理に供される。変数iが画像データの総数max1に達し、全画像データの処理が完了すると、終了要件を規定するステップS112がNoになって本フローチャートの処理を終了する。
(3―3)オブジェクトの分離手順
ステップS102はサブルーチン化されている。図12(a)は、オブジェクトを分離する分離手順を示すフローチャートである。
本フローチャートでは、ステップS121において微分フィルタを施してエッジを抽出する。微分フィルタを施すことで得られた画像(微分画像)は、黒地の背景に、断片的な明線を配した絵柄となる。断片的な明線は、階調や色相が連続しておらず、RGB値が急激に変化している部分を示す。微分画像において明線として現れる画素列は「エッジ」と呼ばれ、対象物の輪郭を断片的に表す。
次に、このエッジを手掛かりにして対象物の分離を試みる。具体的にいうと、ステップS122において、エッジを構成する画素のうち、上下左右を含む8方向において隣接し合うものを結び、閉ループを抽出する。この過程を詳しく説明する。
エッジの任意の点を開始点として記憶して、8方向の何れかで、他のエッジと隣接していないかどうかを判定する。エッジ間に無画素の領域が存在しても、かかる無画素の部分がエッジに対して10%以下の大きさであれば度外視する。対象物の再現を優先したい趣旨である。画素の隙間を度外視しつつ、複数のエッジを辿ってゆくことで、エッジの軌跡が開始点に至るかどうかを判断する。
エッジの軌跡が開始点に戻ってきたということは断片的なエッジが、閉ループをなし、1つの領域を囲んでいたことを意味する。この場合、エッジは対象物の輪郭をなすと考えられるので、ステップS123では、かかるエッジにより囲まれている領域をオブジェクトとして分離する。
更にオブジェクトから特徴量を抽出し(ステップS124)、抽出した特徴量を、機械学習で得られた学習データに適用して、オブジェクトに現れる被写体の類型を認識する(ステップS125)。その後、オブジェクトに連番を付与して、座標系における座標に対応付けて登録し(ステップS126)、登録された1以上のオブジェクトをリターンする。
(3-4)拡張色の決定
ステップS108において拡張色を決定する決定手順の詳細を表したのが、図12(b)のフローチャートである。
本フローチャートでは、SNSユーザーの検索傾向を考慮した拡張色の決定を実行する。具体的にいうと、SNSユーザーであるサービス利用者は、被写体の色として認知されているものを検索条件に選ぶ傾向があるので、認識された類型に対応する拡張色が拡張色テーブルに存在するかどうかを判定する(ステップS131)。存在する場合(ステップS131でYes)、拡張色テーブルに記載された拡張色をメインルーチンにリターンする(ステップS132)。対応する拡張色が拡張色テーブルにないと(ステップS131でNo)、拡張色を決定しない旨をメインルーチンにリターンする(ステップS133)。
画像データiが図13(a)のスキャン画像301であると、エッジ511、512、513、514が抽出され、これらのエッジが連続しているもので囲まれる領域1、2、3、4、5のうち領域1をオブジェクトjとする。かかるオブジェクトjを対象としてヒストグラムを生成すると、図14のヒストグラム521のようになる。このヒストグラム521において、もっとも高い度数522を有する色(図中の乙女色)が抽出色となる。
参照される拡張色テーブル314は、薔薇、ザクロ、ツツジ、乙女椿、夕陽といった現実物に、一般人が認識しているその現実物の色を、拡張色として対応つけて示している。認証辞書を用いて花オブジェクトを認識した結果、拡張色テーブルに記載された類型の1つ(乙女椿)が得られたとすると、かかる乙女椿に対応する拡張色として桃色が得られる。これら抽出色、拡張色の色名の文頭に、ハッシュマーク「#」を追加してカラータグを生成する。かかるカラータグと共に、画像データをSNSサーバー3000のストレージ3001にアップロードして、端末1011~1014のSNSユーザーによる閲覧に供する。
[4]まとめ
以上のように本実施形態によれば、SNSユーザーが注目する被写体を表すとされる画素群であるオブジェクトを、機械学習の過程で得られた学習データを用いて認識して、認識されたオブジェクトをなす画素で使用されている色を示す第1カラータグをアップロードしようとする画像データに付加するので、画像データの中に、SNSユーザーが注目する対象物以外のものが映り込んでいたとしても、対象物の色を自動的に抽出して、その対象物に使用されている色を第1カラータグに示させることができる。画像データに現れている現実物の色を忠実にタグに表すので、被写体がなす色を正しく選んで色検索を実行したSNSユーザーに、当該画像データを閲覧させることができる。
また分離されたオブジェクトの類型から、拡張色を決定して、この拡張色から画像データに付加すべき第2カラータグを生成する。
ある時点に画像閲覧システムを利用するSNSユーザーが世界中に数万人程いて、そのうち何割かが画像データに現れている被写体の色を正確に覚えておらず、被写体の色として認知されているもので検索を実行したとしても、それら思込みによる色で色検索を実行したSNSユーザーの検索結果表示画面に、投稿した画像データが出現することになる。これにより、投稿した画像データのインプレッション、エンゲージメントを高めることができる。抽出色を示すカラータグ、拡張色を示すカラータグを生成して画像データと共にSNSサーバーに投稿するので、同じカラータグがクリックされた際、投稿された画像データはブラウザーに表示されることになる。現実物の色を正しく記憶してカラータグをクリックしたSNSユーザー、現実物の曖昧な記憶を頼りにカラータグをクリックしたSNSユーザーの双方に画像データを提示するので、インプレッション、エンゲージメントを増やすことができる。
[5]第2実施形態
第1実施形態では、オブジェクトを分離し、学習データを用いてそのオブジェクトの類型を明らかにした際、当該類型に対応する拡張色を拡張色テーブルから読み出すことで、オブジェクトの拡張色を決定した。これに対して第2実施形態では、被写体の階調をなす色に近い色を検索条件に選ぶというSNSユーザーの検索傾向に基づき、拡張色を決定する。
(5-1)拡張色の決定手順
オブジェクトの階調の広がりから拡張色を決定するため、第2実施形態では、図15に示す手順により拡張色を決定する。図15は、拡張色を決定する決定手順のフローチャートであり、図12(b)に代えて実行される。
ステップS141において、彩度ヒストグラムに示される画素の階調の広がりをD、Dの半値をr、RGB色空間における抽出色の座標を、CE=(RE、GE、BE)として、以下の数1の式を満たす色CX=(RX、GX、BX)の集合を求める(ステップS141)。
Figure 0007532927000001
図12のステップS141で決定される拡張色は図16の通りとなる。つまり、RGB色空間において、抽出色CEの座標(RE、GE、BE)を中心として半径rをなす球体601の表面上の座標、又は、球体601の内部における座標となる。
球体表面及び球体内部に位置する色集合には、オブジェクトをなす画素の色が含まれている可能性がある。かかる可能性を排除するため、ステップS142の処理を実行する。具体的にいうと、数1の式を満たし球体表面及び球体内部に位置する色集合から、オブジェクトの画素をなす色集合の集合要素を除外した差集合を求めて、かかる差集合から拡張色を決める。差集合は、例えばプログラミング言語Pythonにおいて、set型およびfrozenset型のdifferenceメソッドを利用することで作成することができる。こうして求めた拡張色をメインルーチンにリターンする(ステップS143)。
(5-2)まとめ
画素オブジェクトが現実物である被写体を撮影したものである場合、彩度ヒストグラムの広がりDは、被写体である現実物がなす階調数を示す。かかる階調数を球の径ととらえ、球の表面及び球内部に位置する色の集合から拡張色を決めるので、階調数のみを曖昧に記憶しているSNSユーザーが曖昧の記憶を頼りに色検索を実行した場合にも、投稿した画像データがヒットするようになる。
[6]第3実施形態
上記第2実施形態では、彩度ヒストグラムに示される階調の広がりと、抽出色とから拡張色を定めた。これに対し第3実施形態では、被写体を表す部位において大きな度数をなす複数の色に近い色を検索条件に選ぶというSNSユーザーの検索傾向に基づき、拡張色を決定する。
(6-1)拡張色の決定手順
オブジェクトの階調数から拡張色を決定するため、第3実施形態では、図17に示す手順により拡張色を決定する。図17は、拡張色を決定する決定手順のフローチャートであり、図12(b)に代えて実行される。
色の度数が支配的基準になる色として、第1収束色、第2収束色を求める(ステップS151)。支配的基準値とは、彩度ヒストグラムに示される最大度数に対し、所定の割合(例えば、10%)をなす値である。このように上位10%の度数を有する画素色は、オブジェクトにおいて支配的な配色をなす色であり、被写体の配色を明らかにするのに用いられる。彩度ヒストグラムに示される度数をかかる支配的基準値に収束させることで、僅かな度数の色は拡張色を決定するにあたって、度外視される。
次に第1収束色の色空間座標から、第2収束色の色空間座標に至るベクトル(p,q,r)を求め、当該ベクトル(p,q,r)と、抽出色の座標(a,b,c)とを組み合わせることで、抽出色、第1、第2収束色の座標を通る3次元直線である収束直線(R、G、B)=(a,b,c)+t(p,q,r)を求める(ステップS152)。
RGB色空間における拡張色の点Cxから収束直線に垂線を下ろした際の足Hの位置ベクトルをH=(a+pt,b+qt,c+rt)とした場合、
以下の数2のi)、ii)の要件を満たす色CXの座標(RX、GX、BX)の集合を求める(ステップS153)。
Figure 0007532927000002
上記のステップS153で決定される拡張色は図18に示す通りとなり、収束直線701を中心軸とし、半径Δdをなす円柱702の周面に存在する
円柱の周面に位置する色集合には、オブジェクトをなす画素の色が含まれている可能性がある。かかる可能性を排除するため、ステップS154の処理を実行する。具体的にいうと、i),ii)を満たし、円柱の周面に位置する色集合から、オブジェクトの画素をなす色集合の集合要素を除外した差集合を求め、かかる差集合から拡張色を決めて、メインルーチンにリターンする(ステップS155)。
半径ΔdはRGB色空間において2~5色の間隔を隔てる程度の値であり、かかる径を占める円柱体の周面を占める色集合を拡張色とするので、彩度ヒストグラムにおいて高い度数をなす色にぎりぎり近い色を表すタグを画像データに付加することができる。収束直線を中心軸とした円柱の表面を拡張色の座標とすることで、SNSユーザーが、オブジェクトの階調が正しく記憶しておらず、検索条件で間違った色を選択したとしても、投稿した画像データがヒットするようになる。
(6-2)まとめ
以上のように本実施形態によれば、ある度数に収束する色の色空間座標から3次元直線を規定して、この3次元直線を軸とする円柱の周面が占める範囲から拡張色を決めるので、オブジェクトの配色のうち、支配的とされる色に近い色を拡張色として選ぶことができる。
画像閲覧システムを利用するSNSユーザーが世界に数万人程おり、そのうち何割かが、被写体の階調変化を曖昧に記憶していて、その記憶に従い、抽出色に近い色をパレットから選択して検索を実行した場合でも、投稿した画像データがヒットするようになる。これにより、投稿した画像データのインプレッション、エンゲージメントを高めることができる。
[7]第4実施形態
第3実施形態では、色空間においてヒストグラムに示される色の座標を通過する直線との距離から拡張色を定めた。これに対し第4実施形態では、被写体を表す部位に使用されている色よりも、彩度及び/又は明度が高い色を検索条件に選ぶというSNSユーザーの検索傾向に基づき、拡張色を決定する。
(7-1)拡張色の決定
第4実施形態では、図19に示す手順により拡張色を決定する。図19は、拡張色を決定する決定手順のフローチャートであり、図12(b)に代えて実行される。
分離したオブジェクトの色(RGB値)をHSV値に変換して、HSV色空間にプロットする(ステップS161)。HSV色空間にプロットされたHSV値のうち、もっとも大きなH値を有するものの座標、もっとも大きなS値を有するものの座標、もっとも大きなV値を有するものの座標を通過する直方体をHSV色空間の内部に規定する(ステップS162)。規定される直方体は図20に示す通りとなる。オブジェクトの画素を構成するRGB値は、HSV色空間において図20に示す座標801、802、803、804~807にプロットされたとする。これらの座標のうち、座標807のH値、座標806のS値、座標805のV値がもっとも大きいので、これらを通過する直方体810が規定される。こうして規定された直方体は、分離したオブジェクトの色が、HSV色空間においてどの部分に分布しているか、つまりHSV色空間におけるオブジェクトをなす画素の色の分布域を示す。また、当該直方体の面は、明度の境界面、彩度の境界面を示す。次に、直方体の外側に位置する色の集合から、拡張色を決定する(ステップS163)。HSV色空間において、直方体の面(彩度境界面、彩度境界面)から2~5色の間隔を隔てた位置にある色の集合から拡張色を決める。これにより被写体である現実物の色の彩度、明度を強調した色を表す第2カラータグが画像データに付加されることになる。これにより明度の境界線の外側に位置する拡張色811、及び、明度及び彩度の境界線の外側に位置する拡張色812、813が決定される。以上の過程を経て拡張色を決定した後、メインルーチンにリターンする(ステップS164)。
(7-2)まとめ
画像閲覧システムを利用するSNSユーザーが世界に数万人程おり、そのうち何割かが、被写体の明度、彩度が高い部分に強い部分を印象的に記憶していて、その記憶に従い、抽出色に近い色をパレットから選択して検索を実行した場合でも、投稿した画像データがヒットするようになる。これにより、投稿した画像データのインプレッション、エンゲージメントを高めることができる。
[8]第5実施形態
第1~第4実施形態では、拡張色、抽出色のそれぞれを、別々のカラータグを用いて表した。これに対し本実施形態では、RGB色空間における拡張色の座標と、抽出色の座標との距離に応じて、抽出色、拡張色を別々のカラータグで表すか、単一のカラータグで表すかを決定する。
(8-1)処理手順
メインルーチンの変更部分を図21に示す。本実施形態では、本図に示すステップS171、S172が追加されている。ステップS171は、RGB色空間における抽出色の座標と、拡張色の座標との距離が所定の色覚閾値Dを下回るかどうかの判定である。色覚閾値Dは、同系色となる色と認識される2以上の色空間座標の間隔である。色空間座標が異なっても、人間の目は、複数の色を同じ色と認知したり、同系色と認知することがある。人間の目の色覚特性において、同一色、同系色と認知される境界的な値を色覚閾値として予め設定しておき、抽出色の座標と、拡張色の座標との距離を、かかる色覚閾値と比較する。
色間距離が色覚閾値DT以上である場合、ステップS171がNoになり、図11のステップS108を実行する。
RGB色空間における抽出色の座標と、拡張色の座標との距離が色覚閾値Dを下回る場合、ステップS171がYesになり、ステップS172を実行する。ステップS172では、抽出色、拡張色の双方を単一のカラータグで表現する。こうした単一のカラータグとしては、抽出色と、拡張色との間の中間色を示すもの、抽出色並びに拡張色を包含する色系統を示すものがある。その他、抽出色のみを示すもの、拡張色のみを示すものでもよい。
図22における拡張色及び拡張色のペア911が対象であるとする。このペア911では、抽出色の座標CEと、拡張色の座標Cxとの距離D(CE、CX)が色覚閾値DTを上回っているので、ステップS171がNoになる。この場合、第1実施形態に示したように、上記のペア911における抽出色を示す第1カラータグ、拡張色を示す第2カラータグを生成する(ステップS108)。
図22における拡張色及び拡張色のペア912が対象であるとする。拡張色及び拡張色のペア912は、抽出色の座標CEと、拡張色の座標CXとの距離D(CE、CX)が色覚閾値DT以下になるので、ステップS171がYesになる。この場合、例えば、上記のペア912における抽出色CEの座標(RE、GE、BE)と、拡張色CXの座標(RX、GX、BX)とを足し合わせて2で割り、抽出色、拡張色の中間色のRGB値を算出する(ステップS172)。このように算出されたRGB値に該当する色の色名を、画像データに付加すべきカラータグとする。
(8-2)まとめ
RGB色空間において、近接した座標に、抽出色、拡張色が位置する場合、これらを単一のタグで表現するので、投稿が可能なテキスト文字列の字数に余裕が生ずる。これにより物品の名称や形状の特徴等、付加的な特徴をタグで表現することができる。尚、抽出色、拡張色を含む連続した範囲を複数のタグで表現しようとすると、意図しない色がタグによって表現されてしまう。そうした意図しない色が表現されると、ノイズになってSNSユーザーによる検索を妨げる可能性がある。これに対し本実施形態では、距離の大小に応じて単一のタグの付加、2つのタグの付加を切り替えて行うので、そうしたノイズがタグで表現されることはない。
[9]変形例
以上、本発明を実施の形態に基づいて説明してきたが本発明は上述の実施の形態に限定されないのは勿論であり以下の変形例が考えられる。
(1)255階調のR値、255階調のG値、255階調のB値を用いてオブジェクトをなす各画素の色を表現したがこれに限られない。RGB色空間内部の部分空間の通し番号を用いて、オブジェクトをなす各画素の色を表現してもよい。図23(a)は、RGB色空間を均等分割することで得られた64個(=4×4×4)の部分空間を示す。部分空間は立方体であり、原点から近いものから順に、通し番号「1」、「2」、「3」、「4」が付加されている。
この通し番号を用いると、(135、13、3)のRGB値からなる赤黒は、図23(b)に示すように、「3」の番号で指示される。また、(255、0、0)のRGB値からなる赤は、図23(c)に示すように、「4」の番号で指示される。抽出色、拡張色がどの部分空間に属するかを判定して、その部分空間の遠し番号を記憶することで、拡張色、抽出色を保持する際のデータサイズを小さくすることができる。
(2)上記実施形態では、画像データからエッジを抽出して、被写体を含むオブジェクトを分離したがこれに限られない。同系色をなす画素が連続していて、同系色をなす画素により占有されている領域を分離することで、オブジェクトを得てもよい。具体的にいうと、図13(b)に示すように、オブジェクトの画素がなすRGB値をHSV値に変換して、同一色相からなる画素が連続する画素群を特定する。こうした色相分離を行うと、画像は赤っぽい色、緑っぽい色など、大まかな分類に従い分離される。分離された画素群は、ほぼ同一の色相をもつ画素を連ねたもので同系色をなす。そうした同系色をなす画素群を分離することで、上記エッジ抽出で得られるオブジェクトと同様のものが得られる。
彩度ヒストグラムにおいて最大度数をなす色を抽出色としたが、これは一例に過ぎない。出現度数に示される順序で、オブジェクトの画素に使用されている色の順位が、全体の10%以上等、所定の順位以上となる色を抽出色としてもよい。「リンゴは赤」と認識されているものの、実際のリンゴで多くの面積を占めている画素は赤黒で赤とは限らず、上位何割かの色を抽出した方が、対象物を表す特徴的な色が抽出される可能性があるからである。
(3)画像閲覧システムは、画像投稿サービス、動画投稿サービス、個人紹介サービス、オンラインショッピングサービス、短文投稿サービス、掲示板サービス、店舗情報提供サービス、中古物品の売買・交換サービスを実現するものでもよい。画像データと共に投稿できるテキスト文字列に字数制限があるとしたがこれに限られない。字数制限に代えて、字数制限に加えてカラータグに個数制限があるとしてもよい。
(4)上記実施形態では、MFP1000のスキャンにより得られた画像データをSNSサーバーにアップロードするとしたがこれに限られない。スマートフォン、タブレット、カメラにより撮影された画像データをSNSサーバーにアップロードしてもよい。
(5)タグ付加アプリケーション201Aは、画像処理装置2000に予めインストールされた、プリインストールタイプのアプリケーションとしたがこれに限らない。タグ付加アプリケーション201Aを可搬型記録媒体に記録して、ソフトウェアパッケージとして販売してもよいし、アプリケーション配信サーバーにアップロードして、アプリケーション配信サーバーによる配信に供してもよい。
(6)画像処理装置2000は、事業所の構内に設置されたコンピュータ機器により構成されるとしたが、クラウドサーバーとして構成してもよい。クラウドサーバーは、OSと、タグ付加アプリケーション201Aとをインストールしており、端末1011から要求があると、ゲストOSを起動し、かかるゲストOS上でタグ付加アプリケーション201Aを起動することで、上記実施形態に示した処理を行う。画像処理装置2000は、MFP1000と独立した機器としたがこれに限られない。MFP1000と、画像処理装置2000とを一体の機器としてもよい。また画像処理装置2000は、タグ付与及び画像データのアップロードを行うとしたがこれに限られない。タグ付与のみを行い、画像データのアップロードを他の機器に実行させてもよい。
タグ付加アプリケーション201Aを、SNSユーザーが操作する端末1011~1014にインストールして利用してもよい。SNSユーザーが画像投稿を行うことは往々に存在するからである。また、タグ付加アプリケーション201AをSNSサーバーに設けてもよい。
(7)第2実施形態、第3実施形態では、差集合を求めて差集合の中から拡張色を決定したがこれに限られない。オブジェクトをなす画素の色として使用されているものの、抽出色として抽出されたなかったものが第2実施形態の球体の表面又は内部に存在する場合、かかる色を拡張色として決定してもよい。同様に、オブジェクトをなす画素の色として使用されているものの、抽出色として抽出されたなかったものが第3実施形態の円筒の周面に存在する場合、かかる色を拡張色として決定してもよい。
また、画素オブジェクトの類型から定まる拡張色を示すタグ、画素オブジェクトの階調数から定まる拡張色を示すタグ、第1収束色、第2収束色から定まる拡張色を示すタグ、彩度・明度の飽和させた値から定まる拡張色を示すタグを画像データに付加するとしてもよい。画像データに現れている画素オブジェクトの多面的な色表現が可能になるので、スキャナー1004により読み取った画像データをSNSサーバー3000にアップロードする場合のインプレッションを高めることができる。
(8)色見本データにおける各色の欄にHSV値を記述してもよい。RGB値からHSV値への変換が簡単になるという利点がある。また、変換式を不揮発メモリ204に格納しておき、かかる変換式に基づき、RGB値からHSV値への変換を実行してもよい。
(9)各実施形態では、色名、色コードをカラータグとしたがこれに限られない。色の名前を含む名詞句、形容詞句、副詞句を示すテキスト文字列にハッシュマーク「#」を付したタグを生成してもよい。例えば、「#赤みを帯びた」、「#赤い」、「#赤く」、「#赤っぽい」等のテキスト文字列を色見本データ、拡張色テーブルに記載しておき、これらのテキスト文字列と、ハッシュマークとからなるハッシュタグを画像データに付加してもよい。またカラータグにおける色名は日本語としたがこれに限られない。色見本データ、拡張色テーブルにおいて、英語、中国語、ロシア語、フランス語、スペイン語、アラビア語等の複数言語の色名を記載することで、抽出色、拡張色を複数言語のカラータグで表現するとしてもよい。また、投稿者から言語選択を受け付け、その選択された言語のカラータグを画像データに付加するとしてもよい。
本開示は、SNSサーバーを利用して情報発信を行う様々な業種の産業分野に利用でき、OA機器、情報機器の産業分野を始め、小売業、古物商、賃貸業、不動産業、広告業、運輸業、出版業等、様々な業種の産業分野で利用される可能性がある
1 画像閲覧システム
201 ストレージ
201A タグ付加アプリケーション
201S OS
202 RAM
203 CPU
204 不揮発メモリ
205 NIC
206 周辺ポート
1000 MFP
1011~1014 端末
2000 画像処理装置
2001 ディスプレイデバイス
2002 キャラクターデバイス
2003 ポインティングデバイス
3000 SNSサーバー
3001 ストレージ
3002 検索エンジン

Claims (19)

  1. 画像閲覧サービスにおける画像データの検索を支援する画像処理装置であって、
    対象物を表すとされる部位を、画像データから認識する認識手段と、
    認識された部位をなす画素で使用されている色を抽出する抽出手段と、
    前記部位からは抽出されなかったものの、サービス利用者が検索に用いる可能性がある色を、当該サービス利用者が検索を行う際の検索傾向に基づき決定する決定手段と、
    前記抽出手段により抽出された色を示す第1タグ、及び、前記決定手段により決定された色を示す第2タグを生成して、検索用タグとして画像データに付加する付加手段と
    を備えることを特徴とする画像処理装置。
  2. 前記抽出手段により抽出される色は、前記対象物をなす部位の画素において出現度数が最も高い色、又は、当該出現度数に示される順序に複数の色を並べた際の順位が、所定の順位以上となる色である
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記サービス利用者の検索傾向とは、対象物の色として認知されているものを検索条件に選ぶ傾向であり、
    前記決定手段は、参照テーブルを有し、前記参照テーブルは、現実物の複数の類型のそれぞれを表す色として一般的に認知されている色を示し、
    判別された対象物の類型に対応する色として、前記参照テーブルに記載されたものを、前記サービス利用者が検索に用いる可能性がある色とする
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記サービス利用者の検索傾向とは、対象物の階調をなす色に近い色を検索条件に選ぶ傾向であり、
    前記決定手段は、
    前記抽出手段により抽出された色の色空間座標を中心座標とし、前記部位の階調を径とした範囲を占める球の表面及び内部に位置する色からなる色の集合を生成し、
    前記検索に用いられる可能性がある色は、生成された色の集合に含まれる色である
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  5. 前記サービス利用者の検索傾向とは、対象物を表す部位において度数分布をなす色に近い色を検索条件に選ぶ傾向であり、
    前記決定手段は、前記度数分布における度数が所定値に収束する際の収束点となる第1収束色、第2収束色を求める処理(1)、
    前記抽出手段により抽出された色の色空間座標、第1収束点の色空間座標、第2収束点の色空間座標を通過する3次元直線を中心軸とし、所定のオフセットを径とした円柱体の表面に位置する色の集合を生成する処理(2)を実行し、
    前記検索に用いられる可能性がある色は、生成された色の集合に含まれる色である
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  6. 前記サービス利用者の検索傾向とは、対象物を表す部位に使用されている色よりも、彩度及び/又は明度が高い色を検索条件に選ぶ傾向であり、
    前記決定手段は、HSV色空間において、認識された部位をなす画素で使用されている色が分布している部分空間を規定する処理(1)、
    前記HSV色空間において、前記部分空間の外側で、彩度又は明度が大きくなる場所に位置する色の集合を生成する処理(2)を含み、
    前記検索に用いられる可能性がある色は、前記色の集合に含まれる色である
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  7. 前記付加手段が、第1タグ、及び、第2タグを生成するのは、前記抽出手段により抽出された色の色空間座標と、決定手段が決定した色の色空間座標との距離が所定の閾値を上回る場合である
    ことを特徴とする請求項1~6の何れかに記載の画像処理装置。
  8. 前記抽出手段により抽出された色の色空間座標と、決定手段が決定した色の色空間座標との距離が所定の閾値を下回る場合、前記付加手段は、前記画像データに付加すべき単一のタグを生成し、
    前記単一のタグは、抽出手段により抽出された色と、決定手段により決定された色との中間色、抽出手段により抽出された色並びに決定手段により決定された色を包含する色群、抽出手段により抽出された色そのもの、決定手段により決定された色そのものの何れかを示す
    ことを特徴とする請求項7に記載の画像処理装置。
  9. 前記認識手段は、画像データが現実物を撮影又は描写したものかどうかの判定を行い、前記決定手段が、前記検索に用いられる可能性がある色を決定するのは、画像データが、現実物を撮影又は描写したものと判定された場合である
    ことを特徴とする請求項1~7の何れかに記載の画像処理装置。
  10. 前記色の度数を示すヒストグラムが、所定幅以上の広がりを有しているかどうかの判定を行い、所定幅以上の広がりを有している場合、前記認識手段は、前記画像データにおける一の部位が、現実物を撮影又は描写したものとの判定結果を下す
    ことを特徴とする請求項9に記載の画像処理装置。
  11. 前記認識手段は、現実物の複数の類型のそれぞれに対応する学習データを含み、学習データは、対応する類型の現実物を表す特徴量の点群と、対応する類型の現実物を表さない特徴量の点群とを区切る分離面を規定するデータであり、
    画像データにおいて対象物を表すとされる部位から特徴量を算出して、特徴量を各類型に対応する学習データに適用することで、前記認識手段は、前記画像データにおける一の部位が、現実物を撮影又は描写したものかどうかの判定結果を下す
    ことを特徴とする請求項9に記載の画像処理装置。
  12. 前記認識手段は、画像データをなす画素のうち、エッジとなる画素を抽出する処理を行い、
    前記対象物を表す部位は、エッジとなる画素により囲まれる一群の画素からなる
    ことを特徴とする請求項1~11の何れかに記載の画像処理装置。
  13. 前記認識手段は、同系色をなす画素が占有している領域を、画像データから分離する処理を行い、
    前記対象物を表す部位は、同系色をなすとして分離された領域の画素から構成される
    ことを特徴とする請求項1~11の何れかに記載の画像処理装置。
  14. 前記対象物をなす画素の色は、Rの値、Gの値、Bの値で表され、
    前記Rの値、Gの値、Bの値は、
    RGB色空間を均等に分割することで得られる部分空間のうち、どれに属するかを示す
    ことを特徴とする請求項1~13の何れかに記載の画像処理装置。
  15. 端末が定めた検索条件に基づきサーバーが検索を実行する画像閲覧システムであって、
    対象物を表すとされる部位を、画像データから認識し、
    認識された部位をなす画素で使用されている色を抽出し、
    前記部位からは抽出されなかったものの、サービス利用者が検索に用いる可能性がある色を、当該サービス利用者が検索を行う際の検索傾向に基づき決定して、
    抽出された色を示す第1タグ、及び、決定された色を示す第2タグを生成して、検索用タグとして画像データに付加する
    ことを特徴とする画像閲覧システム。
  16. 前記端末は、パレットを表示して、パレットから検索条件となる色の選択をサービス利用者から受け付け、
    検索条件に合致する第1タグが付加された画像データ、及び/又は、検索条件に合致する第2タグが付加された画像データを含む検索結果画面を端末に表示させる
    ことを特徴とする請求項15に記載の画像閲覧システム。
  17. 前記第1タグは第1ハッシュタグ、前記第2タグは第2ハッシュタグであり、
    第1ハッシュタグ及び/又は第2ハッシュタグを含む一覧画面が端末に表示されている状態で、サービス利用者が当該ハッシュタグを選択すると、同じ第1ハッシュタグ及び/又は第2ハッシュタグが付加された他の画像データを端末に表示させる
    ことを特徴とする請求項16に記載の画像閲覧システム。
  18. 画像閲覧サービスにおける画像データの検索を支援する処理をコンピュータに実行させる画像処理プログラムであって、
    対象物を表すとされる部位を、画像データから認識する認識ステップと、
    認識された部位をなす画素で使用されている色を抽出する抽出ステップと、
    前記部位からは抽出されなかったものの、サービス利用者が検索に用いる可能性がある色を、当該サービス利用者が検索を行う際の検索傾向に基づき決定する決定ステップと、
    前記抽出ステップにより抽出された色を示す第1タグ、及び、前記決定ステップにより決定された色を示す第2タグを生成して、検索用タグとして画像データに付加する付加ステップと
    をコンピュータに実行させることを特徴とする画像処理プログラム。
  19. 画像閲覧サービスにおける画像データの検索を支援する画像処理方法であって、
    対象物を表すとされる部位を、画像データから認識する認識ステップと、
    認識された部位をなす画素で使用されている色を抽出する抽出ステップと、
    前記部位からは抽出されなかったものの、サービス利用者が検索に用いる可能性がある色を、当該サービス利用者が検索を行う際の検索傾向に基づき決定する決定ステップと、
    前記抽出ステップにより抽出された色を示す第1タグ、及び、前記決定ステップにより決定された色を示す第2タグを生成して、検索用タグとして画像データに付加する付加ステップと
    を含む画像処理方法。
JP2020101752A 2020-06-11 2020-06-11 画像処理装置、画像閲覧システム、画像処理プログラム、画像処理方法 Active JP7532927B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020101752A JP7532927B2 (ja) 2020-06-11 2020-06-11 画像処理装置、画像閲覧システム、画像処理プログラム、画像処理方法
US17/326,853 US20220019617A1 (en) 2020-06-11 2021-05-21 Image processing device, image viewing system, image processing program, and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020101752A JP7532927B2 (ja) 2020-06-11 2020-06-11 画像処理装置、画像閲覧システム、画像処理プログラム、画像処理方法

Publications (2)

Publication Number Publication Date
JP2021196761A JP2021196761A (ja) 2021-12-27
JP7532927B2 true JP7532927B2 (ja) 2024-08-14

Family

ID=79195599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020101752A Active JP7532927B2 (ja) 2020-06-11 2020-06-11 画像処理装置、画像閲覧システム、画像処理プログラム、画像処理方法

Country Status (2)

Country Link
US (1) US20220019617A1 (ja)
JP (1) JP7532927B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002197117A (ja) 2000-10-30 2002-07-12 Microsoft Corp イメージ検索システムおよびその方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002197117A (ja) 2000-10-30 2002-07-12 Microsoft Corp イメージ検索システムおよびその方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
長谷川修 外1名,一般道路映像中の移動物体の識別・色の推定と特定対象の検出,情報処理学会論文誌,日本,社団法人情報処理学会,2003年07月15日,第44巻 第7号,pp.1795~1807

Also Published As

Publication number Publication date
JP2021196761A (ja) 2021-12-27
US20220019617A1 (en) 2022-01-20

Similar Documents

Publication Publication Date Title
JP5259894B1 (ja) 色名決定装置、色名決定方法、情報記録媒体、ならびに、プログラム
JP5259893B1 (ja) 色決定装置、色決定システム、色決定方法、情報記録媒体、ならびに、プログラム
US8988450B1 (en) Color palette maps for color-aware search
US9082047B2 (en) Learning beautiful and ugly visual attributes
US9430719B2 (en) System and method for providing objectified image renderings using recognition information from images
US8369616B2 (en) Chromatic matching game
US8775424B2 (en) System for creative image navigation and exploration
US8649572B2 (en) System and method for enabling the use of captured images through recognition
US8837820B2 (en) Image selection based on photographic style
US7809192B2 (en) System and method for recognizing objects from images and identifying relevancy amongst images and information
US8587604B1 (en) Interactive color palettes for color-aware search
WO2023051063A1 (zh) 一种信息展示方法、装置、计算机设备及存储介质
Chu et al. Image Retrieval Based on a Multi‐Integration Features Model
EP1889207A2 (en) System and method for enabling the use of captured images through recognition
Shete et al. TasselGAN: An application of the generative adversarial model for creating field-based maize tassel data
US20170277675A1 (en) Information processing apparatus and non-transitory computer readable medium
RU2603495C1 (ru) Классификация изображений документов на основе параметров цветовых слоев
WO2021129289A9 (zh) 图像处理方法、装置、电子设备以及存储介质
JP7532927B2 (ja) 画像処理装置、画像閲覧システム、画像処理プログラム、画像処理方法
US9767579B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
Gavilan Ruiz et al. Image categorization using color blobs in a mobile environment
JP6805626B2 (ja) 情報処理装置及びプログラム
US20240330407A1 (en) Systems, methods, and storage media for training a model for image evaluation
da Gama Antunes Omeco: Generating Personalized Business Card Designs From Images
Gao Advances in automatic layout design based on generative adversarial networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240715

R150 Certificate of patent or registration of utility model

Ref document number: 7532927

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150