JP2019049898A - 画像マップ作成装置、表示装置及びプログラム - Google Patents

画像マップ作成装置、表示装置及びプログラム Download PDF

Info

Publication number
JP2019049898A
JP2019049898A JP2017174205A JP2017174205A JP2019049898A JP 2019049898 A JP2019049898 A JP 2019049898A JP 2017174205 A JP2017174205 A JP 2017174205A JP 2017174205 A JP2017174205 A JP 2017174205A JP 2019049898 A JP2019049898 A JP 2019049898A
Authority
JP
Japan
Prior art keywords
image
map
word
classification
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017174205A
Other languages
English (en)
Other versions
JP6891744B2 (ja
Inventor
伊藤 直之
Naoyuki Ito
直之 伊藤
拓也 生駒
Takuya Ikoma
拓也 生駒
ジュリアン ピアテック
Peertech Julianne
ジュリアン ピアテック
錬 松山
Ren Matsuyama
錬 松山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2017174205A priority Critical patent/JP6891744B2/ja
Publication of JP2019049898A publication Critical patent/JP2019049898A/ja
Application granted granted Critical
Publication of JP6891744B2 publication Critical patent/JP6891744B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ユーザが所望する目的に最適な画像を探し出すための画像マップ作成装置、表示装置及びプログラムを提供する。【解決手段】画像マップ作成装置1は、画像を解析して複数の単語を抽出する単語抽出部12と、単語抽出部12により抽出した複数の単語をクラスタリングして分類語を生成する分類語生成部14と、分類語生成部14によって生成した分類語をカウントすることによりマップ80を作成するマップ作成部15と、を備える。【選択図】図2

Description

本発明は、画像マップ作成装置、表示装置及びプログラムに関する。
多数のデータからユーザが所望する目的に最適なデータを探し出すことは、容易ではない。そこで、従来、多数のデータから目的に最適なデータを探すことができるように、全体の俯瞰的な位置づけを把握可能なデータのマップを作成する技術が開示されている(例えば、特許文献1)。
特開2008−84151号公報
ところで、多数のデータからユーザが所望する目的に最適なデータを探し出すニーズは、文書データに限らない。例えば、多数の画像データからユーザが所望する目的に最適な画像データを探し出したいニーズがある。
そこで、本発明は、ユーザが所望する目的に最適な画像を探し出すための画像マップ作成装置、表示装置及びプログラムを提供することを目的とする。
本発明は、以下のような解決手段により、前記課題を解決する。
第1の発明は、画像を解析して複数の単語を抽出する単語抽出手段と、前記単語抽出手段により抽出した複数の単語をクラスタリングして分類語を生成する分類語生成手段と、前記分類語生成手段によって生成された分類語をカウントすることによりマップを作成するマップ作成手段と、を備える画像マップ作成装置である。
第2の発明は、第1の発明の画像マップ作成装置において、前記単語抽出手段により抽出した複数の単語を、複数のグループに分ける分類手段を備え、前記分類語生成手段は、前記分類手段により分けられた各グループの単語をクラスタリングして分類語を生成し、前記マップ作成手段は、前記分類手段により分けられた前記複数のグループうち少なくとも2つのグループの各分類語によって分類された前記マップを作成すること、を特徴とする画像マップ作成装置である。
第3の発明は、第1の発明又は第2の発明の画像マップ作成装置において、前記分類語生成手段は、前記単語抽出手段により抽出した複数の単語から、上位概念にあたる語を前記分類語として生成すること、を特徴とする画像マップ作成装置である。
第4の発明は、第1の発明から第3の発明までのいずれかの画像マップ作成装置において、前記分類語生成手段は、前記単語抽出手段により抽出した複数の単語の出現頻度に基づいて、前記分類語を生成すること、を特徴とする画像マップ作成装置である。
第5の発明は、第1の発明から第3の発明までのいずれかの画像マップ作成装置において、画像を解析して前記画像の特徴を表す複数の特徴画像を抽出し、前記画像の領域に対して抽出した前記特徴画像の占める割合を算出する画像割合算出手段を備え、前記単語抽出手段は、前記特徴画像の特徴を表す単語を抽出し、前記分類語生成手段は、前記画像割合算出手段により算出した割合に応じて、前記単語抽出手段により抽出した単語から前記分類語を生成すること、を特徴とする画像マップ作成装置である。
第6の発明は、第1の発明から第5の発明までのいずれかの画像マップ作成装置において、前記単語抽出手段は、前記画像の特徴ごとに関連付いた単語を参照して説明文を生成し、生成した説明文から複数の単語を抽出すること、を特徴とする画像マップ作成装置である。
第7の発明は、第1の発明から第6の発明までのいずれかの画像マップ作成装置において、前記分類語生成手段は、複数の画像の各々から前記単語抽出手段により抽出された複数の単語をクラスタリングして分類語を生成すること、を特徴とする画像マップ作成装置である。
第8の発明は、第1の発明から第7の発明までのいずれかの画像マップ作成装置に対して通信可能に接続された表示装置であって、前記マップ作成手段により作成された前記マップを出力するマップ出力手段と、前記マップ出力手段により出力された前記マップに示され、前記分類語に対応付けられた要素の選択を受け付ける要素受付手段と、前記要素受付手段により受け付けた前記要素に対応する画像を出力する画像出力手段と、を備えること、を特徴とする表示装置である。
第9の発明は、第8の発明の表示装置において、前記画像出力手段は、前記要素受付手段により受け付けた前記要素に対応する画像が複数ある場合に、複数の前記画像の類似度に応じて各画像を配置して、前記複数の画像を関連画像として出力すること、を特徴とする表示装置である。
第10の発明は、第9の発明の表示装置において、前記類似度は、各画像の特徴量と、各画像に対応した単語との少なくとも一方に基づいて算出されるものであること、を特徴とする表示装置である。
第11の発明は、第9の発明又は第10の発明の表示装置において、前記関連画像は、類似度を、画像間の線の長さ若しくは太さ、又は、基準にした画像からの奥行方向の距離によって表したものであること、を特徴とする表示装置である。
第12の発明は、第1の発明から第7の発明までのいずれかの画像マップ作成装置としてコンピュータを機能させるためのプログラムである。
第13の発明は、第8の発明から第11の発明までのいずれかの表示装置としてコンピュータを機能させるためのプログラムである。
本発明によれば、ユーザが所望する目的に最適な画像を探し出すための画像マップ作成装置、表示装置及びプログラムを提供することができる。
本実施形態に係る画像マップ出力システムの全体概要図である。 本実施形態に係る画像マップ作成装置及び表示装置の機能ブロック図である。 本実施形態に係る画像マップ作成装置で作成されるマップの例を示す図である。 本実施形態に係る画像マップ出力システムのマップ出力処理を示すフローチャートである。 本実施形態に係る表示装置での表示例を示す図である。 本実施形態に係る画像マップ作成装置のマップ作成処理を示すフローチャートである。 本実施形態に係る画像マップ作成装置によるマップ作成処理での具体例を示す図である。 本実施形態に係る画像マップ作成装置によるマップ作成処理での具体例を示す図である。 本実施形態に係る画像マップ出力システムの関連画像出力処理を示すフローチャートである。 本実施形態に係る画像マップ作成装置の関連画像生成処理を示すフローチャートである。 本実施形態に係る表示装置での表示例を示す図である。
以下、本発明を実施するための形態について、図を参照しながら説明する。なお、これは、あくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
(実施形態)
<画像マップ出力システム100>
図1は、本実施形態に係る画像マップ出力システム100の全体概要図である。
図2は、本実施形態に係る画像マップ作成装置1及び表示装置4の機能ブロック図である。
図3は、本実施形態に係る画像マップ作成装置1で作成されるマップ80の例を示す図である。
図1に示す画像マップ出力システム100は、画像DB(データベース)3に記憶された画像データを、画像の特徴に基づく分類語によって分類し、画像の分類を可視化したマップを作成するためのシステムである。また、画像マップ出力システム100は、マップを構成する、画像データの集合を表す要素のうち1つの選択を受け付けた場合に、選択された要素に含まれる画像データを出力する。
以下の説明において、画像DB3に記憶される画像データは、例えば、美術館や博物館等で展示されている絵画等を、画像データ化したものであるとする。そして、画像データは、例えば、その画像を保有する美術館等を識別するための美術館ID(IDentification)を含むデータを、メタデータとして有するものとする。
一例として、画像マップ出力システム100では、美術館や博物館で保有する絵画に関するマップを、美術館や博物館ごとに作成するものを説明する。
画像マップ出力システム100は、画像マップ作成装置1と、画像DB3と、表示装置4とを備える。画像マップ作成装置1と、画像DB3と、表示装置4とは、通信ネットワークNを介して通信可能に接続されている。通信ネットワークNは、例えば、インターネット回線等であり、有線であるか無線であるかを問わない。
<画像マップ作成装置1>
画像マップ作成装置1は、画像DB3に記憶された画像データを用いる。画像マップ作成装置1は、画像データが示す画像を解析して、画像の内容を表す複数の単語を抽出する。画像マップ作成装置1は、抽出した複数の単語を、画像データに関連付けて、画像DB3に記憶させてもよい。そして、画像マップ作成装置1は、抽出した複数の単語から、例えば、上位概念にあたる語を生成して、生成した語を、マップで用いる分類語にし、分類語を用いた、例えば、バブルチャートで表されたマップを作成する。
画像マップ作成装置1は、例えば、サーバである。画像マップ作成装置1は、その他、パーソナルコンピュータ(PC)等であってもよい。
図2(A)に示すように、画像マップ作成装置1は、制御部10と、記憶部20と、通信インタフェース部29とを備える。
制御部10は、画像マップ作成装置1の全体を制御する中央処理装置(CPU)である。制御部10は、記憶部20に記憶されているオペレーティングシステム(OS)やアプリケーションプログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、各種機能を実行する。
制御部10は、画像受付部11と、単語抽出部12(単語抽出手段)と、分類部13(分類手段)と、分類語生成部14(分類語生成手段)と、マップ作成部15(マップ作成手段)と、マップ登録部16と、関連画像生成部17とを備える。
画像受付部11は、マップの作成対象になる画像データを受け付ける。画像受付部11は、例えば、画像データのメタデータに有する美術館IDに基づいて、画像DB3に記憶された、対象の美術館が保有する絵画の画像データを受け付ける。
単語抽出部12は、受け付けた画像データの内容を表す単語を抽出する。
単語抽出部12は、例えば、公知の説明文生成ソフトウェアである“DenseCap”を使用して、画像データに関する説明文を生成する。“DenseCap”を使用する場合、単語抽出部12により生成した説明文は、英語で記載されている。なお、単語抽出部12は、“DenseCap”の代わりに、公知の説明文生成ソフトウェアである“NeuralTalk2”等を用いてもよい。但し、説明文を複数生成する“DenseCap”の方が、画像内を複数領域に分けて、各領域の説明文を生成するため、画像に関する説明文から多くの単語を得ることができる。
次に、説明文が英語で記載されている場合、単語抽出部12は、英文の説明文を、日本語に翻訳する。単語抽出部12は、例えば、公知の自動翻訳のソフトウェアを用いて、説明文を翻訳することができる。なお、その他として、単語抽出部12は、通信ネットワークNを介して接続された翻訳のウェブサービスを行うサーバ(図示せず)に対して通信をして、英語から日本語に翻訳してもよい。
なお、“DenseCap”や“NeuralTalk2”の場合、説明文の生成にあたって、現在の画像データを使用して学習した学習器を用いている。そのため、“DenseCap”等は、学習結果として、画像データから現在においてありふれた物を用いた説明文を生成する。他方、美術館や博物館等の絵画の画像データは、古い時代の絵画の画像データを含むため、“DenseCap”等では、誤変換が生じる場合がある。例えば、人物が手に持っている聖書を、現在においてありふれた物であるタブレットに、誤って変換する場合がある。よって、その場合には、生成された説明文に含まれるタブレットを、聖書に置き換えたり、絵画がモチーフとしている時代にはない物の説明については、削除したりする必要がある。
その後、単語抽出部12は、説明文から複数の単語を抽出する。具体的には、単語抽出部12は、例えば、説明文に対して形態素解析を行うことによって、説明文から複数の単語を抽出する。ここで、単語抽出部12が抽出する単語としては、名詞、形容詞、動詞等がある。
なお、上述では、“DenseCap”を用いた説明文の生成及び単語の抽出を説明したが、これに限定するものではない。
分類部13は、マップを作成する対象である複数の画像データから抽出した単語を、複数のグループに分ける。ここで、マップを作成する対象である複数の画像データは、例えば、対象の美術館が保有する複数の絵画の画像データである。
分類部13は、例えば、マップを作成する対象である複数の画像データに基づいて取得した処理対象の単語から、品詞によってフィルタリングすることで、名詞、形容詞、動詞等のグループに分けることができる。
なお、分類部13は、「彼」や「これ」等の代名詞や、「側」や「製」等の接尾名詞、「中」や「一部」等の副詞可能名詞等を除外するようにしてもよい。また、分類部13による分類は、品詞によるものに限定されない。一例として、分類部13による分類は、予め決められたカテゴリ(ジャンル)によるものであってもよい。
分類語生成部14は、処理対象の単語をクラスタリングして、分類語を生成する。
分類語生成部14は、例えば、処理対象の単語を上位概念化して、分類語にする。一例として、単語抽出部12によって「少女」、「男性」という単語が抽出された場合、分類語生成部14は、「少女」、「男性」に共通した上位概念の語である「人」を、分類語として生成してもよい。
また、分類語生成部14は、処理対象の単語の出現頻度に基づいて、出現頻度の高い単語を、分類語にしてもよい。具体的には、出現した単語と、出現数とを対応付けて記憶した上で、分類語生成部14は、出現数が多い方から上位n個(nは1以上の整数)の単語や、ある閾値以上の出現数の単語を、分類語として取得してもよい。
さらに、分類語生成部14は、処理対象の単語の出現頻度の高い単語から、上位概念化する単語を選択して、上位概念の語を分類語にしてもよい。
さらにまた、分類語生成部14は、処理対象の単語が分類部13によって分類された場合には、分類されたグループごとにクラスタリングをして分類語を生成してもよい。
その他、分類語生成部14は、単語の意味の類似性に基づいてクラスタリングして、分類語を生成してもよい。
マップ作成部15は、分類部13によりグループ分けがされた各グループを軸にして分類語を並べ、分類語に対応する位置に、対応する各画像データの数をカウントして円領域(要素)の大きさで表したバブルチャートであるマップ80を作成する。
ここで、マップ作成部15は、分類語に対応する位置が、複数の分類語を含む場合、つまり2軸以上の場合に、全ての分類語を含む説明文があるか否かを、各画像データについて判断する。そして、マップ作成部15は、全ての分類語を含む説明文がある場合に、その画像データの画像IDを、対応する円領域の要素IDに関連付ける。ここで、画像IDは、画像データを識別するための識別情報である。また、要素IDは、マップ80に含まれる円領域を識別するための識別情報である。
図3は、分類部13によるグループ分けから2つのグループを選んだ場合のマップ80の例を示す。マップ80は、縦軸をクラスタ代表語とし、横軸を形容詞として、縦軸と横軸との交わる位置に、両方の分類語で分類される画像データの数を、円領域の大きさで表して配置した2次元マトリックスでの表示態様である。
ここで、1つの画像データに対して、複数の分類語が対応する場合、複数の円領域に、ある1つの画像データを含んでもよい。例えば、ある画像データに、「丸くて赤い果物」の説明文が含まれる場合、その画像データは、分類語として、「丸い」「果物」と、「赤い」「果物」とを含む。よって、「丸い」と「果物」とが交差する位置の円領域と、「赤い」と「果物」とが交差する位置の円領域との両方に、この画像データが含まれる。
図2(A)に戻り、マップ登録部16は、マップ作成部15により作成されたマップ80を、マップ記憶部22に記憶させる。また、マップ登録部16は、マップ80を構成する画像データの画像IDを、円領域を表す要素IDに対応付けて、マップ記憶部22に記憶させる。
関連画像生成部17は、マップ80に含まれる円領域に関連付けられた画像データを、類似度に基づいて配置した、関連画像データを生成する。
ここで、類似度は、円領域に関連付けられた複数の画像データの中から2つの画像データの組合せを選択し、選択した各組合せの画像データの類似度合いを表す。
類似度は、2つの画像データの特徴量に基づいて算出してもよい。特徴量としては、例えば、2つの画像データを構成する色調の類似度合い等である。また、類似度は、2つの画像データに対応した単語の一致度合いや、類似度合いであってもよい。そして、類似度は、その度合いが高いほど、2つの画像データが似ていることを示す。
関連画像生成部17は、より具体的には、円領域に関連付けられた複数の画像データを含み、算出した類似度を、2つの画像データを結ぶ線の長さや、線の太さによって表した関連画像データを生成する。なお、関連画像データは、2つの画像データの類似度が閾値以上である場合に、2つの画像データを線で結ぶようにしてもよい。その他、関連画像データは、類似度を、基準にした画像からの奥行方向の距離によって表してもよい。
記憶部20は、制御部10が各種の処理を実行するために必要なプログラム、データ等を記憶するためのハードディスク、半導体メモリ素子等の記憶領域である。
記憶部20は、プログラム記憶部21と、マップ記憶部22とを備える。
プログラム記憶部21は、各種のプログラムを記憶する記憶領域である。プログラム記憶部21は、上述した公知の説明文生成ソフトウェアや、公知の自動翻訳ソフトウェアの他、マップ作成プログラム21aを記憶している。マップ作成プログラム21aは、画像マップ作成装置1の制御部10が実行する各種機能を行うためのプログラムである。なお、マップ作成プログラム21aは、公知の説明文生成ソフトウェアや、公知の自動翻訳ソフトウェアを含むものであってもよい。
マップ記憶部22は、マップ作成部15によって作成されたマップ80のデータを記憶する記憶領域である。
マップ記憶部22は、マップ80のデータの他、マップ80を構成する円領域ごとに、円領域に含まれる各画像の画像IDを記憶する。
通信インタフェース部29は、通信ネットワークNを介して画像DB3や、表示装置4との間の通信を行うためのインタフェースである。
<画像DB3>
図1に示す画像DB3は、ハードディスク、半導体メモリ素子等の記憶領域を有する、例えば、画像のデータベースサーバである。画像DB3は、画像IDに対応付けて、画像データを記憶する。画像DB3は、この例では、美術館ごとに、画像データを、物理的に又は論理的に分けて記憶してもよい。また、画像DB3は、図示しない他の端末等から画像データを受信して記憶してもよい。なお、画像DB3は、図示しないが、制御部、記憶部、通信インタフェース部等を備える。
<表示装置4>
表示装置4は、例えば、タブレットに代表されるコンピュータの機能を併せ持った携帯型の装置である。表示装置4は、その他、スマートフォンや携帯電話機等でもよいし、PC等であってもよい。
表示装置4は、ユーザが所望する画像のマップ80を表示させる。また、表示装置4は、表示されたマップ80の要素を受け付け、要素に対応した画像データを、画像DB3から抽出して表示させる。
図2(B)に示すように、表示装置4は、制御部40と、記憶部50と、タッチパネルディスプレイ57と、通信インタフェース部59とを備える。
制御部40は、表示装置4の全体を制御するCPUである。制御部40は、記憶部50に記憶されているOSやアプリケーションプログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、各種機能を実行する。
制御部40は、マップ出力部41(マップ出力手段)と、要素受付部42(要素受付手段)と、画像出力部43(画像出力手段)とを備える。
マップ出力部41は、画像マップ作成装置1のマップ作成部15により作成され、又は、画像マップ作成装置1のマップ登録部16によりマップ記憶部22に登録されたマップ80のデータを、タッチパネルディスプレイ57に出力する。これにより、表示装置4のユーザは、タッチパネルディスプレイ57に表示されたマップ80を視認できる。
要素受付部42は、マップ80が表示されている画面において、ユーザにより選択された1つの円領域を受け付ける。
画像出力部43は、画像マップ作成装置1の関連画像生成部17により生成された、受け付けた円領域に対応する関連画像データを、タッチパネルディスプレイ57に出力する。
記憶部50は、制御部40が各種の処理を実行するために必要なプログラム、データ等を記憶するための半導体メモリ素子等の記憶領域である。記憶部50は、プログラム記憶部51を備える。
プログラム記憶部51は、各種のプログラムを記憶する記憶領域である。プログラム記憶部51は、画像表示プログラム51aを記憶している。画像表示プログラム51aは、制御部40が実行する各種機能を行うためのプログラムである。
タッチパネルディスプレイ57は、液晶パネル等で構成される表示部としての機能と、ユーザからの指等によるタッチ入力を検出する入力部としての機能とを有する。
通信インタフェース部59は、通信ネットワークNを介して画像マップ作成装置1等との間で通信を行うためのインタフェースである。
ここで、コンピュータとは、制御部、記憶装置等を備えた情報処理装置をいい、画像マップ作成装置1及び表示装置4は、各々制御部、記憶部等を備えた情報処理装置であり、コンピュータの概念に含まれる。
<画像マップ出力システム100の処理>
次に、表示装置4にマップ80を表示させる処理について説明する。
図4は、本実施形態に係る画像マップ出力システムのマップ出力処理を示すフローチャートである。
図5は、本実施形態に係る表示装置4での表示例を示す図である。
図6は、本実施形態に係る画像マップ作成装置1のマップ作成処理を示すフローチャートである。
図7及び図8は、本実施形態に係る画像マップ作成装置1によるマップ作成処理での具体例を示す図である。
図4のステップS(以下、単に「S」という。)10において、表示装置4の制御部40は、画像表示プログラム51aを実行する。そして、制御部40は、表示装置4のタッチパネルディスプレイ57に、美術館選択画面70を出力する。
図5(A)に、美術館選択画面70の一例を示す。制御部40は、画像表示プログラム51aを実行した後に、画像マップ作成装置1に対して問合せを行って、画像マップ作成装置1が送信した美術館選択画面70を出力してもよい。また、制御部40は、画像表示プログラム51aに予め用意された美術館選択画面70を出力してもよい。
表示装置4のユーザは、マップを表示させたい対象の美術館名の左横のチェックボックスにチェックを入れて、実行ボタンを選択する。そうすることで、S11において、制御部40は、美術館名の選択を受け付けて、画像マップ作成装置1にその美術館の美術館IDを送信する。制御部40は、美術館ID以外の美術館を特定可能なデータを送信しても、もちろんよい。
S12において、画像マップ作成装置1の制御部10は、美術館IDを受信する。
S13において、制御部10は、マップ作成処理を行う。
ここで、マップ作成処理について、図6に基づき説明する。
図6のS20において、画像マップ作成装置1の制御部10(画像受付部11)は、受信した美術館IDを有する画像データを、画像DB3から抽出する。
S21において、制御部10(単語抽出部12)は、抽出した画像データから1つの画像データを選択し、画像データが示す画像の内容を言語化して単語を抽出する。
図7(A)は、言語化する対象の画像データが示す画像60の例である。
図7(B)は、画像60に対して“DenseCap”を使用した場合の結果画像61及びキャプション62の例である。“DenseCap”では、画像60の領域ごとに文を出力する。そして、結果画像61が示すように、領域は、画像60に複数生成されるので、文も複数生成される。なお、画像60の画素数が640px(ピクセル)である場合には、“DenseCap”は、約80個のキャプション62を生成する。
図7(C)は、キャプション62を翻訳した翻訳文(説明文)63の例である。
制御部10は、翻訳文63を、画像データに対応付けて画像DB3に記憶してもよい。
図8(A)は、図7(C)に示す翻訳文63に対して形態素解析をして得られた結果データ64を示す。
図8(B)は、結果データ64に基づいて作成した単語と品詞とを対応付けた単語テーブル65の例を示す。
図6に戻り、S22において、制御部10は、抽出した全ての画像データについて、言語化して単語を抽出する処理を行ったか否かを判断する。抽出した全ての画像データについて処理を行った場合(S22:YES)には、制御部10は、処理をS23に移す。他方、抽出した全ての画像データについて処理を行っていない場合(S22:NO)には、制御部10は、処理をS21に移し、未だ言語化をしていない画像データについて、言語化する処理を行う。
S23において、制御部10(分類部13、分類語生成部14)は、抽出した全ての画像データから抽出された単語を、2つのグループに分けて、各グループでクラスタリングをする。制御部10は、例えば、名詞と、形容詞との2つのグループに分ける。これにより、2つのグループに含まれない動詞等は、除外される。また、制御部10は、グループごとに、クラスタリングをして分類語を抽出する。その際、制御部10は、単語の出現頻度が一定の閾値以上のものを、クラスタリングの対象としてもよい。また、分類語を、単語の出現頻度に応じて、所定数に制限してもよい。
S24において、制御部10(マップ作成部15)は、2つのグループを縦軸及び横軸にし、各軸の分類語が交わる位置に、カウントすることで得た分類語を含む画像データの件数を円領域の大きさで表したバブルチャートのマップ80を作成する。
S25において、制御部10(マップ登録部16)は、作成したマップ80のデータと、円領域を示す要素IDと画像データのIDとの対応付けを、マップ記憶部22に記憶させる。その後、制御部10は、本処理を終了し、処理を図4に移す。
なお、この例では、画像データを言語化してからマップ80を作成し、マップ記憶部22に記憶させるものを例に説明したが、これに限定されない。例えば、予め画像DB3に記憶された画像データに対して言語化する処理までを行って、画像データに単語を関連付けておき、マップ作成処理として、S23以降の処理を行うようにしてもよい。
図4に戻り、S14において、制御部10は、作成したマップ80のデータを、表示装置4に対して送信する。その後、制御部10は、本処理を終了する。
S15において、表示装置4の制御部40(マップ出力部41)は、マップ80のデータを受信して、タッチパネルディスプレイ57にマップ80を含むマップ表示画面71を出力する。
図5(B)は、タッチパネルディスプレイ57に表示されたマップ表示画面71の例を示す。マップ表示画面71に表示されたマップ80は、分類語によって、選択した美術館の絵画の特徴が分かりやすく示されるので、ユーザが所望の画像を探しやすいものにできる。
その後、制御部40は、本処理を終了する。
次に、マップ80に示される円領域を1つ選択することで、円領域に含まれる画像データを出力する処理について説明する。
図9は、本実施形態に係る画像マップ出力システム100の関連画像出力処理を示すフローチャートである。
図10は、本実施形態に係る画像マップ作成装置1の関連画像生成処理を示すフローチャートである。
図11は、本実施形態に係る表示装置4での表示例を示す図である。
例えば、図5(B)に示すように、マップ表示画面71の1つの円領域(バブル)をユーザが選択することで、図9のS30において、表示装置4の制御部40(要素受付部42)は、マップ80上の円領域に対する選択を受け付ける。
S31において、制御部40は、選択された円領域を識別する要素IDを、画像マップ作成装置1に対して送信する。
S32において、画像マップ作成装置1の制御部10は、要素IDを受信する。
S33において、制御部10(関連画像生成部17)は、関連画像生成処理を行う。
ここで、関連画像生成処理について、図10に基づき説明する。
S40において、制御部10は、要素IDに対応付けられた画像データを、画像DB3から抽出する。具体的には、制御部10は、マップ記憶部22を参照して、要素IDに対応付けられた画像データの画像IDを特定する。そして、制御部10は、画像IDに対応した画像データを、画像DB3から抽出する。
S41において、制御部10は、抽出した画像データの類似度を算出する。複数の画像データが抽出された場合には、制御部10は、2つの画像データの各組合せに対して、類似度を算出する。
S42において、制御部10は、算出した類似度に応じて各画像データを配置した関連画像90を生成する。
図11は、関連画像90を含む関連画像画面72の例を示す。関連画像90は、図5(B)でユーザにより選択された円領域に含まれる7つの画像データを、類似度に基づいて配置したものになっている。ここで、関連画像90は、ユーザにより選択された円領域に含まれる7つの画像データのうち、太さの異なる線によって2つの画像データが結び付けられている。この線の太さは、2つの画像データの類似度を表す。
図10に戻り、その後、制御部10は、本処理を終了し、処理を図9に移す。
図9に戻り、S34において、制御部10は、生成した関連画像90のデータを、表示装置4に対して送信する。その後、制御部10は、本処理を終了する。
S35において、表示装置4の制御部40は、関連画像90のデータを受信し、タッチパネルディスプレイ57に関連画像90を表示させる。その後、制御部40は、本処理を終了する。
このように、本実施形態の画像マップ出力システム100によれば、以下のような効果がある。
(1)画像マップ作成装置1は、画像データに関する説明文に形態素解析を行って、得られた単語から分類語を抽出し、分類語によるマップ80を作成する。よって、抽出した単語から抽出する分類語は、画像の特徴を表すものにできる。また、マップ80は、画像データの特徴を分類語により示したものであるので、マップ80を参照することで、ユーザが所望する目的に最適な画像を探し出すことができる。
(2)画像マップ作成装置1は、複数の単語を複数のグループに分け、各グループの単語をクラスタリングして分類語を生成し、分けられた複数のグループうち少なくとも2つのグループの各分類語によって分類されたマップ80を作成する。よって、マップ80を2次元以上のものにできる。
(3)画像マップ作成装置1は、抽出した複数の単語から上位概念を抽出して分類語を生成する。よって、上位概念の語によるマップ80を作成でき、分類語の数を最適な数に抑えることができる。
(4)画像マップ作成装置1は、複数の画像データの各々から抽出された複数の単語をクラスタリングして分類語を生成するので、複数の画像データに共通の分類語を生成でき、分類しやすくできる。
(5)画像マップ作成装置1は、マップ80に示され、分類語に対応付けられた円領域の選択を受け付けたことに応じて、円領域に対応する画像データを出力するので、分類語に対応する画像データを見ることができる。
(6)画像マップ作成装置1は、円領域に対応する画像データが複数ある場合に、複数の画像データの類似度に応じて各画像データを配置して、複数の画像データを含む関連画像90を表示装置4に出力するので、表示装置4では、類似度に対応した画像データの配置によって、各画像データの類似度合いを分かりやすく示すことができる。
(7)類似度は、各画像データの特徴量と、各画像データに対応した単語との少なくとも一方に基づいて算出されるので、各画像データの特徴を反映させたものにできる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されるものではない。また、実施形態に記載した効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載したものに限定されない。なお、上述した実施形態及び後述する変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。
(変形形態)
(1)本実施形態では、2つのグループに分けて各グループでクラスタリングするものを例に説明したが、これに限定されない。グループ分けせず、全体でクラスタリングしてもよいし、3つ以上のグループに分けて各グループでクラスタリングしてもよい。
(2)本実施形態では、バブルチャートのマップを作成するものを例に説明したが、これに限定されない。全体の俯瞰的な位置づけを把握可能なものであれば、他の方法によって表示可能なマップであってもよい。
(3)本実施形態では、複数の画像データに対するマップを作成するものを説明したが、これに限定されない。1つの画像データに対するマップを作成するものであってもよい。その場合、マップに表示される円領域内の数は、全て1になる。
(4)本実施形態では、抽出した複数の単語から上位概念を抽出して、分類語を生成するものを例に説明したが、これに限定されない。例えば、抽出した複数の単語の出現頻度に基づいて、分類語を生成してもよい。また、例えば、画像データ全体の面積に対して、抽出した単語の元になる画像(特徴画像)の領域が占める割合を算出する画像割合算出手段を制御部が備え、例えば、割合の高い語を分類語として取得する等、算出した割合に応じて分類語を取得してもよい。
(5)本実施形態では、画像DBは、通信ネットワークを介して接続されているものとして説明したが、これに限定されない。例えば、本実施形態であれば、画像マップ作成装置の記憶部に有していてもよい。
(6)本実施形態では、美術館や博物館で保有する絵画の画像データを対象とした例を説明したが、これに限定されない。画像化されているデータであればよく、例えば、特許図面の画像データであってもよいし、写真等の画像データであってもよい。
(7)本実施形態では、画像データのメタデータとして、その画像データを保有する美術館等の美術館IDを有するものとして説明したが、これに限定されない。画像データが絵画の場合には、例えば、絵画の画家や、絵画のモチーフの年代等を、メタデータに含んでもよい。また、画像データが、写真の場合には、例えば、撮影日や撮影場所等を、メタデータに含んでもよい。
そして、類似度を、メタデータを使用して算出してもよい。例えば、絵画の場合、同じ画家のものであれば、類似度を高くしてもよい。
(8)本実施形態では、関連画像を表示する際に、類似度を線の太さで表すものを例に説明したが、これに限定されない。例えば、類似度を、各画像間の距離によって表すようにしてもよい。その際、各画像間の距離を、画像の大きさによって表してもよい。具体例としては、マップから関連画像を表示させる際には、本実施形態で説明したものを出力し、さらに、ユーザが表示された関連画像から1つの画像を選択した場合に、選択した画像を中心にして、類似度を、奥行方向で表して出力するようにしてもよい。そのようにすることで、選択した画像との類似度合いを分かりやすく示すことができる。
1 画像マップ作成装置
3 画像DB
4 表示装置
10,40 制御部
12 単語抽出部
14 分類語生成部
15 マップ作成部
17 関連画像生成部
20,50 記憶部
21a マップ作成プログラム
22 マップ記憶部
41 マップ出力部
42 要素受付部
43 画像出力部
51a 画像表示プログラム
57 タッチパネルディスプレイ
80 マップ
90 関連画像
100 画像マップ出力システム

Claims (13)

  1. 画像を解析して複数の単語を抽出する単語抽出手段と、
    前記単語抽出手段により抽出した複数の単語をクラスタリングして分類語を生成する分類語生成手段と、
    前記分類語生成手段によって生成された分類語をカウントすることによりマップを作成するマップ作成手段と、
    を備える画像マップ作成装置。
  2. 請求項1に記載の画像マップ作成装置において、
    前記単語抽出手段により抽出した複数の単語を、複数のグループに分ける分類手段を備え、
    前記分類語生成手段は、前記分類手段により分けられた各グループの単語をクラスタリングして分類語を生成し、
    前記マップ作成手段は、前記分類手段により分けられた前記複数のグループうち少なくとも2つのグループの各分類語によって分類された前記マップを作成すること、
    を特徴とする画像マップ作成装置。
  3. 請求項1又は請求項2に記載の画像マップ作成装置において、
    前記分類語生成手段は、前記単語抽出手段により抽出した複数の単語から、上位概念にあたる語を前記分類語として生成すること、
    を特徴とする画像マップ作成装置。
  4. 請求項1から請求項3までのいずれかに記載の画像マップ作成装置において、
    前記分類語生成手段は、前記単語抽出手段により抽出した複数の単語の出現頻度に基づいて、前記分類語を生成すること、
    を特徴とする画像マップ作成装置。
  5. 請求項1から請求項3までのいずれかに記載の画像マップ作成装置において、
    画像を解析して前記画像の特徴を表す複数の特徴画像を抽出し、前記画像の領域に対して抽出した前記特徴画像の占める割合を算出する画像割合算出手段を備え、
    前記単語抽出手段は、前記特徴画像の特徴を表す単語を抽出し、
    前記分類語生成手段は、前記画像割合算出手段により算出した割合に応じて、前記単語抽出手段により抽出した単語から前記分類語を生成すること、
    を特徴とする画像マップ作成装置。
  6. 請求項1から請求項5までのいずれかに記載の画像マップ作成装置において、
    前記単語抽出手段は、前記画像の特徴ごとに関連付いた単語を参照して説明文を生成し、生成した説明文から複数の単語を抽出すること、
    を特徴とする画像マップ作成装置。
  7. 請求項1から請求項6までのいずれかに記載の画像マップ作成装置において、
    前記分類語生成手段は、複数の画像の各々から前記単語抽出手段により抽出された複数の単語をクラスタリングして分類語を生成すること、
    を特徴とする画像マップ作成装置。
  8. 請求項1から請求項7までのいずれかに記載の画像マップ作成装置に対して通信可能に接続された表示装置であって、
    前記マップ作成手段により作成された前記マップを出力するマップ出力手段と、
    前記マップ出力手段により出力された前記マップに示され、前記分類語に対応付けられた要素の選択を受け付ける要素受付手段と、
    前記要素受付手段により受け付けた前記要素に対応する画像を出力する画像出力手段と、
    を備えること、
    を特徴とする表示装置。
  9. 請求項8に記載の表示装置において、
    前記画像出力手段は、前記要素受付手段により受け付けた前記要素に対応する画像が複数ある場合に、複数の前記画像の類似度に応じて各画像を配置して、前記複数の画像を関連画像として出力すること、
    を特徴とする表示装置。
  10. 請求項9に記載の表示装置において、
    前記類似度は、各画像の特徴量と、各画像に対応した単語との少なくとも一方に基づいて算出されるものであること、
    を特徴とする表示装置。
  11. 請求項9又は請求項10に記載の表示装置において、
    前記関連画像は、類似度を、画像間の線の長さ若しくは太さ、又は、基準にした画像からの奥行方向の距離によって表したものであること、
    を特徴とする表示装置。
  12. 請求項1から請求項7までのいずれかに記載の画像マップ作成装置としてコンピュータを機能させるためのプログラム。
  13. 請求項8から請求項11までのいずれかに記載の表示装置としてコンピュータを機能させるためのプログラム。
JP2017174205A 2017-09-11 2017-09-11 画像マップ作成装置、表示装置及びプログラム Active JP6891744B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017174205A JP6891744B2 (ja) 2017-09-11 2017-09-11 画像マップ作成装置、表示装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017174205A JP6891744B2 (ja) 2017-09-11 2017-09-11 画像マップ作成装置、表示装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2019049898A true JP2019049898A (ja) 2019-03-28
JP6891744B2 JP6891744B2 (ja) 2021-06-18

Family

ID=65906311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017174205A Active JP6891744B2 (ja) 2017-09-11 2017-09-11 画像マップ作成装置、表示装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6891744B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139246A (ja) * 2002-10-16 2004-05-13 Canon Inc 画像検索装置、画像検索方法、プログラム、及び記憶媒体
JP2012108609A (ja) * 2010-11-15 2012-06-07 Sharp Corp 表示装置、表示方法、コンピュータプログラム及び記録媒体
JP2012155524A (ja) * 2011-01-26 2012-08-16 Olympus Corp キーワード付与装置、プログラム及び情報記憶媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139246A (ja) * 2002-10-16 2004-05-13 Canon Inc 画像検索装置、画像検索方法、プログラム、及び記憶媒体
JP2012108609A (ja) * 2010-11-15 2012-06-07 Sharp Corp 表示装置、表示方法、コンピュータプログラム及び記録媒体
JP2012155524A (ja) * 2011-01-26 2012-08-16 Olympus Corp キーワード付与装置、プログラム及び情報記憶媒体

Also Published As

Publication number Publication date
JP6891744B2 (ja) 2021-06-18

Similar Documents

Publication Publication Date Title
US10726212B2 (en) Presenting translations of text depicted in images
US20240031688A1 (en) Enhancing tangible content on physical activity surface
US9239833B2 (en) Presenting translations of text depicted in images
US8538943B1 (en) Providing images of named resources in response to a search query
JP7204847B2 (ja) 関連コンテンツを使用した画像の効率的な増強
US20150169525A1 (en) Augmented reality image annotation
EP3144823A1 (en) Presenting translations of text depicted in images
KR20170014353A (ko) 음성 기반의 화면 내비게이션 장치 및 방법
US20110316796A1 (en) Information Search Apparatus and Information Search Method
US20210216772A1 (en) Visual Menu
WO2021104274A1 (zh) 图文联合表征的搜索方法、系统、服务器和存储介质
JP6363547B2 (ja) 情報処理装置、及び文章画像化プログラム
CN114067797A (zh) 一种语音控制方法、装置、设备以及计算机存储介质
JP2011165092A (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
KR102122918B1 (ko) 대화형 질의응답 장치 및 그 방법
CN115811638A (zh) 一种信息展示方法、装置、设备及存储介质
US11010978B2 (en) Method and system for generating augmented reality interactive content
JP6891744B2 (ja) 画像マップ作成装置、表示装置及びプログラム
JP7338328B2 (ja) データ構造、コンピュータプログラム及び画像処理装置
JP2014137654A (ja) 翻訳システム及びその翻訳方法
JP2018112806A (ja) 画像関連付け装置、画像データベース、画像検索装置、画像検索システム及びプログラム
JP2019053461A (ja) 画像処理装置、プログラム及び画像データ
CN103914446A (zh) 翻译方法及翻译系统
CN106815288A (zh) 一种视频相关信息生成方法及其装置
JP2020119168A (ja) 画像処理装置、プログラム及びデータ構造

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210510

R150 Certificate of patent or registration of utility model

Ref document number: 6891744

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150