JP4962961B2 - 空間共起辞書作成装置及び空間共起辞書作成方法 - Google Patents

空間共起辞書作成装置及び空間共起辞書作成方法 Download PDF

Info

Publication number
JP4962961B2
JP4962961B2 JP2007211836A JP2007211836A JP4962961B2 JP 4962961 B2 JP4962961 B2 JP 4962961B2 JP 2007211836 A JP2007211836 A JP 2007211836A JP 2007211836 A JP2007211836 A JP 2007211836A JP 4962961 B2 JP4962961 B2 JP 4962961B2
Authority
JP
Japan
Prior art keywords
item
image
occurrence
noun
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007211836A
Other languages
English (en)
Other versions
JP2009048295A (ja
Inventor
祐 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2007211836A priority Critical patent/JP4962961B2/ja
Publication of JP2009048295A publication Critical patent/JP2009048295A/ja
Application granted granted Critical
Publication of JP4962961B2 publication Critical patent/JP4962961B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、空間共起辞書作成装置及び空間共起辞書作成方法に関する。
インターネットに代表される近年のネットワーク技術及びコンピュータ技術の発達により大量の画像データを蓄積し、ユーザの要求に応じて蓄積した画像データを検索してユーザに所望の画像を提示する画像検索システムを構築する試みが行われている(例えば特許文献1)。このような画像検索システムでは、画像(キー画像)を検索キーとして入力し、入力された検索キー画像と類似した特徴を持つ画像を提示するものが多い。
また、ユーザの端末画面に3次元の仮想空間の画像を表示し、仮想空間内においてユーザが視点を移動することに応じて、仮想的な視野に入る仮想空間内のオブジェクトを画角や距離感の変化を伴ってユーザの端末画面に表示することにより、ユーザの興味を惹き、仮想空間に臨場感をもたせる試みが、例えばセカンドライフ等のサービスによって行われている(例えば非特許文献1)。
特開2002−245048号公報 マイケル・リマズイスキー(他)著 中川 蘭丸 訳、セカンドライフ公式ガイド、インプレスR&D版、2007年05月
画像検索の技術を活用し、入力された任意の画像をテキスト文で表現することができれば、セカンドライフ等のサービスに関連し、インターネットを用いた新たな利用分野を開拓することができる。具体的な方法としては、入力された画像からエッジ処理等により部分画像を切り出し、その部分画像を画像辞書で検索し、その部分画像に対応するテキスト情報を利用することが考えられるが、もともと画像検索においては、文字検索と異なり、完全一致することは稀であり、類似の概念が存在するために、切り出した部分画像に対応するテキスト情報を一意に決め難いという問題がある。
そこで画像辞書を用いた上記方法を補完するために、画像辞書に登録されたアイテムが同時に同一の画像に出現する共起度を、現在Web上に存在する大量の画像情報から抽出蓄積するとともに、画像に付されたタイトルと、当該画像に含まれるアイテムとの関係についても、その相関度を、現在Web上に存在する大量の画像情報から抽出蓄積することで、前記の問題、即ち、「入力された任意の画像をテキスト文で表現する」という問題に対応することができる。
そこで、本発明は、複数のアイテムが同時に同一の画像に出現する共起度と、画像のタイトルを構成する名詞と当該画像に含まれるアイテムとの相関度を、既存のWebページ上に存在する画像(動画像を含む)から収集したデータに基づき、集計計算する空間共起辞書作成装置及び空間共起辞書作成方法を提供することを目的とする。
本発明者は、既存のWebページから収集した画像のタイトルと、当該画像に含まれるアイテムについて、出現に係る相互の連関性を自動的に収集する装置及び方法を見出し、本発明を完成するに至った。本発明は、具体的には次のようなものを提供する。
(1)Web上から収集された画像を取得する画像取得部と、前記画像から部分画像を取得する部分画像取得部と、前記部分画像から特徴情報を抽出する特徴情報抽出部と、画像辞書を用い、前記特徴情報に基づき前記部分画像に対応するアイテムを特定するアイテム特定部と、前記特定したアイテムに基づき、同一画像に出現する複数のアイテムに係るアイテムの共起度を計算してアイテム共起辞書を作成するアイテム共起辞書作成部と、を備える空間共起辞書作成装置。
この発明によれば、現実にWebページ上に存在する画像から、同一画像に出現する複数のアイテムの共起度を計算するので、信頼性の高い空間共起辞書を自動的に作成することができる。
(2)前記画像は動画像であり、前記共起度は、該動画像を構成する全静止画像(全フレーム画像)のうち少なくとも1つの静止画像に前記アイテムが出現するか否かにより判定することを特徴とする(1)に記載の空間共起辞書作成装置。
この発明によれば、1つの動画中の異なる場面における出現に係るアイテムの共起度を計算することができるので、共起関係を漏れなく拾うことができる。
(3)前記共起度は、同一の画像に出現する異なる2つのアイテムに係るものであることを特徴とする(1)または(2)に記載の空間共起辞書作成装置。
この発明によれば、異なる2つのアイテムの同時使用性、同時出現性を反映した共起度を求めることができるので実情に合わせたアイテム共起辞書を作成することができる。
(4)前記共起度は、同一の画像に出現する同一の複数のアイテムに係るものであることを特徴とする(1)または(2)に記載の空間共起辞書作成装置。
この発明によれば、同一の複数のアイテムの同時使用性、同時出現性を反映した共起度を求めることができるので実情に合わせたアイテム共起辞書を作成することができる。
(5)異なる2つのアイテムの前記共起度は、前記2つのアイテムがともに出現する画像の数を、前記2つのアイテムがそれぞれ出現する画像の数のうちいずれか小さい方で除したものであることを特徴とする(3)に記載の空間共起辞書作成装置。
この発明によれば、異なる2つのアイテムの共起度を、いずれのアイテムを基準とするかに影響されず決定するので、利用の際に簡便な利用が可能となる。
(6)異なる2つのアイテムの前記共起度は、前記2つのアイテムがともに出現する画像の数を、基準とするアイテムが出現する画像の数で除したものであることを特徴とする(3)に記載の空間共起辞書作成装置。
この発明によれば、異なる2つのアイテム名に係るアイテムの共起度を、基準とするアイテムを考慮して決定するので、利用の際にいずれのアイテムを基準とするかを考慮した精緻な利用が可能となる。
(7)前記画像のタイトルから、該タイトルに含まれる名詞を抽出するタイトル名詞抽出部と、前記抽出した名詞と、前記特定したアイテムの相関度を計算してタイトル/アイテム相関辞書を作成するタイトル/アイテム相関辞書作成部と、を備える(1)から(6)のいずれかに記載の空間共起辞書作成装置。
この発明によれば、画像のタイトル中にある名詞と、当該画像に含まれるアイテムとのすべての相関度を計算することができるので、アイテムと相関度の高い名詞を決定するのに役立つ。
(8)前記抽出した名詞を上位の概念とし、その名詞に関連したアイテムを下位の概念とし、さらにそのアイテムを名詞とみなし、それに関連する下位のアイテムをツリー状に構成していく空間オントロジー構成部をさらに備える請求項7に記載の空間共起辞書作成装置。
この発明によれば、このような空間オントロジーにより、画像に映し出されたアイテムの描写角度や描写の鮮明度が悪い場合でも、上位概念の情報により対象アイテムを絞り込み、より的確なアイテム認証が可能となる。たとえば居間に入ったという情報があれば、そこにある長い物体は、ベッドではなくソファーである確率が高いというような判断に利用できる。また、対応アイテムの上位概念、下位概念を把握することにより、その空間に広告情報等を掲載する場合、さまざまな関連性のある広告掲載を可能とすることができる。
(8)前記画像は動画像であり、前記相関度は、該動画像を構成する全静止画像のうち少なくとも1つの静止画像に前記アイテムが出現するか否かにより判定することを特徴とする(7)に記載の空間共起辞書作成装置。
この発明によれば、画像のタイトル中にある名詞と、1つの動画中の異なる場面における出現に係るアイテムとの相関度を計算することができるので、相関関係を漏らさず拾うことができる。
(9)コンピュータを用いて、画像に出現するアイテムの共起度に係る空間共起辞書を作成する方法であって、Web上から収集された画像を取得する画像取得ステップと、前記画像から部分画像を取得する部分画像取得ステップと、前記部分画像から特徴情報を抽出する特徴情報抽出ステップと、画像辞書を用い、前記特徴情報に基づきアイテムを特定するアイテム特定ステップと、前記特定したアイテムに基づき、同一画像に出現する複数のアイテムに係るアイテムの共起度を計算してアイテム共起辞書を作成するアイテム共起辞書作成ステップと、を含む空間共起辞書作成方法。
この発明によれば、(1)に記載の発明が行う処理をコンピュータを用いて行うので、(1)に記載の発明と同様の効果を発揮することができる。
(10)前記画像のタイトルから、該タイトルに含まれる名詞を抽出するタイトル名詞抽出ステップと、前記抽出した名詞と、前記特定したアイテムの相関度を計算してタイトル/アイテム相関辞書を作成するタイトル/アイテム相関辞書作成ステップと、を含む(9)に記載の空間共起辞書作成方法。
この発明によれば、(7)に記載の発明が行う処理をコンピュータを用いて行うので、(7)に記載の発明と同様の効果を発揮することができる。
この発明によれば、現実にWebページ上に存在する画像から、同一画像に出現する複数のアイテムの共起度と、画像のタイトル中にある名詞と当該画像に含まれるアイテムとの相関度を計算するので、信頼性の高い空間共起辞書を自動的に作成することができる。
以下、本発明を実施するための最良の形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
(第1の実施形態)
[全体図]
図1は、空間共起辞書作成装置1が有する機能部分と、空間共起辞書作成装置1がアクセスするデータベース10〜13との関係を示した全体図である。空間共起辞書作成装置1は、Web上から収集された画像(動画を含む)が蓄積された画像DB11から画像を取得する画像取得部2と、画像取得部2によって取得された画像から部分画像を取得する部分画像取得部3と、部分画像取得部3によって取得された部分画像から特徴情報を抽出する特徴情報抽出部4と、特徴情報抽出部4によって抽出された特徴情報に基づき画像辞書DB10に記録された画像辞書を参照し、当該部分画像に係るアイテムを特定し、アイテム名とアイテム番号を取得するアイテム特定部5と、アイテム特定部5により決定された部分画像のアイテムについて、複数のアイテムが同一画像に出現する共起度を計算してアイテム共起辞書DB12上にアイテム共起辞書を作成するアイテム共起辞書作成部6と、画像取得部2で取得した画像のタイトルを取得するタイトル取得部7と、タイトル取得部7によって取得されたタイトルから当該タイトルに含まれる名詞を抽出するタイトル名詞抽出部8と、タイトル名詞抽出部8によって抽出された名詞とアイテム特定部5によって決定されたアイテムとの相関度を求めてタイトル/アイテム相関辞書DB13上にタイトル/アイテム相関辞書を作成するタイトル/アイテム相関辞書作成部9とを備える。なお、画像取得部2は、画像辞書DB10を介さずにWeb上から直接画像を取得してもよい。
[空間共起辞書作成装置1のハードウェア構成]
図2は、本実施形態に係る空間共起辞書作成装置1のハードウェア構成を示す図である。空間共起辞書作成装置1は、制御装置30を構成するCPU(Central Processing Unit)31(マルチプロセッサ構成ではCPU42等複数のCPUが追加されてもよい)、バスライン20、通信I/F(I/F:インターフェイス)33、メインメモリ34、BIOS(Basic Input Output System)35、表示装置36、I/Oコントローラ37、並びにキーボード及びマウス等の入力装置38を備える。
通信I/F33は、空間共起辞書作成装置1が、インターネット(図示せず)を介して画像が保有されているサーバ等(図示せず)にアクセスする場合に使用するネットワーク・アダプタである。通信I/F33は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。BIOS35は、空間共起辞書作成装置1の起動時にCPU31が実行するブートプログラムや、空間共起辞書作成装置1のハードウェアに依存するプログラム等を記録する。
表示装置36は、空間共起辞書作成装置1による演算処理結果等の画面を表示するものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。I/Oコントローラ37には、ハードディスク39、及び半導体メモリ40等の記憶装置41を接続することができる。入力装置38は、空間共起辞書作成装置1の管理者による入力の受け付けを行うものである。ハードディスク39は、本ハードウェアを空間共起辞書作成装置1として機能させるための各種プログラム、本発明の機能を実行するプログラム及び後述するテーブルを記憶する。
以上の例は、空間共起辞書作成装置1のハードウェア構成について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータを空間共起辞書作成装置1として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明した空間共起辞書作成装置1により実現される機能は、上述の方法を当該コンピュータにより実行することによって、あるいは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
なお、本発明でいうコンピュータとは、記憶装置、制御装置等を備えた情報処理装置をいい、空間共起辞書作成装置1は、記憶装置41、制御装置30等を備えた情報処理装置により構成され、この情報処理装置は、本発明のコンピュータの概念に含まれる。ここで、図1に示した、画像取得部2、部分画像取得部3、特徴情報抽出部4、アイテム特定部5、アイテム共起辞書作成部6、タイトル取得部7、タイトル名詞抽出部8、タイトル/アイテム相関辞書作成部9には主として制御装置30が、画像辞書DB10には記憶装置41が、それぞれ対応する。なお、画像DB11は、空間共起辞書作成装置1への入力として、アイテム共起辞書DB12とタイトル/アイテム相関辞書13は空間共起辞書作成装置1からの出力として位置づけられる。
[画像及び部分画像]
図3は、画像取得部2が取得する画像の一例である。なお、この画像には、「日曜日の我が家の居間」というタイトルがついているものとする。
図4は、部分画像取得部3が上記画像から取得した部分画像の例である。(a)は長椅子タイプのソファー、(b)はテーブルである。
[画像辞書]
図5は、アイテム特定部5で参照する画像辞書を示す図である。部分画像の特徴情報を記録した検索用タグと、当該特徴情報を有するアイテムのアイテム名やアイテム番号等の属性情報が対応付けられて記録されている。特徴情報としては、例えば、アイテムの輪郭やアイテムを構成する色数等がある。画像辞書は、画像辞書DB10上に記録されている。
[テーブル]
図6は、アイテム名テーブルであり、アイテム名とアイテム番号が記録されている。
図7は、抽出アイテムテーブルであり、アイテム特定部5が、部分画像取得部3により取得された部分画像について、画像辞書を参照して取得したアイテム名とアイテム番号が保有される。図7(a)は、アイテム3、アイテム5、アイテム9の3つのアイテムが取得されたことを示している。また、図7(b)は、全部で5つのアイテムが取得され、それらのうちアイテム3が3個、アイテム5とアイテム9がそれぞれ1個であることを示している。
図8は、動画から部分画像が取得された例を示している。動画は、静止画の集合であるので、例えば、それをシーン1〜3として、それぞれのシーンから取得された部分画像について、アイテムが取得された例を示している。シーン1では3つのアイテム、シーン2では4つのアイテム、シーン3では3つのアイテムがそれぞれ取得されているが、取得されたアイテムはシーンによって異なっている。
このような場合、同一のアイテムが複数のシーンに出現することもあるので、これらを考慮し、各シーンに出現したアイテムの最大個数をそれぞれのシーンから集め、それをその動画に出現する全アイテムとして抽出アイテムテーブルを作成している。例えば、アイテム3は、シーン2において3個同時に出現しているので、少なくとも3個は存在することになる。同じようにアイテム5とアイテム13についてはシーン3から、アイテム9についてはシーン1から集めている。このようにすると、この動画から取得したアイテムは、抽出アイテムテーブル(全体)に集められた7個のアイテムが同時に出現する静止画と同様の取り扱いが可能となる。
図9は、アイテム別出現度数テーブルである。Web上から取得された画像に含まれる部分画像について、画像辞書を参照してアイテム名やアイテム番号が取得されたものについて、アイテム番号別に出現度数をカウントするためのテーブルである。ここで、本テーブルは行列形式になっており、1列目にアイテム番号、2列目に当該アイテムの出現した画像の数(アイテム出現度数)、3列目以降に異なる2つのアイテムが同一の画像に出現した画像の数(アイテム同時出現度数)をそれぞれ保有している。
例えば、アイテム3が出現した画像の数はc3であり、アイテム3とアイテム5がともに出現した画像の数はc3_5である。なお、重複した情報の保有を省略するために3列目以降は上三角行列の形をしている。
図10は、図9のアイテム別出現度数テーブルを用いて異なる2つのアイテム間で計算した共起度を保有するアイテム別共起度テーブルである。共起度の計算方法は、図中に示した計算方法で行う。この計算方法は種々考えられるが、本実施形態においては、(a)に示した計算方法を用いる。
この場合の2つのアイテム共起度は、当該2つのアイテムがともに出現した画像の数を、各アイテムが出現した画像の数のうちいずれか小さい方で除した商である。これは自然言語処理におけるシンプソン係数と呼ばれるものである。このようにすると、2つのアイテム間の区別がなくなるため、アイテム別共起度テーブル(図10(a))は対称行列になる。ただし、同一アイテム間の共起度については別途対応するので、本テーブルにおける対角要素は意味を持たない。
図11(a)は、同一のアイテムが同一の画像に複数個出現する場合の出現度数をカウントするアイテム別複数出現度数テーブルである。第2列のアイテム出現度数(d1_1、d2_1、…)は図9のアイテム別出現度数テーブルのアイテム出現度数(c1、c2、…)と同一内容である。第2列のdi_1は、1つの画像内に、アイテム番号iのアイテム(アイテムiという)が1以上出現した画像数を表す。第3列のdi_2は、1つの画像内に、アイテムiが2以上出現した画像数を表す。同様にdi_3は3以上、di_4は4以上、di_5は5以上出現した画像数を表す。但し、6個以上同時に出現する場合はカウントしない。何個までカウントするかは適宜決めればよい。
図11(b)は、アイテム別複数出現度数テーブルにおいて実際にカウントされた例である。アイテム1については、1個出現した画像が1つあったことを示している。アイテム2については、同時に2個出現した画像が1つあったことを示している。アイテム3については、同時に5個以上出現した画像が1つあったことを示している。この場合、6個上はカウントしないので、その画像にアイテム3が出現した個数は5個であったとは限らず、それ以上であったかもしれない。アイテム4については、1つだけ出現した画像、同時に2つだけ出現した画像、同時に3つだけ出現した画像がそれぞれ1つあったことを示している。アイテム5については、1個のみ出現した画像はなく、2個出現した画像が100あったことを示しており、これはアイテム5が必ずペアで出現することを意味している。一方、アイテム6については、1個のみ出現した画像が99個、2個同時に出現した画像が1つあったことを示しており、アイテム6は通常単独で出現することを意味している。
図12は、同一のアイテムが同一の画像に複数個出現する場合の共起度を表したアイテム別複数共起度テーブルである。例えば、ri_2は、アイテムiが1個出現した場合に、2個目が出現する比率、ri_3は、アイテムiが2個出現した場合に、3個目が出現する比率をそれぞれ表す。つまり、アイテム番号ごとに、各アイテムがn個出現した場合に、(n+1)個目が出現する比率を(n+1)列目に表示している。この場合も、6個以上出現する場合については、表示の対象としていない。何個まで表示の対象とするかは適宜決めればよい。
図13は、タイトル取得部7によって取得されたタイトルから当該タイトルに含まれる名詞を抽出するために、タイトル名詞抽出部8で参照する名詞テーブルである。名詞テーブルは、名詞とその名詞に対応する名詞番号から構成される。
図14は、上記名詞テーブルを用いてタイトルから抽出された名詞を示す抽出名詞テーブルである。実際に抽出された名詞とその名詞に対応する名詞番号が保有される。図3の例によれば、対象とするタイトル(「日曜日の我が家の居間」)の中に、名詞番号5の「日曜日」と名詞番号17の「我が家」と名詞番号45の「居間」の3つの名詞が含まれることを意味している。
図15は、抽出アイテムテーブル(図7)を拡張した拡張抽出アイテムテーブルである。同一アイテムの複数個同時出現がない場合は抽出アイテムテーブルと同じであるが、同一アイテムの複数個同時出現がある場合は、そのアイテムについて新たに付けられたアイテム番号が表示される。例えば、机(アイテム番号は7と仮定する)が3つ同時に同一画像に出現する場合は、「机3つ」を「机」とは異なる新たなアイテムとして、アイテム番号3000007を付ける。アイテム番号の付け方は予めルールを定めておけばよいが、この例では、最上位の桁を3として、「3つ」の意味を表し、それより下位の桁で下のアイテム番号を現している。このようにすると、例えば、教室のように多数の机が出現するような場合も統一的に取り扱えるようになる。そこで、このようにして新たなアイテム番号を加えたものをここでは拡張アイテム番号と呼ぶことにする。また、拡張アイテム番号に対応するアイテム名を拡張アイテム名と呼ぶ。例えば、アイテム3が3個の場合、「アイテム3」と区別し、「アイテム3が3個」が拡張アイテム名となる。
図16は、上記の拡張アイテム番号を用いてアイテム名テーブル(図6)を拡張した拡張アイテム名テーブルである。拡張アイテム名と拡張アイテム番号が記録されている。
図17は、各名詞を含むタイトルが画像のタイトルとして使用された数(タイトル名詞出現度数)と、その名詞を含むタイトルの画像に各アイテムが出現した数(タイトル名詞別アイテム出現度数)とを、各名詞と各アイテムについて集計したタイトル名詞別アイテム出現度数テーブルである。
なお、同一のアイテム(アイテム番号が同一)が複数個同時に同一画像に出現する場合は、これらの複数個のアイテムを新たな1つのアイテムとして捉え、新たなアイテム番号を付けることとする。図17において、第3列以降は、拡張アイテム番号に基づいて集計した数を表示する。
例えば、t3は名詞番号3の名詞を含むタイトルが画像のタイトルとして使用された数を示す。また、t3_1は、名詞番号3の名詞を含むタイトルの画像にアイテム1が出現した数を表す。
図18は、タイトルから抽出された名詞と、そのタイトルに係る画像に出現したアイテムとの相関関係を示したタイトル名詞アイテム相関度テーブルである。図18の各要素は、図17の要素を用いて図中に記載したように計算される。つまり、タイトル名詞別アイテム出現度数を、対応するタイトル名詞出現度数で除した商である。これは、各名詞がタイトル中に含まれるとき、そのタイトルに係る画像にそれぞれのアイテムが出現する比率を示す。なお、この場合も、タイトル名詞とアイテムの相関度は拡張アイテム番号に基づいて計算されたものである。
[処理フロー]
図19に従って、空間共起辞書作成装置1の処理フローについて説明する。特に断らない限り、以下の処理は、空間共起辞書作成装置1の制御装置30が行うものとする。本実施形態では、空間共起辞書作成装置1が、Web上から収集された画像(動画を含む)が蓄積された画像DB11から画像を取得することを前提としている(S10)。画像の取得は、静止画像の場合は1枚の静止画像、動画像の場合はその動画像を構成する複数枚の静止画像を1単位として行う。
次に、取得した画像から、エッジ処理により部分画像を切り出す(S20)。静止画像であれば、1枚の画像から部分画像が切り出されるが、動画の場合は、1つの動画を構成する複数の静止画像のそれぞれから部分画像が切り出されることになる。したがって、動画を構成する少なくとも1枚の静止画像に含まれている部分画像は、その動画に含まれている部分画像となる。そして、切り出した部分画像から特徴情報を抽出する(S30)。特徴情報としては、部分画像の輪郭や部分画像の色数等がある。このような技術は公知であり、(例えば、特開2006−114053参照)、このようにすることによって、画像に写った家具が、例えばソファーであることが認識できる。この画像の特徴量はテキストとして送信可能なので画像そのものを送信することに比べてデータ量が大幅に減少できる。
次に、画像辞書(図5)を参照し、すでに実用化されている類似画像検索技術に基づき、特徴情報に合致するアイテムを特定し、アイテム名とアイテム番号を求める。その際、特徴情報が完全に一致するものがない場合には、類似度が最も大きいものを選ぶ(S40)。類似画像検索では、検索の対象となる画像から視覚的な情報を数百次元の数値列データ(画像特徴量)で示し、データ同士の似ている度合い(類似度)を、画像特徴量ベクトル間の距離、即ち、この画像特徴量の違いとして評価する。
このようにして、切り出した1つの部分画像についてアイテム名とアイテム番号が特定されると、抽出アイテムテーブル(図7)に登録し、同一画像にさらに別の部分画像がある場合は(S50:Yes)、ステップ20に戻り、同様の処理を行う(S20〜S40)。そしてすべての部分画像について処理が終わると次の処理に移る(S50:No)。
次に、切り出したアイテムをアイテム番号順に並べる(S60)。図7(a)の例では、アイテム番号が3、5、9の3つのアイテムが切り出されて、アイテム番号順に並べられたことを示している。
次に、抽出アイテムテーブル(図7、図8)に基づき以下の要領でアイテム別出現度数テーブル(図9)とアイテム別複数出現度数テーブル(図11(a))を更新する。抽出アイテムテーブルの最初のアイテム(図7(a)ではアイテム3)について、アイテム出現度数(この場合は図9のc3と図11(a)のd3_1)に1を加算する(S70)。
次に、抽出アイテムテーブルの次のアイテム(図7(a)ではアイテム5)について、アイテム出現度数(図9のc5と図11(a)のd5_1)に1を加算する(S80)とともに、最初のアイテム(アイテム3)と次のアイテム(アイテム5)が異なっているので(S90:No)、アイテム別出現度数テーブル(図9)のアイテム同時出現度数(c3_5)に1を加算する(S100)。
図7(b)の例のように、抽出アイテムテーブルの次のアイテムが前のアイテムと同じアイテムの場合は(S90:Yes)、同一アイテムが複数個同時に出現したことになるので、アイテム別出現度数テーブル(図9)のアイテム同時出現度数(c3_5)には加算せずに、アイテム別複数出現度数テーブル(図11(a))のアイテム複数同時出現度数に加算する(S110)。この場合、アイテム3の2個目が抽出アイテムテーブル(図7(b))にあることによりd3_2に1を加算し、3個目が抽出アイテムテーブル(図7(b))にあることによりd3_3に1を加算する。
抽出アイテムテーブルに登録されたすべてのアイテムについて処理が終われば終了するが(S120:Yes)、まだアイテムが残っている場合は(S120:No)、上記の処理(S80〜S110)を繰り返す。このとき、ステップ100の処理は、現在処理中のアイテムと、そのアイテムより先に処理されたすべてのアイテムとの間のアイテム同時出現度数に1を加算する。
例えば、抽出アイテムテーブル(図7(a))に従い、3番目のアイテムであるアイテム9の処理を行うときは、ステップ100においては、アイテム9より先に処理された、アイテム3とアイテム5のそれぞれと、アイテム9とのアイテム同時出現度数を加算する。したがって、この場合、c3_9とc5_9に1が加算される。
以下の処理は、図20に従って説明する。次に、アイテム別出現度数テーブル(図9)に基づいて、アイテム別共起度テーブル(図10(a))を、アイテム別複数出現度数テーブル(図11(a))に基づいて、アイテム別複数共起度テーブル(図12)を、それぞれ生成する(S130)。要素間の計算方法についてはすでに説明したとおりである。
次に画像取得部2で取得した画像のタイトルを取得する(S140)。そして、取得したタイトル中に含まれる名詞を名詞テーブル(図13)に基づいて抽出する(S150)。抽出した名詞は、名詞番号とともに抽出名詞テーブル(図14)に登録し、その後の処理の便宜のために名詞番号順に並べ替えておく。
次に、抽出アイテムテーブル(図7)に基づいて、拡張抽出アイテムテーブル(図15)を作成する(S160)。拡張抽出アイテムテーブル(図15)は、抽出アイテムテーブル(図7)に同一アイテムが複数個ある場合に、これらをまとめて1つの新たなアイテム(拡張アイテム)として取り扱うために設けたテーブルである。次に、拡張アイテム名テーブル(図16)に新たなアイテムの登録を行う(S170)。
次に、抽出名詞テーブル(図14)に基づき以下の要領でタイトル名詞別アイテム出現度数テーブル(図17)を更新する。まず、抽出名詞テーブル(図14)の最初の名詞(図14では名詞番号5の名詞)について、その名詞の名詞番号のタイトル名詞出現度数(図17のt5)に1を加算する(S180)。
次に、拡張抽出アイテムテーブル(図15の右側のテーブル)に登録されたアイテム(図15(a)ではアイテム3、アイテム5、アイテム9)について、その名詞番号(この場合は5)のタイトル名詞別アイテム出現度数(この場合は図17のt5_3、t5_5、t5_9)に1を加算する(S190)。
拡張抽出名詞テーブル(図15)に登録されたすべての名詞について処理が終われば終了するが(S200:Yes)、まだアイテムが残っている場合は(S200:No)、上記の処理(S180〜S190)を繰り返す。
次に、タイトル名詞別アイテム出現度数テーブル(図17)に基づいて、タイトル名詞アイテム相関度テーブル(図18)を生成する(S210)。要素間の計算方法についてはすでに説明したとおりである。
以上の処理(S10〜S210)をWeb上から収集した画像について行う。対象とする画像の数が増えると、信頼度の高いアイテム別共起度テーブル(図10)と、アイテム別複数共起度テーブル(図12)と、タイトル名詞アイテム相関度テーブル(図18)が形成される。アイテム別共起度テーブル(図10)とアイテム別複数共起度テーブル(図12)がアイテム共起辞書、タイトル名詞アイテム相関度テーブル(図18)がタイトル/アイテム相関辞書となる。
また、前記タイトル名詞アイテム相関度テーブル(図18)を用いて、ある名詞(たとえば家)を上位の概念とし、その名詞に関連したアイテム(たとえば、居間、トイレ)を下位の概念とし、さらにそのアイテム(たとえば居間)を名詞とみなし、それに関連する下位のアイテム(たとえばソファー、テーブル)をツリー状に構成していき、空間オントロジーとして表現することもできる。なお、名詞に関連したアイテムとは、当該名詞との相関度が一定値以上のアイテムをいうこととする。
このオントロジーとは日本語処理の意味解析技術で利用される情報表現形式であり、言葉の概念どうしの関係を表現したものであるが、本発明ではこの技術を空間上の概念表現に利用できるようにし、空間の意味をとらえることができるように辞書化したものである。
なお、日本語処理技術でのオントロジーについては「言語と計算5“情報検索と言語処理”、徳永健伸、東京大学出版会、1999年11月」のP104を参照。
なお、上記の説明では、アイテム共起辞書とタイトル/アイテム相関辞書の元となるアイテム別出現度数テーブル(図9)、アイテム別複数出現度数テーブル(図11(a))及びタイトル名詞別アイテム出現度数テーブル(図17)の初期化については触れていない。ステップ10からステップ210の処理は、1つの画像について行うものであるので、複数の画像の処理を行う前に上記の3つの度数テーブルを初期化するようにしてもよいが、初期化は最初の一度だけとし、上記の3つの度数テーブルを累積的に使用するようにしてもよい。この場合は、画像の日付等により、すでに処理した画像を除いて処理するようにすれば、多数の画像例に基づく信頼度の高いアイテム共起辞書とタイトル/アイテム相関辞書を作成することができる。
(第2の実施形態)
第2の実施形態は、アイテム別共起度テーブル(図10(b))の生成方法が異なるだけで、他は第1の実施形態と同様である。
[テーブル]
図10(b)は、図9のアイテム別出現度数テーブルを用いて行う共起度の計算方法が、図10(a)と異なる。この場合の2つのアイテム共起度は、当該2つのアイテムがともに出現した画像の数を、基準とするアイテムが出現した画像の数で除した商である。このようにすると、2つのアイテムの共起度が、いずれのアイテムを基準とするかにより異なったものとなる。生成時においては、単に計算方法の違いに過ぎないが、利用時において、2つのアイテムのどちらを基準に共起度を利用するかが意味を持つような場合に違いが出る。この点以外は、第1の実施形態と同様である。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
本発明の実施形態の一例に係る空間共起辞書作成装置1が有する機能部分と、空間共起辞書作成装置1がアクセスするデータベース10〜13との関係を示した全体図である。 本発明の実施形態の一例に係る空間共起辞書作成装置1のハードウェア構成を示す図である。 本発明の実施形態に係る画像取得部2が取得する画像の一例である。 本発明の実施形態に係る部分画像取得部3が上記画像から取得した部分画像の例である。 本発明の実施形態の一例に係るアイテム特定部5で参照する画像辞書を示す図である。 本発明の実施形態の一例に係るアイテム名テーブルを示す図である。 本発明の実施形態の一例に係る抽出アイテムテーブルを示す図である。 本発明の実施形態の一例に係る動画から部分画像が取得された場合における抽出アイテムテーブルを示す図である。 本発明の実施形態の一例に係るアイテム別出現度数テーブルを示す図である。 本発明の実施形態の一例に係る異なる2つのアイテム間の共起度を保有するアイテム別共起度テーブルを示す図である。((a)は第1の実施形態、(b)は第2の実施形態に対応) 本発明の実施形態の一例に係る同一のアイテムが同一の画像に複数個出現する場合の出現度数をカウントするアイテム別複数出現度数テーブルを示す図である。((a)は一般的な形、(b)は具体的な例) 本発明の実施形態の一例に係る同一のアイテムが同一の画像に複数個出現する場合の共起度を表したアイテム別複数共起度テーブルを示す図である。 本発明の実施形態の一例に係る名詞テーブルを示す図である。 本発明の実施形態の一例に係るタイトルから抽出された名詞を示す抽出名詞テーブルを示す図である。 本発明の実施形態の一例に係る拡張アイテム番号を用いて抽出アイテムテーブル(図7)を拡張した拡張抽出アイテムテーブルを示す図である。 本発明の実施形態の一例に係る拡張アイテム名テーブルを示す図である。 本発明の実施形態の一例に係る各名詞を含むタイトルが画像のタイトルとして使用された数(タイトル名詞出現度数)と、各アイテムについて、そのアイテムが出現した画像のうち、その画像のタイトルがある名詞を含むような画像の数(タイトル名詞別アイテム出現度数)とを、各名詞と各アイテムについて集計したタイトル名詞別アイテム出現度数テーブルを示す図である。 本発明の実施形態の一例に係るタイトルから抽出された名詞と、そのタイトルに係る画像に出現したアイテムとの相関関係を示したタイトル名詞アイテム相関度テーブルを示す図である。 本発明の実施形態の一例に係る空間共起辞書作成装置1の処理のフローチャート(その1)である。 本発明の実施形態の一例に係る空間共起辞書作成装置1の処理のフローチャート(その2)である。
符号の説明
1 空間共起辞書作成装置
2 画像取得部
3 部分画像取得部
4 特徴情報抽出部
5 アイテム特定部
6 アイテム共起辞書作成部
7 タイトル取得部
8 タイトル名詞抽出部
9 タイトル/アイテム相関辞書作成部
10 画像辞書DB
11 画像DB
12 アイテム共起辞書DB
13 タイトル/アイテム相関辞書DB
20 バスライン
30 制御装置
31、32 CPU(Central Processing Unit)
33 通信I/F(I/F:インターフェイス)
34 メインメモリ
35 BIOS(Basic Input Output System)
36 表示装置
37 I/Oコントローラ
38 入力装置
39 ハードディスク
40 半導体メモリ
41 記憶装置

Claims (8)

  1. Web上から収集された画像を取得する画像取得部と、
    前記画像から部分画像を取得する部分画像取得部と、
    前記部分画像から特徴情報を抽出する特徴情報抽出部と、
    画像辞書を用い、前記特徴情報に基づき前記部分画像に対応するアイテムを特定するアイテム特定部と、
    前記特定したアイテムに基づき、同一画像に出現する複数のアイテムに係るアイテムの共起度を計算してアイテム共起辞書を作成するアイテム共起辞書作成部と、
    前記アイテム共起辞書を作成するために前記画像取得部が取得した画像のタイトルから、該タイトルに含まれる名詞を抽出するタイトル名詞抽出部と、
    前記抽出した名詞と、前記特定したアイテムの相関度を計算してタイトル/アイテム相関辞書を作成するタイトル/アイテム相関辞書作成部と、
    前記抽出した名詞を上位の概念とし、その名詞に関連したアイテムを下位の概念とし、さらにそのアイテムを名詞とみなし、それに関連する下位のアイテムをツリー状に構成していく空間オントロジー構成部と、
    を備える空間共起辞書作成装置。
  2. 前記画像は動画像であり、前記共起度は、該動画像を構成する全静止画像のうち少なくとも1つの静止画像に前記アイテムが出現するか否かにより判定することを特徴とする請求項1に記載の空間共起辞書作成装置。
  3. 前記共起度は、同一の画像に出現する異なる2つのアイテムに係るものであることを特徴とする請求項1または請求項2に記載の空間共起辞書作成装置。
  4. 前記共起度は、同一の画像に出現する同一の複数のアイテムに係るものであることを特徴とする請求項1または請求項2に記載の空間共起辞書作成装置。
  5. 異なる2つのアイテムの前記共起度は、前記2つのアイテムがともに出現する画像の数を、前記2つのアイテムがそれぞれ出現する画像の数のうちいずれか小さい方で除したものであることを特徴とする請求項3に記載の空間共起辞書作成装置。
  6. 異なる2つのアイテムの前記共起度は、前記2つのアイテムがともに出現する画像の数を、一方を基準として、前記基準としたアイテムが出現する画像の数で除したものであることを特徴とする請求項3に記載の空間共起辞書作成装置。
  7. 前記画像は動画像であり、前記相関度は、該動画像を構成する全静止画像のうち少なくとも1つの静止画像に前記アイテムが出現するか否かにより判定することを特徴とする請求項に記載の空間共起辞書作成装置。
  8. コンピュータを用いて、画像に出現するアイテムの共起度に係る空間共起辞書を作成する方法であって、
    前記コンピュータは、
    Web上から収集された画像を取得する画像取得ステップと、
    前記画像から部分画像を取得する部分画像取得ステップと、
    前記部分画像から特徴情報を抽出する特徴情報抽出ステップと、
    画像辞書を用い、前記特徴情報に基づきアイテムを特定するアイテム特定ステップと、
    前記特定したアイテムに基づき、同一画像に出現する複数のアイテムに係るアイテムの共起度を計算してアイテム共起辞書を作成するアイテム共起辞書作成ステップと、
    前記アイテム共起辞書を作成するために前記画像取得ステップで取得した画像のタイトルから、該タイトルに含まれる名詞を抽出するタイトル名詞抽出ステップと、
    前記抽出した名詞と、前記特定したアイテムの相関度を計算してタイトル/アイテム相関辞書を作成するタイトル/アイテム相関辞書作成ステップと、
    前記抽出した名詞を上位の概念とし、その名詞に関連したアイテムを下位の概念とし、さらにそのアイテムを名詞とみなし、それに関連する下位のアイテムをツリー状に構成していく空間オントロジー構成ステップと、
    を含む処理を行う空間共起辞書作成方法。
JP2007211836A 2007-08-15 2007-08-15 空間共起辞書作成装置及び空間共起辞書作成方法 Active JP4962961B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007211836A JP4962961B2 (ja) 2007-08-15 2007-08-15 空間共起辞書作成装置及び空間共起辞書作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007211836A JP4962961B2 (ja) 2007-08-15 2007-08-15 空間共起辞書作成装置及び空間共起辞書作成方法

Publications (2)

Publication Number Publication Date
JP2009048295A JP2009048295A (ja) 2009-03-05
JP4962961B2 true JP4962961B2 (ja) 2012-06-27

Family

ID=40500470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007211836A Active JP4962961B2 (ja) 2007-08-15 2007-08-15 空間共起辞書作成装置及び空間共起辞書作成方法

Country Status (1)

Country Link
JP (1) JP4962961B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4640155B2 (ja) * 2005-12-15 2011-03-02 ソニー株式会社 画像処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP2009048295A (ja) 2009-03-05

Similar Documents

Publication Publication Date Title
TWI710919B (zh) 資料儲存裝置、轉譯裝置及資料庫存取方法
US7913163B1 (en) Determining semantically distinct regions of a document
WO2022111249A1 (zh) 一种信息展示的方法、装置以及计算机存储介质
JP5229226B2 (ja) 情報共有システム、情報共有方法、および情報共有プログラム
JP5820320B2 (ja) 情報処理端末及び方法、並びに、情報管理装置及び方法
JP4755632B2 (ja) アイテム認識装置及びアイテム認識方法
JP4962961B2 (ja) 空間共起辞書作成装置及び空間共起辞書作成方法
JP3114465B2 (ja) 情報提示装置
JP2016045552A (ja) 特徴抽出プログラム、特徴抽出方法、および特徴抽出装置
JP2009265770A (ja) 重要文提示システム
JP4972271B2 (ja) 検索結果提示装置
KR100407033B1 (ko) 정보 모델링방법에 의해 데이터베이스를 구축하고, 구축된 데이터베이스를 이용하여 정보를 검색하는 방법,
Chang The sentient map
JP5199968B2 (ja) キーワードタイプ判定装置、キーワードタイプ判定方法およびキーワードタイプ判定プログラム
JP3967230B2 (ja) 画像情報表示システム
JP7539094B1 (ja) プログラム、方法、情報処理装置、システム
JP2013125429A (ja) 分析対象決定装置
US11687581B2 (en) Information extraction, enrichment, and caching framework for augmented reality applications
JP7542812B1 (ja) プログラム、方法、情報処理装置、システム
JP2004030021A (ja) 文書処理装置および方法
JP4983397B2 (ja) 文書検索装置、および文書検索方法、並びにコンピュータ・プログラム
JP2009266065A (ja) 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム
CN107239459B (zh) 实体联系图展示方法及装置
JP5253668B1 (ja) データベース構築装置、データベース構築方法、およびプログラム
Komaki et al. Design and implementation of a Click-Search interface for web browsing using cellular phones

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120319

R150 Certificate of patent or registration of utility model

Ref document number: 4962961

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350