JP4755632B2 - アイテム認識装置及びアイテム認識方法 - Google Patents

アイテム認識装置及びアイテム認識方法 Download PDF

Info

Publication number
JP4755632B2
JP4755632B2 JP2007211817A JP2007211817A JP4755632B2 JP 4755632 B2 JP4755632 B2 JP 4755632B2 JP 2007211817 A JP2007211817 A JP 2007211817A JP 2007211817 A JP2007211817 A JP 2007211817A JP 4755632 B2 JP4755632 B2 JP 4755632B2
Authority
JP
Japan
Prior art keywords
item
image
items
determined
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007211817A
Other languages
English (en)
Other versions
JP2009048294A (ja
Inventor
祐 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2007211817A priority Critical patent/JP4755632B2/ja
Publication of JP2009048294A publication Critical patent/JP2009048294A/ja
Application granted granted Critical
Publication of JP4755632B2 publication Critical patent/JP4755632B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、空間共起情報を利用した空間アイテム認識装置及び空間アイテム認識方法に関する。
インターネットに代表される近年のネットワーク技術及びコンピュータ技術の発達により大量の画像データを蓄積し、ユーザの要求に応じて蓄積した画像データを検索してユーザに所望の画像を提示する画像検索システムを構築する試みが行われている(例えば、特許文献1)。このような画像検索システムでは、画像(キー画像)を検索キーとして入力し、入力された検索キー画像と類似した特徴を持つ画像を提示するものが多い。
また、ユーザの端末画面に3次元の仮想空間の画像を表示し、仮想空間内においてユーザが視点を移動することに応じて、仮想的な視野に入る仮想空間内のオブジェクトを画角や距離感の変化を伴ってユーザの端末画面に表示することにより、ユーザの興味を惹き、仮想空間に臨場感をもたせる試みが、例えばセカンドライフ等のサービスによって行われている(例えば非特許文献1)。
特開2002−245048号公報 マイケル・リマズイスキー(他)著 中川 蘭丸 訳、セカンドライフ公式ガイド、インプレスR&D版、2007年05月
画像検索の技術を活用し、入力された任意の画像をテキスト文で表現することができれば、セカンドライフ等のサービスに関連し、インターネットを用いた新たな利用分野を開拓することができる。具体的な方法としては、入力された画像からエッジ処理等により部分画像を切り出し、その部分画像を画像辞書で検索し、その部分画像に対応するテキスト情報を利用することが考えられるが、もともと画像検索においては、文字検索と異なり、完全一致することは稀であり、類似の概念が存在するために、切り出した部分画像に対応するテキスト情報を一意に決め難いという問題がある。
そこで画像辞書を用いた上記方法を補完するために、画像辞書に登録されたアイテムが同時に同一の画像に出現する共起度を、現在Web上に存在する大量の画像情報から抽出蓄積した空間共起情報と、画像に付されたタイトルと、当該画像に含まれるアイテムとの関係について、その相関度を、現在Web上に存在する大量の画像情報から抽出蓄積したタイトル/アイテム相関情報とを利用することで、前記の問題、即ち、「入力された任意の画像をテキスト文で表現する」という問題に対応することができる。
そこで、本発明は、複数のアイテムが同時に同一の画像に出現する共起度が登録されたアイテム共起辞書と、画像のタイトルを構成する名詞と当該画像に含まれるアイテムとの相関度が登録されたタイトル/アイテム相関辞書を利用して、入力された空間画像に含まれるアイテム名と当該空間画像のタイトル名をテキスト情報として出力することを目的とする。
本発明者は、既存のWebページから収集した画像に基づいて作成された、画像のタイトルと、当該画像に含まれるアイテムの出現に係る相互の連関性情報を活用することにより、入力された任意の画像をテキストで自動的に表現する装置及び方法を見出し、本発明を完成するに至った。
本発明は、具体的には次のようなものを提供する。
(1)空間画像の入力を受け付ける空間画像入力部と、前記空間画像から部分画像を取得する部分画像取得部と、前記部分画像から特徴情報を抽出する特徴情報抽出部と、画像辞書を用い、前記特徴情報に基づき前記部分画像に対応するアイテムの候補を取得する候補アイテム取得部と、アイテム共起度を用いて前記アイテムの候補からアイテムを決定するアイテム決定部と、前記決定されたアイテムのアイテム名を出力するアイテム名出力部と、を備える空間アイテム認識装置。
この発明によれば、空間画像に含まれるアイテムを、画像辞書とアイテム間の共起度を用いて決定できるので、入力された空間画像に含まれるアイテムを信頼度の高いテキスト情報として出力することができる。
(2)前記空間画像は動画像であり、前記部分画像は、前記動画像を構成する静止画像から取得することを特徴とする(1)に記載の空間アイテム認識装置。
この発明によれば、動画像についても、(1)と同様の効果を発揮することができる。
(3)前記アイテム決定部で用いる前記アイテム共起度は、2つの異なるアイテムが同一画像に出現することに係るものであることを特徴とする(1)から(2)のいずれかに記載の空間アイテム認識装置。
この発明によれば、2つの異なるアイテムの同時使用性、または同時存在性を考慮してアイテムを決定できるので、類似度による判定の曖昧性を補うことができる。
(4)前記アイテム決定部で用いる前記アイテム共起度は、前記アイテムの候補のうち類似度が高いアイテムを基準としたものであることを特徴とする(3)に記載の空間アイテム認識装置。
この発明によれば、アイテム間の共起度を利用してアイテム名を決定する際に、類似度の高いアイテムを基準にして類似度の低いアイテムを決定できるので、信頼度の高いアイテムの決定を行うことができる。
(5)前記アイテム決定部で用いる前記アイテム共起度は、同一のアイテムが複数個出現することに係るものであることを特徴とする(1)から(2)のいずれかに記載の空間アイテム認識装置。
この発明によれば、同一のアイテムが複数個同時に使用される可能性を考慮してアイテム決定ができるので、実情を考慮したアイテムの決定を行うことができる。
(6)前記アイテム決定部は、前記アイテムの候補の類似度と該アイテムの候補の共起度に基づいて決定される評価値に基づいてアイテムを決定することを特徴とする(1)から(5)のいずれかに記載の空間アイテム認識装置。
この発明によれば、アイテム候補の類似度と共起度の両方に基づいて決定される評価値に基づいてアイテムを決定するので、客観性のある信頼性の高い決定を行うことができる。
(7)前記アイテム決定部は、類似度の高い候補を持つアイテムの順にアイテムの決定を行うことを特徴とする(1)から(6)のいずれかに記載の空間アイテム認識装置。
この発明によれば、信頼度が高いアイテムから順にアイテムの決定をしていくので、すべてのアイテムの決定を信頼度高く行うことができる。
(8)前記アイテム決定部は、3以上のアイテムについて決定を行う場合、最初に2つのアイテムについて決定を行い、残りのアイテムを、前記決定されたアイテムのうち類似度の高い方を用いて決定される前記評価値に基づいて1つずつ決定することを特徴とする(7)に記載の空間アイテム認識装置。
この発明によれば、もっとも信頼度の高いアイテムを最初に決定し、そのうち類似度の高い方のアイテムを用いて決定される前記評価値に基づいて、他のアイテムを1つずつ決定していくので、決定方法がシンプルで、信頼度の高いアイテムの決定を行うことができる。
(9) 前記アイテム決定部は、3以上のアイテムについて決定を行う場合、最初に2つのアイテムについて決定を行い、残りのアイテムを、前記決定されたアイテムのうち類似度の高い方を用いて決定される前記評価値と、前記決定されたアイテムのうち類似度の低い方を用いて決定される前記評価値の両方に基づいて1つずつ決定することを特徴とする(7)に記載の空間アイテム認識装置。
この発明によれば、最初に決定されたアイテムのうち類似度の高い方のアイテムを用いて決定される前記評価値と類似度の低い方のアイテムを用いて決定される評価値の両方に基づいて決定するので、類似度の高い方のアイテムを用いて決定される前記評価値だけでは決定できないような場合においても、信頼度の高いアイテムの決定を行うことができる。
(10)前記決定されたアイテムとタイトル候補名との相関度に基づき前記空間画像のタイトル名を決定するタイトル名決定部と、前記決定されたタイトル名を出力するタイトル名出力部と、を更に備える(1)から(9)のいずれかに記載の空間アイテム認識装置。
この発明によれば、空間画像に含まれるアイテムとタイトル候補名との相関度を考慮して信頼度の高い空間画像のタイトルを決定することができる。
(11)前記タイトル名決定部は、前記決定されたアイテムが複数ある場合は、該アイテムのそれぞれとタイトル候補名との相関度の積に基づいて前記タイトル名を決定することを特徴とする請求項10に記載の空間アイテム認識装置。
この発明によれば、アイテム数が増えても容易にタイトル名を決定することができる。
(12)コンピュータを用いて、空間画像をテキスト情報に変換する方法であって、空間画像の入力を受け付ける空間画像入力ステップと、前記空間画像から部分画像を取得する部分画像取得ステップと、前記部分画像から特徴情報を抽出する特徴情報抽出ステップと、画像辞書を用い、前記特徴情報に基づき前記部分画像に対応するアイテムの候補を取得する候補アイテム取得ステップと、アイテム共起度を用いて前記アイテムの候補からアイテムを決定するアイテム決定ステップと、前記決定されたアイテムのアイテム名を出力するアイテム名出力ステップと、を含む空間アイテム認識方法。
この発明によれば、(1)に記載の発明が行う処理を、コンピュータを用いて行うことができるので、(1)と同様の効果を発揮することができる。
(13)前記決定されたアイテムと、該アイテムとタイトル候補名との相関度に基づき前記空間画像のタイトル名を決定するタイトル名決定ステップと、前記決定されたタイトル名を出力するタイトル名出力ステップと、を更に含む(12)に記載の空間アイテム認識方法。
この発明によれば、(10)に記載の発明が行う処理を、コンピュータを用いて行うことができるので、(10)と同様の効果を発揮することができる。
本発明によれば、画像辞書を用いるのみならず、アイテムの類似度とアイテム間の共起度を考慮してアイテム名を、アイテムとタイトル名の相関度を考慮してタイトル名を、それぞれ決定するので、入力された空間画像を信頼度の高いアイテム名とタイトル名のテキスト情報として出力することができる。
以下、本発明を実施するための最良の形態について図を参照しながら説明する。なお、これらはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
(第1の実施形態)
[全体図]
図1は、空間アイテム認識装置1が有する機能部分、当該機能を果たす上で利用するデータベース9〜11、及び空間アイテム認識装置1への入力と出力との関係を示した全体図である。空間アイテム認識装置1は、空間画像情報の入力を受け付ける空間画像入力部2と、空間画像入力部2によって入力を受け付けた画像から部分画像を取得する部分画像取得部3と、部分画像取得部3によって取得された部分画像から特徴情報を抽出する特徴情報抽出部4と、特徴情報抽出部4によって抽出された特徴情報に基づき画像辞書DB9に記録された画像辞書を検索し、当該部分画像に係るアイテム候補名を取得する候補アイテム取得部5と、候補アイテム取得部5により取得されたアイテム候補名について、アイテム共起辞書DB10に記録されたアイテム共起辞書を参照してアイテム名を決定するアイテム決定部6と、アイテム決定部6で決定されたアイテム名に基づきタイトル/アイテム相関辞書DB11に記録されたタイトル/アイテム相関辞書を参照してタイトル名を決定するタイトル名決定部7と、それぞれ決定されたタイトル名とアイテム名を出力するタイトル名/アイテム名出力部8とを備える。なお、空間アイテム認識装置1には、空間画像情報12が画像データとして入力され、タイトル名/アイテム名情報13がテキストデータとして出力される。
[空間アイテム認識装置1のハードウェア構成]
図2は、本実施形態に係る空間アイテム認識装置1のハードウェア構成を示す図である。空間アイテム認識装置1は、制御装置30を構成するCPU(Central Processing Unit)31(マルチプロセッサ構成ではCPU32等複数のCPUが追加されてもよい)、バスライン20、通信I/F(I/F:インターフェイス)33、メインメモリ34、BIOS(Basic Input Output System)35、表示装置36、I/Oコントローラ37、並びにキーボード及びマウス等の入力装置38を備える。
通信I/F33は、空間アイテム認識装置1が、インターネット(図示せず)を介して空間画像情報を受け取る場合のネットワーク・アダプタである。通信I/F33は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。BIOS35は、空間アイテム認識装置1の起動時にCPU31が実行するブートプログラムや、空間アイテム認識装置1のハードウェアに依存するプログラム等を記録する。
表示装置36は、空間アイテム認識装置1による演算処理結果等の画面を表示するものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。I/Oコントローラ37には、ハードディスク39、及び半導体メモリ40等の記憶装置41を接続することができる。入力装置38は、空間アイテム認識装置1の管理者による入力の受け付けを行うものである。ハードディスク39は、本ハードウェアを空間アイテム認識装置1として機能させるための各種プログラム、本発明の機能を実行するプログラム及び後述するテーブルを記憶する。
以上の例は、空間アイテム認識装置1のハードウェア構成について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータを空間アイテム認識装置1として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明した空間アイテム認識装置1により実現される機能は、上述の方法を当該コンピュータにより実行することによって、あるいは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
なお、本発明でいうコンピュータとは、記憶装置、制御装置等を備えた情報処理装置をいい、空間アイテム認識装置1は、記憶装置41、制御装置30等を備えた情報処理装置により構成され、この情報処理装置は、本発明のコンピュータの概念に含まれる。ここで、図1に示した、空間画像入力部2、部分画像取得部3、特徴情報抽出部4、候補アイテム取得部5、アイテム決定部6、タイトル名決定部7及びタイトル名/アイテム名出力部8には主として制御装置30が、画像辞書DB9、アイテム共起辞書DB10及びタイトル/アイテム相関辞書DB11には記憶装置41が、それぞれ対応する。
[画像及び部分画像]
図3は、空間画像入力部2が入力を受け付ける画像の一例である。
図4は、部分画像取得部3が上記画像から取得した部分画像の例である。(a)は長椅子タイプのソファー、(b)はテーブルである。
[画像辞書]
図5は、候補アイテム取得部5で参照する画像辞書を示す図である。部分画像の特徴情報を記録した検索用タグと、当該特徴情報を有するアイテムのアイテム名やアイテム番号等のコンテンツが対応付けられて記録されている。特徴情報としては、例えば、アイテムの輪郭やアイテムを構成する色数等がある。画像辞書は、画像辞書DB9上に記録されている。
[アイテム共起辞書]
図6は、異なるアイテム間の共起関係を表すアイテム別共起度テーブルであって、アイテム共起辞書の一部を構成する。共起度とは、異なる2つのアイテムが同一の画像の中に出現する比率をいう。
例えば、母親が画像に出現しても乳児が画像に出現するとは限らないが、乳児が出現すると母親も出現する比率が高いように、アイテム番号iのアイテムiとアイテム番号jのアイテムjの2つのアイテムがある場合、アイテムiが出現したときにアイテムjが一緒に出現する比率ki_jと、アイテムjが出現したときにアイテムiが一緒に出現する比率kj_iは本来異なるものであるが、これらが異なる場合は、いずれか大きい方に合わせてki_j=kj_iとすることもできる。そのようにすると簡便な取り扱いが可能となるからである。本実施形態においては、ki_j=kj_iとすることを前提とする。アイテム別共起度テーブルは、アイテム共起辞書DB10上に記録されている。
図7は、同一のアイテム間の共起関係を表すアイテム別複数共起度テーブルであって、アイテム共起辞書の一部を構成する。あるアイテムが1つ出現した場合に同一画像内に2つ目の同一アイテムが出現する比率を第2列目、あるアイテムが2つ出現した場合に同一画像内に3つ目の同一アイテムが出現する比率を第3列目というように、1つの画像内にn個の同一アイテムが出現した場合に、同じ画像内に、(n+1)個目の同一アイテムが出現する比率を(n+1)列目に表示している。但し、6個以上の場合については省略している。しかし、必要に応じて、必要な個数まで表示するようにしてもよい。アイテム別複数共起度テーブルは、アイテム共起辞書DB10上に記録されている。
[タイトル/アイテム相関辞書]
図8は、Web上に存在する画像のタイトルに含まれる名詞と、その画像に出現したアイテムとの相関度を示したタイトル名詞アイテム相関度テーブルである。縦軸は名詞番号、横軸は拡張アイテム番号として、両者の相関度を記載したものである。名詞番号は、名詞テーブル(図9)により、拡張アイテム番号は、拡張アイテム名テーブル(図10)によりそれぞれ定義されている。タイトル名詞アイテム相関度テーブルは、タイトル/アイテム相関辞書DB11上に記録されている。
[テーブル]
図9は、名詞とその名詞番号から構成される名詞テーブルである。タイトル名決定部7によってタイトル名を決定する際に参照される。
図10は、拡張アイテム名とその拡張アイテム番号から構成される拡張アイテム名テーブルである。拡張アイテム名、拡張アイテム番号とは、同一のアイテムが複数個同時に同一画像に出現する可能性がある場合に、これらの複数個をまとめて1つの新たなアイテムとして取り扱うためにアイテム名とアイテム番号を付け、単品のアイテム名とアイテム番号とを合わせて、拡張アイテム名、拡張アイテム番号としたものである。
図11は、候補アイテムテーブルであり、候補アイテム取得部5が、部分画像取得部3により取得された部分画像について、画像辞書を参照して取得した候補アイテムのアイテム名とアイテム番号と類似度が保有される。図11(a)は、ある部分画像に対して4個の候補アイテムが取得され、それらのアイテム名が、アイテム48、アイテム11、アイテム5、アイテム63であることを示している。同様に、図11(b)は、他の部分画像に対して4個の候補アイテム、図11(c)は、更に別の部分画像に対して3つの候補アイテムが取得されたことを示している。つまり、図11は、1つの画像から取得された3つの部分画像について、画像辞書を参照して取得された候補アイテムを類似度の大きい順に表示したものである。なお、類似度とは、部分画像の持つ特徴情報と、画像辞書に登録されている特徴情報との似ている度合いである。
図12は、候補アイテム取得部5により取得された候補アイテムをその類似度とアイテム間の共起度に基づいて評価を行い、アイテム名を決定する際に使用するアイテム名決定作業用テーブルである。詳しくは、処理フローの中で説明する。
図13は、候補アイテムテーブルにおいて、アイテム名が決定された結果を表示した図である。部分画像αについてはアイテム48、部分画像βについてはアイテム65、部分画像γについてはアイテム78にそれぞれ決定された様子を示している。
図14は、同一のアイテムに係る部分画像が複数個ある場合の候補アイテムテーブルである。これらの部分画像について画像辞書を参照した結果、殆ど同じであるものの、一部は異なる候補アイテムが取得されている。部分画像によって画像が異なる上、類似度に基づく検索であるため、通常このような結果が予想される。
図15は、図14の候補アイテムテーブルに基づいて、アイテム名を決定する際に使用するアイテム名決定作業用テーブルである。詳しくは、処理フローの中で説明する。
図16は、決定されたアイテム名を記載した決定アイテムテーブルと、それを拡張した拡張決定アイテムテーブルの関係を示す図である。同一のアイテムが複数個決定された場合は、その複数個を新たな1つのアイテムとみなして、アイテム名とアイテム番号を付ける。このときのアイテム番号の付け方は、拡張アイテム名テーブル(図10)におけるアイテム番号の付け方と同様とし、アイテム名は、拡張アイテム名テーブル(図10)を検索することによって決めればよい。
図17は、タイトル名決定部7によってタイトル名を決定する際に使用するタイトル候補判定テーブルである。詳しくは、処理フローの中で説明する。
図18は、決定されたタイトル名と拡張アイテム名をタイトル名/アイテム名出力部8が出力するタイトル名/アイテム名情報である。
[処理フロー]
図19及び図20に従って、空間アイテム認識装置1の処理フローについて説明する。特に断らない限り、以下の処理は、空間アイテム認識装置1の制御装置30が行うものとする。まず、空間アイテム認識装置1が、空間画像の入力を受け付ける(S10)。空間画像は静止画であっても動画であってもよい。画像の入力の受け付けは、静止画像の場合は1枚の静止画像、動画像の場合はその動画像を構成する複数枚の静止画像を1単位として行う。
次に、取得した画像から、エッジ処理により部分画像を切り出す(S20)。静止画像であれば、1枚の画像から部分画像が切り出されるが、動画の場合は、1つの動画を構成する複数の静止画像から部分画像が切り出されることになる。そして、切り出した部分画像から特徴情報を抽出する(S30)。特徴情報としては、部分画像の輪郭や部分画像の色数等がある。このような技術は公知であり、(例えば、特開2006−114053参照)、このようにすることによって、画像に写った家具が、例えばソファーであることが認識できる。この画像の特徴量はテキストとして送信可能なので画像そのものを送信することに比べてデータ量が大幅に減少できる。
次に、画像辞書(図5)を参照し、すでに実用化されている類似画像検索技術に基づき、特徴情報の類似度が高い順にアイテム名とアイテム番号を取得する(S40)。その際、可能性の低い候補を排除するために、類似度が一定の基準(例えば20パーセント)以上のものを選ぶようにしてもよい。通常、複数個の候補アイテムが選ばれる(図11参照)。この基準は、適宜変更して、最適なものにすればよい。類似画像検索では、検索の対象となる画像から視覚的な情報を数百次元の数値列データ(画像特徴量)で示し、データ同士の似ている度合い(類似度)を、画像特徴量ベクトル間の距離、即ち、この画像特徴量の違いとして評価する。
このようにして、1つの部分画像について候補アイテムが取得されると、類似度が高い順に候補アイテムテーブル(図11)に登録し、同一画像に更に別の部分画像があれば(S50:No)、同様の処理を行う(S20〜S40)。そしてすべての部分画像が切り出されると次の処理に移る(S50:Yes)。
次に、各部分画像について取得された候補アイテムのうち、それぞれの最上位の類似度(最高類似度)を比較し、高い方から2つの候補アイテムを選ぶ。例えば、図11において、部分画像αの最高類似度は0.92、部分画像βの最高類似度は0.88、部分画像γの最高類似度は0.75であるので、部分画像αと部分画像βについて、アイテム別共起度テーブル(図6)を参照しながら、アイテム名の決定を行う。
具体的には、アイテム名決定作業用テーブル(図12(a))に、候補アイテムテーブル(図11)に登録された部分画像αと部分画像βの各候補アイテムのすべての組み合わせについてアイテム番号と類似度を記入し、更に、アイテム別共起度テーブル(図6)から、各アイテムの組み合わせに対応するアイテム共起度を記入する。
例えば、図11(a)の最初の行には、部分画像αの最も類似度が高い候補アイテム48のアイテム番号48と類似度0.92、部分画像βの最も類似度が高い候補アイテム103のアイテム番号103と類似度0.88、及び両アイテムの共起度k48_103が記入されている。そして評価値を、記入された2つの類似度と共起度の積として計算する(S60)。つまり、p48_103は、0.92×0.88×k48_103によって計算される。
このようにして各アイテムの組み合わせについて評価値を求め、最も高い評価値となった組み合わせを、部分画像αと部分画像βの最も可能性の高いアイテムとして選ぶ(S70)。この例においては、アイテム48とアイテム65の組み合わせが最も高い評価値となったと仮定している。
このようにして部分画像αと部分画像βのアイテム名を決定すると、次に、部分画像αと部分画像βについて決定されたアイテム名のどちらか一方を基準にして部分画像γのアイテム名を同様の方法で決定する(S80、S90)。どちらのアイテムを基準にするかは自由に決めてよいが、本実施形態においては、決定されたアイテムのうち、いずれか類似度の高い方を基準にすることとする。その方が、決定されたアイテムがより確実と考えられるからである。本例においては、アイテム48の類似度は0.92.アイテム65の類似度は0.75であるので、アイテム48を基準にして部分画像γの候補アイテムの中から評価値が最も高くなるアイテムを選び決定する(S90)。
この場合、部分画像αについてはアイテムが決定しているので、アイテム名決定作業用テーブルは図12(b)のようになる。評価値は、図12(a)の場合と同様に計算される。但し、この場合、部分画像αについてはアイテム48がすでに決定されているので、評価値の計算は、2つの類似度と共起度の積とせず、決定すべきアイテムの類似度と共起度の積、即ち、部分画像γの候補アイテムの類似度と共起度の積としてもよい。本例においては、アイテム48とアイテム78の組み合わせの評価値が最も高くなったものと仮定する。その結果、候補アイテムテーブルに登録された候補アイテムは図13に太枠で示したように決定される。
更に、図12(b)における評価値の計算の結果、評価値が同一となった場合は、先に決定した部分画像αのアイテム48と部分画像βのアイテム65のうち、類似度の低いアイテム65と、評価値が同一となった複数のアイテムについてアイテム名決定作業用テーブルを作成し、これに基づいて計算される評価値の高くなるアイテムを選ぶようにしてもよい。なお、それでも評価値が同一となる場合は、そのほかに決定されているアイテムがあれば、それらの中で類似度が高いアイテムを用いて同様の操作を行えばよい。
このようにして、切り出された各部分画像について作成された候補アイテムテーブル(図11)に基づいてアイテム名を順次決定していき(S100:No)、すべての部分画像についてアイテム名の決定が終了したら次の処理に移る(S100:Yes)。この場合、アイテム名の決定は、最高類似度が高い候補アイテムを持つ部分画像から順次決定していく。こうすれば、信頼度の高い順番にアイテムの決定が行われるので、先に決定したアイテムで後のアイテムを決める上で誤差が少なくなるからである。
以上の例では、各部分画像に対する候補アイテムがすべて異なっている場合について説明したが、場合によっては、候補アイテムが同じ場合もありえる。同じアイテムが2つ部分画像として1つの画像内に出現した場合や、異なるアイテムに係る部分画像であっても、候補アイテムが偶然同一となるケースもある。その場合、アイテム別共起度テーブル(図6)には同一アイテム間の共起度が定義されていないのでアイテム別複数共起度テーブル(図7)を使用することになる。
そこで、図14に従って、候補アイテムが同一となった場合について説明する。まず、図12と同様の方法で、アイテム名決定作業用テーブル(図15(a))に、候補アイテムテーブル(図11)に登録された部分画像αと部分画像βの各候補アイテムのすべての組み合わせについてアイテム番号と類似度を記入する。次に、部分画像αと部分画像βの候補アイテムが異なる場合は、アイテム別共起度テーブル(図6)から、各アイテムの組み合わせに対応するアイテム共起度を記入する。
部分画像αと部分画像βの候補アイテムが同一となる場合は、アイテム別複数共起度テーブル(図7)から、アイテム複数共起度を記入する。例えば、部分画像αと部分画像βの候補アイテムがともにアイテム48である場合、アイテム48が1つ出現した場合において2個目が出現する比率である、r48_2が用いられる。部分画像αと部分画像βの候補アイテムがともにアイテム11である場合、同様にr11_2が用いられる。
そして評価値を、記入された2つの類似度と共起度の積として計算する(S60)。つまり、p48_48は、0.92×0.88×r48_2によって計算される。このようにして各アイテムの組み合わせについて評価値を求め、最も高い評価値となった組み合わせを、部分画像αと部分画像βの最も可能性の高いアイテムとして選ぶ(S70)。この例においては、アイテム48とアイテム48の組み合わせが最も高い評価値となったと仮定している。
次に、類似の高い(0.92)、部分画像αのアイテム48に基づいて、部分画像γの候補アイテムの決定に進む。アイテム名決定作業用テーブル(図15(b))に、各候補アイテムの類似度と共起度を記入する。その際、アイテム48同士となったところは、すでに、部分画像αと部分画像βがアイテム48と決定されている上で、更に部分画像γがアイテム48になる共起度であるので、アイテム48が2つ出現した場合において3個目が出現する比率である、r48_3が用いられる。そして評価値が計算され、最も高い評価値となったものを部分画像γのアイテムとして決定する(S90)。
次に、図20に従って、説明する。まず、各部分画像について決定されたアイテムを決定アイテムテーブル(図16の左側)として作成し、それに基づいて、拡張決定アイテムテーブル(図16の右側)を作成する(S110)。
次に、拡張決定アイテムテーブル(図16の右側)の拡張アイテム番号に対応する列(タイトル名詞と拡張アイテムの相関度)をタイトル名詞アイテム相関度テーブル(図8)から抜き出し、タイトル候補判定テーブル(図17)に記入する(S120)。本例では、部分画像αについてはアイテム48、部分画像βについてはアイテム65、部分画像γについてはアイテム78がそれぞれ決定されているので、タイトル名詞アイテム相関度テーブル(図8)から拡張アイテム番号が48、65、78の列を抜き出してタイトル候補判定テーブル(図17)にセットしている。
次に、各名詞番号について各アイテムの相関度の積を評価値として計算する。その結果、評価値が最大となる名詞番号に対応する名詞を名詞テーブル(図9)から選び、タイトル名とする(S130)。このようにして、タイトル名が決定されると拡張アイテム名と併せて出力する(S140)。
このようにすることで、入力された空間画像について、画像辞書だけでは決定が困難なアイテムを、アイテム共起辞書を用いてより信頼度高く決定し、加えて、それらのアイテムと相関度の高い空間画像のタイトルを決定することができる。つまり、空間画像を入力すると、その画像に含まれるアイテムのアイテム名とその空間画像のタイトル名をテキストデータとして出力することができる。
(第2の実施形態)
第2の実施形態は、アイテム別共起度テーブル(図6)のアイテム共起度ki_jが、アイテムiが出現したときアイテムjがともに出現する比率であるように作成されているものとする。これにより、ki_jとkj_iは異なるものとなり、より厳密な利用が可能となる。以下、第1の実施形態と異なる部分のみ説明する。
[テーブル]
図21は、図12のアイテム名決定作業用テーブルの作成において、共起度の選択が2つのアイテムのどちらを基準として行うかを判断するようにしたものである。つまり、2つのアイテムの共起度を利用するとき、類似度が高いアイテムを基準として共起度を選ぶのである。理由は、類似度が高いアイテムの方が信頼性が高いアイテムであると考えられ、類似の低いアイテムが曖昧なアイテムであるので、決定順序としては、類似度の高いアイテムを基準として類似度の低いアイテムを決めるべきであり、類似度の低いアイテムを基準として類似度の高いアイテムを決めるべきではないからである。
したがって、図12(a)と比べて、部分画像βの候補アイテムの類似度が部分画像αの候補アイテムの類似度より高い場合は、共起度の指標を入れ替えている。具体的には、アイテム番号11と103、5と103、5と65、63と103、63と65、63と9の6個である。図12(b)も同様に考えるが、本例においては、アイテム番号48の類似度がアイテム番号78、43、123のいずれよりも高いので、第1の実施形態と変わらない。なお、アイテムが同一の場合、つまりi=jの場合は、この考慮は不要である。
[処理フロー]
アイテム名決定作業用テーブル(図21)は、類似度についてはアイテム名決定作業用テーブル(図12(a))と同様に作成されるが、共起度については、2つのアイテムのうち類似度の高いアイテムに基づいてアイテム別共起度テーブル(図6)の行を選び、類似度の低いアイテムに基づいて列を選んで定まるアイテム共起度を記入する。
このようにすることで、より信頼度の高いアイテムの決定を行うことができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
本発明の実施形態の一例に係る空間アイテム認識装置1が有する機能部分、当該機能を果たす上で利用するデータベース9〜11、及び空間アイテム認識装置1への入力と出力との関係を示した全体図である。 本発明の実施形態の一例に係る空間アイテム認識装置1のハードウェア構成を示す図である。 本発明の実施形態に係る空間画像入力部2が入力を受け付ける画像の一例である。 本発明の実施形態に係る部分画像取得部3が取得した部分画像の例である。 本発明の実施形態の一例に係る候補アイテム取得部5で参照する画像辞書を示す図である。 本発明の実施形態の一例に係る異なるアイテム間の共起関係を表すアイテム別共起度テーブルを示す図である。 本発明の実施形態の一例に係る同一のアイテム間の共起関係を表すアイテム別複数共起度テーブルを示す図である。 本発明の実施形態の一例に係るWeb上に存在する画像のタイトルに含まれる名詞と、その画像に出現したアイテムとの相関度を示したタイトル名詞アイテム相関度テーブルを示す図である。 本発明の実施形態の一例に係る名詞テーブルを示す図である。 本発明の実施形態の一例に係る拡張アイテム名テーブルを示す図である。 本発明の実施形態の一例に係る候補アイテムテーブルを示す図である。 本発明の第1の実施形態の一例に係るアイテム名を決定する際に使用するアイテム名決定作業用テーブルを示す図である。 本発明の実施形態の一例に係る候補アイテムテーブルについて、アイテム名が決定された様子を示す図である。 本発明の実施形態の一例に係る候補アイテムが重複する場合の候補アイテムテーブルを示す図である。 本発明の第1の実施形態の一例に係る候補アイテムが重複する場合にアイテム名を決定する際に使用するアイテム名決定作業用テーブルを示す図である。 本発明の実施形態の一例に係る決定アイテムテーブルと拡張決定アイテムテーブルの関係を示す図である。 本発明の実施形態の一例に係るタイトル名決定部7によってタイトル名を決定する際に使用するタイトル候補判定テーブルを示す図である。 本発明の実施形態の一例に係るタイトル名と拡張アイテム名をタイトル名/アイテム名出力部8が出力するタイトル名/アイテム名情報を示す図である。 本発明の実施形態の一例に係る空間アイテム認識装置1の処理のフローチャート(その1)である。 本発明の実施形態の一例に係る空間アイテム認識装置1の処理のフローチャート(その2)である。 本発明の第2の実施形態の一例に係るアイテム名を決定する際に使用するアイテム名決定作業用テーブルを示す図である。
符号の説明
1 空間アイテム認識装置
2 空間画像入力部
3 部分画像取得部
4 特徴情報抽出部
5 候補アイテム取得部
6 アイテム決定部
7 タイトル名決定部
8 タイトル名/アイテム名出力部
9 画像辞書DB
10 アイテム共起辞書DB
11 タイトル/アイテム相関辞書DB
12 空間画像情報
13 タイトル名/アイテム名情報
20 バスライン
30 制御装置
31、32 CPU(Central Processing Unit)
33 通信I/F(I/F:インターフェイス)
34 メインメモリ
35 BIOS(Basic Input Output System)
36 表示装置
37 I/Oコントローラ
38 入力装置
39 ハードディスク
40 半導体メモリ
41 記憶装置

Claims (12)

  1. 像の入力を受け付ける画像入力部と、
    記画像から部分画像を取得する部分画像取得部と、
    前記部分画像から特徴情報を抽出する特徴情報抽出部と、
    画像辞書を用い、前記特徴情報に基づき前記部分画像に対応するアイテムの候補を取得する候補アイテム取得部と、
    アイテム共起度を用いて前記アイテムの候補からアイテムを決定するアイテム決定部と、
    前記決定されたアイテムのアイテム名を出力するアイテム名出力部と、
    を備え
    前記アイテム決定部で用いる前記アイテム共起度は、前記アイテムの候補のうち類似度が高いアイテムを基準としたものであるアイテム認識装置。
  2. 記画像は動画像であり、前記部分画像は、前記動画像を構成する静止画像から取得することを特徴とする請求項1に記載のアイテム認識装置。
  3. 前記アイテム決定部で用いる前記アイテム共起度は、2つの異なるアイテムが同一画像に出現することに係るものであることを特徴とする請求項1から請求項2のいずれかに記載のアイテム認識装置。
  4. 前記アイテム決定部で用いる前記アイテム共起度は、同一のアイテムが複数個出現することに係るものであることを特徴とする請求項1から請求項のいずれかに記載のアイテム認識装置。
  5. 前記アイテム決定部は、前記アイテムの候補の類似度と該アイテムの候補の共起度に基づいて決定される評価値に基づいてアイテムを決定することを特徴とする請求項1から請求項のいずれかに記載のアイテム認識装置。
  6. 前記アイテム決定部は、類似度の高い候補を持つアイテムの順にアイテムの決定を行うことを特徴とする請求項に記載のアイテム認識装置。
  7. 前記アイテム決定部は、3以上のアイテムについて決定を行う場合、最初に2つのアイテムについて決定を行い、残りのアイテムを、前記決定されたアイテムのうち類似度の高い方を用いて決定される前記評価値に基づいて1つずつ決定することを特徴とする請求項5または請求項に記載のアイテム認識装置。
  8. 前記アイテム決定部は、3以上のアイテムについて決定を行う場合、最初に2つのアイテムについて決定を行い、残りのアイテムを、前記決定されたアイテムのうち類似度の高い方を用いて決定される前記評価値と、前記決定されたアイテムのうち類似度の低い方を用いて決定される前記評価値の両方に基づいて1つずつ決定することを特徴とする請求項5または請求項に記載のアイテム認識装置。
  9. 前記決定されたアイテムとタイトル候補名との相関度に基づき前記画像のタイトル名を決定するタイトル名決定部と、
    前記決定されたタイトル名を出力するタイトル名出力部と、
    を更に備える請求項1から請求項のいずれかに記載のアイテム認識装置。
  10. 前記タイトル名決定部は、前記決定されたアイテムが複数ある場合は、該アイテムのそれぞれとタイトル候補名との相関度の積に基づいて前記タイトル名を決定することを特徴とする請求項に記載のアイテム認識装置。
  11. アイテム認識装置が画像をテキスト情報に変換する方法であって、前記アイテム認識装置が、
    像の入力を受け付ける画像入力ステップと、
    記画像から部分画像を取得する部分画像取得ステップと、
    前記部分画像から特徴情報を抽出する特徴情報抽出ステップと、
    画像辞書を用い、前記特徴情報に基づき前記部分画像に対応するアイテムの候補を取得する候補アイテム取得ステップと、
    前記アイテムの候補のうち類似度が高いアイテムを基準としてアイテム共起度を用いて前記アイテムの候補からアイテムを決定するアイテム決定ステップと、
    前記決定されたアイテムのアイテム名を出力するアイテム名出力ステップと、
    実行する方法。
  12. 前記アイテム認識装置が、
    前記決定されたアイテムと、該アイテムとタイトル候補名との相関度に基づき前記画像のタイトル名を決定するタイトル名決定ステップと、
    アイテム認識装置が前記決定されたタイトル名を出力するタイトル名出力ステップと、
    を更に実行する請求項11に記載の方法。
JP2007211817A 2007-08-15 2007-08-15 アイテム認識装置及びアイテム認識方法 Active JP4755632B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007211817A JP4755632B2 (ja) 2007-08-15 2007-08-15 アイテム認識装置及びアイテム認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007211817A JP4755632B2 (ja) 2007-08-15 2007-08-15 アイテム認識装置及びアイテム認識方法

Publications (2)

Publication Number Publication Date
JP2009048294A JP2009048294A (ja) 2009-03-05
JP4755632B2 true JP4755632B2 (ja) 2011-08-24

Family

ID=40500469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007211817A Active JP4755632B2 (ja) 2007-08-15 2007-08-15 アイテム認識装置及びアイテム認識方法

Country Status (1)

Country Link
JP (1) JP4755632B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5823270B2 (ja) * 2011-11-30 2015-11-25 Kddi株式会社 画像認識装置及び方法
JP5840074B2 (ja) * 2012-05-31 2016-01-06 三菱電機株式会社 画像処理装置
JP6235414B2 (ja) * 2014-06-06 2017-11-22 株式会社デンソーアイティーラボラトリ 特徴量演算装置、特徴量演算方法、及び特徴量演算プログラム
US10474949B2 (en) * 2014-08-19 2019-11-12 Qualcomm Incorporated Knowledge-graph biased classification for data
WO2023032345A1 (ja) * 2021-09-02 2023-03-09 富士フイルム株式会社 情報処理装置、方法およびプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09198407A (ja) * 1996-01-16 1997-07-31 Nec Corp 情報提示装置
JP2002245048A (ja) * 2001-02-20 2002-08-30 Mitsubishi Electric Corp 画像検索方法および画像検索装置
JP4098021B2 (ja) * 2002-07-30 2008-06-11 富士フイルム株式会社 シーン識別方法および装置ならびにプログラム
JP2007026386A (ja) * 2005-07-21 2007-02-01 Fuji Xerox Co Ltd 画像検索システム及び方法
JP4019093B2 (ja) * 2005-10-25 2007-12-05 株式会社日立製作所 類似画像検索方法および装置
JP4640155B2 (ja) * 2005-12-15 2011-03-02 ソニー株式会社 画像処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP2009048294A (ja) 2009-03-05

Similar Documents

Publication Publication Date Title
JP3598211B2 (ja) 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体
RU2390833C2 (ru) Способ и система для идентификации связанности изображения, используя анализ ссылок и компоновки страницы
US20120078936A1 (en) Visual-cue refinement of user query results
JP5915326B2 (ja) 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
JP4969554B2 (ja) トピックグラフを利用したドキュメント検索サーバ及び方法
EP2895967A1 (en) Gesture-based search queries
JP4755632B2 (ja) アイテム認識装置及びアイテム認識方法
US20090024616A1 (en) Content retrieving device and retrieving method
CN112839261A (zh) 一种提升语音指令匹配度的方法及显示设备
CN105765564A (zh) 标识语义上有意义的文本选择
TWI674511B (zh) 商品資訊顯示系統、商品資訊顯示方法、及程式產品
JP5141152B2 (ja) テキスト解析プログラム、テキスト解析方法、およびテキスト解析装置
JP2011238159A (ja) 計算機システム
JP2008021139A (ja) 意味タグ付け用モデル構築装置、意味タグ付け装置及びコンピュータプログラム
JP4972271B2 (ja) 検索結果提示装置
JP2009075662A (ja) 検索支援装置
JP7098897B2 (ja) 画像処理装置、プログラム及び画像データ
JP2010009237A (ja) 多言語間類似文書検索装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体
JP2014199476A (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP4962961B2 (ja) 空間共起辞書作成装置及び空間共起辞書作成方法
JP2004246398A (ja) ユーザ意図推定装置,ユーザ意図推定方法,ユーザ意図推定プログラムおよびそのプログラムの記録媒体,並びに自動辞書引き装置,自動辞書引き処理方法,自動辞書引き処理プログラムおよびそのプログラムの記録媒体
US20230096564A1 (en) Chunking execution system, chunking execution method, and information storage medium
JP2006039811A (ja) ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置
JP2008225561A (ja) 相互に関係する固有表現の組抽出装置及びその方法
JP2016009233A (ja) 検索装置及び検索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110527

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4755632

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250