JP5353299B2 - 画像検索システム、画像検索装置、及び画像検索方法 - Google Patents

画像検索システム、画像検索装置、及び画像検索方法 Download PDF

Info

Publication number
JP5353299B2
JP5353299B2 JP2009042883A JP2009042883A JP5353299B2 JP 5353299 B2 JP5353299 B2 JP 5353299B2 JP 2009042883 A JP2009042883 A JP 2009042883A JP 2009042883 A JP2009042883 A JP 2009042883A JP 5353299 B2 JP5353299 B2 JP 5353299B2
Authority
JP
Japan
Prior art keywords
image
input
search
partial
partial image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009042883A
Other languages
English (en)
Other versions
JP2010198365A (ja
Inventor
利夫 宮澤
隆弘 古川
修 足立
俊二 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2009042883A priority Critical patent/JP5353299B2/ja
Publication of JP2010198365A publication Critical patent/JP2010198365A/ja
Application granted granted Critical
Publication of JP5353299B2 publication Critical patent/JP5353299B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像検索システム、画像検索装置、情報端末、及び画像検索方法の分野に関する。
近年、画像読取装置付き携帯情報端末が広く普及している。特にカメラ付き携帯電話は、各種アプリケーションや通信機能などを備え、その用途や使い方において新たな可能性を広げている。
このようなカメラ付き携帯電話の使い方の一例として、特許文献1に記載される発明が挙げられる。ユーザはカメラ機能付き携帯電話で気になる商品を撮影し、撮影した画像データをインターネットを介してサーバに送信する。サーバは、様々な商品や人物、ロゴマークなどの画像を登録したDB(Data Base)と、DB内の画像データの関連情報を登録したDBを有しており、画像データに対して画像認識処理を行い、DB内の画像データから、画像データと一致度の高いデータを検索し、関連情報DBから対応する関連情報を抽出する。関連情報は、インターネットを介してユーザに提示される。ユーザは、撮影した画像データを送信するだけで気になる商品の関連情報が得られることが記載されている。
ところで、一般のインターネット上の検索エンジンにおいては、テキストを入力し、その入力ワードをキーとして関連するHTML文書等を検索するものであるため、検索方法としてはテキスト検索方式と分類できる。他に、インターネット上でも画像検索と呼ばれる検索方法も登場してきてはいるが、テキストを入力し、その入力ワードをキーとして、画像毎に関連付けられたキーワードで検索して紐付く画像を出力するものであるため、これもまた検索方法としてはテキスト検索方式であるといえる。
これに対して、入力された画像を検索画像として関連する画像(及び関連情報)を検索する検索方法は、画像検索方式といえる。前述のカメラ付き携帯電話の例で用いられる技術は、この画像検索方式である。ユーザがカメラ付携帯電話などを利用して対象を撮影し、撮影によって得られた対象画像をクエリ(検索画像)として、一致度の高い画像(データ)を検索する技術である。
このような画像検索技術は、例えば特許文献2や非特許文献1が詳しい。DBには予め電子文書が格納されており、ユーザは携帯電話付属のカメラで紙文書の一部を撮影し画像を取得すると、撮影画像に基づいて画像検索装置により該当する電子文書が検索されるものである。特にこれら文献に記載される画像検索技術は、紙文書の一部画像からでも該当する電子文書を検索できる点、撮影された一部画像の電子文書における位置/箇所が特定できる点で優れている。
しかしながら、いずれの画像検索技術においても、入力画像(撮影画像)からのみでは、検索結果として一の電子文書に特定しきれない場合がある。
特許文献1においては、対象(物)の一部を撮影しその画像データに基づいて画像認識処理およびメタデータ抽出処理を行い、対応するデータを特定する方法が記載されているが、一意に特定できなかった場合の対応が記載されておらず、複数の画像(及び関連情報)が検索されてくる場合がある。
特許文献2や非特許文献1においても、入力画像が電子文書の一部画像ゆえ、検索結果として複数の画像が検索される場合がある。全体的には全く異なる画像であっても部分的に近似する画像であれば同一(又は近似)画像である、として検索されうるからである。また携帯の情報端末による撮影ゆえ、入力画像において大いにゆがみが生じる場合が想定される。手操作による撮影の為必ずしもきれいに撮影できるとは限らず、オリジナルの電子文書と程遠い画像が入力されれば、一意に絞り込むことはより困難となる。
検索結果として複数の電子文書が取得された場合、或いは取得された文書がなかった場合、検索を反復的に行うこと、また各反復はテキストパターンの異なる部分集合を使うことも考えられるが(例えば特許文献2参照)、その具体的な方法について十分提案されていない。また単純に、検索された複数の候補画像を提示してユーザに選択させたり、書誌情報や属性情報の入力を促して最終的に一の画像に絞り込む方法も考えられる。図1に、従来の複数の候補画像の絞込みを促す画面の一例を示しておく。(a)は、検索された複数の候補画像を画面に表示させ、ユーザに一の画像を選択させるようにした画面表示例であり、(b)は、電子文書の書籍名・書写書誌の情報の追加入力を促して一の画像に絞り込めるようにした画面表示例である。図に示されるこれらの手法は従来から馴染みのある絞込み手法といえる。
以上本発明では上記のような問題に鑑みて、一部画像に基づいて、電子画像を好適に検索する画像検索システム、画像検索装置、情報端末、画像検索方法を提供することを目的とする。より具体的には、一部画像に基づいて検索された候補画像が複数ある場合に、複数の候補画像から意図する電子画像を一意に絞り込む新たな画像検索システム、画像検索装置、情報端末、画像検索方法を本発明により提案する。
そこで上記課題を解決するため、本発明に係る画像検索システムは、画像入力装置を有する情報端末と、検索の対象となる対象画像が記憶された記憶装置と、前記画像入力装置により入力された入力画像に基づいて前記入力画像を一部に含む対象画像を前記記憶装置から検索する画像検索装置とからなる画像検索システムであって、前記画像検索装置は、前記画像入力装置により入力された第一の入力画像に基づいて、前記第一の入力画像を一部に含む対象画像を前記記憶装置から検索する検索手段と、前記検索手段により前記第一の入力画像を一部に含む対象画像の候補画像が複数検索されたとき、当該候補画像に基づいて、当該候補画像から一の対象画像を特定するに推奨される第二の入力画像を算出する推奨部分画像算出手段と、算出された第二の入力画像を前記情報端末に要求する推奨部分画像要求手段とを有し、前記検索手段は、前記情報端末から入力された第二の入力画像に基づいて、前記第二の入力画像を一部に含む対象画像を前記候補画像から検索して一の対象画像を特定し、前記情報端末は、前記画像検索装置から前記第二の入力画像の要求を受信する推奨部分画像要求受信手段と、受信された第二の入力画像の要求に基づき、前記対象画像に対応する被写体において、前記第二の入力画像として入力が推奨される部分を明示的に表示する推奨部分表示手段とを有する。
また上記課題を解決するため、前記画像検索システムにおいて、前記第二の入力画像は、複数の前記候補画像において画素値間の差分が最も大きい部分を含む画像であることを特徴とする。
また上記課題を解決するため、前記画像検索システムにおいて、前記検索手段は、前記画像入力装置により入力された第一の入力画像の一部に基づいて、前記第一の入力画像の一部を一部に含む対象画像を前記記憶装置から検索し、前記推奨部分画像算出手段は、算出した第二の入力画像が、入力された当該第一の入力画像に含まれるとき、記推奨部分画像要求手段は、第二の入力画像を前記情報端末に要求せず、前記検索手段は、当該第一の入力画像に含まれる第二の入力画像に基づいて、前記第二の入力画像を一部に含む対象画像を前記候補画像から検索して一の対象画像を特定することを特徴とする。
なお、本発明の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、などに適用したものも本発明の態様として有効である。
本発明によれば、一部画像に基づいて、電子画像を好適に検索する画像検索システム、画像検索装置、情報端末、画像検索方法を提供することができる。
従来の複数の候補画像の絞込みを促す画面の一例を示す図である。 本発明に係る一実施形態におけるシステム構成図の一例である。 本発明に係る画像検索サーバ1の一実施形態の主要構成を示すハードウェア構成図である。 画像検索サーバ1の一実施形態の主要機能構成を示す機能ブロック図である。 入力画像と対象画像の大小関係を示す図の一例である。 画像検索サーバ1と情報端末3の動作を説明するシーケンス図である。 推奨部分画像の入力を促す画面の一例を示す図である。 検索結果を表示する画面の一例を示す図である。 画像検索サーバ1に焦点を当てた対象画像検索処理を説明するフローチャート図である。 推奨部分画像算出処理を概念的に説明する図の一例である。 各候補画像の差分値を表現した図の一例である。 検索画像と入力画像と対象画像の大小関係を示す図の一例である。
以下、本発明を実施するための形態を各実施形態において図面を用いて説明する。
[実施形態1]
<構成>
はじめに、具体的な発明の内容を説明する前に、本発明を実施するにあたってのシステム構成について説明する。図2は、本発明に係る一実施形態におけるシステム構成図の一例である。画像検索サーバ1、記憶装置2、及び情報端末3が、ネットワーク(情報通信網)4を介して接続されている。画像検索サーバ1は、情報端末3に画像検索サービスを提供する画像検索装置である。情報端末3から入力された画像に基づいて、記憶装置2内からこれに一致する画像(電子文書)を検索する。記憶装置2には、検索対象となる画像(電子文書)が予め格納されている。情報端末3は、画像撮影装置(デジタルカメラ等)や表示装置(表示画面)を備える携帯情報処理端末である。PDA(Personal Digital Assistants)、携帯電話等の情報処理機器から構成され、ウェブブラウザ(ウェブコンテンツ閲覧ソフトウェア)を備える。ネットワーク4は、電話通信網、情報通信網、インターネット網を含む。
紙文書5は、情報端末3の被写体であり、例えば新聞や雑誌である。情報端末3を使用して紙文書5の一部画像を撮影し、画像検索サーバ1に撮影された一部画像をネットワーク4を介して送信する。画像検索サーバ1は、入力された一部画像に基づいて、記憶装置2内からこれに一致する(であろう)画像を検索(取得)する。検索された画像は、情報端末3に送信され、表示装置(表示画面)に表示される。
なお、記憶装置2は画像検索サーバ1と同一筐体内の装置として構成してもよいし、ネットワーク4上に別途構築されてもよい。また情報端末3に画像検索サーバ1の有する画像検索機能を持たせるように構成することもできる。即ち、図中に示されるシステム構成はあくまで一例であり、本発明に係る各機能(詳細後述)を一に統合させてもネットワーク4上に分散して接続しようともその実現は可能である。以下各々詳しく説明する。
(画像検索サーバ)
図3は、本発明に係る画像検索サーバ1の一実施形態の主要構成を示すハードウェア構成図である。画像検索サーバ1のハードウェア構成について簡単に説明しておく。画像検索サーバ1は、例えば一般的な情報処理装置でもよく、主要な構成として、CPU101、ROM(Read Only Memory)102、RAM(Random Access Memory)103、補助記憶装置104、記憶媒体読取装置105、入力装置106、表示装置107、及び通信装置108を含む構成である。
CPU101は、マイクロプロセッサ及びその周辺回路から構成され、PC1全体を制御する回路である。また、ROM102は、CPU101で実行される所定の制御プログラム(ソフトウェア部品)を格納するメモリであり、RAM103は、CPU101がROM102に格納された所定の制御プログラム(ソフトウェア部品)を実行して各種の制御を行うときの作業エリア(ワーク領域)として使用するメモリである。
補助記憶装置104は、汎用のOS(Operating System)、各種情報を格納する装置であり、不揮発性の記憶装置であるHDD(Hard Disk Drive)などが用いられる。なお、上記各種情報は、補助記憶装置104以外にも、CD−ROM(Compact Disk - ROM)やDVD(Digital Versatile Disk)などの記憶媒体やその他のメディアを記憶されてもよく、これらの記憶媒体に格納された各種情報は、記憶媒体読取装置105などのドライブ装置を介して読み取ることが可能である。また補助記憶装置104は、上記の記憶装置2を含んで構築されるものとする。
入力装置106は、サーバ管理者が各種入力操作を行うための装置である。入力装置106は、マウス、キーボードなどを含む。表示装置107は、いわゆるディスプレイで例えばLCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)などから構成される。次に、通信装置108は、ネットワーク4を介して情報端末3との通信を行う装置である。有線ネットワークや無線ネットワークなど含む各種ネットワーク形態に応じた通信をサポートする。
図4は、画像検索サーバ1の一実施形態の主要機能構成を示す機能ブロック図である。画像検索サーバ1は、主な機能部として、部分画像受付部401、検索部402、検索結果出力部403、推奨部分画像算出部404、推奨部分画像要求部405、DB406、候補画像メモリ407を含む構成である。各機能部の機能動作については再度詳細に説明を行うので、ここでは簡単に説明する。
部分画像受付部401は、情報端末3から入力された部分画像(推奨部分画像含む)の受付を行なう機能を有している。即ち、画像入力装置から検索画像(クエリ)を受け付ける機能を有する。
検索部402は、情報端末3から入力された部分画像(第一の入力画像)に基づいて、部分画像を一部に含む対象画像をDB406から検索する機能を有している。また、情報端末3から入力された推奨部分画像(第二の入力画像)に基づいて、推奨部分画像を一部に含む対象画像を、候補画像から検索する機能を有している。候補画像は、部分画像(第一の入力画像)に基づく検索では、該当する一の対象画像に絞りきることができない場合の、対象画像の候補とされる複数の画像をいう。
検索結果出力部403は、入力画像に基づいてDB406から検索された対象画像を、検索結果として情報端末3に出力する機能を有している。
推奨部分画像算出部404は、複数の候補画像が検索されてきたとき、当該候補画像に基づいて、当該候補画像から一の対象画像を特定するに推奨される推奨部分画像(第二の入力画像)を算出する機能を有している。推奨部分画像は複数の候補画像に基づき算出され、複数の候補画像の中から一の対象画像を特定する為に用いられる。画像検索サーバ1側が複数の候補画像の中から一の対象画像を特定する為、情報端末3に対してその特定用途に推奨する部分画像である。詳細は再度後述する。
推奨部分画像要求部405は、推奨部分画像を情報端末3に要求し、ユーザに推奨部分画像の入力を促す機能を有している。
DB406は、検索の対象となる対象画像(電子文書)が予め格納されている。また対象画像毎に、対応する文書情報(文書名、発行者、発効日、属性情報等)も付されている。候補画像メモリ407は、前述の候補画像を一時的に格納するメモリである。推奨部分画像算出部404が推奨部分画像の算出に際し、候補画像メモリ407から候補画像を取得する。
なお上記説明したこれらの機能は、実際にはCPU101が実行するプログラムによりコンピュータ(画像検索サーバ1)に実現させるものである。
(画像)
次に本実施形態に係る画像に関し言及しておく。図5は、入力画像と対象画像の大小関係を示す図の一例である。
入力画像(撮影画像)501は、画像検索サーバ1に入力される部分画像である。つまり具体的には、情報端末3付属のカメラで紙文書(例えば新聞紙)502の一部を撮影したものである。被写体である紙文書の一部を撮影した画像であるので、一部画像という。この一部画像は、対象画像検索の為に検索画像(クエリ)として使用される。なお図の例では、新聞紙502の左上付近が撮影されて一部画像として取得されている。
対象画像503は、DB406に格納され検索の対象となる検索対象画像であり、前述の紙文書(新聞紙)502に対応する電子文書である。従って、入力画像501と対象画像503の大小関係としては、入力画像は対象画像より小さくなる。
<動作>
図6は、画像検索サーバ1と情報端末3の動作を説明するシーケンス図である。具体的には、画像検索に際し、情報端末3と画像検索サーバ1との全体的なやり取りを説明するものである。以下、順(ステップ)を追って説明していく。
まず情報端末3で、紙文書から一部画像が取得(撮影)される(S601)。取得された一部画像は、画像検索サーバ1に送信される(S602)。言い換えれば、まずユーザは情報端末3付属のカメラで紙文書(被写体)を撮影し、これを一部画像として画像検索サーバ1に送信する。なお、紙文書の撮影箇所は、紙面上の任意の箇所が撮影されたものとする。
部分画像受付部401は一部画像を受付けると、検索部402はその一部画像に基づいて、部分画像を一部に含む対象画像をDB406から検索する。検索方法は、例えば、前述の非特許文献1に記載される検索技術が適用できる。勿論、これ以外にも一部画像に基づいて対象画像を検索できる検索方法によってもよい。ここではこの検索処理により一の対象画像に絞ることができず、複数の対象画像(候補画像)が検索されたものとする。本発明の画像検索サーバ1は、候補画像の中から如何に一の対象画像を特定するかに係るものであるからである。
因みに、入力された画像が新聞紙や雑誌等から取得された一部画像である場合、見出しやレイアウト枠、広告欄といった箇所は、紙面上共通している場合も多く、一部画像がそのような箇所が撮影されたものであると、一の対象画像に絞ること難しい。よって全体的には全く異なる画像であっても部分的に近似する画像であれば同一(又は近似)画像であるとして検索される可能性が大きいのである。また情報端末3による撮影ゆえ、入力画像において大いにゆがみが生じる場合も想定される。手操作による撮影の為必ずしもきれいに撮影できるとは限らず、オリジナルの電子文書と程遠い画像が入力されれば、一意に絞り込むことはより困難となる。従って、一回の検索処理(一の入力画像)により一の対象画像に絞れず、複数の対象画像(候補画像)が検索されてくることがある。
再び図6に戻り、検索結果出力部403は、通常、検索された対象画像を検索結果として情報端末3に出力するが、ここでは一の対象画像を特定できなかった為、その出力を保留し検索された複数の候補画像を候補画像メモリ407に一時的に保存する(S604)。また同時に推奨部分画像算出部404に対し、推奨部分画像を算出するよう命令を行なう。
推奨部分画像算出部404は、複数の候補画像が検索されてきたので、当該候補画像に基づいて、推奨部分画像を算出する(S605)。推奨部分画像は、候補画像から一の対象画像を特定するに用いられる画像であり、一の対象画像に特定し易いように画像検索サーバ1側で情報端末3に対して推奨する画像である。一先ず説明を進め、推奨部分画像の算出については後述する。
推奨部分画像要求部405は、推奨部分画像を情報端末3に要求し(S606)、ユーザに推奨部分画像の入力を促す。
情報端末3は、推奨部分画像の要求を受け、これに従って推奨される部分画像の取得(撮影)を行なう(S607)。情報端末3は、既に一部画像を取得しているが(S601)、要求に従って、紙文書から先の一部画像と異なる部分の画像の取得を行なうのである。どこの部分を撮影すべきかについて、推奨部分画像の要求により具体的にその箇所が推奨されている。取得された推奨部分画像は、画像検索サーバ1に送信される(S608)。
図7に、推奨部分画像の入力を促す画面の一例を示す。情報端末3の表示画面には、紙文書(被写体)全体において、先に入力した一部画像に該当する検索該当部分と、あらたに画像取得を要求する箇所(推奨部分)とが明示的に表示されている。ユーザは情報端末3の表示画面でこの表示を確認してから、紙文書(被写体)の推奨部分(付近)を付属のカメラで再び撮影し、これを推奨部分画像として画像検索サーバ1に送信する。なお、図7に示されるような対象画像の全体(全体枠)は、例えば、初回の検索(図6のS603)において、複数の候補画像を検索しつつも、その候補画像の中から最も入力された一部画像と近しいと推定される代表画像を暫定的に利用して、この代表画像の全体画像上に、推奨部分画像を表示するとよい。
検索部402は、入力された推奨部分画像に基づいて、推奨部分画像を一部に含む対象画像を、候補画像メモリ407内の候補画像から検索する(S609)。即ち、推奨部分画像に基づいて、候補画像から一の対象画像に絞りきる。検索方法は、前述と同様の検索部402の有する検索技術によればよい。なお、仮にここで候補画像から一の対象画像に絞りきれない場合、その候補画像を候補画像メモリ407に再び保存し(S604)、改めてその候補画像から推奨部分画像を算出する上述の動作を繰り返すことができる。
検索結果出力部403は、一の対象画像を、検索結果として情報端末3に出力する。情報端末3は、自身が備える表示装置に対象画像を表示させる(S611)。図8に、検索結果を表示する画面の一例を示す。最終的に一の対象画像が検索され、情報端末3において、文書情報(文書名、発行者、発効日、属性情報等)とともに表示されている。以上、図6を用いて全体的な検索処理動作の説明を行った。
図9は、画像検索サーバ1に焦点を当てた対象画像検索処理を説明するフローチャート図である。前述のシーケンスと重複する点もあるが確認的に説明を行う。
情報端末3で、紙文書から一部画像が取得(撮影)され、画像検索サーバ1に送信される。そして、部分画像受付部401は一部画像を受付けると、検索部402はその一部画像に基づいて、部分画像を一部に含む対象画像をDB406から検索する(S901)。
S902において、検索された対象画像(候補画像)が複数である場合は、推奨部分画像算出処理へ進む。一方、検索された対象画像が複数でない場合、即ち一の対象画像に特定されたことになるので処理を終了する。
推奨部分画像算出部404は、複数の候補画像が検索されてきたので、当該候補画像に基づいて、情報端末3に入力要求すべき推奨部分画像を算出する(S903)。
S904では情報端末3から推奨部分画像の入力を待機している状態にあり、推奨部分画像を取得すると、検索部402は、情報端末3から入力された推奨部分画像に基づいて、推奨部分画像を一部に含む対象画像を、候補画像メモリ407内の候補画像から検索する(再びS901)。即ち、推奨部分画像に基づいて、候補画像から一の対象画像に絞りきる。一の対象画像に絞りきれた場合、S902に遷移して処理を終了する。
ここで候補画像から一の対象画像に絞りきれない場合、その候補画像を候補画像メモリ407に再び保存し、その候補画像から推奨部分画像を算出する上述の動作を繰り返すことができる。続いて、推奨部分画像算出部404の推奨部分画像算出処理(S605)を詳しく説明する。
(推奨部分画像算出処理)
前述したように、推奨部分画像算出部404は、複数の候補画像が検索されたとき、当該候補画像に基づいて、推奨部分画像を算出する。推奨部分画像は、候補画像から一の対象画像を特定するに用いられる画像であり、一の対象画像に特定し易いように画像検索サーバ1側で情報端末3に対して推奨する画像である。即ち、推奨部分画像算出部404は、複数の候補画像を解析し、画像として相互に類似していない箇所/部分を特定する。そして、複数の候補画像から一の対象画像を特定する際に、その相互に類似していない箇所(推奨部分画像)を検索画像(クエリ)として用いることにより、精度よく所望される一の対象画像を特定する。
図10は、推奨部分画像算出処理を概念的に説明する図の一例である。図に示されるように、3つの候補画像が検索されている。
推奨部分画像算出するにあたって、推奨部分画像算出部404は、処理を行い易くする為、候補画像の大きさがそれぞれ異なる場合に、まず全ての候補画像に対して正規化処理を行いその大きさを統一する。例えば、候補画像データの縦の画素数の最大値、横の画素数の最大値をそれぞれHmax、Wmaxとして、候補画像データの縦、横の画素数が、Hmax、Wmaxとなるように拡大処理(画素の補間処理)を行うことで実現できる。
次に複数の候補画像から2の候補画像を取得する。ここでは、まず候補画像1と候補画像2を取得する。そして、画素(X,Y)毎にR、G、B値の差の絶対値の和をとる。具体的に、候補画像1と候補画像2において、ある画素の座標(x,y)におけるR、G、B値の差の絶対値の和、D12(x,y)は、
D12(x,y)=|R1(x,y)−R2(x,y)|+|G1(x,y)−G2(x,y)|+|B1(x,y)−B2(x,y)|
と表現できる。
そして同様に、候補画像1と候補画像3、候補画像2と候補画像3においても同様に、ある画素の座標(x,y)におけるR、G、B値の差の絶対値の和、D13(x,y)及びD23(x,y)は、
D13(x,y)=|R1(x,y)−R3(x,y)|+|G1(x,y)−G3(x,y)|+|B1(x,y)−B3(x,y)| ,
D23(x,y)=|R2(x,y)−R3(x,y)|+|G2(x,y)−G3(x,y)|+|B2(x,y)−B3(x,y)|
と表現できる。
そして、候補画像1と候補画像2、候補画像1と候補画像3、候補画像2と候補画像3において、ある画素の座標(x,y)における全候補画像のR、G、B値の差の絶対値の和は、
D123(X,Y)=D12(x,y)+D13(x,y)+D23(x,y)
と表現できる。
図11は、各候補画像の差分値を表現した図の一例である。特に、図11(a)は、候補画像1−3の同一サイズの画像において、xy座標が対応する画素位置毎に、全候補画像のR、G、B値の差の絶対値の和であるD123(X,Y)を表現したものである。各座標内ではそれぞれこの値を有する。そして、(a)について所定ブロック(n×m:n、m>0)に分割したものを(b)に示す。また、図中の斜線部分はD123(X,Y)の値が、比較的大きい部分を示している。さらに、(c)に示されるように、ブロック毎のD123(X,Y)の値の総和を算出し、最も総和の値が大きい箇所を算出する。また、総和の値が所定の閾値以上であるブロックをいくつか算出してもよい。このように算出されたブロックに相当する箇所が、推奨部分画像(推奨部分画像の箇所)とされる。総和の値が所定の閾値以上であるブロックがいくつか算出された場合は、これら複数を推奨部分画像として、情報端末3に選択的に要求することもできる。再び図7を参照すると、対象文書(電子文書)上において、推奨部分画像(丸斜線部)は、先の最も総和の値が大きいブロックに対応するように、表示されている。勿論、推奨部分画像(丸斜線部)は、他にも例えば、色で表示する、ハッチングで表示する、矩形枠で表示する、周辺色と反転した色で表示する等、ユーザがわかり易く認識できるように表示されるとよい。
なお、図11(a)において、初回の検索時に入力された一部画像に対応する座標では、D123(X,Y)の値を0にするなどしておくとよい。一部画像に対応(相当)するブロックが推奨部分画像相当に選択され、再度一部画像と同一の画像が検索画像(クエリ)として使用されないようにする為である。
ところで、図7に示されるような対象画像の全体(全体枠)をどのように表現するかという問題がある。例えば、初回の検索(図6のS603)において、複数の候補画像を検索しつつも、その候補画像の中から最も入力された一部画像と近しいと推定される代表画像を暫定的に利用して、この代表画像の全体画像上に、推奨部分画像を表示するとよい。また他にも、抽象的に仮の対象画像を表示しその枠型のみ表示する、単純に候補画像1の画像を表示する、全候補画像1−3(又は所定の候補画像まで、ある閾値を超えた候補まで)の正規化処理後の複数の候補画像の画素値(カラーの場合はRGBそれぞれ)の平均値を使って対象画像全体(全体枠)を作成する方法等がある。
以上のように、画像検索サーバ1は、一の部分画像からのみでは一の対象画像を検索しきれない場合、候補画像から一の対象画像に特定し易い推奨部分画像を、情報端末3に要求する。推奨部分画像は、複数の候補画像において画像として相互に差異が顕著である箇所を含む画像であるので、画像検索サーバ1は情報端末3から推奨部分画像を取得すれば、候補画像から一の対象画像を精度よく特定することが可能となる。
また情報端末3(ユーザ側)にとっても、情報端末3の表示画面を確認し具体的に紙文書(被写体)のどの箇所(付近)をカメラで再び撮影すればよいのか一目瞭然であるため、漠然と一部画像を再送信というような場合に比べて、使い勝手が非常によい。
[実施形態2]
図12は、検索画像と入力画像と対象画像の大小関係を示す図の一例である。本実施形態では、上述の実施形態1に比して、検索画像(クエリ)として使用される画像の点で異なっている。図5と対比的に説明する。図5においては、入力画像(撮影画像)501は、情報端末3付属のカメラで紙文書(例えば新聞紙)502の一部を撮影した一部画像であった。そしてこの一部画像は、対象画像検索の為に検索画像(クエリ)として使用された。
しかしながらこれに対し、本実施形態においては、図12に示されるように、一部画像と検索画像(クエリ)504とは等しくない。つまり、検索画像504は、一部画像501の一部が使用されるのである。従って、検索画像504と、入力された一部画像501と、対象画像503との大小関係としては、小さい順に、検索画像504、一部画像501、対象画像503の順となる。このように本実施形態においては、撮影された入力画像(一部画像)のさらにその一部を検索画像として使用する。
このように構成することで、まず検索画像が小さくなる分、検索処理が高速になる。さらに、推奨部分画像算出部404が推奨部分画像を算出するとき、算出された推奨部分画像が、一部画像501に含まれていれば(且つ検索画像504以外の領域部分)、推奨部分画像要求部405が推奨部分画像を要求し、情報端末3が推奨部分画像を取得(撮影)して画像検索サーバ1に再度送信する操作を削減できる。つまり、推奨部分画像を算出される際、推奨部分画像とされる画像が一部画像501に含まれていれば、既に当該推奨部分画像が取得されていることになるので、情報端末3側で当該推奨部分画像を取得する必要はないのである。
また先の実施形態1において、総和の値が所定の閾値以上であるブロックをいくつか算出し、複数の推奨部分画像を算出する方法を述べた。これに関連して、複数の推奨部分画像が算出されたとき、この複数の推奨部分画像の中に一部画像501に含まれている推奨部分画像があれば、この推奨部分画像を最優先に(複数の候補画像から一の対象画像の検索処理に)使用する。こうすることにより一部画像501を再利用できる可能性はより高まり、即ち情報端末3が推奨部分画像を取得(撮影)して画像検索サーバ1に再度送信する操作を削減できる可能性をより高めることができる。
<総括>
以上、本発明によれば、一部画像に基づいて、電子画像を好適に検索する画像検索システム、画像検索装置、情報端末、及び画像検索方法を提供することが可能となる。より具体的には、一部画像に基づいて検索された候補画像が複数ある場合に、複数の候補画像から意図する電子画像を一意に絞り込む新たな画像検索システム、画像検索装置、情報端末、及び画像検索方法を提案できる。
なお、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
例えば、実施形態において情報端末3を取り上げて付属のカメラで入力されるべき画像が取得されたが、代用的にスキャナ等の画像読み取り装置による画像入力でもよいし、さらには既に保持される画像を入力されるべき画像(一部画像又は推奨部分画像)とすることも可能である。また、推奨部分画像の算出において、R、G、B全ての値を用いて算出を行ったが、必ずしもR,G,B全ての値を使用する必要はなく、処理速度向上の為G値のみを使用することも可能である。また、対象画像として文書画像に代表される対象画像を例に取り上げて説明を行ったが、必ずしも画像に限られず、ワープロ文書や表計算ソフトなどのアプリケーションファイルの場合、一旦これらを画像ファイルに変換を行うことで本発明を適用可能である。画像への変換は、例えば、プリンタドライバを利用して画像ファイル(ビットマップファイル)に変換したり、ベクターラスタ変換の処理により画像ファイルに変換できる。
1 画像検索サーバ
2 記憶装置
3 情報端末
4 ネットワーク
5 紙文書
101 CPU
102 ROM
103 RAM
104 補助記憶装置
105 記憶媒体読取装置
106 入力装置
107 表示装置
108 通信装置
401 部分画像受付部
402 検索部
403 検索結果部
404 推奨部分画像算出部
405 推奨部分画像要求部
406 DB
407 候補画像メモリ
特開2005−215922号公報 特開2006−107495号公報
ジョナサン ハル、バーナ エロル、ジェイミー グラハム、シーファ ク、岸 秀信、ホーヘ マラレダ、ダニエル バン オルスト「ミックスド・メディア・リアリティ(MMR):紙と電子世界をつなぐ新しい方法」リコーテクニカルレポート、No33、2007年12月、http://www.ricoh.co.jp/about/business_overview/report/33/pdf/A3314.pdf

Claims (9)

  1. 情報端末から取得した入力画像に基づいて、当該入力画像を一部に含む対象画像を記憶装置から検索する画像検索装置を含む画像検索システムであって、
    前記画像検索装置は、
    前記情報端末から取得した第一の入力画像に基づいて、前記第一の入力画像を一部に含む対象画像を前記記憶装置から検索する検索手段と、
    前記検索手段により前記第一の入力画像を一部に含む対象画像となる複数の候補画像が検索されたとき、当該複数の候補画像のうち、2つの候補画像同士の全組み合わせの画像差に基づいて、当該候補画像の中から一の対象画像を特定するに推奨される部分画像を算出する推奨部分画像算出手段と、
    前記算出された部分画像に基づいて、前記情報端末に部分画像要求を送信する推奨部分画像要求手段とを有し、
    前記検索手段は、前記情報端末から前記部分画像要求に応じて入力された第二の入力画像に基づいて、前記第二の入力画像を一部に含む対象画像を前記複数の候補画像から検索して一の対象画像を特定し、
    前記情報端末で、
    前記部分画像要求に基づき、前記対象画像に対応する被写体において、前記第二の入力画像として取得が推奨される部分を明示的に表示させること
    を有することを特徴とする画像検索システム。
  2. 前記推奨部分画像算出手段は、前記複数の候補画像において画素値間の差分が最も大きい部分を含む前記部分画像を算出すること、
    を特徴とする請求項1に記載の画像検索システム。
  3. 前記検索手段は、前記画像入力装置により入力された第一の入力画像の一部に基づいて、前記第一の入力画像の一部を一部に含む対象画像を前記記憶装置から検索し、
    前記推奨部分画像算出手段は、前記算出した部分画像が、前記入力された第一の入力画像に含まれるとき、
    前記推奨部分画像要求手段は、前記情報端末に前記部分画像要求を送信せず、
    前記検索手段は、前記第一の入力画像に含まれる部分画像に基づいて、当該部分画像を一部に含む対象画像を前記候補画像から検索して一の対象画像を特定すること、
    を特徴とする請求項1又は2に記載の画像検索システム。
  4. 情報端末から取得した入力画像に基づいて、当該入力画像を一部に含む対象画像を記憶装置から検索する画像検索装置であって、
    前記情報端末から取得した第一の入力画像に基づいて、前記第一の入力画像を一部に含む対象画像を前記記憶装置から検索する検索手段と、
    前記検索手段により前記第一の入力画像を一部に含む対象画像となる複数の候補画像が検索されたとき、当該複数の候補画像のうち、2つの候補画像同士の全組み合わせの画像差に基づいて、当該候補画像の中から一の対象画像を特定するに推奨される部分画像を算出する推奨部分画像算出手段と、
    前記算出された部分画像に基づいて、前記情報端末に部分画像要求を送信する推奨部分画像要求手段とを有し、
    前記検索手段は、前記情報端末から前記部分画像要求に応じて入力された第二の入力画像に基づいて、前記第二の入力画像を一部に含む対象画像を前記複数の候補画像から検索して一の対象画像を特定すること、
    を特徴とする画像検索装置。
  5. 前記推奨部分画像算出手段は、前記複数の候補画像において画素値間の差分が最も大きい部分を含む前記部分画像を算出すること、
    を特徴とする請求項4に記載の画像検索装置。
  6. 前記検索手段は、前記画像入力装置により入力された第一の入力画像の一部に基づいて、前記第一の入力画像の一部を一部に含む対象画像を前記記憶装置から検索し、
    前記推奨部分画像算出手段は、前記算出した部分画像が、前記入力された第一の入力画像に含まれるとき、
    前記推奨部分画像要求手段は、前記情報端末に前記部分画像要求を送信せず、
    前記検索手段は、前記第一の入力画像に含まれる部分画像に基づいて、当該部分画像を一部に含む対象画像を前記候補画像から検索して一の対象画像を特定すること、
    を特徴とする請求項4又は5に記載の画像検索装置。
  7. 情報端末から取得した入力画像に基づいて、当該入力画像を一部に含む対象画像を記憶装置から検索する画像検索装置を含む画像検索システムにおける画像検索方法であって、
    前記画像検索装置は、
    前記情報端末から取得した第一の入力画像に基づいて、前記第一の入力画像を一部に含む対象画像を前記記憶装置から検索する検索手順と、
    前記検索手順により前記第一の入力画像を一部に含む対象画像となる複数の候補画像が検索されたとき、当該複数の候補画像のうち、2つの候補画像同士の全組み合わせの画像差に基づいて、当該候補画像の中から一の対象画像を特定するに推奨される部分画像を算出する推奨部分画像算出手順と、
    前記算出された部分画像に基づいて、前記情報端末に部分画像要求を送信する推奨部分画像要求手順とを有し、
    前記検索手順は、前記情報端末から前記部分画像要求に応じて入力された第二の入力画像に基づいて、前記第二の入力画像を一部に含む対象画像を前記複数の候補画像から検索して一の対象画像を特定し、
    前記情報端末で、
    前記部分画像要求受信された第二の入力画像の要求に基づき、前記対象画像に対応する被写体において、前記第二の入力画像として取得が推奨される部分を明示的に表示させる推奨部分表示手順と、
    を有することを特徴とする画像検索方法。
  8. 前記推奨部分画像算出手段は、前記複数の候補画像において画素値間の差分が最も大きい部分を含む前記部分画像を算出すること、
    を特徴とする請求項に記載の画像検索方法。
  9. 前記検索手順は、前記画像入力装置により入力された第一の入力画像の一部に基づいて、前記第一の入力画像の一部を一部に含む対象画像を前記記憶装置から検索し、
    前記推奨部分画像算出手順は、前記算出した部分画像が、前記入力された第一の入力画像に含まれるとき、
    前記推奨部分画像要求手順は、前記情報端末に前記部分画像要求を送信せず、
    前記検索手順は、前記第一の入力画像に含まれる部分画像に基づいて、当該部分画像を一部に含む対象画像を前記候補画像から検索して一の対象画像を特定すること、
    を特徴とする請求項又はに記載の画像検索方法。
JP2009042883A 2009-02-25 2009-02-25 画像検索システム、画像検索装置、及び画像検索方法 Expired - Fee Related JP5353299B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009042883A JP5353299B2 (ja) 2009-02-25 2009-02-25 画像検索システム、画像検索装置、及び画像検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009042883A JP5353299B2 (ja) 2009-02-25 2009-02-25 画像検索システム、画像検索装置、及び画像検索方法

Publications (2)

Publication Number Publication Date
JP2010198365A JP2010198365A (ja) 2010-09-09
JP5353299B2 true JP5353299B2 (ja) 2013-11-27

Family

ID=42823019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009042883A Expired - Fee Related JP5353299B2 (ja) 2009-02-25 2009-02-25 画像検索システム、画像検索装置、及び画像検索方法

Country Status (1)

Country Link
JP (1) JP5353299B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016076021A1 (ja) * 2014-11-11 2016-05-19 富士フイルム株式会社 商品検索装置及び商品検索方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123173A (ja) * 1998-10-14 2000-04-28 Ntt Data Corp 画像特徴抽出方法及び類似画像検索システム、記録媒体
JP2001075980A (ja) * 1999-09-02 2001-03-23 Ntt Docomo Inc データベース検索支援装置及びその制御方法
JP2003150634A (ja) * 2001-11-09 2003-05-23 Yamaha Motor Co Ltd マルチメディア検索提供システム、マルチメディア検索提供方法、マルチメディア検索提供システム用プログラム、及びマルチメディア検索提供システム用記録媒体
JP2003271650A (ja) * 2002-03-12 2003-09-26 Nec Corp 携帯電話Webサイト画像検索システム及び方法並びにサーバーとそのプログラム
JP4403937B2 (ja) * 2004-09-29 2010-01-27 カシオ計算機株式会社 カメラ装置、情報処理装置、被写体識別方法
EP1898339A1 (en) * 2005-06-30 2008-03-12 Olympus Corporation Retrieval system and retrieval method
JP2007323554A (ja) * 2006-06-05 2007-12-13 Ron:Kk ネットワーク検索方法,クライアント,サーバ,システム
JP2008146602A (ja) * 2006-12-13 2008-06-26 Canon Inc 文書検索装置、文書検索方法、プログラム及び記憶媒体

Also Published As

Publication number Publication date
JP2010198365A (ja) 2010-09-09

Similar Documents

Publication Publication Date Title
US7991778B2 (en) Triggering actions with captured input in a mixed media environment
US7672543B2 (en) Triggering applications based on a captured text in a mixed media environment
US20100331041A1 (en) System and method for language-independent manipulations of digital copies of documents through a camera phone
US7920759B2 (en) Triggering applications for distributed action execution and use of mixed media recognition as a control input
Kumar et al. A dataset for quality assessment of camera captured document images
KR100979457B1 (ko) 혼합 미디어 환경에서의 이미지 정합 방법 및 시스템
WO2007004519A1 (ja) 検索システム及び検索方法
JP2007286864A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
CN102521258A (zh) 一种用于提供壁纸图片的方法与设备
KR101716807B1 (ko) 웹 상에 3차원 정보를 갖는 html 요소를 나타내기 위한 장치 및 방법
KR101307325B1 (ko) 관심영역 설정을 이용한 이미지 이중 검색 시스템
US10552515B2 (en) Information processing terminal and information processing method capable of supplying a user with information useful for selecting link information
US8646691B2 (en) Apparatus and method for using machine-readable codes
JP6171660B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP5353299B2 (ja) 画像検索システム、画像検索装置、及び画像検索方法
US9977793B2 (en) Information processing system, information processing method, and information processing apparatus
EP3049914B1 (en) User-initiated data recognition and data conversion process
JP2006184415A (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP2016025625A (ja) 情報処理装置、情報処理方法及びプログラム
JP2008257458A (ja) コンテンツ管理システム
JP5278093B2 (ja) 記事関連情報提供方法、装置、プログラム、記録媒体
CN111339465A (zh) 图片处理方法、装置、计算机设备和存储介质
CN105975621B (zh) 识别浏览器页面中的搜索引擎的方法及装置
JP5312310B2 (ja) 検索装置及び方法及びプログラム
JP2019105905A (ja) 名刺情報登録装置、名刺情報登録方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130812

R151 Written notification of patent or utility model registration

Ref document number: 5353299

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees