WO2015159417A1 - 撮影映像による文書検索システム - Google Patents

撮影映像による文書検索システム Download PDF

Info

Publication number
WO2015159417A1
WO2015159417A1 PCT/JP2014/060997 JP2014060997W WO2015159417A1 WO 2015159417 A1 WO2015159417 A1 WO 2015159417A1 JP 2014060997 W JP2014060997 W JP 2014060997W WO 2015159417 A1 WO2015159417 A1 WO 2015159417A1
Authority
WO
WIPO (PCT)
Prior art keywords
document
image
partial image
local feature
feature amount
Prior art date
Application number
PCT/JP2014/060997
Other languages
English (en)
French (fr)
Inventor
直人 秋良
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2014/060997 priority Critical patent/WO2015159417A1/ja
Publication of WO2015159417A1 publication Critical patent/WO2015159417A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying

Definitions

  • the AR glasses 101 includes a camera attached to the glasses and a display device such as a display that displays arbitrary information superimposed on the video of the camera.
  • the AR glasses control PC 102 is a wireless or wireless cable such as a wireless LAN or a USB cable. Connected by wire.
  • the AR glasses 101 may realize the same function by a combination of a web camera and a head mounted display.
  • the local feature amount acquisition program 316 and the local feature amount collation program 317 are the same as those of the AR glasses control PC 102, and thus description thereof is omitted.
  • the third document identification method acquires partial images that are strongly related to objects and documents included in the captured video with the number of matching points and the threshold of the area.
  • a document including a large number of partial images is used as a search result.
  • a document that includes partial images corresponding to all objects is considered to be an image that has a strong relationship with the shooting target. There is an effect that can be done.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

 撮影対象物に関連する図面が載っている文書を高精度に検索する。 文書構造を有する文書から、事前に写真や図面などの部分画像を取得し、取得した部分画像から局所特徴量を抽出し、撮影した視野画像から取得した局所特徴量と、部分画像から取得した局所特徴量との照合により、撮影対象物に関係の強い文書を検索する。

Description

撮影映像による文書検索システム
 本発明は、ユーザが撮影した映像を用いて、ネットワークに接続されている他のユーザのPCに保存されている文書を検索することが可能な文書検索システムに関する。
 ARメガネやスマートフォンの普及により、撮影により情報検索をするサービスが登場している。例えば、街中で風景を撮影すると、映像中の店舗やランドマークの部分に名称等の情報が表示されるサービスが登場している。最近では、業務用のシステムへも普及が進み、装置の近くにARタグと呼ばれるマーカーを設置し、そのARタグに対応付いている情報をデータベースから取得し、装置の映像の上に重畳して表示するようなシステムが登場している。
 しかし、ARタグの設置が難しい用途では、撮影している対象物と、表示すべき情報との対応付けが困難である。そこで、文書を撮影して、その文書の電子ファイルを検索する発明である特許文献1では、撮影した文書から文書を検索するという用途に対して、撮影した文書から生成した回転やスケールの変動に強い局所特徴量を取得し、検索対象の文書から取得した局所特徴量と照合することで、撮影した文書に対応する文書を検索する方法が述べられている。
特開2011-8752号公報
 前述した従来技術では、撮影した文書と同じ文書を検索する場合には、ある程度の検索精度が得られるが、物体を撮影して、その物体の写真などが埋め込まれている文書を検索する場合に、文字などエッジが多い部分から大量の特徴点が抽出されてしまったり、注目している物体以外の領域から抽出された特徴点が多かったりするなど、局所特徴量の照合で誤った対応付けがされる要因が多数存在し、実用上十分な精度が得られないとう問題があった。
 そこで、撮影した映像に映っている物体や図面などの画像が載っている文書を検索するシステムにおいて、高精度に検索することを課題とする。
 上記課題を解決するために、例えば請求の範囲に記載の構成を採用する。本願は上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、文書検索システムであって、ユーザの視野である視野画像を撮像する撮像部と、部分画像または文章を含む文書を蓄積する記憶部と、文書が部分画像を含む第1文書であるか否かを判定する判定部と、視野画像に含まれる第1局所特徴量と、部分画像に含まれる第2局所特徴量を抽出する抽出部と、第1局所特徴量および第2局所特徴量を用いて、部分画像と前記視野画像との照合を行い、照合された部分画像の視野画像に対応する点を求める照合部と、第1文書のうち、照合部において照合されたものを出力する出力部と、を有することを特徴とする。
 あるいは、文書検索方法であって、ユーザの視野である視野画像を撮像する第1ステップと、部分画像または文章を含む文書を記憶装置に蓄積する第2ステップと、文書が部分画像を含む第1文書であるか否かを判定する第3ステップと、視野画像に含まれる第1局所特徴量と、部分画像に含まれる第2局所特徴量を抽出する第4ステップと、第1局所特徴量および第2局所特徴量を用いて、部分画像と視野画像との照合を行い、照合された部分画像の視野画像に対応する点を求める第5ステップと、第1文書のうち、照合部において照合されたものを出力する第6ステップと、を有することを特徴とする。
 本発明によれば、撮影した視野画像に含まれる物体と、物体の部分画像を含む文書との照合を高精度に行うことができる。
本発明の実施の形態の文書検索システムの構成を示す図である。 本発明の実施の形態のARメガネ制御PCの構成の一例を示すブロック図である。 本発明の実施の形態の文書検索PCの構成の一例を示すブロック図である。 文書情報データの一例を示す図である。 検索用データ(部分画像)の一例を示す図である。 検索用データ(文書画像)の一例を示す図である。 画像特徴量の一例を示す図である。 本発明の実施の形態の検索用データを生成する手順を示すフローチャートである。 本発明の実施の形態の文書を検索する手順を示すフローチャートである。 映像の生成方法の一例を示す図である。
 次に、本発明の第一の実施の形態について、図面を参照して説明する。
 図1は、本発明の実施の形態の文書検索システムの一例を示す構成図である。図1において、文書検索システムは、ユーザの視野の映像(視野画像)を撮影し、検索した文書をメガネに付いているカメラの視野映像に重畳表示するARメガネ101と、ARメガネ101の制御を行うARメガネ制御PC102と、検索対象である文書を蓄積し、撮影した映像と局所特徴量の照合により検索する文書検索PC103と、各々の機器を接続するネットワーク104とを主体に構成される。尚、ARメガネ制御PC102は、ARメガネ101に同様の機能を組み込みなどで実装することで、省略しても構わない。また、ARメガネ制御PC102や文書検索PC103は、クラウドサービスなどの仮想PC環境であっても構わない。また、ARメガネ101と、ARメガネ制御PCは、スマートフォンやタブレットPCなど、カメラと画面を有する情報機器で代用しても構わない。また、ARメガネ101と、ARメガネ制御PC102を、国外などの遠方に設置し、文書検索PC103を国内に設置し、グローバルなネットワーク104で接続した構成など、ARメガネ101と文書検索PC103の設置場所が異なっても構わない。
 次に、ARメガネ101の構成要素について、以下に説明する。ARメガネ101は、メガネに付いているカメラと、該カメラの映像に任意の情報を重畳表示するディスプレイなどの表示装置で構成され、ARメガネ制御PC102とは、無線LANやUSBケーブルなど、無線または有線で接続される。尚、ARメガネ101は、ウェブカメラと、ヘッドマウントディスプレイの組み合わせなどで同様の機能を実現しても構わない。
 次に、ARメガネ制御PC102の構成要素について、図1乃至図2を参照しながら、以下に説明する。ARメガネ101からの映像取得および表示映像を生成するARメガネ制御PC102は、図2に例を示す構成図のように、CPU201、主メモリ202、入力部203、表示部204、通信部205および記憶部210を含む計算機で構成される。記憶部210には、OS211と、キャッシュデータ212と、局所特徴量取得プログラム213と、局所特徴量照合プログラム214と、映像取得プログラム215と、映像生成プログラム216と、画面表示プログラム218とが格納される。
 キャッシュデータ212には、検索用データ314から取得した局所特徴量、およびARメガネに表示するデータなど、文書検索PCから取得した一時保存されるデータが格納される。尚、一時保存するタイミングは、文書が更新されたとき、ARカメラ制御PCを起動したときなど、どのようなタイミングでも構わない。
 局所特徴量取得プログラム213は、文書を構成する各ページの見た目のレイアウト画像(文書画像)や文書に含まれる図面や写真などの画像(部分画像)、および視野画像から、画像処理の分野で広く知られているSIFT特徴量やBRISK特徴量など、回転やスケールの変動に強い特徴量を抽出する。局所特徴量の抽出は、特徴点を抽出するステップと、特徴点の特徴を示す特徴量を抽出するステップの2ステップで行われ、特徴量は、局所特徴量の種別に応じて、128次元程度の数値ベクトルまたは数十ビットで記述されるバイナリ特徴量となる。
 局所特徴量照合プログラム214は、撮影された視野画像から抽出した複数の特徴点と、検索対象である文書画像や部分画像から取得した複数の特徴点の対応関係を、特徴点間の総当たりで距離を計算し、距離が閾値よりも小さい組を対応する点として計算する。ここで、距離の計算は、SIFT特徴量のように数値ベクトルであればユークリッド距離などを用い、BRISK特徴量のようにバイナリ特徴量であれば、一致しているビットの数で算出するハミング距離を用いる。尚、類似している特徴点の対応関係が取得すれば、特徴点の対応関係の取得は、どのような方法を用いても構わない。
 映像取得プログラム215は、ARメガネ101などの撮影装置から視野画像を取得し、事前に指定した時間毎、または映像の変化が大きいフレーム毎に、フレーム画像を取得する。
 映像生成プログラム216は、検索結果の文書を視野画像に重畳した映像など、ARメガネ101に表示する映像を生成する。
 画面表示プログラム218は、映像生成プログラム216で生成した映像を、ARメガネ101に表示する。
 次に、文書検索PC103の構成要素について、図1乃至図3を参照しながら、以下に説明する。撮影された視野画像に写っている撮影対象物に関係する部分画像が含まれる文書を検索する文書検索PC103は、図3に例を示す構成図のように、CPU301、主メモリ302、入力部303、表示部304、通信部305および記憶部310を含む計算機で構成される。記憶部310には、OS311と、文書データ312と、文書情報データ313と、検索用データ314と、文書解析プログラム315と、局所特徴量抽出プログラム316と、局所特徴量照合プログラム317と、類似画像検索プログラム318と、文書検索プログラム319とが格納される。
 文書データ312には、部分画像を含む文書等が保存されており、OS311のファイルシステム上に、ファイルの形式で保存されている。例えば、マイクロソフト社の文書作成プログラムを用いた場合には、Word(登録商標)であればdoc形式、PowerPoint(登録商標)であればppt形式、Excel(登録商標)であればxls形式で保存される。尚、Adobe社のPDF形式など、閲覧用に作成された文書が混在していても構わない。
 文書情報データ313には、図4に例を示すように、文書IDと、ファイルパスと、ファイル種別と、更新日時とが登録される。
 検索用データ314には、図5および図6に例を示すように、部分画像および文書画像から抽出した局所特徴量および画像特徴量が登録される。また、文書ID、文書の何ページ目かを示すページ情報、部分画像のページ内での位置情報など、検索結果の表示に必要な情報が併せて登録される。尚、局所特徴量は、一つの画像から複数の特徴点が抽出されるため、特徴点の数だけ、数十ビットまたは128次元程度の特徴量が存在する。また、画像特徴量は、画像の形状や色分布など、見た目の情報を数百次元程度のベクトルに圧縮した情報が登録される。
 文書解析プログラム315は、文書作成ソフトウェアの提供元が提供しているライブラリ、またはオープンソースのライブラリなどを用いて、文書構造から文書中のテキストや画像を抽出する。例えば、Microsoft Office(登録商標)の文書ファイルであれば、マイクロソフト社が提供しているSDK、PDFファイルであればオープンソースのiText(登録商標)を利用して解析することができる。尚、文書のファイルから、テキストと画像と関連情報が取得できれば、どのようなライブラリやツールを用いても構わない。
 尚、本実施例では、文書は1ページ以上のページ集合で構成され、各々のページに含まれている画像を部分画像とし、1ページの領域全体の見た目を画像にしたものを文書画像と定義する。即ち、文書解析プログラム315は、文書データ312から、ページを取得し、各々のページから、組み込み構造の有無を判定し、組み込み構造が有るすなわち、部分画像を有しているページについて、部分画像および文書画像を取得する。
 局所特徴量取得プログラム316および局所特徴量照合プログラム317は、ARメガネ制御PC102と同様であるため、説明を省略する。
 類似画像検索プログラム318は、検索要求の画像の画像特徴量と、検索対象の画像各々の画像特徴量とのベクトル間の距離を計算し、特徴量ベクトル空間における両者間の距離が小さい画像を、見た目の類似度が高い画像として取得するプログラムである。尚、画像特徴量は、画像から生成した画像の見た目の特徴を表す多次元ベクトルを利用できる。例えば、画像の画素値情報を用いて、画像中のエッジパターンの分布を示す多次元ベクトルを生成し、主成分分析法などを用いて多次元ベクトルを次元圧縮して数十~数百次元程度のベクトルを生成し、画像の検索用データとすることができる。ここで、エッジパターンの分布は、図7に例を示す図のように、特徴的なエッジパターンを予め複数設定し、格子状に領域分割を行い、各領域内に含まれるエッジパターン数を計数することによって多次元ベクトルを生成し、主成分分析法を用いて次元圧縮することにより生成される。尚、画像の見た目の特徴を示す特徴量であれば、一般に広く知られているMPEG-7で規定されているエッジヒストグラム特徴など他の特徴量を用いても構わない。また、ベクトル間の距離の計算は、自乗距離など、ベクトル間の類似度を計算できれば、どのような方式を用いても構わない。
 文書検索プログラム319は、ARメガネ制御PC102から取得した、部分画像が含まれている文書を、局所特徴量や画像特徴量を用いて検索する。
 次に、検索用データを生成する手順を、図8に示すフローチャートを用いて説明する。
 まず、文書検索プログラム319が、OS311のファイルシステムまたはネットワーク上の指定されたフォルダにある文書データ312で、検索用データ314に未登録の文書、または、文書情報データ313に登録されている更新日時よりも後に更新された文書を検出する(S801)。
 次に、文書解析プログラム315で、ステップS801で検出した新規文書や更新文書のファイルから、文書情報データ313に登録する情報と、文書画像と、部分画像を取得する(S802)。
 次に、局所特徴量取得プログラム316で、文書画像および部分画像から、SIFT特徴量やBRISK特徴量などの局所特徴量を取得し、検索用データ314に登録する。特徴点の数が事前に定めた閾値よりも多い場合には、特徴点らしさを示す値の大きい事前に定めた個数の特徴点を用いても構わない(S803)。
 次に、類似画像検索プログラム318で、文書画像および部分画像から、画像の見た目の情報を表す画像特徴量を取得し、検索用データ314に登録する。
 次に、文書情報データ313に登録する情報や、検索用データ314に登録する部分画像の座標などの関連情報を、文書情報データ313および検索用データ313に登録する。新規文書または更新文書が無くなるまで、上記検索用データを生成するステップS801乃至S805を繰り返し、終了指示があった場合には処理を終了する(S806)。
 次に、文書を検索する手順を、図9に示すフローチャートを用いて説明する。
 まず、映像所得プログラム215で、ARメガネ101から映像を取得し、指定時間毎または、映像の変化が大きいタイミングでフレーム画像を取得し、撮影している映像から視野画像を取得する(S901)。
 次に、局所特徴量取得プログラム213で、ステップS901で取得した視野画像から、局所特徴量を取得し、キャッシュデータ212に、取得した局所特徴量を登録する。尚、次のフレームの視野画像が取得された場合には、キャッシュデータ212に登録されている局所特徴量を新しいフレームの視野画像の局所特徴量に更新する(S902)。
 次に、文書検索プログラム319で、ユーザからの指示などの情報を用いて、撮影対象が、文書を印刷した紙であるか、それ以外の物体などであるかを判定し(S902)、文書であると判定された場合には、局所特徴量照合プログラム317で、文書画像の局所特徴量を用いて、ステップS902で取得した視野画像の局所特徴量(第1局所特徴量)と、検索用データ314に登録されている文書画像の局所特徴量(第3局所特徴量)とを比較し、対応点が多い文書を取得する(S905)。尚、撮影対象が物体であるか、文書であるかを判定するステップは、判定が困難な場合には省略しても構わない。ここで、撮影対象が文書であるか判定することで、検索対象の文書を印刷した紙を撮影した場合に、撮影画像と文書画像の照合を、局所特徴量(第3局所特徴量)で高精度に行えるため、文書から印刷した紙から、検索対象である文書の電子データの候補を効率的に絞り込めるという効果がある。
 次に、文書検索プログラム319で、検索用データ314から、部分画像の局所特徴量(第2局所特徴量)を取得し、局所特徴量照合プログラム316で、撮影した映像に含まれる物体や文書に対応する部分画像を取得する(S906)。ここで、ステップS904で、撮影対象が文書であると判定されている場合、ステップS905で、特に視野画像と文書画像との局所特徴量の対応点が多いと判定されている文書に含まれる部分画像に限定して照合を行うことで、部分画像を限定することができるので、視野画像と部分画像との照合に要する計算コストを削減できる効果がある。文書画像でなく、部分画像を照合に用いることで、視野画像に写っている撮影対象物の各々の特徴点が、同じ文書に含まれる異なる部分画像すなわち異なる対象物に、分散して対応付けれられてしまうことを抑止できるので、高精度に検索できるという効果がある。
 次に、文書検索プログラム319で、ステップS906で取得した特徴点の対応関係で、事前に指定した密度以上に対応がとれている特徴点の領域を特定し、その領域を含む矩形領域を、部分画像に対応する位置であると仮定し、撮影映像中の位置情報を取得する(S907)。
 次に、ステップS907で対応関係がとれている部分画像に関して、類似画像検索プログラム317で、完全には一致しないが、類似している部分画像を取得し、撮影映像に含まれる物体などと対応する部分画像の母集団を拡充する(S908)。ここで、検索目的が撮影映像中の物体と完全一致している写真が含まれている文書を検索したいなど、類似画像を検索結果に含めたくない場合は、ステップS908は省略しても構わない。
 次に、文書検索プログラム319で、ステップS906乃至ステップS908で取得した部分画像から、以下に示す第一乃至第四の方法で、検索結果の文書を特定する(S909)。
 第一の文書特定方法は、撮影映像から取得した画像と、局所特徴量の照合でマッチングした点が多い順に部分画像をソートし、上位の部分画像が含まれる文書を検索結果とする方法である。局所特徴量の照合のマッチングした点の個数が多いほど、一致がとれている可能性が高いため、信頼度の高い検索結果が取得できる効果がある。
 第二の文書特定方法は、部分画像の局所特徴量と照合するステップS906で取得した部分画像で、事前に定めた閾値よりも多いマッチングが得られた部分画像、およびステップS906で取得した部分画像の類似画像を取得するステップS908で取得した部分画像で、類似度が事前に定めた閾値よりも大きな部分画像を取得し、それらの面積が大きい順にソートした結果の上位に含まれる部分画像に対応する文書を検索結果とする方法である。撮影映像中に含まれる物体や文書が大きく写っている、すなわち、トピックをよく表しているという考えられる検索結果を取得できる効果がある。
 第三の文書特定方法は、第一乃至第二の文書特定方法と同様に、マッチングした点の個数や面積の閾値で、撮影映像中に含まれる物体や文書と関係の強い部分画像を取得し、部分画像が多く含まれる文書を検索結果とする方法である。撮影対象に複数の物体が含まれている場合に、すべての物体に対応する部分画像が含まれる文書は、撮影対象と関係の強い画像と考えられるため、撮影対象全体に関係の強い文書が検索できる効果がある。
 第四の文書特定方法は、第一乃至第三の文書特定方法で文書の特定に使用した部分画像すなわち、特定された文書に含まれる部分画像に類似する部分画像を類似画像検索プログラム318で取得し、取得した部分画像を含む文書を第一乃至第三の文書特定方法で特定した文書に追加する方法である。
 次に、映像生成プログラム216で、文書を特定するステップS909で取得した検索結果の文書を、ARメガネ101の映像に合成した映像を生成する(S910)。ここで、文書の表示位置は、部分画像の位置を取得するステップS907で取得した領域を除いた領域に配置することで、注目している物体などの対象物が検索結果で確認できなくなることを防止できる効果がある。
 次に、画面表示プログラム217で、ARメガネ101のディスプレイ部分に、映像を生成するステップS910で生成した映像を表示させる(S911)。
 次に、終了指示の有無を確認し、終了指示がない場合には、キャッシュデータ212から再度フレーム画像を取得し、ステップS901乃至ステップS911の処理を継続する(S912)。
 尚、ARメガネ101の映像の変化が小さい場合は、直前に照合した画像の中で、マッチングした特徴点が多い部分画像の局所特徴量をキャッシュデータ212に保存し、ARメガネ制御PC102で、照合を行うことで、計算量の削減と通信帯域の効率化が可能である。
 以上を踏まえると、本実施例に記載の発明は、文書検索システムであって、ユーザの視野である視野画像を撮像する撮像部と、部分画像または文章を含む文書を蓄積する記憶部と、文書が部分画像を含む第1文書であるか否かを判定する判定部と、視野画像に含まれる第1局所特徴量と、部分画像に含まれる第2局所特徴量を抽出する抽出部と、第1局所特徴量および第2局所特徴量を用いて、部分画像と前記視野画像との照合を行い、照合された部分画像の視野画像に対応する点を求める照合部と、第1文書のうち、照合部において照合されたものを出力する出力部と、を有することを特徴とする。
 あるいは、文書検索方法であって、ユーザの視野である視野画像を撮像する第1ステップと、部分画像または文章を含む文書を記憶装置に蓄積する第2ステップと、文書が部分画像を含む第1文書であるか否かを判定する第3ステップと、視野画像に含まれる第1局所特徴量と、部分画像に含まれる第2局所特徴量を抽出する第4ステップと、第1局所特徴量および第2局所特徴量を用いて、部分画像と視野画像との照合を行い、照合された部分画像の視野画像に対応する点を求める第5ステップと、第1文書のうち、照合部において照合されたものを出力する第6ステップと、を有することを特徴とする。
 本実施例の文書検索方法を用いることで、例えば、プラントなどの現場で、AR眼鏡を通して配電盤やメータなどの装置を眺めると、それらの写真が載っている保守資料や説明書類などの文書を簡単に検索できるので、検索要求の入力が困難な環境においても簡単に文書が検索できる効果がある。
 また、レイアウトの文書が図だけでなく、文書構造を利用して取得した部分画像から取得した局所特徴量を用いて照合を行うことで、物体や図面の単位でのマッチングが行えるため、誤った特徴点間のマッチングを抑止できる効果がある。
 さらに、部分的に完全一致している画像を検索することが得意な局所特徴量と、部分的な一致の検索が困難であるが全一致していなくても見た目が似ている画像を検索することに適した、画像特徴量を用いた類似画像検索と組み合わせることによって、ユーザが欲しい範囲で、情報を検索することができる。
 201 CPU
 202 主メモリ
 203 入力部
 204 表示部
 205 通信部
 210 記憶部
 211 OS
 212 キャッシュデータ
 213 局所特徴量取得プログラム
 214 局所特徴量照合プログラム
 215 映像取得プログラム
 216 映像生成プログラム
 217 画面表示プログラム
 301 CPU
 302 主メモリ
 303 入力部
 304 表示部
 305 通信部
 310 記憶部
 311 OS
 312 文書データ
 313 文書情報データ
 314 検索用データ
 315 文書解析プログラム
 316 局所特徴量取得プログラム
 317 局所特徴量照合プログラム
 318 類似画像検索プログラム
 319 文書検索プログラム。
 

Claims (8)

  1.  ユーザの視野である視野画像を撮像する撮像部と、
     部分画像または文章を含む文書を蓄積する記憶部と、
     前記文書が部分画像を含む第1文書であるか否かを判定する判定部と、
     前記視野画像に含まれる第1局所特徴量と、前記部分画像に含まれる第2局所特徴量を抽出する抽出部と、
     前記第1局所特徴量および前記第2局所特徴量を用いて、前記部分画像と前記視野画像との照合を行い、照合された前記部分画像の前記視野画像に対応する点を求める照合部と、
     前記第1文書のうち、前記照合部において照合されたものを出力する出力部と、を有することを特徴とする文書検索システム。
  2.  請求項1に記載の文書検索システムであって、
     前記抽出部はさらに、前記第1文書を構成するページに含まれる第3局所特徴量を抽出し、
     前記第1局所特徴量と前記第3局所特徴量との対応する点を求め、前記第1文書から、前記視野画像と対応する点の数が多い前記部分画像を含む第2文書を検索する検索部と、をさらに有し、
     前記判定部は、前記第2文書に対して判定を行い、
     前記照合部は、前記第2文書に含まれる前記部分画像を用いて照合を行うことを特徴とする文書検索システム。
  3.  請求項2に記載の文書検索システムであって、
     前記抽出部は、さらに、前記視野画像に含まれる第1画像特徴量と、前記部分画像に含まれる第2画像特徴量とを抽出し、
     前記検索部は、さらに、前記第2画像特徴量が前記第1画像特徴量と特徴量空間における距離が最も近い部分画像である第1部分画像を検索し、
     前記照合部は、前記第1部分画像をさらに用いて照合を行うことを特徴とする文書検索システム。
  4.  請求項1に記載の文書検索システムであって、
     出力された前記第1文書を、前記ユーザの視野に重畳して表示する表示部を、さらに有し、
     前記表示部では、前記部分画像に対応する点の密度が所定以上の領域を、前記部分画像に対応する第1領域と決定し、前記第1領域よりも外側に前記第1文書を表示することを特徴とする文書検索システム。
  5.  ユーザの視野である視野画像を撮像する第1ステップと、
     部分画像または文章を含む文書を記憶装置に蓄積する第2ステップと、
     前記文書が部分画像を含む第1文書であるか否かを判定する第3ステップと、
     前記視野画像に含まれる第1局所特徴量と、前記部分画像に含まれる第2局所特徴量を抽出する第4ステップと、
     前記第1局所特徴量および前記第2局所特徴量を用いて、前記部分画像と前記視野画像との照合を行い、照合された前記部分画像の前記視野画像に対応する点を求める第5ステップと、
     前記第1文書のうち、前記照合部において照合されたものを出力する第6ステップと、を有することを特徴とする文書検索方法。
  6.  請求項5に記載の文書検索方法であって、
     前記第4ステップではさらに、記第1文書を構成するページに含まれる第3局所特徴量を抽出し、
     前記第1局所特徴量と前記第3局所特徴量との対応する点を求め、前記第1文書から、前記視野画像と対応する点の数が多い前記部分画像を含む第2文書を検索する第7ステップと、をさらに有し、
     前記第3ステップでは、前記第2文書に対して判定を行い、
     前記第5ステップでは、前記第2文書に含まれる前記部分画像を用いて照合を行うことを特徴とする文書検索方法。
  7.  請求項6に記載の文書検索方法であって、
     前記第4ステップでは、さらに、前記視野画像に含まれる第1画像特徴量を、前記部分画像に含まれる第2画像特徴量を抽出し、
     前記第7ステップでは、さらに、前記第2画像特徴量が前記第1画像特徴量と特徴量空間における距離が最も近い部分画像である第1部分画像を検索し、
     前記第5ステップでは、前記第1部分画像をさらに用いて照合を行うことを特徴とする文書検索方法。
  8.  請求項5に記載の文書検索方法であって、
     前記第1文書を、前記ユーザの視野に重畳して表示する第8ステップを、さらに有し、
     前記第8ステップでは、前記部分画像に対応する点の密度が所定以上の領域を、前記部分画像に対応する第1領域と決定し、前記第1領域よりも外側に前記第1文書を表示することを特徴とする文書検索方法。
PCT/JP2014/060997 2014-04-18 2014-04-18 撮影映像による文書検索システム WO2015159417A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/060997 WO2015159417A1 (ja) 2014-04-18 2014-04-18 撮影映像による文書検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/060997 WO2015159417A1 (ja) 2014-04-18 2014-04-18 撮影映像による文書検索システム

Publications (1)

Publication Number Publication Date
WO2015159417A1 true WO2015159417A1 (ja) 2015-10-22

Family

ID=54323658

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/060997 WO2015159417A1 (ja) 2014-04-18 2014-04-18 撮影映像による文書検索システム

Country Status (1)

Country Link
WO (1) WO2015159417A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347812A (zh) * 2019-06-25 2019-10-18 银江股份有限公司 一种面向司法文本的搜索排序方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1091634A (ja) * 1996-08-15 1998-04-10 Hewlett Packard Co <Hp> 写真画像検索システム
JP2001101191A (ja) * 1999-09-27 2001-04-13 Cadix Inc 画像識別装置及び画像識別に用いられるデータベースシステム
JP2002108873A (ja) * 2000-09-25 2002-04-12 Internatl Business Mach Corp <Ibm> 空間情報利用システム、情報取得装置、およびサーバシステム
JP2003122757A (ja) * 2001-10-10 2003-04-25 Sony Corp 検索案内システム、端末装置およびサーバ装置
JP2009301485A (ja) * 2008-06-17 2009-12-24 Olympus Corp 情報表示システムおよびそれを用いた携帯情報端末
JP2011227875A (ja) * 2010-03-31 2011-11-10 Ns Solutions Corp 情報処理装置、情報処理方法及びプログラム
JP2012128680A (ja) * 2010-12-15 2012-07-05 Ns Solutions Corp 情報処理システム、その制御方法及びプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1091634A (ja) * 1996-08-15 1998-04-10 Hewlett Packard Co <Hp> 写真画像検索システム
JP2001101191A (ja) * 1999-09-27 2001-04-13 Cadix Inc 画像識別装置及び画像識別に用いられるデータベースシステム
JP2002108873A (ja) * 2000-09-25 2002-04-12 Internatl Business Mach Corp <Ibm> 空間情報利用システム、情報取得装置、およびサーバシステム
JP2003122757A (ja) * 2001-10-10 2003-04-25 Sony Corp 検索案内システム、端末装置およびサーバ装置
JP2009301485A (ja) * 2008-06-17 2009-12-24 Olympus Corp 情報表示システムおよびそれを用いた携帯情報端末
JP2011227875A (ja) * 2010-03-31 2011-11-10 Ns Solutions Corp 情報処理装置、情報処理方法及びプログラム
JP2012128680A (ja) * 2010-12-15 2012-07-05 Ns Solutions Corp 情報処理システム、その制御方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347812A (zh) * 2019-06-25 2019-10-18 银江股份有限公司 一种面向司法文本的搜索排序方法及系统
CN110347812B (zh) * 2019-06-25 2021-09-10 银江股份有限公司 一种面向司法文本的搜索排序方法及系统

Similar Documents

Publication Publication Date Title
KR101826815B1 (ko) 이미지-특징-기반 인식을 위한 시스템들 및 방법들
US10671662B2 (en) Method and system for analyzing an image generated by at least one camera
JP5665125B2 (ja) 画像処理方法、及び、画像処理システム
US8577882B2 (en) Method and system for searching multilingual documents
JP2011008752A (ja) ドキュメント操作システム、ドキュメント操作方法およびそのためのプログラム
CN102591868A (zh) 用于拍照指南自动生成的系统和方法
JPWO2013089146A1 (ja) 情報処理システム、情報処理方法、通信端末およびその制御方法と制御プログラム
EP2806336A1 (en) Text prediction in a text input associated with an image
US20140059079A1 (en) File search apparatus, file search method, image search apparatus, and non-transitory computer readable storage medium
WO2013115203A1 (ja) 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
JP6822484B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20140205194A1 (en) Information processing apparatus and computer-readable medium
WO2015159417A1 (ja) 撮影映像による文書検索システム
JP2019083532A (ja) 画像処理システム、画像処理方法および画像処理プログラム
WO2021145030A1 (ja) 映像検索システム、映像検索方法、及びコンピュータプログラム
US20180189602A1 (en) Method of and system for determining and selecting media representing event diversity
JP2018137639A (ja) 動画像処理システム、並びに、符号化装置及びプログラム、並びに、復号装置及びプログラム
JP5188290B2 (ja) アノテーション装置、アノテーション方法およびプログラム
Uchiyama et al. On-line document registering and retrieving system for AR annotation overlay
WO2016098187A1 (ja) 画像検索装置および画像検索方法
JP6780262B2 (ja) 画像変換装置、プログラム
JP2016535356A (ja) 製品説明の照会方法、装置、システムおよびクライアント
JP6704680B2 (ja) 表示装置、情報処理プログラムおよび情報処理方法
CN112749292B (zh) 用户标签生成方法及装置、计算机装置和存储介质
JP2009037466A (ja) 参照画像作成表示装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14889239

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14889239

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP