JP2011018202A - アノテーションの検索情報作成、登録手段及び検索手段を実現するための情報処理装置 - Google Patents

アノテーションの検索情報作成、登録手段及び検索手段を実現するための情報処理装置 Download PDF

Info

Publication number
JP2011018202A
JP2011018202A JP2009162478A JP2009162478A JP2011018202A JP 2011018202 A JP2011018202 A JP 2011018202A JP 2009162478 A JP2009162478 A JP 2009162478A JP 2009162478 A JP2009162478 A JP 2009162478A JP 2011018202 A JP2011018202 A JP 2011018202A
Authority
JP
Japan
Prior art keywords
search
document
information
result
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009162478A
Other languages
English (en)
Inventor
Yuki Kusakabe
悠希 草壁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009162478A priority Critical patent/JP2011018202A/ja
Publication of JP2011018202A publication Critical patent/JP2011018202A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 アノテーションデータをファイル内部に元文書とは別に作成することが出来るが、検索対象にならない。
【解決手段】 アノテーションデータから検索データを作成し、別ファイルとして保存し、検索エンジン(インデクサ)に登録する。検索結果を表示する際、検索エンジンから検索結果として前記検索データが取得された場合に、検索結果として、検索データに関連付けられたアノテーションデータを付与した文書を検索結果として表示する。
【選択図】 図10

Description

本発明は、文書に対するアノテーションを検索する情報処理装置、プログラム、記憶媒体に関するものである。これは情報処理装置が、文書に対してアノテーションを加えた場合に付加情報を検索情報として別途ファイルを作成し、検索対象とすること、及び検索対象を検索した結果、アノテーションを加えた文書を検索結果として表示することを実行するプログラムに関するものである。
アノテーションとは、ある文書に対して関連する情報を付与することである。文書に対してコメントなどの付加情報を付与することで元文書の情報を変更することなく情報を追加することで、文書の価値を挙げている。
アノテーションは、ファイル内部に元文書とは別にアノテーションデータを作成し、管理することで元文書自体を改変することなく、自由に情報を付与することが可能である。一方、文書検索という観点において検索は、文書自体を検索し、検索結果として表示するものである。従って、文書自体を検索しても、別に管理されているアノテーションは、検索対象外になってしまうという課題がある。
これでは、ユーザーが追加した情報が検索できなくなってしまうため、操作性が低くなってしまう。
通常、アノテーションデータを検索するためには、
(1)アノテーションを検索対象にするために検索対象となるファイル自身の検索情報登録手段を変更する、
(2)検索エンジンの検索手段を変更する、
ことで、アノテーションを検索することを実現する。しかしながら、(1)の手法では、アノテーションを付与するドキュメントごとに検索情報登録手段を作成しなければならない、また、(2)の手法では、検索エンジンの検索手段を変更しなければならない、というところで、いずれも既存の検索手段を変更しなければならず、ユーザーに変更の負担がかかる。
従来は、アノテーションデータを文書とは別のデータベースに管理し、データベースでは、文書とアノテーションとアノテーションの属性テーブルを持ち、検索時は、アノテーションデータを持つ別データベースに対して検索を行うことでアノテーションと文書を表示していた。(例えば、特許文献1)
特開2004−151898号公報
しかし、上記(1)の手法では、アノテーションを付与するドキュメントごとに検索情報登録手段を作成しなければならない。検索情報はファイルの種類(拡張子)単位で、登録されているため、アノテーションを元文書の検索情報に加えて検索させるためには、元文書の検索情報に修正を加え、アノテーションを検索情報としなければならず、アノテーションデータが元文書とは別に作成・管理することが困難になってしまう。
また、上記(2)の手法では、検索エンジンの検索手段を変更しなければならない。一般的にはOSが提供する検索エンジンが存在するが、このエンジン自体を変更することは容易ではない。また、独自の検索エンジンを作成することも考えられるが、既に存在するエンジンのほかに新たに検索エンジンを作成し、ユーザーに提供し、動作させるということは、情報処理装置全体のパフォーマンスを下げてしまう。先述した技術を使用した場合、文書を管理するデータベースとは別にアノテーションデータを管理するためのデータベースを作成して、アノテーション用のデータベースが検索するためのエンジンを用意し、検索結果の表示を行わなければならない。
というところで、いずれも既存の検索手段を変更しなければならず、ユーザーに変更の負担がかかる。
文書を保存して記憶する文書保存記憶領域(0103)と、
文書保存記憶領域にアクセスして検索する文書検索手段(0203)と、
文書検索手段に文書を検索するための条件を登録できる文書検索登録手段(0202)と、
文書検索手段によって、検索された文書を表示装置に表示する検索結果表示手段(1202)を有する情報処理プログラム、及び情報処理装置であって、以下の手段を有することを特徴とする。
前記検索手段に対して検索対象とは別に検索対象を元に検索情報を作成することが可能な情報を作成する検索情報作成手段(S0503)と、
前記検索情報作成手段で作成した検索情報を前記検索登録手段によって登録する検索登録実行手段(S0801)を有し、
前記検索情報作成手段で作成した検索情報を前記検索手段に対して検索する検索要求手段(S1001)と、
前記検索要求手段で取得した検索結果を取得する検索結果取得手段(S1002)と、
前記検索結果取得手段で取得した検索結果が作成した検索情報であるかどうかを判断する検索結果判断手段(S1003)と、
検索結果判断手段において、取得した検索結果が作成した検索情報であった場合は、取得した検索情報ではなく検索情報に示された関連付けられた文書を前記検索結果表示手段に対して表示することを特徴とする検索手段(S1004)。
本提案では、アノテーション情報を別ファイルに保存し、検索エンジンに対して登録することで、検索エンジン及び元ドキュメントの検索情報登録手段を変更すること無く、アノテーション情報を元ドキュメントの検索対象として追加することが可能になる。
これによりユーザーに元ドキュメントの検索情報登録手段も検索エンジンも変更させること無くアノテーションを検索対象として表示することが出来る。
また、ユーザーが追加した情報を検索対象とすることが可能になり、ユーザーの操作性を向上することが可能になる。
また、アノテーション情報を独自に追加することが出来るため、検索の幅を自由に広げることが可能になる。
情報処理装置のハードウェアブロック図 検索を実現するための動作を示すブロック図 文書に対してアノテーションを付与したファイルの形式の一例を模式的に示す図 アノテーションデータから検索情報ファイルを作成することを実現するためのアプリケーション構成図 アノテーションデータの検索情報ファイル作成フロー 検索情報ファイルの作成を示すシーケンス図 検索情報ファイルを検索処理部のエンジン部が検索できるためのインデックスを生成するためにインデクサ部に対し、インデックスを生成することを要求することを実現するためのアプリケーション構成図 インデクサ部に解析情報を登録するフロー アノテーションデータを検索し、検索結果としてアノテーションデータが付与された文書ファイルを表示することを実現するためのアプリケーション構成図で アノテーションデータ検索フロー アノテーションをつけたデータ文書と検索情報ファイルのファイル関連図 検索結果を表示する前の状態を示すUI図の一例 アノテーションを付与するアプリケーションが検索情報ファイルを生成することを実現するためのアプリケーション構成図 アノテーションデータの検索情報ファイル作成フロー アノテーションデータの検索結果表示フロー 検索結果を表示した状態を示すUI図の一例
(実施例1)
図1は、情報処理装置のハードウェアブロック図である。図1において、CPU0101は、記憶媒体であるHDD0103からRAM0102にロードされたOSやアプリケーションなどのプログラムを実行し、図2のアプリケーション構成や、後述するフローチャートの手順を実現する。またCPU0101は、システムバス0105に接続される各ハードウェアを総括的に制御する。RAM0102は、CPU0101の主メモリ、ワークエリア等として機能する。I/O0104は、不図示のキーボードやポインティングデバイスからのキー入力を制御する。
図2は、検索を実現するための動作を示すブロック図である。図2において、検索処理部(0201)は、インデクサ部(0202)とエンジン部(0203)からなる。インデクサ部(0202)は、検索対象となるファイル(0205)を解析し、インデックス(0204)と呼ばれる検索情報を作成し、HDD0103内に保存する。エンジン部(0203)は、検索要求に対して、インデクサ部が作成したインデックスを参照し、検索要求に一致するインデックスの有無を確認し、検索結果を返す処理を行う。
図3は、文書に対してアノテーションを付与したファイルの形式の一例を模式的に示す図である。文書ファイル(0301)は、内部に文書データ(0302)とアノテーションデータ(0303)を持つ。例えば、汎用フォーマットファイル(例えばPDF)などの場合、汎用フォーマットファイル自身として解釈できるデータを文書データ内に持ち、拡張領域に任意にデータを保存することができる。この拡張領域にアノテーションデータを保存することで、汎用フォーマットファイルを表示する際、文書データを表示した上に拡張領域に保存してあるアノテーションデータをオーバーレイすることで、アノテーションデータがついた文書ファイルの表示が可能となる。(0304)
本発明を実施するためのシーケンス及びアプリケーション構成を以下に示す。
図4は、アノテーションデータから検索情報ファイルを作成することを実現するためのアプリケーション構成図である。アプリケーション(0401)は、文書取得部(0402)と検索情報作成部(0403)を持つ。それぞれがどのような処理を行うかを図5に示すフロー図で説明する。
文書取得部(0402)は、文書ファイルを取得し(S0502)、検索情報作成部(0403)へ渡す。検索情報作成部(0403)は、文書ファイルにアノテーションデータが付与されているかいないかを判断し(S0502)、アノテーションデータが付与されている場合は、検索情報ファイルを作成し(S0503)、HDD(0103)内のファイル格納部にファイルを格納する。
図11にアノテーションをつけたデータ文書と検索情報ファイルのファイル関連図を示す。
文書ファイル0302は、アノテーションをつけた文書である。文書ファイル1102はアノテーションをつけていない文書である。フロー図5の処理により、それぞれアノテーションをつけた文書ファイル0302には対応づいた検索情報ファイル1101が作成される。検索情報ファイル1101内には、アノテーションデータから作成された検索情報とアノテーションデータが付与されていた文書ファイルの保存位置情報が含まれる。作成方法については、図6を用いて説明する。
図6は、検索情報ファイルの作成を示すシーケンス図である。アノテーションデータが付与されている文書ファイルからアノテーションデータを抽出する(S0601)。抽出したアノテーションデータから検索キーワードを作成し、保存する(S0602)。検索キーワードは、例えば、アノテーションにつけられた表示する文字列だけで作成してもよいし、アノテーションデータを解析し、図形データの形状やイメージデータのファイル名を検索キーワードとして、保存してもよい。検索キーワードを保存後、アノテーションデータが付与されていた文書ファイルの保存位置情報を検索情報ファイルに保存する(S0603)。
図7は、検索情報ファイルを検索処理部のエンジン部が検索できるためのインデックスを生成するためにインデクサ部に対し、インデックスを生成することを要求することを実現するためのアプリケーション構成図である。アプリケーション(0701)は、解析情報登録部(0702)を持つ。これがどのような処理を行うかを図8に示すフロー図で説明する。アプリケーション0701は前述アプリケーション0401と同一でも異なるアプリでもどちらでも良い。
解析情報登録部(0702)は、検索処理部(0201)に対し、インデックスを生成するための解析手段を登録する(S0801)。解析手段を登録されたインデクサ部(0202)は、インデクサ部(0202)がクロールを行った時に検索情報ファイルから、インデックスを生成する。これにより、検索情報ファイルに含まれる検索キーワードがインデクサ部に解析され、検索エンジンから検索結果として取得できるようになる。
図9はアノテーションデータを検索し、検索結果としてアノテーションデータが付与された文書ファイルを表示することを実現するためのアプリケーション構成図である。アプリケーション(0901)は、UI部(0902)と検索要求部(0903)と検索結果判定部(0904)を持つ。
それぞれがどのような処理を行うかを図10に示すフロー図で説明する。ユーザーが検索したい検索キーワードをUI部(0903)で入力し、検索を実行する。検索が実行されると検索要求部(0903)は、エンジン部(0203)に対し、検索要求を行う(S1001)。エンジン部(0203)は、インデックス情報(0204)を参照し、検索結果を検索要求部(0903)に返す。これにより検索要求部(0903)は、検索結果をエンジン部(0203)から取得する(S1002)。検索要求部(0903)は、取得した検索結果を検索結果判定部(0904)に渡す。検索結果判定部(0904)は、検索結果が検索情報ファイルか否かを判定する(S1003)。検索結果判定部(0904)は、検索結果が検索情報ファイルであった場合、検索情報ファイル内に記載されているアノテーションデータが付与されている文書の位置を参照し、参照した文書を検索結果として表示する(S1004)。検索結果が、検索情報ファイルでなかった場合は、検索結果をそのまま検索結果として表示する(S1005)。これにより、アノテーションデータを付与した文書を検索することが可能である。本実施例を示すアプリケーションのUI例を図12及び図16に示す。
図12は、検索を行う前の文書一覧表示状態である。アプリケーションUI部0901は、検索キーワード入力部1201と文書表示領域1202から成る。図12は、検索前の状態で、文書表示領域1202に文書が複数表示されている状態を表している。
ユーザーは、UI部0901内の検索キーワード入力部1201に検索したいキーワードを入力する。検索キーワード入力部1201に入力されたキーワードをフロー図10の処理に従い検索する。その結果の表示例を図16に示す。
文書表示領域1202は、S1004及びS1005で表示を実行している文書が表示されている。ここで文書0302は、S1002で取得した検索結果は、検索情報ファイル1101であるが、結果として表示している文書は、S1004の処理により文書0302であることを示している。文書1101はS1005の処理により検索結果として文書1101を表示していることを示している。
(実施例2)
実施例2として、検索情報ファイルの異なる生成手段を記載する。
図13は、アノテーションを付与するアプリケーションが検索情報ファイルを生成することを実現するためのアプリケーション構成図である。アプリケーション(1301)は、アノテーション作成部(1302)と検索情報作成部(1302)を持つ。それぞれがどのような処理を行うかを図14に示すフロー図で説明する。
アノテーション作成部(1302)は、文書ファイルに対して、アノテーションを付与する(S1401)。文書ファイルにアノテーションを付与すると検索情報作成部(1303)は、付与したアノテーションが検索に必要な情報か否かを判断し(S1402)、必要な情報であれば、検索情報ファイルに保存する(S1403)。検索情報ファイルの作成手段は、図6のシーケンス図と同様である。これにより、検索情報ファイルをアノテーション付与時に作成することが可能になる。後の処理は、実施例1と同様である。
(実施例3)
実施例3として、検索結果の表示手段(S1004)の別形態の表示手段について記載する。全ての文書ファイルを検索した結果、元文書と検索情報ファイルが関連付けた文書が同一の文書ファイルを指し示す場合がある。このような場合に、同じ文書を検索結果として表示しないようにする手段を提供する。図15は、表示時のシーケンス図である。
S1001〜S1005は、実施例1の図10と同様の処理を行う。この後に、S1004で表示する文書とS1005で表示する文書が同一文書であるか否かを参照先が同一であるか否かで判断し(S1501)、同一である場合は、重複している参照の文書を1つにして(S1501)表示する。これにより、検索情報ファイルが参照する文書と元文書が検索結果として関連付けた自身の文書が重複して表示されないようにすることが可能となる。

Claims (3)

  1. 文書を保存して記憶する文書保存記憶領域(0103)と、
    文書保存記憶領域にアクセスして検索する文書検索手段(0203)と、
    文書検索手段に文書を検索するための条件を登録できる文書検索登録手段(0202)と、
    文書検索手段によって、検索された文書を表示装置に表示する検索結果表示手段(1202)とを有する情報処理装置であって、
    前記検索手段に対して検索対象とは別に検索対象を元に検索情報を作成することが可能な情報を作成する検索情報作成手段(S0503)と、
    前記検索情報作成手段で作成した検索情報を前記検索登録手段によって登録する検索登録実行手段(S0801)と、
    前記検索情報作成手段で作成した検索情報を前記検索手段に対して検索する検索要求手段(S1001)と、
    前記検索要求手段で取得した検索結果を取得する検索結果取得手段(S1002)と、
    前記検索結果取得手段で取得した検索結果が作成した検索情報であるかどうかを判断する検索結果判断手段(S1003)と、
    検索結果判断手段において、取得した検索結果が作成した検索情報であった場合は、取得した検索情報ではなく検索情報に示された関連付けられた文書を前記検索結果表示手段に対して表示することを特徴とする検索手段(S1004)と、
    を有することを特徴とする情報処理装置。
  2. 前記検索結果表示手段は、取得した検索結果と作成した検索情報に関連付けられた文書を一覧表示する場合において、同一文書であるかどうかを判断する重複文書判断手段(S1501)と、
    同一文書である場合は、1つだけを結果として表示する重複文書削除手段(S1502)とを有することを特徴とする請求項1に記載の情報処理装置。
  3. アノテーションデータから作成した検索データを別ファイルとして保存する保存手段と、
    前記別ファイルとして保存された検索データを、検索手段に登録する登録手段と、
    前記検索手段で検索を行ったときに前記検索データが検索された場合は、検索結果として、当該検索された検索データに関連付けられたアノテーションデータを付与した文書を検索結果として表示する検索結果表示手段と、
    を有することを特徴とする情報処理装置。
JP2009162478A 2009-07-09 2009-07-09 アノテーションの検索情報作成、登録手段及び検索手段を実現するための情報処理装置 Pending JP2011018202A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009162478A JP2011018202A (ja) 2009-07-09 2009-07-09 アノテーションの検索情報作成、登録手段及び検索手段を実現するための情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009162478A JP2011018202A (ja) 2009-07-09 2009-07-09 アノテーションの検索情報作成、登録手段及び検索手段を実現するための情報処理装置

Publications (1)

Publication Number Publication Date
JP2011018202A true JP2011018202A (ja) 2011-01-27

Family

ID=43595939

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009162478A Pending JP2011018202A (ja) 2009-07-09 2009-07-09 アノテーションの検索情報作成、登録手段及び検索手段を実現するための情報処理装置

Country Status (1)

Country Link
JP (1) JP2011018202A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5270018B1 (ja) * 2012-05-11 2013-08-21 株式会社東芝 システム及び手書き文書管理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5270018B1 (ja) * 2012-05-11 2013-08-21 株式会社東芝 システム及び手書き文書管理方法

Similar Documents

Publication Publication Date Title
US11361035B2 (en) Batch generation of links to documents based on document name and page content matching
US9965495B2 (en) Method and apparatus for saving search query as metadata with an image
JP2008257444A (ja) 類似ファイル管理装置、その方法及びそのプログラム
JP5539127B2 (ja) 文書管理システム、検索指定方法、プログラム
US10467209B2 (en) Document management client apparatus and document management method
JP2010061334A (ja) ファイル管理システム、ファイル管理方法、およびプログラム
JP2010102593A (ja) 情報処理装置およびその方法、プログラム、記録媒体
JP4546277B2 (ja) 図面管理方法及び図面管理プログラム
JP7322438B2 (ja) 情報処理装置および情報処理プログラム
JP2010092383A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
JP2008234078A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理プログラムを記録した記録媒体
JP2011018202A (ja) アノテーションの検索情報作成、登録手段及び検索手段を実現するための情報処理装置
JP2005339580A (ja) 文書データ管理装置およびプログラム
US10895958B2 (en) Electronic document management device, electronic document management system, and electronic document management program
US9984084B2 (en) Information processing apparatus, method for controlling same, and storage medium
JP2018005509A (ja) 情報処理装置、制御方法、及びプログラム
JP2009199164A (ja) 文書管理装置、文書管理方法及び記録媒体
JP6124640B2 (ja) 文書管理装置、情報処理方法及びプログラム
JP2018041337A (ja) ファイル管理システム、及び制御方法
JP6257157B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20230252000A1 (en) Information processing system, information processing method, and non-transitory computer readable medium
JP2004164301A (ja) 情報処理装置、情報処理方法およびその方法をコンピュータに実行させるプログラム
JP2010097292A (ja) 情報処理装置及び情報処理方法
JP5511520B2 (ja) 情報処理装置および制御方法およびプログラム
JP2008178080A (ja) 画像生成装置、画像生成方法