JP2006323782A - サーバ装置、及びその制御方法 - Google Patents

サーバ装置、及びその制御方法 Download PDF

Info

Publication number
JP2006323782A
JP2006323782A JP2005148562A JP2005148562A JP2006323782A JP 2006323782 A JP2006323782 A JP 2006323782A JP 2005148562 A JP2005148562 A JP 2005148562A JP 2005148562 A JP2005148562 A JP 2005148562A JP 2006323782 A JP2006323782 A JP 2006323782A
Authority
JP
Japan
Prior art keywords
file
character string
database
document
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005148562A
Other languages
English (en)
Other versions
JP4347264B2 (ja
Inventor
Shuichi Morisawa
秀一 森澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005148562A priority Critical patent/JP4347264B2/ja
Priority to US11/433,473 priority patent/US7818813B2/en
Publication of JP2006323782A publication Critical patent/JP2006323782A/ja
Application granted granted Critical
Publication of JP4347264B2 publication Critical patent/JP4347264B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

【課題】 暗号化されたファイルを登録する場合に、このファイルをその内容に含まれている文字列を用いて検索可能なように登録する為の技術を提供すること。
【解決手段】 暗号化された文書ファイル、関連ファイルを受信し(S42)、関連ファイルから文字列を抽出し(S44)、文書ファイルを抽出した文字列とセットにしてデータベース150に登録する(S45)。
【選択図】 図4

Description

本発明は、ファイルを管理する為の技術に関するものである。
近年、電子文書をインターネット等のネットワークを通じて共有、配信することが盛んに行われているが、電子メールに添付するにはサイズ上の制限がある場合が多いため、共有の文書サーバを立てて、利用する会社や組織に対応したフォルダ構成の元にファイルをやり取りすることが最近行われている。そこでは、文書のアップロード、コピー、ダウンロードなどの機能を使用して、業務に必要な文書を共有、配信している。
しかしながら、インターネット上でのデータのやりとりにはセキュリティ面での不安もあるため、企業の機密情報を送信するためには文書の内容を暗号化しておくのが望ましい。そのため、インターネットを経由して外部の文書管理サーバに文書をアップロードするに際し、送信するユーザはまずクライアントマシン上で暗号化プログラムを文書に対して実行することで内容を暗号化し、その後、サーバに格納することが一般的に行われている。
一方で、サーバに格納された文書を後から検索したいというニーズに対し、文書本文に出現する単語を指定して検索する、所謂全文検索を実現するためには、あらかじめ文書の内容をスキャンして言語解析を行い、インデックスを作成する必要があるが、ユーザのもとで暗号化されてアップロードされた文書はそのままでは当然内容を参照することはできず、インデックスを作成することは不可能である。そこで、例えば特許文献1では、暗号化された文書をサーバ内で一度平文に戻して検索用キーワードを作成する技術が開示されている。しかしながら、特許文献1ではサーバ内で文書を平文に戻す仕組みになっているので、サーバ管理業者の目から文書を隠すには不十分であるという問題点がある。
また、文書の持つ各種属性を指定して検索する属性検索する方法がある。文書の属性としては、文書名、URL、コメント、作成者、作成日時、更新日時、アクセス日時、サイズ、親フォルダ名、アクセス権等のユーザインデックスがあり、システム側で自動で付与するものと、ユーザが手動で入力するものとがある。
ユーザインデックスとは、ユーザが文書を登録する際にその文書を特徴付けるために自由に設定することのできるものである。属性検索では、これらの属性を任意に組み合わせて、目的とする文書を探すことができる。
しかしながら、属性検索は文書に書かれた内容で検索するには不向きであり、検索時の利便性を考慮すると、登録時に十分かつ適切なユーザインデックスを手作業により付加してやる必要があり、ユーザへの負担となっていた。
特開2000−011001号公報
上述のように、特許文献1ではサーバ内で文書を平文に戻す仕組みになっているので、サーバ管理業者の目から文書を隠すには不十分であるという問題点があった。また、属性検索では、ユーザが文書の登録時に適切なユーザインデックスを手作業で個々に入力する必要があり、ユーザの負担が増大していた。
本発明は以上の問題に鑑みてなされたものであり、暗号化されたファイルを登録する場合に、このファイルをその内容に含まれている文字列を用いて検索可能なように登録する為の技術を提供することを目的とする。
本発明の目的を達成するために、例えば本発明のサーバ装置は以下の構成を備える。
即ち、
ファイルを管理するサーバ装置であって、
暗号化された第1のファイルを受信する第1の受信手段と、
前記第1のファイルに関連する第2のファイルを受信する第2の受信手段と、
前記第2のファイルから文字列を抽出する抽出手段と、
前記第1のファイルを前記抽出手段が抽出した文字列とセットにしてデータベースに登録する登録手段と
を備えることを特徴とする。
本発明の目的を達成するために、例えば本発明の端末装置は以下の構成を備える。
即ち、
上記サーバ装置が前記データベースに登録したファイルのうち、所望のファイルを検索する為にキーとして用いる文字列を取得する取得手段と、
前記データベースに登録されているセット群のうち、前記取得手段が取得した文字列を含むセットを特定する特定手段と
前記特定手段が特定したセット中のファイルに係る情報を報知する報知手段と
を備えることを特徴とする。
本発明の目的を達成するために、例えば本発明のシステムは以下の構成を備える。
即ち、
端末装置と、当該端末装置から送信されたファイルを管理するサーバ装置と、を備えるシステムであって、
前記端末装置は、
前記サーバ装置に登録する第1のファイルを選択する第1の選択手段と、
前記第1のファイルを暗号化する暗号化手段と、
前記第1のファイルに関連する第2のファイルを選択する第2の選択手段と、
前記暗号化手段によって暗号化された第1のファイルと、前記第2のファイルとをセットにして前記サーバ装置に送信する送信手段と
を備え、
前記サーバ装置は、
前記端末装置から送信された前記第1のファイルを受信する第1の受信手段と、
前記端末装置から送信された前記第2のファイルを受信する第2の受信手段と、
前記第2のファイルから文字列を抽出する抽出手段と、
前記第1のファイルを前記抽出手段が抽出した文字列とセットにしてデータベースに登録する登録手段と
を備えることを特徴とする。
本発明の目的を達成するために、例えば本発明のサーバ装置の制御方法は以下の構成を備える。
即ち、ファイルを管理するサーバ装置の制御方法であって、
暗号化された第1のファイルを受信する第1の受信工程と、
前記第1のファイルに関連する第2のファイルを受信する第2の受信工程と、
前記第2のファイルから文字列を抽出する抽出工程と、
前記第1のファイルを前記抽出工程で抽出した文字列とセットにしてデータベースに登録する登録工程と
を備えることを特徴とする。
本発明の目的を達成するために、例えば本発明の端末装置の制御方法は以下の構成を備える。
即ち、上記サーバ装置が前記データベースに登録したファイルのうち、所望のファイルを検索する為にキーとして用いる文字列を取得する取得工程と、
前記データベースに登録されているセット群のうち、前記取得工程で取得した文字列を含むセットを特定する特定工程と
前記特定工程で特定したセット中のファイルに係る情報を報知する報知工程と
を備えることを特徴とする。
本発明の構成により、暗号化されたファイルを登録する場合に、このファイルをその内容に含まれている文字列を用いて検索可能なように登録することができる。
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
<本実施形態に係るシステムについて>
図1は、本実施形態に係るシステムの基本構成を示す図である。同図に示す如く、本実施形態に係るシステムは、サーバ装置100とクライアント端末装置170とで構成されており、それぞれはインターネット160を介して互いにデータ通信が可能な構成となっている。サーバ装置100は、クライアント端末装置170から送信されるファイルを登録、管理するためのデータベース150を備えている。なお、以下の説明では、データベース150に登録するファイルは文書ファイルであるとする。
図2は、本実施形態に係るシステムの機能構成を示すブロック図である。
文書登録部200は、クライアント端末装置170からインターネット160を介してサーバ装置100に送信した文書ファイルをサーバ装置100が有するデータベース150に登録する処理を行う。
関連文書送信部210は、登録しようとする文書ファイルとは別に、クライアント端末装置170の操作者が選択した関連ファイルを上記データベース150に送信する処理を行う。
インデックス作成部220は、上記関連ファイルから文字列を抽出し、これを上記文書ファイルのインデックスとしてデータベース150に登録する処理を行う。このインデックスは、全文検索を行うときに用いられるものである。
全文検索部230は、クライアント端末装置170の操作者が指定した文字列をキーとして、この文字列をインデックスとして上記データベース150に登録された文書ファイルを検索する処理を行う。
文書削除部270は、データベース150に登録されている文書ファイル群のうち、クライアント端末装置170の操作者が指定した文書ファイルを削除する処理を行う。
文書更新部260は、データベース150に登録された文書ファイルの内容、又は属性を更新する処理を行い、ある操作者が更新中の際に、他の操作者により同時に更新がかからないように排他制御を行うために、チェックイン・チェックアウト機能を備えたものである。
文書移動部250は、データベース150に登録されている文書ファイル群のうち、クライアント端末装置170の操作者が指定した文書ファイルを、この操作者が指定した記憶位置(例えばデータベース150内の他の記憶位置(他のフォルダ))に移動させる処理を行う。
ダウンロード部280は、データベース150に登録されている文書ファイル群のうち、クライアント端末装置170の操作者が指定した文書ファイルをクライアント端末装置170にダウンロードする処理を行う。
文書コピー部240は、データベース150に登録されている文書ファイル群のうち、クライアント端末装置170の操作者が指定した文書ファイルを、この操作者が指定した記憶位置(例えばデータベース150内の他の記憶位置(他のフォルダ))にコピーさせる処理を行う。
属性検索部290は、文書ファイルや文書ファイルが登録されているフォルダの各種属性をクライアント端末装置170の操作者が指示すると、これをキーとして、目的の文書ファイルやフォルダを検索する処理を行う。
文書ファイルや文書ファイルが登録されているフォルダの各種属性としては、文書名、URL、コメント、作成者、作成日時、更新日時、アクセス日時、サイズ、親フォルダ名、アクセス権、各種ユーザインデックスなどがあり、さらにフォルダ特有の属性としては、廃棄期限設定や更新通知設定などがある。これらはシステム側で自動で付与するものと、操作者が文書ファイルの登録時に手作業で入力するものの両方がある。ユーザインデックスとは、操作者が文書ファイルの登録時やその後で、必要に応じて自由に付与することのできるものであり、予め管理ユーザが定義した型の範囲内であれば、任意の文字列を入力することが可能である。
図16は、サーバ装置100、クライアント端末装置170のそれぞれの基本的なハードウェア構成を示すブロック図である。なお、それぞれの装置のハードウェア構成についてはこれに限定するものではなく、様々な構成が考え得る。
先ず、端末装置170のハードウェア構成について説明する。端末装置170は同図に示す如く、CPU1651、RAM1652、操作部1653、外部記憶装置1654、表示部1655、I/F1656を備える。
CPU1651は、RAM1652にロードされたプログラムやデータを用いてクライアント端末装置170全体の制御を行うと共に、クライアント端末装置170が行う後述の各処理を実行する。
RAM1652は、外部記憶装置1654からロードされたプログラムやデータを一時的に記憶するためのエリア、CPU1651が各種の処理を実行する際に用いるエリアなど、各種のエリアを提供することができる。
操作部1653は、キーボードやマウスなどにより構成されており、クライアント端末装置170の操作者が操作することで、各種の指示をCPU1651に対して入力することができる。
外部記憶装置1654は、ハードディスクドライブ装置に代表される大容量情報記憶装置であり、ここにはOS(オペレーティングシステム)や、クライアント端末装置170が行う後述の各処理をCPU1651に実行させるためのプログラムやデータが保存されており、これらの一部若しくは全部はCPU1651による制御に従って適宜RAM1652にロードされ、CPU1651による処理対象となる。
表示部1655はCRTや液晶画面などにより構成されており、CPU1651による処理結果を画像や文字などでもって表示する。
I/F1656は、クライアント端末装置170をインターネット160に接続する為のインターフェースとして機能するものであり、クライアント端末装置170はこのI/F1656を介してサーバ装置100とのデータ通信を行う。
1657は上述の各部を繋ぐバスである。
次に、サーバ装置100のハードウェア構成について説明する。サーバ装置100は同図に示す如く、CPU1601、RAM1602、操作部1603、外部記憶装置1604、表示部1605、I/F1606を備える。
CPU1601は、RAM1602にロードされたプログラムやデータを用いてサーバ装置100全体の制御を行うと共に、サーバ装置100が行う後述の各処理を実行する。
RAM1602は、外部記憶装置1604からロードされたプログラムやデータを一時的に記憶するためのエリア、I/F1606を介して受信したデータを一時的に記憶するためのエリア、CPU1601が各種の処理を実行する際に用いるエリアなど、各種のエリアを提供することができる。
操作部1603は、キーボードやマウスなどにより構成されており、サーバ装置100の操作者が操作することで、各種の指示をCPU1601に対して入力することができる。
外部記憶装置1604は、ハードディスクドライブ装置に代表される大容量情報記憶装置であり、ここにはOS(オペレーティングシステム)や、サーバ装置100が行う後述の各処理をCPU1601に実行させるためのプログラムやデータが保存されており、これらの一部若しくは全部はCPU1601による制御に従って適宜RAM1602にロードされ、CPU1601による処理対象となる。また、外部記憶装置1604内には上記データベース150も設けられている。
表示部1605はCRTや液晶画面などにより構成されており、CPU1601による処理結果を画像や文字などでもって表示する。
I/F1606は、サーバ装置100をインターネット160に接続する為のインターフェースとして機能するものであり、サーバ装置100はこのI/F1606を介してクライアント端末装置170とのデータ通信を行う。
1607は上述の各部を繋ぐバスである。
<文書ファイルの登録に際し、クライアント端末装置170が行う処理について>
次に、サーバ装置100に登録する文書ファイルを選択し、サーバ装置100に送信する為にクライアント端末装置170が行う処理について、同処理のフローチャートを示す図3を用いて説明する。なお、同図のフローチャートに従った処理をCPU1651に実行させるためのプログラムやデータは外部記憶装置1654に保存されており、これは適宜CPU1651による制御に従ってRAM1652にロードされるので、CPU1651はこれを用いて処理を行うことで、クライアント端末装置170は以下説明する各処理を実行することになる。
サーバ装置100に文書ファイルを登録する為のGUI(データベースビューア)を表示部1655の表示画面上に表示するための操作を、クライアント端末装置170の操作者が操作部1653を用いて入力すると、CPU1651はこれを検知して、同図のフローチャートに従った処理を開始するのであるが、先ず、データベースビューアを表示部1655の表示画面上に表示する(ステップS30)。
図5は、データベースビューアの表示例を示す図である。同図に示す如く、データベースビューアは、サーバ装置100が有する外部記憶装置1604内のデータベース150内のディレクトリ構成をツリー形式で表示する領域501、この領域501内で現在選択しているフォルダに格納されているそれぞれのファイルを示すアイコンを、チェックボックスと共に表示する領域502、そして登録ボタン503を備える。
なお、領域501内に表示されているフォルダ群のうち、所望のフォルダを指示し、所望のフォルダに格納されているファイルの一覧を領域502内に表示するという一連の操作については一般に用いられている操作方法であるので、これに関する説明は省略する。
よってステップS30では、CPU1651は、データベースビューアの表示指示を受けると、先ずサーバ装置100にアクセスし、データベース150内のディレクトリ構成を取得し、取得したディレクトリ構成を領域501に表示すると共に、領域501内でフォルダが指示された場合には、指示されたフォルダに格納されているファイル情報(ファイル名や属性など)を取得し、領域502内に一覧表示する。
なお、外部記憶装置1604内のディレクトリ構成はツリー形式で表示することに限定するものではなく、様々な形式が考え得る。また領域502内にはアイコンの代わりに、ファイル名やファイルの属性を表示するようにしても良い。いずれにせよ、それぞれのファイル情報(アイコン、ファイル名、属性など)は、チェックボックスと共に表示する。
本実施形態では現在指示しているフォルダ内に文書ファイルを登録する(即ち領域502に表示しているファイルと同じフォルダに登録する)ので、ここで、クライアント端末装置170の操作者が操作部1653を用いて登録ボタン503を指示すると、CPU1651はこれを検知して処理をステップS31を介してステップS32に進め、図6に示すGUI(文書登録GUI)を表示部1655の表示画面上に表示する(ステップS32)。
図6は、文書登録GUIの表示例を示す図である。領域601はデータベース150に登録する文書ファイルのファイル名を入力するための領域で、クライアント端末装置170の操作者が操作部1653を用いてファイル名を入力することのできる領域である。この領域601に入力されたファイル名を有する文書ファイルがデータベース150に登録するものとして指定した文書ファイルとなる。
なお、データベース150に登録する文書ファイルの指定方法はこれ以外にもあり、「参照」ボタン602を操作部1653を用いて指示すると、CPU1651はこれを検知して、外部記憶装置1654内に保存されている文書ファイル、及びクライアント端末装置170がアクセス可能な装置が保持している文書ファイルを表示部1655の表示画面上に一覧表示させる。よって、表示された一覧の中から所望の文書ファイルを操作部1653を用いて指示すると、そのファイル名が領域601に表示される。なお、データベース150に登録する文書ファイルの指定方法についてはこれに限定するものではない。
よって、図3に戻って、次に、クライアント端末装置170の操作者は操作部1653を用いて領域601にデータベース150に登録する文書ファイルのファイル名を直接入力する、もしくは「参照」ボタン602を指示することで表示される一覧の中からデータベース150に登録する文書ファイルを操作部1653を用いて指示する等の操作により、データベース150に登録する文書ファイルを指定するので、CPU1651はこれを検知して、領域601に指定された文書ファイルのファイル名を表示する(ステップS33)。
次に、操作者が操作部1653を用いて領域603に文書名を入力する操作を行った場合には、CPU1651はこれを検知し、処理をステップS34を介してステップS35に進め、入力された文書名を領域603に表示する(ステップS35)。なお、文書名の入力は必須なものではない。よって、文書名に何も指定しない場合には、領域601に表示されるファイル名から拡張子を除いた部分を領域603に表示する。
次に、クライアント端末装置170の操作者は、登録しようとする文書ファイル(以下、登録文書ファイル)に関連するファイル(以下、関連ファイル)を指定する。
登録文書ファイルはデータベース150に登録する際には暗号化して登録するので、登録後は、上述の通り、この文書ファイル内の文字列は不可読となる。よって、この文書ファイルに記載された内容に含まれる文字列をキーとしてこの文書ファイルを検索することはできない。
よって、本実施形態では、この文書ファイルと内容的に関連のあるファイルを関連ファイルとして操作者が選択する。この関連ファイルには文書ファイルと共通する文字列がいくつか記載されているので、サーバ装置100は、これらの文字列を抽出し、抽出した文字列を全文検索用インデックスと見なしてこの文書ファイルと共にデータベース150に登録する。これにより、この文書ファイルに記載された文字列でもってこの文書ファイルを検索する場合には、この文書ファイルと共に登録された文字列(関連ファイルから抽出した文字列)を用いればよいので、結果として、文書ファイルに記載された文字列でもってこの文書ファイルを検索することができる。
図6において領域604はデータベース150に登録する関連ファイルのファイル名を入力するための領域で、クライアント端末装置170の操作者が操作部1653を用いてファイル名を入力することのできる領域である。
なお、関連ファイルの指定方法についてはこれ以外にもあり、「参照」ボタン605を操作部1653を用いて指示することで、CPU1651はこれを検知して、外部記憶装置1654内に保存されている関連ファイル、及びクライアント端末装置170がアクセス可能な装置が保持している関連ファイルを表示部1655の表示画面上に一覧表示させる。よって、表示された一覧の中から所望の関連ファイルを操作部1653を用いて指示すると、そのファイル名が領域604に表示される。なお、関連ファイルの指定方法についてはこれに限定するものではない。
よって、図3に戻って、次に、クライアント端末装置170の操作者は操作部1653を用いて領域604に関連ファイルのファイル名を直接入力する、もしくは「参照」ボタン605を指示することで表示される一覧の中から関連ファイルを操作部1653を用いて指示する等の操作により、関連ファイルを指定するので、CPU1651はこれを検知して、領域604に指定された関連ファイルのファイル名を表示する(ステップS36)。
次に、クライアント端末装置170の操作者が操作部1653を用いて領域606にコメントを入力する操作を行った場合には、CPU1651はこれを検知して処理をステップS37を介してステップS38に進め、入力されたコメントを領域606に表示する(ステップS38)。
また、文書ファイルの属性情報でも検索を可能とさせるために、管理ユーザにより予め定義されている各ユーザインデックスの項目をそれぞれ領域607から611に一定の型の範囲内で入力することができる。よって、それぞれの領域に対してクライアント端末装置170の操作者が操作部1653を用いて入力する操作を行った場合には、CPU1651はこれを検知して処理を、入力された情報を対応する領域に表示する(ステップS39)。
図7は、図6に示したGUIを用いて文書ファイル、関連ファイル、及びその他の情報を入力した場合の文書登録GUIの表示例を示す図である。同図のGUIでは、領域601に示す如く、「129484号.doc」なるファイル名を有する文書ファイルが文書ファイルとして指定されている。図8は、「129484号.doc」なるファイル名を有する文書ファイルの内容を示す図である。同図に示す如く、この文書ファイルは、ABC商事なる会社がXYシステムズなる会社に対して行う契約の内容が記載された契約書の文書ファイルである。
また、図6のGUIにおいて、領域604に示す如く、「パンフ_XY.doc」なるファイル名を有する関連ファイルが関連ファイルとして指定されている。図10は、「パンフ_XY.doc」なるファイル名を有する関連ファイルの内容を示す図である。同図に示す如く、この関連ファイルは、上記XYシステムズなる会社の宣伝用のパンフレットである。このパンフレットには、図8に示した文書ファイルに記載された文字列のいくつかが含まれている。よって、このように、文書ファイルに関連のある関連ファイルを選択することで、互いに同じ文字列を有することになる。
ここで、関連ファイルとして、文書ファイル(契約書)のような秘匿性が高いものではなく、一般的な情報が記載されたものを用いていることに注意されたい。即ち、このような関連ファイルに記載された文字列には文書ファイルに記載された内容のような秘匿性はないので、関連ファイルに記載された文字列を全文検索用インデックスとして用いても、文書ファイルに記載された内容は秘匿されたままとなり、文書ファイルに対する秘匿性は保持される。
図6に戻って、領域606にはコメントとして「社外秘」なる文字列が入力されており、領域607には「保守サービス」なる文字列、領域610には「年間」なる文字列が入力されている。なお、ユーザインデックスとして入力可能な項目についてはこれに限定するものではない。また、同図では、文書名は入力されていないので、CPU1651は文書名として、文書ファイルのファイル名「129484号.doc」から拡張子「.doc」を省いた部分「129484号」を文書名とする。
以上の用にして、文書ファイル、関連ファイルを指定すると共に、それ以外の情報についても適宜入力することができる。
図3に戻って次に、クライアント端末装置170の操作者が操作部1653を用いて図6の実行ボタン612を指示すると、CPU1651はこれを検知して、先ず、領域601に表示されているファイル名の文書ファイル(本実施形態では、図8に示す「129484号.doc」なるファイル名を有する文書ファイルであるとする)を暗号化する(ステップS310)。図9は、暗号化された文書ファイルの内容を示す図である。同図に示す如く、暗号化された文書ファイルは、その内容からは図8に示した内容が分からないようなものとなっている。なお、暗号化のアルゴリズムについては特に限定するものではない。
そして、暗号化した文書ファイル、領域604に表示されているファイル名の関連ファイル(本実施形態では、図10に示す「パンフ_XY.doc」なるファイル名を有する関連ファイルであるとする)、そして適宜入力した各種の情報をそれぞれサーバ装置100に対して送信する(ステップS311)。
<文書ファイルの登録に際し、サーバ装置100が行う処理について>
次に、クライアント端末装置170から送信された文書ファイルをデータベース150に登録するためにサーバ装置100が行う処理について、同処理のフローチャートを示す図4を用いて説明する。なお、同図のフローチャートに従った処理をCPU1601に実行させるためのプログラムやデータは外部記憶装置1604に保存されており、これは適宜CPU1601による制御に従ってRAM1602にロードされるので、CPU1601はこれを用いて処理を行うことで、サーバ装置100は以下説明する各処理を実行することになる。
先ず、CPU1601は、クライアント端末装置170から送信された各データを検知すると、それぞれを一時的にRAM1602に記憶する(ステップS42)。データによっては外部記憶装置1604に保存するようにしても良い。
次に、受信した関連ファイルを参照し、サムネイルを作成する(ステップS43)。図11は、関連ファイルのサムネイルを示す図で、同図に示すサムネイルは、図10に示した関連ファイルのサムネイル(縮小画像)となっている。なお、所定のファイルの内容から、このファイルのサムネイルを作成する技術については周知であるので、これに関する説明は省略する。
次に、関連ファイルに含まれている文字列を抽出し、抽出したそれぞれの文字列を全文検索用インデックスとしてRAM1602に順次記憶する(ステップS44)。本実施形態では関連ファイルは図10に示したものであるとするので、「XYシステムズ」、「会社」、「ネットワーク」、「サポート」、「当社」、「相談」、「一例」、「インターネット」、「ルータ」、「データベース」、「RAID」、「バックアップサーバ」、「お見積もり」、「無料」、「下記」、「電話」のそれぞれの文字列が抽出され、それぞれが全文検索用インデックスとしてRAM1602に順次記憶される。なお、関連ファイルがテキストファイルである場合にはファイル中の文字列を単に抽出すればよいのであるが、関連ファイルが画像ファイルで、文字列の画像が含まれている場合には、この画像を周知の技術で認識して文字領域を特定し、特定した文字領域中の各文字を認識して文字列を得るようにする。
いずれにせよ、関連ファイルがどのようなものであったとしても、ステップS44ではこれに含まれる文字列を抽出し、抽出した文字列を全文検索用インデックスとしてRAM1602に順次記憶する。
図12は、ステップS44で抽出されたそれぞれの文字列を管理しているテーブルの構成例を示す図で、同図に示す如く、上述の抽出された各文字列は、抽出された位置と共に管理されている。よって、ステップS44で抽出した文字列はその抽出位置と共に、同図のようなテーブル形式でもってRAM1602に記憶する。なお、各文字列の管理形態についてはこれに限定するものではない。
いずれにせよ、関連ファイルから抽出したそれぞれの文字列はインデックスファイルとしてRAM1602に保持される。
また、関連ファイルから全ての文字列を抽出すると、もうこの関連ファイルは不要であるので、削除するようにしても良い。
図4に戻って、次に、ステップS44で作成したインデックスファイルを、ステップS42でRAM1602に受信した暗号化された文書ファイルに関連付けてデータベース150に登録する(ステップS45)。
次に、文書名やコメント、ユーザインデックスなどの情報がクライアント端末装置170側で入力されていた場合には、これらはステップS42でRAM1602に受信しているので、これをステップS45で登録したセットに関連付けてデータベース150に登録する(ステップS46)。
次に、クライアント端末装置170から送信された「文書ファイルの作成者」や「文書ファイルの作成日時」等、クライアント端末装置170が作成した情報を、ステップS45で登録したセットに関連付けてデータベース150に登録する(ステップS46)。
図13は、上記処理により、「契約書」なるフォルダ(図5のGUIでクライアント端末装置170の操作者が文書ファイルを登録する先として指示したフォルダ)に「129484号.doc」なるファイル名を有する文書ファイルを登録した場合のデータベースビューアの表示例を示す図である。サーバ装置100は、データベース150の状態が変更されるとその旨をクライアント端末装置170に通知するので、クライアント端末装置170はデータベースビューアの表示内容をこの通知内容に従って更新する。よって、領域502内には上記処理で「契約書」なるフォルダに追加された「129484号.doc」なるファイル名を有する文書ファイルのアイコンが表示されている。このアイコンには、ステップS43で作成したサムネイルを用いている。
以上の処理によって、文書ファイルを、全文検索可能なようにデータベース150に登録することができる。
<検索処理について>
次に、データベース150に登録された文書ファイルのうち、所望の文書ファイルを、その内容に記載の文字列をキーとして検索する場合について説明する。
例として、クライアント端末装置170の操作者が、「129484号.doc」なるファイル名を有する文書ファイルの契約書の内容は把握しているのものの、どこに保存されているのかが分からない場合に、クライアント端末装置170を用いてこの文書ファイルを検索するとする。
契約書の内容は上述の通り暗号化されており、不可読である。よって、文書ファイルの内容に記載の文字列をキーとして文書ファイルに対して検索しても、検索はできない。そこで従来では図15に示すようなGUIを用い、上記ユーザインデックスをキーとして文書ファイルの検索を行っていた。図15は、ユーザインデックスをキーにして文書ファイルを検索するために使用するGUIの表示例を示す図で、同図では、ユーザインデックス「ネットワーク」に対する値として「保守サービス」を、またユーザインデックス「契約種別」に対する値として「年間」を入力、もしくは選択することで、属性検索を行う様子を表している。
一方、本実施形態では、文書ファイルの内容さえ覚えていれば、その内容に含まれている文字列をキーにして文書ファイルを検索することができる。そのために先ず、クライアント端末装置170の操作者が検索を行う旨の指示を操作部1653を用いて入力すると、CPU1651はこれを検知して図14に示すGUIを表示部1655の表示画面上に表示する。図14は、文書ファイルの内容に含まれている文字列をキーにして文書ファイルを検索するために使用するGUIの表示例を示す図である。
同図では、キー(キーワード)として「XYシステムズ」なる文字列が入力されている。文字列の入力は操作部1653を用いて行う。そして「実行」ボタン1401を操作部1653を用いて指示すると、CPU1651はこれを検知して、データベース150に登録されている文書ファイルと共に登録されているインデックスのうち、キーとして入力された文字列に一致するものを特定し、キーとして入力された文字列に一致するインデックスと関連付けてデータベース150に登録されている文書ファイルを特定する。
本実施形態の場合、契約書の文書ファイルを検索するためには、パンフレットに記載の文字列であればどれを入力しても良い。また、クライアント端末装置170の操作者の記憶がはっきりしない場合でも、契約書や契約会社に関して思いつく適当な単語をOR検索により指定すれば、契約書の文書ファイルを検索することができる。例えば会社名が曖昧でも、「RAID」や「ルータ」「バックアップサーバ」などを指定することで、契約書の文書ファイルを検索することができる。
なお、文書ファイルを特定した後の処理については特に限定しないが、例えば、特定した文書ファイルのファイル名を表示部1655の表示画面上に表示するようにしても良い。
以上の説明により、本実施形態によって、文書ファイルがセキュリティのために暗号化されている場合であっても、それと関連し且つ秘匿性の少ないファイルに記載の文字列をこの文書ファイルに関連付けて登録すれば、暗号化された文章の内容に関連する文字列をキーとしてこの文書ファイルを検索することができるし、手作業でユーザインデックスを付加する必要はなくなる。またこのため、文書ファイルの登録に係るユーザ負荷を格段に減少させることができる。
なお、本実施形態では説明を簡単にするために、クライアント端末装置は1台としたが、複数台であっても良く、その場合には、それぞれのクライアント端末装置はクライアント端末装置170と同じ処理を行うし、サーバ装置100はそれぞれのクライアント端末装置170に対して同じ処理を行えばよい。
また、本実施形態ではサーバ装置100とクライアント端末装置170とはインターネットを介して接続されているが、ネットワークの種類、形態についてはこれに限定するものではなく、有線のLANや無線のLANにより互いの装置間でデータ通信を行うようにしても良い。
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
本発明の実施形態に係るシステムの基本構成を示す図である。 本発明の実施形態に係るシステムの機能構成を示すブロック図である。 サーバ装置100に登録する文書ファイルを選択し、サーバ装置100に送信する為にクライアント端末装置170が行う処理のフローチャートである。 クライアント端末装置170から送信された文書ファイルをデータベース150に登録するためにサーバ装置100が行う処理のフローチャートである。 データベースビューアの表示例を示す図である。 文書登録GUIの表示例を示す図である。 図6に示したGUIを用いて文書ファイル、関連ファイル、及びその他の情報を入力した場合の文書登録GUIの表示例を示す図である。 「129484号.doc」なるファイル名を有する文書ファイルの内容を示す図である。 暗号化された文書ファイルの内容を示す図である。 「パンフ_XY.doc」なるファイル名を有する関連ファイルの内容を示す図である。 関連ファイルのサムネイルを示す図である。 ステップS44で抽出されたそれぞれの文字列を管理しているテーブルの構成例を示す図である。 「契約書」なるフォルダ(図5のGUIでクライアント端末装置170の操作者が文書ファイルを登録する先として指示したフォルダ)に「129484号.doc」なるファイル名を有する文書ファイルを登録した場合のデータベースビューアの表示例を示す図である。 文書ファイルの内容に含まれている文字列をキーにして文書ファイルを検索するために使用するGUIの表示例を示す図である。 ユーザインデックスをキーにして文書ファイルを検索するために使用するGUIの表示例を示す図である。 サーバ装置100、クライアント端末装置170のそれぞれの基本的なハードウェア構成を示すブロック図である。

Claims (8)

  1. ファイルを管理するサーバ装置であって、
    暗号化された第1のファイルを受信する第1の受信手段と、
    前記第1のファイルに関連する第2のファイルを受信する第2の受信手段と、
    前記第2のファイルから文字列を抽出する抽出手段と、
    前記第1のファイルを前記抽出手段が抽出した文字列とセットにしてデータベースに登録する登録手段と
    を備えることを特徴とするサーバ装置。
  2. 前記第2のファイルは前記第1のファイルに比べて秘匿性の低いものであることを特徴とする請求項1に記載のサーバ装置。
  3. 請求項1に記載のサーバ装置が前記データベースに登録したファイルのうち、所望のファイルを検索する為にキーとして用いる文字列を取得する取得手段と、
    前記データベースに登録されているセット群のうち、前記取得手段が取得した文字列を含むセットを特定する特定手段と、
    前記特定手段が特定したセット中のファイルに係る情報を報知する報知手段と
    を備えることを特徴とする端末装置。
  4. 端末装置と、当該端末装置から送信されたファイルを管理するサーバ装置と、を備えるシステムであって、
    前記端末装置は、
    前記サーバ装置に登録する第1のファイルを選択する第1の選択手段と、
    前記第1のファイルを暗号化する暗号化手段と、
    前記第1のファイルに関連する第2のファイルを選択する第2の選択手段と、
    前記暗号化手段によって暗号化された第1のファイルと、前記第2のファイルとをセットにして前記サーバ装置に送信する送信手段と
    を備え、
    前記サーバ装置は、
    前記端末装置から送信された前記第1のファイルを受信する第1の受信手段と、
    前記端末装置から送信された前記第2のファイルを受信する第2の受信手段と、
    前記第2のファイルから文字列を抽出する抽出手段と、
    前記第1のファイルを前記抽出手段が抽出した文字列とセットにしてデータベースに登録する登録手段と
    を備えることを特徴とするシステム。
  5. ファイルを管理するサーバ装置の制御方法であって、
    暗号化された第1のファイルを受信する第1の受信工程と、
    前記第1のファイルに関連する第2のファイルを受信する第2の受信工程と、
    前記第2のファイルから文字列を抽出する抽出工程と、
    前記第1のファイルを前記抽出工程で抽出した文字列とセットにしてデータベースに登録する登録工程と
    を備えることを特徴とするサーバ装置の制御方法。
  6. 請求項5に記載のサーバ装置が前記データベースに登録したファイルのうち、所望のファイルを検索する為にキーとして用いる文字列を取得する取得工程と、
    前記データベースに登録されているセット群のうち、前記取得工程で取得した文字列を含むセットを特定する特定工程と
    前記特定工程で特定したセット中のファイルに係る情報を報知する報知工程と
    を備えることを特徴とする端末装置の制御方法。
  7. コンピュータに請求項5又は6に記載の制御方法を実行させることを特徴とするプログラム。
  8. 請求項7に記載のプログラムを格納することを特徴とする、コンピュータ読み取り可能な記憶媒体。
JP2005148562A 2005-05-20 2005-05-20 文書管理システム Expired - Fee Related JP4347264B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005148562A JP4347264B2 (ja) 2005-05-20 2005-05-20 文書管理システム
US11/433,473 US7818813B2 (en) 2005-05-20 2006-05-15 Server apparatus and control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005148562A JP4347264B2 (ja) 2005-05-20 2005-05-20 文書管理システム

Publications (2)

Publication Number Publication Date
JP2006323782A true JP2006323782A (ja) 2006-11-30
JP4347264B2 JP4347264B2 (ja) 2009-10-21

Family

ID=37449742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005148562A Expired - Fee Related JP4347264B2 (ja) 2005-05-20 2005-05-20 文書管理システム

Country Status (2)

Country Link
US (1) US7818813B2 (ja)
JP (1) JP4347264B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010044763A (ja) * 2008-08-08 2010-02-25 Estsoft Corp リアルタイム索引情報抽出機能を有するファイルアップロード方法及びこれを用いたウェブストレージシステム
JP2010061103A (ja) * 2008-05-30 2010-03-18 Nec (China) Co Ltd 高速検索可能な暗号化のための方法、装置およびシステム
JP2010160659A (ja) * 2009-01-07 2010-07-22 Kodo Joho Gijutsu Kenkyusho:Kk データ検索のためのシステム、方法、端末装置、検索サーバ装置、ファイルサーバ装置、およびプログラム
JP2011022922A (ja) * 2009-07-17 2011-02-03 Nec Corp 文書管理システム、文書管理方法、及びプログラム
JP2018005809A (ja) * 2016-07-08 2018-01-11 富士ゼロックス株式会社 コンテンツ管理システム、サーバ装置、クライアント装置及びプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4838610B2 (ja) * 2006-03-24 2011-12-14 キヤノン株式会社 文書管理装置、文書管理方法、プログラム
JP2008129821A (ja) * 2006-11-20 2008-06-05 Canon Inc 検索システム及び前記システムにおける検索結果の表示方法
JP4904235B2 (ja) * 2007-09-20 2012-03-28 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
JP5185402B2 (ja) * 2011-01-11 2013-04-17 株式会社東芝 文書検索装置、文書検索方法、及び文書検索プログラム
JP6737117B2 (ja) * 2016-10-07 2020-08-05 富士通株式会社 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2833580B2 (ja) * 1996-04-19 1998-12-09 日本電気株式会社 全文インデックス作成装置および全文データベース検索装置
JP3457184B2 (ja) * 1998-06-25 2003-10-14 シャープ株式会社 検索装置及びその制御プログラムを記憶した媒体
JP2002108910A (ja) * 2000-09-27 2002-04-12 Nec Soft Ltd 暗号化ファイルシステム及び暗号化ファイル検索方法並びにコンピュータ可読記録媒体
JP2002278970A (ja) 2001-03-16 2002-09-27 Ricoh Co Ltd 文書管理システム
JP4342753B2 (ja) * 2001-08-10 2009-10-14 株式会社リコー 文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体
JP4332356B2 (ja) * 2003-01-22 2009-09-16 キヤノン株式会社 情報検索装置及び方法並びに制御プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010061103A (ja) * 2008-05-30 2010-03-18 Nec (China) Co Ltd 高速検索可能な暗号化のための方法、装置およびシステム
JP2010044763A (ja) * 2008-08-08 2010-02-25 Estsoft Corp リアルタイム索引情報抽出機能を有するファイルアップロード方法及びこれを用いたウェブストレージシステム
JP2010160659A (ja) * 2009-01-07 2010-07-22 Kodo Joho Gijutsu Kenkyusho:Kk データ検索のためのシステム、方法、端末装置、検索サーバ装置、ファイルサーバ装置、およびプログラム
JP2011022922A (ja) * 2009-07-17 2011-02-03 Nec Corp 文書管理システム、文書管理方法、及びプログラム
JP2018005809A (ja) * 2016-07-08 2018-01-11 富士ゼロックス株式会社 コンテンツ管理システム、サーバ装置、クライアント装置及びプログラム

Also Published As

Publication number Publication date
JP4347264B2 (ja) 2009-10-21
US20060265762A1 (en) 2006-11-23
US7818813B2 (en) 2010-10-19

Similar Documents

Publication Publication Date Title
JP4347264B2 (ja) 文書管理システム
US9864736B2 (en) Information processing apparatus, control method, and recording medium
US8037107B2 (en) Document transfer assisting system, monitor apparatus, document transfer assisting apparatus, method and computer readable recording medium
US7849099B2 (en) Document management method and apparatus thereof
US9465856B2 (en) Cloud-based document suggestion service
US11182745B2 (en) Data processing apparatus, data processing system, data processing method, and non-transitory computer readable medium
US11625526B2 (en) Systems and methods for displaying digital forensic evidence
US20140101094A1 (en) Enhanced quick search features, low-barrier commenting/interactive features in a collaboration platform
US20090300001A1 (en) Server apparatus, catalog processing method, and computer-readable storage medium
JP2007115131A (ja) 情報処理装置及びその制御方法、情報処理システム、コンピュータプログラム、記憶媒体
JP2012159917A (ja) 文書管理システム、文書管理方法、及びプログラム
JP2006243981A (ja) 文書管理プログラム、文書管理方法及び文書管理装置
US8190563B2 (en) Document management apparatus, document management method, and computer-readable encoding medium recorded with a computer program
JP2005352980A (ja) 文書差分表示システム、文書差分表示サーバ、文書差分表示方法及びそのプログラム
Wollatz et al. Curation of image data for medical research
JP2017220104A (ja) クライアント装置、情報処理システム及びプログラム
JP2004110204A (ja) 情報処理装置、機能拡張プログラム、それをコンピュータ読み取り可能に記憶した記憶媒体、情報処理方法
US20140310323A1 (en) Storage device permitting file storage according to extension, method of controlling the same, program, and storage medium
JP2016173773A (ja) ワークフローシステム、ワークフローシステムの処理方法、およびプログラム
JP2006309593A (ja) 帳票処理装置、帳票処理方法、プログラム及び記録媒体
KR100645965B1 (ko) 호스트 장치 및 그의 데이터 관리방법
JP6572679B2 (ja) 情報処理装置およびプログラム
JP2007272777A (ja) 情報処理装置、情報処理方法
JP7001457B2 (ja) ファイル管理装置、ファイル管理システム、ファイル管理方法、及びプログラム
JP2016040643A (ja) 画像データ管理システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090715

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees