JP2011100358A - 文書管理装置、文書管理方法、及び、プログラム - Google Patents

文書管理装置、文書管理方法、及び、プログラム Download PDF

Info

Publication number
JP2011100358A
JP2011100358A JP2009255431A JP2009255431A JP2011100358A JP 2011100358 A JP2011100358 A JP 2011100358A JP 2009255431 A JP2009255431 A JP 2009255431A JP 2009255431 A JP2009255431 A JP 2009255431A JP 2011100358 A JP2011100358 A JP 2011100358A
Authority
JP
Japan
Prior art keywords
document
data
text
management apparatus
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009255431A
Other languages
English (en)
Inventor
Akihiro Saito
章浩 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neojapan Inc
Original Assignee
Neojapan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neojapan Inc filed Critical Neojapan Inc
Priority to JP2009255431A priority Critical patent/JP2011100358A/ja
Publication of JP2011100358A publication Critical patent/JP2011100358A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書の編集や流用を防ぎつつ、且つ、検索も容易にさせる。
【解決手段】文書管理装置20は、インターネットN1を介して文書データを受信すると、所定のテキスト抽出処理を行い、この文書データに含まれるテキストから構成されるテキストファイルを作成する。続いて、文書管理装置20は、この文書データを画像データに変換し、作成したテキストファイルと対応付けて、データベースに保存する。また、文書の検索が指示された場合、文書管理装置20は、検索条件に合致するテキストファイルを文書データベースに格納されているなかから検出し、検出したテキストファイルに対応付けられている画像データを、検索元に検索結果として送信する。
【選択図】図1

Description

本発明は、文書管理装置、文書管理方法、及び、プログラムに関する。
インターネットを介して、Webサーバにアップロードした文書を不特定多数のユーザに閲覧可能にしたシステムがある。なお、このようなシステムは、アップロードした文書の閲覧のみを不特定多数のユーザに許可し、文書の編集、流用までは許可していないのが一般的である。
このようなシステムにおいて、アップロードされた文書がテキストファイルやHTMLファイル等である場合がある。このような場合、文書の登録者が当該文書の閲覧のみをさせたい場合であっても、ユーザが、エディタなどを用いて、文書の編集や流用等を容易に実施できてしまうという問題がある。
特許文献1には、アップロードした文書を画像に変換して保存しておくことで、文書の編集や流用をされにくくする技術について記載されている。
特開2004−213128号公報
特許文献1では、アップロードされた文書は保存されず、当該文書をイメージに変換した画像がWebサーバに蓄積される。そのため、ユーザは、アップロードされた文書をテキスト検索することができず、使い勝手の面で問題がある。
本発明は上記実情に鑑みてなされたものであり、文書の編集や流用を防ぎ、且つ、使い勝手もよい文書管理装置、文書管理方法、及び、プログラムを提供することを目的とする。
上記目的を達成するため、本発明の第1の観点に係る文書管理装置は、
文書データを受け付ける文書受付手段と、
前記文書受付手段が受け付けた文書データに含まれるテキストデータを抽出するテキスト抽出手段と、
前記文書受付手段が受け付けた文書データを画像データに変換する画像変換手段と、
前記テキスト抽出手段が抽出したテキストデータと、前記画像変換手段が変換した画像データとを対応付けて記憶する文書記憶手段と、
を備えることを特徴とする。
文書を検索するための検索条件を受け付ける検索条件受付手段と、
前記検索条件に合致するテキストデータを前記文書記憶手段に記憶されているなかから特定し、特定したテキストデータに対応付けられている画像データを検索結果として出力する検索手段と、
を備えてもよい。
文書データに付加されたメッセージを定義する情報と、当該文書データの識別情報とが対応付けて記憶されるメッセージ記憶手段を備えてもよい。
上記目的を達成するため、本発明の第2の観点に係る文書管理方法は、
文書データを受け付け、
受け付けた文書データに含まれるテキストデータを抽出し、
受け付けたを文書データを画像データに変換し、
抽出したテキストデータと、変換した画像データとを対応付けて記憶する、
ことを特徴とする。
上記目的を達成するため、本発明の第3の観点に係るプログラムは、
コンピュータを、
文書データを受け付ける文書受付手段、
前記文書受付手段が受け付けた文書データに含まれるテキストデータを抽出するテキスト抽出手段、
前記文書受付手段が受け付けた文書データを画像データに変換する画像変換手段、
前記テキスト抽出手段が抽出したテキストデータと、前記画像変換手段が変換した画像データとを対応付けて記憶する文書記憶手段、
として機能させることを特徴とする。
本発明によれば、文書管理装置は、クライアントからアップロードされた文書データからテキストデータを抽出し、文書データを画像に変換した画像データと対応付けて記憶する。従って、文書の編集や流用を防ぎ、且つ、検索の使い勝手も向上させることができる。
本発明の実施形態に係る文書管理装置とクライアントとの接続構成を示す図である。 クライアントの構成を示すブロック図である。 文書管理装置の構成を示すブロック図である。 文書DBに格納される情報の構成例を示す図である。 メッセージDBに格納されるメッセージ情報の構成例を示す図である。 文書のアップロード用の画面の例を示す図である。 文書登録処理の動作を説明するためのフローチャートである。 文書検索処理の動作を説明するためのフローチャートである。 メッセージが付与された文書の例を示す図である。 メッセージ登録処理の動作を説明するためのフローチャートである。
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。なお、本発明は下記の実施形態及び図面によって限定されるものではない。本発明の要旨を変更しない範囲で下記の実施形態及び図面に変更を加えることが出来るのはもちろんである。また、図中同一または相当部分には同一符号を付す。
本発明の実施形態に係る文書管理装置20について説明する。
文書管理装置20は図1に示すように、インターネットN1を介して、複数のクライアント10と接続される。
クライアント10は、ユーザによって操作されるPCなどの端末装置である。クライアント10にはブラウザが搭載されており、インターネット接続機能を有する。クライアント10は、インターネットN1を介して、文書管理装置20に、公開したい文書データを登録(アップロード)する。また、クライアント10は、インターネットN1を介して、文書管理装置20に、文書の検索を指示する。
クライアント10は、図2に示すように、通信部11、記憶部12、操作部13、表示部14、制御部15、及び上記各部を相互に接続するシステムバス16を備える。
通信部11は、ネットワークカードなどから構成され、インターネットN1を介して、文書管理装置20と各種の情報を送受信する。
記憶部12は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置等の記憶装置によって構成され、各種固定データや各種プログラム、ブラウザ等を記憶する。また、記憶部12は、制御部15の作業領域となる。
また、記憶部12は、文書管理装置20に登録するための文書の原本となるデータ(オリジナル文書データ)を記憶する。オリジナル文書データは、エクセル、ワード、パワーポイント等の複数の異なる形式のファイルであってよい。
また、記憶部12は、文書に付加できるメッセージのテンプレートとなるデータを記憶する。具体的には、記憶部12は、メッセージとして付加できるスタンプ、付箋、及び、吹き出しなどを定義するテンプレートデータを記憶する。
操作部13はキーボードやマウスなどから構成され、ユーザからの操作に対応した操作信号(文書登録要求、文書検索要求、メッセージ検索要求等)を制御部15に供給する。
表示部14は、表示パネル及びドライバ回路等から構成され、文書データや各種の画面を表示する。
制御部15は、マイクロプロセッサユニット等から構成され、記憶部12に記憶されているプログラムを実行することで、クライアント10全体の動作(各部の動作)を制御する。
図1に戻り、文書管理装置20は、クライアント10からインターネットN1を介してアップロードされた文書や、文書に付与されたメッセージを管理、記憶するサーバである。
文書管理装置20は図3に示すように、通信部21と、記憶部22と、制御部23、及び上記各部を相互に接続するシステムバス24とを含んで構成される。
通信部21は、ネットワークカード等を備え、インターネットN1を介して、各クライアント10とデータの送受信を行う。
記憶部22は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置等の記憶装置によって構成され、各種の固定データ、文書管理用のサイトの画面データ、及び、各種のプログラムを記憶する。また、記憶部22は、制御部23の作業領域となる。また、記憶部22は、文書DB(データベース)221と、メッセージDB222を備える。
文書DB221は、クライアント10からアップロードされた文書を格納する。具体的には、文書DB221には、図4に示すように、クライアント10からアップロードされた文書データ(オリジナル文書データ)をイメージ変換した画像データと、該文書データから抽出したテキストファイルとが対応付けられて記憶される。即ち、クライアント10からアップロードされたオリジナル文書データ自体は、文書DB221に記憶されない。なお、各文書にはID(文書ID)が付されている。
メッセージDB222は、文書DB221に登録されている文書の画像データに付加されているメッセージに関する情報(メッセージ情報)を格納する。メッセージ情報の例を、図5に示す。メッセージ情報は、メッセージが付加された文書の文書IDと、当該メッセージの内容と、当該メッセージが付加された文書内での位置と、当該メッセージの属性情報(種類、文字サイズ、色、…)等を含む。また、各メッセージ情報には、ID(メッセージID)が付されている。
図3に戻り、制御部23は、マイクロプロセッサユニット等から構成され、記憶部22に記憶されているプログラムを実行することで、文書管理装置20全体の動作(各部の動作)を制御する。
また、制御部23は、クライアント10からアップロードされた文書を文書DB221に登録する文書登録処理を実行する。また、制御部23は、クライアント10からの検索要求に基づいた文書を検出して、クライアント10に出力する文書検索処理を実行する。また、制御部23は、クライアント10によって文書に付加されたメッセージをメッセージDB222に登録するメッセージ登録処理を実行する。なお、文書登録処理、文書検索処理、および、メッセージ登録処理の詳細については後述する。
続いて、文書管理装置20で実施される処理の動作について説明する。
(文書登録処理)
始めに、文書登録処理について説明する。
まず、クライアント10のユーザは、操作部13を操作して、ブラウザを起動し、文書管理装置20が提供するサイトにログインする。そして、ユーザは、操作部13を操作して、当該サイトにおける文書のアップロード用の画面から、アップロードしたい文書を指定し、当該文書のアップロードを指示する。クライアント10の制御部15は、この指示操作に応答して、指定された文書の登録要求を文書管理装置20に送信する。
図6に、文書管理装置20が提供する文書のアップロード用の画面の例を示す。ユーザは、アップロードしたい任意のファイル形式の文書をエリアE1にドラッグ&ドロップし、エリアE2に表示させる。続いてユーザは、アップロードボタンB1をクリックすることで、エリアE2に表示された文書のアップロードを指示し、文書登録要求が文書管理装置20に送信される。
クライアント10から文書登録要求を受信すると、文書管理装置20は、図7に示す文書登録処理を実行する。
まず、文書管理装置20の制御部23は、クライアント10から受信した文書登録要求に含まれる文書データに対して、所定のテキスト抽出処理を行い、当該文書データに含まれるテキストから構成されるテキストファイルを作成する(ステップS101)。
例えば、制御部23は、文書をPDFファイルに変換し、当該PDFファイルからテキストを抽出する等して、ステップS101の処理を行ってもよい。
続いて、制御部23は、クライアント10から受信した文書に画像変換処理を施し、所定の画像形式(例えば、JPEG)に変換する(ステップS102)。
例えば、制御部23は、文書をPDFファイルに変換し、当該PDFファイルをJPEG形式の画像に変換することで、ステップS102の処理を行ってもよい。
続いて、制御部23は、ステップS101で作成したテキストデータと、ステップS102で変換された画像データとを対応付けて文書DB221に登録する。なお、登録されたエントリには、新規に発行した文書IDを付与する(ステップS103)。以上で、文書登録処理は終了する。
このように、本実施形態に係る文書管理装置20では、クライントからアップロードされたオリジナルの文書自体は登録されず、その文書から抽出されたテキストファイルと、文書を画像変換した画像とが対応付けられて登録される。
(文書検索処理)
続いて、文書検索処理について説明する。
まず、クライアント10のユーザは、操作部13を操作して、ブラウザを起動し、文書管理装置20が提供するサイトにログインする。そして、ユーザは、操作部13を操作して、当該サイトにおける文書検索用の画面から、検索したい文字列(検索文字列)を入力し、検索を指示する。クライアント10の制御部15は、この指示操作に応答して、検索文字列を含む文書検索要求を、文書管理装置20に送信する。
例えば、前述した図6に示す画面では、ユーザは、エリアE3に検索文字列を入力し、検索ボタンB2をクリックすることで検索を指示し、その検索要求が文書管理装置20に送信される。
クライアント10から文書検索要求を受信すると、文書管理装置20は、図8に示す文書検索処理を実行する。
まず、文書管理装置20の制御部23は、クライアント10から受信した検索要求に含まれる検索文字列を含むテキストファイルを、文書DB222から検出する(ステップS201)。
続いて、制御部23は、検出したテキストファイルに関連付けられている文書IDをキーに、メッセージDB222からメッセージ情報を取得する(ステップS202)。
続いて、制御部23は、ステップS201で検出したテキストファイルに対応付けられている画像データに、ステップS202で取得したメッセージ情報に基づいてメッセージを合成した画像を作成する(ステップS203)。
そして、制御部23は、作成したメッセージ付の画像を、検索要求の送信元であるクライアント10に送信する(ステップS204)。そして、クライアント10の制御部15は、文書管理装置20から受信したメッセージ付の画像を表示部14に表示する。以上で、文書検索処理は終了する。
このように、本実施形態に係る文書管理装置20では、文書を検索する際に、文字列で検索することができるため、使い勝手のよい検索ができる。また、このように検索された文書の画像が検索結果として出力されるため、当該文書を加工するのは困難であり、文書の編集や流用をある程度防ぐこともできる。
なお、上述した文書検索処理では、文書の検索結果として、メッセージ付の画像を作成して表示させたが、メッセージを付与しない画像のみを検索結果としてクライアント10に送信して、表示させてもよい。
(メッセージ登録処理)
続いて、メッセージ登録処理について説明する。
まず、クライアント10のユーザは、操作部13を操作して、前述した文書検索処理等を行うことにより所望の文書の画像を表示させる。そして、ユーザは、操作部13を操作して、表示させた画像の任意の位置にメッセージを付与する。そして、ユーザは、付与したメッセージを文書管理サーバに登録することを指示する。クライアント10の制御部15は、この指示操作に応答して、メッセージ登録要求を文書管理装置20に送信する。なお、このメッセージ登録要求には、メッセージが付与された文書の文書IDと、当該メッセージを定義する各種の情報(メッセージの位置、内容、種類、文字サイズ、文字色など)が含まれている。
ユーザによってメッセージが付与された文書の例を図9に示す。この例では、表示された文書の画像データ(議事録.JPG)に、ユーザが、スタンプ形式のメッセージM1、付箋形式のメッセージM2、及び、吹き出し形式のメッセージM3を付与したことを示している。ユーザは、メッセージ登録ボタンB3をクリックすることで、付加したメッセージを登録することを指示し、そのメッセージ登録要求が文書管理装置20に送信される。
クライアント10からメッセージ登録要求を受信すると、文書管理装置20は、図10に示すメッセージ登録処理を実行する。即ち、制御部23は、クライアント10から受信したメッセージ登録要求に含まれる文書IDと、メッセージを定義する各種の情報とを対応付けて、メッセージDB222に登録する(ステップS301)。なお、登録されたメッセージ情報には、新規に発行したメッセージIDを付与する。以上で、メッセージ登録処理は終了する。
このように、本実施形態に係る文書管理装置20では、文書DB221に記憶されている文書の画像データ自体は改変されず、メッセージのみが、別のデータベース(メッセージDB222)で管理される。
なお、上記実施形態は、種々の変形、および、応用が可能である。
例えば、本発明の文書管理装置20は、専用のハードウェアに限られるものではなく、通常のコンピュータシステムによっても実現することができる。
具体的には、上記各実施の形態では、文書管理装置20のプログラムが、記憶部22等に予め記憶されているものとして説明した。しかし、上述の処理動作を実行させるためのプログラムを、フレキシブルディスク、CD−ROM(Compact Disk Read-Only Memory)、DVD(Digital Versatile Disk)、MO(Magneto-Optical disk)等のコンピュータ読み取り可能な記録媒体に格納して配布し、そのプログラムをコンピュータにインストールすることにより、上述の処理を実行する文書管理装置20を構成してもよい。
また、プログラムをインターネットN1等の通信ネットワーク上のサーバ装置が有するディスク装置等に格納しておき、例えば、搬送波に重畳させて、コンピュータにダウンロード等するようにしてもよい。さらに、通信ネットワークを介してプログラムを転送しながら起動実行することによっても、上述の文書管理装置20の処理を達成することができる。
また、上述の機能を、OS(Operating System)が分担又はOSとアプリケーションの協働により実現する場合等には、OS以外の部分のみを媒体に格納して配布してもよく、また、コンピュータにダウンロード等してもよい。
10 クライアント
20 文書管理装置
N1 インターネット

Claims (5)

  1. 文書データを受け付ける文書受付手段と、
    前記文書受付手段が受け付けた文書データに含まれるテキストデータを抽出するテキスト抽出手段と、
    前記文書受付手段が受け付けた文書データを画像データに変換する画像変換手段と、
    前記テキスト抽出手段が抽出したテキストデータと、前記画像変換手段が変換した画像データとを対応付けて記憶する文書記憶手段と、
    を備えることを特徴とする文書管理装置。
  2. 文書を検索するための検索条件を受け付ける検索条件受付手段と、
    前記検索条件に合致するテキストデータを前記文書記憶手段に記憶されているなかから特定し、特定したテキストデータに対応付けられている画像データを検索結果として出力する検索手段と、
    を備えることを特徴とする請求項1に記載の文書管理装置。
  3. 文書データに付加されたメッセージを定義する情報と、当該文書データの識別情報とが対応付けて記憶されるメッセージ記憶手段を備える、
    ことを特徴とする請求項1又は2に記載の文書管理装置。
  4. 文書データを受け付け、
    受け付けた文書データに含まれるテキストデータを抽出し、
    受け付けたを文書データを画像データに変換し、
    抽出したテキストデータと、変換した画像データとを対応付けて記憶する、
    ことを特徴とする文書管理方法。
  5. コンピュータを、
    文書データを受け付ける文書受付手段、
    前記文書受付手段が受け付けた文書データに含まれるテキストデータを抽出するテキスト抽出手段、
    前記文書受付手段が受け付けた文書データを画像データに変換する画像変換手段、
    前記テキスト抽出手段が抽出したテキストデータと、前記画像変換手段が変換した画像データとを対応付けて記憶する文書記憶手段、
    として機能させることを特徴とするプログラム。
JP2009255431A 2009-11-06 2009-11-06 文書管理装置、文書管理方法、及び、プログラム Pending JP2011100358A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009255431A JP2011100358A (ja) 2009-11-06 2009-11-06 文書管理装置、文書管理方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009255431A JP2011100358A (ja) 2009-11-06 2009-11-06 文書管理装置、文書管理方法、及び、プログラム

Publications (1)

Publication Number Publication Date
JP2011100358A true JP2011100358A (ja) 2011-05-19

Family

ID=44191472

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009255431A Pending JP2011100358A (ja) 2009-11-06 2009-11-06 文書管理装置、文書管理方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP2011100358A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014065148A1 (ja) 2012-10-26 2014-05-01 株式会社イーズ 有機肥料及び飼料製造システム
CN112541333A (zh) * 2020-12-18 2021-03-23 中国农业银行股份有限公司 一种文件编辑方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014065148A1 (ja) 2012-10-26 2014-05-01 株式会社イーズ 有機肥料及び飼料製造システム
CN112541333A (zh) * 2020-12-18 2021-03-23 中国农业银行股份有限公司 一种文件编辑方法及装置

Similar Documents

Publication Publication Date Title
JP6859620B2 (ja) 情報処理システム、情報処理装置、情報処理方法、及び情報処理プログラム
JP4935658B2 (ja) ブラウザプログラムおよび情報処理装置
JP5262121B2 (ja) 情報処理装置、シンボル表示方法、シンボル表示プログラム
US8253806B2 (en) Image sharing system, image managing server, and control method and program thereof
US10180814B2 (en) User terminal, image processing device and cloud server to identify plural user information to execute an image processing job upon validating an user information
RU2646350C2 (ru) Способ ввода данных в электронное устройство, способ обработки голосового запроса, машиночитаемый носитель (варианты), электронное устройство, сервер и система
CN102200976A (zh) 桌面应用转换成网络应用的定制系统和方法
US10067918B2 (en) Encoding text units
CN112860642A (zh) 一种庭审数据处理方法、服务器及终端
JP6756270B2 (ja) 情報処理システム、情報処理装置、情報処理方法、及びプログラム
JP2006252001A (ja) ドキュメント処理装置
CN101127068A (zh) 信息处理系统、信息处理器、信息处理方法和记录介质
US20130332477A1 (en) Record creating support apparatus and method
US9591092B2 (en) Relaying device, image processing device, and system comprising image processing device, relaying device and service server
JP2011100358A (ja) 文書管理装置、文書管理方法、及び、プログラム
US20130124959A1 (en) Application generation apparatus, application generation method, and computer-readable recording medium
JP7390071B2 (ja) 書類処理装置、書類処理方法、およびプログラム
JP2020106926A (ja) 情報処理装置、情報処理システムおよび情報処理方法
US20150112465A1 (en) Method and Apparatus for On-Demand Conversion and Delivery of Selected Electronic Content to a Designated Mobile Device for Audio Consumption
JP2007264763A (ja) データ管理装置、データ管理方法及びデータ管理システム
JP2008287607A (ja) 情報処理装置およびプログラム
JP6536308B2 (ja) 情報処理システム、情報処理装置、情報処理方法、及びプログラム
JP2004164317A (ja) 言語翻訳管理システム
KR100653613B1 (ko) 온라인 플래시 편집시스템에서의 2 바이트 문자처리 장치 및 방법, 그리고 이를 채용한 온라인 플래시 편집시스템
JP2019164555A (ja) 画像検索システム、画像検索装置および画像検索方法