JP5243054B2 - データ管理システムおよび方法並びにプログラム - Google Patents

データ管理システムおよび方法並びにプログラム Download PDF

Info

Publication number
JP5243054B2
JP5243054B2 JP2008021774A JP2008021774A JP5243054B2 JP 5243054 B2 JP5243054 B2 JP 5243054B2 JP 2008021774 A JP2008021774 A JP 2008021774A JP 2008021774 A JP2008021774 A JP 2008021774A JP 5243054 B2 JP5243054 B2 JP 5243054B2
Authority
JP
Japan
Prior art keywords
document
data
folder
registered
data management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008021774A
Other languages
English (en)
Other versions
JP2009181479A (ja
Inventor
真史 土田
吉田  隆
秀規 真後
孝志 勝毛
Original Assignee
株式会社日本デジタル研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日本デジタル研究所 filed Critical 株式会社日本デジタル研究所
Priority to JP2008021774A priority Critical patent/JP5243054B2/ja
Publication of JP2009181479A publication Critical patent/JP2009181479A/ja
Application granted granted Critical
Publication of JP5243054B2 publication Critical patent/JP5243054B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、文書データを保存するデータ管理システムに関し、特に、データ内容に基づいて登録場所の妥当性を判断したり適切な登録場所を提案したりするデータ管理システムおよび方法並びにプログラムに関する。
今日、会計事務所の多くは財務処理専門のコンピュータシステムを導入して業務を行っており、このようなシステムの仕様に基づいて顧客毎に膨大な数のデータを管理している。例えば、ある財務システムでは、記憶領域に図3に示すような顧客毎のフォルダ(ディレクトリ)階層が構築される。図3に示すように、顧客名に対応するフォルダの下に財務システムの業務ユニット名である会計・税務・一般の3つの下層フォルダが作成され、これらのフォルダ内に当該顧客の業務毎に関連して作成された個々のデータファイルが登録される。なお、このシステムでは新規顧客を登録すると自動的に会計・税務・一般の3つのフォルダが作成されるが、会計事務所が顧客からどの業務を請け負うかは顧客との取り決めにより、請け負わない業務に関するフォルダは使用されない。これが図3において斜線で示されるフォルダである。
電子ファイリングに関する従来技術として、画像をスキャナで読み込み、OCR処理を行って得たテキストデータを検索タイトルとしてイメージデータと対応づけて記憶するシステムが提案されている(例えば、特許文献1、2)。また、本願出願人は、ファイル内に含まれる顧客情報と、コピー先または移動先フォルダの管理情報に含まれる顧客情報とを照合することにより、ファイルをコピーまたは移動すべきフォルダと異なるフォルダを選択するという人為的な操作ミスを防ぐための技術を提案している(例えば、特許文献3)。
特開平10−162016号公報 特開平8−137971号公報 特開2007−200283号公報
しかしながら、上記特許文献1、2の技術では、ファイルの保存場所はオペレータが指定するため、本来登録すべき保存場所と異なる場所が間違って指定され、オペレータが気付かずに登録してしまう可能性があった。また、例えば特許文献1の技術において画像ファイルに関連づけられる検索タイトルは、画像ファイルから抽出したテキストデータを最大許容量まで取り込んで残りを切り捨てたものに過ぎず、抽出情報の取捨選択が行われないためそのファイルがどのような業務と関連するかが必ずしも分からなかった。この場合もオペレータが手動で登録先を決定することとなるが、その分類ポリシーはオペレータの判断に委ねられるため、異なるオペレータによる判断基準の相違や熟練度による判断基準の変化などで、ファイルの関連づけの一貫性が保たれない可能性があった。
また、上記特許文献3のシステムは、顧客情報が整合しないファイルのコピーや移動を防止しうるものであるが、例えば図3に示すシステムのように顧客毎に複数のフォルダ階層が構築されるような場合には利用できない。
したがって、データの登録時に指定した場所が果たして正しい登録場所かを判定し、あるいはデータの登録時にデータ内容からシステム側が適切な登録場所を提示するようなデータ管理システム、方法、プログラムが求められていた。
本発明にかかるデータ管理システムは、上記課題を解決するためになされたものであり、文書データが登録される記憶領域と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域と、前記テーブルのキーワードについて前記文書データのテキスト情報を検索するテキスト検索部と、前記テキスト検索部から出力される検索情報を用いて前記文書データの登録場所またはその候補を決定する登録先判定部とを具え、前記登録先判定部は、テキスト検索部により前記文書データから抽出されたキーワードに基づき前記テーブルを参照し、対応する登録先を抽出することにより前記文書データの登録場所またはその候補を決定することを最も主要な特徴とする。
このデータ管理システムは、さらに、前記システムのオペレータから前記文書ファイルの登録場所の指定を受け付ける入力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所と、前記入力手段で指定された文書ファイルの登録場所とを照合して、前記指定された登録場所が妥当か否かを判定することが有効である。
さらに、前記コンピュータシステムのオペレータに前記文書データの登録場所の候補を提示する出力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所を前記オペレータに提示して、当該オペレータが選択した登録先に前記文書データを登録することが有効である。
また、前記テーブル格納領域に、前記記憶領域における登録場所の情報に関するテーブルが格納されているとともに、前記登録先判定部がさらに、前記登録場所の情報に関するテーブルを参照して前記文書データの登録場所またはその候補として決定した登録場所が利用可能か否かを確認することが有効である。
さらに、光学式読取(OCR)手段を具え、画像データにOCR処理を行ってテキスト情報を生成し、前記画像データの登録場所またはその候補を決定することが有効である。
実施例によっては、前記文書データが登録される記憶領域および前記テーブル格納領域が通信ネットワークに接続された文書サーバ内にあるとともに、前記テキスト検索部および登録先判定部が前記ネットワークに接続されたクライアント端末内にあってもよい。
本発明の文書管理システムは、予め文書データの登録場所に関するキーワードが登録された1以上のテーブルを参照して文書データのテキスト情報を検索し、抽出されるキーワードから当該文書データの登録場所またはその候補を自動的に決定するものであるため、間違った場所に文書データを登録してしまうといった事態が防止される。また、1以上のテーブルに登録されたキーワードに基づいて機械的に登録作業を決定するため、オペレータが恣意的に登録場所を決定する運用に比べ、文書内容に対する登録先の関係の一貫性を保つことができる。
また、システムのオペレータにより登録場所を指定されている場合、この指定先と決定した登録場所を照合して妥当性を判断するため、オペレータが間違った登録場所を指定していた場合でも、この間違った場所に文書データが登録されるのを未然に防ぐことができる。
また、登録先判定部が決定した登録場所の候補をシステムのオペレータに提示することにより、登録場所が指定されていない場合や間違った場所が指定されていた場合に、オペレータを正しい登録場所に導くことができる。データ保管場所の一貫性が保たれるとともに、オペレータが自分で判断してデータの登録場所を指定する労力を軽減することができる。さらに、自動的にデータを登録すべき場所を提示してくれるため、特に社内LANなど比較的複雑化したシステムにおいてシステムや操作に知識のない者でも容易に正しい場所にデータを登録することができる。
また、システムが登録場所の情報に関するテーブルを具え、決定した登録場所が利用可能かを確認することにより、例えば財務処理専門のコンピュータシステムにおいて顧客と取り決めのない、すなわち利用すべきでない業務フォルダにデータが登録されるのを防止することができる。
また、OCR処理を行いテキストデータを取得して検索をかけることにより、画像形式で取り込まれるデータに対しても自動的に登録先を決定することができる。
また、通信ネットワークを介してクライアント端末から文書登録サーバに文書データを登録するように構成することにより、例えば社内LANなどで接続された複数の端末で扱う多数の文書データを一元的かつ一貫性を持たせて管理することができる。
本発明を実施するための最良の形態について、図面を参照しながら以下に詳細に説明する。図1は、本発明の一実施例にかかるデータ管理システムの構成例を示す図である。前提として、本実施例のコンピュータシステムは例えば会計事務所で利用されるものであり、財務処理プログラム(図示せず)が実装されているものとする。本実施例にかかるシステム、方法およびプログラムは、このような財務処理プログラムの運用中に作成または取り込まれる文書データについてオペレータから指定される登録先の妥当性を検証し、あるいは適切な登録先を提示して、データ保管場所の一貫性を保たんとするものである。
本実施例のシステムは所謂スタンドアロン型であり、一般的なコンピュータシステムに本発明にかかるデータ管理プログラムをインストールして構成することができる。図1に示すように、このシステムは、制御部10と、記憶部20と、表示部30と、入力部40と、通信部50とを具えている。制御部10は中央処理装置を含み、本発明にかかるデータ管理プログラムを実行して各種処理を行う。記憶部20は、文書データが登録されるHDDといった大容量記録装置の他に、RAM、ROMなどの各種メモリも含む概念であり、さらに外付けハードディスクなどの外部記憶装置やDVD−RWなどの可搬型記憶媒体であってもよい。また、後述する実施例(図13および図14)のように、ネットワークを介して接続された他のコンピュータ端末内に存在してもよい。
表示部30は、CRTまたはLCD(液晶ディスプレイ)などで構成され、このコンピュータシステムのオペレータに文書ファイルや各種メッセージを表示する。入力部40は、例えばキーボード41やマウス42であり、オペレータが各種情報を入力するのに用いられる。また、入力部40は登録対象となる文書データを取り込むスキャナ(図示せず)を具えてもよい。通信部50は、ネットワーク(インターネットやWAN、LAN)に対しデータの送受信を行い、必要な通信プロトコルを実装している。ただし、スタンドアロン型の本実施例では通信部50は必ずしも必要ではない。
本発明にかかるファイル管理プログラムは、例えばシステムが具えるCD−ROMドライブ(図示せず)にセットされたCD−ROMから、記憶部20にインストールされる。そして、プログラムの実行時に記憶部20から読み出されて所定の場所に展開される。このようにして、制御部10は記憶部20に格納されたプログラムに従って、後述する処理を実行する。なお、ファイル管理プログラムはCD−ROMからではなく、他の磁気ディスク、磁気テープ、光ディスクなどの記録媒体からこのコンピュータシステムにインストールされてもよい。また、ネットワークを通じて電子メールやインターネットダウンロードなどの伝送媒体により提供されてもよい。
図2は、図1に示すコンピュータシステムの制御部10と記憶部20の構成をより詳細に示す図である。本図に示すように、制御部10は、選択および処理指示部11と、テキスト検索部12と、登録先判定部13とを具えている。これらの要素は本発明のデータ管理プログラムの個々のプログラムモジュールであり、中央処理装置や一時メモリなどのハードウェアとの協働により実現される。選択および処理指示部11は、入力部40からオペレータによる文書データの選択やデータ登録処理の指示を受けて実行する。テキスト検索部12は、所定のテーブルまたは辞書(記憶部20のテーブル格納領域22)に基づいて、保存される文書データのテキスト情報を検索し、キーワードを抽出する。登録先判定部13は、抽出されたキーワードに基づいてテーブルまたは辞書を参照し、当該文書データの登録先またはその候補を決定する。なお、図2では制御部10の要素として特に重要なもののみを示すが、本発明は後述する処理に必要な他の様々なプログラムモジュールまたは手段を具えるものとする。
記憶部20は、未分類すなわちこれから登録場所が決定される文書データが一時的に格納される文書データ群一次保存領域21と、文書データの登録場所の決定に必要な各種テーブルまたは辞書が登録されるテーブル格納領域22と、最終的に文書データが保存されるファイル格納部23とを具えている。
ここで、本実施例におけるファイル格納部23の構造を図3に示す。上述したように、本実施例のコンピュータシステムは財務処理システムとして構成され、その仕様によって本図に示すようなフォルダ(ディレクトリ)階層が構築されている。図3に示すように、本実施例では顧問先ごとに上位フォルダ群201が作成され、その下の階層に会計、税務、および一般といった業務ごとに3つずつのフォルダ群202が作成され、これらのフォルダ内に当該顧客の業務毎に関連する個々のデータファイルが登録される。なお、この財務処理プログラムでは新規顧客を登録すると自動的に会計・税務・一般の3つのフォルダが作成されるが、会計事務所が顧客からどの業務を請け負うかは顧客との取り決めにより、請け負わない業務に関するフォルダは使用されない。このフォルダが図3において概念的に斜線で示されている。なお、フォルダ(ディレクトリ)構造は本実施例に限るものではなく、例えば会計年度やグループ会社などで細分され、より多くの階層をもつ構造としてもよい。
図4乃至図6は、本実施例におけるテーブル格納領域22に登録されたテーブルおよび辞書の内容を示す図である。これらのテーブルおよび辞書は、テキスト検索部12および登録先判断部13により利用される。図4(a)は、図3に示す上位フォルダ群201と会社名とを関連づけるテーブル1であり、顧客ごとに一意に設定される管理番号と、上位フォルダ名と、会社名とが関連づけられている。一方、図4(b)に示すテーブル2は、個々の文書データで用いられる可能性のある会社の略称や別名などをテーブル1の上位フォルダ名と関連づけるテーブルであり、テーブル1にて設定された管理番号と、略称または別名リストとが関連づけられている。例えば、テーブル1で「ABC工業」との上位フォルダ名で管理される「株式会社ABC工業」に設定された管理番号1に、「株式会社ABC工業」、「(株)ABC」、「エービーシー東京」などの考えられる略称または別名が関連づけられる。同様に、管理番号2で管理される「DEF商事株式会社」には、「デー・イー・エフ」や「DEF商事(株)」などの略称または別名が関連づけられている。このテーブル2により、文書ファイル内に正式な社名(テーブル1記載の社名)が用いられていない場合でも、テーブル2にリストアップされた略称や別名があればその会社に関連する文書であると関連付けることが可能となる。
次に、図5に示すテーブル3は、ファイル格納部23で文書ファイルの登録先として利用可能なフォルダを管理するテーブルであり、顧客の管理番号ごとに、会計、税務、一般の3つの下層フォルダ202のどのフォルダが利用可能かが関連づけられている。ここで、フォルダが利用可能すなわち顧客からその業務を請け負っている場合には「1」、使用しない場合には「0」が登録される。 本実施例では図3に示すように「DEF商事」の一般フォルダと、「GHI産業」の会計フォルダが使用されておらず、これに対応してテーブル3では管理番号2(DEF商事に相当)の「一般」欄と管理番号3(GHI産業に相当)の「会計」欄に「0」が登録され、それ以外の欄に「1」が登録される。
これらのテーブル1乃至3の情報は、コンピュータシステムで動作する財務処理プログラムで新規顧客を登録するときに新規レコードとして作成されるものである。すなわち、財務処理プログラム上でオペレータが新規顧客を登録すると、図3に示すフォルダ構造に3つの下位フォルダ(会計・税務・一般フォルダ)を有する1つの上位フォルダ(会社名フォルダ)が自動的に作成されるとともに、テーブル1に管理番号が設定され、オペレータが入力した顧客の会社名を用いて新規顧客の会社名とフォルダ名が登録される。また、オペレータの指定により、あるいは入力された会社名から自動的に、その会社の略称または別名がテーブル2に登録される。ここで、自動的に略称または別名を登録するには、オペレータが漢字変換する前の入力内容から読み方を抽出したり、システムがアルファベット各文字とその読み方の片仮名表記の対照表を予め具えており、例えば「ABC」を含む会社名から「エー・ビー・シー」なる別名を抽出するようにプログラミングすることが考えられる。さらに、新規顧客の登録時にオペレータによって指定される請負業務の情報から、テーブル3の情報が登録される。これらの情報は予めテーブル1乃至3に登録されるものであるが、その処理は財務処理プログラムの動作であって、本発明のデータ管理プログラムの動作とは直接的に関連せず、また当業者であれば容易に理解できるため、これ以上の詳細な説明は本明細書では省略する。
図6(a)および(b)は、文書データに含まれるキーワードから当該文書データがどの業務に関連するかを導き出すための辞書の一例を示す図である。図6(a)に示す辞書1は、本実施例のシステムで用いる業務名(会計・税務・一般)と、各業務に関連する文書カテゴリ名が関連づけられている。また、図6(b)の辞書2では、辞書1に登録された文書カテゴリに関連する複数のキーワードが登録されている。また、これは必須ではないが、各キーワードには重要度に応じた重み付けの数値が設定されている。これらの辞書1、2は、本発明にかかるデータ管理システム、方法、およびプログラムが適用されるコンピュータシステムの使用目的に応じて、本発明にかかるシステムまたはプログラムの出荷時、あるいはシステムの運用開始時に予め登録されるものとする。本実施例では会計事務所用のコンピュータシステムを想定しているが、他の業種で用いられるテーブルや辞書は他の構成となることは明らかである。
このように構成されたデータ管理システムの動作を、図7以降を用いて詳細に説明する。図7は、本発明にかかるデータ管理方法の実施例を説明するためのフローチャートである。本図は、対象とする文書データの登録先がオペレータに指定されている場合の動作である。ここで、保存対象となる文書データは、図1の記憶部20の文書データ群格納領域21に一時的に格納されている。この文書データは、テキストデータを含んだ電子ファイルのことを指し、例えばワープロや表計算ソフトで作成されたファイルでもよいし、本システムで動作する財務処理プログラムで直前に作成されたものでもよい、また、予め財務処理プログラムや他のソフトウェアで作成され文書データ群一時格納領域21にプールされたもの、メール添付やインターネットダウンロードやLAN内の他の端末からネットワークを介して受け取ったものであってもよい。さらに、このシステムに接続されたスキャナ等の文書読取装置(図示せず)から取得され、OCR処理によりテキスト情報が付された画像データであってもよい。
本実施例では、最初にシステムのオペレータにより文書データの指定と登録場所の選択を受け付ける(ステップA1)。図8は、文書データ選択時に表示部30からオペレータに提示される画面例である。本図に示すように、一時格納領域21に登録された文書データ群が表示部30にリスト提示され、オペレータが入力部40を操作していずれか1以上のファイルを選択できるようになっている。このリストには、ファイル名、形式、作成日付の情報が提示される。オペレータは対象とするファイルを例えばマウスでクリックすることにより反転表示させ、下にある確定ボタンを押下する。
次に図9に示すような登録先選択画面が表示部30に提示され、同様にオペレータがファイルの登録場所を選択して確定ボタンを押下する。制御部10の選択および処理指示部11がこの入力を受け、文書データ群から該当する文書ファイルを抽出するとともにテキスト検索部12に処理を受け渡す。なお、本実施例では、オペレータは図3に示す会社毎の上位フォルダ201のみを指定し、その下の業務フォルダの指定は行わない。一方、システム側は文書内容に基づいて適切な会社名が指定されているかのチェックを行った上で、文書内容からどの業務フォルダに納まるべきかを判断し、自動的にファイルがそのフォルダに登録されるよう構成される。ただし、ステップA1でオペレータが2またはそれ以上の階層のパスを指定し、システム側がこれをすべてチェックする構成としてもよい。
次に、制御部10のテキスト検索部12が、図4に示すテーブル1および2に登録された会社名およびその略称、別名をキーとして、文書ファイルのテキスト検索を行う(ステップA2)。これにより、文書ファイル内にいずれかの会社名または略称や別名が記載されている場合にそれが抽出される。具体的には、テキスト検索部12は、テーブル1の会社名およびテーブル2の略称または別名リストのすべてについて検索を行い、ヒットした会社名、略称または別名の管理番号を抽出し、検索結果を登録先判定部13に出力する。登録先判定部13は、ステップA1で選択された会社が文書ファイルの検索結果に含まれるかを判定する(ステップA3)。具体的には、ヒットした会社名等の管理番号がオペレータに選択された会社の管理番号と一致するか否かを比較する。1つの文書ファイル内に複数の会社名が検出された場合、本実施例では、検出された会社名のいずれか1つが選択された会社名と一致すればステップA3の判断はYESとする。ただし、別の実施例では、例えば文書ファイル内に最も多く出現する会社名のみを比較するようにしてもよい。ステップA3で選択された会社名が含まれればステップA5へ進み、文書ファイル内にオペレータに指定された会社名が含まれない場合はステップA4へと進む。
文書ファイル内に指定された会社名がない場合、選択された登録先以外の会社名が含まれているかを判断する(ステップA4)。もしあれば、後述する図10のフローチャートへと移行する。なければ、そのままステップA5へ進む。
ステップA5では、再びテキスト検索部12が辞書2のキーワードについてテキスト検索を行い、その結果により登録先判定部13が文書カテゴリ名を決定する(ステップA5)。ここで、文書カテゴリ名の決定方法は幾つか考えられるが、例えば最初にヒットしたキーワードに対応する文書カテゴリ名を採用する方法、ヒットした回数が最も多い文書カテゴリ名を採用する方法、図6(b)に示す辞書2に示すようにキーワード毎に重み付け情報を付加して、各キーワードのヒット回数に重み付け数値を乗じた値を文書カテゴリ名ごとに加算し、最も大きい値となった文書カテゴリ名を採用する方法等が考えられる。
次に、登録先判定部13は図6(a)の辞書1を参照し、決定した文書カテゴリ名に対応する業務名を抽出する(ステップA6)。ここで抽出される業務名に対応する業務フォルダが、文書ファイルを登録すべきフォルダとして決定される。さらに、登録先判定部13は図5のテーブル3を参照して、該当する会社の業務フォルダが利用可能かを確認する(ステップA7)。利用可能であれば、文書ファイルをオペレータの選択した会社名のフォルダ内の該当する業務フォルダに関連づけて、ファイル格納部23に格納する(ステップA8)。本実施例では、このとき辞書2で抽出された文書カテゴリ名をファイル名またはその一部として採用し、辞書1で決定された業務フォルダに登録する。一方、決定された業務フォルダが利用可能でなければ、オペレータに選択された登録先に登録できないため、後述する登録先候補の提示処理へと進む(B:図10ステップB8へ)。別の実施例では、図11に示すように登録先の再選択を促す画面を表示して、この入力を受けて再びステップA1から繰り返すようにしてもよい。
次に、図10のフローチャートを用いて、文書データの登録先が予めオペレータによって選択されていない場合の動作例を説明する。本実施例の方法は、予め登録先が指定されていない文書データについて、そのテキスト内容から登録先の候補を抽出してオペレータに選択させるものである。まず、選択および処理指示部11が、文書データ群一時格納領域21に登録されている文書データ群をオペレータに提示して、登録対象となる文書データの選択を促す(ステップB1)。この処理は図8の画面をオペレータに提示して行われる。ファイルの指定を受けたら、テキスト検索部12が図6(b)の辞書2のキーワードについて文書データのテキスト検索を行い、登録先判定部13がヒットしたキーワードから文書カテゴリ名を決定する(ステップB2)。これは図7のステップA5と同じであり、最初にヒットしたキーワードが属するカテゴリ名を採用したり、キーワード毎に重み付けを付与しておき加算値が最も大きなカテゴリ名を採用したりすることができる。
なお、図7のフローチャートにおいて、対称とする文書データに選択した会社名が入っておらず他の会社名が抽出された場合も(図7ステップA4:YES)、ここから処理を始める。選択された会社名がない場合、システム側から文書データに含まれる会社を抽出してオペレータに提案するようにするものである。
次に、登録先判定部12が、図6(a)の辞書1を参照して、決定されたカテゴリ名に対応する業務名を特定する(ステップB3)。これで対称とする文書ファイルのカテゴリ名と業務名が決定する。次に、テキスト検索部12が図4のテーブル1,2のキーワードについてテキスト検索を行い(ステップB4)、何らかの会社名(または略称、別名)がヒットしたらステップB6へと進む(ステップB5)。文書ファイルにいずれの会社名もない場合(ステップB5:NO)、表示部30からエラーメッセージを通知して処理を終了する(ステップB12)。
次に、登録先判定部12は図5のテーブル3を参照し、抽出された会社の決定された業務フォルダが利用可能であるかを確認する(ステップB6)。これは該当する箇所のレコードが「1」であるかを確認することにより行われる。利用可能(ステップB6:YES)である場合、登録先判定部12は、後にオペレータに提示される登録先候補リストにその会社名を登録する(ステップB7)。業務フォルダが利用不能である場合(ステップB6:NO)、リストには登録せずにステップB8へと進む。次に、会社名や略称をキーとした検索で他にヒットした会社名が存在するかをチェックし(ステップB8)、もしあれば、すべての会社について決定された業務フォルダが利用可能であるかを確認してから登録先候補リストに登録する。また、図7の処理においてオペレータに指定された会社の業務フォルダが利用不能であった場合(ステップA7:NO)も、このステップB8で文書内にある他の会社名を抽出し、登録先候補リストに登録する。
文書ファイルに含まれるすべての会社名を確認した後、この登録先候補リストに会社名のデータが存在すれば(ステップB9)、表示部30からリストを提示してオペレータによる選択を受け付ける(ステップB10)。この画面例を図12に示す。本図に示すように、文書ファイルに登場する複数の会社名が提示されて選択できるようになっている。オペレータがいずれかの会社を選択し(反転表示させ)、確定キーを押下すると、登録先判定部12が対称となる文書ファイルと選択された会社の業務フォルダとの関連づけを行い、文書ファイルをファイル格納部23に保存する。すなわち、決定された文書カテゴリ名をファイル名またはその一部に採用し、選択された会社名フォルダの配下にある決定した業務フォルダ内にこの文書ファイルを登録する。ステップB9でリストにデータがない場合、すなわち文書ファイルに該当業務を利用可能な顧客会社名が存在しなかった場合、いずれの会社のファイルとして扱ってよいか分からないため、エラーメッセージを表示して処理を終了する(ステップB12)。
以上に本発明のデータ管理システム、方法、およびプログラムの最良と考えられる実施例について詳細に説明したが、本発明は上記実施例に限定されず、様々な変形例、変更例として実現することができる。図13、14は、このような変形例の構成を示す図である。図13に示す例は、クライアント−サーバ型システムであり、図1に示す制御部10の要素がクライアント端末上にあり、図1に示す記憶部20の要素が、前記クライアント端末とネットワークで接続されたサーバ上にある。このようなシステムは、財務処理システムで扱うデータがサーバ上で一元管理され、複数のクライアント端末がこれにアクセスするといった業務形態に適している。本実施例では、クライアント端末の通信部50からネットワークを介してサーバの通信部、制御部を介して記憶部20のデータへアクセスするが、その他の動作や処理は上述した実施例と何ら変わるものではないため、これ以上の説明はここに省略する。
図14に示す実施例では、これから登録先が決定される文書データが格納される文書データ群一時格納領域21がクライアント端末上にある以外は、図13に示す実施例と同様である。このようなシステムは、例えばクライアント−サーバ型の財務処理システムにおいて、個々のクライアント端末で作成された文書ファイルをそのまま保存するような場合に適している。この場合も、データやテーブルの保存場所以外の処理や動作は同様である。
その他、上述した実施例では、システムのオペレータは最上位のフォルダ(会社名フォルダ)のみを指定または選択し、その下の文書ファイルが登録されるべき下位フォルダはシステム側が決定するようにしているが、これは処理速度や便宜性を考慮したものであって、本例に限定する趣旨ではない。例えば、オペレータが文書ファイルの登録先の全部またはある程度までを指定して、システム側が文書内容から指定されたパス全体について適切かどうかを判断する構成としてもよい。
また、上述の実施例では図5のテーブル3のような利用可能なフォルダ(登録場所)の情報を管理し、これを参照して登録先候補となるフォルダが利用可能か否かをチェックするようにしているが(例えば図7ステップA7や図10ステップB6)、これは必ずしも必須の構成ではなく、例えば最終的に文書データを保存しようとするときに該当するフォルダが存在しない場合に新しくフォルダを作成するかを問い合わせるような運用としてもよい。
また、上述した実施例では、図6(b)の辞書2を用いて文書カテゴリ名すなわちファイル名またはその一部を決定し、これに基づいて図6(a)の辞書1を参照して業務フォルダ名を決定しているが、文書カテゴリ名(ファイル名)の決定は必須の構成要素ではない。文書ファイル名は例えばオペレータが指定してもよく、また前から付されているものをそのまま使用するようにしてもよい。このように本願発明の処理内でファイル名を決定しない場合は、図6に示すような2段階の辞書を用意する必要はなく、業務名に対応するキーワードを登録した辞書を1つ用意すればよい。逆に、例えばファイル格納領域23が3またはそれ以上の階層のフォルダ(ディレクトリ)構造である場合は、これに対応する数の辞書を用意して格納すべきフォルダを決定できるようにする。このように本発明のデータ管理システムを適用するコンピュータシステムの目的や仕様によって文書ファイルが登録されるファイル格納部のフォルダ(ディレクトリ)構造は任意に設計されてもよく、これに応じてテーブル格納領域22に用意されるテーブルや辞書を、様々な階層のフォルダを辿っていけるように適宜構成する。これは当業者であれば格別の困難なく実現できるものであり、このような変形例はすべて本発明の技術的範囲に含まれると解すべきである。
以上、詳細に説明したように、本発明の文書管理システムによれば、予め文書データの登録場所に関するキーワードが登録された1以上のテーブルを参照して文書データのテキスト情報を検索し、抽出されるキーワードから当該文書データの登録場所またはその候補を自動的に決定するものであるため、間違った場所に文書データを保存する事態が防止される。また、機械的に登録作業を決定するため、文書内容に対する登録先の関係の一貫性を保つことができる。
本発明のデータ管理システム、方法およびプログラムは、特に本願出願人により提供される財務処理システムへの利用に適している他、ある程度の規則性に則ってフォルダ階層が構築される文書ファイルが管理される業務システム全般における文書データの管理に広く利用することができる。
図1は、本発明の一実施例にかかるデータ管理システムの構成例を示す図である。 図2は、図1に示すデータ管理システムの制御部10と記憶部20の詳細を示す概略図である。 図3は、記憶部20のファイル格納部23のフォルダ構造の一例を示す図である。 図4(a)は、図3に示す上位フォルダ名と会社名との対応関係を定義するテーブルである。図4(b)は、会社名とその略称または別名との対応関係を定義するテーブルである。 図5は、図3に示す下層フォルダが利用可能か否かを関連づけるためのテーブルである。 図6(a)は、文書カテゴリ名と業務フォルダ名の対応関係を定義する辞書である。図6(b)は、キーワードと文書カテゴリ名の対応関係を定義する辞書である。 図7は、予め登録先がオペレータにより選択されている場合の本発明にかかるシステムの動作を説明するフローチャートである。 図8は、表示部30の画面例であり、仮登録された文書データの選択画面である。 図9は、表示部30の画面例であり、図8のステップA1においてオペレータが登録先を選択する画面である。 図10は、予め登録先が選択されていない場合の本発明にかかるシステム雄動作例を説明するフローチャートである。 図11は、図10のフローチャートでエラー終了した場合の画面例を示す図である。 図12は、図10ステップB10でオペレータに提示される登録先選択画面の例である。 図13は、本発明のデータ管理システムの別の実施例の構成を示す概略図である。 図14は、本発明のデータ管理システムの別の実施例の構成を示す概略図である。
符号の説明
10 制御部
11 選択および処理指示部
12 テキスト検索部
13 登録先判定部
20 記憶部
21 文書データ群一時格納領域
22 テーブル格納領域
23 ファイル格納部
30 表示部
40 入力部
50 通信部
201 上位フォルダ群
202 業務フォルダ群
203 文書データ群

Claims (11)

  1. 読取装置で読み取られた税務会計に関する文書データを分類保存する税務会計業務向けのデータ管理システムにおいて、文書データが登録される記憶領域と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域と、
    前記読み取られた文書のイメージデータをテキスト情報に変換する文字認識手段と、前記1以上のテーブルのキーワードについて前記文書データのテキスト情報を検索するテキスト検索部と、前記テキスト検索部から出力される検索情報を用いて前記文書データの登録場所またはその候補を決定する登録先判定部とを具え
    前記テーブル格納領域に格納された1以上のテーブルには、少なくとも業務フォルダと文書カテゴリを対応づける第1の対応関係と、前記文書カテゴリと各文書カテゴリに関連するキーワードを対応づける第2の対応関係とが登録されており、
    前記記憶領域には、会社毎に設けられる会社フォルダの下層に文書カテゴリに対応する1以上の前記業務フォルダが設けられ、
    前記登録先判定部は、(1)文書ファイル内で最も多く検出されるキーワード、(2)文書ファイル内で最初にヒットしたキーワード、(3)キーワード毎の重みづけ数値を当該キーワードの数に乗じた値が最も大きいキーワード、のいずれか1以上に基づいて、前記第2の対応関係を参照して当該文書データの文書カテゴリを抽出し、抽出された文書カテゴリから前記第1の対応関係を参照して対応する業務フォルダを抽出することにより、前記文書データがどの業務フォルダに登録されるべきかを決定することを特徴とするデータ管理システム。
  2. 請求項1に記載のデータ管理システムにおいて、前記テーブル格納領域に格納された1以上のテーブルにさらに、前記会社フォルダと会社名を対応づける第3の対応関係が登録されており、前記登録先判定部は、前記文書ファイル内のキーワードから、前記第3の対応関係を参照して前記文書データがどの会社フォルダに登録されるべきかを決定することを特徴とするデータ管理システム。
  3. 請求項2に記載のデータ管理システムにおいて、前記テーブル格納領域の前記第3の対応関係に会社名を登録する際に前記データ管理システムが当該会社名の他にその略称または別名をキーワードとして自動登録するよう構成されていることを特徴とするデータ管理システム。
  4. 請求項1乃至3のいずれかに記載のデータ管理システムにおいて、前記テーブル格納領域に、会社毎の業務フォルダの有無に関する第4の対応関係が格納されているとともに、前記登録先判定部がさらに、前記第4の対応関係を参照して前記文書データの登録場所として決定した業務フォルダが利用可能か否かを確認することを特徴とするデータ管理システム。
  5. 請求項1乃至4のいずれか1項に記載のデータ管理システムにおいて、前記文書データが登録される際に、前記登録先判定部が当該文書データの登録場所の決定に用いた文書カテゴリが当該文書データのファイル名またはその一部として用いられることを特徴とするデータ管理システム。
  6. 読取装置で読み取られた税務会計に関する文書データを分類保存する税務会計業務向けのコンピュータシステムにおけるデータ管理方法において、前記コンピュータシステムが、文書データが登録される記憶領域と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域と、文書のイメージデータをテキスト情報に変換する文字認識手段とを具え
    前記テーブル格納領域に格納された1以上のテーブルには、少なくとも業務フォルダと文書カテゴリを対応づける第1の対応関係と、前記文書カテゴリと各文書カテゴリに関連するキーワードを対応づける第2の対応関係とが登録されており、
    前記記憶領域には、会社毎に設けられる会社フォルダの下層に文書カテゴリに対応する1以上の前記業務フォルダが設けられ、
    前記データ管理方法が、
    前記文字認識手段が、前記読み取られた文書のイメージデータをテキスト情報に変換するステップと、
    テキスト検索部が、前記テーブルのキーワードについて文書データのテキスト情報を検索するステップと、
    登録先判定部が、(1)文書ファイル内で最も多く検出されるキーワード、(2)文書ファイル内で最初にヒットしたキーワード、(3)キーワード毎の重みづけ数値を当該キーワードの数に乗じた値が最も大きいキーワード、のいずれか1以上に基づいて、前記第2の対応関係を参照して当該文書データの文書カテゴリを抽出し、抽出された文書カテゴリから前記第1の対応関係を参照して対応する業務フォルダを抽出することにより、前記文書データがどの業務フォルダに登録されるべきかを決定するステップとを含むことを特徴とするデータ管理方法。
  7. 請求項6に記載のデータ管理方法において、前記テーブル格納領域に格納された1以上のテーブルにさらに、前記会社フォルダと会社名を対応づける第3の対応関係が登録されており、前記登録先判定部が、前記文書ファイル内のキーワードから前記第3の対応関係を参照して、前記文書データがどの会社フォルダに登録されるべきかを決定するステップを含むことを特徴とするデータ管理方法
  8. 請求項7に記載のデータ管理方法において、当該データ管理システムが、前記テーブル格納領域の前記第3の対応関係に会社名を登録する際に当該会社名の他にその略称または別名をキーワードとして自動登録するステップを含むことを特徴とするデータ管理方法。
  9. 請求項6乃至8のいずれか1項に記載のデータ管理方法において、前記テーブル格納領域に、会社毎の業務フォルダの有無に関する第4の対応関係が登録されているとともに、前記方法が、前記第4の対応関係を参照して、前記文書データの登録場所として決定した業務フォルダが利用可能か否かを確認するステップを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
  10. 請求項6乃至9のいずれか1項に記載のデータ管理方法がさらに、前記文書データを保存する際に、前記登録先判定部が当該文書データの登録場所の決定に用いた文書カテゴリを当該文書データのファイル名またはその一部として用いるステップを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
  11. 請求項6乃至10のいずれか1項に記載のデータ管理方法をコンピュータに実行させることを特徴とするプログラム。
JP2008021774A 2008-01-31 2008-01-31 データ管理システムおよび方法並びにプログラム Active JP5243054B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008021774A JP5243054B2 (ja) 2008-01-31 2008-01-31 データ管理システムおよび方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008021774A JP5243054B2 (ja) 2008-01-31 2008-01-31 データ管理システムおよび方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2009181479A JP2009181479A (ja) 2009-08-13
JP5243054B2 true JP5243054B2 (ja) 2013-07-24

Family

ID=41035386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008021774A Active JP5243054B2 (ja) 2008-01-31 2008-01-31 データ管理システムおよび方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP5243054B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5681558B2 (ja) 2011-05-10 2015-03-11 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation データの保存を制御する装置及び方法
JP7131137B2 (ja) * 2017-12-27 2022-09-06 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP7059476B2 (ja) * 2017-12-28 2022-04-26 太市 井上 電子データ管理システムおよび電子データ管理プログラム
WO2024047819A1 (ja) * 2022-08-31 2024-03-07 日本電信電話株式会社 抽出装置、情報抽出装置、抽出方法、および、抽出プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114610A (ja) * 1993-08-26 1995-05-02 Fuji Xerox Co Ltd 情報処理システムの入力装置及び情報処理システムの入力方法
JPH09282328A (ja) * 1996-04-16 1997-10-31 Canon Inc 文書画像処理装置及びその方法
JP2001126010A (ja) * 1999-11-01 2001-05-11 Ricoh Co Ltd 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JP2003223383A (ja) * 2002-01-30 2003-08-08 Matsushita Electric Ind Co Ltd データ送信方法およびデータ格納方法、情報処理装置、並びにプログラム
JP2006331274A (ja) * 2005-05-30 2006-12-07 Canon Inc ネットワーク文書管理システム、及びその制御方法、並びに記憶媒体
JP2007011721A (ja) * 2005-06-30 2007-01-18 Sanyo Electric Co Ltd 文書検索装置
JP4991247B2 (ja) * 2005-12-28 2012-08-01 株式会社日本デジタル研究所 電子ファイル管理方法、電子ファイル管理装置および電子ファイル管理プログラム
JP2010282241A (ja) * 2007-08-20 2010-12-16 Nec Corp ファイル管理装置、ファイル管理システム、ファイル管理方法、および、プログラム

Also Published As

Publication number Publication date
JP2009181479A (ja) 2009-08-13

Similar Documents

Publication Publication Date Title
US10114821B2 (en) Method and system to access to electronic business documents
US6957384B2 (en) Document management system
US8468167B2 (en) Automatic data validation and correction
US20180075138A1 (en) Electronic document management using classification taxonomy
US20050289182A1 (en) Document management system with enhanced intelligent document recognition capabilities
US7849398B2 (en) Decision criteria for automated form population
US8539334B2 (en) Document management system having automatic notifications
JP6307745B2 (ja) 会計処理システム
US8718367B1 (en) Displaying automatically recognized text in proximity to a source image to assist comparibility
US20080162603A1 (en) Document archiving system
US11736587B2 (en) System and method for integrating message content into a target data processing device
JP6357621B1 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
US9087053B2 (en) Computer-implemented document manager application enabler system and method
JP2017054469A (ja) データ管理システム、方法およびプログラム
JP5243054B2 (ja) データ管理システムおよび方法並びにプログラム
JP5669041B2 (ja) 文書処理装置及び文書処理方法
JP2012216083A (ja) 文書作成装置、文書作成プログラム、文書作成方法及び文書作成装置を用いた漏洩元特定システム
JP5550959B2 (ja) 文書処理システム、及びプログラム
JP4430490B2 (ja) データエントリ装置及びその制御方法、プログラム
US8390836B2 (en) Automatic review of variable imaging jobs
JP7377565B2 (ja) 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
JPH1196224A (ja) 申請内容審査方法と証明書発行システム
JP2006338114A (ja) データ管理装置およびデータ管理方法
JP2009199254A (ja) 電子メール送信システム、情報処理装置、電子メール送信方法、プログラム、及び記録媒体
JP2888458B2 (ja) ファイル格納装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121030

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121226

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130404

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160412

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5243054

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250