JP2006338114A - データ管理装置およびデータ管理方法 - Google Patents

データ管理装置およびデータ管理方法 Download PDF

Info

Publication number
JP2006338114A
JP2006338114A JP2005159125A JP2005159125A JP2006338114A JP 2006338114 A JP2006338114 A JP 2006338114A JP 2005159125 A JP2005159125 A JP 2005159125A JP 2005159125 A JP2005159125 A JP 2005159125A JP 2006338114 A JP2006338114 A JP 2006338114A
Authority
JP
Japan
Prior art keywords
document
dms
index
index value
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005159125A
Other languages
English (en)
Inventor
Tadashi Naganuma
正 長沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005159125A priority Critical patent/JP2006338114A/ja
Publication of JP2006338114A publication Critical patent/JP2006338114A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 目的は文書の内容に適切なインデックス値を文書に設定するために、読解力や習熟度、またはミスタイプなどの人に左右されないインデックス付けを行うことができる文書管理システムを提供することにある。
【解決手段】 インデックス付けの作業を行うユーザインタフェースを操作した時に、当該文書の既に登録されている文書に最も類似度の高い文書を類似文書検索技術を用いて検索し、その文書に既にインデックス値が設定されている場合は、そのインデックスがふさわしいインデックス値としてユーザインタフェースに表示し、ユーザに適切なインデックス付けを行う操作を促すことにより、適切なインデックス付け作業を行える様にする。
【選択図】 図1

Description

本発明は、データベース等における文書の分類を効率的に行う文書のインデックス登録手法に関するものである。
たとえば、ある文書管理システムに登録された文書を分類、整理するために、文書に対してインデックスと呼ばれる分類識別子を設定する項目を属性項目として登録し、文書の特徴を表す共通のインデックスを登録する。
適切なインデックスで分類された文書管理システムでは、インデックス名で並べ替えを実施することにより、効率良く文書の分類を行うことができ、各分類に分類された文書数でデータの傾向を容易に把握でき、必要とする文書を効率良く探し出すことが可能となる。
又、従来例としては、例えば特許文献1をあげることが出来る。
特開2000−231520号公報
文書を分類するとは、登録されている文書を或る決まった規則で同じ種類に属する文書を幾つかのグループに分類することであるが、文書の内容に対して如何に適切なグループを区別する識別子(以下インデックスと表現する)を割り当てることでもある。
しかし、インデックスの定義が如何に適切であっても、文書の内容に合致する適切なインデックスを設定する必要がある。たとえば同じインデックスのグループの中に、異なる種類の文書が含まれていた場合、適切な分類は行われず、データの傾向の把握ができず、所望とする文書を見つけることが出来ないという問題も発生する。
例えば、複数名の管理者で運営される文書管理システムにおいて、大量の文書にインデックスを設定する必要がある場合、複数名がインデックス付けを実施する場合が多い。一人のユーザがインデックスの設定を行う場合は、インデックスの設定操作は1人の判断基準で操作が行われるため、それほど問題が顕在化する要素は少ないが、複数名のユーザがインデックス付け操作を行う場合、判断基準が明確ではなく、ユーザによって判断の基準が異なり、同じ文書でもユーザによっては違うインデックスに分類されるケースも考えられる。
例えば、クレーム文書を複数名のオペレータで処理するお客様相談センターの場合、受け付けたクレーム文書の分類は各オペレータによって行われるが、判断基準がユーザによって異なる問題や、文書内容の読解力の他に、オペレータの習熟度によっても分類の判断基準が異なる場合もあるという問題があった。
また、オペレータがインデックスとして使用するキーワードを自由に設定できるフリーキーワードを許すシステムである場合、例えば或るユーザが「障害」として入力したものを他のユーザが同じ意味の単語である「トラブル」をキーワードとして入力する場合も考えられる。これらは同義語であるが、結果として別分類となってしまう。また同じ読みであっても、「障害a」と「障害A」は別分類になってしまう。
したがって、本発明の目的は文書の内容に適切なインデックスを文書に設定するために、読解力や習熟度などの人に左右されないインデックス付けを行うことができる文書管理システムを提供することにある。
本発明によれば、インデックスを設定しようとする対象文書に文書の内容の類似度が高く、且つインデックスが設定されている文書を抽出し、これから設定するインデックスのユーザインタフェースにその一覧を表示することで、読解力や、習熟度の低いユーザでも補助手段として選択入力できるような手段を設けたことを特徴とするデータ管理装置が提供される。
以上説明したとおり、本発明によれば、例えば、従来、文書の分類を行う技術として、分類を行う識別子としてのインデックス値を設定して、インデックス値で並べ替えを行うシステムが存在したが、インデックスを設定するユーザの習熟度、判断基準、ミスタイプにより、インデックスを適切に行えないという問題があった。
それに対して、適切と思われるインデックス値を候補としてユーザに示すことで、適切なインデックス値をより選びやすくなるため、文書の効率的分類を行う文書管理システムを実現できることになる。
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。
図1は本発明の一実施形態に係る文書管理システム(Document Management System: 以下DMSという。)の概略構成を示すブロック図である。
図1に示すようにDMSはネットワーク11に構築されている。
このシステムはネットワーク11では、DMSサーバ12と、DMSクライアント13と、で基本的に構成される。DMSサーバ12は、このシステム全体の管理を行うコンピュータであり、公知の技術で実現されるネットワーク処理の他に、主に文書データベースの構築、各装置間の文書データの送受信処理、セキュリティ処理、複数ユーザ間の排他制御処理、文書データを蓄積するデータベースの管理などを行なう。このDMSサーバ12の詳細は図2を参照して後述する。
DMSクライアント13は、ユーザが実際に文書データの入力、参照、出力、などの操作を行うパーソナルコンピュータであり、図1では便宜上一つのみ記載しているが、本実施形態では、複数台のDMSクライアント13がネットワーク11に接続されていることを想定している。このDMSクライアント13の詳細は図3を参照して後述する。
プリンタ14は、スキャナ15と同様に公知の技術を用いて複数のDMSクライアント13によって共有され、各DMSクライアント13は、ネットワーク11を経由してその制御を行なうことができる。プリンタ14は、本実施形態においては、主にDMSサーバ12に蓄積された文書データを印刷出力する役割を果たす。
スキャナ15は、紙に印刷または記載された文字、図形、画像等のデータを読み取り、画像データに変換して出力する装置であり、ネットワーク11に接続されている。各DMSクライアント13は公知の技術を用いてスキャナ15を共有し、それぞれネットワーク11を経由してその動作を制御することができる。
モデム16は、他のネットワークシステムとの電子メールの送受信、FAXの送受信の処理を行なう。このモデム16も複数のDMSクライアント13に共有されており、各DMSクライアント13は、ネットワーク11を経由してその制御を行なうことができる。
CD−ROMドライブ17はDMSサーバ12及び複数のDMSクライアント13に共有され、DMSサーバ12等は、ネットワーク11を経由してその制御を行なうことができる。CD−ROMドライブ17は、本実施形態においては、主にDMSサーバ12、DMSクライアント13のDMS制御プログラムのインストールに用いられる。
尚、本実施形態では、プリンタ14、スキャナ15、モデム16、及びCD−ROMドライブ17をネットワーク11に接続した形式を採用しているが、これに限られず、例えば、DMSクライアント13にこれらを直接接続する形式を採用することもできる。
図2はDMSサーバ12の構成をさらに詳細に説明したブロック図である。
CPU(中央処理装置)22は、主に外部記憶装置28に格納されている各制御プログラムに従って、後述するフローチャートに示すような処理を行なう。
ROM(リードオンリーメモリー)23は、後述するフローチャートの基本的な判断プログラムや、表示・印刷に用いる文字フォント、入力装置としてのキーボード25からキーを押下された事によって出力される電気信号に対応した文字コード表や、あらかじめ設定されている値などを記憶している。
RAM(ランダムアクセスメモリ)24は、各処理中に必要となるワークエリアを有する。
241は、基本I/Oプログラムの領域であり、ROM23に格納される基本判断プログラムが動作する時に必要とされるワーク領域である。CPU22はまず、基本I/Oプログラムを起動し、次にDMSが動作するOSを起動することになる。
242は、OSが動作するためのワーク領域である。
243は、DMSサーバープログラムが動作するための領域で、HDD28に格納されているDMSサーバープログラム282がロードされる領域である。
244は、DMSプログラムが動作するために必要とされる外部記憶装置28に格納されているDMSデータ283のリソースなどの固定データなどがロードされる領域である。
245はDMSプログラムが動作するための一時的にHDD28に格納されているデータベースデータなどを編集するためのワーク領域である。
246はその他の処理で使用されるワーク領域である。
25は、入力装置としてのキーボードである。
26は入力装置としてのポインティングデバイスである。本実施形態はマウスを使用している。
27は、表示装置であり、このDMSの管理者はその表示に従って、操作の経過、結果を判断する。
28は、外部記憶装置であり、本実施形態では、外部記憶装置28は一般的な固定ディスクである。
外部記憶装置28は、ネットワークを管理する基本プログラム281、DMSを管理するプログラムであるDMSサーバープログラム282であるが、この中には、類似文書検索を実行するプログラム、等が含まれる。次に、DMSプログラムが動作するために必要とされるリソースなどの固定データなどのDMSデータ283、スキャナ15を管理する制御するプログラムであるスキャンプログラム284、を記録しており、また、このDMSサーバが管理するデータベースリストを管理する領域285、文書データを蓄積管理するためにデータベース形式で管理されており、ユーザ、グループ、特権データ、インデックスデータ、文書、フォルダなどを管理する領域DMSDB286、及び、それに対応した文書の実体を格納する領域DMSVOLUME287などを有する。DMSアノテーション288はこのデータベースに登録されているアノテーションの表示用、印刷展開用の実データが格納されている。
フレキシブルディスクドライブ(FDD)29は、フレキシブルディスク(FD)2Aへの文書データの格納などに使用される他、フレキシブルディスク2Aに記録されたこのDMSの制御プログラムを、インストールするために用いられる。
制御プログラムは、HDD28のDMSサーバープログラム282、DMSデータ283等の領域にインストールされることになる。フレキシブルディスク2Aの記録内容については、図9を参照して後述する。
尚、FDD29及び、FD2Aの代わりに、CD−ROMドライブと、DMS制御プログラムが格納されたCD−ROMを用いることもできる。
図3はDMSクライアント13の構成を更に詳細に説明したブロック図である。
CPU(中央処理装置)32は、主に外部記憶装置37に格納されているDMSクライアント制御プログラム371に従って、後述するフローチャートに示すような処理を行なう。
ROM(リードオンリーメモリー)33は、後述するフローチャートの基本的な判断プログラムや、表示・印刷に用いる文字フォント、入力装置としてのキーボード34からキーを押下された事によって出力される電気信号に対応した文字コードを出力するための文字コード表や、あらかじめ設定されている値などを記憶している。
34は、入力装置としてのキーボードである。
RAM(ランダムアクセスメモリ)35は、各処理中に必要となるワークエリアを有する。
351は、基本I/Oプログラムの領域であり、ROM33に格納される基本判断プログラムが動作するときに必要とされるワーク領域である。CPU32はまず、基本I/Oプログラムを起動し、次にDMSが動作するOSを起動することになる。
352はOSが動作するためのワーク領域である。
353は、DMSクライアントが動作するための領域で、HDD37に格納されているDMSクライアント制御プログラム371がロードされる領域である。
354はDMSクライアントプログラムが動作するために必要とされるHDD37に格納されたDMSデータ373のリソースなどの固定データ等がロードされる領域(DMSクライアントデータ)である。
355はその他の領域で使用されるワーク領域である。
36は、入力装置としてのポインティングデバイスであり、本実施形態ではマウスを使用している。
37は、外部記憶装置であり、DMSサーバ12とデータの通信などを行なうプログラムであるDMSクライアント制御プログラム371、スキャナ15を管理する制御するプログラムであるスキャンプログラム372、DMSプログラムが動作するために必要とされるリソースなどの固定データなどのDMSデータ373等を有する。
DMSクライアント13が参照するために登録してあるデータベースの一覧を管理するための領域374を有する。この一覧にはDMSサーバ12だけではなく、異なるネットワーク上のDMSサーバが管理するデータベースの一覧も登録されている。
38は表示装置であり、DMSクライアント13で作業するユーザはこの表示装置38に表示されるDMSのユーザインタフェースの様子で操作の経過、結果を判断する。
39は、フレキシブルディスクドライブ(FDD)であり、フレキシブルディスク3Aへの文書データの格納などに使用され、またFD3Aに記録されたこのDMSの制御プログラムをインストールするために用いられる。
制御プログラムは、HDD37のDMSクライアントプログラム371、スキャンプログラム372、DMSデータ373などの領域にインストールされることとなる。FD3Aの記録内容については、図16を参照して後述する。
尚、FDD39及びFD3Aは、それぞれCD―ROMドライブ及びCD−ROMであっても良い。
図4は、図2のデータベースを管理する領域286(DMS DB)の内容を更に詳細に表した図である。これはデータベースが管理するユーザ、グループなどのデータベース管理情報や、登録されている文書情報を含むものであり、図4において、情報群40,41は、それぞれ1キャビネットのデータを示している。従って、サーバに登録されたキャビネットの数だけ以下に述べるデータが存在することとなる。
42はキャビネット識別子である。本実施形態では“クレーム管理”というキャビネット名を格納している。
43はユーザリストであり、このキャビネットに登録されているユーザの一覧が格納されている。キャビネットへの接続はこのユーザ名を使用して行う。
44はグループリストであり、このキャビネットに登録されているグループの一覧が格納されている。複数のユーザに同じ管理を行いたい場合に用いる。それぞれ43のユーザリストに登録されているユーザが各グループに任意に登録されている。
45はプリンタリストであり、このキャビネットにおいて使用することが出来るプリンタの一覧がここに登録されている。本発明のシステムにおいて、DMSクライアント13はこの領域に登録されたプリンタからのみ印刷できる。
46はインデックスリストである。インデックスは文書の分類、検索などの目的で使用する。キャビネット単位で登録されており、インデックスのタイトル、既に登録済みのインデックスの一覧等が管理されている。詳細は図5を参照して説明する。
47はフォルダリストである。キャビネットに作成されているフォルダが登録されている。
48は文書リストである。このキャビネットに登録されている文書の属性情報が全て格納されている。詳細は図6を参照して説明する。
49はアノテーションリストである。このキャビネットに登録されているアノテーションの属性が登録されている。
4Aはボリュームリストである。このキャビネットに登録されている文書の実体は図2のDMS Volume287に格納されているが、そこへのポインタが格納されている。
図5は図4のインデックスリスト46の内容を更に詳細に表した図である。
情報群50、51はインデックスリストの情報単位であり、文書に既に登録済みのインデックスがそれぞれ登録順に格納され、そのキャビネットで各文書に登録可能なインデックス項目数だけこの単位が格納されている。ユーザがクライアント13で文書を選択してその文書にインデックス値を設定する場合、この情報単位が図7の一覧78に示すように、入力補助を促す選択肢として表示される。
52は情報単位50のインデックス識別子であり、当該インデックス項目の識別子を表す。本実施形態では“発生部門”が割り当てられている。内部処理におけるインデックス項目の識別にはこの値が使用される。
53は既に文書に設定済みのインデックス値であり、“発生部門”のインデックス項目で“販売”というインデックス値が既に文書に登録されている事を意味する。
54、55、56、57は同様に既に文書に登録されているインデックスの値である。
58、59もインデックス値の格納領域であるが、インデックスはまだ登録されておらず、登録済みのリストは埋まっていない事を意味する。
図6は、図4の文書リスト48に格納される文書情報の内容を詳細に表した図である。
60,61は文書の情報単位であり、文書の登録数だけこの単位が格納されている。
62は属性情報であり、当該文書の識別子を示す。本実施形態では“クレーム1”という情報が割り振られている。
63は文書属性情報であり、文書名、作成者、などの文書属性に関する情報が格納されている。
64は作成日時である。この文書が文書管理システムに登録された日時を格納する。本実施例では2002/09/20が格納されている。
65は更新日時である。この文書に対して不特定のユーザが変更を行なって更新した日時を格納する。本実施例では、2002/12/25が格納されている。
66はアクセス日時である。この文書に対して不特定のユーザが参照などの操作でアクセスを行なった日時を格納する。本実施例では2002/12/26が格納されている。
67はこの文書に対するACL(アクセス・コントロール・リスト)である。各ユーザがこの文書にアクセスする場合のセキュリティレベルの一覧が格納されている。
68はこの文書に設定が可能なインデックス項目のひとつであり、図7の76に示すようなユーザインタフェースでユーザがインデックス値を設定する事が出来る。この領域にはその設定されたインデックス値が格納される。本実施形態では、まだインデックス値は設定されていない事を示している。
69、6Aも同様にこの文書に設定が可能なインデックス項目であり、インデックス値が格納される。
図7はDMSクライアント13において、任意の文書の図6に示すような文書情報をユーザがこの文書管理システムで表示する目的で用いるユーザインタフェースの一例を表す例である。
70は選択した文書の文書名を表すもので、図6の文書属性情報63に格納されている文書名が表示され、ユーザはこの文書名で文書名を判別する。本実施例では“クレーム1”という文書名であることを示している。
71は選択した文書の見た目をあらわすイメージ情報である。クライアント13で選択した文書の概要を表すイメージを表示する。
72は文書属性情報であり、図6に示す情報単位60に示す情報をこの領域に表示する。左側のセル72−1は項目のタイトルを一覧表示し、右側のセル72−2はそれぞれに対応する設定値を表示する。ユーザが値を設定することも可能である。
73、74、75は情報単位の一部であるインデックス項目が一覧表示されている。図6に示す“発生部門”68の入力を行うユーザインタフェースの一例である。図はこれから入力する操作を行なっている状態であることを示している。入力領域76にクライアント13のキーボード34を用いて直接値を入力することが出来る。既に設定されているインデックス値と同じ値を入力領域76に設定したい場合は、ボタン77を選択すると、本文書管理システムに登録されている文書に既に登録されているインデックス値の一覧78を表示し、この一覧の中から選択すると、キーボード34を用いて直接入力しなくても入力領域76にインデックス値を設定することもできる。このインデックス値一覧78は図5に示すインデックスリストの例えばインデックス情報単位50が表示される。
ボタン79はこの文書属性情報を表すダイアログを現表示内容で確定して、ウインドウを閉じるためのものである。変更の無い場合は、単にウインドウを閉じるだけである。
ボタン7Aはこの文書属性情報を表すダイアログを閉じる。変更の行なわれていた場合は、変更内容は破棄されて変更は行なわれない。
図8は本発明を説明するために必要な操作を説明するフローチャートである。詳細は実施例で説明を後述する。
図9は本文書管理システムの制御プログラムを格納したフレキシブルディスクの内容を説明するものである。本文書管理システムはこの様な形式で供給され、HDD28、やHDD37にインストールされる。
なお、これはCD−ROMでも良い。
91は媒体のフォーマット形式、ディレクトリ管理形式、媒体に付けられた名称などを管理する領域である。
92はディレクトリ情報を管理する領域である。
93は文書管理システムのサーバープログラムを格納した領域で、インストールによってHDD28のDMSサーバープログラム282に格納される。
94は文書管理システムの固定データを格納した領域で、インストールによってHDD28のDMSデータ283に格納される。
95は文書管理システムのクライアントプログラムを格納した領域で、インストールによってHDD37のDMSクライアントプログラム371に格納される。
96は文書管理システムの固定データを格納した領域で、インストールによってHDD37のDMSデータ373に格納される。
次に、本発明を説明するために、ユーザがDMSサーバでユーザからのクレーム文書を分類するために、インデックス項目にインデックス値を設定して文書を分類する作業を行う例で、インデックス値を決める作業時に候補として類似度の高い文書に既に設定されているインデックス値を表示するという本発明の主たる処理、操作を図8のフローチャートを用いて説明する。
まず、図8のフローチャートにおいて、ステップ80では初期化処理を行なう。DMSサーバ12、DMSクライアント13、プリンタ14、スキャナ15、モデム16、CD−ROMドライブ17、ネットワークシステム11の起動を行なう。それぞれ起動処理を行なうと共に、ネットワーク11を介してネットワークシステムへの接続処理を行なうが、これらは公知の技術で実施できるものであるため、詳細は省略する。
ステップ81は新規クレーム文書が登録されたかどうかを確認するループであり、新規クレーム文書の登録を確認する処理である。本実施例では、複数台の他のDMSクライアント13や、クライアント13を共有する他のユーザにより文書登録を行う場合、モデム11を通して登録する場合等がある。登録が確認されたら、ステップ82に移行する。
ステップ82では実際にユーザが新規に登録された文書を選択してインデックス値を設定する操作を行う為に、新規に登録された文書を選択して文書プロパティを表示する処理を行う。図7に示すような文書プロパティの編集を行う画面を表示する操作をこのステップで行う。これは公知の技術を用いて実現できるため、詳細は省略する。
テップ83において、本実施例では図7に示すインデックス項目83に文書の特徴を表すインデックス値を設定する例で説明する。この処理においては、図7に示すボタン77を押下する。インデックス値を直接入力領域76に入力し、登録することもできるが、本特許の利点は一覧78から選択入力することにより、効率的に文書の特徴を表すインデックス値を設定することが出来ることにあるので、ここでは、一覧78から選択入力を行う操作で説明する。
ステップ83でボタン77が押下されると、ステップ84に移行し、選択中の文書のキーワード抽出処理を実行する。このキーワードは次のステップ85で実行する類似文書検索処理を実行する為に必要なもので、選択文書の特徴を表す幾つかの単語を文書中から抽出する処理を実行する。これは公知の技術で実現できるもので、例えばイメージ文書の場合は、OCRを用いてイメージからテキストを抽出し、公知の技術である要約抽出技術を用いて特徴を表す単語、文章を抽出する。
キーワードが抽出できたら、ステップ85においてこの文書に類似度の高い文書を抽出する処理を行う。
ステップ85では、DMSサーバ12に格納されている図4に示すデータベース領域の文書リスト48に格納されている全ての文書から、この文書に内容の似ている文書を抽出する処理を行う。この処理には公知の技術である類似文書検索処理のうち、要約機能を用いて行う。ステップ84で抽出したキーワードを用いて検索処理を行う。1文書ずつ類似度を検索し、ステップ86では全文書の類似検索処理の終了を確認する。終了を確認するとステップ87に移行し、類似文書検索結果を例えば図2に示すDMSサーバのRAM DMS WORK245に格納する。
ステップ88では出力された検索結果で、類似度の高い文書を抽出する。公知の技術で実現する類似文書検索処理ではランキングと呼ばれる、類似度を表す値を各文書に出力できるため、その値の類似度で類似度の高さを確認できる。本特許では公知の技術として使用するだけであるので、詳細は省略する。
ステップ89では抽出した文書のインデックス値が設定済みであるかどうかを確認する処理を行う。本実施例では、当該インデックス項目である、“クレーム分類”68の値が設定されているかどうかで確認することが出来る。若し、設定されていない場合は、ステップ8Aに処理を移行する。
ステップ8Aではステップ87に格納した検索結果リストから、次に類似度の高い文書を抽出する。ここで抽出した文書は再度ステップ89での確認処理に移行するが、その前に、ステップ8Bでその類似度が4位以内であるかどうかを確認する。本実施例では4位以内としたが、文書管理システムによってはユーザインタフェースを装備して、任意の値に閾値を変更できるようにしてもよい。但し、あまり大きくすると、文書の類似度が低くなるので、注意が必要である。
若し、この閾値を超えた場合は、ステップ8Cに移行する。
ステップ8AではDMSサーバ12において類似度の高い文書が存在しなかった為、入力領域76に直接入力する操作を行う。登録を終了したら終了処理9Hへ移行する。
以上の処理で、ステップ89においてインデックス値の登録済みである文書を選択した場合は、ステップ8Dに処理を移行する。
ステップ8Dでは図6に示すクレーム分類というインデックス項目から、設定値を獲得する。
ステップ8Eにおいては図5に示すインデックスリストで、既に登録済みのインデック値リスト53〜59、の値をそれぞれ下の項目に移行し、先頭に、ステップ8Dで獲得したインデックス値を表示する。文書の種類によっては、既に53〜59の中に登録済みであり、場所を先頭の53に移動するだけの場合もある。
以上の処理で、図5に格納されているインデックスリストの格納内容を表示用メモリに書き出し出される
ステップ8Fでは、図7に示す一覧78に出力する処理を行う。ユーザは先頭に類似度の高いインデックス値が表示されていることを確認できる。自動的に無条件に文書に登録する処理でも構わないが、本実施例で説明しているようなクレーム文書を分類する文書管理システムにおいては、文書の内容だけではなく、クレームユーザの態度などの他の要素も考慮しなくては一概にインデックスを決定することはできないため、最終的に決定するのはDMSクライアント13で操作するユーザに任される仕様にしている。無条件にインデックス値を決定するシステムであっても良い。
ステップ8Gではユーザが選択入力する操作を行う。
ステップ8Hでは終了処理を行う。メモリの解放処理等を実施する。
以上の処理でDMSサーバ12に登録された文書に対してユーザがその文書の内容を表現する最も適切なインデックス値を設定する処理を施したことになる。
従来の文書管理システムでは、文書の分類のために、文書の特徴を表すインデックスを設定し、共通の特徴を持つ文書は同じインデックスを設定するシステムがあったが、複数ユーザが操作する場合や、自由入力を許すインデックス値の場合、人によって判断基準が異なったり、同義語ではあるが、異なる文字列をインデックスとして設定してしまう場合があったりし、的確な文書の分類が出来ない恐れがあるという点が問題とされていた。
文書の特徴を表すインデックス値を設定する場合、その文書に類似度の高い文書は同じインデックスを設定する可能性があり、既にインデックス値が設定されていた場合は、同じインデックス値を設定することで、適切なインデックス値を設定することが出来るところに、本発明の特徴がある。
本発明の1実施例を示すDMSシステムの概略構成を説明するブロック図である。 図1に示すDMSサーバ12の構成を詳細に表す図である。 図1に示すDMSクライアント13の構成を詳細に表す図である。 図2に示すDMSデータベースリスト286の構成を詳細に表す図である。 図4に示すインデックスリスト46の構成を詳細に表す図である。 図4に示す文書リスト48の構成をより詳細に表す図である。 本実施例で図9に示すフローチャートで表示されるユーザインタフェースの一例である。 ユーザが本特許で構成される文書管理システムにおいて文書を選択し、適切なインデックス値を設定する手順を説明するフローチャートである。 文書管理システムの制御プログラムなどを供給するFD2A、3Aの内容を説明するものである。

Claims (1)

  1. 文書管理システムにおいて、文書の分類の識別子としてインデックスを設定する場合、公知の技術で実現される類似文書検索技術の要約機能を用いて、対象文書の特徴を表すキーワードを抽出する手段と、そのキーワードを用いて対象文書に内容が類似している文書を、類似文書検索技術を用いて検索する手段と、類似度の高い文書が既にインデックス値が設定されているかどうかを判断し、設定されていなければ、次に類似度の高い文書を検出する手段と、閾値を超えてもインデックス値が設定されている文書が存在しない場合、自由入力手段に切り替える手段と、類似度が高く、インデックス値が設定されている文書が見つかった場合、そのインデックス値を入力候補の先頭に設定する手段と、を備えたことを特徴とするデータ管理装置。
JP2005159125A 2005-05-31 2005-05-31 データ管理装置およびデータ管理方法 Withdrawn JP2006338114A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005159125A JP2006338114A (ja) 2005-05-31 2005-05-31 データ管理装置およびデータ管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005159125A JP2006338114A (ja) 2005-05-31 2005-05-31 データ管理装置およびデータ管理方法

Publications (1)

Publication Number Publication Date
JP2006338114A true JP2006338114A (ja) 2006-12-14

Family

ID=37558646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005159125A Withdrawn JP2006338114A (ja) 2005-05-31 2005-05-31 データ管理装置およびデータ管理方法

Country Status (1)

Country Link
JP (1) JP2006338114A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015164066A (ja) * 2015-05-07 2015-09-10 富士通株式会社 情報検索装置、情報検索方法およびそのプログラム
JP2020135246A (ja) * 2019-02-15 2020-08-31 国立大学法人大阪大学 文書検索装置、文書検索方法、及び、文書検索プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015164066A (ja) * 2015-05-07 2015-09-10 富士通株式会社 情報検索装置、情報検索方法およびそのプログラム
JP2020135246A (ja) * 2019-02-15 2020-08-31 国立大学法人大阪大学 文書検索装置、文書検索方法、及び、文書検索プログラム

Similar Documents

Publication Publication Date Title
JP4308587B2 (ja) 文書群管理装置
US8630852B2 (en) Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program
US20090313539A1 (en) Information processor, information processing method, and recording medium
US20060221957A1 (en) Data transmission device capable of transmitting data to a plurality of addresses by simple method
CN101645087A (zh) 一种分类词库系统及其更新和维护方法、以及客户端
US8370384B2 (en) Information processing apparatus, file management method, program, and storage medium
WO2011040025A1 (en) Method for setting metadata, system for setting metadata, and program
US8248667B2 (en) Document management device, document management method, and computer program product
US20230196002A1 (en) Document processing method, and information processing device
JP2008234078A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理プログラムを記録した記録媒体
JP4288761B2 (ja) メール送信装置およびそのプログラム記憶媒体
JP2006338114A (ja) データ管理装置およびデータ管理方法
JP2009075849A (ja) 情報処理装置、情報処理方法、そのプログラム及び記憶媒体
JPH1069476A (ja) ドキュメント管理システム、ドキュメント共有方法及び記録媒体
JP2010009412A (ja) 情報処理装置、電子帳票管理システムおよびその帳票検索方法、並びにプログラム
JP2009277124A (ja) 情報処理装置及びその制御方法、並びに制御プログラム
JPH1125077A (ja) 文書管理装置及びシステム及び方法
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
JP2009099090A (ja) 帳票キーワード登録装置、帳票キーワード登録方法、および、プログラム
JP2006350454A (ja) 文書管理装置、文書管理システム、情報管理装置、情報処理装置および文書管理方法
JP5217513B2 (ja) 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。
JP2016071717A (ja) メール表示プログラム、メール表示方法、及びメール表示システム
JP2007011721A (ja) 文書検索装置
JP2000099234A (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
JP7323138B2 (ja) 技術マップ出力装置、技術マップ出力方法、およびプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080805