JP2002245065A - 文書処理装置、文書処理方法、プログラムおよび記録媒体 - Google Patents
文書処理装置、文書処理方法、プログラムおよび記録媒体Info
- Publication number
- JP2002245065A JP2002245065A JP2001037762A JP2001037762A JP2002245065A JP 2002245065 A JP2002245065 A JP 2002245065A JP 2001037762 A JP2001037762 A JP 2001037762A JP 2001037762 A JP2001037762 A JP 2001037762A JP 2002245065 A JP2002245065 A JP 2002245065A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- document
- storage unit
- editing history
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
目の名称やデータ型等の変更があった場合にも、変更前
後の属性を用いて検索や分類が行え、利用者の労力が軽
減される文書処理装置を提供する。 【解決手段】 少なくとも複数のデータ項目とそのデー
タ型とからなる属性を保持する文書属性蓄積部160
と、前記属性を付与された文書を複数の文書を保持する
文書蓄積部150と、文書属性蓄積部160に保持され
た属性を編集し、その編集履歴を保持する文書属性編集
履歴蓄積部170と、文書蓄積部150に保持した文書
を分析するときに、前記属性とこの属性の持つ情報に対
して文書属性編集履歴蓄積部170を検索し、編集履歴
を得てから分析を行う分析処理実行部140とを備え
る。
Description
を管理する文書処理装置、文書処理方法、プログラムお
よび記録媒体に係り、詳細には、文書の属性を利用して
検索や分類を行い文書群の分析を行う技術に関する。
では、文書名、作成日や更新日などの書誌情報を利用し
て文書群の管理、検索や分類などの文書群の分析を支援
している。また、個々の文書にキーワードや文書内容の
一部を抽出した情報を文書の書誌情報として利用し、文
書群の分析を行ったり、キーワード抽出や文書内容から
の情報抽出を自動化して、文書データベース等へ文書を
登録するときの利便性を向上させることも従来から行わ
れている(例えば、特開平9−6792号を参照)。ま
た、文書へ予め用意された付帯情報以外に、利用者が文
書へ付帯させる情報を定義できるシステムでは、属性の
項目名称や項目の型を定義することが可能で、文書登録
時や文書更新時を含めた任意の時点で利用者が定義した
項目の型に従い項目値を入力したり、自動で入力させた
りすることもできる。また、これまでに述べた文書の書
誌情報や文書付帯項目を複数、纏めて文書の属性として
定義することも従来から行われている。例えば、属性の
名称を定義し、その属性に含まれる項目の名称や項目の
型を複数定義して文書種として利用するものであって、
属性内の項目の増減、項目の名称/型を編集することが
でき、文書の登録や更新時に文書の属性を選択し、個々
の項目の型に従った項目値を代入することができる。こ
のような文書の書誌情報や文書属性に対して、書誌情報
の値、文書属性の値を検索条件として指定して文書群か
らいくつかの文書を抽出したり、それらの値に基づいて
分類して文書群の分析を行ったりすることも従来から行
われている。さらに、指定した検索条件で検索された文
書や、すでに提示されている文書との類似での文書検索
の指示や、その文書とはある観点が違っている文書の検
索を支援する技術としては、特許第2581376号公
報に記載された技術がある。
は、利用者が定義する文書の属性の名称、属性に含まれ
る項目の名称、項目の型の変更などの、文書属性の編集
を行った場合に、その編集の前後で、属性種が異なるた
め、旧属性種を指定して検索を行うと新属性種に対応し
た文書が検索できず、また、このような編集記録を利用
者が記録管理したとしても検索条件の指定が煩雑になる
という問題があった。また、システムが文書群の分類を
行う際にも、このような編集の前後の関連性を考慮しな
いため、望んでいる検索結果や分類結果が得られないこ
とがあった。本発明は、上記問題点を解決するためにな
されたものであって、文書の属性の名称、属性に含まれ
るデータ項目の名称やデータ型等の変更があった場合に
も、変更前後の属性を用いて検索や分類が行える文書処
理装置、文書処理方法、プログラムおよび記録媒体を提
供し、これにより利用者が文書の属性等の変更を自分で
管理する労力を軽減することを目的とする。
めに、本願の請求項1の発明は、少なくとも複数のデー
タ項目とそのデータ型とからなる属性を保持する文書属
性蓄積部と、前記属性を付与された文書を複数の文書を
保持する文書蓄積部と、前記文書属性蓄積部に保持され
た属性を編集し、その編集履歴を保持する文書属性編集
履歴蓄積部と、前記文書蓄積部に保持した文書を分析す
るときに、前記属性とこの属性の持つ情報に対して前記
文書属性編集履歴蓄積部を検索し、編集履歴を得てから
分析を行う分析処理実行部とを備えたことを特徴とす
る。また、本願の請求項2の発明は、請求項1に記載の
文書処理装置において、前記分析実行部は、前記文書蓄
積部の文書を検索するために指定された検索条件中に前
記属性が存在するとき、前記文書属性編集履歴蓄積部お
よび前記文書属性蓄積部とを参照して得たその属性の編
集履歴に基づいて検索条件を拡張して検索するようにし
たことを特徴とする。また、本願の請求項3の発明は、
請求項1に記載の文書処理装置において、前記分析実行
部は、前記文書属性編集履歴蓄積部および前記文書属性
蓄積部とを参照して得た属性の編集履歴に基づいて分類
を行うことを特徴とする。
も複数のデータ項目とそのデータ型とからなる属性を保
持する文書属性蓄積部と、前記属性を付与された文書を
複数の文書を保持する文書蓄積部と、前記文書属性蓄積
部に保持された前記属性を編集し、その編集履歴を保持
する文書属性編集履歴蓄積部と、入力された検索条件に
適合する文書を前記文書蓄積部から検索する分析処理実
行部とを備え、前記分析実行部は、入力された検索条件
中に前記属性を用いた検索要求がなされたとき、前記文
書属性編集履歴蓄積部および前記文書属性蓄積部とを参
照してこの属性に対する編集履歴を得て、入力された検
索条件を拡張することを特徴とする。また、本願の請求
項5の発明は、少なくとも複数のデータ項目とそのデー
タ型とからなる属性を保持する文書属性蓄積部と、前記
属性を付与された文書を複数の文書を保持する文書蓄積
部と、前記文書属性蓄積部に保持された前記属性を編集
し、その編集履歴を保持する文書属性編集履歴蓄積部
と、前記文書属性蓄積部と前記文書属性編集履歴蓄積部
とを参照して前記属性の編集履歴を得て、これらの属性
に関する情報を基に前記文書蓄積部に保持された文書を
分類する分析処理実行部とを備えたことを特徴とする。
また、本願の請求項6の発明は、文書属性蓄積部に少な
くとも複数のデータ項目とそのデータ型とからなる属性
を保持し、文書蓄積部に前記属性を付与された文書を複
数の文書を保持し、前記文書蓄積部に保持した文書を分
析するときに、前記属性とこの属性の持つ情報に対して
この属性を編集した編集履歴を得てから分析を行うこと
を特徴とする。
蓄積部に少なくとも複数のデータ項目とそのデータ型と
からなる属性を保持し、文書蓄積部に前記属性を付与さ
れた文書を複数の文書を保持し、文書属性編集履歴蓄積
部に前記属性を編集したときの編集履歴を保持して、入
力された検索条件中に前記属性を用いた検索要求がなさ
れたとき、前記文書属性編集履歴蓄積部および前記文書
属性蓄積部とを参照してこの属性に対する編集履歴を得
て、入力された検索条件を拡張して、この検索条件に適
合する文書を前記文書蓄積部から検索することを特徴と
する。また、本願の請求項8の発明は、文書属性蓄積部
に少なくとも複数のデータ項目とそのデータ型とからな
る属性を保持し、文書蓄積部に前記属性を付与された文
書を複数の文書を保持し、文書属性編集履歴蓄積部に前
記属性を編集した編集履歴を保持して、前記文書属性蓄
積部と前記文書属性編集履歴蓄積部とを参照して前記属
性の編集履歴を得て、これらの属性に関する情報を基に
前記文書蓄積部に保持された文書を分類することを特徴
とする。また、本願の請求項9の発明は、コンピュータ
を、少なくとも複数のデータ項目とそのデータ型とから
なる属性を保持する文書属性蓄積部と、前記属性を付与
された文書を複数の文書を保持する文書蓄積部と、前記
文書属性蓄積部に保持された前記属性を編集し、その編
集履歴を保持する文書属性編集履歴蓄積部と、入力され
た検索条件に適合する文書を前記文書蓄積部から検索す
る分析処理実行部とを備え、前記分析実行部は、入力さ
れた検索条件中に前記属性を用いた検索要求がなされた
とき、前記文書属性編集履歴蓄積部および前記文書属性
蓄積部とを参照してこの属性に対する編集履歴を得て、
入力された検索条件を拡張してから文書を検索する機能
させる。
ュータを、少なくとも複数のデータ項目とそのデータ型
とからなる属性を保持する文書属性蓄積部と、前記属性
を付与された文書を複数の文書を保持する文書蓄積部
と、前記文書属性蓄積部に保持された前記属性を編集
し、その編集履歴を保持する文書属性編集履歴蓄積部
と、前記文書属性蓄積部と前記文書属性編集履歴蓄積部
とを参照して前記属性の編集履歴を得て、これらの属性
に関する情報を基に前記文書蓄積部に保持された文書を
分類する分析処理実行部とを備え、文書群を前記属性に
関する情報によって分類する機能を実現させる。また、
本願の請求項11の発明は、コンピュータを文書処理装
置として機能させるためのプログラムを記録した記録媒
体であって、少なくとも複数のデータ項目とそのデータ
型とからなる属性を保持する文書属性蓄積部と、前記属
性を付与された文書を複数の文書を保持する文書蓄積部
と、前記文書属性蓄積部に保持された前記属性を編集
し、その編集履歴を保持する文書属性編集履歴蓄積部
と、入力された検索条件に適合する文書を前記文書蓄積
部から検索する分析処理実行部とを備え、前記分析実行
部は、入力された検索条件中に前記属性を用いた検索要
求がなされたとき、前記文書属性編集履歴蓄積部および
前記文書属性蓄積部とを参照してこの属性に対する編集
履歴を得て、入力された検索条件を拡張してから文書を
検索する機能を実現するためのプログラムを記録した。
また、本願の請求項12の発明は、コンピュータを文書
処理装置として機能させるためのプログラムを記録した
記録媒体であって、少なくとも複数のデータ項目とその
データ型とからなる属性を保持する文書属性蓄積部と、
前記属性を付与された文書を複数の文書を保持する文書
蓄積部と、前記文書属性蓄積部に保持された前記属性を
編集し、その編集履歴を保持する文書属性編集履歴蓄積
部と、前記文書属性蓄積部と前記文書属性編集履歴蓄積
部とを参照して前記属性の編集履歴を得て、これらの属
性に関する情報を基に前記文書蓄積部に保持された文書
を分類する分析処理実行部とを備え、文書群を前記属性
に関する情報によって分類する機能を実現するためのプ
ログラムを記録した。
施の形態の構成および動作を詳細に述べる。 (1)機能構成 図1は、本発明の実施の形態の一例である文書処理装置
の機能構成を示すブロック図である。本実施の形態の文
書処理装置は、制御部100、文書登録部110、文書
属性付与部120、文書属性編集部130、分析処理実
行部140、文書蓄積部150、文書属性蓄積部16
0、文書属性編集履歴蓄積部170とから構成される。
制御部100は、利用者がキーボード等の入力装置を操
作して文書登録、文書属性編集、文書属性付与、分析実
行などを指定したときの文書処理装置全体の制御を行
う。文書登録部110は、スキャナ、カメラ、キーボー
ド等の入力装置またはネットワークを介して、文書を入
力し、入力された文書を文書蓄積部150へ登録する。
この文書の登録過程やその結果は、ディスプレイやプリ
ンタ等の出力装置で確認することができる。
とに、文書を管理するための文書識別子(文書ID)、
文書名、書誌事項(登録日、登録者名、更新日、文書の
形式(例えば、テキスト情報、イメージ情報、音声情報
等)、文書のサイズ、メモ等)、属性ID、データ項目
一覧およびコンテンツリスト等を保持している(図2、
図3参照)。ここで、属性IDは、文書属性蓄積部16
0に登録された属性を識別する唯一名であり、データ項
目一覧は、この属性IDで示される属性のデータ項目に
対応した実際の値を保持する。また、コンテンツリスト
は、文書の内容(テキスト、画像、音声等のデータ)を
示すコンテンツを保存しているファイル識別子のリスト
である。文書属性編集部130は、文書に付与する属性
の名称と、この属性に含まれる項目の名称やこの項目の
データ型等を定義し、この属性を文書属性蓄積部160
へ登録する。一度、登録された文書の属性を文書属性蓄
積部160から取り出し、編集を行った結果を文書属性
蓄積部160へ再登録して更新することができる。もち
ろん、属性自身やデータ項目を削除することもできる。
この文書の属性の編集の過程や結果は、ディスプレイや
プリンタ等の出力装置で確認することができる。文書属
性蓄積部160のデータ構造(図4、図5参照)は、各
文書に付与される属性のデータ項目を定義するものであ
って、属性IDによって識別される。すなわち、各文書
は、書誌事項の他にここで定義される可変データ項目を
もち、このデータ項目は文書蓄積部150のそれに対応
している。この可変データ項目は、この可変データ項目
を使用するか否かのフラグ、このデータ項目のデータ型
(文字型、文字列型、日付型、名前型、数値型、論理型
等)およびこのデータ項目の名前との3つ組対で構成さ
れる。
性の例である。属性の名称は、任意の名前(例えば「ab
c」)を定義することができる。この例のように、属性
には複数の項目をまとめて定義することができ、データ
項目の名称とデータ項目のデータ型(値の型)として、
データ項目の名称に文書印刷日、そのデータ項目に対す
るデータ型に日付型等のように定義する。図5の文書属
性蓄積部160に登録された属性を編集する例を図6
(編集前の状態)と図7(編集後の状態)に示した。こ
の図6では、属性の名称を「abc」から「xyz」に、デー
タ項目の名称「文書印刷日」を「最終印刷日」に、デー
タ項目の名称「図面区別」のデータ型を「文字列型」か
ら「数値型」に変更し、データ項目として名称に「顧客
コード」、そのデータ型に「数値型」を追加している。
また、属性「abc」自体を削除することもできる。な
お、属性の編集作業を図8に示したような画面を使って
行うように構成してもよい。図8の画面上部に示された
登録属性参照画面は、既に文書属性蓄積部160に登録
されている属性の一覧を表示する。また、図8の画面下
部の新規定義画面は、新たに定義する属性の編集画面を
示しており、この例では属性「new」を定義している。
この新規定義画面では、一つ一つの項目型の名称、項目
型を定義する。このとき、登録属性参照画面から属性の
全体、または、それに含まれる項目の一部を選択して定
義することもできる。ここでは、属性「abc」と属性「g
hi」のすべてのデータ項目を選択して新たな属性「ne
w」としている。この属性の定義は、登録属性参照画面
に示された二つ以上の属性を利用して新たな属性を定義
することもできる。例えば、登録属性参照画面に示され
た属性「A」や「B」から、新規定義画面で属性
「a」、「b」、「c」、「d」を定義する場合に両者
の関係として図9のような関係が可能である。図中左か
ら、 ・属性Aの全項目と、新たに定義する項目を加えてaを
定義する ・属性Aの項目の一部を選択して、bを定義する ・属性Aと属性Bの項目の和から、cを定義する ・属性Aと属性Bの項目の積から、dを定義する
0から取り出した文書と文書属性蓄積部160から取り
出した属性とを対応づけたり、その属性に含まれる項目
の値を代入する等を行う。この対応づけられた文書と属
性は、文書蓄積部150へ登録される。この文書への属
性の対応づけの処理過程やその結果は、ディスプレイや
プリンタ等の出力装置で確認することができる。例え
ば、図10を用いて文書属性付与部120を説明する。
この例では、文書登録部110で文書蓄積部150へ登
録する文書あるいはすでに文書蓄積部150に登録され
ている文書「いろは」に、属性を対応づけを行っている
ところを示している。この図10では、すでに付与され
ている文書「いろは」の属性「xyz」を、文書属性蓄積
部160に登録されている属性名リスト(画面の右の部
分)の中から属性「abc」を選択して、変更している。
さらに、属性「abc」を選択した後、その属性に定義さ
れている各々の項目の値を図11のように代入する。こ
れらの編集結果を文書蓄積部150へ文書のコンテンツ
と対応させる形式で登録する。分析処理実行部140
は、利用者によりキーボードやポインティングデバイス
等の入力装置から検索や分類の条件の設定が行われた
後、文書蓄積部150から文書群を取り出し、指定され
た条件を参照して検索や分類等の処理を実行する(詳し
くは後述する)。この文書群の分析過程やその結果は、
ディスプレイやプリンタ等の出力装置で確認することが
できる。
性編集部130が実行する編集処理の履歴を記録する。
文書属性編集履歴蓄積部170のデータ構造(図12参
照)は、各属性の編集登録日に対して、属性ID、その
編集日と編集のもとになった属性の属性IDとの3つ組
みで表される。図12の文書属性編集履歴蓄積部170
のデータ構造の編集日を文書属性蓄積部160のデータ
構造に加えるようにして、文書属性蓄積部160と文書
属性編集履歴蓄積部170とを一つに管理してもよい。
例えば、図12は、図6の属性「abc」が1983年3
月31日に新たに定義され、1996年7月28日に図
7の属性「xyz」のように編集を加えられ、さらに、同
日にその属性「xyz」が変更された場合を示している。
この編集のように、データ項目「顧客コード」が削除さ
れた場合は、使用可否のフラグが「否」となる。なお、
この属性の編集履歴を表現するときに、文書属性蓄積部
160のデータ構造を図13のように、属性のデータ項
目ごとに文書属性蓄積部160内でユニークに管理され
る「管理NO.」とどの属性のどのデータ項目を流用し
たかを示す「from」とを追加し、さらにその属性の編集
日を追加して構成すれば、文書属性編集履歴蓄積部17
0は文書属性蓄積部160へ統合され、且つ、編集のも
とになる属性を2つ以上表現することができる。例え
ば、図14(文書属性蓄積部160)に示すように、1
982年6月10日に定義された属性「abc」のデータ
項目の一部を利用して新たに属性「OPQ」を定義する場
合を考える。
日」は、文書属性蓄積部160内でユニークに管理され
た管理番号「1」が割り振られている。これを利用した
とすると属性「OPQ」の「from」にはこの管理番号
「1」が代入され、それ自身の管理番号はユニークな管
理番号「101」が与えられる。次に、属性「abc」の
データ項目「承認者」は、文書属性蓄積部160内でユ
ニークに管理された管理番号「2」が割り振られて、こ
れを属性「OPQ」では「所属長」と名称を変えたときに
は、「from」はこの管理番号「2」が代入され、名称や
型を変更し、自身の管理番号はユニークな管理番号「1
02」が与えられる。また、属性「abc」のすべてのデ
ータ項目を利用して、新たな属性「UVW」を定義する場
合には、属性「OPQ」のデータ項目「印刷日」の「fro
m」には「1/AID001」が代入され、それ自身の管理番号
はユニークな管理番号「201」が与えられている。こ
の「/」の右側の「AID001」は、1982年6月10日
に編集登録された属性「abc」のユニークな識別子を表
し、の左側の「1」はその属性のデータ項目「印刷日」
のユニークな管理番号を示している。また、図14の属
性ID「AID001」と「AID002」および「AID005」と「AI
D006」のように属性名だけを変更するような使い方とし
ては、例えば、属性名称を「1999年発信文書」とし
ていたものを、2000年を契機に「2000年発信文
書」に変更したり、組織変更等で属性名称「開発室」を
「第1開発課」というように変更したりするときに用い
るとよい。
理手順を説明するためのフローチャートである。先ず、
利用者は、キーボード等の入力装置から文書蓄積部15
0に登録されている文書を検索するための検索条件を入
力する(ステップS100)。入力された検索条件中
に、属性名や属性の項目名が含まれているかを調べる
(ステップS110)。含まれていないときには、ステ
ップS150へ進んで、その検索条件で通常の検索を実
行する。含まれている場合は、文書属性蓄積部160と
文書属性編集履歴蓄積部170を参照して、検索条件に
含まれている属性名や属性の項目名に対応する編集履歴
を取り出す(ステップS120)。検索条件に含まれて
いる属性名や属性の項目名に対応する編集履歴があるか
どうか調べ(ステップS130)、なければステップS
150進み、あれば、その取り出された履歴から新しい
検索条件を追加する(ステップS140)。例えば、図
5と図12を用いて説明すると、検索条件に属性「xy
z」を持つ文書群を検索するように指定されている場合
に、この属性を作成するもとになった属性「abc」をも
つ文書群も検索するように検索条件に追加するようにす
る。また、属性「xyz」のデータ項目「承認者」の値が
検索条件として指定されたときには、その属性を作成す
るもととなった属性「abc」のさらに対応するデータ項
目「文書検印者」を含めた検索条件を追加する。
は、文書属性蓄積部160のデータ構造を図13のよう
に構成したほうが見つけやすくなる。例えば、図14を
使って説明すると、入力された検索条件の中に属性「OP
Q」のデータ項目「印刷日」の値が指定されているとす
ると、このデータ項目を作成するときに参照したもとの
データ項目、即ち、属性「abc」のデータ項目「印刷
日」を見つけられる。(図14の管理番号「101」に
その属性のデータ項目を定義した際に管理番号「1」を
利用した記録が残されている。)従って、管理番号
「1」のデータ項目を文書属性蓄積部160から取得
し、属性「abc」と対応づけられているデータ項目の名
称「印刷日」も検索条件に追加することができる。追加
された検索条件(ステップS110(No)およびS1
30(No)からのときには入力された検索条件のま
ま)を用いて、文書蓄積部150の通常の検索を実行す
る(ステップS150)。この検索結果をディスプレイ
やプリンタ等の出力装置へ出力する(ステップS16
0)。この結果を出力する際、利用者が指定した検索条
件から直接検索された文書群と、本文書処理装置が検索
対象を拡張した条件から検索された文書群を色別、グル
ープ別等によって区別すると利用者には便利である。本
実施の形態をこのように構成すると、属性の名称、属性
に含まれるデータ項目の名称やデータ型の変更などの編
集が行われた際の履歴を記録しているので、その情報を
利用して、編集の前、あるいは後の属性が条件として指
定されて検索が行われた場合に、編集履歴に基づき検索
対象を拡張して検索を行うことができる。
理手順を説明するためのフローチャートである。先ず、
文書蓄積部150の中の利用者は分類させたい文書群を
キーボードやマウス等の入力装置によって指定し、この
指定された文書群に対して行う分類手法やそれに付属し
た情報などの諸設定を行う(ステップS200)。次
に、分類対象となった文書の書誌事項、内容、属性の数
量化を行う(ステップS210)。この数量化は、例え
ば、図17に示したような同じ属性をもった文書Aと文
書Bがあるとき、各データ項目の値を全一致で見た場合
の相違したデータ項目の個数と考えれば、差は2(種類
と文書番号)となる。また、データ項目同士の値の差を
使うとすれば、差は1+(45−30)=16である。こ
れは図面と請求書が異なるから1であり、文書番号はそ
の値の差を計算して上記の数値を得る。
図面は(x,y)=(4,7)、請求書は(x,y)=(10,15)などと定義
して距離を差として使うこともできる。この場合、軸を
「再利用度」や「閲覧されることの多さ」などを予め決
めて、文書ごとに数値化しておくようにする。また、項
目数の差異だけでなく、編集された日時の差、データ項
目の名称やデータ型の編集による差異などを数量化する
ようにしてもよい。例えば、図18のように同じ文書C
が12日に作成され、15日と18日に編集されたとす
ると、12日の文書と15日の文書の差異は、文書番号
の差(45−30)に日にちの差3を乗じて計算するよ
うにしてもよい。また、文書内容の数量化は、含まれる
単語の数の差を利用する方法などが考えられる。更に、
任意の2文書の差異を求めるのに、単語の頻度を用いて
数値化することもできる。文書を形態素解析して、単語
を抽出し、「文書×単語」の行列を作成し 特定の文書
ベクトル間距離を計算することを例にして説明する。
この行列の列を次のように増やす。増やす列名は、図1
4にある管理番号(例えば、「1」、「2」、「10
1」や「102」)である。例えば、文書の属性名称
「OPQ」に属する場合には、列名「101」と「10
2」の要素に非0(これは1でもよいが、重みとしても
よい)を代入し、属性名称「OPQ」のfromを参照し、列
名「1」と「2」の要素にも非0を代入する。このよう
して拡張した行列を用いて、距離の計算(=分類)を行
う。このようにして数量化された各文書に対して、クラ
スタ分析等の利用者から指定された分類手法によって、
指定された文書群を分類し(ステップS220)、その
分類結果をディスプレイやプリンタ等の出力装置に出力
することによって利用者へ提示する(ステップS23
0)。 上述したように実施の形態を構成することによ
って、属性の名称、属性に含まれるデータ項目の名称や
データ型の変更などの編集が行われた際の履歴を記録し
ているので、以下のような効果が達成できる。 (1)編集の前後の属性が検索条件として指定された場
合であっても、この編集履歴に基づき検索対象を拡張し
て検索を行うことができるので、利用者は属性が変えら
れたことを気にせずに検索の実行ができる。 (2)文書群を分類させる場合に、その編集前後の属性
間の近接度を数量化して利用し、文書属性の編集履歴を
反映した文書群の分類を実行することができる。
>本発明の文書処理装置は、図17に上げたようなネッ
トワーク接続されたコンピュータシステムによっても実
現することができる。すなわち、利用者のクライアント
200と文書データを管理しているサーバ300とがネ
ットワーク9を介して接続している。クライアント20
0とサーバ300とは、必要であればそれぞれ複数台が
接続されていて良い。このネットワーク9は、これらの
利用者のクライアント200とサーバ300とを結合す
るための伝送路であって、一般には、ケーブルで実現さ
れ、通信プロトコルにはTCP/IPが使われる。但
し、伝送路としてはケーブルだけではなく、それらの間
の通信プロトコルが一致するものであれば無線LANや
放送波を使ったものであっても良い。これらクライアン
ト200とサーバ300は、汎用的なコンピュータによ
って構成される。すなわち、入力装置1はキーボード、
マウス、タッチパネル、スキャナ等により構成され、情
報の入力に使用される。出力装置2は、種々の出力情報
や入力装置1からの入力された情報などを出力させるデ
ィスプレイやプリンタで構成される。CPU(Cent
ral Processing Unit;中央処理ユ
ニット)3は、種々のプログラムを動作させる。メモリ
4は、プログラム自身を保持し、またそのプログラムが
CPU3によって実行されるときに一時的に作成される
情報等を保持する。記憶装置5は、データ、プログラム
やプログラム実行時の一時的な情報等を保持する。
を記憶した記録媒体を装着してそれらを読み込み、メモ
リ4または記憶装置5へ格納するのに用いられる。ま
た、直接データの入出力やプログラム実行するのに使っ
てもよい。ネットワーク接続装置7は、クライアント2
00やサーバ300をネットワーク9へ接続するための
インタフェースである。バス8は、上記各部を接続す
る。このようなコンピュータにおいて、図1に示したク
ライアント200を構成する各機能やサーバ300の文
書蓄積部150、文書属性蓄積部160や文書属性編集
履歴蓄積部170を管理する機能をそれぞれプログラム
化し、予めCD−ROM等の記録媒体に書き込んでお
き、このCD−ROMをクライアント200やサーバ3
00のCD−ROMドライブのような媒体駆動装置6に
装着して、プログラムをメモリ4あるいは記憶装置5に
格納し、それを実行することによって、上記の実施の形
態の機能を実現することができる。なお、記録媒体とし
ては半導体媒体(例えば、ROM、ICメモリカード
等)、光媒体(例えば、DVD−ROM,MO,MD,
CD−R等)、磁気媒体(例えば、磁気テープ、フレキ
シブルディスク等)のいずれであってもよい。また、本
発明の文書処理装置の機能を実現するプログラムは、媒
体の形で頒布することができる。また、本発明の文書処
理装置の機能を実現するプログラムを磁気ディスク等の
記憶装置に格納しておき、有線又は無線の通信ネットワ
ークによりダウンロード等の形式で頒布したり、放送波
によって配布したりすることで提供することもできる。
文書の属性の名称、属性に含まれるデータ項目の名称や
データ型等の変更があった場合にも、変更前後の属性を
用いて検索や分類が行えるので、利用者が文書の属性等
の変更を自分で管理する労力を軽減することができる。
の構成を説明するブロック図である。
る。
ある。
ある。
る。
るときの概念図である。
る。
定するときの例を示す図である。
ある。
ある。
る。
を説明するためのフローチャートである。
を説明するためのフローチャートである。
である。
である。
ントおよびサーバを実現するためのコンピュータハード
ウェアを示す構成図である。
Claims (12)
- 【請求項1】 少なくとも複数のデータ項目とそのデー
タ型とからなる属性を保持する文書属性蓄積部と、前記
属性を付与された文書を複数の文書を保持する文書蓄積
部と、前記文書属性蓄積部に保持された属性を編集し、
その編集履歴を保持する文書属性編集履歴蓄積部と、前
記文書蓄積部に保持した文書を分析するときに、前記属
性とこの属性の持つ情報に対して前記文書属性編集履歴
蓄積部を検索し、編集履歴を得てから分析を行う分析処
理実行部とを備えたことを特徴とする文書処理装置。 - 【請求項2】 請求項1に記載の文書処理装置におい
て、前記分析実行部は、前記文書蓄積部の文書を検索す
るために指定された検索条件中に前記属性が存在すると
き、前記文書属性編集履歴蓄積部および前記文書属性蓄
積部とを参照して得たその属性の編集履歴に基づいて検
索条件を拡張して検索するようにしたことを特徴とする
文書処理装置。 - 【請求項3】 請求項1に記載の文書処理装置におい
て、前記分析実行部は、前記文書属性編集履歴蓄積部お
よび前記文書属性蓄積部とを参照して得た属性の編集履
歴に基づいて分類を行うことを特徴とする文書処理装
置。 - 【請求項4】 少なくとも複数のデータ項目とそのデー
タ型とからなる属性を保持する文書属性蓄積部と、前記
属性を付与された文書を複数の文書を保持する文書蓄積
部と、前記文書属性蓄積部に保持された前記属性を編集
し、その編集履歴を保持する文書属性編集履歴蓄積部
と、入力された検索条件に適合する文書を前記文書蓄積
部から検索する分析処理実行部とを備え、前記分析実行
部は、入力された検索条件中に前記属性を用いた検索要
求がなされたとき、前記文書属性編集履歴蓄積部および
前記文書属性蓄積部とを参照してこの属性に対する編集
履歴を得て、入力された検索条件を拡張することを特徴
とする文書処理装置。 - 【請求項5】 少なくとも複数のデータ項目とそのデー
タ型とからなる属性を保持する文書属性蓄積部と、前記
属性を付与された文書を複数の文書を保持する文書蓄積
部と、前記文書属性蓄積部に保持された前記属性を編集
し、その編集履歴を保持する文書属性編集履歴蓄積部
と、前記文書属性蓄積部と前記文書属性編集履歴蓄積部
とを参照して前記属性の編集履歴を得て、これらの属性
に関する情報を基に前記文書蓄積部に保持された文書を
分類する分析処理実行部とを備えたことを特徴とする文
書処理装置。 - 【請求項6】 文書属性蓄積部に少なくとも複数のデー
タ項目とそのデータ型とからなる属性を保持し、文書蓄
積部に前記属性を付与された文書を複数の文書を保持
し、前記文書蓄積部に保持した文書を分析するときに、
前記属性とこの属性の持つ情報に対してこの属性を編集
した編集履歴を得てから分析を行うことを特徴とする文
書処理方法。 - 【請求項7】 文書属性蓄積部に少なくとも複数のデー
タ項目とそのデータ型とからなる属性を保持し、文書蓄
積部に前記属性を付与された文書を複数の文書を保持
し、文書属性編集履歴蓄積部に前記属性を編集したとき
の編集履歴を保持して、入力された検索条件中に前記属
性を用いた検索要求がなされたとき、前記文書属性編集
履歴蓄積部および前記文書属性蓄積部とを参照してこの
属性に対する編集履歴を得て、入力された検索条件を拡
張して、この検索条件に適合する文書を前記文書蓄積部
から検索することを特徴とする文書処理方法。 - 【請求項8】 文書属性蓄積部に少なくとも複数のデー
タ項目とそのデータ型とからなる属性を保持し、文書蓄
積部に前記属性を付与された文書を複数の文書を保持
し、文書属性編集履歴蓄積部に前記属性を編集した編集
履歴を保持して、 前記文書属性蓄積部と前記文書属性編集履歴蓄積部とを
参照して前記属性の編集履歴を得て、これらの属性に関
する情報を基に前記文書蓄積部に保持された文書を分類
することを特徴とする文書処理方法。 - 【請求項9】 コンピュータを、少なくとも複数のデー
タ項目とそのデータ型とからなる属性を保持する文書属
性蓄積部と、前記属性を付与された文書を複数の文書を
保持する文書蓄積部と、前記文書属性蓄積部に保持され
た前記属性を編集し、その編集履歴を保持する文書属性
編集履歴蓄積部と、入力された検索条件に適合する文書
を前記文書蓄積部から検索する分析処理実行部とを備
え、前記分析実行部は、入力された検索条件中に前記属
性を用いた検索要求がなされたとき、前記文書属性編集
履歴蓄積部および前記文書属性蓄積部とを参照してこの
属性に対する編集履歴を得て、入力された検索条件を拡
張してから文書を検索する機能させるプログラム。 - 【請求項10】 コンピュータを、少なくとも複数のデ
ータ項目とそのデータ型とからなる属性を保持する文書
属性蓄積部と、前記属性を付与された文書を複数の文書
を保持する文書蓄積部と、前記文書属性蓄積部に保持さ
れた前記属性を編集し、その編集履歴を保持する文書属
性編集履歴蓄積部と、前記文書属性蓄積部と前記文書属
性編集履歴蓄積部とを参照して前記属性の編集履歴を得
て、これらの属性に関する情報を基に前記文書蓄積部に
保持された文書を分類する分析処理実行部とを備え、文
書群を前記属性に関する情報によって分類する機能を実
現させるプログラム。 - 【請求項11】 コンピュータを文書処理装置として機
能させるためのプログラムを記録した記録媒体であっ
て、少なくとも複数のデータ項目とそのデータ型とから
なる属性を保持する文書属性蓄積部と、前記属性を付与
された文書を複数の文書を保持する文書蓄積部と、前記
文書属性蓄積部に保持された前記属性を編集し、その編
集履歴を保持する文書属性編集履歴蓄積部と、入力され
た検索条件に適合する文書を前記文書蓄積部から検索す
る分析処理実行部とを備え、前記分析実行部は、入力さ
れた検索条件中に前記属性を用いた検索要求がなされた
とき、前記文書属性編集履歴蓄積部および前記文書属性
蓄積部とを参照してこの属性に対する編集履歴を得て、
入力された検索条件を拡張してから文書を検索する機能
を実現するためのプログラムを記録したことを特徴とす
るコンピュータ読み取り可能な記録媒体。 - 【請求項12】 コンピュータを文書処理装置として機
能させるためのプログラムを記録した記録媒体であっ
て、少なくとも複数のデータ項目とそのデータ型とから
なる属性を保持する文書属性蓄積部と、前記属性を付与
された文書を複数の文書を保持する文書蓄積部と、前記
文書属性蓄積部に保持された前記属性を編集し、その編
集履歴を保持する文書属性編集履歴蓄積部と、前記文書
属性蓄積部と前記文書属性編集履歴蓄積部とを参照して
前記属性の編集履歴を得て、これらの属性に関する情報
を基に前記文書蓄積部に保持された文書を分類する分析
処理実行部とを備え、文書群を前記属性に関する情報に
よって分類する機能を実現するためのプログラムを記録
したことを特徴とするコンピュータ読み取り可能な記録
媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001037762A JP4253134B2 (ja) | 2001-02-14 | 2001-02-14 | 文書処理装置、文書処理方法、プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001037762A JP4253134B2 (ja) | 2001-02-14 | 2001-02-14 | 文書処理装置、文書処理方法、プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002245065A true JP2002245065A (ja) | 2002-08-30 |
JP4253134B2 JP4253134B2 (ja) | 2009-04-08 |
Family
ID=18900842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001037762A Expired - Fee Related JP4253134B2 (ja) | 2001-02-14 | 2001-02-14 | 文書処理装置、文書処理方法、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4253134B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006301846A (ja) * | 2005-04-19 | 2006-11-02 | Keyence Corp | ユーザプログラム用検索装置及びこれに適用されるプログラム |
JP2009017592A (ja) * | 2003-03-10 | 2009-01-22 | Ricoh Co Ltd | 画像形成装置及び文書管理システム |
WO2012161236A1 (ja) * | 2011-05-26 | 2012-11-29 | 日本電気株式会社 | 検索システム、検索方法及び検索プログラム |
JP2020057195A (ja) * | 2018-10-02 | 2020-04-09 | テクマトリックス株式会社 | 要約生成サーバ、要約生成システム及び要約生成方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0567155A (ja) * | 1991-09-09 | 1993-03-19 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置 |
JPH0728845A (ja) * | 1993-07-13 | 1995-01-31 | Canon Inc | 文書検索装置及びその方法 |
JPH1027180A (ja) * | 1996-07-12 | 1998-01-27 | Toshiba Corp | 文書検索システムおよび文書検索方法 |
JPH1115835A (ja) * | 1997-06-20 | 1999-01-22 | Fuji Xerox Co Ltd | 分類情報提示装置及び分類情報提示プログラムを記録した媒体 |
-
2001
- 2001-02-14 JP JP2001037762A patent/JP4253134B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0567155A (ja) * | 1991-09-09 | 1993-03-19 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置 |
JPH0728845A (ja) * | 1993-07-13 | 1995-01-31 | Canon Inc | 文書検索装置及びその方法 |
JPH1027180A (ja) * | 1996-07-12 | 1998-01-27 | Toshiba Corp | 文書検索システムおよび文書検索方法 |
JPH1115835A (ja) * | 1997-06-20 | 1999-01-22 | Fuji Xerox Co Ltd | 分類情報提示装置及び分類情報提示プログラムを記録した媒体 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009017592A (ja) * | 2003-03-10 | 2009-01-22 | Ricoh Co Ltd | 画像形成装置及び文書管理システム |
JP4527796B2 (ja) * | 2003-03-10 | 2010-08-18 | 株式会社リコー | 画像形成装置及び文書管理システム |
JP2006301846A (ja) * | 2005-04-19 | 2006-11-02 | Keyence Corp | ユーザプログラム用検索装置及びこれに適用されるプログラム |
JP4628169B2 (ja) * | 2005-04-19 | 2011-02-09 | 株式会社キーエンス | ユーザプログラム用検索装置及びこれに適用されるプログラム |
WO2012161236A1 (ja) * | 2011-05-26 | 2012-11-29 | 日本電気株式会社 | 検索システム、検索方法及び検索プログラム |
JP2020057195A (ja) * | 2018-10-02 | 2020-04-09 | テクマトリックス株式会社 | 要約生成サーバ、要約生成システム及び要約生成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4253134B2 (ja) | 2009-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4308587B2 (ja) | 文書群管理装置 | |
US7668888B2 (en) | Converting object structures for search engines | |
JP2001344276A (ja) | 文書検索方法および装置並びにその処理プログラムを記録した記録媒体 | |
US20060195426A1 (en) | Information management apparatus, information management method, and information management program | |
WO2002046921A1 (fr) | Procede et dispositif pour l'analyse de sequences | |
US8145580B2 (en) | Data management apparatus and method for managing data elements using a plurality of metadata elements | |
US20060173755A1 (en) | Catalog management apparatus, catalog generation method and catalog retrieval method | |
US20080140608A1 (en) | Information Managing Apparatus, Method, and Program | |
US20030055672A1 (en) | Method of defining functional configuration of business application system | |
JP4253134B2 (ja) | 文書処理装置、文書処理方法、プログラムおよび記録媒体 | |
JP3933407B2 (ja) | 文書処理装置、文書処理方法および文書処理プログラムが格納された記憶媒体 | |
JP2001056809A (ja) | 文書管理システム | |
JP2006048521A (ja) | 文書検索装置及びその制御方法、並びに制御プログラム | |
JP4624870B2 (ja) | デモ作成システム | |
JP2002041289A (ja) | 成果物管理方法及びシステム | |
JP2001147922A (ja) | 文書管理装置、文書管理方法および記憶媒体 | |
JPH05257765A (ja) | データベース管理システム | |
JP2007025831A (ja) | コンテンツ検索装置及びその方法 | |
JP2000076358A (ja) | 再出力機能付き帳票出力管理システム及び方法 | |
JP2003122608A (ja) | データファイリングシステム及びデータファイリング用コンピュータプログラム | |
JP2003173343A (ja) | 文書管理装置及び文書表示方法 | |
JP4988441B2 (ja) | 検索プログラム、検索方法および検索装置 | |
JP2004126838A (ja) | 文書作成支援方法 | |
JP2000163495A (ja) | ワークフロー処理方法及びその実施装置並びにその処理プログラムを記録した媒体 | |
JP2001067224A (ja) | オントロジ構築装置およびオントロジ構築プログラム記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050124 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050225 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080304 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080507 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080610 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080808 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080916 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081016 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090120 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090123 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120130 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130130 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140130 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |