JPH05307570A - 文書管理装置 - Google Patents

文書管理装置

Info

Publication number
JPH05307570A
JPH05307570A JP4110971A JP11097192A JPH05307570A JP H05307570 A JPH05307570 A JP H05307570A JP 4110971 A JP4110971 A JP 4110971A JP 11097192 A JP11097192 A JP 11097192A JP H05307570 A JPH05307570 A JP H05307570A
Authority
JP
Japan
Prior art keywords
document management
document
unit
keyword
morphological analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4110971A
Other languages
English (en)
Inventor
Yasutsugu Ogawa
泰嗣 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP4110971A priority Critical patent/JPH05307570A/ja
Publication of JPH05307570A publication Critical patent/JPH05307570A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 形態素解析に基づくキーワード付与の自動化
技術を文書管理装置に採り入れ、分散処理環境下での文
書管理の効率化を図ることが可能な文書管理装置を提供
する。 【構成】 形態素解析を行う解析処理手段3と、解析処
理に必要な形態素解析辞書5の辞書引きを行う辞書管理
手段4とを備えた形態素解析部1を設け、登録文書に対
応するキーワードを形態素解析結果をもとに自動設定す
るキーワード抽出手段6と、ユーザが入力した検索条件
を形態素解析結果をもとに解釈する文書検索手段7と、
書誌情報及びキーワード抽出手段6で設定されたキーワ
ードを適切な形式でデータファイルに保存する文書デー
タ管理手段8と、ユーザとの対話を行うユーザインター
フェース手段9とを備えた文書管理部2を設けた。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ワードプロセッサ、或
いは、コンピュータ上で作成された電子化されている文
書を効率的に管理する文書管理装置に関する。
【0002】
【従来の技術】近年、自然言語処理技術の発達に伴い、
キーワード付与作業の自動化の研究も進んでいる。この
キーワード付与の自動化の方法としては、例えば、文書
中の単語の品詞からキーワードを判定するものがある。
この方式では、文書を単語に区切り、その品詞を判定す
る形態素解析処理が必要不可欠となっている。従来にお
けるキーワード抽出技術に関する例としては、特開昭5
7−137965号公報に「漢字かな混り文からのキー
ワード自動抽出方式」なるタイトルで開示されているも
のがある。
【0003】
【発明が解決しようとする課題】従来の文書管理装置で
は、文書を文書内容を表現する上述したようなキーワー
ドを用いて管理を行っている。しかし、従来におけるキ
ーワードの設定方法は、人手による場合が多く、文書管
理を困難にしている。
【0004】また、最近のLAN(構内情報通信網)の
発達に伴い、文書管理の分散処理化が望まれるようにな
っている。しかし、従来のキーワード付与における形態
素解析を行うには、大規模な辞書を必要とするため、複
数の文書管理装置を同時に使用する場合、各文書管理装
置が辞書を持っているのは不経済である。
【0005】
【課題を解決するための手段】請求項1記載の発明で
は、形態素解析を行う解析処理手段と、解析処理に必要
な形態素解析辞書の辞書引きを行う辞書管理手段とを備
えた形態素解析部を設け、登録文書に対応するキーワー
ドを形態素解析結果をもとに自動設定するキーワード抽
出手段と、ユーザが入力した検索条件を形態素解析結果
をもとに解釈する文書検索手段と、書誌情報及び前記キ
ーワード抽出手段で設定されたキーワードを適切な形式
でデータファイルに保存する文書データ管理手段と、ユ
ーザとの対話を行うユーザインターフェース手段とを備
えた文書管理部を設けた。
【0006】請求項2記載の発明では、請求項1記載の
発明において、形態素解析部と、文書管理部とを備えた
メイン文書管理装置を設け、文書管理部のみを備えたサ
ブ文書管理装置を設けた。
【0007】請求項3記載の発明では、請求項1記載の
発明において、形態素解析部のみを備えた形態素解析サ
ーバーを設け、文書管理部のみを備えたサブ文書管理装
置を設けた。
【0008】
【作用】請求項1記載の発明では、形態素解析部によっ
て文書を単語に区切り、各単語の品詞を決定することに
よって、文書の登録/検索の自動化、すなわち、形態素
解析に基づくキーワード付与の自動化を文書管理装置に
採り入れることが可能となる。
【0009】請求項2又は3記載の発明では、LANを
用いた分散環境下で複数の文書管理装置を使用する場
合、形態素解析部を複数の文書管理装置で共用して用い
ることによって、分散処理環境下での文書管理の効率化
を図ることが可能となる。
【0010】
【実施例】請求項1記載の発明の一実施例を図1に基づ
いて説明する。本装置である文書管理装置は、形態素解
析部1と、文書管理部2とからなっている。まず、前者
の形態素解析部1について述べる。この形態素解析部1
は、解析処理手段としての解析処理部3と、辞書管理手
段としての辞書管理部4とからなる。
【0011】前記解析処理部3は、形態素解析を行う。
また、前記辞書管理部4は、解析処理に必要な形態素解
析辞書5(単語の表記と品詞とが入っている)の辞書引
き、及び、辞書データの管理を行う。
【0012】次に、後者の文書管理部2について述べ
る。この文書管理部2は、キーワード抽出手段としての
キーワード抽出部6と、文書検索手段としての文書検索
部7と、文書データ管理手段としての文書データ管理部
8と、ユーザインターフェイス手段としてのユーザイン
ターフェイス部9とからなる。
【0013】前記キーワード抽出部6は、登録文書に対
して適切なキーワードを自動的に設定する。このキーワ
ードは以下のようにして設定される。登録文書を形態素
解析部1で形態素解析し、名詞と判断された単語をキー
ワードとする。
【0014】前記文書データ管理部8には、キーワード
ファイル8aと、書誌情報データファイル8bと、文書
データファイル8cとが接続されており、文書、それに
付随して与えられた書誌情報(文書のタイトル、著者、
作成年月日などのデータ)及び前記キーワード抽出部6
で設定されたキーワードを適切な形式でデータファイル
に保存する。
【0015】前記文書検索部7は、外部から与えられる
検索条件に対する検索処理を実行する。検索条件を解析
し、書誌情報に関する条件と、キーワードに関する条件
とに分離する。本装置では、キーワードに関する条件と
して自然文を受け付ける。すなわち、検索条件は「文書
管理」のような名詞だけで構成される必要はなく、「文
書管理のための装置」のような名詞と、それ以外の品詞
から構成される日常会話で用いられる文をそのまま検索
条件として用いることができる。キーワードに関する条
件は、前記キーワード抽出部6の動作と同様、前記形態
素解析部1で形態素解析し、名詞と判断された単語を検
索用のキーワードとする。この結果のキーワードを用い
て、検索条件に一致する文書が検索される。
【0016】前記ユーザインターフェイス部9は、キー
ボード、マウス、ディスプレイなどを制御し、ユーザと
の対話処理を行う。ユーザは、キーボード等を用いて検
索要求を入力し、ディスプレイを通して検索結果を確認
する。
【0017】次に、キーワード抽出についてさらに詳し
く説明する。キーワード抽出は、以下の(1)〜(3)
の3つのステップ (1)形態素解析 (2)品詞による単語の選択 (3)連続する単語の融合 で行う。
【0018】本装置では、(2)では名詞と判定された
単語をキーワード候補として抽出する。(3)では名詞
が連続して出現した場合、それらの単語をまとめて1つ
のキーワードとする。キーワードを抽出する対象文を
「文書管理システムにおけるキーワード抽出処理」とし
て、各ステップを例示する。
【0019】
【表1】
【0020】この場合、一段目の欄が、形態素解析結果
を示す。本装置では、形態素解析部1が解析を行う。二
段目の欄が、単語の判定結果を示す。キーワード可能性
の欄が“〇”の品詞に属する単語がキーワード候補であ
る。三段目の欄が、抽出されたキーワードを示す。連続
するキーワード候補はまとめて1つのキーワードとして
おり、「文書管理システム」と「キーワード抽出処理」
の2つのキーワードが得られる。
【0021】上述したように、形態素解析部1によって
文書を単語に区切り、各単語の品詞を決定することがで
きるため、文書の登録/検索の自動化を図り、形態素解
析に基づくキーワード付与の自動化技術を文書管理装置
に採り入れることが可能となる。従って、これによりユ
ーザの文書管理の効率化を図ることができる。
【0022】次に、請求項2記載の発明の一実施例を図
2に基づいて説明する。なお、請求項1記載の発明の実
施例(図1参照)と同一部分についての説明は省略し、
その同一部分については同一符号を用いる。
【0023】本実施例における文書管理装置は、メイン
文書管理装置10と、サブ文書管理装置11a,11b
とからなっている。この場合、前記メイン文書管理装置
10は、形態素解析部1と、文書管理部2とを備えてい
る。また、前記サブ文書管理装置11a,11bは、文
書管理部2のみを備えている。
【0024】前記メイン文書管理装置10の構成は前述
した図1と同じであり、各部の動作もほぼ同じである。
図1との相異点は、解析処理部3に対する解析要求がメ
イン文書管理装置10に含まれる文書管理部2からのみ
来るだけではなく、LAN12を介して、サブ文書管理
装置11a,11bの文書管理部2からも来る点にあ
る。
【0025】前記サブ文書管理装置11a,11bの構
成は図1の文書管理装置から形態素解析部1を取り除い
て文書管理部2だけとしたものに等しく、各部の動作も
ほぼ同じである。図1との唯一の相異点は、キーワード
抽出部6及び文書検索部7が形態素解析要求を出す相手
が、メイン文書管理装置10の文書管理部2にある点で
ある。
【0026】上述したように、LAN12を用いた分散
環境下で複数の文書管理装置10,11a,11bを使
用する場合、形態素解析部1を複数の文書管理装置1
0,11a,11bで共用して用いることにより、記憶
装置などの計算機資源の有効利用が可能となる。従っ
て、このようなことから、分散処理環境下での文書管理
の効率化を図ることができる。
【0027】次に、請求項3記載の発明の一実施例を図
3に基づいて説明する。なお、請求項1,2記載の発明
の実施例(図1,2参照)と同一部分についての説明は
省略し、その同一部分については同一符号を用いる。
【0028】本実施例における文書管理装置は、形態素
解析サーバー13と、サブ文書管理装置11a,11b
とからなっている。この場合、形態素解析サーバー13
は、形態素解析部1のみを備えている。また、サブ文書
管理装置11a,11bは、文書管理部2のみを備えて
いる。
【0029】前記形態素解析サーバー13の構成は図1
の文書管理装置から文書管理部2のみを取り除いて形態
素解析部1とだけしたものであり、各部の動作は図2の
メイン文書管理装置10の形態素解析部1と同様にして
行うことができる。すなわち、LAN12を介して、サ
ブ文書管理装置11a,11bの文書管理部2から来る
解析要求を処理する。なお、サブ文書管理装置11a,
11bは、図2の構成、動作と全く同様に考えることが
できる。
【0030】本実施例の場合も、前述した請求項2記載
の発明の実施例の場合と同様に、LAN12を用いた分
散環境下で、複数の文書管理装置10,11a,11b
を使用する場合、形態素解析部1を共有しているため、
文書管理の効率化を図ることができる。
【0031】
【発明の効果】請求項1記載の発明は、形態素解析を行
う解析処理手段と、解析処理に必要な形態素解析辞書の
辞書引きを行う辞書管理手段とを備えた形態素解析部を
設け、登録文書に対応するキーワードを形態素解析結果
をもとに自動設定するキーワード抽出手段と、ユーザが
入力した検索条件を形態素解析結果をもとに解釈する文
書検索手段と、書誌情報及び前記キーワード抽出手段で
設定されたキーワードを適切な形式でデータファイルに
保存する文書データ管理手段と、ユーザとの対話を行う
ユーザインターフェース手段とを備えた文書管理部を設
けたので、このように形態素解析部により文書を単語に
区切り、各単語の品詞を決定することによって文書の登
録/検索の自動化を図ることができ、これにより、形態
素解析に基づくキーワード付与の自動化を文書管理装置
に採り入れることができるものである。
【0032】請求項2記載の発明は、請求項1記載の発
明において、形態素解析部と、文書管理部とを備えたメ
イン文書管理装置を設け、文書管理部のみを備えたサブ
文書管理装置を設けたので、LANを用いた分散環境下
で複数の文書管理装置を使用する場合、形態素解析部を
複数の文書管理装置で共用して用いることによって、分
散処理環境下での文書管理の効率化を図ることが可能と
なり、これにより記憶装置などの計算機資源の有効利用
を図ることができるものである。
【0033】請求項3記載の発明は、請求項1記載の発
明において、形態素解析部のみを備えた形態素解析サー
バーを設け、文書管理部のみを備えたサブ文書管理装置
を設けたので、請求項2記載の発明と同様の効果を得る
ことができるものである。
【図面の簡単な説明】
【図1】請求項1記載の発明の一実施例を示すブロック
図である。
【図2】請求項2記載の発明の一実施例を示すブロック
図である。
【図3】請求項3記載の発明の一実施例を示すブロック
図である。
【符号の説明】
1 形態素解析部 2 文書管理部 3 解析処理手段 4 辞書管理手段 5 形態素解析辞書 6 キーワード抽出手段 7 文書検索手段 8 文書データ管理手段 9 ユーザインターフェース手段 10 メイン文書管理装置 11a,11b サブ文書管理装置 13 形態素解析サーバー

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 形態素解析を行う解析処理手段と解析処
    理に必要な形態素解析辞書の辞書引きを行う辞書管理手
    段とを備えた形態素解析部と、登録文書に対応するキー
    ワードを形態素解析結果をもとに自動設定するキーワー
    ド抽出手段とユーザが入力した検索条件を形態素解析結
    果をもとに解釈する文書検索手段と書誌情報及び前記キ
    ーワード抽出手段で設定されたキーワードを適切な形式
    でデータファイルに保存する文書データ管理手段とユー
    ザとの対話を行うユーザインターフェース手段とを備え
    た文書管理部とよりなることを特徴とする文書管理装
    置。
  2. 【請求項2】 形態素解析部と、文書管理部とを備えた
    メイン文書管理装置と、文書管理部のみを備えたサブ文
    書管理装置とよりなることを特徴とする請求項1記載の
    文書管理装置。
  3. 【請求項3】 形態素解析部のみを備えた形態素解析サ
    ーバーと、文書管理部のみを備えたサブ文書管理装置と
    よりなることを特徴とする請求項1記載の文書管理装
    置。
JP4110971A 1992-04-30 1992-04-30 文書管理装置 Pending JPH05307570A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4110971A JPH05307570A (ja) 1992-04-30 1992-04-30 文書管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4110971A JPH05307570A (ja) 1992-04-30 1992-04-30 文書管理装置

Publications (1)

Publication Number Publication Date
JPH05307570A true JPH05307570A (ja) 1993-11-19

Family

ID=14549146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4110971A Pending JPH05307570A (ja) 1992-04-30 1992-04-30 文書管理装置

Country Status (1)

Country Link
JP (1) JPH05307570A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020110830A1 (ja) * 2018-11-26 2020-06-04 ソニー株式会社 情報処理装置および情報処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020110830A1 (ja) * 2018-11-26 2020-06-04 ソニー株式会社 情報処理装置および情報処理方法

Similar Documents

Publication Publication Date Title
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
US6167370A (en) Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP2006004427A (ja) 日本語などの複雑言語のコンテンツを検索するシステム及び方法
JP2002197104A (ja) 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
JPH0567144A (ja) 前編集支援方法およびその装置
CN1492354A (zh) 多国文字信息搜索方法和多国文字信息搜索引擎系统
JPH1145274A (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3363501B2 (ja) テキスト検索装置
JP2000163441A (ja) 辞書作成方法及び装置及び辞書作成プログラムを格納した記憶媒体及び検索要求作成方法及び装置及び検索要求作成プログラムを格納した記憶媒体及び多言語対応情報検索システム
JPH05307570A (ja) 文書管理装置
JP2003296327A (ja) 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム
JP2838984B2 (ja) 汎用参照装置
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
Baisa et al. Turkic language support in Sketch Engine
JPS6175952A (ja) 文書入力処理方式
JP4262529B2 (ja) 全文検索装置、方法、プログラム及び記録媒体
JP4206266B2 (ja) 全文検索装置、処理方法、処理プログラム及び記録媒体
JPH0793345A (ja) 文書検索装置
JP2003228578A (ja) 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム
JP4368550B2 (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
JP2007233724A (ja) 文書検索システム、その方法及びプログラム
JPH0561902A (ja) 機械翻訳システム
JP2003022277A (ja) 文書検索装置及び文書検索方法
JP2003263458A (ja) テキスト分析方法及び装置