JPH09311805A - Document processing method and device therefor - Google Patents

Document processing method and device therefor

Info

Publication number
JPH09311805A
JPH09311805A JP8129899A JP12989996A JPH09311805A JP H09311805 A JPH09311805 A JP H09311805A JP 8129899 A JP8129899 A JP 8129899A JP 12989996 A JP12989996 A JP 12989996A JP H09311805 A JPH09311805 A JP H09311805A
Authority
JP
Japan
Prior art keywords
document
folder
unit
held
holding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8129899A
Other languages
Japanese (ja)
Inventor
Shiro Ito
史朗 伊藤
Shogo Shibata
昇吾 柴田
Takanari Ueda
隆也 上田
Yuji Ikeda
裕治 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP8129899A priority Critical patent/JPH09311805A/en
Priority to US08/863,047 priority patent/US20030061221A1/en
Publication of JPH09311805A publication Critical patent/JPH09311805A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To manage documents from the viewpoint of users and also to easily collect and use the documents by analyzing a new document to judge a storage destination folder and informing user of this folder. SOLUTION: A storage candidate retrieval part 103 retrieves a folder that is suitable as the storage destination of the document held at a new document holding part 102. The candidates of storage destinations retrieved by the part 103 are held at a storage candidate holding part 104. Then a folder retrieval part 108 retrieves a folder that is held at a document holding part 101 based on the retrieval condition which is held at a retrieval condition holding part 107. The folder labels are displayed in order of holders held at the part 104, so that a user can easily select the storage destinations by looking at the periphery of the display head of the folder labels. The user also can select the folders to search for the documents and can effectively perform the data retrieval processing.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、例えば電子新聞、
電子出版、電子回覧などで用いられる電子化文書の収集
と収集した文書の管理を行なう文書処理装置に関するも
のである。
TECHNICAL FIELD The present invention relates to an electronic newspaper,
The present invention relates to a document processing device that collects digitized documents used in electronic publishing, electronic circulation, etc., and manages the collected documents.

【0002】[0002]

【従来の技術】近年、電子新聞、電子出版、電子回覧と
いった電子化文書による情報流通が広まってきている。
こうした文書を収集して管理するために文書処理装置が
用いられる。
2. Description of the Related Art In recent years, information distribution based on electronic documents such as electronic newspapers, electronic publishing, and electronic circulation has become widespread.
A document processing device is used to collect and manage such documents.

【0003】従来この種の文書処理装置では、新たに到
着した文書を列挙し、それらを利用者が閲覧して必要な
文書を収集する方法が採られている、収集した文書の保
存先としてはフォルダが用意され、利用者は列挙されて
いるフォルダから、保存先を選び、当該文書を保存する
方法が採られている。保存した文書を利用する場合に
は、列挙されている中からフォルダを選び、フォルダ中
の文書を利用する方法が採られている。ここで、フォル
ダを階層的に保持して、階層を辿ってフォルダを選べる
ようにする方法が採られることもある。
Conventionally, in this type of document processing apparatus, a method has been adopted in which newly arrived documents are enumerated, and a user browses them to collect necessary documents. Folders are prepared, and the user selects a save destination from the listed folders and saves the document. When using a saved document, a method of selecting a folder from the listed and using the document in the folder is adopted. Here, there may be a method in which folders are hierarchically held and the folders can be selected by tracing the hierarchy.

【0004】この文書処理装置を利用する場合、利用者
は自らの視点からみて関連する文書を同一のフォルダに
入れて保存し、利用時に自らの視点に沿ってフォルダを
選択し、所望の文書を利用することになる。
When using this document processing apparatus, the user puts related documents in the same folder from the viewpoint of his / her own, saves them, selects a folder according to his / her own viewpoint at the time of use, and selects a desired document. Will be used.

【0005】フォルダを利用せずに収集した文書を管理
する文書処理装置としては、文書の属性を用いて検索を
行なうデータベースマネージメントシステムや文書にキ
ーワードを付与して検索を行なう情報検索システム、あ
るいは文書の本文中の検索語の有無を調べて検索を行な
う全文検索システムなどがある。
As a document processing apparatus for managing collected documents without using folders, a database management system for performing a search using the attributes of a document, an information search system for performing a search by adding a keyword to a document, or a document There is a full-text search system that searches for the presence or absence of search words in the text of.

【0006】[0006]

【発明が解決する課題】しかしながら、上記従来例の装
置では、収集時に保存先のフォルダを探すことや、利用
時に適切なフオルダを探すことが困難となり文書の収集
および利用の効率が低下するという問題点がある。こう
した現象は、一つにはフォルダが多数になる場合に起き
る、フォルダが多数になった場合、列挙されたフォルダ
を一覧して適切なフォルダを探し出すことは困難にな
る、フォルダを階層的に保持することで、この問題点は
ある程度緩和されるが、利用者の視点は時間推移と共に
変化することが多く、以前に作成した階層構造がその後
の視点に合わなくなって、階層を辿ることが難しくな
り、フォルダを探し出すことが困難になる、あるいは、
あるフォルダを最後に利用してから時間が相当に経過し
ている場合には、そのフォルダが何であったか、あるい
はそのフォルダの存在そのものを利用者が忘れているこ
とが多い、こうした場合も、フォルダを探すことが困難
になる。フォルダを探すことが困難になると、収集時に
おいては、フォルダ数を少なく抑えたり、不適当なフォ
ルダに入れたり、複数のフォルダに保存することを減ら
したり、保存を止めたりすることになる。こうした場
合、フォルダが視点を正しく反映しなくなり、利用時に
フォルダから所望の文書を探すのが困難になるという問
題点も生じる。
However, in the above-mentioned conventional apparatus, it is difficult to find a save destination folder at the time of collection, and it is difficult to find an appropriate folder at the time of use, which reduces the efficiency of document collection and use. There is a point. This phenomenon occurs when there are many folders, when there are many folders, it becomes difficult to list the listed folders to find an appropriate folder, and hold folders hierarchically. By doing so, this problem is alleviated to some extent, but the user's viewpoint often changes over time, and the hierarchical structure created earlier does not match the subsequent viewpoint, making it difficult to trace the hierarchy. , It becomes difficult to find the folder, or
If a certain amount of time has passed since a folder was last used, the user often forgets what the folder was or the existence of the folder itself. It will be difficult to find. When it becomes difficult to find a folder, at the time of collection, the number of folders may be kept small, put in an inappropriate folder, saved in a plurality of folders, or saved. In such a case, the folder does not correctly reflect the viewpoint, and it becomes difficult to search for a desired document from the folder at the time of use.

【0007】一方、データベースマネージメントシステ
ムや情報検索システムなどを使って文書を管理しようと
すると、文書の収集時に属性値やキーワードなどを付与
する必要があり、収集時の負荷が高い。この種の文書処
理装置は、個人が日常的に用いることが多いので、収集
時の負荷が高いことは問題である。
On the other hand, when trying to manage a document by using a database management system or an information retrieval system, it is necessary to add an attribute value, a keyword, etc. at the time of collecting the document, and the load at the time of collecting is high. Since this type of document processing device is often used by an individual on a daily basis, a high load at the time of collection is a problem.

【0008】文書に予め付与されている属性やキーワー
ドだけを用いてデータベースマネージメントシステムや
情報検索システムを利用したり、全文検索システムを利
用して文書を管理する方法では、利用者の視点に沿った
検索が困難になるという問題点がある。
In a method of using a database management system or an information search system by using only attributes and keywords previously given to a document, or a method of managing a document by using a full-text search system, the method is based on the viewpoint of the user. There is a problem that it becomes difficult to search.

【0009】本発明は上記の問題に鑑みてなされたもの
であり、利用者の視点に沿って文書を管理するととも
に、文書の収集と利用を容易に行なうことを可能とする
文書処理方法及び装置を提供することを目的とする。
The present invention has been made in view of the above problems, and manages documents from the user's point of view, and a document processing method and apparatus that can easily collect and use the documents. The purpose is to provide.

【0010】[0010]

【課題を解決する為の手段】上記課題を解決する為に、
本発明は好ましくはフォルダ及びフォルダに属する文書
を保持し、新規文書に適した保持先フォルダを、該新規
文書を解析することにより前記文書保持手段に保持され
ているフォルダより判定し、前記判定された保存先フォ
ルダを報知する文書処理方法及び装置を提供する。
Means for Solving the Problems To solve the above problems,
The present invention preferably holds a folder and a document belonging to the folder, and determines a holding folder suitable for a new document from the folders held in the document holding means by analyzing the new document, and the judgment is made. A document processing method and apparatus for notifying the storage destination folder are provided.

【0011】上記課題を解決する為に、本発明はフォル
ダ及びフォルダに属する文書を保持し、新規文書を保持
し、前記保持されている文書の保存先として適するフォ
ルダを検索し、前記検索された保存先の候補を出力し、
前記保持されている新規文書の保存先を選択し、前記新
規文書を前記選択された保存先のフォルダに属するよう
保持する文書処理方法及び装置を提供する。
In order to solve the above problems, the present invention holds a folder and a document belonging to the folder, holds a new document, searches a folder suitable as a storage destination of the held document, and searches the folder. Output the candidate of save destination,
A document processing method and apparatus for selecting a storage destination of the held new document and holding the new document so as to belong to the selected storage destination folder.

【0012】上記課題を解決する為に、本発明はフォル
ダ及びフォルダに属する文書を保持し、新規文書を保持
し、前記保持されている文書の保存先として適するフォ
ルダ毎に前記新規文書を分類し、前記分類された結果を
出力し、前記分類された結果の変更を指示し、前記新規
文書を前記変更された保存先のフォルダに属するよう保
持する文書処理方法及び装置を提供する。
In order to solve the above problems, the present invention holds folders and documents belonging to the folders, holds new documents, and classifies the new documents for each folder suitable as a storage destination of the held documents. Provided is a document processing method and apparatus for outputting the classified results, instructing a change of the classified results, and holding the new document so that the new document belongs to the changed save destination folder.

【0013】上記課題を解決する為に、本発明は好まし
くは前記分類結果出力手段により出力された分類結果を
削除することにより前記保存先の変更を指示する。
In order to solve the above problems, the present invention preferably instructs the change of the storage destination by deleting the classification result output by the classification result output means.

【0014】上記課題を解決する為に、本発明は好まし
くは新しいフォルダを作成する。
In order to solve the above problems, the present invention preferably creates a new folder.

【0015】上記課題を解決する為に、本発明は好まし
くは前記フォルダは、当該フォルダに属して保持されて
いる文書の文書特徴の代表値の情報を含む。
In order to solve the above-mentioned problems, the present invention preferably contains the information of the representative value of the document feature of the document held in the folder.

【0016】上記課題を解決する為に、本発明は好まし
くは前記文書特徴の代表値は、前記フォルダに属して保
持されている文書の文書特徴の平均値とする。
In order to solve the above-mentioned problems, the present invention preferably sets the representative value of the document characteristics to an average value of the document characteristics of the documents held in the folder.

【0017】上記課題を解決する為に、本発明は好まし
くは前記新規文書の文書特徴と、前記フォルダに含まれ
る文書特徴の代表値とを比較し、類似していると判定さ
れるフォルダを該新規文書の保存先として適すると判定
する。
In order to solve the above problems, the present invention preferably compares the document features of the new document with the representative values of the document features contained in the folder, and selects the folders determined to be similar to each other. It is determined that the new document is suitable for storage.

【0018】上記課題を解決する為に、本発明は好まし
くは前記文書の保存先として適するフォルタを複数判定
し、前記複数判定されたフォルダに関して前記分類を出
力する。
In order to solve the above-mentioned problems, the present invention preferably determines a plurality of folders suitable as the storage destination of the document, and outputs the classification with respect to the plurality of determined folders.

【0019】上記課題を解決する為に、本発明は好まし
くは前記分類結果出力手段は表示器とする。
In order to solve the above problems, in the present invention, the classification result output means is preferably a display.

【0020】上記課題を解決する為に、本発明は好まし
くは検索条件を保持し、前記保持されている検索条件に
従って、前記保持されているフォルダを検索し、前記検
索されたフォルダを報知する。
In order to solve the above problems, the present invention preferably retains search conditions, searches the retained folders according to the retained search conditions, and notifies the retrieved folders.

【0021】上記課題を解決する為に、本発明は好まし
くは前記フォルダの検索は、前記保持された検索条件に
一致する文書を保持しているフォルダを検索する。
In order to solve the above-mentioned problems, the present invention preferably searches the folder holding the document that matches the held search condition.

【0022】上記課題を解決する為に、本発明は好まし
くは前記検索条件は文字列とする。
In order to solve the above problems, the present invention preferably uses a character string as the search condition.

【0023】上記課題を解決する為に、本発明は好まし
くは前記検索結果は、検索されたフォルダの名称を報知
する。
In order to solve the above-mentioned problems, the present invention preferably reports the name of the searched folder as the search result.

【0024】上記課題を解決する為に、本発明は好まし
くは前記検索結果の報知は前記検索条件との一致スコア
が高い順に行なう。
In order to solve the above problems, the present invention preferably notifies the search results in the descending order of match score with the search condition.

【0025】[0025]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

【0026】図1は、本発明の一実施の形態に係る装置
の基本構成を示すブロック図である。
FIG. 1 is a block diagram showing the basic configuration of an apparatus according to an embodiment of the present invention.

【0027】同図において、101は、フォルダ及びフ
ォルダに属する文書を保持する文書保持部である。10
2は、新たに到着した文書を保持する新規文書保持部で
ある。103は新規文書保持部102に保持されている
文書の保存先として適するフォルダを検索する保存候補
検索部である。104は、保存候補検索部103により
検索された保存先の候補を保持する保存候補保持部であ
る。105は、保存候補保持部104に保持されている
保存候補の中から利用者により選択された保存先を保持
する保存先保持部である。106は、新規文書保持部1
02に保持されている文書を保存先保持部105に保持
されている保存先のフォルダに属するよう文書保持部1
01に保持する処理を行なう保存処理部である。107
は、フォルダに対する検索条件を保持する検索条件保持
部である。108は、検索条件保持部107に保持され
ている検索条件に従って、文書保持部101に保持され
ているフォルダを検索するフォルダ検索部である。10
9は、フォルダ検索部108により検索されたフォルダ
を保持する検索結果保持部である。
In the figure, reference numeral 101 denotes a document holding unit for holding a folder and a document belonging to the folder. 10
Reference numeral 2 denotes a new document holding unit that holds a newly arrived document. A storage candidate search unit 103 searches for a folder suitable as a storage destination of the document held in the new document holding unit 102. A storage candidate holding unit 104 holds the storage destination candidates searched by the storage candidate searching unit 103. Reference numeral 105 denotes a storage destination storage unit that stores the storage destination selected by the user from the storage candidates stored in the storage candidate storage unit 104. 106 is a new document holding unit 1
The document holding unit 1 so that the document held in 02 belongs to the save destination folder held in the save destination holding unit 105.
This is a storage processing unit that performs the processing of holding 01. 107
Is a search condition holding unit that holds search conditions for folders. Reference numeral 108 denotes a folder search unit that searches the folders held in the document holding unit 101 according to the search conditions held in the search condition holding unit 107. 10
Reference numeral 9 is a search result holding unit that holds the folders searched by the folder searching unit 108.

【0028】図2は、本実施例の文書処理装置の具体的
構成を示す図である。同図において、201はCPUで
あり、ROM203に保持されたプログラムに従って動
作する。
FIG. 2 is a diagram showing a specific configuration of the document processing apparatus of this embodiment. In the figure, 201 is a CPU, which operates according to a program stored in the ROM 203.

【0029】202はROMであり、新規文書保持部1
02と保存候補保持部104と保存先保持部105と検
索条件保持部107と検索結果保持部と上記プログラム
の動作に必要な記憶領域とを提供する。203はROM
であり、後述するフローチャートの手順を実現するプロ
グラムを保持する。204はディスク装置であり、文書
保持部101を実現する。205はバスである。206
は文字や画像等を表示し得る表示器であり、CRTや液
晶表示器等である。207はキーボードやポインティン
グデバイス等の入力手段である。
Reference numeral 202 denotes a ROM, which is a new document holding unit 1.
02, a storage candidate storage unit 104, a storage destination storage unit 105, a search condition storage unit 107, a search result storage unit, and a storage area required for the operation of the program. 203 is ROM
And holds a program that implements the procedure of the flowchart described below. A disk device 204 realizes the document holding unit 101. 205 is a bus. 206
Is a display capable of displaying characters and images, such as a CRT and a liquid crystal display. Reference numeral 207 is an input unit such as a keyboard or a pointing device.

【0030】本実施例では、文書保持部101は、文書
のリストとフォルダのリストを保持する構造になってい
る。文書dは次のようなデータから構成される。
In the present embodiment, the document holding unit 101 has a structure for holding a document list and a folder list. The document d is composed of the following data.

【0031】d=(t,v(d)) ここで、tは文書のテキストデータであり、v(d)は
ベクトル空間モデルに基づきテキストtの特徴を表現し
たベクトルである。また、フォルダfは次のようなデー
タから構成される。
D = (t, v (d)) where t is the text data of the document, and v (d) is a vector expressing the feature of the text t based on the vector space model. The folder f is composed of the following data.

【0032】f=(1,D,v(f)) ここで、1はラベルであり、利用者がフォルダを視認す
るための文字列であって、利用者がキーボード等の入力
手段207により入力したものや、或いは自動的に付加
されたものであっても良い。Dは、フォルダに保存され
る文書の集合であり、Dは空でもよい。vfは、そのフ
ォルダfに格納されている全ての文書dについてのベク
トルv(d)(d∈D)の平均をとったベクトルであ
る。以下、文書保持部101に保持されているフォルダ
の数をNで表す。新規文書保持部102は、一つの文書
を保持する構造になっている。保存候補保持部104及
び保存先保持部105及び検索結果保持部109は、フ
ォルダの番号を保持するリストとなっている。検索条件
保持部107は、検索語とその論理関係を示す検索式を
保持する構造になっている。
F = (1, D, v (f)) Here, 1 is a label, which is a character string for the user to visually recognize the folder, and is input by the user using the input means 207 such as a keyboard. It may be added or automatically added. D is a set of documents saved in the folder, and D may be empty. vf is a vector obtained by averaging vectors v (d) (dεD) for all documents d stored in the folder f. Hereinafter, the number of folders held in the document holding unit 101 is represented by N. The new document holding unit 102 has a structure for holding one document. The storage candidate holding unit 104, the storage destination holding unit 105, and the search result holding unit 109 are a list holding folder numbers. The search condition holding unit 107 has a structure for holding a search expression indicating a search word and its logical relationship.

【0033】以下、図3のフローチャートを参照して、
本実施の形態の文書処理装置における保存候補検索処理
の手順を説明する。
Hereinafter, with reference to the flowchart of FIG.
The procedure of the storage candidate search process in the document processing apparatus of this embodiment will be described.

【0034】ステップS301では、新規文書保持部1
02に新たに到着した文書のテキストt(n)が保持さ
れたか否かを調べ、文書が保持された場合はステップS
302に移る。保持されていない場合は、ステップS3
01を繰り返し、新たな文書のテキストtnが新規文書
保持部102に保持されるのを待つ。ここで新たな文書
のテキストt(n)は、ユーザの入力指示のタイミン
グ、或いはテキスト供給元からの自動供給のタイミング
で新規文書保持部102に到着する。
In step S301, the new document holding unit 1
It is checked whether the text t (n) of the document newly arrived at 02 is held, and if the document is held, step S
Moving on to 302. If not held, step S3
01 is repeated until the text tn of the new document is held in the new document holding unit 102. Here, the text t (n) of the new document arrives at the new document holding unit 102 at the timing of the user's input instruction or the timing of automatic supply from the text supplier.

【0035】ステップS302では、テキストt(n)
に対して特徴ベクトルv(dn )を作成し、t(n)と
共に新規文書保持部102に保持する。そして、ステッ
プS303に移る。
In step S302, the text t (n)
Then, a feature vector v (d n ) is created and stored in the new document storage unit 102 together with t (n). Then, the process proceeds to step S303.

【0036】ステップS303では文書保持部101に
保持されているフォルダの情報に順次アクセスするため
のフォルダ番号のカウンタxの値を初期値の1に設定す
る。そして、ステップS304に移る。
In step S303, the value of the folder number counter x for sequentially accessing the folder information held in the document holding unit 101 is set to an initial value of 1. Then, the process proceeds to step S304.

【0037】ステップS304では、S305〜S30
7の処理が文書保持部101に保持されている全てのフ
ォルダに対して行なわれたか判定すべく、カウンタxの
値と文書保持部101中のフォルダの数Nを比較し、x
≦NであればステップS305に移る。x>Nであれば
図3のフローチャートに示す保存候補検索処理を終了す
る。
In step S304, S305 to S30
The value of the counter x is compared with the number N of folders in the document holding unit 101 in order to determine whether the processing of 7 has been performed for all folders held in the document holding unit 101, and x
If ≦ N, the process moves to step S305. If x> N, the save candidate search process shown in the flowchart of FIG. 3 ends.

【0038】ステップS305では、文書保持部101
中のx番目のフォルダf(x)と新規文書d(n)に対
してスコアs=g(v(dn ),v(fx))を計算す
る。ここで、関数gは以下に示すものである。
In step S305, the document holding unit 101
X th folder f (x) as a new document d (n) with respect to the score s = g in (v (d n), v (fx)) is calculated. Here, the function g is shown below.

【0039】g(v(1),v(2))=(v(1)・
v(2))/(|v(1)||v(2)|) スコアSを求めた後ステップS306に移る。
G (v (1), v (2)) = (v (1) ·
v (2)) / (| v (1) || v (2) |) After obtaining the score S, the process proceeds to step S306.

【0040】ステップS306では、ステップS305
に求めたスコアsの昇順になるよう保存候補保持部10
4にS305でスコアを求めたフォルダの番号xをスコ
アSとともに保持する。そして、ステップS307に移
る。
In step S306, step S305
The storage candidate holding unit 10 is arranged in the ascending order of the scores s obtained in
The number x of the folder for which the score is obtained in S305 is held in S4 together with the score S. Then, the process proceeds to step S307.

【0041】ステップS307では、カウンタxの値を
1増やす。そして、ステップS304に戻る。
In step S307, the value of the counter x is incremented by 1. Then, the process returns to step S304.

【0042】図3のフローチャートにより説明した保存
候補検索処理により求められ、保存候補保持部104に
保持された保存先の候補フォルダに関する情報(フォル
ダのラベル等)は、表示器206に保持された順(スコ
アSの昇順)に新規文書保持部102に保持されている
文書を対応づけて表示し、ユーザに報知される。
The information (folder label, etc.) concerning the candidate folders of the save destinations, which are obtained by the save candidate search processing described with reference to the flowchart of FIG. The documents held in the new document holding unit 102 are displayed in association with each other (ascending order of the score S), and the user is notified.

【0043】尚、この表示器に表示するフォルダは、保
存候補保持部104に保持された全フォルダでも良い
し、或いはスコアSや個数Mにより選択される上位のフ
ォルダのみでも良い。
The folders displayed on this display may be all folders held in the storage candidate holding unit 104, or only upper folders selected by the score S and the number M.

【0044】次に、図4のフローチャートを参照して、
本実施の形態の文書処理装置における文書の保存処理の
手順を説明する。
Next, referring to the flowchart of FIG.
A procedure of document saving processing in the document processing apparatus according to the present embodiment will be described.

【0045】ステップS401では、保存先保持部10
5に保存先フォルダのリストFが保持されているか否か
を調べ、保持されている場合はステップS402に移
る。保持されていない場合は、ステップS401を繰り
返し、保存先保持部105にリストFが保持されるのを
待つ。このリストFは、ユーザによりキーボード等の入
力手段によって入力されるフォルダ列であり、ユーザは
保存候補保持部104に保持されたデータに基づいて報
知される保存先の候補フォルダ情報を考慮した上でリス
トFを入力する。
In step S401, the storage destination holding unit 10
It is checked whether or not the list F of save destination folders is held in 5, and if it is held, the process proceeds to step S402. If the list F is not held, the step S401 is repeated and the storage destination holding unit 105 waits until the list F is held. The list F is a sequence of folders input by the user with an input unit such as a keyboard, and the user considers candidate folder information of a save destination notified based on the data held in the save candidate holding unit 104. Enter list F.

【0046】ステップS402では、その時点でアクセ
スするフォルダがリストFの何番目のフォルダであるか
を示す。カウンタxの値を初期値の1に設定する。そし
て、ステップS403に移る。
At step S402, the number of the folder in the list F to be accessed at that time is shown. The value of the counter x is set to the initial value of 1. Then, the process proceeds to step S403.

【0047】ステップS403では、カウンタxの値と
保存先の個数|F|を比較し、x≦|F|であればステ
ップS404に移る。x>|F|であれは図4のフロー
チャートに示す文書の保存処理を終了する。
In step S403, the value of the counter x is compared with the number of storage destinations | F |, and if x ≦ | F |, the process proceeds to step S404. If x> | F |, the document saving process shown in the flowchart of FIG. 4 ends.

【0048】ステップS404では、保存先保持部10
5中のx番目に対応するフォルダf(Fx)の文書リス
トD(Fx)に新規文書d(n)を加える。さらに、こ
のd(n)が加えられた新たなD(Fx)に対して、ベ
クトルv(d)(d∈D(Fx)の平均を計算し、新た
なv(f(Fx))とする。そして、ステップS405
に移る。
In step S404, the storage destination holding unit 10
The new document d (n) is added to the document list D (Fx) of the folder f (Fx) corresponding to the x-th item in 5. Further, with respect to the new D (Fx) to which this d (n) is added, the average of the vector v (d) (dεD (Fx) is calculated to obtain a new v (f (Fx)). Then, step S405.
Move on to.

【0049】ステップS405では、カウンタxの値を
1増やす。そして、ステップS403に戻る。
In step S405, the value of the counter x is incremented by 1. Then, the process returns to step S403.

【0050】次に、図5のフローチャートを参照して、
本実施の形態の文書処理装置におけるフォルダ検索処理
の手順を説明する。
Next, referring to the flowchart of FIG.
The procedure of the folder search process in the document processing apparatus according to the present embodiment will be described.

【0051】ステップS501では、検索条件保持部1
07に検索条件cが保持されたか否かを調べ、保持され
た場合はステップS502に移る。保持されていない場
合は、ステップS501を繰り返し、検索条件cが、保
持されるのを待つ。この検索条件cは、ユーザによりキ
ーボード等の入力手段から入力される語或いは文章の文
字列である。
In step S501, the search condition holding unit 1
It is checked whether or not the search condition c is held in 07, and if it is held, the process proceeds to step S502. If not held, step S501 is repeated until the search condition c is held. The search condition c is a character string of a word or a sentence input by the user from an input unit such as a keyboard.

【0052】ステップS502では、その時点でアクセ
スするフォルダが文書保持部101に保持されている全
フォルダの中で何番目のフォルダであるかを示すカウン
タxの値をデフォルトの1に設定する。そして、ステッ
プS503に移る。
In step S502, the value of the counter x, which indicates the number of the folder to be accessed at that time among all the folders held in the document holding unit 101, is set to 1 by default. Then, control goes to a step S503.

【0053】ステップS503では、カウンタxの値と
文書保持部101中のフォルダの全数Nを比較し、x≦
NであればステップS504に移る。x>Nであれば図
5のフローチャートに示すフォルダ検索処理を終了す
る。
In step S503, the value of the counter x is compared with the total number N of folders in the document holding unit 101, and x≤
If N, the process moves to step S504. If x> N, the folder search process shown in the flowchart of FIG. 5 ends.

【0054】ステップS504では、文書保持部101
中のx番目のフォルダf(x)と検索条件cに対してス
コアsを次の式により計算する。
In step S504, the document holding unit 101
The score s is calculated for the x-th folder f (x) in the inside and the search condition c by the following formula.

【0055】[0055]

【外1】 [Outside 1]

【0056】なお、関数fは、パターンマッチングによ
り文書中に検索語cがあるか否かを調べ、cが文書中に
ある場合にはその文書についてはf(c,d)=1と
し、Cが文書中にない場合はf(c,d)=0とするも
のである。この判断をx番目のフォルダ内の全文書D
(x)について行う。従って、上述のスコアsは、x番
目のフォルダ内に、検索語cがある文書がいくつあっ
て、全体の文書数|D(x)|で割ることによって割合
を求めたものである。
The function f checks by pattern matching whether or not there is a search word c in the document, and if c is in the document, sets f (c, d) = 1 for that document and sets C Is not in the document, f (c, d) = 0. This judgment is made for all documents D in the xth folder.
Perform (x). Therefore, the score s is obtained by dividing the number of documents having the search word c in the xth folder by the total number of documents | D (x) |.

【0057】S505でx番目のフォルダについての検
索スコアSを求めた後、ステップS505に移る。
After the search score S for the xth folder is obtained in S505, the process proceeds to step S505.

【0058】ステップS505では、ステップS504
で求めたスコアsの昇順になるよう検索結果保持部10
9にS504でスコアSを求めたフォルダの番号xをス
コアSとともに保持する。そして、ステップS506に
移る。
In step S505, step S504
The search result holding unit 10 is arranged in the ascending order of the scores s obtained in
The number x of the folder for which the score S is obtained in S504 is held in S9 together with the score S. Then, the process proceeds to step S506.

【0059】ステップS506では、カウンタxの値を
1増やす。そして、ステップS503に戻る。
In step S506, the value of the counter x is incremented by 1. Then, the process returns to step S503.

【0060】図5のフローチャートにより説明したフォ
ルダ検索処理により求められ、検索結果保持部109に
保持された検索結果のフォルダに関する情報(フォルダ
のラベル等)は、表示器206に保持された順(スコア
sの昇順)に検索語cと対応づけて表示し、ユーザに報
知される。尚、この表示器206に表示されるフォルダ
は、検索結果保持部109に保持された全フォルダでも
良いし、或いはスコアSや個数Mにより選択される上位
フォルダのみでも良い。
Information (folder labels, etc.) regarding the folders of the search results, which are obtained by the folder search processing described with reference to the flowchart of FIG. It is displayed in association with the search word c in the ascending order of s) and notified to the user. The folders displayed on the display 206 may be all folders held in the search result holding unit 109, or only upper folders selected by the score S or the number M.

【0061】本実施の形態の文書処理装置を用いると、
文書の収集時においては、新規文書の保存先として最適
なフォルダが保存候補保持部104の先頭に保持され
る。
Using the document processing apparatus of this embodiment,
At the time of collecting documents, an optimum folder as a save destination of a new document is held at the head of the save candidate holding unit 104.

【0062】そこで、例えば、保存候補保持部104に
保持されている順に従ってフォルダのラベルを表示する
ことにより利用者は表示の先頭周辺を見ることで、保存
先を容易に選ぶことができる。文書の利用時には、検索
条件を指定すると、その検索条件に良く合う文書が集ま
るフォルダを検索することができるので、文書を捜すフ
ォルダを絞り込むことが可能となり、検索処理を効率的
に行える。
Therefore, for example, by displaying the labels of the folders according to the order in which they are stored in the storage candidate storage unit 104, the user can easily select the storage destination by looking around the top of the display. When a document is used, if search conditions are specified, it is possible to search for a folder in which documents that match the search condition are gathered. Therefore, it is possible to narrow down the folders in which the document is searched, and the search process can be performed efficiently.

【0063】以上のように本実施例の文書処理装置を用
いることで、視点に沿って文書をフォルダに保持すると
共に、文書の収集と利用が容易になる。
As described above, by using the document processing apparatus of this embodiment, the documents can be held in the folder in accordance with the viewpoint, and the documents can be easily collected and used.

【0064】尚、本実施の形態においては、文書の収集
と検索利用の双方における処理を容易にする機能を実現
する場合について説明したが、本発明はこれに限定され
るものではない。収集もしくは利用のみを容易にする機
能を実現したものでもよい。この場合の実施例のブロッ
ク図を図6と図7に示す。なお、前述の図1の構成と比
較すると明らかなように、図6の構成601から607
は、図1の101から107に対応している。また、図
7の構成701から704は、図1の101、107、
108、109に対応している。
In the present embodiment, a case has been described in which a function for facilitating the processing of both document collection and retrieval / use is realized, but the present invention is not limited to this. It may be one that realizes a function that facilitates only collection or use. A block diagram of an embodiment in this case is shown in FIGS. Note that, as is clear from comparison with the configuration of FIG. 1 described above, the configurations 601 to 607 of FIG.
Corresponds to 101 to 107 in FIG. Further, configurations 701 to 704 in FIG.
It corresponds to 108 and 109.

【0065】(他の実施例1)上記実施例においては、
一つの文書ごとに保存先のフォルダの候補を検索して当
該文書に対する保存先のフォルダの候補を提示すること
で収集に要する作業を容易ならしめる場合について説明
したが、本発明はこれに限定されるものではない。本実
施の形態では、新たに到着する文書の保存先として適し
ていると判断されるフォルダごとに分類し、フォルダご
とに対応した文書を提示することで収集に要する作業を
容易にする例について説明する。
(Other Embodiment 1) In the above embodiment,
Although a case has been described in which the candidate of the save destination folder is searched for each document and the candidate of the save destination folder for the document is presented to facilitate the work required for collection, the present invention is not limited to this. Not something. In the present embodiment, an example will be described in which documents that are determined to be suitable as storage destinations for newly arrived documents are classified, and documents corresponding to each folder are presented to facilitate the work required for collection. To do.

【0066】図8は、本実施の形態に係る装置の基本構
成を示すブロック図である。同図において、801は、
フォルダに及びフォルダに属する文書を保持する文書保
持部である。802は、新たに到着した文書を保持する
新規文書保持部である。803は、新規文書保持部80
2に保持されている文書の保存先として適するフォルダ
に文書を分類する文書分類部である。804は、文書分
類部803により分類された結果を保持する分類結果保
持部である。805は、保存処理の対象とする文書を保
持する保存対象文書保持部である。806は、分類結果
保持部804に保持されている分類結果から保存対象文
書保持部805に保持されている保存対象文書の保存先
を作成する保存先作成部である。807は、保存先作成
部806により作成された保存先を保持する保存先保持
部である。808は、利用者により保存先保持部807
に保持されている保存先を変更する保存先変更部であ
る。809は、保存対象文書保持部805に保持されて
いる文書を保存先保持部807に保持されている保存先
のフォルダに属するよう文書保持部801に保持する処
理を行なう保存処理部である。
FIG. 8 is a block diagram showing the basic configuration of the apparatus according to this embodiment. In the figure, 801 is
A document holding unit for holding a folder and a document belonging to the folder. Reference numeral 802 denotes a new document holding unit that holds a newly arrived document. 803 is a new document holding unit 80
2 is a document classification unit that classifies documents into folders suitable as storage destinations for the documents held in 2. Reference numeral 804 is a classification result holding unit that holds the results classified by the document classification unit 803. Reference numeral 805 denotes a save target document holding unit that holds a document to be saved. Reference numeral 806 denotes a save destination creation unit that creates a save destination of the save target document held in the save target document holding unit 805 from the classification result held in the classification result holding unit 804. Reference numeral 807 denotes a save destination holding unit that holds the save destination created by the save destination creating unit 806. Reference numeral 808 denotes a storage destination holding unit 807 by the user.
It is a save destination changing unit that changes the save destination held in. Reference numeral 809 denotes a save processing unit that performs a process of holding the document held in the save target document holding unit 805 in the document holding unit 801 so that the document belongs to the save destination folder held in the save destination holding unit 807.

【0067】本実施の形態ては、分類結果保持部804
は、フォルダfごとに分類された文書の集合を保持する
構造になっている。保存対象文書保持部は、保存前の文
書を一つ保持する構造になっている。文書保持部80
1、新規文書保持部802、保存先保持部807は、先
に説明した図1の構成101、102、105と同様で
ある。
In the present embodiment, the classification result holding unit 804
Has a structure for holding a set of documents classified for each folder f. The saving target document holding unit has a structure for holding one document before saving. Document holding unit 80
1, the new document holding unit 802, and the storage destination holding unit 807 are the same as the configurations 101, 102, and 105 of FIG. 1 described above.

【0068】本実施例における装置構成は先に説明した
図2と同様であり、ここでは説明を省略する。
The apparatus configuration of this embodiment is the same as that of FIG. 2 described above, and the description thereof is omitted here.

【0069】以下、図9のフローチャートを参照して、
本実施の形態の文書処理装置における文書分類処理の手
順を説明する。
Hereinafter, with reference to the flowchart of FIG.
A procedure of document classification processing in the document processing apparatus according to the present embodiment will be described.

【0070】ステップS901では、新規文書保持部8
02に新たに到着した文書のテキストt(n)が保持さ
れたか否かを調べ、文書が保持された場合はステップS
902に移る。保持されていない場合は、ステップS9
01を繰り返し、新たに到着した文書のテキストt
(n)が保持されるのを待つ。
In step S901, the new document holding unit 8
It is checked whether the text t (n) of the document newly arrived at 02 is held, and if the document is held, step S
Move to 902. If not held, step S9
01 is repeated, and the text t of the newly arrived document
Wait for (n) to be retained.

【0071】ステップS902では、テキストt(n)
に対して特徴ベクトルv(dn)を作成しt(n)と共
に新規文書保持部802に保持する。そして、ステップ
S903に移る。
In step S902, the text t (n)
Holding the new document holding unit 802 with the feature vector v (d n) to create a t (n) with respect to. Then, the process proceeds to step S903.

【0072】ステップS903では、その時アクセスし
ているフォルダが文書保持部801に保持されているフ
ォルダの何番目であるかを示すカウンタxの値を初期値
の1に設定する。そして、ステップS904に移る。
In step S903, the value of the counter x indicating the number of the folder currently held in the document holding unit 801 is set to 1 which is the initial value. Then, the process proceeds to step S904.

【0073】ステップS904では、カウンタxの値と
文書保持部801中のフォルダの数Nを比較し、x≦N
であればステップS905に移る。x>Nであれば処理
を終了する。
In step S904, the value of the counter x is compared with the number N of folders in the document holding unit 801, and x ≦ N.
If so, the process proceeds to step S905. If x> N, the process ends.

【0074】ステップS905では、文書保持部801
中のx番目のフォルダf(x)と新規文書d(n)に対
してスコアs=g(v(dn ),v(fx))を計算す
る。そして、ステップS906に移る。
In step S905, the document holding unit 801
X th folder f (x) as a new document d (n) with respect to the score s = g in (v (d n), v (fx)) is calculated. Then, the process proceeds to step S906.

【0075】ステップS906では、ステップS905
で求めたスコアsと予め設定されている閾値Scとを比
較し、s>ScであればステップS907に移る。s≦
ScであればステップS908に移る。
In step S906, step S905
The score s obtained in step S is compared with a preset threshold Sc, and if s> Sc, the process proceeds to step S907. s ≦
If it is Sc, the process proceeds to step S908.

【0076】ステップS907では、分類結果保持部8
04において、フォルタf(x)に相当する集合に新規
文書d(n)を追加する。そして、ステップS908に
移る。
In step S907, the classification result holding unit 8
At 04, the new document d (n) is added to the set corresponding to the folder f (x). Then, the process proceeds to step S908.

【0077】ステップS908では、カウンタxの値を
1増やす。そして、ステップS904に戻る。
At step S908, the value of the counter x is incremented by 1. Then, the process returns to step S904.

【0078】また、保存先作成処理は、保存対象文書保
持部805に保持された文書が、分類結果保持部804
において属しているフォルダ全てを保存先保持部807
に保持する。保存先変更処理は、利用者の指示に従っ
て、保存先保持部807に保持されている保存先のリス
トにフォルダの追加もしくは削除を行なう。保存処理
は、図4のフローチャートに示した先の実施例の保存処
理と同様である。
In the storage destination creating process, the document held in the storage target document holding unit 805 is stored in the classification result holding unit 804.
Save folder 807 for all folders that belong to
To hold. In the save destination changing process, a folder is added to or deleted from the save destination list held in the save destination holding unit 807 according to a user's instruction. The saving process is similar to the saving process of the previous embodiment shown in the flowchart of FIG.

【0079】本実施例の文書処理装置を用いると、文書
の収集時に、各フォルダへ保存すべきと判断される文書
がフォルダごとに分類されて分類結果保持部804に保
持される。そこで、例えば分類結果保持部804に保持
されている分類に従って、フォルダごとに文書を閲覧す
れば、利用者は自らの視点に沿って関連する文書をまと
めて閲覧することができる。また、保存先保持部807
にデフォルトの保存先が保持されており、変更の必要が
なく、変更の指示が入力手段207から入力されなけれ
ば利用者が保存先を改めて指示することなく、保存の指
示のみで保存処理を行なうことも可能である。以上のよ
うに、本実施の形態の文書処理装置を用いることで、文
書を視点に沿って閲覧し視点に沿った保存先が得られる
ので、文書の収集に要する作業が容易になる。
When the document processing apparatus of this embodiment is used, when the documents are collected, the documents judged to be stored in each folder are classified into folders and held in the classification result holding unit 804. Therefore, for example, if the documents are browsed for each folder according to the classification stored in the classification result storage unit 804, the user can collectively browse related documents according to his / her own viewpoint. Further, the storage destination holding unit 807
Since the default save destination is stored in, and no change is required, and if the change instruction is not input from the input unit 207, the user does not instruct the save destination again, and the save processing is performed only by the save instruction. It is also possible. As described above, by using the document processing apparatus according to the present embodiment, the document can be browsed along the viewpoint and the storage destination according to the viewpoint can be obtained, which facilitates the work required to collect the document.

【0080】(他の実施例2)前記実施の形態において
は、分類結果から保存先を作成し、この保存先だけを利
用者が見て変更する場合について説明したが、本発明は
これに限定されるものではなく、図1に示した保存候補
作成処理と組み合わせて保存候補も利用しながら保存先
を変更することで収集を容易にする例について説明す
る。
(Other Example 2) In the above-described embodiment, a case has been described in which a storage destination is created from a classification result, and the user changes only the storage destination, but the present invention is not limited to this. Instead of this, an example will be described in which the collection is facilitated by changing the storage destination while also using the storage candidate in combination with the storage candidate creation processing shown in FIG.

【0081】図10は、本実施の形態に係る装置の基本
構成を示すブロック図である。同図において、1001
は、フォルダ及びフォルダに属する文書を保持する文書
保持部である。1002は、新たに到着した文書を保持
する新規文書保持部である。1003は、新規文書保持
部1002に保持されている文書の保存先として適する
フォルダに文書を分類する文書分類部である。1004
は、文書分類部1003により分類された結果を保持す
る分類結果保持部である。1005は、保存処理の対象
とする文書を保持する保存対象文書保持部である。10
06は、分類結果保持部1004に保持されている分類
結果から保存対象文書保持部1005に保持されている
保存対象文書の保存先を作成する保存先作成部である。
1007は、保存先作成部1006により作成された保
存先を保持する保存先保持部である。1008は、保存
対象文書保持部1005に保持されている文書の保存先
として適するフォルダを検索し、その中から保存先保持
部1007に保持されているフォルダを除いたものを保
存先の候補とする保存候補作成部である。1009は、
保存候補作成部1008により作成された保存先の候補
を保持する保存候補保持部である。1010は、利用者
により保存先保持部1007に保持されている保存先と
保存候補保持部1009に保持されている保存候補を変
更する保存先変更部である。1011は、保存対象文書
保持部1005に保持されている文書を保存先保持不1
007に保持されている保存先のフォルダに属するよう
文書保持部1001に保持する処理を行なう保存処理部
である。
FIG. 10 is a block diagram showing the basic configuration of the apparatus according to this embodiment. In the figure, 1001
Is a document holding unit that holds a folder and a document belonging to the folder. A new document storage unit 1002 stores a newly arrived document. Reference numeral 1003 denotes a document classification unit that classifies the documents held in the new document holding unit 1002 into folders suitable as storage destinations of the documents. 1004
Is a classification result holding unit that holds the results classified by the document classification unit 1003. Reference numeral 1005 denotes a save target document holding unit that holds a document to be saved. 10
Reference numeral 06 denotes a save destination creation unit that creates a save destination of the save target document held in the save target document holding unit 1005 from the classification result held in the classification result holding unit 1004.
Reference numeral 1007 is a storage destination storage unit that stores the storage destination created by the storage destination creation unit 1006. Reference numeral 1008 searches a folder suitable as a save destination of the document held in the save target document holding unit 1005, and selects a folder excluding the folder held in the save destination holding unit 1007 as a save destination candidate. This is a storage candidate creation unit. 1009 is
This is a storage candidate storage unit that stores the storage destination candidates created by the storage candidate creation unit 1008. Reference numeral 1010 denotes a save destination changing unit that changes the save destination held in the save destination holding unit 1007 and the save candidate held in the save candidate holding unit 1009 by the user. A reference numeral 1011 indicates that the document stored in the storage target document storage unit 1005 is not stored in the storage destination.
This is a storage processing unit that performs processing for storing the document in the document storage unit 1001 so that it belongs to the storage destination folder stored in 007.

【0082】本実施例では、文書保持部1001、新規
文書保持部1002、分類結果保持部1004、保存先
保持部1007は、先に説明した図9の構成901、9
02、904、907と同様である。また、保存候補保
持部は、先に説明した図1の構成104と同様である。
各処理も先に説明した処理と同様であるが、保存先変更
処理は一部異なる。本実施例における保存先変更処理で
は、保存先保持部1007から削除された保存先は、保
存候補保持部1009に保持される。また、保存候補保
持部1009に保持されている保存先候補が、保存先保
持部1007に追加された場合は、それを保存候補保持
部1009から削除する。
In this embodiment, the document holding unit 1001, the new document holding unit 1002, the classification result holding unit 1004, and the storage destination holding unit 1007 are the configurations 901 and 9 of FIG. 9 described above.
02, 904, and 907. Further, the storage candidate holding unit is the same as the configuration 104 of FIG. 1 described above.
Each process is similar to the process described above, but the save destination changing process is partially different. In the save destination changing process according to the present embodiment, the save destination deleted from the save destination holding unit 1007 is held in the save candidate holding unit 1009. In addition, when the storage destination candidate stored in the storage candidate storage unit 1009 is added to the storage destination storage unit 1007, it is deleted from the storage candidate storage unit 1009.

【0083】本実施例の文書処理装置を用いると、保存
先の決定にあたって分類結果を修正する場合に追加する
フォルダを容易に探すことかできるようになり、文書の
収集がより容易になる。
By using the document processing apparatus according to the present embodiment, it becomes possible to easily find a folder to be added when the classification result is modified in determining the storage destination, and the documents can be collected more easily.

【0084】尚、ここまで説明した全ての実施の形態に
おいては、保存候補検索処理及び文書分類処理において
特徴ベクトルの距離関係を用いてスコアを計算する場合
について説明したが、本発明はこれに限定されるもので
はない。文書がフォルダに属する度合いを示すスコアを
得られる他の手法を用いてもよい。例えば、フォルダの
データに、利用者が与えるキーワードとその論理関係に
よる検索条件cを加えて、 f=(1,D,c,v(f)) とし、スコアをs=f(c(x),d(n))により計
算する方法やs=f(c(x),d(n)) * C+
g(v(fx),v(dn ))により計算する方法など
がある(Cは任意の定数である)。
It should be noted that in all the embodiments described so far, the case where the score is calculated by using the distance relation of the feature vectors in the save candidate search process and the document classification process has been described, but the present invention is not limited to this. It is not something that will be done. Other methods that can obtain a score indicating the degree to which a document belongs to a folder may be used. For example, a keyword given by the user and a search condition c based on its logical relationship are added to the data in the folder to obtain f = (1, D, c, v (f)), and the score is s = f (c (x)). , D (n)) or s = f (c (x), d (n)) * C +
g (v (fx), v (d n)) and a method of calculating the (C is an arbitrary constant).

【0085】また、フォルダ検索処理においてキーワー
ドとその論理関係による検索条件を用いて検索する場合
について説明したが、本発明はこれに限定されるのもの
ではない。フォルダを検索できる他の手法を用いてもよ
い。例えば、検索したいフォルダに近い別のフォルダf
(t)を検索条件として、スコアsをs=g(v(f
x),v(ft))として計算する方法がある。あるい
は、検索したフォルダの内容に近い文書d(t)を検索
条件として、スコアsをs=g(v(fx),v(d
t))として計算する方法がある。
Further, although a case has been described in which a search condition is used in a folder search process based on a keyword and its logical relationship, the present invention is not limited to this. Other methods that can search folders may be used. For example, another folder f close to the folder you want to search
Using (t) as a search condition, the score s is s = g (v (f
x), v (ft)). Alternatively, the score s is s = g (v (fx), v (d) using the document d (t) close to the contents of the searched folder as the search condition.
There is a method of calculating as t)).

【0086】尚、先の実施の形態においては、利用時の
検索を実現する構成としてフォルダ検索部だけを持つ場
合について説明したが、本発明はこれに限定されるもの
ではなく、文書を検索する文書検索部を設けてもよい。
In the above embodiment, the case in which only the folder search section is provided as a structure for realizing the search at the time of use has been described, but the present invention is not limited to this, and a document is searched. A document search unit may be provided.

【0087】尚、先の実施の形態においては、文書分類
処理で全てのフォルダに対応した分類を行なう場合につ
いて説明したが、本発明はこれに限定されるものではな
く、特定のフォルダに限って分類を行なってもよい。例
えば、利用者が指定したフォルダだけに限定したり、一
定期間内に利用されたフォルダだけに限定したりする。
In the above embodiment, the case where the classification corresponding to all the folders is performed in the document classification processing has been described, but the present invention is not limited to this, and is limited to a specific folder. You may classify. For example, the folders may be limited to folders designated by the user, or may be limited to folders used within a certain period.

【0088】尚、先の実施の形態においては、文書分類
処理でスコアを同じ方法で求めて同一の閾値と比較して
判定する場合について説明したが、本発明はこれに限定
されるものではなく、対応するフォルダによって、スコ
アを求める方法を変えてもよいし、閾値を変えてもよ
い。
In the above embodiments, the case where the score is obtained by the same method in the document classification process and the score is compared with the same threshold value to make the determination is described, but the present invention is not limited to this. The method for obtaining the score may be changed, or the threshold may be changed, depending on the corresponding folder.

【0089】尚、先の実施の形態においては保存候補検
索処理及びフォルダ検索処理において全てのフォルダを
結果として保持する場合について説明したが、本発明は
これに限定されるものではなく、一部のフォルダだけを
結果として保持してもよい。例えば、スコアが予め設定
された閾値を越えたものだけを保持する方法や予め設定
された数や割合の範囲内で結果を保持する方法がある。
In the above embodiment, the case where all the folders are held as a result in the save candidate search process and the folder search process has been described, but the present invention is not limited to this, and some of them are retained. Only folders may be retained as a result. For example, there is a method of retaining only scores whose score exceeds a preset threshold, and a method of retaining results within a range of a preset number or ratio.

【0090】尚、先の実施の形態においては、収集時に
新しいフォルダを作成しない場合について説明したが、
本発明はこれに限定されるものではなく、新しいフォル
ダを作成して、当該フォルダを保存先保持部に追加する
新規保存先作成部を設けてもよい。
In the above embodiment, the case where a new folder is not created at the time of collection has been described.
The present invention is not limited to this, but a new folder may be created and a new save destination creation unit that adds the folder to the save destination holding unit may be provided.

【0091】尚、先の実施の形態においては、分類結果
保持部に保持されている分類結果が常に保持される場合
について説明したが、本発明はこれに限定されるもので
はなく、保存処理が行なわれたときに当該文書を分類結
果から削除したり特定のフォルダに対応する分類結果を
削除するなど、分類結果削除部を設けてもよい。
In the above embodiment, the case where the classification result held in the classification result holding unit is always held has been described, but the present invention is not limited to this, and the saving process is not limited to this. A classification result deletion unit may be provided, such as deleting the document from the classification result or deleting the classification result corresponding to a specific folder when performed.

【0092】尚、先の実施の形態においては、フォルダ
検索処理において、複数のフォルダに保存されている文
書に対して関数fの値を求める場合について説明した
か、本発明はこれに限定されるものではなく、一つの文
書に対して関数fの値を1回だけ求めるような処理でも
よい。例えば、1回計算した関数fの値を保持しておく
方法や、文書に対するfの値を計算した後、その値を当
該文書が属するフォルダに伝播させてフォルダをスコア
を合成していく方法がある。
In the above embodiment, the case where the value of the function f is obtained for the documents stored in a plurality of folders in the folder search processing has been explained, but the present invention is not limited to this. Instead of one, the process of obtaining the value of the function f only once for one document may be performed. For example, there is a method of holding the value of the function f calculated once, or a method of calculating the value of f for a document and then propagating the value to the folder to which the document belongs and synthesizing the scores of the folders. is there.

【0093】尚、先の実施の形態においては、パターン
マッチングにより関数fの値を求める場合について説明
したが、本発明はこれに限定されるものではなく、文書
に対するインデックスを作成しておき、インデックスを
用いて関数fの値を求めてもよい。
In the above embodiment, the case where the value of the function f is obtained by pattern matching has been described, but the present invention is not limited to this, and an index is created for a document and the index is created. The value of the function f may be obtained using.

【0094】[0094]

【発明の効果】以上説明したように、本発明によれば、
新規文書の保存先として適したフォルダをユーザに提示
できるので、ユーザの保存先選択処理が容易になる。
As described above, according to the present invention,
Since a folder suitable as a storage destination of a new document can be presented to the user, the storage destination selection process of the user becomes easy.

【0095】また、利用者の視点に沿って文書を管理で
きる。
Documents can be managed from the user's point of view.

【0096】また、文書の収集時或は利用時における適
切なフォルダの選択が容易になる。
Further, it becomes easy to select an appropriate folder when collecting or using documents.

【0097】また、利用者の文書保持の視点が変化して
も対応できる。
Further, it is possible to cope with a change in the user's viewpoint of document holding.

【0098】また、提示された保存先を変更する処理だ
けで保存先を指示できるので、保存先の指示操作が簡単
になる。
Further, since the storage destination can be instructed only by the presented processing for changing the storage destination, the operation of instructing the storage destination becomes simple.

【0099】また、順次新しいフォルダが作成されるの
で、新たに必要なフォルダの作成処理が不要となり、操
作性が向上する。
Further, since new folders are sequentially created, the process of creating a newly required folder is unnecessary, and the operability is improved.

【0100】また、新規文書を保存するのに適したフォ
ルダの選択を、既にフォルダに属して保持されている文
書の特徴から判断するので、適切な判断が行える。
Further, since the selection of a folder suitable for saving a new document is judged from the characteristics of the document already belonging to the folder and held, an appropriate judgment can be made.

【0101】また、ユーザに報知する保存先として適し
たフォルダを複数用意するので、ユーザの求めるフォル
ダが選択され損ねる危険性が低い。
Further, since a plurality of folders suitable as storage destinations to be notified to the user are prepared, there is a low risk that the folder desired by the user will not be selected.

【0102】また、表示器により正確にフォルダを確認
することができる。
Further, the folder can be confirmed accurately on the display.

【0103】また、検索条件に適したフォルダを提示す
るので、検索処理を効率よく行うことができる。
Further, since the folders suitable for the search conditions are presented, the search processing can be performed efficiently.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係る文書処理装置の基本構成例を示す
ブロック図である。
FIG. 1 is a block diagram showing a basic configuration example of a document processing apparatus according to the present invention.

【図2】本発明に係る機能的な具体的構成を示す図であ
る。
FIG. 2 is a diagram showing a functional specific configuration according to the present invention.

【図3】本発明に係る保存候補検索処理の概要を示すフ
ローチャートである。
FIG. 3 is a flowchart showing an outline of a storage candidate search process according to the present invention.

【図4】本発明に係る保存処理の概要を示すフローチャ
ートである。
FIG. 4 is a flowchart showing an outline of a saving process according to the present invention.

【図5】本発明に係るフォルダ検索処理の概要を示すフ
ローチャートである。
FIG. 5 is a flowchart showing an outline of a folder search process according to the present invention.

【図6】本発明に係る基本構成例を示すブロック図であ
る。
FIG. 6 is a block diagram showing a basic configuration example according to the present invention.

【図7】本発明に係る別の基本構成例を示すブロック図
である。
FIG. 7 is a block diagram showing another basic configuration example according to the present invention.

【図8】本発明に係る別の基本構成例を示すブロック図
である。
FIG. 8 is a block diagram showing another basic configuration example according to the present invention.

【図9】本発明に係る文書分類処理を示すフローチャー
トである。
FIG. 9 is a flowchart showing a document classification process according to the present invention.

【図10】本発明に係る別の基本構成例を示すブロック
図である。
FIG. 10 is a block diagram showing another basic configuration example according to the present invention.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 池田 裕治 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 ─────────────────────────────────────────────────── ─── Continued Front Page (72) Inventor Yuji Ikeda 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc.

Claims (20)

【特許請求の範囲】[Claims] 【請求項1】 フォルダ及びフォルダに属する文書を保
持する文書保持手段と、 新規文書に適した保持先フォルダを、該新規文書を解析
することにより前記文書保持手段に保持されているフォ
ルダより判定する保存先判定手段と、 前記保存先判定手段により判定された保存先フォルダを
報知する報知手段とを有することを特徴とする文書処理
装置。
1. A document holding unit for holding a folder and a document belonging to the folder, and a holding destination folder suitable for a new document are determined from the folders held in the document holding unit by analyzing the new document. A document processing apparatus, comprising: a storage destination determination unit; and a notification unit that notifies the storage destination folder determined by the storage destination determination unit.
【請求項2】 フォルダ及びフォルダに属する文書を保
持する文書保持手段と、 新規文書を保持する新規文書保持手段と、 前記新規文書保持手段に保持されている文書の保存先と
して適するフォルダを検索する保存候補検索手段と、 前記保存候補検索手段により検索された保存先の候補を
出力する保存候補出力手段と、 前記新規文書保持手段に保持されている新規文書の保存
先を選択する保存先選択手段と、 前記新規文書保持手段に保持されている文書を前記保存
先選択手段により選択された保存先のフォルダに属する
よう前記文書保持手段に保持する保存処理手段とを有す
る事を特長とする文書処理装置。
2. A document holding unit for holding a folder and a document belonging to the folder, a new document holding unit for holding a new document, and a folder suitable as a storage destination of the document held by the new document holding unit are searched. Save candidate search means, save candidate output means for outputting the save destination candidates searched by the save candidate search means, and save destination selecting means for selecting the save destination of the new document held in the new document holding means And a saving processing unit that holds the document held in the new document holding unit in the document holding unit so that it belongs to the save destination folder selected by the save destination selecting unit. apparatus.
【請求項3】 フォルダ及びフォルダに属する文書を保
持する文書保持手段と、 新規文書を保持する新規文書保持手段と、 前記新規文書保持手段に保持されている文書の保存先と
して適するフォルダ毎に前記新規文書を分類する文書分
類手段と、 前記文書分類手段により分類された結果を出力する分類
結果出力手段と、 前記文書分類手段により分類された結果の変更を支持す
る保存先変更手段と、 前記新規文書保持手段に保持されている文書を前記保存
先変更手段により変更された保存先のフォルダに属する
よう前記文書保持手段に保持する保存手段とを有するこ
とを特徴とする文書処理装置。
3. A document holding unit for holding a folder and a document belonging to the folder, a new document holding unit for holding a new document, and each folder suitable as a storage destination of the document held in the new document holding unit. A document classification unit that classifies new documents; a classification result output unit that outputs the results classified by the document classification unit; a storage destination modification unit that supports modification of the results classified by the document classification unit; A document processing apparatus comprising: a storage unit that stores the document stored in the document storage unit in the document storage unit so that the document belongs to the storage destination folder changed by the storage destination changing unit.
【請求項4】 前記保存先変更手段は、前記分類結果出
力手段により出力された分類結果を削除することにより
変更を指示することを特徴とする請求項3に記載の文書
処理装置。
4. The document processing apparatus according to claim 3, wherein the storage destination changing unit instructs the change by deleting the classification result output by the classification result output unit.
【請求項5】 前記文書保持手段に保持する新しいフォ
ルダを作成するフォルダ作成手段を有することを特徴と
する請求項3に記載の文書処理装置。
5. The document processing apparatus according to claim 3, further comprising a folder creating unit that creates a new folder held in the document holding unit.
【請求項6】 前記フォルダは、当該フォルダに属して
保持されている文書の文書特徴の代表値の情報を含むこ
とを特徴とする請求項3に記載の文書処理装置。
6. The document processing apparatus according to claim 3, wherein the folder includes information on a representative value of document characteristics of documents that belong to the folder and are held.
【請求項7】 前記文書特徴の代表値は、前記フォルダ
に属して保持されている文書の文書特徴の平均値とする
ことを特徴とする請求項6に記載の文書処理装置。
7. The document processing apparatus according to claim 6, wherein the representative value of the document features is an average value of the document features of documents that belong to and are held in the folder.
【請求項8】 前記新規文書の文書特徴と、前記フォル
ダに含まれる文書特徴の代表値とを比較し、類似してい
ると判定されるフォルダを該新規文書の保存先として適
すると判定することを特徴とする請求項6に記載の文書
処理装置。
8. Comparing the document features of the new document with the representative values of the document features included in the folder, and determining that folders that are determined to be similar are suitable as the storage destination of the new document. The document processing apparatus according to claim 6, wherein
【請求項9】 前記文書の保存先として適するフォルダ
を複数判定し、前記複数判定されたフォルダに関して前
記分類を出力することを特徴とする請求項3に記載の文
書処理装置。
9. The document processing apparatus according to claim 3, wherein a plurality of folders suitable as storage destinations of the document are determined, and the classification is output for the plurality of determined folders.
【請求項10】 前記分類結果出力手段は表示器とする
ことを特徴とする請求項3に記載の文書処理装置。
10. The document processing apparatus according to claim 3, wherein the classification result output means is a display device.
【請求項11】 検索条件を保持する検索条件保持手段
と、 前記検索条件保持手段に保持されている検索条件に従っ
て、前記文書保持手段に保持されているフォルダを検索
するフォルダ検索手段と、 前記フォルダ検索手段により検索されたフォルダを報知
する検索結果報知手段とを有することを特徴とする請求
項3に記載の文書処理装置。
11. A search condition holding unit for holding a search condition, a folder search unit for searching a folder held in the document holding unit according to a search condition held in the search condition holding unit, and the folder The document processing apparatus according to claim 3, further comprising a search result notification unit that notifies the folder searched by the search unit.
【請求項12】 フォルダ及びフォルダに属する文書を
保持する文書保持手段と、 検索条件を保持する検索条件保持手段と、 前記検索条件保持手段に保持されている検索条件に従っ
て、前記文書保持手段に保持されているフォルダを検索
するフォルダ検索手段と、 前記フォルダ検索手段により検索されたフォルダを報知
する検索結果報知手段とを有することを特徴とする文書
処理装置。
12. A document holding unit for holding a folder and a document belonging to the folder, a search condition holding unit for holding a search condition, and a document holding unit for holding the document according to the search condition held by the search condition holding unit. A document processing apparatus, comprising: a folder search unit that searches for a folder that is searched for; and a search result notification unit that notifies the folder searched by the folder search unit.
【請求項13】 前記フォルダ検索手段は、前記保持さ
れた検索条件に一致する文書を保持しているフォルダを
検索することを特徴とする請求項12に記載の文書処理
装置。
13. The document processing apparatus according to claim 12, wherein the folder search unit searches a folder holding a document that matches the held search condition.
【請求項14】 前記検索条件は文字列とすることを特
徴とする請求項12に記載の文書処理装置。
14. The document processing apparatus according to claim 12, wherein the search condition is a character string.
【請求項15】 前記検索結果報知手段は、フォルダの
名称を報知することを特徴とする請求項12に記載の文
書処理装置。
15. The document processing apparatus according to claim 12, wherein the search result notifying unit notifies the name of the folder.
【請求項16】 前記検索結果報知手段は前記検索条件
との一致スコアが高い順に検索結果を報知することを特
徴とする請求項12に記載の文書処理装置。
16. The document processing apparatus according to claim 12, wherein the search result notifying unit notifies the search results in descending order of matching score with the search condition.
【請求項17】 フォルダ及びフォルダに属する文書を
保持する文書保持手段を利用し、 新規文書に適した保存先ファルダを、該新規文書を解析
することにより前記文書保持手段に保持されているフォ
ルダより判定し、 前記判定された保存先フォルダを報知することを特徴と
する文書処理方法。
17. A folder for holding a folder suitable for a new document is analyzed by using a document holding unit that holds a folder and a document belonging to the folder, and the folder held in the document holding unit is analyzed by analyzing the new document. A document processing method, characterized by making a determination and notifying the determined storage destination folder.
【請求項18】 フォルダ及びフォルダに属する文書を
保持する文書保持手段を利用し、 新規文書を保持し、 前記保持されている文書の保存先として適するフォルダ
を検索し、 前記検索された保存先の候補を出力し、 前記保持されている新規文書の保存先を選択し、 前記保持されている文書を前記選択された保存先のフォ
ルダに属するよう前記文書保持手段に保持することを特
徴とする文書処理方法。
18. A document holding means for holding a folder and a document belonging to the folder is used, a new document is held, a folder suitable as a saving destination of the held document is searched, and the searched saving destination is A document characterized by outputting a candidate, selecting a storage destination of the retained new document, and retaining the retained document in the document retaining unit so as to belong to the selected storage destination folder. Processing method.
【請求項19】 フォルダ及びフォルダに属する文書を
保持する文書保持手段を利用し、 新規文書を保持し、 前記保持されている文書の保存先として適するフォルダ
毎に前記新規文書を分類し、 前記分類された結果を出力し、 前記分類された結果の変更を指示し、 前記保持されている新規文書を前記変更された保存先の
フォルダに属するよう前記文書保持手段に保持すること
を特徴とする文書処理方法。
19. A new document is retained by using a document retaining unit that retains a folder and a document belonging to the folder, and the new document is classified for each folder suitable as a storage destination of the retained document. The modified result is output, the modification of the classified result is instructed, and the retained new document is retained in the document retaining unit so as to belong to the modified storage destination folder. Processing method.
【請求項20】 フォルダ及びフォルダに属する文書を
保持する文書保持手段を利用し、 検索条件を保持し、 前記保持されている検索条件に従って、前記文書保持手
段に保持されているフォルダを検索し、 前記検索されたフォルダを報知することを特徴とする文
書処理方法。
20. A document holding unit that holds a folder and a document belonging to the folder is used to hold a search condition, and a folder held in the document holding unit is searched according to the held search condition, A document processing method, which notifies the searched folder.
JP8129899A 1996-05-24 1996-05-24 Document processing method and device therefor Pending JPH09311805A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP8129899A JPH09311805A (en) 1996-05-24 1996-05-24 Document processing method and device therefor
US08/863,047 US20030061221A1 (en) 1996-05-24 1997-05-23 Document processing method system and storage medium for document processing programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8129899A JPH09311805A (en) 1996-05-24 1996-05-24 Document processing method and device therefor

Publications (1)

Publication Number Publication Date
JPH09311805A true JPH09311805A (en) 1997-12-02

Family

ID=15021135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8129899A Pending JPH09311805A (en) 1996-05-24 1996-05-24 Document processing method and device therefor

Country Status (1)

Country Link
JP (1) JPH09311805A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7120625B2 (en) 2001-11-15 2006-10-10 Hitachi, Ltd. Method and apparatus for document information management
JP2008182404A (en) * 2007-01-24 2008-08-07 Murata Mach Ltd Document processor
JP2009053942A (en) * 2007-08-27 2009-03-12 Fuji Xerox Co Ltd Document processing program, document processing device and document processing system
JP2009193171A (en) * 2008-02-12 2009-08-27 Canon Inc Document management device, method, program, and document management system
JP2009230726A (en) * 2008-03-25 2009-10-08 Fujitsu Ltd Memory device and computer program
JP2016146147A (en) * 2015-02-09 2016-08-12 キヤノン株式会社 Document management system, document registration apparatus and document registration method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7120625B2 (en) 2001-11-15 2006-10-10 Hitachi, Ltd. Method and apparatus for document information management
JP2008182404A (en) * 2007-01-24 2008-08-07 Murata Mach Ltd Document processor
JP4556246B2 (en) * 2007-01-24 2010-10-06 村田機械株式会社 Document processing device
JP2009053942A (en) * 2007-08-27 2009-03-12 Fuji Xerox Co Ltd Document processing program, document processing device and document processing system
JP2009193171A (en) * 2008-02-12 2009-08-27 Canon Inc Document management device, method, program, and document management system
JP2009230726A (en) * 2008-03-25 2009-10-08 Fujitsu Ltd Memory device and computer program
JP2016146147A (en) * 2015-02-09 2016-08-12 キヤノン株式会社 Document management system, document registration apparatus and document registration method

Similar Documents

Publication Publication Date Title
JP4640591B2 (en) Document search device
US6654738B2 (en) Computer program embodied on a computer-readable medium for a document retrieval service that retrieves documents with a retrieval service agent computer
EP0810534B1 (en) Document display system and electronic dictionary
JP4746136B2 (en) Rank graph
US20050138056A1 (en) System and method for multi-dimensional foraging and retrieval of documents
US20060015509A1 (en) Bookmark management apparatus for dynamic categorization
KR101502671B1 (en) Online analysis and display of correlated information
JP2001184153A (en) Information processor and recording medium having information display program recorded thereon
JP3643470B2 (en) Document search system and document search support method
CN107451139A (en) File resource methods of exhibiting, device and corresponding smart machine
JP2006120126A (en) Keyword extraction device and keyword extraction program
JP3577822B2 (en) Information presentation apparatus and information presentation method
JP4084647B2 (en) Information search system, information search method, and information search program
JPH08320882A (en) Document processor and document retrieval device
JPH09311805A (en) Document processing method and device therefor
JP2005128872A (en) Document retrieving system and document retrieving program
JPS63191271A (en) Storing/retrieving system for picture information
JP2001092850A (en) Terminal for information retrieval and its information displaying and inputting-outputting method
JPH02121058A (en) Data file device, method and device for retrieving data associative memory
CA2371244A1 (en) Method and apparatus for dynamically displaying a set of documents organized by a hierarchy of indexing concepts
JPH06337899A (en) Information retrieving method and its device
JP4224131B2 (en) Document search system
JP2005216139A (en) Document search system, method and program
O’Sullivan et al. Context-oriented image retrieval
JP2001229178A (en) Method and device for document retrieval and recording medium where the method is recorded

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061114

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070115

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070213