JPH09212505A - Document processor and its method - Google Patents

Document processor and its method

Info

Publication number
JPH09212505A
JPH09212505A JP8034193A JP3419396A JPH09212505A JP H09212505 A JPH09212505 A JP H09212505A JP 8034193 A JP8034193 A JP 8034193A JP 3419396 A JP3419396 A JP 3419396A JP H09212505 A JPH09212505 A JP H09212505A
Authority
JP
Japan
Prior art keywords
document
compression rate
summarizing
access
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8034193A
Other languages
Japanese (ja)
Inventor
Takanari Ueda
隆也 上田
Noriko Otani
紀子 大谷
Shiro Ito
史朗 伊藤
Yuji Ikeda
裕治 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP8034193A priority Critical patent/JPH09212505A/en
Publication of JPH09212505A publication Critical patent/JPH09212505A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a document processor summarizing a document corresponding to the degree of user's interest. SOLUTION: The document processor is provided with a document data base 101, the number of access holding part 102, a compressibility calculation part 103, an input document holding part 104, a document sorting part 105, a document summarizing part 106, a summarized document holding part 107 and a summarized document display part 108. A document sorting part 105 sort-processes an inputted document. The document sorting processing gives a sorting category to the document. The number of access to the given category is investigated and a compressibility calculation part 102 calculates a compressibility from the investigated number of access. The compressibility is made 10 when the number of access is not more than 10 times, the compressibility is made 3 when the number of access is not more than 100 times and the compressibility is made 2 when the number of access is not less than 101 times. The document summarizing part 106 summarizes the document according to the calculated compressibility. The summarized result is held in the summarized document holding part 107. The document held in the summarized document holding part 107 is displayed by the summarized document display part 108 by each sorting category.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は文書処理装置および
方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document processing device and method.

【0002】[0002]

【従来の技術】近年、記憶媒体の大容量化・低価格化、
ワードプロセッサの普及などによって電子化された文書
の量が増大している。また、ネットワークの整備が進
み、電子メール・電子ニュースなどのメディアによって
ユーザの下に届く電子化文書の量も増えている。このた
め、ユーザが処理できる量を越えた文書が入ってくると
いう、いわゆる「情報洪水」が問題となっている。
2. Description of the Related Art In recent years, storage media have been increased in capacity and price,
With the spread of word processors and the like, the amount of electronic documents is increasing. In addition, the network is being improved, and the amount of electronic documents that reach users by media such as electronic mail and electronic news is increasing. Therefore, there is a problem of so-called "information flood" in which more documents than the user can process are input.

【0003】この問題の対応策として、各文書の量を減
らすために文書の内容を要約する「文書要約」の技術が
用いられるようになってきた。「文書要約」では、例え
ば文書中の各文に重要度にしたがってスコアを付け、ス
コアの高いものから文を選択することにより定められた
比率で要約文書を生成する。ここではこの比率を圧縮率
と呼ぶこととし、「原文書の量」と「要約文書の量」と
の比として定義する。
As a measure against this problem, a technique of "document summarization" for summarizing the contents of each document has been used in order to reduce the amount of each document. In the “document summary”, for example, each sentence in the document is given a score according to the degree of importance, and a sentence is generated at a determined ratio by selecting the sentence with the highest score. Here, this ratio is referred to as a compression ratio, and is defined as a ratio between the “amount of original document” and the “amount of summary document”.

【0004】即ち、圧縮率が高いほど要約文書の長さは
短くなる。従来、圧縮率は装置側であらかじめ一定の値
に設定されていたり、あるいはユーザが直接に一定の値
に設定するようにされていた。
That is, the higher the compression rate, the shorter the length of the summary document. Conventionally, the compression rate has been set to a fixed value in advance on the device side, or the user has directly set the compression rate to a fixed value.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、圧縮率
は文書の種類によって違うことが望ましい。ユーザは興
味の度合が高い種類の文書は詳細に内容を知りたい。一
方、興味の度合がそれほどでもない種類の文書は簡潔に
内容を知ることができればよい。一律の圧縮率が設定さ
れている場合、こうした要求に応えることができない。
However, it is desirable that the compression rate be different depending on the type of document. The user wants to know the details of the types of documents that have a high degree of interest. On the other hand, it is only necessary to be able to briefly understand the content of a document that is not so interesting. If a uniform compression rate is set, such a request cannot be met.

【0006】また、ユーザが文書を見る際、圧縮率を任
意の値に設定する手段が用意されている場合があるが、
この場合、詳細に内容を知りたい種類の文書については
いちいち圧縮率を低く設定して見なければならず、ま
た、簡潔に内容を知りたい種類の文書についてはいちい
ち圧縮率を高く設定して見なければならない。
There is a case where a user has a means for setting a compression rate to an arbitrary value when viewing a document.
In this case, you should set a low compression rate for each type of document whose details you want to know in detail, and set a high compression rate for each type of document whose content you want to know briefly. There must be.

【0007】そこで、本発明はユーザの興味の度合に応
じて文書を要約する文書処理装置を提供することを目的
とする。
Therefore, an object of the present invention is to provide a document processing device that summarizes a document according to the degree of interest of the user.

【0008】[0008]

【課題を解決するための手段】上記目的を達成するため
に、本発明の請求項1に係る文書処理装置は、入力され
た文書を保持する文書保持手段と、該保持された文書を
要約する要約手段とを備えた文書処理装置において、前
記文書保持手段に保持された文書に分類カテゴリを付与
する分類付与手段と、該付与された分類カテゴリ毎にユ
ーザの興味の度合を判定する判定手段と、該判定された
ユーザの興味の度合に応じて圧縮率を設定する設定手段
とを備え、前記要約手段は該設定された圧縮率にしたが
って前記文書を要約することを特徴とする。
In order to achieve the above object, a document processing apparatus according to claim 1 of the present invention summarizes the held document and the document holding means for holding the input document. In a document processing device provided with summarizing means, a classification assigning means for assigning a classification category to the document held in the document holding means, and a determining means for determining the degree of user's interest for each of the assigned classification categories. Setting means for setting a compression ratio according to the determined degree of interest of the user, and the summarizing means summarizes the document according to the set compression ratio.

【0009】請求項2に係る文書処理装置では、請求項
1に係る文書処理装置において前記判定手段は、前記文
書が属する前記分類カテゴリにアクセスされるアクセス
回数を計数する計数手段を備え、前記設定手段は、該計
数されたアクセス回数が多いほど前記圧縮率を低く設定
することを特徴とする。
According to a second aspect of the present invention, there is provided the document processing apparatus according to the first aspect, wherein the determining means includes counting means for counting the number of times of access to the classification category to which the document belongs, and the setting is performed. The means sets the compression rate to be lower as the counted number of accesses increases.

【0010】請求項3に係る文書処理方法は、入力され
た文書を保持し、該保持された文書を要約する文書処理
方法において、前記保持された文書に分類カテゴリを付
与し、該付与された分類カテゴリ毎にユーザの興味の度
合を判定し、該判定されたユーザの興味の度合に応じて
圧縮率を設定し、該設定された圧縮率にしたがって前記
文書を要約することを特徴とする。
A document processing method according to a third aspect of the present invention is a document processing method for holding an input document and summarizing the held document, assigning a classification category to the held document, and assigning the classification category. The degree of interest of the user is determined for each classification category, a compression rate is set according to the determined degree of interest of the user, and the document is summarized according to the set compression rate.

【0011】[0011]

【発明の実施の形態】本発明の文書処理装置の実施の形
態について説明する。図1は実施の形態における文書処
理装置の構成を示すブロック図である。図において、1
01はユーザが保存した文書を格納する文書データベー
ス、102は文書データベース101の中の各分類カテ
ゴリにアクセスした回数を保持するアクセス回数保持部
である。
BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of a document processing apparatus of the present invention will be described. FIG. 1 is a block diagram showing the configuration of the document processing apparatus according to the embodiment. In the figure, 1
Reference numeral 01 is a document database that stores documents saved by a user, and 102 is an access count holding unit that holds the number of times each category category in the document database 101 is accessed.

【0012】103は文書の圧縮率を計算する圧縮率計
算部、104はユーザの下に入ってきた文書を保持する
入力文書保持部、105は入力文書保持部104に保持
されている文書を分類する文書分類部、106は圧縮率
計算部103で計算した圧縮率にしたがって文書を要約
する文書要約部である。
Reference numeral 103 denotes a compression ratio calculation unit for calculating the compression ratio of a document, 104 an input document holding unit for holding a document entered under a user, and 105 a classification of documents held in the input document holding unit 104. A document classifying unit 106 is a document summarizing unit that summarizes documents according to the compression ratio calculated by the compression ratio calculating unit 103.

【0013】107は要約した文書を分類カテゴリ毎に
保持する要約文書保持部、108は要約文書保持部10
7に保持されている文書を表示する要約文書表示部であ
る。
Reference numeral 107 denotes a summary document holding unit that holds the summarized document for each classification category, and 108 denotes the summary document holding unit 10.
7 is a summary document display unit for displaying the documents held in 7.

【0014】図2は文書処理装置のハードウェアの構成
を示すブロック図である。図において、201は後述す
る図3の制御手順を記憶する制御メモリである。制御メ
モリ201はROMあるいはRAMのいずれでもよい。
202はメモリであり、前述のアクセス回数保持部10
2、入力文書保持部104、要約文書保持部107を実
現する。
FIG. 2 is a block diagram showing the hardware configuration of the document processing apparatus. In the figure, 201 is a control memory for storing the control procedure of FIG. 3 described later. The control memory 201 may be ROM or RAM.
Reference numeral 202 denotes a memory, which is the access count holding unit 10 described above.
2. The input document holding unit 104 and the summary document holding unit 107 are realized.

【0015】203は制御メモリ201に記憶されてい
る制御手順にしたがって処理を行う中央処理装置であ
る。204はディスクであり、文書データベース101
を実現する。205はディスプレイであり、要約文書表
示部108を実現する。ディスプレイ205はCRTで
あってもよいし、液晶ディスプレイであってもよい。2
06は各構成要素を接続するバスである。
Reference numeral 203 denotes a central processing unit which performs processing in accordance with the control procedure stored in the control memory 201. Reference numeral 204 denotes a disk, which is the document database 101.
To realize. Reference numeral 205 denotes a display, which implements the summary document display unit 108. The display 205 may be a CRT or a liquid crystal display. 2
Reference numeral 06 is a bus for connecting each component.

【0016】図3は文書処理装置の動作の制御手順を示
すフローチャートである。文書分類部105は入力され
た文書についての文書分類処理を行う(ステップS30
1)。文書分類処理は文書に分類カテゴリを付与する処
理であり、一般に行われているどのような手法を用いて
もよい。例えば、分類カテゴリ毎にキーワード集合を定
めておき、入力された文書にどのようなキーワードが出
現するかによって分類カテゴリを決定するようにしても
よい。
FIG. 3 is a flow chart showing the control procedure of the operation of the document processing apparatus. The document classification unit 105 performs document classification processing on the input document (step S30).
1). The document classification process is a process of assigning a classification category to a document, and any generally used method may be used. For example, a keyword set may be defined for each classification category, and the classification category may be determined according to what keyword appears in the input document.

【0017】付与された分類カテゴリのアクセス回数を
調べる(ステップS302)。アクセス回数は文書デー
タベース101に保存されている各分類カテゴリの文書
にアクセスした回数として定義できる。即ち、文書デー
タベース101から文書を検索して利用する際、アクセ
ス回数保持部102内に保持されているその文書が属す
る分類カテゴリのアクセス回数をインクリメントするよ
うにしておく。このとき、アクセス回数の総数も同時に
インクリメントする。
The number of accesses of the assigned classification category is checked (step S302). The number of times of access can be defined as the number of times the document of each classification category stored in the document database 101 is accessed. That is, when a document is searched from the document database 101 and used, the access count of the classification category to which the document belongs stored in the access count storage unit 102 is incremented. At this time, the total number of accesses is also incremented at the same time.

【0018】圧縮率計算部103はステップS302で
調べたアクセス回数からステップS301で付与された
分類カテゴリに対応する圧縮率を計算する(ステップS
303)。アクセス回数の少ない分類カテゴリほど圧縮
率が大きくなるように設定してあれば、どのような方式
にしたがって圧縮率を設定してもよい。図4はアクセス
回数に応じた圧縮率の値を示す説明図である。アクセス
回数が10回までは圧縮率を10とし、アクセス回数が
100回までは圧縮率を3とし、アクセス回数が101
回以上である場合、圧縮率を2とする。
The compression rate calculation unit 103 calculates the compression rate corresponding to the classification category assigned in step S301 from the access count checked in step S302 (step S).
303). The compression rate may be set according to any method as long as the compression rate is set to be higher for the classification category having the smaller number of accesses. FIG. 4 is an explanatory diagram showing the value of the compression rate according to the number of accesses. The compression rate is 10 until the access count is 10 times, the compression rate is 3 until the access count is 100 times, and the access count is 101.
When it is more than the number of times, the compression rate is set to 2.

【0019】文書要約部106はステップS303で計
算した圧縮率にしたがって文書を要約する(ステップS
304)。要約した結果は要約文書保持部107に保持
される。
The document summarizing section 106 sums up the document according to the compression rate calculated in step S303 (step S).
304). The summarized result is held in the summarized document holding unit 107.

【0020】未処理の文書が残っているか否かを調べる
(ステップS305)。未処理の文書が残っている場
合、ステップS301の処理に戻って文書分類処理を行
う。一方、全ての文書を処理し終わった場合、ステップ
S306に移行する。
It is checked whether any unprocessed document remains (step S305). If unprocessed documents remain, the process returns to step S301 to perform document classification processing. On the other hand, when all the documents have been processed, the process proceeds to step S306.

【0021】ステップS306では、要約文書保持部1
07に保持されている文書を分類カテゴリ毎に要約文書
表示部108に表示する。
In step S306, the summary document holding unit 1
The documents held in 07 are displayed on the summary document display unit 108 for each classification category.

【0022】図5は各分類カテゴリのアクセス回数を具
体的に示す説明図である。図6は各文書の分類カテゴリ
およびその圧縮率を示す説明図である。3つの文書がそ
れぞれ「Jリーグ」、「大相撲」、「プロ野球」に分類
された場合、それぞれの圧縮率は図5のアクセス回数に
基づき値2、10、3に設定される。即ち、文書1は分
類カテゴリが「Jリーグ」であり、「Jリーグ」のアク
セス回数は値107であるので、図4にしたがって圧縮
率は値2となる。このようにして得られた圧縮率にした
がって各文書は要約される。
FIG. 5 is an explanatory diagram specifically showing the number of times of access for each classification category. FIG. 6 is an explanatory diagram showing the classification category of each document and its compression rate. When the three documents are classified into "J League", "Grand Sumo", and "Professional Baseball", the respective compression ratios are set to the values 2, 10 and 3 based on the number of accesses in FIG. That is, since the classification category of the document 1 is “J League” and the number of accesses of “J League” is the value 107, the compression rate is the value 2 according to FIG. Each document is summarized according to the compression ratio thus obtained.

【0023】尚、上記実施の形態では、各分類カテゴリ
に対するユーザの興味の度合を分類カテゴリへのアクセ
ス回数で捉えたが、その他の手法によってもよい。例え
ば、文書データベース中の各分類カテゴリに保存されて
いる文書の数によってもよく、文書数が少ない分類カテ
ゴリほど圧縮率を高く設定するようにする。
In the above-described embodiment, the degree of user's interest in each category is grasped by the number of times the category is accessed, but other methods may be used. For example, it may depend on the number of documents stored in each classification category in the document database, and the compression rate is set to be higher for a classification category having a smaller number of documents.

【0024】また、文書を表示する際、要約だけでなく
選択によって全文も表示できるようになっている構成の
場合、全文を表示させる回数の多い分類カテゴリはユー
ザの興味の度合が高いとみなすこともできる。全文を表
示させる率、つまり、各分類カテゴリに属する文書のう
ち全文を表示させた文書の比率を保存しておき、その率
が低いほど圧縮率を高く設定するようにする。
Further, when displaying a document, in the case of a structure in which not only the summary but also the whole sentence can be displayed by selection, it is considered that the category category in which the whole sentence is frequently displayed has a high degree of interest to the user. You can also The ratio of displaying all the sentences, that is, the ratio of the documents displaying all the sentences among the documents belonging to each classification category is stored, and the compression ratio is set to be higher as the ratio is lower.

【0025】さらに、上記実施の形態では、アクセス回
数から圧縮率を決定する際、実際にアクセスした回数の
値を用いたが、全体のアクセス回数に対する比を用いて
もよい。
Furthermore, in the above embodiment, the value of the number of times of actual access was used when determining the compression rate from the number of times of access, but a ratio to the total number of times of access may be used.

【0026】また、上記実施の形態では、圧縮率はアク
セス回数だけで決まるとしたが、文書の総数を考慮する
ようにしてもよい。例えば、その時点で表示する文書の
総数をn、アクセス回数から決まる圧縮率をro、実際
の圧縮率をrとすると数式1にしたがって設定してもよ
い。
In the above embodiment, the compression rate is determined only by the number of accesses, but the total number of documents may be taken into consideration. For example, if the total number of documents to be displayed at that time is n, the compression rate determined by the number of accesses is ro, and the actual compression rate is r, the compression rate may be set according to Expression 1.

【0027】[0027]

【数1】r=ro :0<n≦50 r=ro×1.5 :50<n≦100 r=ro×2 :100<n これにより、文書総数が多い場合、全体的に圧縮率を高
めることができる。
## EQU1 ## r = ro: 0 <n ≦ 50 r = ro × 1.5: 50 <n ≦ 100 r = ro × 2: 100 <n As a result, when the total number of documents is large, the compression ratio is generally set. Can be increased.

【0028】さらに、上記実施の形態では、分類カテゴ
リ毎に圧縮率を設定して文書を要約するようにしていた
が、要約文書の字数を設定してから圧縮率を算出するよ
うにしてもよい。例えば、アクセス回数が101回以上
の場合、400文字、アクセス回数が11回以上100
回以下の場合、200文字、アクセス回数が10回以下
の場合、100文字で要約するようにする。文字数nで
文字数mの文書を要約する場合、その文書を圧縮率m/
nで要約すればよく、上記実施の形態と同じ文書要約の
手法を使うことができる。
Further, in the above embodiment, the compression rate is set for each classification category to summarize the document, but the compression rate may be calculated after setting the number of characters of the summary document. . For example, when the access count is 101 or more, 400 characters, and the access count is 11 or more and 100
If the number of times is less than or equal to 200, the number of characters is 200. If the number of times of access is less than or equal to 10, the number of characters is 100. When summarizing a document with the number of characters n and the number of characters m, the compression rate of the document is m /
It suffices to summarize with n, and the same document summarization method as in the above-described embodiment can be used.

【0029】また、上記実施の形態では、圧縮率をアク
セス回数から設定するようにしていたが、ユーザによっ
て圧縮率を任意の値に設定できる手段が用意されている
場合、各分類カテゴリに属する文書についてユーザが設
定した圧縮率の履歴から圧縮率を設定するようにしても
よい。例えば、ユーザが分類カテゴリAに属する文書を
見る際、ユーザが設定した圧縮率の平均を分類カテゴリ
Aに対する圧縮率として使うことができる。
In the above embodiment, the compression rate is set based on the number of accesses. However, if a means for setting the compression rate to an arbitrary value is prepared by the user, the document belonging to each classification category is displayed. The compression rate may be set from the history of compression rates set by the user. For example, when the user views a document belonging to the classification category A, the average compression ratio set by the user can be used as the compression ratio for the classification category A.

【0030】さらに、ユーザ自らが分類カテゴリ毎に興
味の度合を数値で設定できるようにしてもよい。
Furthermore, the user may be allowed to set the degree of interest for each classification category by a numerical value.

【0031】また、文書総数が所定数以下である場合、
文書の要約作成を中止するようにしてもよい。これによ
り、ユーザは文書の数が少ないときには即座に全文の内
容を見ることができる。
If the total number of documents is less than or equal to a predetermined number,
It is also possible to cancel the document summary creation. As a result, the user can immediately see the contents of the entire sentence when the number of documents is small.

【0032】さらに、本発明は複数の機器から構成され
るシステムに適用してもよいし、1つの機器からなる装
置に適用してもよい。また、本発明はシステムあるいは
装置にプログラムを供給することによって達成される場
合にも適用できることはいうまでもない。この場合、本
発明を達成するためのソフトウェアによって表されるプ
ログラムを格納した記憶媒体をシステムあるいは装置に
読み出すことによってそのシステムあるいは装置が本発
明の効果を享受することが可能となる。
Furthermore, the present invention may be applied to a system composed of a plurality of devices or an apparatus composed of one device. Needless to say, the present invention can be applied to a case where the present invention is achieved by supplying a program to a system or an apparatus. In this case, by reading out a storage medium storing a program represented by software for achieving the present invention into a system or an apparatus, the system or the apparatus can enjoy the effects of the present invention.

【0033】[0033]

【発明の効果】本発明の請求項1に係る文書処理装置に
よれば、文書保持手段により入力された文書を保持し、
要約手段により該保持された文書を要約する際、分類付
与手段により前記文書保持手段に保持された文書に分類
カテゴリを付与し、判定手段により該付与された分類カ
テゴリ毎にユーザの興味の度合を判定し、設定手段によ
り該判定されたユーザの興味の度合に応じて圧縮率を設
定し、前記要約手段は該設定された圧縮率にしたがって
前記文書を要約するので、ユーザの興味の度合に応じて
文書を要約することができる。したがって、限られた時
間内で効率的にユーザに情報を伝達できる。
According to the document processing apparatus of the first aspect of the present invention, the document inputted by the document holding means is held,
When summarizing the held document by the summarizing means, a classification category is given to the document held in the document holding means by the classification giving means, and the degree of interest of the user is given to each given classification category by the judging means. The setting unit determines the compression rate according to the determined degree of interest of the user, and the summarizing unit summarizes the document according to the set compression rate. Therefore, the compression rate is set according to the degree of interest of the user. Can summarize the document. Therefore, information can be efficiently transmitted to the user within a limited time.

【0034】請求項2に係る文書処理装置によれば、前
記判定手段は、前記文書が属する前記分類カテゴリにア
クセスされるアクセス回数を計数する計数手段を備え、
前記設定手段は、該計数されたアクセス回数が多いほど
前記圧縮率を低く設定するので、ユーザの興味の度合を
正しく判定することができる。
According to the document processing apparatus of the second aspect, the determining means includes counting means for counting the number of times of access to the classification category to which the document belongs,
The setting unit sets the compression rate to be lower as the counted number of accesses is larger, so that the degree of interest of the user can be correctly determined.

【0035】請求項3に係る文書処理方法によれば、入
力された文書を保持し、該保持された文書を要約する文
書処理方法において、前記保持された文書に分類カテゴ
リを付与し、該付与された分類カテゴリ毎にユーザの興
味の度合を判定し、該判定されたユーザの興味の度合に
応じて圧縮率を設定し、該設定された圧縮率にしたがっ
て前記文書を要約するので、ユーザの興味の度合に応じ
て文書を要約することができる。
According to the document processing method of the third aspect, in the document processing method for holding an input document and summarizing the held document, a classification category is given to the held document, and the given document is given. The degree of interest of the user is determined for each classified category, the compression rate is set according to the determined degree of interest of the user, and the document is summarized according to the set compression rate. Documents can be summarized according to their degree of interest.

【図面の簡単な説明】[Brief description of drawings]

【図1】実施の形態における文書処理装置の構成を示す
ブロック図である。
FIG. 1 is a block diagram showing a configuration of a document processing device according to an embodiment.

【図2】文書処理装置のハードウェアの構成を示すブロ
ック図である。
FIG. 2 is a block diagram showing a hardware configuration of a document processing apparatus.

【図3】文書処理装置の動作の制御手順を示すフローチ
ャートである。
FIG. 3 is a flowchart showing a control procedure of operation of the document processing apparatus.

【図4】アクセス回数に応じた圧縮率の値を示す説明図
である。
FIG. 4 is an explanatory diagram showing a value of a compression rate according to the number of accesses.

【図5】各分類カテゴリのアクセス回数を具体的に示す
説明図である。
FIG. 5 is an explanatory diagram specifically showing the number of times of access for each classification category.

【図6】各文書の分類カテゴリおよびその圧縮率を示す
説明図である。
FIG. 6 is an explanatory diagram showing a classification category of each document and a compression rate thereof.

【符号の説明】[Explanation of symbols]

101 文書データベース 102 アクセス回数保持部 103 圧縮率計算部 104 入力文書保持部 105 文書分類部 106 文書要約部 107 要約文書保持部 101 Document Database 102 Access Count Storage Unit 103 Compression Rate Calculation Unit 104 Input Document Storage Unit 105 Document Classification Unit 106 Document Summarization Unit 107 Summary Document Storage Unit

フロントページの続き (72)発明者 池田 裕治 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内Front Page Continuation (72) Inventor Yuji Ikeda 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 入力された文書を保持する文書保持手段
と、 該保持された文書を要約する要約手段とを備えた文書処
理装置において、 前記文書保持手段に保持された文書に分類カテゴリを付
与する分類付与手段と、 該付与された分類カテゴリ毎にユーザの興味の度合を判
定する判定手段と、 該判定されたユーザの興味の度合に応じて圧縮率を設定
する設定手段とを備え、 前記要約手段は該設定された圧縮率にしたがって前記文
書を要約することを特徴とする文書処理装置。
1. A document processing apparatus comprising document holding means for holding an input document and summarizing means for summarizing the held document, wherein a classification category is given to the document held by the document holding means. And a setting unit configured to set a compression rate according to the determined degree of interest of the user. The document processing apparatus, wherein the summarizing means summarizes the document according to the set compression rate.
【請求項2】 前記判定手段は、前記文書が属する前記
分類カテゴリにアクセスされるアクセス回数を計数する
計数手段を備え、 前記設定手段は、該計数されたアクセス回数が多いほど
前記圧縮率を低く設定することを特徴とする請求項1記
載の文書処理装置。
2. The determining means comprises counting means for counting the number of accesses to the classification category to which the document belongs, and the setting means lowers the compression rate as the counted number of accesses increases. The document processing apparatus according to claim 1, wherein the document processing apparatus is set.
【請求項3】 入力された文書を保持し、 該保持された文書を要約する文書処理方法において、 前記保持された文書に分類カテゴリを付与し、 該付与された分類カテゴリ毎にユーザの興味の度合を判
定し、 該判定されたユーザの興味の度合に応じて圧縮率を設定
し、 該設定された圧縮率にしたがって前記文書を要約するこ
とを特徴とする文書処理方法。
3. A document processing method for holding an input document and summarizing the held document, wherein a classification category is given to the held document, and a user's interest is given to each given classification category. A document processing method comprising: determining a degree, setting a compression rate according to the determined degree of interest of a user, and summarizing the document according to the set compression rate.
JP8034193A 1996-01-30 1996-01-30 Document processor and its method Pending JPH09212505A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8034193A JPH09212505A (en) 1996-01-30 1996-01-30 Document processor and its method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8034193A JPH09212505A (en) 1996-01-30 1996-01-30 Document processor and its method

Publications (1)

Publication Number Publication Date
JPH09212505A true JPH09212505A (en) 1997-08-15

Family

ID=12407347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8034193A Pending JPH09212505A (en) 1996-01-30 1996-01-30 Document processor and its method

Country Status (1)

Country Link
JP (1) JPH09212505A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11203305A (en) * 1998-01-12 1999-07-30 Ricoh Co Ltd Method for processing document picture and recording medium
JP2001092755A (en) * 1999-09-24 2001-04-06 Fujitsu Ltd Method and system for preparing profile
JP2004506961A (en) * 2000-03-16 2004-03-04 マイクロソフト コーポレイション Generate and manage priorities
JP2005122710A (en) * 1998-08-13 2005-05-12 Internatl Business Mach Corp <Ibm> System for tracing use of electronic content by end user
JP2008065469A (en) * 2006-09-05 2008-03-21 Sharp Corp Electronic equipment, its control method and program for outputting written translation
JP2010020678A (en) * 2008-07-14 2010-01-28 Nippon Telegr & Teleph Corp <Ntt> Document summarization device, document summarization method, program and recording medium
JP2010044612A (en) * 2008-08-13 2010-02-25 Fujitsu Ltd Data browsing management system
JP2015032281A (en) * 2013-08-07 2015-02-16 富士ゼロックス株式会社 Document management device and document management program
US9146933B2 (en) 2011-12-22 2015-09-29 International Business Machines Corporation Compressed storage access system with uncompressed frequent use data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101990A (en) * 1995-07-31 1997-04-15 Toshiba Corp Information filtering device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101990A (en) * 1995-07-31 1997-04-15 Toshiba Corp Information filtering device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11203305A (en) * 1998-01-12 1999-07-30 Ricoh Co Ltd Method for processing document picture and recording medium
JP2005122710A (en) * 1998-08-13 2005-05-12 Internatl Business Mach Corp <Ibm> System for tracing use of electronic content by end user
JP2001092755A (en) * 1999-09-24 2001-04-06 Fujitsu Ltd Method and system for preparing profile
JP2004506961A (en) * 2000-03-16 2004-03-04 マイクロソフト コーポレイション Generate and manage priorities
JP2008065469A (en) * 2006-09-05 2008-03-21 Sharp Corp Electronic equipment, its control method and program for outputting written translation
JP2010020678A (en) * 2008-07-14 2010-01-28 Nippon Telegr & Teleph Corp <Ntt> Document summarization device, document summarization method, program and recording medium
JP2010044612A (en) * 2008-08-13 2010-02-25 Fujitsu Ltd Data browsing management system
US9146933B2 (en) 2011-12-22 2015-09-29 International Business Machines Corporation Compressed storage access system with uncompressed frequent use data
JP2015032281A (en) * 2013-08-07 2015-02-16 富士ゼロックス株式会社 Document management device and document management program

Similar Documents

Publication Publication Date Title
US6701362B1 (en) Method for creating user profiles
US7840538B2 (en) Discovering query intent from search queries and concept networks
JP3390553B2 (en) Table of contents indexing device
KR100898454B1 (en) Integrated search service system and method
US20140046957A1 (en) Alerting Users to Items of Current Interest
US7974975B2 (en) Method and apparatus for distributing information to users
US6493707B1 (en) Hypervideo: information retrieval using realtime buffers
US6559864B1 (en) Method and system for displaying and providing access to data on a monitor
US6490580B1 (en) Hypervideo information retrieval usingmultimedia
US20140172642A1 (en) Analyzing commodity evaluations
US20030191754A1 (en) Hypervideo: information retrieval at user request
US7502774B2 (en) Ring method, apparatus, and computer program product for managing federated search results in a heterogeneous environment
US20120254127A1 (en) Computer-implemented method of determining validity of a command line
US6721744B1 (en) Normalizing a measure of the level of current interest of an item accessible via a network
CN111767393A (en) Text core content extraction method and device
JPH09212505A (en) Document processor and its method
US6311198B1 (en) Method and system for threading documents
JP2937519B2 (en) Document search device
CN111401039A (en) Word retrieval method, device, equipment and storage medium based on binary mutual information
JPH08335265A (en) Document processor and its method
CN106033417A (en) A sorting method and device for video search for series
JP3692416B2 (en) Information filtering method and apparatus
JP2000227922A (en) Information retrieval device and method therefor, and recording medium recording program for executing its method
JP2980067B2 (en) Document categorizing apparatus and machine-readable recording medium recording program
JPH1185764A (en) Method and device for statistically estimating number of retrieved result and storage medium storing statistical estimation program for number of retrieved result

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050301