JPH0535732A - Document display device - Google Patents

Document display device

Info

Publication number
JPH0535732A
JPH0535732A JP3320881A JP32088191A JPH0535732A JP H0535732 A JPH0535732 A JP H0535732A JP 3320881 A JP3320881 A JP 3320881A JP 32088191 A JP32088191 A JP 32088191A JP H0535732 A JPH0535732 A JP H0535732A
Authority
JP
Japan
Prior art keywords
document
display
input
type
selecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3320881A
Other languages
Japanese (ja)
Inventor
Toru Matsuda
透 松田
Makoto Ishii
信 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPH0535732A publication Critical patent/JPH0535732A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To reduce the document understanding labor of en operator by discriminating the important words/phrases from the unimportant ones and also deciding the document type. CONSTITUTION:The document data are inputted by a document input means 1, and an input document is divided by a document dividing means 2 into several parts of different types of performance. A display output means 3 has plural display forms to each character according to the difference of attributes like the presence or absence of underlines, the font, the color, and the luminance, etc. Then the means 3 uses these display forms after selecting them for each character. A control means 4 selects the display forms of the characters included in the divided parts of the input document in accordance with the characteristic of each part to control the means 3.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【技術分野】本発明は、文書表示装置に関し、より詳細
には、文書を取り扱う情報機器一般(印刷装置を含む)
の、使用者の視覚を用いての情報提示手段を有する文書
表示装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document display device, and more particularly to general information equipment for handling documents (including a printing device).
The present invention relates to a document display device having information presenting means using the visual sense of the user.

【0002】[0002]

【従来技術】現在広く用いられている文書処理装置の表
示手段は、各文字に対してアンダーラインの有無・フォ
ント・色などの属性の違いによる複数の表示形を有する
ものが多く、表示形を文書によって切替えれば使用者が
その文書を理解する上での労力を軽減することができる
はずであるが、その表示形の切替えは文書データ内部に
埋め込まれた制御文字あるいは使用者によるスイッチ切
替えによっている。重要語句検出器については、例え
ば、特公昭57−21720号公報に連続非同期式相関
動作を利用することによって連続言語内のキーワードを
検出するシステムが記載されている。また、抽出不要な
文字列を不要語ファイルに記憶し、そのファイルを参照
して文章中の不要語を除き、キーワードを抽出すること
により、抽出処理を簡単にして、処理時間の短縮を図
り、日本語文のデータを高速にて処理することも知られ
ている。
2. Description of the Related Art Many of the display means of document processing apparatuses that are widely used at present have a plurality of display forms depending on attributes such as presence / absence of underline, font and color for each character. Although it should be possible to reduce the effort for the user to understand the document if it is switched according to the document, the display form can be switched by the control characters embedded in the document data or the switch switching by the user. There is. Regarding the important word detector, for example, Japanese Patent Publication No. 57-21720 discloses a system for detecting a keyword in a continuous language by utilizing a continuous asynchronous correlation operation. In addition, by storing unnecessary extraction character strings in an unnecessary word file, removing unnecessary words in sentences by referring to the file, and extracting keywords, the extraction process is simplified and the processing time is shortened. It is also known to process Japanese sentence data at high speed.

【0003】さらに、メモリにキーワードとして不適切
な語を分野別に収容した辞書テーブルを備えることによ
り、登録すべき文書に最も適切な語をキーワードとし
て、その文書中の出現頻度順に表示することも知られて
いる。さらに、文中で強調されている区間でキーワード
の探索を行うことにより、計算量を削減して効率よくキ
ーワードを捜すことができるようにすることも知られて
いる。また、先に提案されたものとして、文書種別を自
動判別して文書全体に対する表示形を切替える「文書表
示装置」がある。また、重要語句検出器についても提案
されている。
Further, it is also known that a memory is provided with a dictionary table accommodating unsuitable words as keywords for each field so that words most suitable for a document to be registered can be displayed as keywords in order of appearance frequency in the document. Has been. Further, it is also known that a keyword can be searched for in an emphasized section in a sentence so that the amount of calculation can be reduced and the keyword can be searched efficiently. Further, as previously proposed, there is a "document display device" that automatically determines the document type and switches the display form for the entire document. Also, an important word detector has been proposed.

【0004】文書データ内部に表示形切替え制御文字を
埋め込みを行なう場合には、文書作成時に作成者が余分
な作業を要求され、使用者がスイッチ切替えを行なう場
合には、使用者が余分な作業を要求され、そのいずれも
行なわない場合には、文書の性質にかかわらず表示形が
一定になるため文書の個性が埋没してしまい、使用者が
文書を理解するための労力を軽減することができないと
いう問題点があった。特に重要語句と非重要語句が異な
る表示形で表示されないため、使用者は表示された文書
を丹念に見なければ文書の内容が分からないという問題
点があった。また、例えば、入力文書を重要語句と非重
要語句とに分割する文書分割手段を考えても、どのよう
な語句が重要であるかは文書種別毎に異なっている。し
たがって、文書種別によらずに共通の文書分割手段を用
いるのは適切でない。
When embedding a display type switching control character inside the document data, the creator is required to perform extra work when the document is created, and when the user switches the switch, the user performs extra work. If you do not do any of the above, and the display form is constant regardless of the nature of the document, the individuality of the document will be buried, and the effort for the user to understand the document can be reduced. There was a problem that it could not be done. Particularly, since the important words and the unimportant words are not displayed in different display forms, there is a problem that the user cannot understand the contents of the displayed document unless he or she carefully looks at the displayed document. Further, for example, even when considering a document dividing unit that divides an input document into important words and unimportant words, what kind of words are important is different for each document type. Therefore, it is not appropriate to use the common document dividing means regardless of the document type.

【0005】次に、文書種別の判別については、編集シ
ステムによっては文書内部に埋め込まれた文書種別指定
コマンドや文書名に応じて編集モードを切替えるものも
ある。(例:emacsにおいては、最初の非空白行に「-*-
C-*-」という文字列が含まれていたり、最初の非空白行
で特に種別指定がなく文書名が.cや.hで終っていたりす
れば、Cプログラム編集モードとなる(“GNU Emac
s Manual”第18章))。
Next, regarding the discrimination of the document type, depending on the editing system, the editing mode may be switched according to the document type designation command embedded in the document or the document name. (Example: In emacs, "-*-" is added to the first non-blank line.
If the character string "C-*-" is included, or if the document name ends with .c or .h in the first non-blank line and no type is specified, the C program edit mode is set ("GNU Emac
s Manual ”Chapter 18)).

【0006】文書種別の判別については、文書内部に種
別指定コマンドの埋め込みを行う場合には、やはり文書
作成者が余分な作業を要求され、文書名で判別する場合
には、文書作成者が文書名を意識的に管理することを要
求される上、まだ文書名を付けていない新規作成時に
は、この方法による判別は無効であるという問題点があ
った。
Regarding the discrimination of the document type, when the type designation command is embedded in the document, the document creator is still required to perform extra work. In addition to being required to manage the names consciously, there is a problem that the discrimination by this method is invalid at the time of new creation without assigning a document name.

【0007】[0007]

【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、重要語句と非重要語句とを異なった表示形で表
示し、文書を理解するための労力を軽減させること、ま
た、文書種別の判別を行い、まだ文書名を付けていない
新規作成時にも文書作成と並行して種別判定を行なうこ
と、更には、文書種別に応じて文書分割手段を切替え
て、各種の文書に柔軟に対応するようにした文書表示装
置を提供することを目的としてなされたものである。
[Object] The present invention has been made in view of the above-mentioned circumstances, and reduces an effort to understand a document by displaying important phrases and insignificant phrases in different display forms. The type is determined, the type is determined in parallel with the document creation even when a new document name is not assigned yet, and the document dividing means is switched according to the document type to flexibly handle various documents. The object is to provide a corresponding document display device.

【0008】[0008]

【構成】本発明は、上記目的を達成するために、(1)
文書データを入力する文書入力手段と、該文書入力手段
により入力された文書を性質の異なるいくつかの部分に
分割する文書分割手段と、各文字に対して属性の違いに
よる複数の表示形を有して表示に際して保有する複数の
表示形を文字ごとに選択して使用できる表示出力手段
と、前記文書分割手段で分割された入力文書の各部分の
性質に応じてその部分に含まれる文字の表示形を選択し
て前記表示出力手段を制御する制御手段とから成り、入
力文書の各部分の性質に応じて自動的に使用する表示形
を選択すること、更には、(2)前記文書分割手段にお
いて、前記入力文書から重要語句を検出する重要語句検
出手段を有し、前記入力文書を重要語句と非重要語句と
に分割すること、或いは、(3)文書データを入力する
文書入力手段と、該文書入力手段により入力された文書
の種類を判別する文書種類判別手段と、各文字に対して
属性の違いによる複数の表示形を有して表示に際して保
有する複数の表示形を選択して使用できる表示出力手段
と、前記文書種別判別手段で判別された入力文書種別に
応じて表示形を選択して前記表示出力手段を制御する制
御手段とから成り、入力文書の種別に応じて自動的に使
用する表示形を選択すること、更には、(4)前記文書
種別判別手段が、文書の定型パターンを記憶する定型パ
ターン記憶部および該定型パターン記憶部に記憶された
文書定型パターンと入力文書を照合するパターン照合部
および制御部からなる定型パターン検出部と、語彙と文
書種別との対応を記憶する種別対応語彙記憶部および形
態素解析部および該形態素解析部の出力と該種別対応語
彙記憶部に記憶されたデータとを照合する照合部および
制御部からなる種別対応語彙検出部との、少なくとも一
方を有し、検出された定型パターンと種別対応語彙の少
なくとも一方を用いて入力文書の種別を判別すること、
或いは、(5)文書データを入力する文書入力手段と、
該文書入力手段により入力された文書の種類を判別する
文書種類判別手段と、前記文書入力手段により入力され
た文書を性質の異なるいくつかの部分に分割する文書分
割手段と、前記文書種類判別手段で判別された文書種別
に応じて文書分割手段を選択する選択手段と、各文字に
対して属性の違いによる複数の表示形を有して表示に際
して保有する複数の表示形を文字ごとに選択して使用で
きる表示出力手段と、前記選択手段で選択された文書分
割手段によって分割された入力文書の各部分の性質に応
じてその部分に含まれる文字の表示形を選択して前記表
示出力手段を制御する制御手段とを有し、入力文書の各
部分の性質に応じて自動的に使用する表示形を選択する
ことを特徴としたものである。以下、本発明の実施例に
基づいて説明する。
In order to achieve the above object, the present invention provides (1)
Document input means for inputting document data, document dividing means for dividing the document input by the document input means into several parts having different characteristics, and a plurality of display forms depending on the attribute for each character are provided. A display output means capable of selecting and using for each character a plurality of display forms possessed at the time of display, and a display of the characters included in the portion of the input document divided by the document dividing means according to the nature of each portion. Selecting a shape and controlling the display output means, automatically selecting a display shape to be used according to the property of each part of the input document, and (2) the document dividing means. In the above, there is provided an important word detecting means for detecting an important word from the input document, and the input document is divided into an important word and an unimportant word, or (3) a document input means for inputting document data, The A document type discriminating means for discriminating the type of the document input by the handwriting inputting means, and a plurality of display types for each character having different attributes can be selected and used for display. The display / output means and the control means for controlling the display / output means by selecting a display form according to the input document type determined by the document type determination means are used automatically according to the type of the input document. And (4) the document type discrimination means collates the fixed pattern pattern storage unit for storing the fixed pattern pattern of the document and the document fixed pattern pattern stored in the fixed pattern pattern storage unit with the input document. A fixed pattern detection unit including a pattern matching unit and a control unit, a type-corresponding vocabulary storage unit that stores the correspondence between a vocabulary and a document type, a morphological analysis unit, and And at least one of a type-corresponding vocabulary detection unit including a collating unit and a control unit for collating the data stored in the type-corresponding vocabulary storage unit, and at least one of the detected fixed pattern and the type-corresponding vocabulary. Determine the type of input document using
Alternatively, (5) document input means for inputting document data,
A document type discriminating means for discriminating the type of the document input by the document inputting means, a document dividing means for dividing the document input by the document inputting means into several parts having different properties, and the document type discriminating means. The selecting means for selecting the document dividing means according to the document type determined by the above, and the plural display shapes which have plural display shapes depending on the attribute for each character and which are held at the time of display are selected for each character. Display output means that can be used as the display output means, and the display output means by selecting the display form of the characters included in the portion of the input document divided by the document dividing means selected by the selecting means according to the property of each portion. It is characterized by having a control means for controlling and automatically selecting a display form to be used in accordance with the property of each part of the input document. Hereinafter, description will be given based on examples of the present invention.

【0009】図1は、本発明による文書表示装置の一実
施例を説明するための構成図で、図中、1は文書入力手
段、2は文書分割手段、3は表示出力手段、4は制御手
段である。文書入力手段1により文書データを入力し、
文書分割手段2により入力された文書を性質の異なるい
くつかの部分に分割する。表示出力手段3は、各文字に
対してアンダーラインの有無・フォント・色・輝度など
の属性の違いによる複数の表示形を有して表示に際して
保有する複数の表示形を文字ごとに選択して使用する。
制御手段4は文書分割手段2で分割された入力文書の各
部分の性質に応じてその部分に含まれる文字の表示形を
選択して表示出力手段3を制御する。
FIG. 1 is a block diagram for explaining an embodiment of a document display device according to the present invention. In the figure, 1 is a document input means, 2 is a document dividing means, 3 is a display output means, and 4 is a control. It is a means. Input the document data by the document input means 1,
The document inputted by the document dividing means 2 is divided into several parts having different properties. The display output means 3 has a plurality of display forms depending on attributes such as presence / absence of underline, font, color, and brightness for each character, and selects a plurality of display forms possessed at the time of display for each character. use.
The control means 4 controls the display output means 3 by selecting the display form of the characters contained in the portion of the input document divided by the document dividing means 2 according to the property of each portion.

【0010】すなわち、図1中の文書入力手段1で入力
された文書データが、文書分割手段2でいくつかの部分
に分割された後、表示出力手段3で表示される。この
時、その表示形は、制御手段4で文書の分割された各部
分の性質に対応するものが選択される。その選択方法と
しては、例えば、文書内の位置を性質とみなして1行ご
とに背景色を変えるとか、重要度を性質とみなして重要
語句の部分は太字のフォントを使うとかの、部分の性質
と表示形の対応づけを保有したデータベースを有してそ
れを検索するなどが考えられる。文書を位置によって分
割して1行ごとに背景色を変えるという単純なもので
も、使用者が読んでいる箇所を見失うことが少なくなる
ため、その文書を理解する上での労力が軽減される。
That is, the document data input by the document input means 1 in FIG. 1 is divided into several parts by the document dividing means 2 and then displayed by the display output means 3. At this time, the display form is selected by the control means 4 so as to correspond to the property of each divided portion of the document. As the selection method, for example, the position in the document is regarded as a property and the background color is changed for each line, or the importance is regarded as a property and a bold word is used for a part of the important phrase. It is conceivable to have a database that holds the correspondence between the and display forms and search it. Even if the document is divided according to position and the background color is changed line by line, the user is less likely to lose track of what is being read, thus reducing the effort for understanding the document.

【0011】文書を重要語句の部分と非重要語句の部分
に分割する請求項2の文書分割手段においては、入力文
書を、重要語句検出器によって検出された重要語句の部
分と、それ以外の部分とに分割する。重要語句検出器は
従来のものを使用するが、この文書分割手段の性能は重
要語句検出器の性質に大きく依存する。この分割手段を
請求項1の文書表示装置で用い、重要語句を強調して表
示すれば、使用者は重要な箇所をあらかじめ知ってから
文書を読むことができ、また重要語句だけを斜め読みし
ても文書内容の概要を把握できるため、文書内容を理解
するための使用者の労力を特に軽減することができる。
なお、文書分割手段としては、請求項2のものの他に、
文書内の位置を性質となみして位置により文書を分割す
る単純なものなども考えられる。
According to another aspect of the document dividing means of the present invention, the input document is divided into an important word portion and an insignificant word portion, and the input document is an important word portion detected by the important word detector and other portions. Split into and. Although a conventional important word detector is used, the performance of this document segmentation means depends largely on the nature of the important word detector. If this dividing means is used in the document display device according to claim 1 and the important words are emphasized and displayed, the user can read the document after knowing the important points in advance, and can read only the important words diagonally. However, since the outline of the document content can be grasped, the labor of the user for understanding the document content can be particularly reduced.
As the document dividing means, in addition to the one described in claim 2,
A simple one in which the position in the document is regarded as a property and the document is divided according to the position may be considered.

【0012】図2は、本発明による文書表示装置の他の
実施例を示す図で、図中、11は文書入力手段、12は
文書種別判別手段、13は表示出力手段、14は制御手
段である。文書入力手段11により文書データを入力
し、文書種別判別手段12により入力された文書の種別
を判別する。表示出力手段13は、各文字に対してアン
ダーラインの有無・フォント・色・輝度などの属性の違
いによる複数の表示形を有して表示に際して保有する複
数の表示形を選択して使用する。制御手段14は、文書
種別判別手段12で判別された入力文書種別に応じて表
示形を選択して表示出力手段13を制御する。
FIG. 2 is a diagram showing another embodiment of the document display device according to the present invention. In the figure, 11 is a document input means, 12 is a document type discrimination means, 13 is a display output means, and 14 is a control means. is there. The document input unit 11 inputs the document data, and the document type determination unit 12 determines the type of the input document. The display output means 13 has a plurality of display forms depending on attributes such as presence / absence of underline / font / color / brightness for each character, and selects and uses a plurality of display forms held at the time of display. The control unit 14 controls the display output unit 13 by selecting a display form according to the input document type determined by the document type determination unit 12.

【0013】すなわち、図2中の文書入力手段11で入
力された文書データが、文書種別判別手段12での文書
種別に用いられた後、表示出力手段13で表示される。
この時、その表示形は、制御手段14で、文書種別判別
手段12による判別結果に対応するものが選択される。
その選択方法としては、例えば、プログラムは固定幅の
タイプライターフォントで表示するとか、通常英文書は
romanフォントなどの固定幅でないフォントで表示する
とか、日本語の口語で書かれたくだけた文書は手書き風
のフォントで表示するとかの、文書種別と表示形の対応
づけを保有したデータベースを有してそれを検索するな
どが考えられる。以下に文書種別判別手段における処理
の請求項4に対応する例を挙げるが、請求項3に関して
いえば、これは従来通りの文書名などから文書種別を判
別する簡単なものでも良い。
That is, the document data input by the document input means 11 in FIG. 2 is used for the document type by the document type determination means 12, and then displayed by the display output means 13.
At this time, the display form selected by the control means 14 corresponds to the discrimination result by the document type discrimination means 12.
As a selection method, for example, the program is displayed in a fixed width typewriter font,
It has a database that holds correspondences between document types and display forms, such as displaying in non-fixed width fonts such as roman font, or displaying handwritten fonts in documents that are written in Japanese colloquial language. It may be possible to search for it. An example corresponding to claim 4 of the processing in the document type discriminating means will be given below, but as for claim 3, this may be a simple one for discriminating the document type from a conventional document name or the like.

【0014】図3は、文書種別判別手段の構成図で、図
中、15は定型パターン検出部、16は定型パターン照
合部、17は定型パターン記憶部、18は制御部、19
は種別対応語彙検出部、20は形態素解析部、21は種
別対応語彙照合部、22は種別対応語彙記憶部、23,
24は制御部である。定型パターン記憶部17には、文
書中に「会議開催通知」という行が存在すればその文書
は会議開催通知であるとか、「From:」で始まる行と「T
o:」で始まる行が存在すればその文書は電子メールか電
子ニュース記事であるとか、「♯include」で始まる行が
存在すればその文書はCプログラムであるとかの、文書
種別に特有の定型パターンと文書種別との対応付けが記
憶されており、定型パターン照合部16においてそれら
の定型パターンと入力文書との照合が行なわれる。入力
文書が複数の定型パターンと照合に成功し、それらの定
型パターンが対応する文書種別が同一でない場合の競合
解消は、定型パターン検出部15では行なわれず、文書
判別手段全体の制御部24で行なわれる。ただし、競合
解消のための情報を、定型パターン記憶部17に記憶す
るデータに付加しておくことは十分考えられる。
FIG. 3 is a block diagram of the document type discriminating means. In the figure, 15 is a fixed pattern detection unit, 16 is a fixed pattern matching unit, 17 is a fixed pattern storage unit, 18 is a control unit, and 19 is a control unit.
Is a type-corresponding vocabulary detecting unit, 20 is a morpheme analyzing unit, 21 is a type-corresponding vocabulary collating unit, 22 is a type-corresponding vocabulary storage unit, 23,
Reference numeral 24 is a control unit. If the line “conference holding notice” exists in the document in the fixed pattern storage unit 17, the document is a notice holding the conference, or a line starting with “From:” and “T:
If a line starting with "o:" exists, the document is an email or an electronic news article, or if a line starting with "#include" exists, the document is a C program. Correspondences between patterns and document types are stored, and the fixed pattern matching unit 16 matches the fixed patterns with the input document. When the input document is successfully matched with a plurality of standard patterns and the document types corresponding to the standard patterns are not the same, the conflict resolution is not performed by the standard pattern detection unit 15, but is performed by the control unit 24 of the entire document discrimination means. Be done. However, it is sufficiently conceivable to add information for conflict resolution to the data stored in the fixed pattern storage unit 17.

【0015】種別対応語彙記憶部22には、文書中に
「さ」、「な」、「ね」、「よ」などの口語間投助詞が
存在すればその文書は口語で書き表されたくだけた文書
であるとかいった、語彙と文書種別との対応づけが記憶
されており、種別対応語彙照合部21においてそれらの
種別対応語彙と形態素解析部26の出力との照合が行な
われる。なお、競合が生じた場合は、競合解消はやはり
文書判別手段全体の制御部24で行なわれるが、競合解
消のための情報を種別対応語彙記憶部22に記憶するデ
ータに付加しておくことも十分考えられる。
If the type-corresponding vocabulary storage unit 22 has colloquial interjectional particles such as "sa", "na", "ne", and "yo" in the document, the document only needs to be written in colloquial language. The correspondence between the vocabulary and the document type, such as a document, is stored, and the type-corresponding vocabulary collating unit 21 collates the type-corresponding vocabulary with the output of the morphological analysis unit 26. When a conflict occurs, the conflict is resolved by the control unit 24 of the entire document discriminating means, but information for conflict resolution may be added to the data stored in the type-corresponding vocabulary storage unit 22. I think enough.

【0016】種別選択手段全体の制御部24では、定型
パターン検出部15と種別対応語彙検出部19とのう
ち、種別選択手段を構成しているものすべての検出結果
を用いて文書種別を判別する。競合が発生した場合の優
先順位づけの方法としては、各文書種別に対応する定型
パターンや語彙の検出を単純に計算するとか、定型パタ
ーン記憶部17や種別対応語彙記憶部22に記憶されて
いるデータに競合解消用情報として重みを付加しておい
て、各文書種別に対応する定型パターンや語彙の検出を
重みつきで計数するとかが考えられる。なお、文書種別
判別手段は、定型パターン検出部と種別対応語彙検出部
の一方のみから構成されることも考えられる。
The control unit 24 of the entire type selection unit discriminates the document type by using the detection results of all of the fixed pattern detection unit 15 and the type-corresponding vocabulary detection unit 19 constituting the type selection unit. . As a method of prioritizing when a conflict occurs, detection of a fixed pattern or vocabulary corresponding to each document type is simply calculated, or stored in the fixed pattern storage unit 17 or the type-corresponding vocabulary storage unit 22. It is conceivable that a weight is added to the data as conflict resolution information and the detection of a fixed pattern or vocabulary corresponding to each document type is counted with a weight. It should be noted that the document type discriminating means may be composed of only one of the fixed pattern detecting unit and the type corresponding vocabulary detecting unit.

【0017】このように、文書種別判別手段、文書分割
手段については前述してある。どのような語句が重要で
あるかは文書種別毎に異なるので、重要度による文書分
割手段も文書種別毎に複数存在しうる。例えば、入力文
書がプログラムの場合は、関数定義や制御構造を示す部
分が重要であるし、新聞記事などの場合は5W1Hを表
す部分が重要である。入力文書がC言語のプログラムで
あった場合を想定する。文書種別判別手段により、その
特有の語彙からC言語のプログラムであることが判別さ
れる。その場合の文書分割手段としては、たとえば/*
と/*で囲まれた部分、if,for,whileなどのキーワー
ド、それ以外の部分に3分するものが考えられる。文書
分割選択手段でC言語のプログラムに対してこの分割手
段を選べば、プログラムは、コメント、キーワード、そ
れ以外に分割されるので、例えば、コメントをイタリッ
クで、キーワードを太字で、それ以外をタイプライター
フォントで表示することにより、可読性を増すことがで
きる。
As described above, the document type discriminating means and the document dividing means have been described above. Since what word is important differs for each document type, there may be a plurality of document dividing means depending on the degree of importance for each document type. For example, when the input document is a program, the part indicating the function definition or control structure is important, and in the case of a newspaper article or the like, the part indicating 5W1H is important. Assume that the input document is a C language program. The document type discriminating means discriminates the program in the C language from the unique vocabulary. In that case, the document dividing means is, for example, / *
It is possible to divide into 3 parts in the part surrounded by and / *, keywords such as if, for, while, and other parts. If this division means is selected for a C language program by the document division selection means, the program is divided into comments, keywords, and others. For example, comments are italic, keywords are bold, and the others are typed. Readability can be increased by displaying in a writer font.

【0018】[0018]

【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)請求項1,3に対応する効果;文書作成者や使用
者に余分な作業を要求することなく、使用者が文書を理
解するための労力を軽減することができる。 (2)請求項2に対応する効果;使用者が文書を理解す
るための労力を特に軽減することができる。 (3)請求項4に対応する効果;文書作成者が余分な作
業を要求せず文書種別の判別を行なうことができる。ま
た、まだ文書名を付けていない新規作成時にも、文書作
成と並行して種別判定を行なっていくことができる。 (4)請求項5に対応する効果;文書種別に応じて文書
分割手段を切替えて、各種の文書に柔軟に対応するので
その可読性を増すように表示することができる。
As is apparent from the above description, the present invention has the following effects. (1) Effects corresponding to claims 1 and 3; The labor for the user to understand the document can be reduced without requiring extra work for the document creator and the user. (2) Effect corresponding to claim 2; The labor for the user to understand the document can be particularly reduced. (3) Effect corresponding to claim 4; The document creator can determine the document type without requesting extra work. In addition, when creating a new document that has not been given a document name, the type determination can be performed in parallel with the document creation. (4) Effect corresponding to claim 5: Since the document dividing means is switched according to the document type to flexibly deal with various documents, it is possible to display the readability so as to increase the readability.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明による文書表示装置の一実施例を説明
するための構成図である。
FIG. 1 is a configuration diagram for explaining an embodiment of a document display device according to the present invention.

【図2】 本発明による文書表示装置の他の実施例を示
す図である。
FIG. 2 is a diagram showing another embodiment of the document display device according to the present invention.

【図3】 文書種別判別手段の構成図である。FIG. 3 is a configuration diagram of a document type determination unit.

【符号の説明】[Explanation of symbols]

1…文書入力手段、2…文書分割手段、3…表示出力手
段、4…制御手段。
1 ... document input means, 2 ... document dividing means, 3 ... display output means, 4 ... control means.

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 文書データを入力する文書入力手段と、
該文書入力手段により入力された文書を性質の異なるい
くつかの部分に分割する文書分割手段と、各文字に対し
て属性の違いによる複数の表示形を有して表示に際して
保有する複数の表示形を文字ごとに選択して使用できる
表示出力手段と、前記文書分割手段で分割された入力文
書の各部分の性質に応じてその部分に含まれる文字の表
示形を選択して前記表示出力手段を制御する制御手段と
から成り、入力文書の各部分の性質に応じて自動的に使
用する表示形を選択することを特徴とする文書表示装
置。
1. A document input means for inputting document data,
Document dividing means for dividing the document input by the document inputting means into several parts having different properties, and a plurality of display shapes held for displaying each character having a plurality of display shapes depending on the attribute And a display output means for selecting and using each character, and a display output means for selecting the display form of the characters included in the portion of the input document divided by the document dividing means according to the property of each portion. A document display device characterized by comprising control means for controlling and automatically selecting a display form to be used according to the property of each part of the input document.
【請求項2】 前記文書分割手段において、前記入力文
書から重要語句を検出する重要語句検出手段を有し、前
記入力文書を重要語句と非重要語句とに分割することを
特徴とする請求項1記載の文書表示装置。
2. The document dividing means has an important word detecting means for detecting an important word from the input document, and divides the input document into important words and insignificant words. Document display device described.
【請求項3】 文書データを入力する文書入力手段と、
該文書入力手段により入力された文書の種類を判別する
文書種類判別手段と、各文字に対して属性の違いによる
複数の表示形を有して表示に際して保有する複数の表示
形を選択して使用できる表示出力手段と、前記文書種別
判別手段で判別された入力文書種別に応じて表示形を選
択して前記表示出力手段を制御する制御手段とから成
り、入力文書の種別に応じて自動的に使用する表示形を
選択することを特徴とする文書表示装置。
3. Document input means for inputting document data,
A document type discriminating means for discriminating the type of the document input by the document inputting means, and a plurality of display types for each character having a plurality of display forms depending on the attribute are selected and used. And display control means for controlling the display output means by selecting a display form according to the input document type determined by the document type determination means, and automatically according to the input document type. A document display device characterized by selecting a display form to be used.
【請求項4】 前記文書種別判別手段が、文書の定型パ
ターンを記憶する定型パターン記憶部および該定型パタ
ーン記憶部に記憶された文書定型パターンと入力文書を
照合するパターン照合部および制御部からなる定型パタ
ーン検出部と、語彙と文書種別との対応を記憶する種別
対応語彙記憶部および形態素解析部および該形態素解析
部の出力と該種別対応語彙記憶部に記憶されたデータと
を照合する照合部および制御部からなる種別対応語彙検
出部との、少なくとも一方を有し、検出された定型パタ
ーンと種別対応語彙の少なくとも一方を用いて入力文書
の種別を判別することを特徴とする請求項3記載の文書
表示装置。
4. The document type discriminating means is composed of a fixed pattern storage section for storing fixed pattern patterns of a document, a pattern matching section for checking a document fixed pattern stored in the fixed pattern storage section and an input document, and a control section. A fixed pattern detection unit, a type-corresponding vocabulary storage unit that stores the correspondence between a vocabulary and a document type, a morpheme analysis unit, and a collation unit that collates the output of the morpheme analysis unit and the data stored in the type-corresponding vocabulary storage unit. And a type-corresponding vocabulary detection unit including a control unit, and the type of the input document is determined using at least one of the detected fixed pattern and the type-corresponding vocabulary. Document display device.
【請求項5】 文書データを入力する文書入力手段と、
該文書入力手段により入力された文書の種類を判別する
文書種類判別手段と、前記文書入力手段により入力され
た文書を性質の異なるいくつかの部分に分割する文書分
割手段と、前記文書種類判別手段で判別された文書種別
に応じて文書分割手段を選択する選択手段と、各文字に
対して属性の違いによる複数の表示形を有して表示に際
して保有する複数の表示形を文字ごとに選択して使用で
きる表示出力手段と、前記選択手段で選択された文書分
割手段によって分割された入力文書の各部分の性質に応
じてその部分に含まれる文字の表示形を選択して前記表
示出力手段を制御する制御手段とを有し、入力文書の各
部分の性質に応じて自動的に使用する表示形を選択する
ことを特徴とする文書表示装置。
5. Document input means for inputting document data,
A document type discriminating means for discriminating the type of the document input by the document inputting means, a document dividing means for dividing the document input by the document inputting means into several parts having different properties, and the document type discriminating means. The selecting means for selecting the document dividing means according to the document type determined by the above, and the plural display shapes which have plural display shapes depending on the attribute for each character and which are held at the time of display are selected for each character. Display output means that can be used as the display output means, and the display output means by selecting the display form of the characters included in the portion of the input document divided by the document dividing means selected by the selecting means according to the property of each portion. A document display device having a control means for controlling, and automatically selecting a display form to be used according to the property of each part of the input document.
JP3320881A 1991-05-16 1991-11-08 Document display device Pending JPH0535732A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP14111491 1991-05-16
JP3-141114 1991-05-16

Publications (1)

Publication Number Publication Date
JPH0535732A true JPH0535732A (en) 1993-02-12

Family

ID=15284490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3320881A Pending JPH0535732A (en) 1991-05-16 1991-11-08 Document display device

Country Status (1)

Country Link
JP (1) JPH0535732A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2828950A1 (en) * 2001-08-24 2003-02-28 Jong Won Bark ELECTRONIC DICTIONARY SYSTEM HAVING A TREE STRUCTURE AND ITS OUTPUT DEVICE

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2828950A1 (en) * 2001-08-24 2003-02-28 Jong Won Bark ELECTRONIC DICTIONARY SYSTEM HAVING A TREE STRUCTURE AND ITS OUTPUT DEVICE

Similar Documents

Publication Publication Date Title
KR100330801B1 (en) Language identifiers and language identification methods
US5031121A (en) System for automatically processing a document including text and associated image information
EP0423683B1 (en) Apparatus for automatically generating index
JP2783558B2 (en) Summary generation method and summary generation device
US5992737A (en) Information search method and apparatus, and medium for storing information searching program
US4994967A (en) Information retrieval system with means for analyzing undefined words in a natural language inquiry
JPH0776969B2 (en) Document processor
JPH0484271A (en) Intra-information retrieval device
JPH0785080A (en) System for retrieving all document
JPH0535732A (en) Document display device
JP2002189734A (en) Device and method for extracting retrieval word
JP2785692B2 (en) Dictionary search and display device
JPH01205265A (en) Document shaping device
JP2570681B2 (en) Word processor
JPH0765008A (en) Word registration control method/device
JPH0765005A (en) Document fast read support display device, word processor and digital copying device
JP2991909B2 (en) Document processing apparatus and document processing method
JP2005189955A (en) Document processing method, document processor, control program, and recording medium
JPH06309369A (en) Information retrieving device
JPS6366665A (en) Document analyzing/shaping device
JPH07282198A (en) Typed character recognizing device
JPH0954781A (en) Document retrieving system
JP3367198B2 (en) Text processing device using character attributes
KR100228902B1 (en) Apparatus for emphasiging the first charator of a sentence and method thereof
JPH03129562A (en) Device for supporting index formation