JPH05158401A - Document fast reading support/display system and document processor and document retrieving device - Google Patents

Document fast reading support/display system and document processor and document retrieving device

Info

Publication number
JPH05158401A
JPH05158401A JP3349676A JP34967691A JPH05158401A JP H05158401 A JPH05158401 A JP H05158401A JP 3349676 A JP3349676 A JP 3349676A JP 34967691 A JP34967691 A JP 34967691A JP H05158401 A JPH05158401 A JP H05158401A
Authority
JP
Japan
Prior art keywords
document
character
word
mode
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3349676A
Other languages
Japanese (ja)
Inventor
Masayuki Kameda
雅之 亀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3349676A priority Critical patent/JPH05158401A/en
Publication of JPH05158401A publication Critical patent/JPH05158401A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

PURPOSE:To execute such a display, etc., as it is easy to follow and read an important part the original containing other part than the important part can be read immediately by leaving size of a character of the important part to be emphasized as standard size, and making character size of other part than the important part small. CONSTITUTION:In a step 1, in the beginning, the device is set to a standard mode in advance, and in a step 2, a digit number counter for line feed control of one line is initialized to '0' in advance. In a step 3, thereafter, a character of a document is read in by one character each, and in steps 4-6, the following processings are repeated, and when the character is gone, the processing is finished. In the main processing, the kind of a character is decided, and in the case of KANA (Japanese syllabary), the device is set to a 1/4 fold mode in a step 7, and thereafter, in a step 9, a half size null, the KANA concerned, and a half size null are outputted continuously. In this regard, when the device becomes a 1/4 fold mode already, a mode change is unnecessary and the processing advances to a step 8. Also, in the case of being other than the KANA, the device becomes the standard mode in a step 10, and thereafter, in a step 12, the character concerned is outputted.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【技術分野】本発明は、電子化された文書の表示方式に
関し、より詳細には、文書速読支援表示方式並びに文書
処理装置及び文書検索装置に関する。例えば、文書を表
示あるいは印刷する機能が必要な文書編集装置,文書閲
覧装置,文書検索装置などの文書処理装置一般に適用さ
れるものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an electronic document display system, and more particularly to a document speed reading support display system, a document processing device and a document search device. For example, it is generally applied to a document processing device such as a document editing device, a document browsing device, a document search device, etc., which needs a function of displaying or printing a document.

【0002】[0002]

【従来技術】文書を作成あるいは提供する際に、重要部
分を強調することはそれを閲覧する人に有効な支援とな
る。具体的には、文書を表示あるいは印刷される際に、
重要部分にアンダーライン,網掛け,反転,拡大等を施
す。しかし、このためには、一般には、重要部分に対し
てあらかじめ人手で処理を施す必要がある。一方、文書
検索装置等では、文書中で指定した単語あるいは関連単
語を自動検索し、その部分を上記方法で表示する機能を
もつのが多い。例えば、平和情報センター:「重要キ
ーワード抽出システム」パンフレットがある。英日機械
翻訳システムの派生機能として、重要な単語の訳だけを
原英文表示に対応させて表示し、英文の速読を支援する
ものとしては、例えば、鈴木 他,シャープ:「機械
翻訳システム DUET E/J II 現状と今後の課
題」(英文速読支援,情報処理学会 自然言語処理研究
会資料 84-16, P.125(pp.119-116), 1991;表示例な
し)がある。また、特開平2−112068号公報
「テキスト簡略表示方式」では、構文解析を利用して、
文の必須要素だけによる簡略文を作成して速読を支援す
る。ここでは、簡略文だけの表示の他に、原文中の簡略
文の要素となる文字列だけを他の文字列と識別して表示
する例として、簡略文要素を大きなサイズの文字で、他
を小さなサイズの文字で表示する例を挙げている[参考
文献の図12]。
2. Description of the Related Art When creating or providing a document, emphasizing important parts is an effective support for those who view it. Specifically, when displaying or printing a document,
Underlines, shades, reverses, and enlarges important parts. However, for this purpose, it is generally necessary to manually process important parts in advance. On the other hand, in many cases, a document search device or the like has a function of automatically searching for a specified word or a related word in a document and displaying the part by the above method. For example, there is the Peace Information Center: "Important Keyword Extraction System" pamphlet. As a derivative function of the English-Japanese machine translation system, only the translations of important words are displayed in correspondence with the original English sentence display, and speed reading of English sentences is supported, for example, Suzuki et al., Sharp: "Machine translation system DUET E / J II Current status and future issues ”(English speed reading support, Information Processing Society of Japan Natural Language Processing Research Material 84-16, P.125 (pp.119-116), 1991; no display example). Further, in Japanese Unexamined Patent Publication No. 2-112068 “Text Simplified Display Method”, syntax analysis is used to
Create short sentences using only the essential elements of the sentence to support speed reading. Here, in addition to displaying only the short sentences, as an example of displaying only the character strings that are the elements of the short sentences in the original text by distinguishing them from other character strings, An example of displaying in small size characters is given [Fig. 12 of the reference].

【0003】上記のうち、参考文献の検索では事前に
必要な単語(キーワード)を指定する必要があるが、
,ではたどるべき重要部分を自動的に抽出する。こ
のため、あらかじめ人手を経ずに未知の文書を効率的に
閲覧することができる。多量の文書を閲覧する場合に
は、こうした強調表示が有効で、いわゆる斜め読み(流
し読み)あるいは速読と呼ばれる読み方を行う際は、重
要部分をたどって読んでいると考えられる。
Of the above, in searching for references, it is necessary to specify in advance the necessary words (keywords).
Then, the important part to be traced is automatically extracted. Therefore, an unknown document can be efficiently browsed without human intervention in advance. When viewing a large amount of documents, such highlighting is effective, and it is considered that important reading is performed when reading a so-called oblique reading (flow reading) or a speed reading.

【0004】前述のように、一般には重要部分を事前に
処理したり、の検索装置では事前に特定の検索したい
単語(キーワード)を用意しなくてはならないが、,
の方式では自動的に重要部分を抽出するという点で優
れている。しかし、次のような問題がある。 (1)これらの表示では重要部分以外が表示されていな
い。これは、実際の速読では、必要に応じて重要部分以
外の他の部分も読むという際に問題となる。一方、一般
のアンダーラインとか反転表示の形式では、原文はいつ
でもたどれるが、a)重要部分が必要以上に強調され、
視覚に負担が出たり、b)重要部分以外は通常の表示な
ので比較的目に入りやすく、結果として強調部分を自然
にたどるのを阻害しやすい。この点、で補足的に示し
ている上記の文字のサイズを違える方法は、b)につい
ては効果的である。しかし、a)の問題は残り、また原
文に対する表示バランスの悪さによる閲覧の負担も考え
られる。 (2)重要部分の検索に構文解析というコストの高い技
術を用いているため、実現の困難さがある。
As described above, in general, important parts must be processed in advance, and the search device must prepare a specific word (keyword) to be searched in advance.
The method is superior in that it automatically extracts important parts. However, there are the following problems. (1) In these displays, only the important parts are displayed. In actual speed reading, this becomes a problem when reading other parts than important parts as necessary. On the other hand, in the general underline or reverse display format, the original text can always be followed, but a) important parts are emphasized more than necessary,
Since it is a normal display except for the important part b), it is relatively easy to get into the eyes, and as a result, it is easy to hinder the natural tracking of the emphasized part. In this respect, the method of changing the size of the characters, which is supplementarily shown in the above, is effective for b). However, the problem of a) remains, and the burden of browsing due to poor display balance with respect to the original text may be considered. (2) Since a costly technique called syntactic analysis is used to search for an important part, it is difficult to realize.

【0005】[0005]

【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、文書を効率的に閲覧するのに、重要部分をたど
って読むことが容易であるとともに、必要に応じて重要
部分以外を含む原文を直ちに読めるような表示あるいは
印刷を、閲覧の負担が少ないようにより整った形式で行
うこと、また、事前に重要部分に処理を施すような手間
をかけることがなく、かつ比較的低いコストで自動的に
重要部分を検出するようにした文書速読支援表示方式を
提供すること、さらに、前記表示方式を有する文書処理
装置及び文書検索装置を提供することを目的としてなさ
れたものである。
[Purpose] The present invention has been made in view of the above-mentioned circumstances, and in order to efficiently browse a document, it is easy to trace the important part and read the important part as necessary. Display or print the original text including the text in a more organized format so as to reduce the burden of browsing, and do not need to process important parts in advance, and the cost is relatively low. It is an object of the present invention to provide a document speed reading support display system in which an important part is automatically detected by, and a document processing device and a document search device having the display system.

【0006】[0006]

【構成】本発明は、上記目的を達成するために、(1)
電子化された文書を表示あるいは印刷する文書表示方式
において、文書中の強調したい文字列に対し、その他の
部分の文字列について文字のサイズを縮小し、かつ、縮
小する文字を原文と同じ位置に表示あるいは印刷する機
能を有すること、更には、(2)文書中の強調する部分
あるいはそれ以外の部分を文字種によって判定するこ
と、更には、(3)文書中の強調する部分以外の部分を
単語あるいは文字列によって判定すること、更には、
(4)文書中の強調する部分あるいはそれ以外の部分を
単語の品詞によって判定すること、或いは、(5)前記
(2)〜(4)記載の文書速読支援表示方式を用いた文
書処理装置を提供すること、或いは、(6)電子化され
た文書中の特定の単語あるいはそれに関連する単語を検
索する機能を有し、検索された単語部分を含む文書を表
示あるいは印刷する文書表示方式において、文書中の検
索された単語以外の単語について、文字のサイズを縮小
し、かつ縮小する文字を原文と同じ位置に表示あるいは
印刷する機能を有することを特徴とする文書速読支援表
示方式を用いた文書検索装置を提供することを特徴とし
たものである。以下、本発明の実施例に基づいて説明す
る。
In order to achieve the above object, the present invention provides (1)
In a document display method that displays or prints a digitized document, the character size of the character string of the other part is reduced with respect to the character string to be emphasized in the document, and the reduced character is placed at the same position as the original text. It has a function of displaying or printing, (2) Judgment of a part to be emphasized or other parts in the document by a character type, and (3) Word other than the part to be emphasized in the document. Or judging by a character string, further,
(4) A part to be emphasized or other part in the document is determined by the part of speech of the word, or (5) a document processing device using the document speed reading support display method described in (2) to (4) above. Or (6) a document display method for displaying or printing a document including a searched word portion, which has a function of searching a specific word in an electronic document or a word related thereto , Uses a document speed reading support display method characterized by reducing the character size of words other than searched words in a document and displaying or printing the reduced characters at the same position as the original text. The present invention is characterized in that it provides a document retrieval device that has been used. Hereinafter, description will be given based on examples of the present invention.

【0007】まず、請求項1に記載された発明について
説明する。文書を効率的に閲覧するのに、重要部分をた
どって読むことが容易であるとともに、必要に応じて重
要部分以外を含む原文を直ちに読めるような表示あるい
は印刷を、閲覧の負担が少ないように、より整った形式
で行うために、強調するべき重要部分の文字のサイズは
標準のままとし、重要部分以外の部分の文字のサイズを
小さくすることで重要部分を間接的に強調する。ただ
し、縮小による文字密度の増加による見にくさを避ける
ために原文の文字位置を保持する。なお、図1には原文
の表示例を示してある。
First, the invention described in claim 1 will be described. In order to efficiently browse the document, it is easy to read the important parts and read or print the original text including the non-important parts immediately if necessary so that the burden of reading is reduced. , In order to carry out in a more organized format, the size of the characters of the important part to be emphasized remains the standard, and the important part is indirectly emphasized by reducing the size of the characters of the parts other than the important part. However, the character position of the original sentence is retained in order to avoid the difficulty of seeing due to the increase of the character density due to the reduction. Note that FIG. 1 shows a display example of the original text.

【0008】以下、実施例では、標準の文字に対し、縮
小する文字のサイズを縦と幅の各々について1/2づつ
(面積で1/4)の大きさとし、さらに原文との位置関係
を保持するために、その文字の前後を幅が1/4の空白で
挟んだ表示形態を示していく。ただし、本発明において
縮小率や埋め込む空白の割合は、これに限定するもので
はない。また、実施例では日本語文書を対象に示すが、
本発明は日本語だけに限るものではない。なお、ここで
は、表示あるいは印刷のための制御として、標準モード
と1/4倍(縦・幅の各々が1/2、面積で1/4)モードがあ
り、対応する制御コードによりモードを変更できるとす
る。また、全角文字と半角文字があるとする。
In the following, in the embodiment, the size of the character to be reduced is set to 1/2 each of the vertical and width (1/4 in area) with respect to the standard character, and the positional relationship with the original sentence is maintained. In order to do that, we will show the display form in which the front and back of the character are sandwiched by white space with a width of 1/4. However, in the present invention, the reduction ratio and the ratio of blank spaces to be embedded are not limited to this. In addition, although Japanese documents are shown in the examples,
The present invention is not limited to Japanese. In addition, here, there are standard mode and 1/4 times (vertical and width each 1/2, area 1/4) mode as control for display or printing, and the mode is changed by the corresponding control code. Suppose you can. Also, assume that there are full-width characters and half-width characters.

【0009】本仮定に従い、例えば「日本語の文書につ
いて」という文字列に対し、「日本語」と「文書」を強
調するべき文字列とした場合、[標]日本語[1/4]_の
_[標]文書[1/4]_に__つ__い__て_[標]、というデ
ータを表示系や印刷系に送信することで、次の表1のよ
うに原文に対する表示あるいは印刷が得られる。
According to this assumption, for example, when a character string "about a Japanese document" is to be emphasized in "Japanese" and "document", [mark] Japanese [1/4] _ of
By sending the data _ [mark] document [1/4] _ __ _ __ ___ _ _ _ [mark] to the display system and the printing system, the display for the original text as shown in Table 1 below. Alternatively, a print is obtained.

【0010】[0010]

【表1】 [Table 1]

【0011】なお、上記で '[標]','[1/4]'は、各々標
準モード,1/4倍モードにする制御コードとし、また、'
_ ','__'は半角の空白が各々1,2個、'_ 'は半角のさ
らに幅が半分(全角の幅の1/4)になった空白とする。
In the above, "[mark]" and "[1/4]" are control codes for the standard mode and the 1/4 times mode, respectively.
_ ',' __ 'are 1 or 2 half-width spaces, and'_' is a half-width space (1/4 of full-width).

【0012】一般に、文章を構成する単語は、内容語と
機能語と呼ばれる種類に分類することができる。内容語
とは名詞や動詞等の実体や事象を指す単語であり、機能
語とは内容語間の関係を示す助詞や事象の属性等を添え
る助動詞等の単語である。上記で意味的に情報に富む部
分は、このうちの内容語にほぼ対応するといえる。すな
わち、人間が多量の文書の内容を大ざっぱに把握するた
めに行う斜め読み(速読)は、経験的にこの内容語をた
どって読んでいると考えられる。本発明は、意味的に情
報に富んだ部分(あるいはそれ以外の部分)を近似的に
抽出する方法を用いて、上記に示した意味的に情報に富
んでいるとした部分以外の部分の文字のサイズを小さく
する表示を行う。意味的に情報に富んでいるとした部分
以外の部分は、表示しないという方法もあるが、必要に
応じて、文として詳細に読む必要が生じる場合が考えら
れるし、近似的な方法故に抽出の誤りもあり、こうした
理由から、これらの部分は不要にはならない。
In general, the words forming a sentence can be classified into types called content words and function words. The content word is a word indicating an entity or an event such as a noun or a verb, and the functional word is a word such as a particle indicating a relationship between the content words or an auxiliary verb with an attribute of the event. It can be said that the above-mentioned semantically rich portion of information substantially corresponds to the content words. That is, it is considered that the oblique reading (speed reading), which is performed by a human to roughly understand the contents of a large amount of documents, is experientially following this content word. The present invention uses a method of approximating a semantically rich portion (or other portion) to obtain characters of a portion other than the semantically rich portion shown above. Display to reduce the size of. There is a method of not displaying the part other than the part that is semantically rich in information, but it may be necessary to read it in detail as a sentence if necessary, and because it is an approximate method, it can be extracted. There are mistakes, and for these reasons, these parts are not obsolete.

【0013】次に、請求項2に記載された発明について
説明する。意味的に情報に富んだ部分以外の部分を文字
種によって近似的に判別する。例えば、日本語において
は、この文字種としてひらがなを採用する。すなわち、
一般的なかな漢字交じりの日本語においては、助詞や助
動詞等の機能語は大体ひらがなからなり、名詞や動詞等
の内容語は漢字やカタカナからなる、あるいは漢字を含
んでいるという性質に基づく。図2にこの方式による表
示例を示す。
Next, the invention described in claim 2 will be described. A portion other than the portion that is semantically rich in information is approximately determined by the character type. For example, in Japanese, hiragana is used as the character type. That is,
In general Japanese with kana-kanji mixing, functional words such as particles and auxiliary verbs consist of hiragana, and content words such as nouns and verbs consist of or contain kanji and katakana. FIG. 2 shows a display example by this method.

【0014】図11は、請求項2に記載された発明の処
理を説明するためのフローチャートである(この処理フ
ローでは、簡単のために禁則処理等は示さない)。この
処理では、はじめに標準モードにしておき(step1)、
また、1行の改行制御のための桁数カウンタを0に初期
化しておく(step2)。以降、文書の文字を1文字づつ
読み込んで(step3)以下の主処理(step4〜6)を繰
り返すが、文字がなくなれば終了する。主処理では、文
字種を判定し、ひらがなであれば1/4倍モードにした上
で(step7)半角空白,当該ひらがな,半角空白を続け
て出力する(step9)。ただし、すでに1/4倍モードに
なっていればモード変更は不要である(step8)。ひら
がな以外であれば標準モードにした上で(step10)当
該文字を出力する(step12)。ただし、すでに標準モ
ードになっていればモード変更は不要である(step1
1)。ただし、上記処理の前に、桁数カウンタと1行内
の桁数指定値との比較で、必要なら改行及び桁数カウン
タの0化を行っておく(step5)。また、上記処理の後
に桁数カウンタの加算を行う(step13)。
FIG. 11 is a flow chart for explaining the processing of the invention described in claim 2 (in this processing flow, prohibition processing etc. are not shown for simplification). In this process, first set the standard mode (step 1),
Also, the digit counter for line feed control of one line is initialized to 0 (step 2). Thereafter, the characters of the document are read character by character (step 3) and the main processing (steps 4 to 6) below is repeated, but the process ends when there are no more characters. In the main processing, the character type is determined, and if it is a Hiragana character, the mode is set to 1/4 times (Step 7), and then the half-width blank, the Hiragana, and the half-width blank are successively output (Step 9). However, if it is already in 1/4 mode, it is not necessary to change the mode (step 8). If it is other than hiragana, the standard mode is set (step 10) and the character is output (step 12). However, if it is already in standard mode, it is not necessary to change the mode (step 1
1). However, before the above processing, a line feed and a digit counter are zeroed if necessary by comparing the digit counter with the digit designation value in one line (step 5). After the above processing, the digit counter is added (step 13).

【0015】図1に示した文書に対して、本処理を施す
と、図2に示すようなひらがな部分は縮小文字となる一
方、原文との位置関係は保持されたままの表示が得られ
る。なお、ひらがなの前後に半角の空白を挿入しない
と、図3に示すように原文との位置関係は保持されず、
結果として表示密度が高くなり、見にくい出力となる。
When this processing is performed on the document shown in FIG. 1, the hiragana portion as shown in FIG. 2 becomes a reduced character, while a display in which the positional relationship with the original sentence is maintained is obtained. Note that if you do not insert single-byte spaces before and after the hiragana, the positional relationship with the original text is not retained as shown in FIG.
As a result, the display density is high, and the output is difficult to see.

【0016】次に、請求項3に記載された発明について
説明する。意味的に情報に富んだ部分以外の部分を、あ
らかじめ定めた特定の単語(文字列)によって近似的に
判別する。例えば、日本語においては、この特定の単語
として助詞とされている「は」,「が」,「に」,
「へ」,「から」等、また、余り重要でない「など」,
「等」,「ほか」,「他」等を採用する。以下、請求項
3の実施例について説明する。
Next, the invention described in claim 3 will be described. A portion other than the portion that is semantically rich in information is approximately determined by a predetermined specific word (character string). For example, in Japanese, "ha", "ga", "ni", which is a particle as this specific word,
"He", "From", etc., and "Minor", etc.,
Adopt "etc.", "other", "other", etc. Hereinafter, an embodiment of claim 3 will be described.

【0017】まず、第1段階として、文書に対して指定
された単語の検索処理を行う。複数の文字列の検索処理
自体は従来技術として容易に実現できるので、特にその
処理内容は示さない。ここでは、図7に示すように、検
索された単語の前後に特殊なマーク(図7では
'[',']')を挿入し、メモリあるいはファイル上にい
ったん展開する。その後、第2段階として、図7の展開
内容に対して図12の処理フローに従い処理すると、図
4に示す表示が得られる。step1〜step5までは請求項
2のフローチャートと同様である。
First, as a first step, a search process for a designated word is performed on a document. Since the search process itself for a plurality of character strings can be easily realized as a conventional technique, the details of the process are not shown. Here, as shown in FIG. 7, special marks (in FIG. 7, before and after the searched word)
Insert '[', ']') and expand it once in memory or file. Then, as a second step, when the expanded contents of FIG. 7 are processed according to the processing flow of FIG. 12, the display shown in FIG. 4 is obtained. Steps 1 to 5 are the same as the flowchart of claim 2.

【0018】本処理では、1文字づつ読み込んで、文字
種かどうか判断する(step6)、'[' ならば1/4倍モー
ドにする(step7)。ただし、すでに1/4倍モードにな
っていればモード変更は不要である。文字種が ']' な
らば(step6)標準モードにする(step8)。ただし、
すでに標準モードになっていればモード変更は不要であ
る。文字種が '[' あるいは ']' 以外ならば(step
6)、1/4倍モードであれば(step9)、半角空白,当
該ひらがな,半角空白を続けて出力する(step10)。
標準モードであれば(step9)、当該文字を出力する
(step11)。なお、1文書全体に対して2段階の処理
を行うのではなく、段落,「。」,あるいは「、」の単
位ごとに行ってもよい(この場合、処理フローでの桁数
カウンタの初期化の扱いが若干異なってくるが、本質的
ではないのでここでは述べない)。また、改行の制御は
請求項1と同様である。
In this processing, each character is read and it is judged whether or not it is a character type (step 6). If '[', the mode is set to 1/4 times (step 7). However, if you are already in 1/4 mode, you do not need to change the mode. If the character type is "]" (step 6), the standard mode is set (step 8). However,
If already in standard mode, no mode change is necessary. If the character type is something other than '[' or ']' ((step
6) In the 1/4 mode (step 9), the half-width blank, the relevant hiragana, and the half-width blank are continuously output (step 10).
In the standard mode (step 9), the character is output (step 11). It should be noted that instead of performing the two-step process for the entire document, it may be performed for each unit of paragraph, “.”, Or “,” (in this case, initialization of the digit counter in the process flow). Will be handled slightly differently, but it is not essential so I won't discuss it here). The control of line feed is the same as in claim 1.

【0019】次に、請求項4に記載された発明について
説明する。意味的に情報に富んだ部分以外の部分を、あ
らかじめ定めた特定の品詞の単語によって近似的に判別
する。例えば、日本語においては、この特定の品詞とし
て、名詞類,動詞/形容詞/形容動詞類の語幹,副詞,
記号類(ここでは、種別Aと呼ぶ)のいづれでもない品
詞(種別Bと呼ぶ)を採用する。以下、請求項4の実施
例について説明する。
Next, the invention described in claim 4 will be described. The part other than the part that is semantically rich in information is approximately determined by the word of a predetermined specific part of speech. For example, in Japanese, the specific parts of speech include nouns, verbs / adjectives / adjectives, stems, adverbs,
A part-of-speech (referred to as type B) that is not any of the symbols (referred to as type A here) is adopted. Hereinafter, an embodiment of claim 4 will be described.

【0020】まず、第1段階として、文書に対して形態
素解析(単語切り)処理を行う。形態素解析処理自体
は、従来技術として容易に実現できるので、特にその処
理内容は示さない。ここでは、図9,図10に示すよう
な結果を得、それをメモリあるいはファイル上にいった
ん展開する。図9,図10は、単語ごとのレコードとな
っており、各レコードは、位置情報(先頭からの文字
数),単語及び品詞情報からなる。その後、第2段階と
して、図9,図10の展開内容に対して図13の処理フ
ローに従い処理すると、図5に示す表示が得られる。
First, as the first step, morphological analysis (word segmentation) processing is performed on the document. Since the morphological analysis process itself can be easily realized as a conventional technique, its processing content is not shown. Here, the results shown in FIGS. 9 and 10 are obtained, and the results are once expanded in the memory or file. 9 and 10 are records for each word, and each record includes position information (the number of characters from the beginning), words, and part-of-speech information. Then, as a second step, when the developed contents of FIGS. 9 and 10 are processed according to the processing flow of FIG. 13, the display shown in FIG. 5 is obtained.

【0021】本処理では、単語レコードごとの処理を進
め(step1〜3)、単語レコードがなくなれば終了す
る。単語レコードごとの処理では品詞を判定し(step
4)、種別Bであれば1/4倍モードにする(step5)。た
だし、すでに1/4倍モードになっていればモード変更は
不要である(step6)。種別Aであれば標準モードにす
る(step7)。ただし、すでに標準モードになっていれ
ばモード変更は不要である(step8)。その後、単語レ
コード中の単語の文字を順次読み込み(step9)、次の
処理を繰り返す(step10,11)。文字が尽きれば単
語レコードごとの処理を終了する。1/4倍モードであれ
ば(step12)半角空白,当該ひらがな,半角空白を続
けて出力する(step13,14)。標準モードであれば
(step12)当該文字を出力する(step15)。なお、
請求項2と同様に、1文書全体に対して2段階の処理を
行うのではなく、段落,「。」,あるいは「、」の単位
ごとに行ってもよい。また、改行の制御は請求項1と同
様である。
In this processing, the processing for each word record is advanced (steps 1 to 3), and the processing ends when there are no more word records. In the processing for each word record, the part of speech is determined (step
4) If the type is B, the 1/4 mode is set (step 5). However, if it is already in 1/4 mode, it is not necessary to change the mode (step 6). If the type is A, the standard mode is set (step 7). However, if it is already in the standard mode, it is not necessary to change the mode (step 8). Then, the characters of the words in the word record are sequentially read (step 9), and the next process is repeated (steps 10 and 11). When the characters are used up, the processing for each word record ends. In the 1/4 mode (step 12), the half-width blank, the relevant hiragana, and the half-width blank are successively output (steps 13 and 14). In the standard mode (step 12), the character is output (step 15). In addition,
Similar to the second aspect, the process of two steps may not be performed for the entire one document, but may be performed for each unit of paragraph, “.”, Or “,”. The control of line feed is the same as in claim 1.

【0022】次に、請求項5に記載された発明について
説明する。従来の表示あるいは印刷機能を有する文書処
理装置において、上記に示したような処理を付加するこ
とで容易に実現できる。
Next, the invention described in claim 5 will be described. In a conventional document processing apparatus having a display or printing function, it can be easily realized by adding the above-described processing.

【0023】次に、請求項6に記載された発明について
説明する。文書検索装置等で、検索単語を含む文書の表
示について、検索単語を上記にいう意味的に情報に富ん
だ部分として扱うことによる。この実現は、原理的には
請求項2による方法と同じである。ここでは、情報処理
分野に関連するキーワード(「情報」,「コンピュー
タ」等)を検索した例を示す。請求項2と同様に、第1
段階として、図8に示すように、検索された単語の前後
に特殊なマーク(図8)では '[',']')が付けられた
結果を得、しかる後に、請求項2の処理フロー(図1
1)の1/4倍モードと標準モードの扱いを逆にした処理
によって図6が得られる。
Next, the invention described in claim 6 will be described. By displaying the document including the search word in the document search device or the like, the search word is treated as the above-mentioned semantically rich portion. This realization is in principle the same as the method according to claim 2. Here, an example is shown in which keywords related to the information processing field (“information”, “computer”, etc.) are searched. Similarly to claim 2, the first
As a step, as shown in FIG. 8, a result in which a special mark ('[', ']') is added before and after the searched word is obtained, and thereafter, the processing flow of claim 2 is obtained. (Fig. 1
FIG. 6 is obtained by the processing in which the treatment of the 1/4 mode and the standard mode of 1) is reversed.

【0024】[0024]

【効果】以上の説明から明らかなように、本発明による
と、以下のように効果がある。 (1)請求項1に対応する効果:強調したい重要部分以
外の部分の文字のサイズを小さくすることで重要部分を
間接的に強調し、間接的に強調された部分をたどること
により、文章の流れを把握しながら文書を効率的に閲覧
すること(斜め読み,流し読み,速読)を支援する。さ
らに、必要に応じて、詳細に読みたい箇所では、縮小さ
れた部分も含めて改めて読むことができ、正確な読みと
りも可能である。この表示では、重要部分の文字は標準
のサイズのままで非重要部分を縮小して、重要部分を間
接的に強調している。これは、重要部分が必要以上に強
調されたり、非重要部分が自然に目に入ってしまうとい
うことがなく、従来の表示より速読に適している。さら
に、原文との位置関係も保持されているので原文との対
応がとりやすい。また、請求項2から4については事前
に文書に対する処理が不要であり、未知の文書の閲覧に
有利である。上記に加え、請求項2から4は、次のよう
な作用効果がある。 (2)請求項2に対応する効果:縮小するべき部分を文
字種によって判定するだけなので、辞書や特定単語の用
意が不要であり、処理的にも簡単なので非常に容易に実
現することができる。 (3)請求項3に対応する効果:縮小するべき部分をあ
らかじめ定めた単語によって判定するだけなので、辞書
が不要であるとともに、請求項1より縮小するべき部分
の判定がより正しい。例えば、請求項2で縮小化された
「あいまいさ」というひらがなからなる名詞が縮小化さ
れずにすむ。 (4)請求項4に対応する効果:縮小するべき部分をい
わゆる内容語以外にすることができるので、請求項1や
2より縮小するべき部分の判定がより正しい。例えば、
請求項3と同様に、請求項2で縮小化された「あいまい
さ」というひらがなからなる名詞が縮小化されずにすん
だり、請求項3で活用するために、縮小化の対象にしに
くい助動詞も縮小することができる。これを実現する形
態素解析処理には辞書が必要だが、なお、構文解析の技
術より低いコストで導入することができる。
[Effect] As is apparent from the above description, the present invention has the following effects. (1) Effect corresponding to claim 1: By reducing the size of the characters other than the important portion to be emphasized, the important portion is indirectly emphasized, and the indirectly emphasized portion is traced Support the efficient reading of documents (oblique reading, flow reading, speed reading) while grasping the flow. Furthermore, if necessary, it is possible to re-read the detailed portion, including the reduced portion, so that accurate reading is possible. In this display, the characters of the important part are kept in the standard size, the non-important part is reduced, and the important part is indirectly emphasized. This is more suitable for speed reading than the conventional display, because important parts are not emphasized more than necessary and non-important parts do not get into the eyes naturally. Furthermore, since the positional relationship with the original text is maintained, it is easy to correspond to the original text. Further, according to claims 2 to 4, processing on the document is not required in advance, which is advantageous for browsing an unknown document. In addition to the above, claims 2 to 4 have the following effects. (2) Effect corresponding to claim 2: Since only the part to be reduced is determined by the character type, preparation of a dictionary and specific words is not required, and processing is simple, so that it can be realized very easily. (3) Effect corresponding to claim 3: Since the part to be reduced is determined only by a predetermined word, a dictionary is unnecessary and the determination of the part to be reduced is more correct than in claim 1. For example, the hiragana noun "ambiguity" reduced in claim 2 is not reduced. (4) Effect corresponding to claim 4: Since the portion to be reduced can be other than the so-called content word, the determination of the portion to be reduced is more correct than in claims 1 and 2. For example,
Similar to claim 3, the noun consisting of the hiragana word "ambiguity" reduced in claim 2 can be left unreduced, or an auxiliary verb that is difficult to reduce because it is used in claim 3. Can be reduced. A morphological analysis process that realizes this requires a dictionary, but it can be introduced at a lower cost than the syntax analysis technique.

【図面の簡単な説明】[Brief description of drawings]

【図1】 原文の表示例を示す図である。FIG. 1 is a diagram showing a display example of an original sentence.

【図2】 請求項2の表示例を示す図である。FIG. 2 is a diagram showing a display example of claim 2;

【図3】 原文との位置関係を保持しない表示例を示す
図である。
FIG. 3 is a diagram showing a display example in which a positional relationship with an original sentence is not held.

【図4】 請求項3での表示例を示す図である。FIG. 4 is a diagram showing a display example according to claim 3;

【図5】 請求項4での表示例を示す図である。FIG. 5 is a diagram showing a display example according to claim 4;

【図6】 請求項6での表示例を示す図である。FIG. 6 is a diagram showing a display example according to claim 6;

【図7】 請求項3での特定単語抽出処理の出力結果例
を示すである。
FIG. 7 is a diagram showing an example of an output result of the specific word extraction processing according to claim 3;

【図8】 請求項6でのキーワード検索の出力結果例を
示すである。
FIG. 8 is a diagram showing an output result example of a keyword search in claim 6;

【図9】 請求項4での形態素解析の出力結果例(その
1)を示すである。
FIG. 9 shows an output result example (No. 1) of the morphological analysis according to claim 4.

【図10】 請求項4での形態素解析の出力結果例(そ
の2)を示すである。
FIG. 10 shows an output result example (No. 2) of the morphological analysis according to claim 4.

【図11】 請求項2の処理フローを示す図である。FIG. 11 is a diagram showing a processing flow of claim 2;

【図12】 請求項3の処理フローを示す図である。FIG. 12 is a diagram showing a processing flow of claim 3;

【図13】 請求項4の処理フローを示す図である。FIG. 13 is a diagram showing a processing flow of claim 4;

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 // G09G 5/26 9061−5G ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 5 Identification code Office reference number FI technical display location // G09G 5/26 9061-5G

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 電子化された文書を表示あるいは印刷す
る文書表示方式において、文書中の強調したい文字列に
対し、その他の部分の文字列について文字のサイズを縮
小し、かつ、縮小する文字を原文と同じ位置に表示ある
いは印刷する機能を有することを特徴とする文書速読支
援表示方式。
1. In a document display method for displaying or printing an electronic document, a character string to be emphasized in the document is reduced in character size with respect to other character strings, and a character to be reduced is displayed. A document speed reading support display method that has a function of displaying or printing at the same position as the original text.
【請求項2】 文書中の強調する部分あるいはそれ以外
の部分を文字種によって判定することを特徴とする請求
項1記載の文書速読支援表示方式。
2. The document speed-reading support display system according to claim 1, wherein a highlighted portion or other portion in the document is determined by a character type.
【請求項3】 文書中の強調する部分以外の部分を単語
あるいは文字列によって判定することを特徴とする請求
項1記載の文書速読支援表示方式。
3. The document speed-reading support display system according to claim 1, wherein a portion other than a highlighted portion in the document is determined by a word or a character string.
【請求項4】 文書中の強調する部分あるいはそれ以外
の部分を単語の品詞によって判定することを特徴とする
請求項1記載の文書速読支援表示方式。
4. The document speed-reading support display system according to claim 1, wherein the emphasized portion or the other portion in the document is determined by the word part of speech.
【請求項5】 前記請求項2,3又は4記載の文書速読
支援表示方式を用いたことを特徴とする文書処理装置。
5. A document processing apparatus using the document speed reading support display method according to claim 2, 3 or 4.
【請求項6】 電子化された文書中の特定の単語あるい
はそれに関連する単語を検索する機能を有し、検索され
た単語部分を含む文書を表示あるいは印刷する文書表示
方式において、文書中の検索された単語以外の単語につ
いて、文字のサイズを縮小し、かつ縮小する文字を原文
と同じ位置に表示あるいは印刷する機能を有することを
特徴とする文書速読支援表示方式を用いた文書検索装
置。
6. A document display method having a function of searching for a specific word in an electronic document or a word related thereto and displaying or printing a document including a searched word portion, the search in a document A document retrieving apparatus using a document speed reading support display method, which has a function of reducing the character size of a word other than the written word and displaying or printing the reduced character at the same position as the original sentence.
JP3349676A 1991-12-06 1991-12-06 Document fast reading support/display system and document processor and document retrieving device Pending JPH05158401A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3349676A JPH05158401A (en) 1991-12-06 1991-12-06 Document fast reading support/display system and document processor and document retrieving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3349676A JPH05158401A (en) 1991-12-06 1991-12-06 Document fast reading support/display system and document processor and document retrieving device

Publications (1)

Publication Number Publication Date
JPH05158401A true JPH05158401A (en) 1993-06-25

Family

ID=18405348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3349676A Pending JPH05158401A (en) 1991-12-06 1991-12-06 Document fast reading support/display system and document processor and document retrieving device

Country Status (1)

Country Link
JP (1) JPH05158401A (en)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5950187A (en) * 1995-11-30 1999-09-07 Fujitsu Limited Document retrieving apparatus and method thereof for outputting result corresponding to highlight level of inputted retrieval key
JPH11288425A (en) * 1998-01-06 1999-10-19 Fuji Xerox Co Ltd Method and device for facilitating skip reading and graphical user interface
JP2000099526A (en) * 1998-09-21 2000-04-07 Sharp Corp Document information extracting device
JP2000267781A (en) * 1999-03-17 2000-09-29 Hitachi Ltd Character display method and display device
WO2005078604A1 (en) * 2004-02-13 2005-08-25 Hitachi, Ltd. Character display method
JP2006302068A (en) * 2005-04-22 2006-11-02 Kataoka Design Works:Kk Character processing apparatus
US7234942B2 (en) 2002-07-09 2007-06-26 Canon Kabushiki Kaisha Summarisation representation apparatus
JP2009032026A (en) * 2007-07-26 2009-02-12 Sharp Corp Display control device, method, program and storage medium
JP2009211716A (en) * 1996-08-07 2009-09-17 Randall C Walker Text processor
JP2010157085A (en) * 2008-12-26 2010-07-15 Fujitsu Ltd Document display device, portable terminal equipment, document display method, and document display program
US7765471B2 (en) 1996-08-07 2010-07-27 Walker Reading Technologies, Inc. Method for enhancing text by applying sets of folding and horizontal displacement rules
JP2012168877A (en) * 2011-02-16 2012-09-06 Casio Comput Co Ltd Printing device, printing method, and printing control program
JP2012212254A (en) * 2011-03-30 2012-11-01 Nec Casio Mobile Communications Ltd Information processing device and method
JP2015170287A (en) * 2014-03-10 2015-09-28 大日本印刷株式会社 Text providing device, program, printed matter manufacturing method, and printed matter

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5950187A (en) * 1995-11-30 1999-09-07 Fujitsu Limited Document retrieving apparatus and method thereof for outputting result corresponding to highlight level of inputted retrieval key
JP2009211716A (en) * 1996-08-07 2009-09-17 Randall C Walker Text processor
US7861163B2 (en) 1996-08-07 2010-12-28 Walker Reading Technologies, Inc. Reading product fabrication methodology
US7765471B2 (en) 1996-08-07 2010-07-27 Walker Reading Technologies, Inc. Method for enhancing text by applying sets of folding and horizontal displacement rules
JPH11288425A (en) * 1998-01-06 1999-10-19 Fuji Xerox Co Ltd Method and device for facilitating skip reading and graphical user interface
JP2000099526A (en) * 1998-09-21 2000-04-07 Sharp Corp Document information extracting device
JP2000267781A (en) * 1999-03-17 2000-09-29 Hitachi Ltd Character display method and display device
US7234942B2 (en) 2002-07-09 2007-06-26 Canon Kabushiki Kaisha Summarisation representation apparatus
WO2005078604A1 (en) * 2004-02-13 2005-08-25 Hitachi, Ltd. Character display method
KR100865825B1 (en) * 2004-02-13 2008-10-28 가부시키가이샤 히타치세이사쿠쇼 Character display method and information terminal
JP2006302068A (en) * 2005-04-22 2006-11-02 Kataoka Design Works:Kk Character processing apparatus
JP2009032026A (en) * 2007-07-26 2009-02-12 Sharp Corp Display control device, method, program and storage medium
JP2010157085A (en) * 2008-12-26 2010-07-15 Fujitsu Ltd Document display device, portable terminal equipment, document display method, and document display program
JP2012168877A (en) * 2011-02-16 2012-09-06 Casio Comput Co Ltd Printing device, printing method, and printing control program
JP2012212254A (en) * 2011-03-30 2012-11-01 Nec Casio Mobile Communications Ltd Information processing device and method
JP2015170287A (en) * 2014-03-10 2015-09-28 大日本印刷株式会社 Text providing device, program, printed matter manufacturing method, and printed matter

Similar Documents

Publication Publication Date Title
CA2078423C (en) Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
US5200893A (en) Computer aided text generation method and system
US5384703A (en) Method and apparatus for summarizing documents according to theme
JP2783558B2 (en) Summary generation method and summary generation device
JP3220560B2 (en) Machine translation equipment
JPH11110416A (en) Method and device for retrieving document from data base
JP2002197104A (en) Device and method for data retrieval processing, and recording medium recording data retrieval processing program
JPH05158401A (en) Document fast reading support/display system and document processor and document retrieving device
US20240119218A1 (en) Device dependent rendering of pdf content
JP3352799B2 (en) Machine translation method and machine translation device
US11775733B2 (en) Device dependent rendering of PDF content including multiple articles and a table of contents
JP3483585B2 (en) Document search device and document search method
JP3398729B2 (en) Automatic keyword extraction device and automatic keyword extraction method
JP2002197097A (en) Article summary sentence generator, article summary sentence generating/processing method and recording medium of article summary sentence generation processing program
JPH06259423A (en) Summary automatically generating system
JPH0883280A (en) Document processor
JP2928515B2 (en) Translated word output device
JP3206600B2 (en) Document generation device
JP3788864B2 (en) Related word automatic extraction apparatus and method, and information storage medium
JPH06266753A (en) Word processor
JP3425329B2 (en) Discrete expression dictionary device
JP2001142897A (en) Device, method and system for retrieving document and computer-readable recording medium having program for executing the method recorded thereon
JP2002132764A (en) Machine translation preprocessor
JP2972212B2 (en) Machine translation method and system
Mulvany Software tools for indexing: what we need