JP3337940B2 - Abstract sentence generator - Google Patents

Abstract sentence generator

Info

Publication number
JP3337940B2
JP3337940B2 JP11932597A JP11932597A JP3337940B2 JP 3337940 B2 JP3337940 B2 JP 3337940B2 JP 11932597 A JP11932597 A JP 11932597A JP 11932597 A JP11932597 A JP 11932597A JP 3337940 B2 JP3337940 B2 JP 3337940B2
Authority
JP
Japan
Prior art keywords
line
sentence
unit
stored
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11932597A
Other languages
Japanese (ja)
Other versions
JPH10307821A (en
Inventor
雅人 竹内
秀造 釘宮
奈緒樹 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP11932597A priority Critical patent/JP3337940B2/en
Publication of JPH10307821A publication Critical patent/JPH10307821A/en
Application granted granted Critical
Publication of JP3337940B2 publication Critical patent/JP3337940B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、要約文章生成装置
に関し、特に、自然言語文章の要約文を生成する要約文
章生成装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an abstract sentence generating apparatus, and more particularly to an abstract sentence generating apparatus for generating an abstract sentence of a natural language sentence.

【0002】[0002]

【従来の技術】近年、パーソナルコンピュータ(パソコ
ン)等の普及、通信インフラストラクチャーの整備なら
びにパソコン通信およびインターネット等の通信サービ
スの普及により、電子化文章を様々な形で利用するケー
スが多くなってきている。また、ワードプロセッサ等の
文章作成システムにおいて新規に電子化文章を作成する
際には、過去に作成した情報(以下「ログファイル」と
いう。)を利用するのが一般的である。
2. Description of the Related Art In recent years, with the spread of personal computers (PCs) and the like, the development of communication infrastructure, and the spread of communication services such as PC communication and the Internet, the use of digitized texts in various forms has increased. I have. In addition, when a new digitized text is created in a text creation system such as a word processor, it is common to use information created in the past (hereinafter, referred to as “log file”).

【0003】目的とするログファイルを検索する手段と
して、あらかじめログファイル毎に題名を設定してお
き、検索時に文章の題名を指定することにより電子化文
章の内容を確認する手段がある。この閲覧作業を、趣旨
と合致する電子化文章が見つかるまで行う。しかし、こ
の閲覧作業時間はログファイル数に比例して多くなる。
As a means for searching for a target log file, there is a means for setting a title in advance for each log file and confirming the contents of the digitized text by specifying the title of the text at the time of search. This browsing operation is performed until an electronic sentence that matches the purpose is found. However, this browsing work time increases in proportion to the number of log files.

【0004】そこで、特開平5−54024号公報に開
示されている文章処理装置では、複数の文章のそれぞれ
に適当な登録名を付けてあらかじめ登録し、この登録名
に基いて、登録文章を取出し、登録された文章の先頭数
行を表示させることにより閲覧作業の簡略化を図ってい
る。
Therefore, in the text processing apparatus disclosed in Japanese Patent Application Laid-Open No. 5-54024, a plurality of texts are registered in advance with an appropriate registration name, and the registered text is extracted based on the registration name. The browsing operation is simplified by displaying the first few lines of the registered text.

【0005】また、特開平5−274345号公報に開
示されている要約文章生成装置では、全文の文脈構造解
析を行ない、分離可能な接続表現等を分離することによ
り要約文章を生成するという手段を取っている。
The summary sentence generating apparatus disclosed in Japanese Patent Application Laid-Open No. 5-274345 has a means of generating a summary sentence by analyzing the context structure of the entire sentence and separating separable connection expressions and the like. taking it.

【0006】[0006]

【発明が解決しようとする課題】しかし、従来の文章処
理装置では、表示行数が文章の先頭数行と限定されてい
る。このため、文章の先頭に挨拶文等の本文の内容に関
係の薄い文がある場合には、要約文章としてあまり有効
ではない。また、文章によってはあと数行を表示させた
いケースも多く、カットされた文章に重要な情報が含ま
れる可能性がある。
However, in the conventional text processing apparatus, the number of displayed lines is limited to the first few lines of the text. For this reason, if there is a sentence at the head of the sentence, such as a greeting sentence, which has little relation to the content of the text, it is not very effective as a summary sentence. Also, depending on the sentence, there are many cases where it is desired to display a few more lines, and the cut sentence may contain important information.

【0007】従来の要約文章生成装置では、文脈構造解
析、抽出および再構成のそれぞれの段階に多くの処理時
間を要する。また、数行程度で理解できる要約文章の場
合においても全文に対して要約処理を行なう。このた
め、要約処理に時間がかかり、要約文章を逐次的に生成
するには不適切である。
[0007] In the conventional summary sentence generating apparatus, each processing of the context structure analysis, extraction and reconstruction requires a lot of processing time. Even in the case of a summary sentence that can be understood in several lines, the summarization process is performed on the entire sentence. For this reason, the summarization process takes a long time and is not suitable for sequentially generating a summary sentence.

【0008】また、電子メールシステムなどにおいて電
子化文章を使用者同士でやり取りを行なう場合には、新
規文章作成時に過去のログファイルや受信メールの電子
化文章を引用したり、見栄えを良くするために1行以上
の空行を開ける場合が多い。しかし、従来の文章処理装
置や要約文章生成装置では、引用文の先頭に付与された
引用マークを識別したり、空行を削除する処理が無い。
このため、要約文章に引用文や空行が残り、要約文章と
しての精度が低下する可能性がある。
In the case where users exchange electronic text in an electronic mail system or the like, in order to quote a past log file or electronic text of a received mail when creating a new text, or to improve the appearance. In many cases, one or more blank lines can be opened. However, in a conventional text processing device and a summary text generation device, there is no process of identifying a quotation mark added to the head of a quotation or deleting blank lines.
For this reason, quotes and blank lines may remain in the summary sentence, and the accuracy of the summary sentence may be reduced.

【0009】本発明は、これらのような問題点を解決す
るためになされたもので、請求項1〜6のいずれかに記
載の発明の目的は、処理時間が短く、精度の高い要約文
章を作成する要約文章生成装置を提供することである。
SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and an object of the present invention is to provide a summary text with a short processing time and high accuracy. An object of the present invention is to provide a summary sentence generation device to be created.

【0010】[0010]

【課題を解決するための手段】請求項1に記載の発明に
係る要約文章生成装置は、要約対象文章を記憶するため
の要約対象文章記憶手段と、要約対象文章記憶手段に記
憶された要約対象文章を受け、最初に行の長さが1つ前
の行の長さよりも小さくなる区分行を検出するための区
分行検出手段と、区分行検出手段で検出された区分行を
受け、上記要約対象文章記憶手段に記憶された要約対象
文章を区分行の1つ前の行より読出すための要約文章読
出手段とを含む。
According to a first aspect of the present invention, there is provided an abstract sentence generating apparatus for storing an abstracted sentence, and an abstracted sentence stored in the abstracted sentence storage. Receiving a sentence, first receiving a partitioned line detected by the partitioned row detecting means for detecting a partitioned row in which the length of the row is smaller than the length of the previous row; A summary sentence reading means for reading the summary target sentence stored in the target sentence storage means from the line immediately before the segmented line.

【0011】請求項1に記載の発明は、直前の行よりも
短い行が現われた場合には、その直前の行を要約文章の
始まりとし、要約文章を作成する。経験的にこのように
して定められる行以下は、文章の内容をよく表現してい
ることが多い。これにより、処理時間が短く、精度の高
い要約文章を作成することができる。
According to the first aspect of the present invention, when a line shorter than the immediately preceding line appears, the immediately preceding line is used as the beginning of the summary sentence, and the summary sentence is created. The lines below the line determined empirically in this way often express the contents of the text well. This makes it possible to create a high-accuracy summary sentence with a short processing time.

【0012】請求項2に記載の発明に係る要約文章生成
装置は、請求項1に記載の発明の構成に加えて、上記区
分行検出手段は、上記要約対象文章記憶手段に記憶され
た要約対象文章を最初の行から1行ずつ読込み、各行の
長さを算出するための行長算出手段と、行長算出手段で
算出された各行の長さのうち現在処理中の行の長さを記
憶するための現在行長記憶手段と、行長算出手段で算出
された最初の行から現在処理中の行の1つ前の行までの
長さの最大値を算出して記憶するための最大行長算出記
憶手段と、現在行長記憶手段に記憶された値と最大行長
算出記憶手段に記憶された値とを比較するための行長比
較手段と、行長比較手段の結果を受け、現在行長記憶手
段に記憶された値が最大行長算出記憶手段に記憶された
値より初めて小さくなる場合に、現在処理中の行を区分
行として検出するための手段とを含む。
[0012] According to a second aspect of the present invention, in addition to the configuration of the first aspect of the present invention, the sectioned line detecting means may include an abstract target stored in the abstract target text storage means. The line is read one line at a time from the first line, and the line length calculating means for calculating the length of each line, and the length of the line currently being processed among the line lengths calculated by the line length calculating means are stored. Current line length storing means for calculating the maximum length of the length from the first line calculated by the line length calculating means to the line immediately before the line currently being processed and storing the maximum value Receiving a result of the line length comparing means, a line length comparing means for comparing a value stored in the current line length storing means with a value stored in the maximum line length calculating and storing means, The value stored in the line length storage means is first smaller than the value stored in the maximum line length calculation storage means. If made, and means for detecting the line currently being processed as a division line.

【0013】請求項3に記載の発明に係る要約文章生成
装置は、請求項1〜2のいずれかに記載の発明の構成に
加えて、要約文章の上限行数を記憶するための上限要約
行数記憶手段をさらに含み、上記要約文章読出手段は、
上記区分行検出手段で検出された区分行を受け、上記要
約対象文章記憶手段に記憶された要約対象文章を区分行
の1つ前の行より上限要約行数記憶手段に記憶された要
約文章の上限行数だけ読出すための設定行数要約文章読
出手段を含む。
According to a third aspect of the present invention, there is provided an abstract sentence generating apparatus according to any one of the first and second aspects, further comprising an upper limit abstract line for storing an upper limit number of lines of the abstract sentence. Further comprising number storage means, wherein the abstract sentence reading means comprises:
Receiving the segmented line detected by the segmented line detecting means, the summarizing target sentence stored in the summarizing object sentence storage means is replaced with the summarizing sentence stored in the upper limit summarizing line number storing means before the line preceding the segmented line. A set number of lines for reading only the upper limit number of lines is included.

【0014】請求項3に記載の発明は、請求項1〜2の
いずれかに記載の発明の作用、効果に加えて、要約文章
の上限行数を設定することができる。これにより、必要
以上に長い要約文章を作成することがなく、処理時間が
短く、精度の高い要約文章を作成することができる。
According to the third aspect of the invention, in addition to the functions and effects of the first or second aspect of the present invention, an upper limit number of lines of a summary sentence can be set. As a result, a summary sentence with a short processing time and high accuracy can be created without creating an unnecessarily long summary sentence.

【0015】請求項4に記載の発明に係る要約文章生成
装置は、請求項3に記載の発明の構成に加えて、要約文
章の上限行数を入力するための入力手段と、入力手段の
入力値を上記上限要約行数記憶手段に書込むための書込
み手段とをさらに含む。
According to a fourth aspect of the present invention, in addition to the configuration of the third aspect, the abstract sentence generating apparatus further includes an input unit for inputting an upper limit number of lines of the abstract sentence, and an input of the input unit. Writing means for writing the value into the upper limit summary row number storage means.

【0016】請求項4に記載の発明は、請求項3に記載
の発明の作用、効果に加えて、要約文章の上限行数を使
用者が設定することが可能となる。これにより、必要以
上に長い要約文章を作成することがなく、処理時間が短
く、精度の高い要約文章を作成することができる。
According to the fourth aspect of the present invention, in addition to the functions and effects of the third aspect of the present invention, it is possible for the user to set the upper limit of the number of lines of the summary sentence. As a result, a summary sentence with a short processing time and high accuracy can be created without creating an unnecessarily long summary sentence.

【0017】請求項5に記載の発明に係る要約文章生成
装置は、請求項1〜4のいずれかに記載の発明の構成に
加えて、要約対象文章を記憶するための作業用文章記憶
手段と、作業用文章記憶手段に記憶された要約対象文章
から不要行を除去して上記要約対象文章記憶手段に書込
むための不要行除去手段とをさらに含む。
According to a fifth aspect of the present invention, in addition to the configuration of the first aspect of the present invention, the abstract sentence generating apparatus further includes a working sentence storage unit for storing an abstract target sentence. And an unnecessary line removing unit for removing unnecessary lines from the summarizing target sentence stored in the working sentence storing unit and writing the unnecessary lines in the summarizing target sentence storing unit.

【0018】請求項5に記載の発明は、請求項1〜4の
いずれかに記載の発明の作用、効果に加えて、要約対象
文章から不要行を削除することができる。これにより、
不要行を含まない要約文章を作成することができ、処理
時間が短く、精度の高い要約文章を作成することができ
る。
According to the fifth aspect of the invention, in addition to the functions and effects of the first to fourth aspects of the invention, unnecessary lines can be deleted from the text to be summarized. This allows
A summary sentence containing no unnecessary lines can be created, and a high-accuracy summary sentence with a short processing time can be created.

【0019】請求項6に記載の発明に係る要約文章生成
装置は、請求項5に記載の発明の構成に加えて、不要行
は、空行と、行頭に特定パターンを有する行とを含み、
上記不要行除去手段は、上記作業用文章記憶手段に記憶
された要約対象文章から空行と行頭に特定パターンを有
する行とを除去して上記要約対象文章記憶手段に書込む
ための手段を含む。
According to a sixth aspect of the present invention, in addition to the configuration of the fifth aspect, the unnecessary sentence includes an empty line and a line having a specific pattern at the beginning of the line.
The unnecessary line removing unit includes a unit for removing a blank line and a line having a specific pattern at the beginning of a line from the summary target sentence stored in the working sentence storage unit and writing the same into the summary target sentence storage unit. .

【0020】請求項6に記載の発明は、請求項5に記載
の発明の作用、効果に加えて、要約対象文章から空行お
よび行頭に特定パターンを有する行を削除することがで
きる。これにより、空行および行長に特定パターンを有
する行を含まない要約文章を作成することができ、処理
時間が短く、精度の高い要約文章を作成することができ
る。
According to the sixth aspect of the invention, in addition to the functions and effects of the fifth aspect of the present invention, a blank line and a line having a specific pattern at the beginning of a line can be deleted from the text to be summarized. As a result, a summary sentence that does not include a blank line and a line having a specific pattern in the line length can be created, and a summary sentence with a short processing time and high accuracy can be created.

【0021】[0021]

【発明の実施の形態】以下、図面を参照しつつ、本発明
における実施の形態の1つである要約文章生成装置につ
いて説明する。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing a summary sentence generating apparatus according to an embodiment of the present invention.

【0022】図1を参照して、要約文章生成装置4は、
本体キャビネット部1と、蓋部3とを含む。
Referring to FIG. 1, summary sentence generating apparatus 4 includes:
It includes a main body cabinet 1 and a lid 3.

【0023】本体キャビネット部1は、各種パラメータ
の入力や、文字表示等の入出力を行なうための入出力部
2と、図示しない赤外線通信部と、ペン保持部と、入出
力部2、赤外線通信部およびインターフェース等を制御
するための制御回路(図示せず)と、必要箇所に電源を
供給する電源部(図示せず)と、本体電源をONまたは
OFFするための本体電源スイッチ8とを含む。
The main body cabinet unit 1 includes an input / output unit 2 for inputting and outputting various parameters and displaying characters and the like, an infrared communication unit (not shown), a pen holding unit, an input / output unit 2, and an infrared communication unit. A control circuit (not shown) for controlling the units and interfaces, a power supply unit (not shown) for supplying power to necessary parts, and a main body power switch 8 for turning on or off the main body power. .

【0024】蓋部3は、本体キャビネット部1の背面に
ヒンジにて接続されており、入出力部2を覆うように回
転し、運搬時に入出力部2を保護する役目を果たす。
The lid 3 is connected to the back of the main body cabinet 1 by a hinge, rotates so as to cover the input / output unit 2, and serves to protect the input / output unit 2 during transportation.

【0025】図2を参照して、入出力部2は、薄型で文
字を表示可能なマトリックス方式からなる液晶表示部1
0と、液晶表示部を覆うための透明タブレット12とを
含む。
Referring to FIG. 2, input / output unit 2 is a liquid crystal display unit 1 of a thin matrix type which can display characters.
0 and a transparent tablet 12 for covering the liquid crystal display unit.

【0026】液晶表示部10は、必要に応じてEL(E
lectro Luminescence)パネル等よ
りなるバックライトを背面に設ける。
The liquid crystal display section 10 is provided with an EL (E
A backlight composed of an electro luminescence panel is provided on the back surface.

【0027】透明タブレット12は、透明な2枚のシー
トの内側面に透明電極を有する。透明電極のシート上に
は、通常状態においてはそれぞれの電極が接触しないよ
うに小さな突起状のスペーサが印刷されている。このス
ペーサを指またはペンで指定することにより透明電極が
接触し、指定された位置が検出される。また、検出位置
と液晶表示部10に表示された表示内容の位置情報とに
より使用者が指定した表示内容が検出される。
The transparent tablet 12 has a transparent electrode on the inner surface of two transparent sheets. On the transparent electrode sheet, small projecting spacers are printed so that the electrodes do not come into contact with each other in a normal state. By designating this spacer with a finger or a pen, the transparent electrode comes into contact and the designated position is detected. The display content specified by the user is detected based on the detection position and the position information of the display content displayed on the liquid crystal display unit 10.

【0028】図3を参照して、制御回路は、液晶表示部
10と、透明タブレット12と、透明タブレット12の
指定位置を検出するためのタブレット制御部20と、液
晶表示回路部22と、コモン回路24と、セグメント回
路26と、本体電源スイッチ8と、各種命令により入力
情報または出力情報を制御するための中央制御部28
と、図示しないクロック信号を受け、時間を計測し、現
在の年月日および時間を出力するためのRTC(Rea
l Time Clock)30と、ROM(Read
Only Memory)32と、RAM(Rand
om Access Memory)34とを含む。
Referring to FIG. 3, the control circuit includes a liquid crystal display unit 10, a transparent tablet 12, a tablet control unit 20 for detecting a designated position of the transparent tablet 12, a liquid crystal display circuit unit 22, and a common control unit. Circuit 24, a segment circuit 26, a main body power switch 8, and a central control unit 28 for controlling input information or output information according to various commands.
And a clock signal (not shown) to measure the time, and to output the current date and time.
l Time Clock) 30 and ROM (Read
Only Memory 32 and RAM (Rand)
Om Access Memory) 34.

【0029】タブレット制御部20は、透明タブレット
12のシートに設けられた透明電極に接続されており、
透明電極の出力電圧により、指あるいはペンで指定され
た位置を検出する。
The tablet controller 20 is connected to a transparent electrode provided on a sheet of the transparent tablet 12,
The position specified by the finger or the pen is detected based on the output voltage of the transparent electrode.

【0030】液晶表示回路部22は、液晶を点灯させる
ドット位置をビットマップとして表示メモリ42に記憶
しており、必要に応じてコモン回路24またはセグメン
ト回路26にビットマップ情報を送信する。
The liquid crystal display circuit section 22 stores a dot position for turning on the liquid crystal in the display memory 42 as a bit map, and transmits the bit map information to the common circuit 24 or the segment circuit 26 as necessary.

【0031】中央制御部28は、透明タブレット12よ
り使用者が入力した要約行数を記憶するための設定要約
行数メモリ44と、現在処理中の行(以下、「現在行」
という。)の長さを記憶するための現在行長メモリ46
と、要約文章の最大行長を記憶するための最大行長メモ
リ48と、要約済の行数を記憶するための要約済行数メ
モリ50と、要約開始位置を検出済か否かを示すフラグ
を記憶するための開始フラグメモリ52と、デフォルト
の要約行数を記憶するためのデフォルト要約行数メモリ
54とを含む。なお、1行は、あるCR(キャリッジリ
ターン)コードから次のCRコードまでを指す。
The central control unit 28 includes a set summary line number memory 44 for storing the number of summary lines input by the user from the transparent tablet 12 and a line currently being processed (hereinafter, “current line”).
That. ) Current line length memory 46 for storing the length
A maximum line length memory 48 for storing the maximum line length of the summary sentence, a summarized line number memory 50 for storing the number of summarized lines, and a flag indicating whether or not the summary start position has been detected. And a default summary row number memory 54 for storing a default summary row number. One line indicates from a certain CR (carriage return) code to the next CR code.

【0032】RAM34は、文章等の文字情報を記憶す
るための文章メモリ74と、文章メモリ74に記憶され
ている文章のうち使用者が指定した文章を記憶するため
の作業用文章メモリ72と、作業用文章メモリ72に記
憶されている文章より空行および引用行を取り除いた文
章を記憶するための要約対象文章メモリ70と、要約対
象文章メモリ70に記憶されている文章のうち現在処理
を行なっている行の文章をそれぞれ記憶するための現在
行メモリA76および現在行メモリB80と、現在処理
を行なっている行の直前の行の文章を記憶するための前
行メモリ78と、要約文章を記憶するための要約文章記
憶メモリ82とを含む。
The RAM 34 includes a text memory 74 for storing character information such as texts, a work text memory 72 for storing texts specified by the user among the texts stored in the text memory 74, The summarization target sentence memory 70 for storing sentences obtained by removing blank lines and quoted lines from the sentences stored in the work sentence memory 72, and the current processing among the sentences stored in the summarization target sentence memory 70 is performed. A current line memory A76 and a current line memory B80 for respectively storing the text of the current line, a previous line memory 78 for storing the text of the line immediately before the line currently being processed, and a summary text. And a summary sentence storage memory 82 for performing

【0033】ROM32は、中央制御部28の動作を示
したプログラムを記憶するためのプログラムエリアを含
む。プログラムエリアは、現在行の桁数を求めるプログ
ラムを記憶するための現在行数算出部56と、現在行長
メモリ46に記憶されている値と最大行長メモリ48に
記憶されている値とを比較するプログラムを記憶するた
めの行長比較部58と、要約対象文章メモリ70に記憶
されている文章を中央制御部28に読込む際に、その文
章が最終行か否かを検出するプログラムを記憶するため
の文末検出A部60と、作業用文章メモリ72に記憶さ
れている文章の中で空行および引用行を検出するプログ
ラムを記憶するための空行・引用行検出部62と、作業
用文章メモリ72に記憶されている文章を中央制御部2
8に読込む際に、その文章が最終行か否かを検出するプ
ログラムを記憶するための文末検出B部64と、要約済
行数メモリ50に記憶されている値と設定要約行数メモ
リ44に記憶されている値とを比較するプログラムを記
憶するための行数比較部66と、要約対象文章メモリ7
0に記憶されている文章を中央制御部28に読込む際
に、行末のCRコードを検出するプログラムを記憶する
ためのCR検出部68とを含む。
ROM 32 includes a program area for storing a program indicating the operation of central control unit 28. The program area includes a current line number calculation unit 56 for storing a program for calculating the number of digits of the current line, a value stored in the current line length memory 46, and a value stored in the maximum line length memory 48. A line length comparing unit 58 for storing a program to be compared and a program for detecting whether or not the sentence is the last line when the sentence stored in the sentence memory 70 to be summarized is read into the central control unit 28 are stored. End-of-sentence detection A unit 60, a blank line / quoted line detection unit 62 for storing a program for detecting blank lines and quoted lines in sentences stored in the working sentence memory 72, The sentence stored in the sentence memory 72 is transferred to the central control unit 2
8, the sentence end detection B unit 64 for storing a program for detecting whether or not the sentence is the last line, the value stored in the summarized line number memory 50, and the set summary line number memory 44. A line number comparison unit 66 for storing a program for comparing the stored value with a stored value;
When reading the text stored in 0 into the central control unit 28, the central control unit 28 includes a CR detection unit 68 for storing a program for detecting a CR code at the end of a line.

【0034】図4を参照して、要約文章生成装置4の大
まかな処理の流れを説明する。まず、使用者が要約文章
の行数を設定する(S2)。次に、要約の対象となる文
章より不要行である空行および引用行が削除される(S
4)。不要行が削除された文章に対して要約処理が施さ
れ、S2にて指定された行数の要約文章が作成される
(S6)。作成された要約文章が液晶表示部10に表示
される(S8)。
With reference to FIG. 4, a rough processing flow of the summary sentence generation device 4 will be described. First, the user sets the number of lines of the summary sentence (S2). Next, blank lines and quoted lines, which are unnecessary lines, are deleted from the text to be summarized (S
4). Summarization processing is performed on the sentence from which unnecessary lines have been deleted, and an abstract sentence having the number of lines specified in S2 is created (S6). The prepared summary text is displayed on the liquid crystal display unit 10 (S8).

【0035】図5〜図6を参照して、要約文章の行数を
設定するS2の処理をさらに詳しく説明する。デフォル
ト要約行数メモリ54に記憶されている要約文章の行数
のデフォルト値(=3)が液晶表示部10上に表示され
る(S12、図6(A)、(B))。次に使用者の入力
待ち状態となる。使用者がOK96またはキャンセル9
8を入力した場合には、処理が終了する(S30、S2
4)。使用者が数字(=5)を入力した場合には(S1
4)、入力値(=5)が設定要約行数メモリ44に記憶
され(S16)、入力値を保存するか否かを確認するた
めの表示が行なわれる(S18、図6(C))。更新否
102またはキャンセル104が入力された場合には、
処理を終了する(S26、S28)。更新可100が入
力された場合には(S20)、設定要約行数メモリ44
に記憶されている入力値をデフォルト値としてデフォル
ト要約行数メモリ54に新たに記憶する(S22)。
The processing of S2 for setting the number of lines of the summary sentence will be described in more detail with reference to FIGS. The default value (= 3) of the number of lines of the summary sentence stored in the default summary line number memory 54 is displayed on the liquid crystal display unit 10 (S12, FIGS. 6A and 6B). Next, it is in a state of waiting for user input. User is OK96 or Cancel 9
8 is input, the process ends (S30, S2
4). When the user inputs a number (= 5) (S1
4) The input value (= 5) is stored in the set summary line number memory 44 (S16), and a display for confirming whether to save the input value is performed (S18, FIG. 6C). When update rejection 102 or cancel 104 is input,
The process ends (S26, S28). When the update permission 100 is input (S20), the setting summary line number memory 44
Is newly stored in the default summary row number memory 54 as a default value (S22).

【0036】図7〜図8を参照して、要約対象文章より
不要行を削除するS4の処理をさらに詳しく説明する。
文章メモリ74に記憶されている文章のうち使用者が指
定した文章が作業用文章メモリ72に記憶される(S4
0)。作業用文章メモリ72に記憶されている文章のう
ち現在処理を行なう行の文章が現在行メモリB80に記
憶される(S42)。現在行メモリB80に記憶されて
いる文章が文末か否かを文末検出B部64に記憶されて
いるプログラムを用いて判断する。文末であるか否かは
EOFコードを検出する事により行なう(S44)。そ
の文章が文末であれば(S44でYES)、何もせずに
処理を終了する。その文章が文末でない場合には(S4
4でNO)、その文章が空行か否かを判断する(S4
6)。空行であれば(S46でYES)、S42に戻
り、次の行に対する処理を開始する。空行でなければ
(S46でNO)、その文章が引用行か否かを判断する
(S48)。引用行であれば(S48でYES)、S4
2に戻り、次の行に対する処理を開始する。引用行でな
ければ、現在行メモリB80に記憶されている内容を要
約対象文章メモリ70に追加し(S50)、S42に戻
り、次の行に対する処理を開始する。
With reference to FIGS. 7 and 8, the processing of S4 for deleting unnecessary lines from the text to be summarized will be described in more detail.
The sentences specified by the user among the sentences stored in the sentence memory 74 are stored in the working sentence memory 72 (S4).
0). Of the sentences stored in the working sentence memory 72, the sentence of the line currently being processed is stored in the current line memory B80 (S42). Whether or not the sentence currently stored in the row memory B80 is the end of the sentence is determined using the program stored in the sentence end detection B unit 64. Whether it is the end of the sentence is determined by detecting the EOF code (S44). If the sentence is at the end of the sentence (YES in S44), the process ends without doing anything. If the sentence is not at the end of the sentence (S4
(NO in S4), it is determined whether or not the sentence is a blank line (S4).
6). If it is a blank line (YES in S46), the process returns to S42, and processing for the next line is started. If it is not a blank line (NO in S46), it is determined whether or not the sentence is a quoted line (S48). If it is a quoted line (YES in S48), S4
Returning to step 2, the process for the next line is started. If it is not a quoted line, the contents stored in the current line memory B80 are added to the summary target sentence memory 70 (S50), and the process returns to S42 to start processing for the next line.

【0037】空行の判断(S46)においては、CRコ
ードから、次のCRコードまでの間にデータがない場合
に空行と判断する。引用行の判断(S48)は、行頭に
引用文であることを示すコード(”>”)を検出する事
により行なう。但し、このコード”>”に限定されるも
のではない。
In the determination of a blank line (S46), when there is no data between the CR code and the next CR code, it is determined that the line is blank. The determination of the quoted line (S48) is performed by detecting a code (">") indicating a quote at the beginning of the line. However, the code is not limited to “>”.

【0038】以上のような処理により、図8(A)中の
行番号3および10の空行や行番号4〜9の引用行が除
去された重要度の高い文章が作成され、図8(B)の文
章が要約対象文章メモリ70に記憶される。
By the above-described processing, a sentence with a high degree of importance is created in which the blank lines at line numbers 3 and 10 and the quoted lines at line numbers 4 to 9 in FIG. The sentence B) is stored in the sentence memory 70 to be summarized.

【0039】図9を参照して、要約文章を作成するS6
の処理をさらに詳しく説明する。まず、各作業用データ
の初期設定を行なう(S60)。次に、要約対象文章メ
モリ70に記憶されている文章のうち現在処理を行なう
行の文章が現在行メモリA76に記憶される(S6
2)。デフォルト要約行数メモリ54に記憶されている
要約文章の上限行数(以下、「設定要約行数」とい
う。)と、要約済行数メモリ50に記憶されている現在
までに作成された要約文章の行数との比較が行なわれる
(S64)。現在までに作成された要約文章の行数が設
定要約行数以上の場合には(S64でNO)、処理を終
了させる。現在までに作成された要約文章の行数が設定
要約行数より小さい場合には(S64でYES)、これ
から処理を行なう行が文末行か否かを判断する(S6
6)。文末行であれば(S66でYES)、処理を終了
させる。文末行でなければ(S66でNO)、開始フラ
グメモリ52に記憶されている開始フラグがONである
か否かを判断する(S68)。開始フラグには、要約文
章メモリ82に要約文章が存在する場合にONが設定さ
れる。なお、初期設定(S60)ではOFFが設定され
る。開始フラグがONであれば(S68でON)、現在
行メモリA76に記憶されている現在行の文章を要約文
章メモリ82に追加し(S72)、要約済行数メモリ5
0に記憶されている値(以下、「要約済行数」とい
う。)をインクリメントし(S80)、S62以降の処
理を再度行なう。開始フラグがOFFの場合は(S68
でOFF)、現在行メモリA76に記憶されている現在
行の文章の長さ(以下、「現在行長」という。)の算出
が行なわれる(S70)。次に、現在行長とこれまで算
出を行なった現在行長の内の最大値(以下、「最大行
長」という。)との比較が行なわれる(S74)。現在
行長が最大行長よりも小さい場合には(S74でYE
S)、開始フラグをONにし(S82)、後述するS7
8で設定されている前行メモリ78に記憶されている前
行の文章を要約文章メモリ82に追加し(S78)、要
約済行数をインクリメントし(S80)、S62以降の
処理を再度行なう。現在行長が最大行長以上の場合に
は、最大行長に現在行長を代入し(S76)、前行メモ
リ78に現在行メモリA76に記憶されている現在行の
文章を追加し(S78)、要約済行数をインクリメント
し(S80)、S62以降の処理を再度行なう。
Referring to FIG. 9, a summary sentence is created S6.
Will be described in more detail. First, initialization of each work data is performed (S60). Next, of the sentences stored in the summary target sentence memory 70, the sentence of the line on which the current processing is to be performed is stored in the current line memory A76 (S6).
2). The maximum number of summary sentences stored in the default summary line number memory 54 (hereinafter referred to as “set summary line number”) and the summary sentences created to date stored in the summarized line number memory 50 (S64). When the number of lines of the summary sentence created up to the present is equal to or greater than the set number of summary lines (NO in S64), the process is terminated. If the number of lines of the summary sentence created so far is smaller than the set number of summary lines (YES in S64), it is determined whether or not the line to be processed is the last line of the sentence (S6).
6). If it is the last line of the sentence (YES in S66), the process ends. If it is not the last line of the sentence (NO in S66), it is determined whether or not the start flag stored in the start flag memory 52 is ON (S68). The start flag is set to ON when an abstract sentence exists in the abstract sentence memory 82. In the initial setting (S60), OFF is set. If the start flag is ON (ON in S68), the text of the current row stored in the current row memory A76 is added to the summary text memory 82 (S72), and the summarized row number memory 5
The value stored in "0" (hereinafter, referred to as "summarized number of lines") is incremented (S80), and the processing from S62 is repeated. If the start flag is OFF (S68
OFF), the length of the text of the current line stored in the current line memory A76 (hereinafter, referred to as "current line length") is calculated (S70). Next, a comparison is made between the current line length and the maximum value of the current line lengths calculated so far (hereinafter, referred to as "maximum line length") (S74). If the current line length is smaller than the maximum line length (YE in S74)
S), the start flag is turned ON (S82), and S7 described later is set.
The sentence of the previous line stored in the previous line memory 78 set in step 8 is added to the summary sentence memory 82 (S78), the number of summarized lines is incremented (S80), and the processing after S62 is performed again. If the current line length is equal to or greater than the maximum line length, the current line length is substituted for the maximum line length (S76), and the text of the current line stored in the current line memory A76 is added to the previous line memory 78 (S78). ), The number of summarized lines is incremented (S80), and the processes from S62 are repeated.

【0040】図10を参照して、設定要約行数を3行と
し、要約対照文章メモリ70の内容を図10(A)とし
た場合には、挨拶行である行番号1〜2行が除去され、
行番号3〜5のみが中央制御部28の制御により表示メ
モリ42に送られ、液晶表示部10に図10(B)が表
示される。
Referring to FIG. 10, when the number of set summary lines is set to 3 and the contents of summary reference sentence memory 70 are set to FIG. 10 (A), line numbers 1 to 2 which are greeting lines are removed. And
Only the line numbers 3 to 5 are sent to the display memory 42 under the control of the central control unit 28, and FIG. 10B is displayed on the liquid crystal display unit 10.

【0041】以上のような要約文章生成装置4により、
直前の行よりも短い行が出現した場合に、直前の行から
開始する要約文章を生成する。また、使用者が指定した
行数の要約文章を生成することができ、要約文章から
は、空行・引用行などの不要行を削除することができ
る。よって、処理時間が短く、精度の高い要約文章を作
成する要約文章生成装置を提供することができる。
With the summary sentence generation device 4 as described above,
If a line shorter than the previous line appears, generate a summary sentence starting from the previous line. Further, it is possible to generate a summary sentence of the number of lines designated by the user, and it is possible to delete unnecessary lines such as blank lines and quoted lines from the summary sentence. Therefore, it is possible to provide a summary sentence generation device that creates a high-accuracy summary sentence with a short processing time.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態に係る要約文章生成装置4
の外観斜視図である。
FIG. 1 is a summary sentence generation device 4 according to an embodiment of the present invention.
It is an external appearance perspective view of.

【図2】入出力部2の分解斜視図である。FIG. 2 is an exploded perspective view of the input / output unit 2.

【図3】制御回路の機能ブロック図である。FIG. 3 is a functional block diagram of a control circuit.

【図4】要約文章生成装置4の全体処理の流れを示すフ
ローチャートである。
FIG. 4 is a flowchart showing a flow of overall processing of the summary sentence generation device 4;

【図5】要約行数設定処理の流れを示すフローチャート
である。
FIG. 5 is a flowchart illustrating a flow of a summary line number setting process.

【図6】要約行数設定処理の液晶画面表示図である。FIG. 6 is a liquid crystal screen display diagram of a summary line number setting process.

【図7】不要行除去処理の流れを示すフローチャートで
ある。
FIG. 7 is a flowchart illustrating a flow of an unnecessary line removal process.

【図8】不要行除去処理前後の液晶画面表示図である。FIG. 8 is a view showing a liquid crystal screen before and after an unnecessary line removal process.

【図9】要約処理の流れを示すフローチャートである。FIG. 9 is a flowchart illustrating a flow of a summarization process.

【図10】要約行数設定処理前後の液晶表示図である。FIG. 10 is a liquid crystal display diagram before and after a summary line number setting process.

【符号の説明】[Explanation of symbols]

2 入出力部 4 要約文章生成装置 22 液晶表示回路部 28 中央制御部 32 ROM 34 RAM Reference Signs List 2 input / output unit 4 summary sentence generation device 22 liquid crystal display circuit unit 28 central control unit 32 ROM 34 RAM

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−259423(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 G06F 17/30 ────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-6-259423 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G06F 17/21 G06F 17/30

Claims (6)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 要約対象文章を記憶するための要約対象
文章記憶手段と、 前記要約対象文章記憶手段に記憶された前記要約対象文
章を受け、最初に行の長さが1つ前の行の長さよりも小
さくなる区分行を検出するための区分行検出手段と、 前記区分行検出手段で検出された前記区分行を受け、前
記要約対象文章記憶手段に記憶された前記要約対象文章
を前記区分行の1つ前の行より読出すための要約文章読
出手段とを含む、要約文章生成装置。
1. An abstract target sentence storage means for storing an abstract target sentence, and receiving the abstract target sentence stored in the abstract target sentence storage means, and firstly, a line length of a line preceding by one line is received. A sectioning line detecting means for detecting a sectioning line smaller than the length, receiving the sectioning line detected by the sectioning line detecting means, and converting the summary target sentence stored in the summary target sentence storage section into the sectioning section. An abstract sentence generation device, comprising: an abstract sentence reading means for reading from a line immediately before a branch line.
【請求項2】 前記区分行検出手段は、 前記要約対象文章記憶手段に記憶された前記要約対象文
章を最初の行から1行ずつ読込み、各行の長さを算出す
るための行長算出手段と、 前記行長算出手段で算出された前記各行の長さのうち現
在処理中の行の長さを記憶するための現在行長記憶手段
と、 前記行長算出手段で算出された最初の行から現在処理中
の行の1つ前の行までの長さの最大値を算出して記憶す
るための最大行長算出記憶手段と、 前記現在行長記憶手段に記憶された値と前記最大行長算
出記憶手段に記憶された値とを比較するための行長比較
手段と、 前記行長比較手段の結果を受け、前記現在行長記憶手段
に記憶された値が前記最大行長算出記憶手段に記憶され
た値より初めて小さくなる場合に、現在処理中の行を前
記区分行として検出するための手段とを含む、請求項1
に記載の要約文章生成装置。
2. A line length calculating means for reading the summarization target sentence stored in the summarization target sentence storage means one line at a time from the first line, and calculating the length of each line. A current line length storage unit for storing the length of the line currently being processed among the line lengths calculated by the line length calculation unit; and from the first line calculated by the line length calculation unit. A maximum line length calculation storage unit for calculating and storing the maximum value of the length up to the line immediately before the line currently being processed, a value stored in the current line length storage unit, and the maximum line length A line length comparison unit for comparing the value stored in the calculation storage unit, and a value stored in the current line length storage unit in response to the result of the line length comparison unit. When the value becomes smaller than the stored value for the first time, the row currently being processed is referred to as the section row. And means for detecting Te, claim 1
The summary sentence generation device described in.
【請求項3】 前記要約文章の上限行数を記憶するため
の上限要約行数記憶手段をさらに含み、 前記要約文章読出手段は、前記区分行検出手段で検出さ
れた前記区分行を受け、前記要約対象文章記憶手段に記
憶された前記要約対象文章を前記区分行の1つ前の行よ
り前記上限要約行数記憶手段に記憶された前記要約文章
の上限行数だけ読出すための設定行数要約文章読出手段
を含む、請求項1〜2のいずれかに記載の要約文章生成
装置。
3. The method according to claim 1, further comprising an upper limit summary line number storage unit for storing an upper limit line number of the summary sentence, wherein the summary sentence reading unit receives the division line detected by the division line detection unit, The set number of lines for reading the summarization target sentence stored in the summarization target sentence storage means from the line immediately before the segmented line by the upper limit number of lines of the summarization sentence stored in the upper limit summation line number storage means 3. The abstract sentence generation device according to claim 1, further comprising an abstract sentence reading unit.
【請求項4】 前記要約文章の上限行数を入力するため
の入力手段と、 前記入力手段の入力値を前記上限要約行数記憶手段に書
込むための書込み手段とをさらに含む、請求項3に記載
の要約文章生成装置。
4. An input unit for inputting an upper limit number of lines of the summary sentence, and a writing unit for writing an input value of the input unit into the upper limit summary line number storage unit. The summary sentence generation device described in.
【請求項5】 要約対象文章を記憶するための作業用文
章記憶手段と、 前記作業用文章記憶手段に記憶された前記要約対象文章
から不要行を除去して前記要約対象文章記憶手段に書込
むための不要行除去手段とをさらに含む、請求項1〜4
のいずれかに記載の要約文章生成装置。
5. A work sentence storage unit for storing a summary target sentence, and an unnecessary line is removed from the summary target sentence stored in the work sentence storage unit and written into the summary target sentence storage unit. And an unnecessary line removing means for performing the processing.
The summary sentence generation device according to any one of the above.
【請求項6】 前記不要行は、空行と、行頭に特定パタ
ーンを有する行とを含み、 前記不要行除去手段は、前記作業用文章記憶手段に記憶
された前記要約対象文章から前記空行と前記行頭に特定
パターンを有する行とを除去して前記要約対象文章記憶
手段に書込むための手段を含む、請求項5に記載の要約
文章生成装置。
6. The unnecessary line includes a blank line and a line having a specific pattern at the beginning of the line, and the unnecessary line removing unit is configured to execute the blank line from the summary target sentence stored in the working sentence storage unit. 6. The summary sentence generation apparatus according to claim 5, further comprising: means for removing a line having a specific pattern at the head of the line and writing the same in the summary target sentence storage means.
JP11932597A 1997-05-09 1997-05-09 Abstract sentence generator Expired - Fee Related JP3337940B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11932597A JP3337940B2 (en) 1997-05-09 1997-05-09 Abstract sentence generator

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11932597A JP3337940B2 (en) 1997-05-09 1997-05-09 Abstract sentence generator

Publications (2)

Publication Number Publication Date
JPH10307821A JPH10307821A (en) 1998-11-17
JP3337940B2 true JP3337940B2 (en) 2002-10-28

Family

ID=14758681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11932597A Expired - Fee Related JP3337940B2 (en) 1997-05-09 1997-05-09 Abstract sentence generator

Country Status (1)

Country Link
JP (1) JP3337940B2 (en)

Also Published As

Publication number Publication date
JPH10307821A (en) 1998-11-17

Similar Documents

Publication Publication Date Title
JP4582810B2 (en) Electronic dictionary device
US6336125B2 (en) Method and device for generating application data and storage medium containing thereon a program for generating application data
JP2004288195A (en) User-operable help information system
CN101458704B (en) Electronic device
JP5309873B2 (en) Electronic device and program having dictionary function with handwriting input unit
JP3337940B2 (en) Abstract sentence generator
JPH11161582A (en) Device and method for processing information and medium storing information processor control program
JP3734391B2 (en) Individual name extraction device, extraction method, and recording medium
JPH1166061A (en) Information processor, and computer readable recording medium recorded with information processing program
JPH09244847A (en) Computer system
CN109582959B (en) Book catalog generation method and device, computer equipment and storage medium
JP3672473B2 (en) Individual name extraction device, extraction method, and recording medium
JPH01214963A (en) Device for consulting dictionary
JPH09146892A (en) Electronic equipment
JP2786260B2 (en) Kana-Kanji conversion device
JPH05290030A (en) Word processor
JP2001117913A (en) Face mark input device
JP2001236360A (en) Electronic book display device and storage medium with recorded electronic book display program
CN110764843A (en) Application program control method, terminal and computer readable storage medium
CN118114660A (en) Text detection method, system and computer readable storage medium
JP2001075952A (en) Method and device for processing data and storage medium
JPS62125426A (en) Data input system
JPS62156767A (en) Word processor with memo@(244e//00) function
JPH05298287A (en) Document processor
JPH1011428A (en) Kana-to-kanji conversion device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020723

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070809

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080809

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080809

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090809

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090809

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100809

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110809

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110809

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120809

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120809

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130809

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees