JP2638187B2 - Text summarization device - Google Patents

Text summarization device

Info

Publication number
JP2638187B2
JP2638187B2 JP1057016A JP5701689A JP2638187B2 JP 2638187 B2 JP2638187 B2 JP 2638187B2 JP 1057016 A JP1057016 A JP 1057016A JP 5701689 A JP5701689 A JP 5701689A JP 2638187 B2 JP2638187 B2 JP 2638187B2
Authority
JP
Japan
Prior art keywords
sentence
unit
selection
input
selection criterion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1057016A
Other languages
Japanese (ja)
Other versions
JPH02297157A (en
Inventor
浩幸 新納
信一 重永
弘義 石橋
貴雄 福重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1057016A priority Critical patent/JP2638187B2/en
Publication of JPH02297157A publication Critical patent/JPH02297157A/en
Application granted granted Critical
Publication of JP2638187B2 publication Critical patent/JP2638187B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、文書検索などにおいて大量の文書から所望
の文章の内容を迅速に把握する手段としてその文章の要
約文を得る文章要約装置に関する。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a text summarization apparatus for obtaining a summary text of a desired text as a means for quickly grasping the content of a desired text from a large number of documents in a document search or the like.

従来の技術 従来の文章要約の方法としては、予め一定のフレーム
を用意しておきそのスロットを埋めていく方法、ストー
リ性のある文章を対象として物語文法という文章レベル
の規則を適用して物語の核になる文章を抽出する方法
や、文章を論理的に展開されるものに限定し、文間の連
接関係の解析を行い文章の構造を二分木で表現して個々
の連接関係に付与された重みから二分木を走査して要約
文を得る方法などがあった。
2. Description of the Related Art Conventional text summarization methods include a method of preparing a certain frame in advance and filling its slots, and a method of story-level grammar by applying a story-level grammar to a story-like sentence. The method of extracting the core sentence and limiting the sentence to those that can be logically expanded, analyzing the connection between sentences, expressing the structure of the sentence as a binary tree, and assigning it to each connection There was a method of scanning a binary tree from weights to obtain a summary sentence.

発明が解決しようとする課題 文書検索などに用いる文章要約では、個々の文章の内
容に拘わらず利用者の望む情報を迅速かつ容易に抽出す
ることが必須要件である。そのためには、文解析や要約
文生成の負担を軽くして高速な処理を実現すると同時
に、利用者の要求に応じて要約文の質及び量が制御でき
る必要がある。
In the text summarization used for document search or the like, it is essential that information desired by the user be quickly and easily extracted regardless of the content of each text. For this purpose, it is necessary to realize high-speed processing by reducing the burden of sentence analysis and summary sentence generation, and at the same time, to control the quality and quantity of the summary sentence according to the user's request.

従来のフレームによる方法では、広範囲の文章に対処
するには記述内容に応じたフレームを多数用意する必要
があり実用的ではなかった。また、物語文法や文間の連
接関係による方法は高度の意味解析を必要とするため文
解析の負担が大きく高速処理には向いていなかった。
In the conventional method using frames, it is not practical to deal with a wide range of sentences because it is necessary to prepare a large number of frames according to the description contents. Moreover, the method based on the story grammar and the connection between sentences requires a high level of semantic analysis, so that the burden of sentence analysis is large and not suitable for high-speed processing.

本発明は上記課題を解決するためのもので、第1に文
解析や要約文生成の負担が少なく、かつ、個々の文章の
記述内容に依らず広範囲の文章に適用できる文章要約装
置を提供することを目的とする。
SUMMARY OF THE INVENTION The present invention is to solve the above-mentioned problem. First, it provides a text summarization apparatus which has a small burden of sentence analysis and generation of a summary sentence and can be applied to a wide range of texts regardless of the description content of each text. The purpose is to:

また、第2に利用者の要求に応じて要約文の質及び量
を制御できる文章要約装置を提供することを目的とする
ものである。
Another object of the present invention is to provide a text summarization apparatus capable of controlling the quality and quantity of a summary sentence according to a user's request.

課題を解決するための手段 上記目的を達成するために、本願発明の文章要約装置
は第1に、文章と当該文章の書かれた意図・目的によっ
て分類された文章のタイプとを入力する入力部と、前記
入力部により入力された文章の各文の構文解析を行う文
解析部と、文章のタイプ毎に要約文を構成する文形態を
指定した文形態選択基準と、語彙情報,構文情報,連接
関係の情報の少なくとも一つを用いて記述された文の文
形態を判定する判定基準とからなる選択基準を格納した
選択基準データベースと、前記入力部から入力された文
章から要約を構成する文を選択する要約文選択部と、選
択された文を表示する要約文表示部とを備え、前記要約
文選択部が、前記文解析部の構文解析結果に対し、前記
入力部から入力された当該文章のタイプに対応する文形
態選択基準と、当該文形態選択基準により指定された文
形態を判定する判定基準とを参照し、該当する入力文が
要約を構成する文であるか否かを判定することにより要
約を構成する文を選択する構成となっている。
Means for Solving the Problems In order to achieve the above object, a text summarizing apparatus according to the present invention firstly comprises an input section for inputting a text and a type of a text classified according to the intention / purpose of writing the text. A sentence analysis unit that performs a syntax analysis of each sentence of the sentence input by the input unit, a sentence form selection criterion that specifies a sentence form that constitutes a summary sentence for each sentence type, vocabulary information, syntax information, A selection criterion database storing a selection criterion including a criterion for determining a sentence form of a sentence described by using at least one of the information on the concatenation relation, and a sentence constituting a summary from a sentence input from the input unit And a summary sentence display unit for displaying the selected sentence, wherein the summary sentence selection unit responds to the syntax analysis result of the sentence analysis unit by inputting from the input unit. Corresponding to the type of sentence The sentence form selection criterion and the criterion for judging the sentence form specified by the sentence form selection criterion are referred to, and it is determined whether or not the corresponding input sentence is a sentence constituting the summary. It is configured to select a constituent sentence.

第2に、第1の手段において、選択基準データベース
に格納された選択基準が重要度を備え、要約文選択部が
前記重要度に基づき要約を構成する文を選択する構成と
なっている。
Secondly, in the first means, the selection criterion stored in the selection criterion database has a degree of importance, and the summary sentence selecting unit selects a sentence constituting a summary based on the importance.

作用 上記構成における作用は次のようになる。種々の文章
においては、その文章の性質、即ち、文章の具体的な内
容とは無関係に、文章の書かれた意図、目的等によって
特別ないい回しや構文構造をもっている。したがって、
これらの特別な要素を予め選択基準として設定してお
き、入力文章を構文解析して得られた情報をこの選択基
準と照合比較して重要と思われるものを抽出選択するこ
とにより、個々の文章の具体的記述内容の如何にかかわ
らず広範囲の文章を高速に処理して要約文を得ることが
できる。
Operation The operation in the above configuration is as follows. Various texts have a special circling or syntactic structure depending on the purpose, purpose, etc. of the text, regardless of the nature of the text, that is, the specific content of the text. Therefore,
These special elements are set as selection criteria in advance, and the information obtained by parsing the input sentence is compared with the selection criteria to extract and select those considered important, so that individual sentences can be selected. Irrespective of the specific contents of the description, a summary sentence can be obtained by processing a wide range of sentences at high speed.

また、第2の手段において要約文選択部が選択基準の
重要度に基づき要約を達成する文を選択することによ
り、利用者の要求に合わせ要約文の質や量を調整するこ
とが可能である。
In the second means, the summary sentence selection unit selects a sentence that achieves the summary based on the importance of the selection criterion, so that the quality and quantity of the summary sentence can be adjusted according to the user's request. .

実 施 例 以下、本発明の実施例を図面により説明する。Embodiments Hereinafter, embodiments of the present invention will be described with reference to the drawings.

第1図は、本発明の実施例の文書要約装置の概念図で
ある。要約される文章は英語の文章とする。入力装置1
より入力された文章は、文解析装置2によって構文意味
解析が施され入力文章の各文の内容を表す内部表現に変
換される。要約文選択装置3は、入力文章と共に利用者
により指定された文章の性質を示す文章のタイプを受け
取り、そのタイプに対応した選択基準を選択基準データ
ベース4から得る。
FIG. 1 is a conceptual diagram of a document summarizing apparatus according to an embodiment of the present invention. The text to be summarized should be English text. Input device 1
The sentence input from the input sentence is subjected to syntactic and semantic analysis by the sentence analysis device 2 and is converted into an internal expression representing the content of each sentence of the input sentence. The summary sentence selection device 3 receives a sentence type indicating the nature of the sentence specified by the user together with the input sentence, and obtains a selection criterion corresponding to the type from the selection criterion database 4.

選択基準データベース4に格納される選択基準は次の
ようにして定められる。各種の文章、たとえば主張や問
題提起などの著者のある種の態度を表す文の形態には、
特別な語句やいい回しが使用されていたり、特別の構文
構造を持っていたりする。また、依頼では著者の要求を
述べた文構造を有している。これらは特別な語彙情報、
構文情報あるいは文間の連接関係の情報などとして表わ
すことが可能である。選択基準データベース4には、こ
れら、『主張』や『問題提起』、『依頼』等の文章の性
質、即ち、文章の具体的な内容とは無関係に、文章の書
かれた意図、目的等によって分類される文章のタイプご
と、どのような形態の文が重要であるか、また、その他
にどのような形態の文を選択すれば要約文が得られるか
が記述されている。それらの文の形態を判定する判定基
準となるものを、上記のような語彙情報や構文情報や文
間の連接関係の情報などの形で記述する。それらの文の
形態や判定情報には重要度を付加しておく。
The selection criterion stored in the selection criterion database 4 is determined as follows. A variety of sentences, such as those that describe the author's certain attitudes, such as assertions or questions,
It has special words or phrases, or has a special syntactic structure. The request has a sentence structure that describes the author's request. These are special vocabulary information,
It can be represented as syntax information or information on connection between sentences. In the selection criterion database 4, the nature of the sentence such as "claim", "question", "request", etc., that is, regardless of the specific content of the sentence, For each type of sentence that is classified, what form of sentence is important, and what other form of sentence is selected to obtain a summary sentence are described. A criterion for judging the form of the sentence is described in the form of the vocabulary information, the syntax information, the information of the connection relationship between the sentences, and the like. The importance is added to the sentence form and the determination information.

選択基準に付加される重要度を用いて全ての文に対す
る重要度を算出することにより要約文の量や質に対応す
るレベル値に従って重要度がある値以上の文を選択する
ことが可能になり、必要に応じて要約文の量や質を制御
することができる。詳細は後述する。
By calculating the importance for all sentences using the importance added to the selection criterion, it is possible to select sentences with a value greater than or equal to the importance according to the level value corresponding to the quantity and quality of the summary sentence The amount and quality of the summary can be controlled as needed. Details will be described later.

要約文選択装置3では、選択基準データベース4から
の選択基準と文解析装置2から得られた入力文章の各文
の内部表現を照合することにより重要と思われる文を選
択する。要約文の質や量のレベルは既定値として与えら
れてあり、このレベル値も考慮して選択される文は決定
される。既定のレベルを変更することによって要約文の
質や量を制御し利用者の目的に合った要約文を得ること
ができる。
The summary sentence selection device 3 selects a sentence considered to be important by comparing the selection criterion from the selection criterion database 4 with the internal expression of each sentence of the input sentence obtained from the sentence analysis device 2. The level of the quality and quantity of the summary sentence is given as a default value, and the sentence to be selected is determined in consideration of this level value. By changing the default level, it is possible to control the quality and quantity of the summary sentence and obtain a summary sentence that suits the user's purpose.

第2図は、第1図の選択基準データベース4の内部構
成である。文章の性質ごとにどのような形態の文を選択
するかを記述した文形態選択基準部7と、文の形態ごと
にその形態であることを判定するための情報を記述した
判定情報部8からなっている。データベースを文形態選
択基準部7と判定情報部8とに分けることにより、いく
つかの文章の性質に対して選択すべき文の形態が重複す
る場合には判定基準を共有し重複記述を避けることがで
きる。
FIG. 2 is an internal configuration of the selection criterion database 4 of FIG. A sentence form selection reference unit 7 describing what form a sentence is to be selected for each property of the sentence, and a determination information unit 8 describing information for determining the form for each sentence form Has become. The database is divided into a sentence form selection criterion section 7 and a judgment information section 8, so that when the form of a sentence to be selected is duplicated for some sentence properties, the judgment criterion is shared and duplicate descriptions are avoided. Can be.

第3図は、第2図の文形態選択基準部7の内部構成で
ある。文章の性質ごとに、その文章から要約を得るため
に必要と思われる主張や問題提起といった文の形態が記
述されている。それらの文の形態の各々にはこの文章の
性質を考慮した重要度a,b,c,………が与えられている。
同じ文の形態であっても要求している文章の性質によっ
て重要度の値は異なっている。
FIG. 3 shows the internal configuration of the sentence form selection reference section 7 of FIG. For each character of the sentence, the form of the sentence, such as a claim or a problem, which is deemed necessary to obtain a summary from the sentence is described. Each of these sentence forms is given a degree of importance a, b, c,... Taking into account the nature of the sentence.
Even in the same sentence form, the value of importance differs depending on the nature of the requested sentence.

例えば、社説や論説などのように著者の主張を捕らえ
ることが重要であるような文章は文書のタイプとして
『主張』に、著者の読み手に対する要求を捕らえること
が重要な文章は文章のタイプとして『依頼』に分類され
る。
For example, sentences in which it is important to capture the author's claim, such as editorials and editorials, are referred to as "claims" as a document type, and sentences in which it is important to capture the requirements of the author's reader are referred to as "sentence type". Request ”.

そして、文章のタイプ、即ち、文章の性質が『主張』
である場合には、主張や結論を述べている文や、その主
張や結論の元になった問題提起を述べている文や、その
主張や結論の根拠を述べている文などを選択することに
より要約文が得られると考える。その際、問題提起や根
拠を述べている文は主張や結論を述べている文の補足的
な役割になるので、重要度の値を低く設定する。
And the type of sentence, that is, the nature of the sentence is "claim"
If so, select a statement that states the claim or conclusion, a statement that raises the problem that caused the claim or conclusion, or a statement that states the basis of the claim or conclusion. Would yield a summary sentence. At this time, the value of the importance statement is set low because the statement that raises the problem or the grounds serves as a supplementary role to the statement that states the assertion or conclusion.

第4図は、第2図の判定情報部8の内部構成図であ
る。文の形態ごとにその文の形態であることを判定する
ための語彙的情報や構文的情報や文間の連接関係の情報
が記述されている。また、それら各々の情報にも重要度
s,t,………が付加されている。これらの各情報の少なく
とも1つが選択に用いられる。
FIG. 4 is an internal configuration diagram of the determination information unit 8 of FIG. For each sentence form, lexical information, syntactic information, and information on connection between sentences for determining the sentence form are described. The importance of each piece of information
s, t,... are added. At least one of these pieces of information is used for selection.

例えば、主張を表す文の形態の場合、語彙的情報とし
ては、「should」や「must」などの主張を表す助動詞や
「We hope」などの言い回しの出現情報を用いる。構文
的情報としては、主張を表す強調構文などの情報を用い
る。文間の連接関係情報としては、語彙情報や構文的情
報により主張を表すと認められた文に、「and」や「bu
t」などの接続詞で繋がれた文などの情報を用いる。重
要度としては、例えば、強調構文である文は、「shoul
d」の出現する文よりも強い主張を表していると考え
て、重要度の値を高く設定する。連接関係情報の重要度
は要約文選択部2によりその連接関係となった文の重要
度を考慮して動的に値が付けられる。
For example, in the case of a sentence form expressing an assertion, as lexical information, use is made of an auxiliary verb expressing an assertion such as "should" or "must" or appearance information of a phrase such as "We hope". As the syntactic information, information such as an emphasis syntax expressing an assertion is used. Concatenation relation information between sentences includes `` and '' and `` bu
Information such as sentences connected by a conjunction such as "t" is used. As importance, for example, a sentence that is an emphasized syntax is "shoul
The value of importance is set high, considering that the statement expresses a stronger assertion than the sentence where "d" appears. The importance of the connection relation information is dynamically assigned a value by the summary sentence selection unit 2 in consideration of the importance of the sentence in the connection relation.

第5図は、第1図の要約文選択装置3の処理の概念図
を表したものである。選択基準抽出部9では、選択基準
データベース4の文形態選択基準部7から入力文章の性
質に応じた要約文を得るための文の形態の情報と、選択
基準データベース4の判定情報部8からそれらの文の形
態を判定するための情報を取り出す。重要度算出部10で
はそれらの選択情報を文解析装置2から得られた各文の
内部表現に照合する。ある文が判定情報に合致した場合
には、その文の形態の重要度や判定情報に使用された情
報の重要度を考慮してその文の重要度を決定する。連接
関係情報に合致して選択された文の重要度は、その連接
関係となったもとの文の重要度から算出し、複数の判定
基準を満たす文には各々の判定基準に対応した重要度の
最大値より高い値を与える。どの判定情報にも合致しな
い文は重要度を最低値にし、入力文章の全ての文に対し
て何らかの重要度を与える。レベル別選択部11は、入力
装置1より要約文の質や量に対応するレベル値を知る。
このとき、レベル値の入力がない場合は、既定値が用い
られる。このレベル値に従って、重要度がある値以上の
文を選択する。レベル値に対応する重要度の範囲は選択
すべき要約文の質や量と重要度の値の分布から求められ
る。例えば、レベル値1が、量に対する要求「要約文を
全文の2分の1にする」に対応するものとすると、重要
度の値の分布から選択分の量が全文の2分の1になるよ
うな重要度の値を求め、その値以上の文を要約文として
選択する。なお、レベル値に対応する重要度の範囲を予
め設定しておくこともできるが、その場合には全部の文
が選択されたり、逆にまったく選択されなかったりする
ことが起こりうるので注意が必要である。
FIG. 5 shows a conceptual diagram of the processing of the summary sentence selection device 3 of FIG. The selection criterion extracting unit 9 obtains information on the sentence form for obtaining a summary sentence corresponding to the nature of the input sentence from the sentence form selection criterion unit 7 of the selection criterion database 4 and the judgment information unit 8 of the selection criterion database 4. The information for determining the form of the sentence is extracted. The importance calculation unit 10 compares the selected information with the internal expression of each sentence obtained from the sentence analysis device 2. When a sentence matches the judgment information, the importance of the sentence is determined in consideration of the importance of the form of the sentence and the importance of the information used for the judgment information. The importance of the sentence selected in accordance with the concatenation relationship information is calculated from the importance of the original sentence that has formed the concatenation relationship. Give a value higher than the maximum value. A sentence that does not match any of the pieces of judgment information has the lowest importance, and assigns some importance to all sentences in the input sentence. The level-based selection unit 11 knows a level value corresponding to the quality and quantity of the summary sentence from the input device 1.
At this time, if there is no input of a level value, a default value is used. According to this level value, a sentence whose importance is equal to or higher than a certain value is selected. The range of the importance corresponding to the level value is obtained from the quality and quantity of the summary sentence to be selected and the distribution of the value of the importance. For example, assuming that the level value 1 corresponds to the request for the amount “the summary sentence is reduced to half of the whole sentence”, the selected amount is reduced to half of the whole sentence from the distribution of the importance value. A value of such importance is obtained, and a sentence higher than that value is selected as a summary sentence. Note that the range of importance corresponding to the level value can be set in advance, but in this case, it is possible to select all sentences or conversely not to select them at all. It is.

第1図にもどり、このようにして要約文選択装置3で
選択された要約文は出力装置6に供給され、入力文章上
に色分けとか太字化などのハイライト表示をして表示す
る。このハイライト表示によりいわゆる斜め読みをサポ
ートすることができる。
Returning to FIG. 1, the summary sentence selected by the summary sentence selection device 3 in this way is supplied to the output device 6, and is displayed on the input sentence by highlighting it by color coding or bolding. This highlight display can support so-called oblique reading.

なお、利用者の要求に応じて要約文生成装置5では、
文解析装置2による文の内部表現から、選択された文に
対応する日本語訳を生成し出力装置6により同一画面上
に表示する。
In addition, in response to the request of the user, the summary sentence generation device 5
From the internal representation of the sentence by the sentence analyzer 2, a Japanese translation corresponding to the selected sentence is generated and displayed on the same screen by the output device 6.

発明の効果 以上のように、本発明は入力文章の各文の構文意味解
析の結果を所定の選択基準と照合して重要と思われる文
を選択する文章要約方法および装置で、選択基準は、文
章の性質が同じであれば個々の文章の記述内容に依らな
いので広範囲の文章に適用できる。また、浅い文解析で
も判定できる基準なので文解析の負担が少なく、要約文
も選択のみで生成できるための処理負担が少ない。した
がって高速の処理が可能である。
Effect of the Invention As described above, the present invention provides a sentence summarizing method and apparatus for selecting a sentence considered to be important by comparing the result of syntactic and semantic analysis of each sentence of an input sentence with a predetermined selection criterion. If the texts have the same properties, they can be applied to a wide range of texts because they do not depend on the description of each text. In addition, since it is a criterion that can be determined even in shallow sentence analysis, the burden of sentence analysis is small, and the processing load for generating a summary sentence only by selection is small. Therefore, high-speed processing is possible.

さらに、要約文を選択する際に入力文章全文に重要度
与えることにより選択文の追加や削除が高速に行なえ、
対話的に要約文の質や量の調整ができる。また、選択基
準の情報として語彙に関する情報だけを用いれば、構文
解析の処理を行なわず更に高速な処理も可能になる。
Furthermore, adding or deleting selected sentences can be performed at high speed by giving importance to the entire input sentence when selecting a summary sentence.
You can interactively adjust the quality and quantity of the summary sentence. Further, if only the information about the vocabulary is used as the information of the selection criterion, a higher-speed processing can be performed without performing the parsing processing.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の実施例の文章要約装置のブロック図、
第2図は選択基準データベースの内部構成図、第3図は
選択基準データベースの文形態選択基準部の内部構成
図、第4図は選択基準データベースの判定情報部の内部
構成図、第5図は要約文選択装置の処理の概念図であ
る。 1……入力装置、2……文解析装置、3……要約文選択
装置、4……選択基準データベース、5……要約文生成
装置、6……出力装置、7……文形態選択基準部、8…
…判定情報部、9……選択基準抽出部、10……重要度算
出部、11……レベル選択部。
FIG. 1 is a block diagram of a text summarizing apparatus according to an embodiment of the present invention;
FIG. 2 is an internal configuration diagram of a selection criterion database, FIG. 3 is an internal configuration diagram of a sentence form selection criterion portion of the selection criterion database, FIG. 4 is an internal configuration diagram of a judgment information portion of the selection criterion database, and FIG. It is a conceptual diagram of a process of a summary sentence selection device. DESCRIPTION OF SYMBOLS 1 ... Input device, 2 ... Sentence analysis device, 3 ... Summary sentence selection device, 4 ... Selection criterion database, 5 ... Summary sentence generation device, 6 ... Output device, 7 ... Sentence form selection reference portion , 8 ...
... Judgment information section, 9 ... selection criterion extraction section, 10 ... importance calculation section, 11 ... level selection section.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 福重 貴雄 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 昭61−100861(JP,A) 特開 昭63−298563(JP,A) 情報処理学会研究報告,Vol.87, No.68,P.63.6.1〜63.6. 8,1987 情報処理学会研究報告,Vol.87, No.84,P.85〜91,1987 ──────────────────────────────────────────────────続 き Continuation of the front page (72) Inventor Takao Fukushige 1006 Kazuma Kadoma, Kadoma City, Osaka Prefecture Matsushita Electric Industrial Co., Ltd. (56) References JP-A-61-100861 (JP, A) JP-A-63- 298563 (JP, A) Information Processing Society of Japan Research Report, Vol. 87, No. 68, p. 63.6.1-63.6.8, 1987 Information Processing Society of Japan Research Report, Vol. 87, No. 84, p. 85-91, 1987

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】文章と当該文章の書かれた意図・目的によ
って分類された文章のタイプとを入力する入力部と、 前記入力部により入力された文章の各文の構文解析を行
う文解析部と、 文章のタイプ毎に要約文を構成する文形態を指定した文
形態選択基準と、語彙情報,構文情報,連接関係の情報
の少なくとも一つを用いて記述された、文の文形態を判
定する判定基準とからなる選択基準を格納した選択基準
データベースと、 前記入力部から入力された文章から要約を構成する文を
選択する要約文選択部と、 選択された文を表示する要約文表示部とを備え、 前記要約文選択部が、前記文解析部の構文解析結果に対
し、前記入力部から入力された当該文章のタイプに対応
する文形態選択基準と、当該文形態選択基準により指定
された文形態を判定する判定基準とを参照し、該当する
入力文が要約を構成する文であるか否かを判定すること
により要約を構成する文を選択することを特徴とする文
書要約装置。
An input unit for inputting a sentence and a type of the sentence classified according to the intention and purpose in which the sentence is written, and a sentence analyzing unit for performing a syntax analysis of each sentence of the sentence input by the input unit And a sentence form selection criterion that specifies a sentence form constituting a summary sentence for each sentence type, and a sentence form of the sentence described using at least one of vocabulary information, syntax information, and information on connection relations is determined. A selection criterion database storing a selection criterion including a criterion to be determined, a summary sentence selection unit for selecting a sentence constituting a summary from sentences input from the input unit, and a summary sentence display unit for displaying the selected sentence The summary sentence selection unit is configured to specify a sentence form selection criterion corresponding to the type of the sentence input from the input unit with respect to the syntax analysis result of the sentence analysis unit, and the sentence form selection criterion. Judge the sentence form Article Summary apparatus characterized by criterion a reference to the input sentence corresponding to select the sentence that constitutes the summary by determining whether the sentence constituting an abstract that will.
【請求項2】選択基準データベースに格納された選択基
準が重要度を備え、要約文選択部が前記重要度に基づき
要約を構成する文を選択することを特徴とする請求項1
記載の文書要約装置。
2. The method according to claim 1, wherein the selection criterion stored in the selection criterion database has a degree of importance, and the summary sentence selection unit selects a sentence constituting a summary based on the importance.
Document summarization device as described.
【請求項3】請求項1記載の構成に加え、要約文選択部
により選択された文を他言語に翻訳する手段を備え、要
約文表示部が翻訳された文を表示することを特徴とする
請求項1記載の文書要約装置。
3. The system according to claim 1, further comprising: means for translating the sentence selected by the summary sentence selection unit into another language, wherein the summary sentence display unit displays the translated sentence. The document summarizing apparatus according to claim 1.
JP1057016A 1989-03-09 1989-03-09 Text summarization device Expired - Lifetime JP2638187B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1057016A JP2638187B2 (en) 1989-03-09 1989-03-09 Text summarization device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1057016A JP2638187B2 (en) 1989-03-09 1989-03-09 Text summarization device

Publications (2)

Publication Number Publication Date
JPH02297157A JPH02297157A (en) 1990-12-07
JP2638187B2 true JP2638187B2 (en) 1997-08-06

Family

ID=13043639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1057016A Expired - Lifetime JP2638187B2 (en) 1989-03-09 1989-03-09 Text summarization device

Country Status (1)

Country Link
JP (1) JP2638187B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3691844B2 (en) * 1990-05-21 2005-09-07 株式会社東芝 Document processing method
JP3358100B2 (en) * 1995-04-17 2002-12-16 日本電信電話株式会社 Japanese question message analysis method and device
JP2002073644A (en) * 2000-08-28 2002-03-12 Suuri Giken:Kk Device and method for extracting and processing important statement and computer readable storage medium stored with important statement extraction processing program
JP2009151798A (en) * 2009-01-19 2009-07-09 Sony Corp Image processor and image processing method
JP5979706B2 (en) * 2012-03-27 2016-08-31 株式会社 ドキュメントハウス Product manual evaluation system, its evaluation method and quality evaluation server
WO2020234929A1 (en) * 2019-05-17 2020-11-26 株式会社アイエクセス Summary creation method, summary creation system, and summary creation program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61100861A (en) * 1984-10-23 1986-05-19 Toshiba Corp Document editing device
JP2766261B2 (en) * 1987-05-29 1998-06-18 株式会社東芝 Sentence summarization system
JPS6450161A (en) * 1987-08-20 1989-02-27 Matsushita Electric Ind Co Ltd Document processor

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
情報処理学会研究報告,Vol.87,No.68,P.63.6.1〜63.6.8,1987
情報処理学会研究報告,Vol.87,No.84,P.85〜91,1987

Also Published As

Publication number Publication date
JPH02297157A (en) 1990-12-07

Similar Documents

Publication Publication Date Title
JP2638187B2 (en) Text summarization device
JPH0344764A (en) Mechanical translation device
JPH0576067B2 (en)
JPH03191475A (en) Document summarizing system
JPS61260366A (en) Mechanical translating system having learning function
JPH0561902A (en) Mechanical translation system
JPH08190562A (en) Machine translation system
JP2715419B2 (en) Translation equipment
JPH0635964A (en) Machine translation device
JPH06236399A (en) Word processor with translation function
JPH0561906A (en) Language conversion system
JPH09185629A (en) Machine translation method
JPH09134358A (en) Machine translation system
JP3253311B2 (en) Language processing apparatus and language processing method
JPH03164975A (en) Mechanical translating device
JPH05225232A (en) Automatic text pre-editor
JP3033858B2 (en) Consent sentence generator
JPH03225468A (en) Machine translation device
JPH04153878A (en) Pre-editing assisting processor of machine translation device
JPH05216922A (en) Dictionary editing device
JPH04130577A (en) Natural language processor
JPH04119467A (en) Natural language translating method
JPH01321553A (en) Japanese word processing method with literary style converting function
JPH03212767A (en) Device for forming natural language
JPH05290083A (en) Document generation support device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080425

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 12

EXPY Cancellation because of completion of term