JP2001325273A - Important sentence extraction device, method therefor and storage medium - Google Patents

Important sentence extraction device, method therefor and storage medium

Info

Publication number
JP2001325273A
JP2001325273A JP2000141140A JP2000141140A JP2001325273A JP 2001325273 A JP2001325273 A JP 2001325273A JP 2000141140 A JP2000141140 A JP 2000141140A JP 2000141140 A JP2000141140 A JP 2000141140A JP 2001325273 A JP2001325273 A JP 2001325273A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
document
table
important
importance
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000141140A
Other languages
Japanese (ja)
Inventor
Masako Bosu
雅子 望主
Original Assignee
Ricoh Co Ltd
株式会社リコー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

PROBLEM TO BE SOLVED: To appropriately specify an important sentence corresponding to the kind of the structure of a document. SOLUTION: In a document structure information importance table 3, the 'conditions' of the presence/absence of a document structure expression and the number of the paragraphs in the document and 'important parts' in the document are made to correspond to each other for registration. The document structure expression is an expression for clearly indicating the document structure and is a subtitle or the title of a chapter or a passage, for instance. A document analysis part 2 analyzes an input document, examines to which 'condition' of the document structure information importance table 3 it is pertinent and specifies a part pertinent to the 'important part' corresponding to the pertinent 'condition' as the important part of the input document.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】この発明は、対象となる文書の重要部分を特定することができる重要文抽出装置およびその方法ならびに記憶媒体に関する。 TECHNICAL FIELD The present invention relates to a key sentence extraction apparatus and method, and storage medium can be specified important part of the document of interest.

【0002】 [0002]

【従来の技術】近年、インターネットの普及などによって、大量の文書データを扱う必要が生じてきている。 In recent years, such as by the spread of the Internet, it has become necessary to deal with large amounts of document data. そのため、文書中の重要な個所を抽出するための技術が研究されている。 Therefore, a technique for extracting the key points in the document have been studied. かかる技術には、単語の頻度や表現によって文書中の重要な個所を特定するものと、文書の構造から文書中の重要な個所を判断するものとがある。 Such techniques include the intended to identify key points in the document by the word frequency and expressions, as to determine the critical points in the document from the structure of the document. 特に後者の場合、文書によってその構造は異なってくるため、どのような文書を処理対象にするかによって重要かどうかの判断基準が変ってくる。 Especially in the latter case, since the structure varies by the document, coming Hen' important basis for deciding whether or not depending on whether you what document processed.

【0003】これに対し、特開平7-13967号公報には、 [0003] On the other hand, in Japanese Unexamined Patent Publication (Kokai) No. 7-13967,
文書の分野ごとのシナリオ項目をもち、シナリオの部分ごとに述語のテーブルを持ち、文書の重要な文を抽出する、「抄録文作成装置」が開示されている。 Has a scenario items for each field of the document has a predicate of the table for each part of the scenario, to extract important sentences in a document, "abstract statement creating apparatus" is disclosed. これは、対象文書の分野に応じた重要文を抽出し、かつそれらの文を整形して抄録文をつくるものである。 It extracts important sentences in accordance with the field of the target document, and is intended to make abstract statement shaping those statements.

【0004】 [0004]

【発明が解決しようとする課題】しかし、前記特開平7- [SUMMARY OF THE INVENTION However, the Patent 7-
13967号公報に開示の技術では、以下の不具合がある。 The 13967 JP disclosed technique, there is the following problem.

【0005】第1に、述語表現に一致しない場合は重要文を得ることができないという不具合がある。 [0005] First, there is the problem that if you do not match the predicate expression is not possible to obtain the important statement.

【0006】第2に、述語表現だけに着目し、その他の手がかりとなる言語情報を使用しないため、重要文がうまく抽出できない場合があるという不具合がある。 [0006] In the second, paying attention only to the predicate expression, because you do not want to use the language information to be with other clues, there is a problem that there is a case in which important statement can not be successfully extracted.

【0007】第3に、抽出する重要文の量を変えることができないという不具合がある。 [0007] Third, there is a problem that it is not possible to change the amount of important sentences to be extracted.

【0008】この発明の目的は、文書の構造の種類に応じて適切に重要文を特定することである。 An object of the present invention is to identify the proper key sentences according to the type of structure of the document.

【0009】この発明の別の目的は、文書タイプに応じて適切に重要文の特定をすることである。 Another object of the invention is to appropriately important statement specified according to the document type.

【0010】この発明の別の目的は、文書中の重要である可能性がある個所は落とさずに特定することである。 Another object of this invention is the point that there is important is the possibility of a document is to identify without lowering.

【0011】この発明の別の目的は、重要度によって多段階に文書中の重要個所を特定できるようにすることである。 Another object of the invention is to be able to identify key points in the document at multiple stages importance.

【0012】この発明の別の目的は、文書をより効率的に読み進めることが可能となるよう文書中の重要個所を特定できるようにすることである。 Another object of the invention is to be able to identify key points in the document so that it is possible to proceed to read documents more efficiently.

【0013】この発明の別の目的は、重要個所を追加で特定し、または、特定する個所を増加する際に、所望の個所を特定することができるようにすることである。 Another object of this invention to identify an additional important point, or, when increasing the point that identifies, is to be able to identify the desired location.

【0014】この発明の別の目的は、より重要度の高い部分だけを文書中で特定することができるようにすることである。 Another object of the invention is to be able to identify only the higher importance part in the document.

【0015】 [0015]

【課題を解決するための手段】請求項1に記載の発明は、文書構造の種類と当該構造を有する文書中の部分の重要性の有無とを対応付けて記述しているテーブルを記憶する記憶手段と、前記テーブルを参照して対象となる文書中の重要個所を特定する重要個所特定手段と、を備えている重要文抽出装置である。 SUMMARY OF THE INVENTION The first aspect of the present invention, a storage for storing a table describing correspondence between the presence or absence of the importance of the portion of the document with the type and the structure of the document structure means and a sentence extraction device comprising a the importance position identification unit to identify key points in the document of interest by referring to the table.

【0016】したがって、文書の構造の種類に応じて適切に重要文を抽出することができる。 [0016] Thus, it is possible to extract the appropriate key sentences according to the type of structure of the document.

【0017】請求項2に記載の発明は、請求項1に記載の重要文抽出装置において、前記テーブルは、文書構造を明示する表現の有無を用いて前記文書構造の種類を表現している。 [0017] According to a second aspect of the invention, the sentence extraction device according to claim 1, wherein the table expresses the type of the document structure with the presence of demonstrating represents the document structure.

【0018】したがって、文書構造を明示する表現の有無により文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0018] Therefore, to identify the type of structure of the document the presence or absence of manifest represents the document structure, it is possible to extract the appropriate key sentences.

【0019】請求項3に記載の発明は、請求項1または2に記載の重要文抽出装置において、前記テーブルは、 [0019] The invention described in claim 3 is the sentence extraction device according to claim 1 or 2, wherein the table,
文書の長さを用いて前記文書構造の種類を表現している。 It expresses the type of the document structure with the length of the document.

【0020】したがって、文書の長さで文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0020] Therefore, to identify the type of structure of the document in the document length, it can be extracted appropriately important sentences.

【0021】請求項4に記載の発明は、文書のタイプと当該タイプである文書中の部分の重要性の有無とを対応付けて記述しているテーブルを記憶する記憶手段と、前記テーブルを参照して対象となる文書中の重要個所を特定する重要個所特定手段と、を備えている重要文抽出装置である。 [0021] The invention described in claim 4 includes storage means for storing a table describing correspondence between the presence or absence of the importance of the portion of the document is a type and the type of document, see the table the importance position identification unit to identify key points in the document of interest to a sentence extraction device comprising a.

【0022】したがって、文書タイプに応じて適切に重要文の抽出をすることができる。 [0022] Thus, it is possible to properly extract the important sentences in accordance with the document type.

【0023】請求項5に記載の発明は、請求項4に記載の重要文抽出装置において、前記テーブルは、文書中の非重要個所の要件を記述していて、前記重要個所特定手段は、前記テーブルを参照して対象となる文書中で前記非重要個所の要件に該当する部分以外の部分を前記重要個所として特定する。 [0023] The invention described in claim 5 is the sentence extraction device according to claim 4, wherein the table is not describe the requirements for non-critical point in the document, the key position identification means, wherein identifying a portion other than the portion corresponding to the requirements of the non-critical point in the document in which the target by referring to the table as the critical point.

【0024】したがって、文書中の重要でない個所をテーブルに規定することで、その他の部分については漏らさずに抽出することを可能とし、重要である可能性がある個所は落とさずに抽出することができる。 [0024] Therefore, by defining a non-critical point in the document on the table, make it possible to extract without leaking the other parts, to be extracted without reducing points which may be important is it can.

【0025】請求項6に記載の発明は、請求項4に記載の重要文抽出装置において、前記テーブルは、文書中の重要個所の要件を記述し、かつ、この各要件の重要度の大きさを記述していて、前記重要個所特定手段は、前記テーブルを参照し前記重要度の大きさを付して対象となる文書中で前記重要個所を特定する。 [0025] The invention described in claim 6 is the sentence extraction device according to claim 4, wherein the table is to describe the requirements of important points in the document, and the magnitude of the importance of each requirement It has describing the important position identification means identifies the critical points in the document in which the target are given the magnitude of the importance degree by referring to the table.

【0026】したがって、重要度によって多段階に文書中の重要個所を特定することができる。 [0026] Thus, it is possible to identify key points in the document at multiple stages importance.

【0027】請求項7に記載の発明は、請求項4に記載の重要文抽出装置において、前記テーブルは、文書中の重要個所の要件を記述し、かつ、この要件間を関連付けていて、前記重要個所特定手段は、前記テーブルを参照し対象となる文書中で前記関連付けに基づく前記重要個所間の関連付けを行って前記重要個所を特定する。 The invention described in claim 7 is the sentence extraction device according to claim 4, wherein the table is to describe the requirements of important points in the document, and have associated between this requirement, the important position identification means performs the association between the critical point based on association the document in which the target by referring to the table to identify the critical points.

【0028】したがって、対象文書中で重要個所として特定した部分の他にそれと関係する部分を必要に応じて特定することが可能となり、文書を効率的に読み進めることができる。 [0028] Thus, it is possible to specify as needed in addition to a portion related to that particular portion as an important point in the target document can proceed to read the document efficiently.

【0029】請求項8に記載の発明は、請求項7に記載の重要文抽出装置において、前記テーブルは、前記関連付けの関係名を記述していて、前記重要個所特定手段は、前記関連付けを行って前記重要個所の特定を行う際に前記関係名も関連付ける。 [0029] The invention according to claim 8, in sentence extraction device according to claim 7, wherein the table is not describe the relation name of the association, the critical position identification means, performing the association the relationship name when performing certain of the important points Te also associate.

【0030】したがって、重要個所を追加で特定し、または、特定する個所を増加する際に、関係名を手がかりとして所望の個所を特定することができる。 [0030] Therefore, to identify an additional important point, or, when increasing the point of identifying can identify the desired location a relationship name as a clue.

【0031】請求項9に記載の発明は、請求項6に記載の重要文抽出装置において、前記テーブルは、前記要件に対応させて当該要件を具備する個所の記載に関する条件を記述していて、前記重要個所特定手段は、前記テーブルを参照し対象となる文書中で前記重要度が比較的大きい前記要件を具備する個所を前記重要個所として特定し、また、この特定した重要個所から前記重要度が比較的大きい前記条件に合致する部分を探し、前記対象となる文書中で前記重要度が比較的小さい前記要件を具備する部分で前記合致する部分が出現するものも前記重要個所として特定する。 [0031] The invention according to claim 9, in sentence extraction device according to claim 6, wherein the table is not describe a condition relating to the description of point comprising the requirement in correspondence with the requirements, the important point specifying means specifies the location where the importance degree of the document in which the target by referring to the table comprises a relatively large the requirements as the critical point, also, the importance of the identified critical points There locate the portion that matches the larger the condition, the severity document in which the said object is relatively small the requirements the matching portion at a portion that includes also identified as the key point that appears.

【0032】したがって、文書中の重要度が比較的高い個所の表現を解析し、それによって他の部分の重要度を判定することで、より重要度の高い部分だけを文書中で特定することができる。 [0032] Thus, to analyze the expression of importance is relatively high location in the document, thereby by determining the importance of the other part, be determined only by a document in the higher degree of importance part it can.

【0033】請求項10に記載の発明は、所定の記憶装置に記憶されていて文書構造の種類と当該構造を有する文書中の部分の重要度とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程を含んでなる重要文抽出方法である。 [0033] The invention according to claim 10 refers to the table that describes in association with severity of portions of the document with the type and the structure of the document structure is stored in a predetermined storage device Te is a sentence extraction process comprising key position identification step to identify key points in the document of interest.

【0034】したがって、文書の構造の種類に応じて適切に重要文を抽出することができる。 [0034] Thus, it is possible to extract the appropriate key sentences according to the type of structure of the document.

【0035】請求項11に記載の発明は、請求項10に記載の重要文抽出方法において、前記テーブルは、文書構造を明示する表現の有無を用いて前記文書構造の種類を表現している。 [0035] The invention according to claim 11, in the sentence extraction method according to claim 10, wherein the table expresses the type of the document structure with the presence of demonstrating represents the document structure.

【0036】したがって、文書構造を明示する表現の有無により文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0036] Therefore, to identify the type of structure of the document the presence or absence of manifest represents the document structure, it is possible to extract the appropriate key sentences.

【0037】請求項12に記載の発明は、請求項10または11に記載の重要文抽出方法において、前記テーブルは、文書の長さを用いて前記文書構造の種類を表現している。 [0037] The invention according to claim 12, in the sentence extraction method according to claim 10 or 11, wherein the table expresses the type of the document structure with the length of the document.

【0038】したがって、文書の長さで文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0038] Therefore, to identify the type of structure of the document in the document length, it can be extracted appropriately important sentences.

【0039】請求項13に記載の発明は、所定の記憶装置に記憶されていて文書のタイプと当該タイプである文書中の部分の重要性の有無とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程を含んでなる重要文抽出方法である。 [0039] The invention according to claim 13, referring to the table describing in association with the presence or absence of the importance of the portion of the document is a type and the type of document being stored in a predetermined storage device to a sentence extraction process comprising key position identification step to identify key points in the document of interest.

【0040】したがって、文書タイプに応じて適切に重要文の抽出をすることができる。 [0040] Thus, it is possible to properly extract the important sentences in accordance with the document type.

【0041】請求項14に記載の発明は、請求項13に記載の重要文抽出方法において、前記テーブルは、文書中の非重要個所の要件を記述していて、前記重要個所特定工程は、前記テーブルを参照して対象となる文書中で前記非重要個所の要件に該当する部分以外の部分を前記重要個所として特定する。 [0041] The invention according to claim 14, in sentence extraction method according to claim 13, wherein the table is not describe the requirements for non-critical point in the document, the key position identification step, the identifying a portion other than the portion corresponding to the requirements of the non-critical point in the document in which the target by referring to the table as the critical point.

【0042】したがって、文書中の重要でない個所をテーブルに規定することで、その他の部分については漏らさずに抽出することを可能とし、重要である可能性がある個所は落とさずに抽出することができる。 [0042] Therefore, by defining a non-critical point in the document on the table, make it possible to extract without leaking the other parts, to be extracted without reducing points which may be important is it can.

【0043】請求項15に記載の発明は、請求項13に記載の重要文抽出方法において、前記テーブルは、文書中の重要個所の要件を記述し、かつ、この各要件の重要度の大きさを記述していて、前記重要個所特定工程は、 [0043] The invention according to claim 15, in sentence extraction method according to claim 13, wherein the table is to describe the requirements of important points in the document, and the magnitude of the importance of each requirement have describing the critical position identification step,
前記テーブルを参照し前記重要度の大きさを付して対象となる文書中で前記重要個所を特定する。 Identifying the critical points in the document in which the target are given the magnitude of the importance degree by referring to the table.

【0044】したがって、重要度によって多段階に文書中の重要個所を特定することができる。 [0044] Thus, it is possible to identify key points in the document at multiple stages importance.

【0045】請求項16に記載の発明は、請求項13に記載の重要文抽出方法において、前記テーブルは、文書中の重要個所の要件を記述し、かつ、この要件間を関連付けていて、前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記関連付けに基づく前記重要個所間の関連付けを行って前記重要個所を特定する。 [0045] The invention according to claim 16, in sentence extraction method according to claim 13, wherein the table is to describe the requirements of important points in the document, and have associated between this requirement, the important position identification step performs an association between the critical point based on association the document in which the target by referring to the table to identify the critical points.

【0046】したがって、対象文書中で重要個所として特定した部分の他にそれと関係する部分を必要に応じて特定することが可能となり、文書を効率的に読み進めることができる。 [0046] Thus, it is possible to specify as needed in addition to a portion related to that particular portion as an important point in the target document can proceed to read the document efficiently.

【0047】請求項17に記載の発明は、請求項16に記載の重要文抽出方法において、前記テーブルは、前記関連付けの関係名を記述していて、前記重要個所特定工程は、前記関連付けを行って前記重要個所の特定を行う際に前記関係名も関連付ける。 [0047] The invention according to claim 17, in sentence extraction method according to claim 16, wherein the table is not describe the relation name of the association, the critical position identification step, performing the association the relationship name when performing certain of the important points Te also associate.

【0048】したがって、重要個所を追加で特定し、または、特定する個所を増加する際に、関係名を手がかりとして所望の個所を特定することができる。 [0048] Therefore, to identify an additional important point, or, when increasing the point of identifying can identify the desired location a relationship name as a clue.

【0049】請求項18に記載の発明は、請求項15に記載の重要文抽出方法において、前記テーブルは、前記要件に対応させて当該要件を具備する個所の記載に関する条件を記述していて、前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記重要度が比較的大きい前記要件を具備する個所を前記重要個所として特定し、また、この特定した重要個所から前記重要度が比較的大きい前記条件に合致する部分を探し、前記対象となる文書中で前記重要度が比較的小さい前記要件を具備する部分で前記合致する部分が出現するものも前記重要個所として特定する。 [0049] The invention according to claim 18, in sentence extraction method according to claim 15, wherein the table is not describe a condition relating to the description of point comprising the requirement in correspondence with the requirements, the key position identification step identifies the location where the importance degree of the document in which the target by referring to the table comprises a relatively large the requirements as the critical point, also, the importance of the identified critical points There locate the portion that matches the larger the condition, the severity document in which the said object is relatively small the requirements the matching portion at a portion that includes also identified as the key point that appears.

【0050】したがって、文書中の重要度が比較的高い個所の表現を解析し、それによって他の部分の重要度を判定することで、より重要度の高い部分だけを文書中で特定することができる。 [0050] Thus, to analyze the expression of importance is relatively high location in the document, thereby by determining the importance of the other part, be determined only by a document in the higher degree of importance part it can.

【0051】請求項19に記載の発明は、所定の記憶装置に記憶されていて文書構造の種類と当該構造を有する文書中の部分の重要度とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程をコンピュータに実行させるプログラムを記憶したコンピュータに読み取り可能な記憶媒体である。 [0051] The invention according to claim 19 refers to the table that describes in association with severity of portions of the document with the type and the structure of the document structure is stored in a predetermined storage device Te is a storage medium readable to a computer which stores a program for executing a critical position identification step to identify key points in the document of interest to the computer.

【0052】したがって、文書の構造の種類に応じて適切に重要文を抽出することができる。 [0052] Thus, it is possible to extract the appropriate key sentences according to the type of structure of the document.

【0053】請求項20に記載の発明は、請求項19に記載の記憶媒体において、前記テーブルとして、文書構造を明示する表現の有無を用いて前記文書構造の種類を表現しているものを用いる。 [0053] The invention according to claim 20, in the storage medium of claim 19, as the table, using those representing the type of the document structure with the presence of demonstrating represents the document structure .

【0054】したがって、文書構造を明示する表現の有無により文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0054] Therefore, to identify the type of structure of the document the presence or absence of manifest represents the document structure, it is possible to extract the appropriate key sentences.

【0055】請求項21に記載の発明は、請求項19または20に記載の重要文抽出方法において、前記テーブルとして、文書の長さを用いて前記文書構造の種類を表現しているものを用いる。 [0055] The invention according to claim 21, in sentence extraction method according to claim 19 or 20, as the table, using those representing the type of the document structure with the length of the document .

【0056】したがって、文書の長さで文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0056] Therefore, to identify the type of structure of the document in the document length, it can be extracted appropriately important sentences.

【0057】請求項22に記載の発明は、所定の記憶装置に記憶されていて文書のタイプと当該タイプである文書中の部分の重要性の有無とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程をコンピュータに実行させるプログラムを記憶したコンピュータに読み取り可能な記憶媒体である。 [0057] The invention according to claim 22, referring to the table describing in association with the presence or absence of the importance of the portion of the document is a type and the type of document being stored in a predetermined storage device to a storage medium readable to a computer which stores a program for executing a critical position identification step to identify key points in the document of interest to the computer.

【0058】したがって、文書タイプに応じて適切に重要文の抽出をすることができる。 [0058] Thus, it is possible to properly extract the important sentences in accordance with the document type.

【0059】請求項23に記載の発明は、請求項22に記載の記憶媒体において、前記テーブルとして、文書中の非重要個所の要件を記述しているものを用い、前記重要個所特定工程は、前記テーブルを参照して対象となる文書中で前記非重要個所の要件に該当する部分以外の部分を前記重要個所として特定する。 [0059] The invention according to claim 23, in the storage medium of claim 22, as the table, used as describing the requirements for non-critical point in the document, the key position identification step, identifying a portion other than the portion corresponding to the requirements of the non-critical point in the document in which the target by referring to the table as the critical point.

【0060】したがって、文書中の重要でない個所をテーブルに規定することで、その他の部分については漏らさずに抽出することを可能とし、重要である可能性がある個所は落とさずに抽出することができる。 [0060] Therefore, by defining a non-critical point in the document on the table, make it possible to extract without leaking the other parts, to be extracted without reducing points which may be important is it can.

【0061】請求項24に記載の発明は、請求項22に記載の記憶媒体において、前記テーブルとして、文書中の重要個所の要件を記述し、かつ、この各要件の重要度の大きさを記述しているものを用い、前記重要個所特定工程は、前記テーブルを参照し前記重要度の大きさを付して対象となる文書中で前記重要個所を特定する。 [0061] The invention according to claim 24, described in the storage medium of claim 22, as the table describes the requirements of important points in the document, and the size of the importance of each requirement used as being the critical position identification step identifies the critical points in the document in which the target are given the magnitude of the importance degree by referring to the table.

【0062】したがって、重要度によって多段階に文書中の重要個所を特定することができる。 [0062] Thus, it is possible to identify key points in the document at multiple stages importance.

【0063】請求項25に記載の発明は、請求項22に記載の記憶媒体において、前記テーブルとして、文書中の重要個所の要件を記述し、かつ、この要件間を関連付けているものを用い、前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記関連付けに基づく前記重要個所間の関連付けを行って前記重要個所を特定する。 [0063] The invention according to claim 25, in the storage medium of claim 22, as the table describes the requirements of important points in the document, and using those associated between this requirement, the key position identification step identifies the critical point associated with performing between said critical points based on associating the document in which the target by referring to the table.

【0064】したがって、対象文書中で重要個所として特定した部分の他にそれと関係する部分を必要に応じて特定することが可能となり、文書を効率的に読み進めることができる。 [0064] Thus, it is possible to specify as needed in addition to a portion related to that particular portion as an important point in the target document can proceed to read the document efficiently.

【0065】請求項26に記載の発明は、請求項25に記載の記憶媒体において、前記テーブルとして、前記関連付けの関係名を記述しているものを用い、前記重要個所特定工程は、前記関連付けを行って前記重要個所の特定を行う際に前記関係名も関連付ける。 [0065] The invention according to claim 26, in the storage medium of claim 25, as the table, used as describing the relationship name of the association, the critical position identification step, the association performed also associates the relationship name when performing certain of the important points.

【0066】したがって、重要個所を追加で特定し、または、特定する個所を増加する際に、関係名を手がかりとして所望の個所を特定することができる。 [0066] Therefore, to identify an additional important point, or, when increasing the point of identifying can identify the desired location a relationship name as a clue.

【0067】請求項27に記載の発明は、請求項24に記載の記憶媒体において、前記テーブルとして、前記要件に対応させて当該要件を具備する個所の記載に関する条件を記述しているものを用い、前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記重要度が比較的大きい前記要件を具備する個所を前記重要個所として特定し、また、この特定した重要個所から前記重要度が比較的大きい前記条件に合致する部分を探し、 [0067] The invention according to claim 27, in the storage medium of claim 24, as the table in correspondence with the requirements with those describing the condition relating to the description of point comprising the requirements the key position identification step identifies the location having a level of importance is relatively large the requirements document in which the target by referring to the table as the critical point, also, important from said the identified critical points locate the portion degrees matches the larger the condition,
前記対象となる文書中で前記重要度が比較的小さい前記要件を具備する部分で前記合致する部分が出現するものも前記重要個所として特定する。 Wherein said importance in the document of interest is the matching portion at a portion having a relatively small the requirements also identified as the key point that appears.

【0068】したがって、文書中の重要度が比較的高い個所の表現を解析し、それによって他の部分の重要度を判定することで、より重要度の高い部分だけを文書中で特定することができる。 [0068] Thus, to analyze the expression of importance is relatively high location in the document, thereby by determining the importance of the other part, be determined only by a document in the higher degree of importance part it can.

【0069】 [0069]

【発明の実施の形態】[発明の実施の形態1]この発明の一実施の形態について説明する。 BEST MODE FOR CARRYING OUT THE INVENTION [First Embodiment of the Invention will be described an embodiment of the present invention.

【0070】図1は、この発明の一実施の形態である重要文抽出装置の機能ブロック図である。 [0070] Figure 1 is a functional block diagram of a key sentence extraction device according to an embodiment of the present invention. 図1に示すように、この重要文抽出装置1は、文書解析部2と、文書構造情報重要度テーブル3と、抽出部4とからなる。 As shown in FIG. 1, the sentence extraction device 1 includes a document analysis unit 2, the document structure information importance degree table 3, consisting of the extraction section 4.

【0071】文書解析部2は、重要個所特定手段を実現するもので、文書構造情報重要度テーブル3に登録されているルールに基づいて、入力された文書に必要な解析を行なう。 [0071] document analysis unit 2 is intended to achieve a significant position identification means, based on the rules that are registered in the document structure information importance table 3, and analyzes required to document input. すなわち、形態素解析または文字列パターンによって、文書の構造や重要度判定に関係する語句と品詞とを認識する。 In other words, the morphological analysis or string patterns, recognizes the words and parts of speech related to the structure and significance determination document.

【0072】文書構造情報重要度テーブル3は、文書の構造等とその重要度を記述したルールが登録されている。 [0072] document structure information importance table 3, the rule that describes the structure and the like of the document and its importance has been registered. すなわち、文書構造に関する条件を記述し、また、 That describes the condition regarding the document structure and,
その条件に該当する文書の場合に、どの部分を重要と判定するかの重要個所を記述したテーブルである。 If the document corresponding to the condition is a table describing of important points determining which part is important. この例では、対象となる文書に文書構造を表す明らかな表現があるかどうかによって重要個所を特定する。 In this example, to identify key points depending on whether there is a clear representation of the document structure in the document of interest.

【0073】抽出部4は、文書構造情報重要度テーブル3に登録されている条件に基づいて、入力文書から重要な文を抽出する。 [0073] extracting unit 4, based on the condition registered in the document structure information importance table 3, to extract important sentences from the input document.

【0074】次に、以上のような機能を実現する重要文抽出装置1の具体的な構成について説明する。 Next, description will be given concrete of sentence extraction apparatus 1 configured to implement the functions described above. 図2は、 Figure 2,
重要文抽出装置1の電気的な接続を示すブロック図である。 It is a block diagram showing an electrical key sentence extraction device 1 connected. 図2に示すように、この重要文抽出装置1は、各種の演算を行い、重要文抽出装置1の全体を集中的に制御するCPU11と、BIOSなどを格納したROM12 As shown in FIG. 2, the sentence extraction unit 1 performs various computations, a CPU11 for controlling the entire sentence extraction apparatus 1 centrally and stores a BIOS ROM 12
と、CPU11の作業エリアとなるRAM13とが、バスライン14で接続されている。 When, and a RAM13 serving as the work area of ​​the CPU 11, are connected by a bus line 14. また、バスライン14 In addition, bus line 14
には、ハードディスクなどの磁気ディスク装置15と、 The, the magnetic disk device 15 such as a hard disk,
重要文抽出装置1をインターネットなどのネットワークに接続する通信制御装置16と、記憶媒体17を読み取る記憶媒体読取装置18と、キーボード、マウスなどの入力装置19と、LCDなどの出力装置20とが、図示しないインターフェイスを介して接続されている。 A communication control unit 16 for connecting the sentence extraction device 1 to a network such as the Internet, a storage medium reading device 18 for reading a storage medium 17, a keyboard and an input device 19 such as a mouse, and an output device 20 such as LCD, It is connected via an interface (not shown).

【0075】記憶媒体17としては、DVD、CDなどの光ディスク、光磁気ディスクおよびフロッピー(登録商標)ディスクなど、各種の方式のメディアを用いることができる。 [0075] As the storage medium 17, it is possible to use DVD, optical disc CD, etc. magneto-optical disks and floppy disks, media various methods. この記憶媒体17には、文書解析部2および抽出部4の機能を実現するプログラムならびに文書構造情報重要度テーブル3の内容である固定データなどが記憶されている。 This storage medium 17, such as a fixed data is the contents of the program and the document structure information importance degree table 3 realizes the functions of the document analysis unit 2 and extraction section 4 are stored. 記憶媒体読取装置18は、具体的には、記憶媒体17の方式に対応して、光ディスクドライブ装置、光磁気ディスクドライブ装置、フロッピーディスクドライブ装置などが用いられ、記憶媒体17に記憶されているプログラムおよび固定データは、記憶媒体読取装置18を介してCPU11に読み取られ、磁気ディスク装置15にインストールされることにより、重要文抽出装置1は、文書解析部2および抽出部4などの機能を実現することが可能な状態となる。 Storage medium reading device 18, specifically, in response to system storage medium 17, an optical disk drive, magneto-optical disk drive, such as a floppy disk drive is used, the program stored in the storage medium 17 and fixed data via a storage medium reading device 18 reads the CPU 11, by being installed in the magnetic disk device 15, sentence extraction device 1 implements functions such as document analysis unit 2 and extraction section 4 it becomes capable state. すなわち、磁気ディスク装置15、RAM13が、テーブルである文書構造情報重要度テーブル3を記憶する記憶手段、記憶装置となる。 That is, the magnetic disk device 15, RAM 13 is storage means for storing document structure information importance level table 3 is a table, a storage device.

【0076】このプログラムおよび固定データは、記憶媒体17から磁気ディスク装置15にインストールするのに代えて、インターネットなどのネットワークから通信制御装置16を介してダウンロードして、磁気ディスク装置15にインストールするようにしてもよい。 [0076] The program and fixed data, in place from the storage medium 17 to install the magnetic disk device 15, downloaded via a communication control device 16 from a network such as the Internet, to be installed in the magnetic disk device 15 it may be. この場合に、プログラムおよび固定データを送信したサーバ装置において前記プログラムおよび固定データを記憶している記憶装置も、この発明の記憶媒体である。 In this case, the storage device in the server apparatus that has transmitted the program and fixed data are stored the programs and fixed data are also storage medium of the present invention.

【0077】なお、磁気ディスク装置15にインストールされた前記のプログラムは、所定のOS上で動作するアプリケーションプログラムであってもよい。 [0077] Incidentally, the programs installed in the magnetic disk device 15 may be an application program running on a given of the OS. また、このプログラムは、以下に説明する文書解析部2および抽出部4などが遂行する機能の一部の実行をOSや他のアプリケーションプログラムに代行させるものであってもよい。 The program may be one for delegate part of the execution to the OS and other application programs, such as is performed functional document analysis unit 2 and the extraction unit 4 will be described below.

【0078】次に、重要文抽出装置1が行う具体的な処理について説明する。 [0078] Next, a specific process of sentence extraction device 1 performs. まず、この重要文抽出装置1に入力する入力文書の例を示す。 First, an example of the input document to be input to the sentence extraction apparatus 1. 以下の例は、新聞記事であり(毎日新聞(1995年))、タイトルは“北日本、低気圧の影響で大荒れ−−交通機関、乱れる”である。 The following example is a newspaper article (Mainichi Shimbun (1995)), the title "northern Japan, large rough under the influence of low pressure - transport, disturbed" is.

【0079】<入力文書の例> ------------------------------------------ 「発達した低気圧の影響で、四日は北海道、東北地方の各地で吹雪や強風の大荒れの天候となった。このため高速道路が通行止めとなったり、東北新幹線が運転を見合わせるなど交通機関が乱れ、正月休み明けで首都圏へ向かうUターンラッシュにも影響が出た。気象庁によると、マイナス三六度以下の強い寒気が日本列島北部の上空に流れ込んだため、北日本や北陸地方では陸上で一五―二〇メートル、岬や海上で二〇―二五メートルの最大風速を記録。この強風に雪が伴い、吹雪となった。悪天候は五日朝まで続きそうだという。JR東日本によると、東北新幹線の福島―白石蔵王(宮城県白石市)間で同日午後五時五十分、三〇メートルを超える強風を観測したため、同八時 [0079] <Example of the input document> ----------------------------------------- -. under the influence of the "low pressure that developed, the fourth day Hokkaido, was the weather rough large snowstorm and high winds in the northeast region of the country or become because of this highway is closed to traffic, such as Tohoku Shinkansen is forgo driving traffic institutions is disturbed, according to the influence came out. Meteorological agency to U-turn rush towards the metropolitan area in the New Year after the holidays, for minus thirty-six degrees or less of the strong cold air is flowing into the sky of the Japanese archipelago north, in northern Japan and the Hokuriku region is fifteen in the land -.. twenty meters, recorded a maximum wind speed of the two-〇- two five meters cape and marine snow is due to the high winds, became a snowstorm bad weather According to the .JR East that it is likely to continue up to five days in the morning, Fukushima Tohoku Shinkansen - Shiroishizao (Miyagi Prefecture Shiroishi) afternoon five o'clock fifty minutes in between, because you have observed the strong winds of more than thirty meters, the same eight o'clock まで運転を見合わせた。このため同線の三十七本が最高二時間六分遅れた。このほか、東北地方の一部の在来線も不通となった。一方、高速道路は四日朝から寸断状態。日本道路交通情報センターによると五日午前一時現在、東北道は青森インター―仙台泉インター間が通行止めのほか、福島県内でも断続的に通行止めになった。このほか八戸道、秋田道、磐越道も一時、 It postponed the operation until. Thirty-seven pieces of this for trains was the best two hours six minutes late. In addition, part of the conventional lines of the Tohoku region also became impassable. On the other hand, from the high-speed road four days morning . shredded state Japan road traffic information According to the center five days morning temporary current, Tohoku Expressway Aomori inter -. in addition to between Sendai Izumi inter is closed to traffic, became intermittently closed to traffic in Fukushima Prefecture in addition Hachinohe road, Akita road, IwaEtsu The road is also a time,
通行止めとなった。 It was closed to traffic. 」 ------------------------------------------ "------------------------------------------

【0080】以上のような入力文書があったときに、まず、文書解析部2が、図3に示す文書構造情報重要度テーブル3を参照して必要な解析を行なう。 [0080] When there is an input document as described above, first, the document analysis unit 2 performs the necessary analysis with reference to the document structure information importance table 3 shown in FIG.

【0081】具体的には、文書構造情報重要度テーブル3に、文書構造表現があるか否かという条件が登録されている。 [0081] Specifically, the document structure information importance table 3, the condition that whether there is a document structure representation is registered. 文書構造表現とは、文書構造を明示する表現であり、例えば、小見出しや、章や節の見出しが該当する。 The document structure representation, is a manifest representation of the document structure, for example, subheadings and, headings of chapters and sections applicable.

【0082】小見出しか否かは、 ・字下げがあり、レコードの末が名詞であるものは小見出しである。 [0082] Whether subheadings or not, there is a-indentation, as the end of the record is the noun is a subheading. ・レコードの先頭に記号があるものは小見出しである。 Record the beginning that there is a sign of a subheading. 等で判断できる。 It can be judged the like. ここで、名詞か否かは字下げのあるレコードについて形態素解析すればよい。 Here, whether a noun may be morphological analysis for records that indentation. また、文書の段落は、字下げがあるか否かで判定することができる。 Further, paragraph document can be determined by whether there is a indentation.

【0083】図4は、文書解析部2が行う処理を示すフローチャートである。 [0083] Figure 4 is a flowchart showing the process of document analysis unit 2 performs. この処理により重要個所特定工程が実現される。 Important position identification step by the process is realized. 図4に示すように、まず、入力文書中に文書解析部2で未処理の文またはレコードがあるか否かを判断し(ステップS1)、未処理の文またはレコードがあるときは(ステップS1のY)、未処理の文またはレコードの先頭から1文または1レコードを特定して(ステップS2)、当該1文または1レコードに文書構造表現があるか否かを判断し(ステップS3)、その判断結果をRAM13の所定領域に記録して(ステップS As shown in FIG. 4, first, it is determined whether there is a statement or unprocessed record in the document analyzing portion 2 in the input document (step S1), the if there is a statement or unprocessed record (step S1 of Y), and identify one sentence or one record from the beginning of the untreated statement or records (step S2), the determining whether there is a document structure representation to the one sentence or one record (step S3), and the determination result is recorded in RAM13 in a predetermined region (step S
4)、ステップS1に戻る。 4), the flow returns to step S1. すべての文やレコードについてこのような判断をした後に(ステップS1のN)、 After such a determination for all the statements and records (N in step S1), the
前記のようにRAM13の所定領域に記録された文書構造表現のあり/なしの結果から、入力文書全体として文書構造表現のあり/なしの判定を行い、入力文書全体の段落数を判定する(ステップS5)。 The results of Yes / No of the recorded document structure representation RAM13 of a predetermined area as described above, a determination / absence of the document structure represented as a whole input document (determining the number of paragraphs entire input document S5). そして、文書構造情報重要度テーブル3を参照して、当該判定結果に合致した条件に対応している重要個所を入力文書中で特定する(ステップS6)。 Then, by referring to the document structure information importance table 3, to identify key points which correspond to conditions consistent with the determination result in the input document in (Step S6).

【0084】前記の例の入力文書では、小見出し等の文書構造表現はなく、段落数は4であることがわかる。 [0084] In the input document of the examples, rather than the document structural representation of such subheadings, it can be seen that the number of paragraphs is 4. そして、文書構造情報重要度テーブル3を参照して、先の解析結果で得られた条件に一致する重要個所を調べると、「文書構造表現なし」で「段落数5以下」の条件においては、重要個所として「先頭の段落を抽出」とあるので、この例の入力文書中から、先頭段落だけが重要文書として特定されることとなる。 Then, by referring to the document structure information importance table 3, by examining the critical locations that match the criteria obtained in the preceding analysis result, the condition of "having 5 or less paragraphs" in "no document structure representation" is since the "extracts the first paragraph" as an important point, from the input document in this example, so that the only the first paragraph is identified as an important document.

【0085】抽出部4は、ステップS6で特定された入力文書中の重要個所を抽出して、出力装置20に出力する。 [0085] extracting section 4 extracts the important points in the input document specified in step S6, the output device 20.

【0086】前記の入力文書例において、このようにして抽出された入力文書中の重要個所は、以下のとおりとなる。 [0086] In the input document example of the importance point of the input in a document thus extracted to are as listed below.

【0087】<抽出文書の例> ------------------------------------------ 「発達した低気圧の影響で、四日は北海道、東北地方の各地で吹雪や強風の大荒れの天候となった。このため高速道路が通行止めとなったり、東北新幹線が運転を見合わせるなど交通機関が乱れ、正月休み明けで首都圏へ向かうUターンラッシュにも影響が出た。」 ------------------------------------------ [0087] <Example of the extraction document> ----------------------------------------- -. under the influence of the "low pressure that developed, the fourth day Hokkaido, was the weather rough large snowstorm and high winds in the northeast region of the country or become because of this highway is closed to traffic, such as Tohoku Shinkansen is forgo driving traffic institutions is disturbed, also affect the U-turn rush towards the metropolitan area in the New Year after the holidays came out. "--------------------------- ---------------

【0088】以上説明した重要文抽出装置1によれば、 [0088] According to the important sentence extraction device 1 described above,
文書の構造の種類により、それを特徴づける要因(段落数等)を用いて適切に重要文を抽出できる。 The type of structure of the document can be appropriately extracted key sentences using the factors that characterize it (Paragraphs etc.).

【0089】なお、前記の例では、文書構造表現を持たず、段落数5以下と、比較的短い文書であることが、文書構造情報重要度テーブル3に記述され、このような短い文書は通常、速報等の即時性を求めた文書であることが多く、それらは文書の冒頭部分がほとんど全体の要約に適する場合が多いとの考えに基づいて、重要文の抽出を行うものである。 [0089] In the above example, no document structure representation, a number of 5 or less paragraphs, to be relatively short documents, is described in the document structure information importance degree table 3, such short documents typically often a document to determine the immediacy of bulletins such, they are those based on the idea that in many cases suitable for most overall summary beginning of the document, to extract important sentences. また、段落の小見出しがある(文書構造表現あり)場合は、前記のものよりは文書は長い場合が多く、それに応じた抽出ができる。 Also, there are subheadings paragraph (Yes document structure representation) case, than that of the document may longer if many, extracted accordingly.

【0090】[発明の実施の形態2]別例である発明の実施の形態を発明の実施の形態2として説明する。 [0090] Second Embodiment of the Invention] describing the embodiments of the invention which is another example as the second embodiment of the invention.

【0091】この発明の実施の形態2である重要文抽出装置1が発明の実施の形態1と相違するのは、図3に示す文書構造情報重要度テーブル3に代えて図5に示す文書構造情報重要度テーブル3を用い、これに伴い、図4 [0091] The sentence extraction device 1 according to a second embodiment that differs from the first embodiment aspect of the invention, the document shown in FIG. 5 in place of the document structure information importance table 3 shown in FIG. 3 Structure using the information importance degree table 3, along with this, FIG. 4
に示す処理に代えて図6に示す処理を行う点にある。 It lies in the processing shown in FIG. 6 in place of the process shown in. その他の内容については、発明の実施の形態1と同様であるので、発明の実施の形態1の場合と同一符号を用い、 For other details are the same as in the first embodiment of the invention, using the same reference numerals as in the first embodiment of the invention,
詳細な説明を省略する。 A detailed description thereof will be omitted.

【0092】図5に示す文書構造情報重要度テーブル3 [0092] document structure information importance table 3 shown in FIG. 5
は、入力された文書のタイプに基づいて重要個所を特定できるよう、文書タイプと、その文書タイプ中の重要個所となる構成要素(文書構造表現を先頭としたまとまり)を対応づけて記述したものである。 Things, that to be able to identify key points based on the type of the input document, and the document type, described in association with the components that are critical points in the document type (unity that the top document structure representation) it is.

【0093】次に、重要文抽出装置1が行う具体的な処理について説明する。 [0093] Next, a specific process of sentence extraction device 1 performs. まず、この重要文抽出装置1に入力する入力文書の例を示す。 First, an example of the input document to be input to the sentence extraction apparatus 1. 以下の文書は、公開特許公報の例である(なお、この明細書において、特許公報を示すときは、便宜上、その文中のすみ付きカッコを“< The following documents are examples of patent publications (In this specification, when referring to patent publications, for convenience, the corner brackets in the text "<
>”に代えて示す)。 > Shown in place of the ").

【0094】<入力文書の例> -------------------------------------------- 「<発明の名称>文章要約支援装置 <特許請求の範囲> <請求項1> 電子化された文章を表示する表示部と、前記表示部に表示されている文章中の文字や語句を指定する位置指定を利用者が入力するための入力部と、利用者から入力された位置指定で指定された文字や語句を含む [0094] <Example of the input document> ----------------------------------------- --- "text summary support device <claims> <entitled> <claim 1> a display unit for displaying a digitized text, characters and phrases in a sentence being displayed on the display unit comprising an input unit for a user to enter a location specification specifying a character or phrase specified by the position specification input from the user to
1文を切り出す文切り出し部と、記憶部と、解析用辞書と、切り出された文の構造を前記解析用辞書を用いて解析し、指定された文字や語句を含む、1つの述語を中心とするまとまりである単位文を取り出して前記記憶部に格納する単位文検出部と、利用者により入力された全ての位置指定に対して前記文切り出し部と前記単位文検出部による処理が終了すると、前記記憶部に格納されている全ての単位文を前記文章の要約の元となる要約文作成用データとして出力する出力部とを有する文章要約支援装置。 And sentence extraction unit to cut out one sentence, the center and the storage unit, and the analysis dictionary, the structure of the cut-out sentence and analyzed using the analysis dictionary, containing the specified text or phrase, one predicate the unit sentence detection unit to be stored in the storage unit takes out the unit statement is a unity of the processing by the units sentence detecting unit and the sentence cutout portion for all positions designated input by the user is completed, sentence summary support apparatus having an output unit for outputting all unit statements stored in the storage unit as the underlying summary creation data summary of the sentence. <発明の詳細な説明> <0001> <産業上の利用分野> 本発明は、入力された文章を要約する際に利用者の手助けをする文章要約支援装置に関する。 <Detailed Description of the Invention> <0001> invention <relates> relates sentence summarizing support apparatus to assist the user when summarizing the text input. <0002> <従来の技術> 人間が文章を要約する際には、文章を読みながら重要な箇所をマークし、しかる後にマークした箇所を抜き出して、それを基に要約文を組み立てるという手順を取るのが一般的である。 <0002> when <Prior Art> humans to summarize the sentences, while reading the sentence to mark the importance of a point, by extracting a portion marked thereafter, take the procedure of assembling the summary statement based on it the is common. <発明が解決しようとする課題> 従来の自動要約の考え方では、文が長くなるとそれだけキーワードを含む確率が高くなり、修飾語句を多く含む文が抽出される割合が比較的高くなる。 The concept of <INVENTION Problems to be Solved> conventional automatic summarization, sentence is the much more likely to contain the keyword long, the ratio of statements containing many modifiers are extracted is relatively high. また、キーワードを1個しか含まない文は抽出されにくいという問題もある。 In addition, a statement that did not contain only one keyword is also a problem that it is difficult to be extracted. このため、自動要約といっても現実には要約の基本データの抽出装置に過ぎず、最終的な要約文を作成するには、人間による、 For this reason, only the extraction device of the basic data of the summary is also in reality to say that automatic summarization, to create the final summary statement, by human beings,
抽出した文章の確認や抽出漏れの救済や抽出した文の加工が不可欠である。 Processing of the extracted sentence of confirmation and extraction leakage relief and extracted statement is essential. <0006> 本発明はこうした事情に鑑みてなされたもので、その目的は、文章の要約を行なう利用者の負担を軽減するような文章要約支援装置を提供することにある。 <0006> present invention has been made in view of these circumstances, an object thereof is to provide a text summary support device so as to reduce the burden on the user to perform a summary sentence. <0007> <問題を解決するための手段> 上記目的を達成するために、本発明の文章要約支援装置は、電子化されている文章を表示する表示部と、表示部に表示されている文章中の文字や語句を指定する位置指定を利用者が入力するための入力部と、利用者から入力された位置指定で指定された文字や語句を含む1文を切り出す文切り出し部と、 <0007> in order to achieve the above object <Means for Solving the Problem>, sentence sentence summarizes support apparatus of the present invention, a display unit for displaying a text that has been digitized, displayed on the display unit an input for user position designation to specify the character or phrase is entered in a text clipping unit for cutting out one sentence including characters or phrases specified by the input position specified by the user,
記憶部と、解析用辞書と、切り出された文の構造を前記解析用辞書を用いて解析し、指定された文字や語句を含む、1つの述語を中心とするまとまりである単位文を取り出して前記記憶部に格納する単位文検出部と、利用者により入力された全ての位置指定に対して前記文切り出し部と前記単位文検出部による処理が終了すると、前記記憶部に格納されている全ての単位文を前記文章の要約の元となる要約文作成用データとして出力する出力部とを有する。 A storage unit, and the analysis dictionary, the structure of the cut-out sentence and analyzed using the analysis dictionary, containing the specified text and phrases and retrieves a unit statement is a unity around one predicate the unit sentence detection unit to be stored in the storage unit, the processing by the units sentence detecting unit and the sentence cutout portion for all positions designated input by the user is completed, all stored in the storage unit units sentence and an output unit for outputting as the underlying summary creation data summary of the sentence. <0008> <作用> 本発明は、要約文を作成しようとして文章中から、利用者が指定(中略) <実施例> 次に、本発明の実施例について図面を参照して説明する。 <0008> <action> The present invention is, from the text in an attempt to create a summary, specified by the user (Omitted) <Example> Next, will be described with reference to the drawings an embodiment of the present invention. (中略) <発明の効果> 以上説明したように本発明は、電子化された文章をディスプレイ等に表示し、利用者からの位置指定を契機として文章中から指定された文字や語句を含む1文を切り出し、自然言語解析によってその文の構造を解析し、指定された文字や語句を含む単位文を取り出して記憶しておき、利用者による一連の位置指定が終了すれば、記憶されている単位文を要約文作成用データとして出力することにより、利用者は出力された単位文から要約文を容易に作成することができる効果がある。 (Omitted) present as has been described <Effects of the Invention> invention, 1 the digitized text displayed on a display or the like, comprising a character or phrase specified by the sentence in response to the position specified by the user excised statement, analyzes the structure of the sentence by the natural language analysis, stores removed the unit sentence containing the specified text or phrase, if termination series of positions designated by the user has been stored by outputting unit statement as a summary creation data, the user has the advantage of being able to easily create a summary from the unit sentence output. <図面の簡単な説明> <図1> 本発明の一実施例の文章要約支援装置の構成を示すブロック図である。 It is a block diagram showing the structure of a sentence summary support apparatus of an embodiment of a <BRIEF DESCRIPTION OF THE DRAWINGS> <1> present invention. <図2> 文切り出し部3の処理を示す流れ図である。 It is a flow diagram that illustrates the processing of the <2> sentence extraction unit 3. <図3> 単位文検出部5の処理を示す流れ図である。 It is a flow diagram that illustrates the processing of the <3> units sentence detection unit 5. <図4> 単位文検出部5による自然言語解析の解析結果の例を示す図である。 Is a diagram showing an example of the analysis result of the natural language analysis by <4> units sentence detection unit 5. <図5> 単位文検出部5による自然言語解析によって得られる単位文の範囲の例を示す図である。 It is a diagram illustrating an example of a range of unit sentence obtained by the natural language analysis by <5> Units sentence detection unit 5. 」 -------------------------------------------- "--------------------------------------------

【0095】以上の文書が入力されると、その文書のタイプを特定する。 [0095] When the above document is input, to identify the type of the document. その特定は、ユーザが文書のタイプを直接入力することで行ってもよく、また、文書解析部2 That particular may be carried out by the user to enter the type of document directly, also, the document analysis unit 2
が入力文書中の文書構造表現を解析して、その解析結果に基づいて自動的に特定するようにしてもよい。 There analyzes the document structure representation in the input document may be automatically identified based on the analysis result. 前記の入力文書の例では、図5に示す文書構造情報重要度テーブル3の文書タイプの中で「特許」に該当するが、この「特許」という文書タイプをユーザが直接入力してもよいし、また、文書解析部2で文書構造情報重要度テーブル3内の「特許」という文書タイプに対応して規定された「特許請求の範囲」、「従来の技術」等の文書構造表現を抽出することで、「特許」という文書タイプであると判定してもよい。 In the example of the input document, but corresponds to the "patent" in the document type of the document structure information importance table 3 shown in FIG. 5, the document type of the "patent" user may be input directly also been defined corresponding to the document type of "patent" in the document structure information importance level table 3 by the document analysis unit 2 "claims", extracts the document structure representation such as "prior art" that is, it may be determined that a document type called "patent".

【0096】入力文書中の重要個所を文書解析部2が自動的に特定する場合の文書解析部2の具体的な処理は、 [0096] Specific processing of the document analysis unit 2 when the document analysis unit 2 the importance points in the input document is automatically identified,
図6のフローチャートに示すとおりである。 It is shown in the flowchart of FIG. この処理により重要個所特定工程が実現される。 Important position identification step by the process is realized. すなわち、まず、 That is, first,
入力文書中に文書解析部2で未処理の文またはレコードがあるか否かを判断し(ステップS11)、未処理の文またはレコードがあるときは(ステップS11のY)、 It determines whether there is statement or unprocessed record in the document analyzing portion 2 in the input document (step S11), and if there is a statement or unprocessed record (Y in step S11), and
未処理の文またはレコードの先頭から1文または1レコードを特定して(ステップS12)、当該1文または1 Identify the one sentence or one record from the beginning of the untreated statement or records (step S12), the said one sentence or one
レコードに文書構造情報重要度テーブル3の「特許」という文書タイプに対応している重要個所として挙げられている、「発明の名称」「従来の技術」等の特許明細書に特有の文書構造表現があるか否かを判断し(ステップS13)、その判断結果をRAM13の所定領域に記録して(ステップS14)、ステップS11に戻る。 Records to are mentioned as important points that correspond to the document type of "patent" document structure information importance table 3, "entitled" "Prior Art" document structure specific expression in patents such as It determines whether there is (step S13), and the determination result to be recorded in RAM13 in a predetermined area (step S14), and returns to step S11. すべての文やレコードについてこのような判断をした後に(ステップS11のN)、前記のようにRAM13の所定領域に記録された文書構造表現のあり/なしの結果から、入力文書のタイプを特定し(ステップS15)、文書構造情報重要度テーブル3を参照して当該文書タイプに対応した入力文書中の重要個所を特定する(ステップS16)。 For all statements and records after such a determination (N of step S11), and the results of Yes / No of the recorded document structure representation RAM13 of a predetermined area as described above, identifies the type of the input document (step S15), and by referring to the document structure information importance degree table 3 to identify key points in the input document corresponding to the document type (step S16).

【0097】すなわち、図5に示す文書構造情報重要度テーブル3の例では、「発明の名称」「従来の技術」等の特許明細書に特有の文書構造表現が入力文書中に含まれているときは入力文書のタイプを「特許」と特定し、 [0097] That is, in the example of the document structure information importance table 3 shown in FIG. 5, document structure representation specific to patents, such as "entitled" "prior art" is contained in the input document is the type of input document identified as "patent" when,
このような文書構造表現が含まれていないときは入力文書のタイプを例えば「コラム」と特定する。 Such a document structure when the representation is not included to identify the type of the input document, for example, a "column". そして、それぞれの文書タイプに対応して登録されている重要個所を入力文書中で特定する。 Then, to identify key points that are registered in correspondence to each document type in the input document in.

【0098】このような文書解析部2による結果に基づき、特定された入力文書中の重要個所を、抽出部4が入力文書中から抽出し、出力装置20にその結果を出力する。 [0098] Based on the results of such document analysis unit 2, the key point in the input document specified, the extracting unit 4 is extracted from the input document, and outputs the result to the output device 20. 図5の例では、文書タイプが「特許」であれば、 In the example of FIG. 5, the document type is equal to "patent",
「発明の名称」、「特許請求の範囲」、「従来の技術」、「発明が解決しようとする課題」の欄の文章が抽出される。 "Entitled", "claims", "prior art", is a sentence in the column of "Problems that the Invention is to Solve" are extracted.

【0099】前記入力文書の例に対しては、以下が抽出例である。 [0099] For the example of the input document, an extraction example below.

【0100】<抽出文書の例> ----------------------------------------------- 「<発明の名称>文章要約支援装置 <特許請求の範囲> <請求項1> 電子化された文章を表示する表示部と、前記表示部に表示されている文章中の文字や語句を指定する位置指定を利用者が入力するための入力部と、利用者から入力された位置指定で指定された文字や語句を含む [0100] <Example of the extraction document> ----------------------------------------- ------ "text summary support device <entitled> <of claims> a display unit for displaying the <claim 1> digitized text, in the text being displayed on the display unit comprising an input for the position designation to specify the character or phrase the user inputs a character or phrase specified by the input position specified by the user
1文を切り出す文切り出し部と、記憶部と、解析用辞書と、切り出された文の構造を前記解析用辞書を用いて解析し、指定された文字や語句を含む、1つの述語を中心とするまとまりである単位文を取り出して前記記憶部に格納する単位文検出部と、利用者により入力された全ての位置指定に対して前記文切り出し部と前記単位文検出部による処理が終了すると、前記記憶部に格納されている全ての単位文を前記文章の要約の元となる要約文作成用データとして出力する出力部とを有する文章要約支援装置。 And sentence extraction unit to cut out one sentence, the center and the storage unit, and the analysis dictionary, the structure of the cut-out sentence and analyzed using the analysis dictionary, containing the specified text or phrase, one predicate the unit sentence detection unit to be stored in the storage unit takes out the unit statement is a unity of the processing by the units sentence detecting unit and the sentence cutout portion for all positions designated input by the user is completed, sentence summary support apparatus having an output unit for outputting all unit statements stored in the storage unit as the underlying summary creation data summary of the sentence. <従来の技術> 人間が文章を要約する際には、文章を読みながら重要な箇所をマークし、しかる後にマークした箇所を抜き出して、それを基に要約文を組み立てるという手順を取るのが一般的である。 When <Prior Art> humans to summarize the sentences, while reading the sentence to mark the importance of a point, by extracting a portion marked thereafter, the general to take the steps that assemble a summary statement based on it is a basis. <発明が解決しようとする課題> 従来の自動要約の考え方では、文が長くなるとそれだけキーワードを含む確率が高くなり、修飾語句を多く含む文が抽出される割合が比較的高くなる。 The concept of <INVENTION Problems to be Solved> conventional automatic summarization, sentence is the much more likely to contain the keyword long, the ratio of statements containing many modifiers are extracted is relatively high. また、キーワードを1個しか含まない文は抽出されにくいという問題もある。 In addition, a statement that did not contain only one keyword is also a problem that it is difficult to be extracted. このため、自動要約といっても現実には要約の基本データの抽出装置に過ぎず、最終的な要約文を作成するには、人間による、抽出した文章の確認や抽出漏れの救済や抽出した文の加工が不可欠である。 For this reason, only the extraction device of the basic data of the summary is in reality to say that automatic summarization, to create the final summary statement, by humans, was extracted sentence of confirmation and relief of extraction leak or extraction processing of sentence is essential.
<0006> 本発明はこうした事情に鑑みてなされたもので、その目的は、文章の要約を行なう利用者の負担を軽減するような文章要約支援装置を提供することにある。 <0006> present invention has been made in view of these circumstances, an object thereof is to provide a text summary support device so as to reduce the burden on the user to perform a summary sentence. 」 ------------------------------------------- "-------------------------------------------

【0101】また、公開特許公報のような定型的な文書以外にも、図5の文書構造情報重要度テーブル3に記載の例のように、対象となる文書がコラムの場合は、先頭の段落および小見出し部分だけを重要個所として抽出する。 [0102] In addition, routine Besides documents, such as patent publications, as in the example described in the document structure information importance level table 3 of FIG. 5, if the document of interest column, the beginning of the paragraph and only extracts as an important location subheading portion.

【0102】以下は、コラムである入力文書の例であり、毎日新聞(95年)の記事である。 [0102] The following is an example of the input document is a column, which is an article of Mainichi Shimbun (95 years). タイトルは、“砂糖 “甘さ控えめ”で現実は甘くない?!−−業界、消費拡大に懸命”である。 A - title, "sugar" sweet low-key "industry, hard to consumption expansion in reality is not sweet?!".

【0103】<入力文書の例> ------------------------------------------- 「砂糖の消費が、年々減っている。飲み物も、お菓子も、あげて「甘さ控えめ」が全盛だが、業界は砂糖の効用をPRして消費拡大に懸命だ。 [0103] <Example of the input document> ----------------------------------------- -. "consumption of sugar, has decreased year by year drink also, sweets, but raised in" sweetness modest "is prime, the industry's hard to consumption expand the utility of the sugar and PR. ◇73年度ピークに消費減少−−業界、PRに躍起 砂糖の一人当たり消費量は、農水省によると一九七三砂糖年度(十月―翌年九月)の二十九キロが最高。 ◇ consumption decreased to 73 year peak - industry, consumption per capita eager sugar in PR, according to the Ministry of Agriculture, Forestry and Fisheries one thousand nine hundred seventy-three sugar year (October - the following year in September) highest twenty-nine kg of. その後は減少傾向で、八〇年度に二十五キロを割り、九三年度以降は二十キロを下回っている。 Then in the downward trend, dividing the twenty-five km to eighty fiscal year, after ninety-three fiscal year is less than twenty kilometers away. また、でんぷんを原料とする異性化糖の大量生産技術が確立され、十数年前から清涼飲料、缶詰、菓子、パンなどに広く利用されている。 In addition, starch is mass production technology establishment of isomerized sugar as a raw material, soft drinks from ten years ago, canning, confectionery, have been widely used, such as in bread. 異性化糖は分類上、砂糖に含まれないため、砂糖の需要を食った形になるが、異性化糖を加えた消費量でも、七八年度の二十八キロをピークに、ここ三年は二十五キロ台と、じり貧だ。 Isomerized sugar on the classification, because it is not included in the sugar, becomes a form that ate the demand of sugar, even in consumption plus the isomerized sugar, to peak the twenty-eight kilometers of seventy-eight fiscal, here three years and twenty-five km block, but Jirihin. 同省砂糖類課は「砂糖が肥満や虫歯、糖尿病などのもとになるという、間違った健康知識に基づく砂糖・甘味離れが、平成時代に入って目立つようになった。これを受けて、飲料や菓子メーカーが『甘さを抑えれば売れ筋になる』と、生産を切り替えたことが大きく影響している」(信太英治・課長補佐)と分析する。 The ministry sugars Division "sugar is obesity and tooth decay, that made the original such as diabetes, sugar-sweet taste away based on the wrong health knowledge, began to stand out entered the Heisei era. In response to this, drinks and confectionery manufacturers "consisting selling if Osaere the sweetness", to analyze the fact that switching the production has a significant impact "(Eiji Shida Deputy director). こうした減少傾向に、精糖工業会や日本砂糖輸出入協議会など砂糖八団体は九〇年末、「お砂糖“真”時代協議会」を結成。 In such a downward trend, refined sugar Industry Association and sugar eight organizations such as Japan sugar import and export council ninety the end of the year, formed the "sugar" true "era Council". 消費者にもっと砂糖を知ってもらおうと、キャンペーン活動を続ける。 When'll let you know more sugar to consumers, continue to campaign activities. 一昨年にテレビ放映した番組を基に昨年春、おいしい和洋菓子や職人の技などを紹介する冊子「甘いお話」を三万部作成したが、残部はほとんどないという。 Two years ago last year on the basis of the program that was televised in the spring, delicious sum confectionery and craftsmen of the booklet "sweet talk" to introduce the technique was created thirty thousand parts, the balance being mostly that it is not. 今春に第二集を発行する。 To issue a second collection this spring. さらに、二月十九日から二十五日まで、東京・銀座のソニースクエアで、砂糖を使ったオブジェを展示し、買い物客らにPRする。 In addition, from February nineteen days until the 25th, Sony Square in Tokyo's Ginza, exhibited objects using the sugar, to PR to shoppers, et al. ◇上手な使用法や効果 《健康》「砂糖を食べると太るのでは」「虫歯にならないか」「ビタミンB1やカルシウムは奪われないか」など、健康に絡んだ消費者の疑問に、精糖工業会は(1) ◇ "eat and is the fat of the sugar" good usage and effects "health", such as "Do not be tooth decay," "or not vitamin B1 and calcium is lost", consumers wondering entwined healthy, refined sugar industry Kai (1)
砂糖は疲労を速やかに回復するエネルギー源。 Energy source to recover quickly the fatigue is sugar. バランス良く食べて、よく体を動かせば、問題はない(2)食事やおやつは、時間と量を決めて節度よく与える。 Eat a well-balanced, may be moving the body, meals and snacks there is no problem (2), give better moderation decide the time and amount. その後、必ず歯を磨けば虫歯は予防できる(3)B1やカルシウムが奪われることはないが、牛乳、果物、野菜などからバランス良く摂取するのが合理的――などと説明する。 Thereafter, the caries if always polish teeth, but (3) B1 and calcium not be deprived preventable, milk, fruits, reasonable to ingest a balanced from vegetables - such as that described. 《九不思議》砂糖の効用は「七不思議」よりふたつ多い? Utility of the "nine mysterious" sugar is more two than the "seven wonders"? (1)親水性=肉にもみ込むと、たんぱく質と水分を結びつけ、肉を軟らかくする。 (1) When Komu fir hydrophilic = meat linked protein and water, to soften meat. (2)泡の安定=卵白に加えて泡立てれば、しっかりした泡のメレンゲになる。 (2) If Awadatere in addition to the stable = egg white foam, become firm foam of meringue. (3)浸透性=果実酒を作るとき加えるのは、浸透圧でフルーツの味と香りを引き出すため。 (3) to add when you make the permeability = fruit wine, in order to bring out the taste and aroma of the fruit in the osmotic pressure. (4)ゼリー化=ジャムを作るときに加え、果物に含まれるペクチンをゼリーのようにする。 (4) In addition, when making a jelling = jams, the pectin contained in fruits like jelly. (5)でんぷんの老化防止=でんぷんを軟らかく保つ働きがあるため、すし飯に加えると固くなるのを防ぐ。 (5) because of the work to keep soft anti-aging = starch starch, prevented from being firmly when added to the sushi rice. (6)発酵の促進=イーストの発酵を活発にし、焼き色の良いふっくらしたパンにする。 (6) to actively fermentation of promotion = East of fermentation, to plump bread good browned. (7)温度による変化=約一〇五度でシロップ、一一五度でフォンダン、一六〇―一六五度でべっこうあめ、一九五度以上でカラメルになる。 (7) change with temperature = syrups at about one hundred and five degrees, fondant at one hundred and fifteen degrees, sixteen 〇- sixteen 35 degrees Celsius in Bekkoame becomes caramel with one hundred ninety-five degrees. (8)脂肪の酸化防止=ケーキやクッキーのバター風味を保つ。 (8) keep the butter antioxidant = cakes and cookies fat. (9)防腐性=カビや細菌の繁殖に必要な水分を吸収する。 (9) to absorb the necessary moisture breeding antiseptic = mold and bacteria. (「甘いお話」から) 《保存》東京都消費者センターによると、砂糖についての問い合わせ、苦情は一九九〇年四月以降、昨年十一月までで計二十八件と、比較的少ない。 According to the ( "sweet talk" from) "Save" Tokyo consumer center, inquiries about sugar, complaints 1990 four since January, and a total of twenty-eight cases in up to November last year, relatively few . 大半は「古い砂糖が出てきたが、大丈夫か」など、保存に関する内容という。 Most "came out the old sugar but, all right either", etc., that the contents related to storage. 砂糖は、においや水分を吸収しやすいので、密閉できる缶やプラスチック容器に入れて使う。 Sugar, so easy to absorb odors and moisture, use put it in cans and plastic containers that can be sealed. においが移ったら、風通しの良い場所に広げて空気にさらす。 When the smell is moved, it exposed to air and spread to well-ventilated place. 固まった場合は、広げて霧を吹くか、砕いて使うとよい。 If you have solidified, or blow the fog spread, it may crushed use. 《プレート》お祝いにタイをかたどった砂糖を配る風習は、昔からよく見られたが、東京の三越銀座店では、菓乃実(かのみ)の杜(もり)=港区元赤坂=が、名入れのできる砂糖のプレートを発売。 "Plate" custom of handing out sugar in the shape of Thailand in celebration, was seen well from the old days, in Tokyo of the Mitsukoshi Ginza store, Mori (Sheng) of 菓乃 real (Kanomi) = Minato-ku Moto-Akasaka = is, name It launched a plate of sugar that can put. プレートは大人の手のひらほどの大きさ。 The plates of the more adult of palm size. 「〇〇ちゃん、おめでとう」といった言葉を付けられる。 It attached the words such as "hundred-chan, congratulations". 砂糖製のベビーシューズをあしらって、値段は三千円。 Garnish sugar made of baby shoes, the price is three thousand yen. バレンタインデー向けのハート形小物入れ(四千円)など、季節商品が数種類ある。 Valentine's Day heart-shaped pouch for Day (four thousand yen), such as seasonal products there are several types. 注文に応じ、オリジナルの品も製作する。 Depending on the order, also made the original goods. 種類 特徴 ・ 用途 ◆上白糖 いわゆる白砂糖。 Type Characteristics and application ◆ white sugar so-called white sugar. しっとりした風味。 Moist flavor.
調味、菓子、飲み物など万能 ◆三温糖 黄褐色で甘みが強い。 Seasonings, confectionery, a strong sweetened with universal ◆ three brown sugar tan, such as drink. 煮物やつくだ煮に使うと、甘さとコクが出る ◆グラニュー糖 高純度でサラサラ。 With the stew and tsukudani, sweetness and flavor comes out ◆ smooth in granulated sugar high purity. 淡泊な甘さで飲み物、菓子、料理に広く使う ◆中ざら糖 黄褐色だが純度が高い。 Beverages, confectionery, but the middle quite common sugar tan ◆ used widely in cooking is high purity, bland sweetness. 風味があり、 There is a flavor,
煮物やめん類の汁などに使う ◆角砂糖 グラニュー糖を四角く固めた。 Use, such as in the juice of boiled and noodles ◆ hardened square the sugar cube granulated sugar. 飲み物のほか料理、菓子作りに便利 ◆氷砂糖 果実酒に最適。 In addition to food drink, ideal for convenient ◆ rock candy fruit wine in pastry making. 稲荷ずしのアゲを煮ると、美しいつやが出る ◆粉砂糖 果物にかけたり、ケーキやクッキー、 When the cook fried of Inari sushi, or subjected to a beautiful shiny leaves ◆ powdered sugar fruits, cakes and cookies,
洋菓子作りに使う ◆顆粒状糖 多孔質、顆粒(かりゅう)状の高純度糖。 Use in pastry making ◆ granular sugar porous, granules (downstream) like high purity sugar. 冷たい飲み物に入れたり果物にかける ◆和三盆 伝統製法で作る。 Applied to the fruit or put in a cold drink ◆ made in Wasanbon traditional recipe. 結晶が非常に小さく、和菓子用に珍重される ◆黒砂糖 サトウキビの搾り汁をそのまま煮詰めた。 Crystals are very small, boiled down as the juice of brown sugar cane ◆ which is prized for sweets. 強い風味と甘さをもつ =精糖工業会の資料から」 ------------------------------------------- Strong with the flavor and sweetness = from refined sugar Industry Association of Documentation "----------------------------------- --------

【0104】以上の入力文書の例の文書タイプを「コラム」と認識して、文書構造情報重要度テーブル3を参照して重要文を抽出した例は下記のとおりである。 [0104] and recognized as "column" the document type of example of more of the input document, an example of extracting the important statement by referring to the document structure information importance table 3 are as follows.

【0105】<抽出例> ------------------------------------------- 「砂糖の消費が、年々減っている。飲み物も、お菓子も、あげて「甘さ控えめ」が全盛だが、業界は砂糖の効用をPRして消費拡大に懸命だ。 [0105] <extraction Example> ------------------------------------------- "consumption of sugar, has decreased year by year. drink also, sweets, but raised in" sweetness modest "is prime, the industry's hard to consumption expand the utility of the sugar and PR. ◇73年度ピークに消費減少−−業界、PRに躍起 ◇上手な使用法や効果 《健康》 《九不思議》 《保存》 《プレート》」 ------------------------------------------- ◇ consumption decreased to 73 year peak - industry, PR rushing ◇ good usage and effects "health" "nine mysterious" "Save" "plate" "--------------- ----------------------------

【0106】以上説明した重要文抽出装置1によれば、 [0106] According to sentence extraction device 1 described above,
文書タイプごとに文書中の重要個所を規定するので、文書タイプに応じた適切な文の抽出ができる。 Since defining the importance location in the document for each document type, you can extract the appropriate sentence in accordance with the document type.

【0107】[発明の実施の形態3]別例である発明の実施の形態を発明の実施の形態3として説明する。 [0107] describing the embodiments of the invention which is another example Third Embodiment of the Invention] As a third embodiment of the invention.

【0108】この発明の実施の形態3である重要文抽出装置1が発明の実施の形態2と相違するのは、図5に示す文書構造情報重要度テーブル3に代えて図7に示す文書構造情報重要度テーブル3を用い、これに伴い、図6 [0108] The sentence extraction device 1 according to a third embodiment that differs from the second embodiment of the invention of the present invention, the document shown in FIG. 7 in place of the document structure information importance table 3 shown in FIG. 5 structure using the information importance degree table 3, along with this, FIG. 6
に示す処理に代えて図8に示す処理を行う点にある。 It lies in the processing shown in FIG. 8 in place of the process shown in. その他の内容については、発明の実施の形態2と同様であるので、発明の実施の形態2の場合と同一符号を用い、 For other details are the same as the second embodiment of the invention, using the same reference numerals as in the second embodiment of the invention,
詳細な説明を省略する。 A detailed description thereof will be omitted.

【0109】この重要文抽出装置1では、図7に示す文書構造情報重要度テーブル3で、入力された文書のタイプに基づいて文書中の重要でない個所を特定できるよう、文書タイプと、その文書タイプ中の抽出しなくてもよい重要でない個所となる構成要素(文書構造表現を先頭としたまとまり)を対応づけて記述するものである。 [0109] In the sentence extraction apparatus 1, the document structure information importance table 3 shown in FIG. 7, to be able to identify non-critical point in the document based on the type of the input document, the document type and, the document components a location not be good important not extracted in type (unity with the top document structure representation) is for describing correspondence.

【0110】図8は、文書解析部2が行う具体的な処理について説明するフローチャートである。 [0110] Figure 8 is a flowchart illustrating a specific process performed by the document analysis unit 2. この処理により重要個所特定工程が実現される。 Important position identification step by the process is realized. 図8に示すように、 As shown in FIG. 8,
まず、この例では、入力文書のタイプをユーザが直接入力する。 First, in this example, the user directly inputs the type of the input document. この入力がされたときは(ステップS21のY)、入力文書中に文書解析部2で未処理の文またはレコードがあるか否かを判断し(ステップS22)、未処理の文またはレコードがあるときは(ステップS22のY)、未処理の文またはレコードの先頭から1文または1レコードを特定して(ステップS23)、当該1文または1レコードに文書構造情報重要度テーブル3のステップS21で特定された文書タイプに対応している非重要個所として挙げられている内容の有無の判定のために必要な解析を行い(ステップS24)、その判断結果をRAM13の所定領域に記録して(ステップS25)、 There is (Y in step S21), and determines whether there is statement or unprocessed record in the document analyzing portion 2 in the input document (step S22), and statement or unprocessed record when the input is when (Y in step S22), and identifies the one sentence or one record from the beginning of the untreated statement or records (step S23), in step S21 in the document structure information importance degree table 3 to the one sentence or one record analyzes required for the determination of the presence or absence of the contents listed as non-essential point that corresponds to the document type identified (step S24), and records the determination result to the RAM13 in a predetermined area (step S25),
ステップS22に戻る。 It returns to the step S22. すべての文やレコードについてこのような解析を行った後に(ステップS22のN)、 For all of the statements and the record after performing such analysis (N in step S22), and
前記のようにRAM13の所定領域に記録されたその解析結果に基づいて、入力文書中の非重要個所を特定する(ステップS26)。 Based on the recorded result of the analysis to RAM13 of a predetermined area as described above, to identify non-critical points in the input document (step S26).

【0111】より具体的な例をもって説明すると、文書タイプがコラムである場合に、図7の文書構造情報重要度テーブル3ではコラムに関する記載の「小見出しより下の階層の箇条書き、列挙」が非重要個所とされている。 [0111] than Explaining with a specific example, if the document type is a column, "bullet of below subheadings hierarchy enumeration" described for column in the document structure information importance level table 3 of FIG. 7 is non It has been an important point. そこで、文書解析部2では、「小見出し」「箇条書き」「列挙表現」を解析、判定する。 Therefore, in the document analysis unit 2, analyzes the "subheading", "bullet", "enumeration representation", is determined.

【0112】箇条書き、列挙表現は、例えば、 ・先頭が記号の表現か数詞表現がある部分 ・先頭が記号で、レコードの末が名詞のレコードが連続する部分 に対して判定する。 [0112] bullets, enumeration representation is determined, for example, in part, the top-top and there is a representation or numeral representation of the symbol is the symbol, to the portion of the end record of nouns consecutive record.

【0113】1文ずつの解析(ステップS24)では、 [0113] In the analysis of one sentence (step S24), and
上記条件の表現を検出してRAM13に記憶しておき、 Detecting the expression of the condition is stored in the RAM 13,
すべての文を解析した後(ステップS22のN)、連続した個所は箇条書き、そうでない場合は小見出しとして判定する(ステップS26)。 After analyzing all the statements (N in step S22), and successive points are itemized, otherwise it determines as subheading (step S26).

【0114】そして、抽出部4では、RAM13に記憶されている非重要個所の記述から、非重要個所に該当しない個所だけを重要個所として抽出する。 [0114] Then, the extracting section 4, from the description of a non-critical point stored in the RAM 13, and extracts only the point that does not correspond to a non-critical point as an important point.

【0115】発明の実施の形態2で示した入力文書例では、図7に示す文書構造情報重要度テーブル3のうち、 [0115] In the input document examples shown in the second embodiment of the invention, among the document structure information importance table 3 shown in FIG. 7,
文書タイプとしてコラムが選択されて、前記処理がなされた結果、以下のような文書が抽出される。 Is a column selection as document type, a result of the processing has been performed, a document such as the following are extracted.

【0116】<抽出文書の例> -------------------------------------------- 「砂糖の消費が、年々減っている。飲み物も、お菓子も、あげて「甘さ控えめ」が全盛だが、業界は砂糖の効用をPRして消費拡大に懸命だ。 [0116] <Example of the extraction document> ----------------------------------------- --- "the consumption of sugar, has decreased year by year. drink also, sweets, but raised in" sweetness modest "is prime, the industry's hard to consumption expand the utility of the sugar and PR. ◇73年度ピークに消費減少−−業界、PRに躍起 砂糖の一人当たり消費量は、農水省によると一九七三砂糖年度(十月―翌年九月)の二十九キロが最高。 ◇ consumption decreased to 73 year peak - industry, consumption per capita eager sugar in PR, according to the Ministry of Agriculture, Forestry and Fisheries one thousand nine hundred seventy-three sugar year (October - the following year in September) highest twenty-nine kg of. その後は減少傾向で、八〇年度に二十五キロを割り、九三年度以降は二十キロを下回っている。 Then in the downward trend, dividing the twenty-five km to eighty fiscal year, after ninety-three fiscal year is less than twenty kilometers away. また、でんぷんを原料とする異性化糖の大量生産技術が確立され、十数年前から清涼飲料、缶詰、菓子、パンなどに広く利用されている。 In addition, starch is mass production technology establishment of isomerized sugar as a raw material, soft drinks from ten years ago, canning, confectionery, have been widely used, such as in bread. 異性化糖は分類上、砂糖に含まれないため、砂糖の需要を食った形になるが、異性化糖を加えた消費量でも、七八年度の二十八キロをピークに、ここ三年は二十五キロ台と、じり貧だ。 Isomerized sugar on the classification, because it is not included in the sugar, becomes a form that ate the demand of sugar, even in consumption plus the isomerized sugar, to peak the twenty-eight kilometers of seventy-eight fiscal, here three years and twenty-five km block, but Jirihin. 同省砂糖類課は「砂糖が肥満や虫歯、糖尿病などのもとになるという、間違った健康知識に基づく砂糖・甘味離れが、平成時代に入って目立つようになった。これを受けて、飲料や菓子メーカーが『甘さを抑えれば売れ筋になる』と、生産を切り替えたことが大きく影響している」(信太英治・課長補佐)と分析する。 The ministry sugars Division "sugar is obesity and tooth decay, that made the original such as diabetes, sugar-sweet taste away based on the wrong health knowledge, began to stand out entered the Heisei era. In response to this, drinks and confectionery manufacturers "consisting selling if Osaere the sweetness", to analyze the fact that switching the production has a significant impact "(Eiji Shida Deputy director). こうした減少傾向に、精糖工業会や日本砂糖輸出入協議会など砂糖八団体は九〇年末、「お砂糖“真”時代協議会」を結成。 In such a downward trend, refined sugar Industry Association and sugar eight organizations such as Japan sugar import and export council ninety the end of the year, formed the "sugar" true "era Council". 消費者にもっと砂糖を知ってもらおうと、キャンペーン活動を続ける。 When'll let you know more sugar to consumers, continue to campaign activities. 一昨年にテレビ放映した番組を基に昨年春、おいしい和洋菓子や職人の技などを紹介する冊子「甘いお話」を三万部作成したが、残部はほとんどないという。 Two years ago last year on the basis of the program that was televised in the spring, delicious sum confectionery and craftsmen of the booklet "sweet talk" to introduce the technique was created thirty thousand parts, the balance being mostly that it is not. 今春に第二集を発行する。 To issue a second collection this spring. さらに、二月十九日から二十五日まで、東京・銀座のソニースクエアで、砂糖を使ったオブジェを展示し、買い物客らにPRする。 In addition, from February nineteen days until the 25th, Sony Square in Tokyo's Ginza, exhibited objects using the sugar, to PR to shoppers, et al. ◇上手な使用法や効果 《健康》 「砂糖を食べると太るのでは」「虫歯にならないか」 ◇ good usage and effects "health", "eat and is the fat of the sugar," "Do not be in tooth decay."
「ビタミンB1やカルシウムは奪われないか」など、健康に絡んだ消費者の疑問に、精糖工業会は(1)砂糖は疲労を速やかに回復するエネルギー源。 Such as "Do not vitamin B1 and calcium is lost", consumers wondering entwined healthy, refined sugar Industry Association (1) sugar energy source to recover quickly the fatigue. バランス良く食べて、よく体を動かせば、問題はない(2)食事やおやつは、時間と量を決めて節度よく与える。 Eat a well-balanced, may be moving the body, meals and snacks there is no problem (2), give better moderation decide the time and amount. その後、必ず歯を磨けば虫歯は予防できる(3)B1やカルシウムが奪われることはないが、牛乳、果物、野菜などからバランス良く摂取するのが合理的――などと説明する。 Thereafter, the caries if always polish teeth, but (3) B1 and calcium not be deprived preventable, milk, fruits, reasonable to ingest a balanced from vegetables - such as that described. 《九不思議》砂糖の効用は「七不思議」よりふたつ多い? Utility of the "nine mysterious" sugar is more two than the "seven wonders"? 《保存》東京都消費者センターによると、砂糖についての問い合わせ、苦情は一九九〇年四月以降、昨年十一月までで計二十八件と、比較的少ない。 When the "Save" According to the Tokyo Metropolitan consumer center, inquiries about sugar, complaints 1990 four since January, and a total of twenty-eight cases in up to November last year, relatively few. 大半は「古い砂糖が出てきたが、大丈夫か」など、保存に関する内容という。 Most "came out the old sugar but, all right either", etc., that the contents related to storage. 砂糖は、においや水分を吸収しやすいので、密閉できる缶やプラスチック容器に入れて使う。 Sugar, so easy to absorb odors and moisture, use put it in cans and plastic containers that can be sealed. においが移ったら、風通しの良い場所に広げて空気にさらす。 When the smell is moved, it exposed to air and spread to well-ventilated place. 固まった場合は、広げて霧を吹くか、砕いて使うとよい。 If you have solidified, or blow the fog spread, it may crushed use. 《プレート》お祝いにタイをかたどった砂糖を配る風習は、昔からよく見られたが、東京の三越銀座店では、菓乃実(かのみ)の杜(もり)=港区元赤坂=が、名入れのできる砂糖のプレートを発売。 "Plate" custom of handing out sugar in the shape of Thailand in celebration, was seen well from the old days, in Tokyo of the Mitsukoshi Ginza store, Mori (Sheng) of 菓乃 real (Kanomi) = Minato-ku Moto-Akasaka = is, name It launched a plate of sugar that can put. プレートは大人の手のひらほどの大きさ。 The plates of the more adult of palm size. 「〇〇ちゃん、おめでとう」といった言葉を付けられる。 It attached the words such as "hundred-chan, congratulations". 砂糖製のベビーシューズをあしらって、値段は三千円。 Garnish sugar made of baby shoes, the price is three thousand yen. バレンタインデー向けのハート形小物入れ(四千円)など、季節商品が数種類ある。 Valentine's Day heart-shaped pouch for Day (four thousand yen), such as seasonal products there are several types. 注文に応じ、オリジナルの品も製作する。 Depending on the order, also made the original goods. 」 ------------------------------------------ "------------------------------------------

【0117】以上説明した重要文抽出装置1によれば、 [0117] According to sentence extraction device 1 described above,
文書構造情報重要度テーブル3において文書タイプごとに文書中の重要でない個所を規定することで、文書の種類に応じた重要文抽出を的確に行うことができる。 By defining a non-critical point in the document for each document type in the document structure information importance table 3 can be carried out accurately sentence extraction in accordance with the type of document.

【0118】また、文書中の重要でない個所を文書構造情報重要度テーブル3に規定することで、その他の部分については漏らさずに抽出することを可能とし、重要である可能性がある個所は落とさずに抽出することができる。 [0118] Also, by defining a non-critical point in the document in the document structure information importance table 3, possible to extract without leaking the other parts, locations that may be important is dropped it can be extracted without.

【0119】[発明の実施の形態4]別例である発明の実施の形態を発明の実施の形態4として説明する。 [0119] describing the embodiments of the invention which is another example Fourth Embodiment of the Invention] As a fourth embodiment of the invention.

【0120】この発明の実施の形態4である重要文抽出装置1が発明の実施の形態3と相違するのは、図7に示す文書構造情報重要度テーブル3に代えて図9に示す文書構造情報重要度テーブル3を用い、これに伴い、図8 [0120] The sentence extraction device 1 according to a fourth embodiment that differs from the third embodiment of the invention of the present invention, the document shown in FIG. 9 in place of the document structure information importance table 3 shown in FIG. 7 structure using the information importance degree table 3, along with this, FIG. 8
に示す処理に代えて図10に示す処理を行う点にある。 It lies in the processing shown in FIG. 10 in place of the process shown in.
その他の内容については、発明の実施の形態3と同様であるので、発明の実施の形態3の場合と同一符号を用い、詳細な説明を省略する。 For other details are the same as the third embodiment of the invention, using the same reference numerals as in the third embodiment of the invention, a detailed description thereof will be omitted.

【0121】この重要文抽出装置1では、図9に示す文書構造情報重要度テーブル3で、入力された文書のタイプに基づいて、文書の構成要素(文書構造表現を先頭としたまとまり)と、当該個所が重要であるかどうかの度合いや順序付けを記述している。 [0121] In the sentence extraction apparatus 1, the document structure information importance table 3 shown in FIG. 9, based on the type of the input document, the components of the document and (unity that the top document structure representation), the location is described how the degree or ordering or important.

【0122】入力文書中の重要個所を文書解析部2が自動的に特定する場合の文書解析部2の具体的な処理は、 [0122] Specific processing of the document analysis unit 2 when the document analysis unit 2 the importance points in the input document is automatically identified,
図10のフローチャートに示すとおりである。 It is shown in the flowchart of FIG. 10. この処理により重要個所特定工程が実現される。 Important position identification step by the process is realized. すなわち、まず、入力文書中に文書解析部2で未処理の文またはレコードがあるか否かを判断し(ステップ31)、未処理の文またはレコードがあるときは(ステップS31のY)、未処理の文またはレコードの先頭から1文または1レコードを特定して(ステップS32)、当該1文または1レコードに文書構造情報重要度テーブル3の「特許」という文書タイプに対応している条件として挙げられている、「発明の名称」「従来の技術」等の特許明細書に特有の文書構造表現があるか否かを判断し(ステップS33)、その判断結果をRAM13の所定領域に記録して(ステップS34)、ステップS31に戻る。 That is, first, to determine whether there is a statement or unprocessed record in the document analyzing portion 2 in the input document (step 31), if there is a statement or unprocessed record (Y in step S31), non from the beginning of the sentence or records for processing to identify the one sentence or one record (step S32), as a condition that corresponds to the document type of "patent" document structure information importance degree table 3 to the one sentence or one record listed, it is determined whether there is a document structure specific expression in patents such as "entitled" "prior art" (step S33), and records the determination result to the RAM13 in a predetermined area Te (step S34), and returns to step S31. すべての文やレコードについてこのような判断をした後に(ステップS31のN)、前記のようにRAM13の所定領域に記録された文書構造表現のあり/なしの結果から、入力文書のタイプを特定し(ステップS35)、文書構造情報重要度テーブル3を参照して当該文書タイプに対応した条件から、重要個所を特定する(ステップS For all statements and records after such a determination (N of step S31), the results of Yes / No of the recorded document structure representation RAM13 of a predetermined area as described above, identifies the type of the input document (step S35), by referring to the document structure information importance level table 3 from the condition corresponding to the document type, to identify key points (step S
36)。 36).

【0123】そして、抽出部4が、その重要個所を抽出して出力装置20に出力するが、図9に示す文書構造情報重要度テーブル3では、条件ごとに入力文書中の重要個所についての重要度の順序付けがなされており、この例では重要度1のものを重要度最大としている。 [0123] Then, the extracting unit 4, will be output to the output device 20 extracts the important points, the document structure information importance degree table 3 shown in FIG. 9, important for critical points in the input document for each condition time ordering have been made of, in this example are those of severity 1 and severity maximum. このように重要度の順序付けがなされているので、入力文書中の重要個所を特定する際(ステップS36)には、出力装置20による出力については、最初に重要度1のものだけを出力し、ユーザの指示がある場合のみ重要度2を出力する、あるいは、重要度1と2のものをフォントサイズや色などを区別して表示する、あるいは、出力したい文書サイズが規定されている場合には、重要度1のものの分量でサイズに余裕がある場合のみ重要度2のものも出力するなど、重要度の大きさに応じた様々な出力が可能となる。 This way, since the ordering of importance is made, the time to identify key points in the input document (step S36), the output by the output device 20, and outputs only the first one of Severity 1, and outputs the importance 2 only when there is a user's instruction, or, when displayed by severity 1 and distinguish such as font size and color of those 2, or the document size to be output are defined in, etc. also outputs only the importance 2 if there is a margin in the size in an amount of one of severity 1, various output becomes possible in accordance with the magnitude of importance.

【0124】発明の実施の形態2で示した入力文書例を、この重要文抽出装置1で処理し、重要度1のみ出力した例を以下に示す。 [0124] The input document examples shown in the second embodiment of the invention, treated in this sentence extraction device 1 shows an example of output only Severity 1 below.

【0125】<抽出文書の例> ----------------------------------------- 「砂糖の消費が、年々減っている。飲み物も、お菓子も、あげて「甘さ控えめ」が全盛だが、業界は砂糖の効用をPRして消費拡大に懸命だ。 [0125] <Example of the extraction document> ----------------------------------------- "consumption of sugar, has decreased year by year. drink also, sweets, but raised in" sweetness modest "is prime, the industry's hard to consumption expand the utility of the sugar and PR. ◇73年度ピークに消費減少−−業界、PRに躍起 ◇上手な使用法や効果 《健康》 《九不思議》 《保存》 《プレート》」 ------------------------------------------- ◇ consumption decreased to 73 year peak - industry, PR rushing ◇ good usage and effects "health" "nine mysterious" "Save" "plate" "--------------- ----------------------------

【0126】以上説明した重要文抽出装置1によれば、 [0126] According to the important sentence extraction device 1 described above,
入力文書のタイプに基づき、文書の構成要素ごとに重要度を付与しているので、文書タイプに応じた重要文の抽出が可能であり、ユーザの希望や出力制限などに応じて多段階に抽出文書を出力することが可能である。 Based on the type of the input document, because it imparts importance for each component of the document are possible extraction of important sentences in accordance with the document type, extracted in multiple stages depending on the user's wishes and the output limit it is possible to output the document.

【0127】[発明の実施の形態5]別例である発明の実施の形態を発明の実施の形態5として説明する。 [0127] describing the embodiments of the invention which is another example Embodiment 5 of the invention as the fifth embodiment of the invention.

【0128】この発明の実施の形態5である重要文抽出装置1が発明の実施の形態4と相違するのは、図9に示す文書構造情報重要度テーブル3に代えて図11に示す文書構造情報重要度テーブル3を用い、図10に示す処理に代えて図6に示す発明の実施の形態2と同様の処理を行う点にある。 [0128] The sentence extraction device 1 according to a fifth embodiment that differs from the fourth embodiment of the invention of the present invention, the document shown in FIG. 11 in place of the document structure information importance table 3 shown in FIG. 9 structure using the information importance degree table 3, it lies in the same processing as the second embodiment of the invention shown in FIG. 6 in place of the process shown in FIG. 10. その他の内容については、発明の実施の形態4と同様であるので、発明の実施の形態4の場合と同一符号を用い、詳細な説明を省略する。 For other details are the same as the fourth embodiment of the invention, using the same reference numerals as in the fourth embodiment of the invention, a detailed description thereof will be omitted.

【0129】図11に示す文書構造情報重要度テーブル3では、入力された文書のタイプに基づいて、文書中の文書構造表現、構成要素(文書構造表現を先頭としたまとまり)間で関係する個所を記述している。 [0129] places the document structure information importance degree table 3 shown in FIG. 11, based on the type of the input document, the document structural representation of the document, relating between components (unity was top document structure representation) It describes the. 図11の例では、「特許請求の範囲」が「実施例」と内容的に関連する。 In the example of FIG. 11, "claims" the contents related to "Examples". 特に、この例では、最も左に書かれた文書構造表現の構成要素と、その右に記載された文書構造表現の構成要素とが関係する。 In particular, in this example, the components of the document structure written expression leftmost, and the components of the document structure representation described in the right concerned.

【0130】このような文書構造情報重要度テーブル3 [0130] Such a document structure information importance table 3
を参照して、文書解析部2は、図6に示す発明の実施の形態2と同様の処理を行う。 See, document analysis unit 2 performs the same processing as the second embodiment of the invention shown in FIG. この場合にステップS13 Step S13 in this case
では文書構造情報重要度テーブル3の文書タイプ「特許」に対応する文書構造表現の組に挙げられている文書構造表現の有無を判断し、このような文書構造表現があるときにステップS15で入力文書のタイプを「特許」 In determining whether a document structure representation listed in the set of document structure representation corresponding to the document type of the document structure information importance level table 3 "patent", entered in the step S15 when there is such a document structure representation "patent" the type of document
と特定する。 To identify with. そして、ステップS16では、文書タイプ「特許」に対応する文書構造表現の組に挙げられている文書構造表現に対応している構成要素を入力文書の重要個所として特定する。 Then, in step S16, it identifies the components that support document structure representation listed in the set of document structure representation corresponding to the document type "patent" as an important point of the input document. この特定を行う場合に、文書構造表現の組の欄で最も左に書かれた文書構造表現の構成要素なのか、あるいは、その右に記載された文書構造表現の構成要素なのかを識別し、同一の文書構造表現の組の構成要素同士を対応付けて特定する。 When performing this particular, whether components of the document structure written expression most left set of columns of the document structural representation, or to identify whether the components of the document structure representation described in the right, identify in association with a set of components to each other of the same document structure representation.

【0131】そして、抽出部4は、文書タイプ「特許」 [0131] Then, the extraction section 4, document type "patent"
に対応する文書構造表現の組の欄のうち、最も左に記載した文書構造表現(図5の例では、「特許請求の範囲」、「発明が解決しようとする課題」)の構成要素を抽出して、出力装置20に出力する。 Of the set of column document structure representation corresponding to (in the example of FIG. 5, "claims", "problems to be Solved by the Invention") document structure representation described leftmost extract components and, to the output device 20. その際、各構成素が関連する構成要素(図5の例では、「効果」「実施例」「作用」)について、ユーザから指示がある場合や、最も左に記載した文書構造表現の構成要素だけでは抽出量が少ない場合に、その関連する個所を出力する。 At that time, (in the example of FIG. 5, "effect" "Examples" "act") components each constituent is related for the components of the case and, document structure representation described leftmost there is an instruction from a user only if a small amount extracted, and outputs the relevant point.
例えば、ユーザが「発明が解決しようとする課題」の部分を指示すると、関連する「作用」「効果」の部分が出力される。 For example, when the user instructs the part of "Problems that the Invention is to Solve" portion of the associated "act", "effect" it is output. なお、関連づけられた部分は発明の実施の形態3に説明と同様に識別表示等でもよい。 Incidentally, associated portions may be described as well as identification, etc. to a third embodiment of the invention.

【0132】発明の実施の形態2に示した特許公開公報の入力文書の例で、この重要文抽出装置1で重要個所を抽出した例は以下のようになる。 [0132] In the example of the input document of patent publications as shown in the second embodiment of the invention, examples of extracting the important points in this sentence extraction device 1 is as follows.

【0133】<抽出文書の例> ------------------------------------------- 「<発明が解決しようとする課題> 従来の自動要約の考え方では、文が長くなるとそれだけキーワードを含む確率が高くなり、修飾語句を多く含む文が抽出される割合が比較的高くなる。また、キーワードを1個しか含まない文は抽出されにくいという問題もある。このため、自動要約といっても現実には要約の基本データの抽出装置に過ぎず、最終的な要約文を作成するには、人間による、抽出した文章の確認や抽出漏れの救済や抽出した文の加工が不可欠である。 <0006> 本発明はこうした事情に鑑みてなされたもので、その目的は、文章の要約を行なう利用者の負担を軽減するような文章要約支援装置を提供することにある。 <作用> 本発明は、要約文を作成しようとして文章中 [0133] <Example of the extraction document> ----------------------------------------- - "in the idea of ​​<iNVENTION problems to be solved> conventional automatic summary statement is the much more likely to contain the keyword long, the ratio of statements containing many modifiers are extracted is relatively high. in addition, a statement that did not contain only one keyword is also a problem that it is difficult to be extracted. Therefore, also in reality to say that automatic summarization only extraction apparatus of the basic data of the summary, to create a final summary the human by, processing the extracted sentences check extraction failure remedies and extracted sentence is essential. <0006> present invention has been made in view of these circumstances, and its object is a summary of the text is to provide a text summary support device, such as to reduce the burden on the user to perform. <action> present invention, the text in an attempt to create a summary statement から、利用者が指定した文字や語句を含む単位文(1つの述語を中心とするまとまり)を抽出するので、利用者は抽出された単位文から従来に比べて容易に要約文を作成することができる。 <発明の効果> 以上説明したように本発明は、電子化された文章をディスプレイ等に表示し、利用者からの位置指定を契機として文章中から指定された文字や語句を含む1文を切り出し、自然言語解析によってその文の構造を解析し、指定された文字や語句を含む単位文を取り出して記憶しておき、利用者による一連の位置指定が終了すれば、記憶されている単位文を要約文作成用データとして出力することにより、利用者は出力された単位文から要約文を容易に作成することができる効果がある。」 ------------------------------------------ From, since to extract the (unity around one predicate) units sentence including characters or words designated by a user, the user to easily create summary compared to conventionally extracted units sentences It can. book as has been described <effects of the invention> invention, 1 the digitized text displayed on a display or the like, comprising a character or phrase specified by the sentence in response to the position specified by the user excised statement, analyzes the structure of the sentence by the natural language analysis, stores removed the unit sentence containing the specified text or phrase, if termination series of positions designated by the user has been stored by outputting unit statement as a summary creation data, the user has the advantage of being able to easily create a summary from the unit sentence output. "------------ ------------------------------

【0134】以上説明した重要文抽出装置1によれば、 [0134] According to sentence extraction device 1 described above,
文書タイプごとに各構成要素間を関連づけておくことで、関係する構成要素部分を必要に応じて出力することが可能となり、重要な個所とそれに関連する部分を提示でき、文書を効率的に読み進めることができる。 By keeping associates between components for each document type, it is possible to output as required component parts involved, can present significant points and parts associated therewith, efficiently read the document You can proceed.

【0135】[発明の実施の形態6]別例である発明の実施の形態を発明の実施の形態6として説明する。 [0135] Sixth Embodiment of the Invention] describing the embodiments of the invention which is another example as a sixth embodiment of the invention.

【0136】この発明の実施の形態6である重要文抽出装置1が発明の実施の形態5と相違するのは、図11に示す文書構造情報重要度テーブル3に代えて図12に示す文書構造情報重要度テーブル3を用いる点にある。 [0136] The sentence extraction device 1 according to a sixth preferred embodiment that differs from the fifth embodiment of the invention of the present invention, the document shown in FIG. 12 in place of the document structure information importance table 3 shown in FIG. 11 structure It lies in the use of information importance degree table 3. その他の内容については、発明の実施の形態5と同様であるので、発明の実施の形態5の場合と同一符号を用い、 For other details are the same as the fifth embodiment of the invention, using the same reference numerals as in the fifth embodiment of the invention,
詳細な説明を省略する。 A detailed description thereof will be omitted.

【0137】図12に示す文書構造情報重要度テーブル3では、文書のタイプに応じて、図11に示す発明の実施の形態5の場合と同様に文書構造表現の組が記述され、さらに、各文書構造表現の組には、どのような関係にあるか関係の種類を示す「関係名」が対応付けられて記述されている。 [0137] The document structure information importance degree table 3 shown in Fig. 12, depending on the type of document, set the same manner as in the case the document structural representation of embodiment 5 of the invention shown in FIG. 11 is described, and further, each the set of document structure representation is described what "relationship name" indicating the type of relationship or a relationship with the associated. すなわち、図12の例では、「特許請求の範囲」が「実施例」と情報を「詳細化」するという点で関連し、「特許請求の範囲」は「作用」と「平易化」という点で関連する。 That is, in the example of FIG. 12, associated with that "claims" to "Example" and information "detailing", that "claims" and "working", "simplification" in the relevant.

【0138】このような文書構造情報重要度テーブル3 [0138] Such a document structure information importance table 3
を参照して、文書解析部2は、図6に示す発明の実施の形態5と同様の処理を行う。 See, document analysis unit 2 performs the same processing as the fifth embodiment of the invention shown in FIG. 前記のように、ステップS As described above, the step S
16では、文書タイプ「特許」に対応する文書構造表現の組に挙げられている文書構造表現に対応している構成要素を入力文書の重要個所として特定し、この特定を行う場合に、文書構造表現の組の欄で最も左に書かれた文書構造表現の構成要素なのか、あるいは、その右に記載された文書構造表現の構成要素なのかを識別し、同一の文書構造表現の組の構成要素同士を対応付けて特定する。 In 16, when identifying the elements that support document structure representation listed in the set of document structure representation corresponding to the document type "patent" as an important point of the input document, make this particular, document structure of the most left written document structure represented by a set of column representation components that the, or to identify whether the components of the document structure representation described in the right set of configuration of the same document structure representation to identify in association with the elements to each other. そして、この特定を行う場合に、同一の文書構造表現の組の構成要素に文書構造情報重要度テーブル3に掲げる関係名も対応付ける。 Then, when performing this particular associates document structure information to the set of components of the same document structure also expressed importance relationship names listed in table 3.

【0139】そして、抽出部4は、文書構造情報重要度テーブル3の最も左に記載している構成要素「特許請求の範囲」のまとまりをまず重要な個所として出力装置2 [0139] Then, the extracting unit 4, an output device chunk of the document structure information importance "claims" to have components described in the leftmost table 3 First an important point 2
0に出力する。 And outputs it to 0. その際、文書構造情報重要度テーブル3 At that time, the document structure information importance level table 3
の最も左に記載している文書構造表現の構成要素が関連する構成要素名と、この関連を示す関連名の出力も可能とし、ユーザから指示がある場合や、重要個所の抽出量が少ない場合に、その関連する構成要素を表示することができる。 The most left and components name component associated document structure representation which describes in, to allow the output of the associated name indicating the relevant, and if there is an instruction from the user, if a small amount of the extracted important point of the , it is possible to display the elements of its associated.

【0140】例えば、図12の例で、ユーザが「特許請求の範囲」について関係名「平易化」の「作用」の部分を指示すると、関連する「作用」の部分が出力装置20 [0140] For example, in the example of FIG. 12, when the user instructs the part of the "action" relationship name "simplification" on "claims", the output portion of the associated "action" 20
から出力される。 It is output from. なお、関連づけられた部分は発明の実施の形態3に説明と同様に識別表示等でもよい。 Incidentally, associated portions may be described as well as identification, etc. to a third embodiment of the invention. これは用途等に応じて、どの関係名が情報を追加表示する際よいかをあらかじめ設定しておいてもよい。 This is in accordance with the application etc., which relationship name may be previously set or a good time to add display the information.

【0141】発明の実施の形態2に示した特許公開公報の入力文書の例で、この重要文抽出装置1で重要個所を抽出した例は以下のようになる。 [0141] In the example of the input document of patent publications as shown in the second embodiment of the invention, examples of extracting the important points in this sentence extraction device 1 is as follows.

【0142】<抽出文書の例> ---------------------------------------- 「<特許請求の範囲> <請求項1> 電子化された文章を表示する表示部と、前記表示部に表示されている文章中の文字や語句を指定する位置指定を利用者が入力するための入力部と、利用者から入力された位置指定で指定された文字や語句を含む [0142] <Example of the extraction document> ---------------------------------------- " a display unit for displaying a <claims> <claim 1> digitized text, locate the user for input specifying a character or word in a sentence being displayed on the display unit It includes an input section, a character or phrase specified by the input position specified by the user
1文を切り出す文切り出し部と、記憶部と、解析用辞書と、切り出された文の構造を前記解析用辞書を用いて解析し、指定された文字や語句を含む、1つの述語を中心とするまとまりである単位文を取り出して前記記憶部に格納する単位文検出部と、利用者により入力された全ての位置指定に対して前記文切り出し部と前記単位文検出部による処理が終了すると、前記記憶部に格納されている全ての単位文を前記文章の要約の元となる要約文作成用データとして出力する出力部とを有する文章要約支援装置。 And sentence extraction unit to cut out one sentence, the center and the storage unit, and the analysis dictionary, the structure of the cut-out sentence and analyzed using the analysis dictionary, containing the specified text or phrase, one predicate the unit sentence detection unit to be stored in the storage unit takes out the unit statement is a unity of the processing by the units sentence detecting unit and the sentence cutout portion for all positions designated input by the user is completed, sentence summary support apparatus having an output unit for outputting all unit statements stored in the storage unit as the underlying summary creation data summary of the sentence. -->(平易化)作用 <作用> 本発明は、要約文を作成しようとして文章中から、利用者が指定した文字や語句を含む単位文(1つの述語を中心とするまとまり)を抽出するので、利用者は抽出された単位文から従来に比べて容易に要約文を作成することができる。 -> (simplification) act <action> The present invention is, from the text in an attempt to create a summary, extracts the (unity around one predicate) units sentence including characters or words designated by a user since, the user can easily create a summary compared to conventionally extracted units statement. 」 ----------------------------------------- "-----------------------------------------

【0143】以上説明した重要文抽出装置1によれば、 [0143] According to the important sentence extraction device 1 described above,
文書中の関連する構成要素とその関係を保持しておくことにより、情報を追加表示あるいは出力分量を増やす際に、ユーザの所望の情報を出力することができる。 By maintaining the relationship between the relevant components in the document, when increasing the additional display or output amount information, it is possible to output the desired information of the user.

【0144】前記の例では、文として長く、複雑である「特許請求の範囲」と、それをより平易化した「作用」 [0144] In the above example, long as a statement, a complex as "claims", a more simplification it "working"
部分の表現と共に表示することで、より適切な情報提示を行うことができる。 By displaying together with part of the expression, it is possible to perform more appropriate information presentation.

【0145】[発明の実施の形態7]別例である発明の実施の形態を発明の実施の形態7として説明する。 [0145] [Embodiment 7 of the invention] describing the embodiments of the invention which is another example as the seventh embodiment of the invention.

【0146】この発明の実施の形態7である重要文抽出装置1が発明の実施の形態6と相違するのは、図12に示す文書構造情報重要度テーブル3に代えて図13に示す文書構造情報重要度テーブル3を用いる点にある。 [0146] The sentence extraction device 1 according to a seventh preferred embodiment that differs from the sixth embodiment of the invention of the present invention, the document shown in FIG. 13 in place of the document structure information importance table 3 shown in FIG. 12 structure It lies in the use of information importance degree table 3. その他の内容については、発明の実施の形態6と同様であるので、発明の実施の形態6の場合と同一符号を用い、 For other details are the same as the sixth embodiment of the invention, using the same reference numerals as in the sixth embodiment of the invention,
詳細な説明を省略する。 A detailed description thereof will be omitted.

【0147】図13に示す文書構造情報重要度テーブル3では、文書タイプに応じて、その文書タイプ中の重要個所となる構成要素(文書構造表現を先頭としたまとまり)の先頭の「文書構造表現」と、その構成要素に含まれる語句についての所定の「条件」と、その構成要素の「重要度」とが対応付けられて記述されている。 [0147] The document structure information importance degree table 3 shown in Fig. 13, depending on the document type, "document structure representation of the head components is important point in the document type (unity that the top document structure representation) "said prescribed the" condition "for words contained in its components, the" importance "is described in association of its components.

【0148】このような文書構造情報重要度テーブル3 [0148] Such a document structure information importance table 3
を参照して、文書解析部2は、図10に示す発明の実施の形態4と同様の処理を行う。 See, document analysis unit 2 performs the same processing as in the fourth embodiment of the invention shown in FIG. 10. 但し、図10のステップS36においては、入力文書の重要個所の特定を次のように行う。 However, in the step S36 in FIG. 10, it performs certain key points of the input document, as follows. すなわち、まず、文書構造情報重要度テーブル3に挙げている「文書構造表現」を先頭とする構成要素を入力文書中で特定する。 That is, first, to identify the component to the top of the "document structural representation" as mentioned in the document structure information importance level table 3 in the input document in. そして、これらの構成要素のうち、「重要度」の最も高い構成要素部分(重要度1)に対して構文解析、パタンマッチ、形態素解析等を行い、対応する「条件」に合致する語句、すなわち、修飾句の長い文の語句か、修飾句の長い文の末の語句か、 Then, among these components, the syntax analysis on the highest component parts of the "importance" (Severity 1), pattern matching, performs morphological analysis or the like, to meet the corresponding "condition" phrase, i.e. , or phrase of a long sentence of qualified clause, or phrase of the end of a long sentence of qualified clause,
または、頻度の高い語句かを保持する。 Or holds or frequent phrases. 図13の例では、修飾句の長い文の末の語句を「条件」としている。 In the example of FIG. 13, it is set to "condition" the phrase after a long sentence of modification clause.
この構成要素自体については、全体を重要度1としても、特にこの修飾句の長い文だけを重要としてもよい。 This component itself, also the overall severity 1, may be particularly important only long sentence of this modification clause.
そのほかの「重要度」の低い構成要素部分(重要度2) Low component part of the other of the "importance" (Severity 2)
については、保持した語句が文書構造情報重要度テーブル3に記載の「条件」で出現していれば、その構成要素のその文を重要個所として抽出する。 For holding the phrase if found at "conditions" according to the document structure information importance table 3, and extracts the statement of its components as an important point.

【0149】図13に示す文書構造情報重要度テーブル3の例では、「重要度」が1の「特許請求の範囲」について、修飾句の長い文(長いとは、どの程度長いものを指すのかは予め文書構造情報重要度テーブル3に設定されている)を抽出し、その語句を得る。 [0149] In the example of the document structure information importance table 3 shown in FIG. 13, the "claims", "importance" is 1, whether the long sentence of qualifiers (long, refers to how long extracts are set in advance in the document structure information importance degree table 3), obtaining the phrase. 入力文書が発明の実施の形態2で示した特許公開公報の例である場合は、「前記表示部に表示されている文章中の文字や語句を指定する位置指定を利用者が入力するための入力部」、「利用者から入力された位置指定で指定された文字や語句を含む1文を切り出す文切り出し部」、「切り出された文の構造を前記解析用辞書を用いて解析し、指定された文字や語句を含む、1つの述語を中心とするまとまりである単位文を取り出して前記記憶部に格納する単位文検出部」、「利用者により入力された全ての位置指定に対して前記文切り出し部と前記単位文検出部による処理が終了すると、前記記憶部に格納されている全ての単位文を前記文章の要約の元となる要約文作成用データとして出力する出力部」の4文が長いので、これらに含まれる語 If the input document is an example of patent publications as shown in the second embodiment of the invention, "the in the text displayed on the display unit characters and the position designation for designating a word the user to enter input unit ", were analyzed using the" sentence extracting unit for cutting out one sentence including characters or phrases specified by the input position designated by the user "," cut-out structure dictionaries for the analysis of the sentence, designated have been including characters and words, the unit sentence detection unit retrieves a unit statement is unity around the one predicate stored in the storage unit ", the for all positions designated input by" user When the processing by the unit sentence detecting unit and the sentence extraction unit is completed, 4 sentence output section "for outputting all unit statements stored in the storage unit as the underlying summary creation data summary of the sentence since long, the word that is included in these をまず保持する。 The first to hold.

【0150】そして、文書構造表現「従来の技術」「実施例」があると、その「従来の技術」「実施例」に対応した構成要素の部分について、先の語句が文書構造情報重要度テーブル3に掲げられた「条件」である、“提題「〜は」”という形で出現したかどうかを判定し、“提題「〜は」”という形で出現した文があれば、その文の位置を特定してRAM13に記憶する。 [0150] Then, when there is document structure expression "prior art" "Example", the "ART" for the portion of the component element corresponding to the "Examples", the previous phrase document structure information importance level table was listed in 3, which is a "condition", "Hisagedai" - is "" to determine whether or not appeared in the form of, "Hisagedai" - is "" if there is an emerging sentence in the form of, the sentence identify the position stored in the RAM 13.

【0151】そして、以上のように特定された文を抽出部4が抽出して出力装置20から出力する。 [0151] Then, the identified sentence extracting unit 4 outputs the extracted and output device 20 as described above.

【0152】以下の文書は、発明の実施の形態2で示したものと同じ公開特許公報の例である。 [0152] The following document is an example of the same patent publication and that shown in the second embodiment of the invention.

【0153】<入力文書の例> ----------------------------------------- 「<発明の名称>文章要約支援装置 <特許請求の範囲> <請求項1> 電子化された文章を表示する表示部と、前記表示部に表示されている文章中の文字や語句を指定する位置指定を利用者が入力するための入力部と、利用者から入力された位置指定で指定された文字や語句を含む [0153] <Example of the input document> ----------------------------------------- a display unit for displaying the "text summary support device <claims> <entitled> <claim 1> digitized text, specify the character or phrase in a sentence being displayed on the display unit comprising an input unit for a user to enter a locate, the character or phrase specified by the input position specified by the user
1文を切り出す文切り出し部と、記憶部と、解析用辞書と、切り出された文の構造を前記解析用辞書を用いて解析し、指定された文字や語句を含む、1つの述語を中心とするまとまりである単位文を取り出して前記記憶部に格納する単位文検出部と、利用者により入力された全ての位置指定に対して前記文切り出し部と前記単位文検出部による処理が終了すると、前記記憶部に格納されている全ての単位文を前記文章の要約の元となる要約文作成用データとして出力する出力部とを有する文章要約支援装置。 And sentence extraction unit to cut out one sentence, the center and the storage unit, and the analysis dictionary, the structure of the cut-out sentence and analyzed using the analysis dictionary, containing the specified text or phrase, one predicate the unit sentence detection unit to be stored in the storage unit takes out the unit statement is a unity of the processing by the units sentence detecting unit and the sentence cutout portion for all positions designated input by the user is completed, sentence summary support apparatus having an output unit for outputting all unit statements stored in the storage unit as the underlying summary creation data summary of the sentence. (中略) <0012> 記憶部4には要約したい文章が記憶されている。 (Snip) <0012> text that you want to summarize in the storage unit 4 is stored. 表示部1は例えばCRTディスプレイで、記憶部4に記憶されている文章を表示する。 Display unit 1 in the CRT display for example, to display the text stored in the storage unit 4. 入力部2はマウス、タッチキーなどで、利用者は表示部1に表示されている文章を見ながら、重要だと思われる文字や語句を入力部2 Input unit 2 mouse, and the like touch keys, the user while viewing the text that is displayed on the display unit 1, an input unit characters or phrases that are considered to be important 2
を用いてマーク(位置指定)する、文切り出し部3は、 Mark (position specification) using a sentence extracting unit 3,
図2に示すように、マークから文章の先頭方向へ向かって文と文の境界を探し、その位置を「S」とし(ステップ11)、次にマークから文章の末尾方向へ向かって文と文の境界を探し、その位置を「E」として(ステップ1 As shown in FIG. 2, looking for sentence boundaries and statements toward the mark to the top direction of the text, to the position "S" (step 11), text and sentence then toward the mark to the end direction of the text looking for a boundary, its position as the "E" (step 1
2)、最後にSからEまでの範囲を1文として切り出す。 2), cut end of the range of from S to E as one sentence.
(ステップ13)。 (Step 13). 単位文検出部5は図3に示すように、文切り出し部3で切り出された文を解析用辞書6を用いて自然言語解析し(参考文献:長尾真監修「日本語情報処理」(電子通信学会,1985))(ステップ21)、1つの述語を中心とするまとまりである単位文の範囲を決定し(ステップ22)、マークされた文字や語句を含む単位文を検出し、記憶部4に格納する(ステップ23)。 The unit sentence detecting unit 5 as shown in FIG. 3, and natural language analysis using an analysis dictionary 6 excised statement sentence extraction unit 3 (reference: Nagao supervision "Japanese Information Processing" (Electronic Communication Society, 1985)) (step 21), determines the range of the unit statement is a unity around one predicate (step 22), detects the unit statement containing the marked letters and words, in the storage unit 4 stores (step 23). 出力部7 The output unit 7
は、例えばプリンタで、全てのマークについて文切り出し部3と単位文検出部5による処理が終了すると、記憶部 Is for example a printer, when the process by the sentence extracting unit 3 and the unit sentence detecting unit 5 for all marks ends, the storage unit
4に格納されている全ての単位文を文章要約の元となる要約文作成用データとして出力する。 Outputs all unit statements stored in 4 as the underlying summary creation data sentence summary. <0013> 次に、本実施例の文章要約支援装置の動作を、 <0013> Next, an operation of the text summary support apparatus of this embodiment,
次に示す文書が要約対象である場合について説明する。 The following documents will be described a summary object. <0014> 「製品の取扱説明書作成の大手の十印は英文マニュアルを日本文に直す機械翻訳システムを実用化し、 <0014> "of the product's instructions to create a leading Jushirushi is put to practical use the machine translation system to fix the English manual in Japan statement,
作成工程で導入した。 It was introduced in the creation process. 英日機械翻訳作業をコンピュータが自動的にこなすため、人手に比べ納期が半減するうえ、翻訳レベルも一定になる。 In order to do a English-Japanese machine translation work computer automatically, helping to half the delivery time compared to the manual, the translation level is also constant. 業務用の本格的なシステムは珍しく、すでに外資系企業の日本向け製品の技術マニュアルに絞って同システムの運用を始めた。 Unusual full-fledged system for business, has already started the operation of the system focuses on the technical manual for Japan products of foreign companies. 一年後には月間一万ページの体制を整える。 Establish a system of monthly one million pages after one year. <0015> 開発したシステムはTDMS。 <0015> The developed system TDMS. 英文の技術マニュアルを対象に運用開始し、米国の電子部品、通信機メーカー数社から受注している。 And the start of operation to target the technical manuals in English, the United States of electronic components, has received an order from the communication machine manufacturers several companies. 同事業を推進するため、 In order to promote the same business,
このほど専門セクションの「機械翻訳部」を設置した。 It was established the "machine translation" of the professional section recently. <0016> 同システムでは、英文の原稿をフロッピーディスクなどの磁気媒体で受け取り、書式を設定する事前前編集から翻訳、版下制作などの一連の作業をコンピュータで処理する。 <0016> in the same system, receives a document in English in a magnetic medium such as a floppy disk, the translation from the pre-before editing that you want to format, to process a series of work in the computer, such as a block copy production. 人間による翻訳作業はほとんど排除して、機械が翻訳できなかった箇所をチェックしたり、自然な日本語にするためのリライト部分に翻訳者が手を加えるだけにした。 Human translation work almost to the exclusion, or check the location where the machine can not be translated, the translator to rewrite part of the order to natural Japanese was only added to the hand. <0017> 翻訳者一人が一ヶ月かかる仕事を機械翻訳だと四時間で済むという。 <0017> translator one person's machine translation and it takes one month work and that requires only four hours. マニュアルの中の数字や単位など訳す必要のない部分には手を加えず、日本語化の際にデータの入力ミスを防いでいる。 Without touching the numbers and the part that does not need to translate such unit in the manual, which prevents input errors of the data at the time of the Japanese localization. また、原文の印刷スタイルも日本語にしてそのまま再現できる。 In addition, it can be reproduced as also print style of the original text to Japanese. 」(以下略;日本経済新聞1991年7月1日の記事より)利用者は表示部1 "(Following abbreviation; than the articles of the Nihon Keizai Shimbun July 1, 1991) the user display section 1
に表示されている上記文章を見ながらアンダラインで示された箇所を入力部2によりマークしたものとする。 While watching the text displayed on the assumed marked by the input unit 2 a portion indicated by underlining. 文切り出し部3は、利用者によるマークの入力契機として文の切り出しを開始する。 Sentence cut-out section 3, to start a cut-out of the sentence as input opportunity of the mark by the user. 例えば、第1行の「機械翻訳」のマークに対しては、図2の流れ図に従って、まず前方へ文の境界を探しにいき、文章の先頭に至るので、 For example, for a mark of the first row "machine translation", in accordance with the flow diagram of FIG. 2, I went to look for the boundaries of the sentence to the front first, because the lead at the beginning of the sentence,
文章の先頭、すなわち「製品の取扱説明書…」を文の開始位置Sとする。 The beginning of the sentence, that is, the starting position S of the statement "Product of the instruction manual ...". 次いで後方へ文と文の境界を探しにいき、2行目半ばの「…作業行程で導入した。」の句点が境界となるのでここを文の終了位置Eとする。 Then went to look for the boundaries of the sentence and the sentence to the rear, "it was introduced in ... working stroke." Of the mid-second line period of the end position E of here because the boundary statement. このようにしてマークされた語句を含む1文を順に切り出していく。 It will cut out the one sentence containing such phrases are marked in the order. <0018> 単位文検出部5では、文切り出し部3で切り出された文を対象として、図3の流れ図に従って単位文の抽出を行なう。 <0018> in the unit sentence detecting unit 5, as a target the excised statement sentence extracting unit 3, the extraction unit sentence in accordance with the flow chart of FIG 3. まず、切り出された文の自然言語解析を行ない、文の構造を決定する。 First, perform the natural language analysis of the cut-out sentence to determine the sentence structure. 図4は、この解析によって得られる文の構造の例を示している。 Figure 4 shows an example of a structure of the sentence obtained by the analysis. この構造によって得られる1つの述語を中心とするまとまりを単位文として図5(1),(2)のような各単位文の範囲を決定し、単位文中に利用者によりマークされた語句を含むものを順に抽出する。 Figure 5 cohesiveness around one predicate obtained by this structure as a unit statement (1), including phrases such the scope of the decided each unit statement marked by the user to the unit statement as (2) to extract things in order. この例では「機械翻訳」の部分にマークがあるので、述語“実用化する”を中心とするまとまり「製品の取扱説明書作成大手の十印は英文マニュアルを日本語に直す機械翻訳システムを実用化し」の部分が抽出される。 In this example, since there is a mark on the part of the "machine translation", predicate Jushirushi of unity centered on the "practical use is of" "product instruction manual create major practical machine translation system to fix the English manual in Japanese part oak "is extracted. このようにして次のような要約文生成用データが得られる。 Thus summary generation data as follows is obtained. これらは記憶部4に格納された後、 After these are stored in the storage unit 4,
出力部7により出力される。 It is output by the output unit 7. <0019> 要約文作成データ 製品の取扱説明書作成の大手の十印は英文マニュアルを日本文に直す機械翻訳システムを実用化した。 <0019> Jushirushi of leading the instruction manual creation of the summary statement creating data products were put to practical use the machine translation system to fix the English manual in Japan statement. 人手に比べ納期が半減するうえ、翻訳レベルも一定になる。 Terms of delivery time compared to manual is reduced by half, the translation level is also constant.
一年後には月間一万ページの体制を整える。 Establish a system of monthly one million pages after one year. 開発したシステムはTDMS。 The developed system TDMS. 英文の技術マニュアルを対象に運用開始した。 It was the start of operation to target the English of technical manuals. 米国の電子部品、通信機メーカー数社から受注している。 The United States of electronic components, has received an order from the communication machine manufacturers several companies. 翻訳者一人が一ヶ月かかる仕事を機械翻訳だと四時間で済むという。 It machine translation one person translator takes one month work and that requires only four hours. <0020> これらの要約文作成用データは、利用者がマークした文字や語句を含む必要最低限の要素から構成される文であるので、これらを適宜組み合わせることにより、次のような要約文を利用者が容易に作成することができる。 <0020> data for creating these summary, since it is composed of statements from minimum element including characters or phrases that the user has marked, by combining these appropriately, a summary statement: it is possible for the user to easily create. この例では、のシステム名との「技術マニュアル」に着目して、この2文にに組み合わせて表現し、その他の文の順序を前後させている。 In this example, by focusing on the "Technical Manual" of the system name of, and representation in combination with this two sentences, which is before and after the order of the other statements. <0021> 要約文の作成例 「製品の取扱説明書作成の大手の十印は英文マニュアルを日本文に直す機械翻訳システム「TDMS」を実用化した。 <0021> Jushirushi Example of creating a "product of the instruction manual to create giant summary statement was put to practical use the machine translation system" TDMS "to fix the English manual in Japan statement. 米国の電子部品、通信機メーカー数社から受注している。 The United States of electronic components, has received an order from the communication machine manufacturers several companies. 翻訳者一人が一ヶ月かかる仕事を機械翻訳だと四時間で済むという。 It machine translation one person translator takes one month work and that requires only four hours. 人手に比べ納期が半減するうえ、 Terms of delivery time compared to manual is reduced by half,
翻訳レベルも一定になる。 The level of translation is also constant. 一年後には月間一万ページの体制を整える。 Establish a system of monthly one million pages after one year. 」」 ------------------------------------- "" -------------------------------------

【0154】このような入力文書例において、「実施例」について以下の部分が抽出される。 [0154] In such an input document example, the "Examples" The following parts are extracted.

【0155】<抽出文書の例> ------------------------------------- <実施例> <0012> 表示部1は例えばCRTディスプレイで、記憶部4に記憶されている文章を表示する。 [0155] <Example of the extraction document> ------------------------------------- <Example> <0012> display unit 1 in the CRT display for example, to display the text stored in the storage unit 4. 入力部2はマウス、タッチキーなどで、利用者は表示部1に表示されている文章を見ながら、重要だと思われる文字や語句を入力部2を用いてマーク(位置指定)する。 Input unit 2 mouse, and the like touch keys, the user while viewing the text that is displayed on the display unit 1, to mark (position designation) using the input unit 2 characters or phrases that are considered to be important. 文切り出し部3 Sentence cut-out section 3
は、図2に示すように、マークから文章の先頭方向へ向かって文と文の境界を探し、その位置を「S」とし(ステップ11)、次にマークから文章の末尾方向へ向かって文と文の境界を探し、その位置を「E」として(ステップ12)、最後にSからEまでの範囲を1文として切り出す。 As shown in FIG. 2, looking for sentence boundaries and statements toward the mark to the top direction of the sentence, the position is "S" (step 11), and then toward the mark to the end direction of the text sentence and looking for sentence boundaries, cutting out the position as "E" (step 12), and finally the range of from S to E as one sentence. (ステップ13)。 (Step 13). 単位文検出部5は図3に示すように、文切り出し部3で切り出された文を解析用辞書6を用いて自然言語解析し(参考文献:長尾真監修「日本語情報処理」(電子通信学会,1985))(ステップ21)、1 The unit sentence detecting unit 5 as shown in FIG. 3, and natural language analysis using an analysis dictionary 6 excised statement sentence extraction unit 3 (reference: Nagao supervision "Japanese Information Processing" (Electronic Communication Society, 1985)) (step 21), 1
つの述語を中心とするまとまりである単位文の範囲を決定し(ステップ22)、マークされた文字や語句を含む単位文を検出し、記憶部4に格納する(ステップ23)。 One of the predicate to determine the range of the unit statement is unity around the (step 22), detects the unit statement containing the marked letters and words, is stored in the storage unit 4 (step 23). 出力部7は、例えばプリンタで、全てのマークについて文切り出し部3と単位文検出部5による処理が終了すると、 The output unit 7, for example a printer, when the process by the sentence extracting unit 3 and the unit sentence detecting unit 5 for all marks ends,
記憶部4に格納されている全ての単位文を文章要約の元となる要約文作成用データとして出力する。 Outputs all unit statements stored in the storage unit 4 as the underlying summary creation data sentence summary. ------------------------------------- -------------------------------------

【0156】以上説明した重要文抽出装置1によれば、 [0156] According to the important sentence extraction device 1 described above,
入力文書中のもっとも重要な個所の表現を解析し、重要単語を保持し、他の構成要素については、その重要単語を特定の形で含むかどうかで当該他の構成要素の重要度を判定するので、より重要度の高い部分だけを特定することができる。 Analyzing the representation of the most important points in the input document, and retains the important words, for the other components, it determines the importance of the other elements in whether to include the key word in a particular manner since, it is possible to identify only the portion of high more importance.

【0157】 [0157]

【発明の効果】請求項1に記載の発明は、文書の構造の種類に応じて適切に重要文を抽出することができる。 Effects of the Invention According to one aspect of the present invention can be extracted appropriately important sentences in accordance with the type of structure of the document.

【0158】請求項2に記載の発明は、請求項1に記載の重要文抽出装置において、文書構造を明示する表現の有無により文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0158] According to a second aspect of the invention, the sentence extraction device according to claim 1, identifies the type of structure of the document the presence or absence of manifest represents the document structure, extracting the appropriate key sentences can.

【0159】請求項3に記載の発明は、請求項1または2に記載の重要文抽出装置において、文書の長さで文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0159] According to a third aspect of the invention, can be in the sentence extraction device according to claim 1 or 2, it identifies the type of structure of the document in the document length, and extracts the appropriate key sentences .

【0160】請求項4に記載の発明は、文書タイプに応じて適切に重要文の抽出をすることができる。 [0160] According to a fourth aspect of the invention, it is possible to properly extract the important sentences in accordance with the document type.

【0161】請求項5に記載の発明は、請求項4に記載の重要文抽出装置において、文書中の重要でない個所をテーブルに規定することで、その他の部分については漏らさずに抽出することを可能とし、重要である可能性がある個所は落とさずに抽出することができる。 [0161] The invention described in claim 5 is the sentence extraction device according to claim 4, by defining a non-critical point in the document on the table, to extract without leaking the other parts possible and then, locations that may be important can be extracted without loss.

【0162】請求項6に記載の発明は、請求項4に記載の重要文抽出装置において、重要度によって多段階に文書中の重要個所を特定することができる。 [0162] The invention described in claim 6 is the sentence extraction device according to claim 4, it is possible to identify key points in the document at multiple stages importance.

【0163】請求項7に記載の発明は、請求項4に記載の重要文抽出装置において、対象文書中で重要個所として特定した部分の他にそれと関係する部分を必要に応じて特定することが可能となり、文書を効率的に読み進めることができる。 [0163] The invention described in claim 7 is the sentence extraction device according to claim 4, be determined as needed parts related with it to another particular portion as an important point in the target document possible and will, it can proceed to read the document efficiently.

【0164】請求項8に記載の発明は、請求項7に記載の重要文抽出装置において、重要個所を追加で特定し、 [0164] The invention according to claim 8, in sentence extraction device according to claim 7, identified an additional important point,
または、特定する個所を増加する際に、関係名を手がかりとして所望の個所を特定することができる。 Or, when increasing the point of identifying can identify the desired location a relationship name as a clue.

【0165】請求項9に記載の発明は、請求項6に記載の重要文抽出装置において、文書中の重要度が比較的高い個所の表現を解析し、それによって他の部分の重要度を判定することで、より重要度の高い部分だけを文書中で特定することができる。 [0165] The invention according to claim 9, in sentence extraction device according to claim 6, analyzes the representation of importance is relatively high location in the document, thereby determining the importance of the other part it is, it is possible to identify only a document in a higher degree of importance part.

【0166】請求項10に記載の発明は、文書の構造の種類に応じて適切に重要文を抽出することができる。 [0166] The invention of claim 10 is able to extract the appropriate key sentences according to the type of structure of the document.

【0167】請求項11に記載の発明は、請求項10に記載の重要文抽出方法において、文書構造を明示する表現の有無により文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0167] The invention according to claim 11, in the sentence extraction method according to claim 10, identifies the type of structure of the document the presence or absence of manifest represents the document structure, extracting the appropriate key sentences can.

【0168】請求項12に記載の発明は、請求項10または11に記載の重要文抽出方法において、前記テーブルは、文書の長さを用いて前記文書構造の種類を表現している。 [0168] The invention according to claim 12, in the sentence extraction method according to claim 10 or 11, wherein the table expresses the type of the document structure with the length of the document.

【0169】したがって、文書の長さで文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0169] Therefore, to identify the type of structure of the document in the document length, it can be extracted appropriately important sentences.

【0170】請求項13に記載の発明は、所定の記憶装置に記憶されていて文書のタイプと当該タイプである文書中の部分の重要性の有無とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程を含んでなる重要文抽出方法である。 [0170] The invention according to claim 13, referring to the table describing in association with the presence or absence of the importance of the portion of the document is a type and the type of document being stored in a predetermined storage device to a sentence extraction process comprising key position identification step to identify key points in the document of interest.

【0171】したがって、文書タイプに応じて適切に重要文の抽出をすることができる。 [0171] Thus, it is possible to properly extract the important sentences in accordance with the document type.

【0172】請求項14に記載の発明は、請求項13に記載の重要文抽出方法において、前記テーブルは、文書中の非重要個所の要件を記述していて、前記重要個所特定工程は、前記テーブルを参照して対象となる文書中で前記非重要個所の要件に該当する部分以外の部分を前記重要個所として特定する。 [0172] The invention according to claim 14, in sentence extraction method according to claim 13, wherein the table is not describe the requirements for non-critical point in the document, the key position identification step, the identifying a portion other than the portion corresponding to the requirements of the non-critical point in the document in which the target by referring to the table as the critical point.

【0173】したがって、文書中の重要でない個所をテーブルに規定することで、その他の部分については漏らさずに抽出することを可能とし、重要である可能性がある個所は落とさずに抽出することができる。 [0173] Therefore, by defining a non-critical point in the document on the table, make it possible to extract without leaking the other parts, to be extracted without reducing points which may be important is it can.

【0174】請求項15に記載の発明は、請求項13に記載の重要文抽出方法において、前記テーブルは、文書中の重要個所の要件を記述し、かつ、この各要件の重要度の大きさを記述していて、前記重要個所特定工程は、 [0174] The invention according to claim 15, in sentence extraction method according to claim 13, wherein the table is to describe the requirements of important points in the document, and the magnitude of the importance of each requirement have describing the critical position identification step,
前記テーブルを参照し前記重要度の大きさを付して対象となる文書中で前記重要個所を特定する。 Identifying the critical points in the document in which the target are given the magnitude of the importance degree by referring to the table.

【0175】したがって、重要度によって多段階に文書中の重要個所を特定することができる。 [0175] Thus, it is possible to identify key points in the document at multiple stages importance.

【0176】請求項16に記載の発明は、請求項13に記載の重要文抽出方法において、前記テーブルは、文書中の重要個所の要件を記述し、かつ、この要件間を関連付けていて、前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記関連付けに基づく前記重要個所間の関連付けを行って前記重要個所を特定する。 [0176] The invention according to claim 16, in sentence extraction method according to claim 13, wherein the table is to describe the requirements of important points in the document, and have associated between this requirement, the important position identification step performs an association between the critical point based on association the document in which the target by referring to the table to identify the critical points.

【0177】したがって、対象文書中で重要個所として特定した部分の他にそれと関係する部分を必要に応じて特定することが可能となり、文書を効率的に読み進めることができる。 [0177] Thus, it is possible to specify as needed in addition to a portion related to that particular portion as an important point in the target document can proceed to read the document efficiently.

【0178】請求項17に記載の発明は、請求項16に記載の重要文抽出方法において、前記テーブルは、前記関連付けの関係名を記述していて、前記重要個所特定工程は、前記関連付けを行って前記重要個所の特定を行う際に前記関係名も関連付ける。 [0178] The invention according to claim 17, in sentence extraction method according to claim 16, wherein the table is not describe the relation name of the association, the critical position identification step, performing the association the relationship name when performing certain of the important points Te also associate.

【0179】したがって、重要個所を追加で特定し、または、特定する個所を増加する際に、関係名を手がかりとして所望の個所を特定することができる。 [0179] Therefore, to identify an additional important point, or, when increasing the point of identifying can identify the desired location a relationship name as a clue.

【0180】請求項18に記載の発明は、請求項15に記載の重要文抽出方法において、前記テーブルは、前記要件に対応させて当該要件を具備する個所の記載に関する条件を記述していて、前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記重要度が比較的大きい前記要件を具備する個所を前記重要個所として特定し、また、この特定した重要個所から前記重要度が比較的大きい前記条件に合致する部分を探し、前記対象となる文書中で前記重要度が比較的小さい前記要件を具備する部分で前記合致する部分が出現するものも前記重要個所として特定する。 [0180] The invention according to claim 18, in sentence extraction method according to claim 15, wherein the table is not describe a condition relating to the description of point comprising the requirement in correspondence with the requirements, the key position identification step identifies the location where the importance degree of the document in which the target by referring to the table comprises a relatively large the requirements as the critical point, also, the importance of the identified critical points There locate the portion that matches the larger the condition, the severity document in which the said object is relatively small the requirements the matching portion at a portion that includes also identified as the key point that appears.

【0181】したがって、文書中の重要度が比較的高い個所の表現を解析し、それによって他の部分の重要度を判定することで、より重要度の高い部分だけを文書中で特定することができる。 [0181] Thus, to analyze the expression of importance is relatively high location in the document, thereby by determining the importance of the other part, be determined only by a document in the higher degree of importance part it can.

【0182】請求項19に記載の発明は、所定の記憶装置に記憶されていて文書構造の種類と当該構造を有する文書中の部分の重要度とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程をコンピュータに実行させるプログラムを記憶したコンピュータに読み取り可能な記憶媒体である。 [0182] The invention according to claim 19 refers to the table that describes in association with severity of portions of the document with the type and the structure of the document structure is stored in a predetermined storage device Te is a storage medium readable to a computer which stores a program for executing a critical position identification step to identify key points in the document of interest to the computer.

【0183】したがって、文書の構造の種類に応じて適切に重要文を抽出することができる。 [0183] Thus, it is possible to extract the appropriate key sentences according to the type of structure of the document.

【0184】請求項20に記載の発明は、請求項19に記載の記憶媒体において、前記テーブルとして、文書構造を明示する表現の有無を用いて前記文書構造の種類を表現しているものを用いる。 [0184] The invention according to claim 20, in the storage medium of claim 19, as the table, using those representing the type of the document structure with the presence of demonstrating represents the document structure .

【0185】したがって、文書構造を明示する表現の有無により文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0185] Therefore, to identify the type of structure of the document the presence or absence of manifest represents the document structure, it is possible to extract the appropriate key sentences.

【0186】請求項21に記載の発明は、請求項19または20に記載の重要文抽出方法において、前記テーブルとして、文書の長さを用いて前記文書構造の種類を表現しているものを用いる。 [0186] The invention according to claim 21, in sentence extraction method according to claim 19 or 20, as the table, using those representing the type of the document structure with the length of the document .

【0187】したがって、文書の長さで文書の構造の種類を特定し、適切に重要文を抽出することができる。 [0187] Therefore, to identify the type of structure of the document in the document length, it can be extracted appropriately important sentences.

【0188】請求項22に記載の発明は、所定の記憶装置に記憶されていて文書のタイプと当該タイプである文書中の部分の重要性の有無とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程をコンピュータに実行させるプログラムを記憶したコンピュータに読み取り可能な記憶媒体である。 [0188] The invention according to claim 22, referring to the table describing in association with the presence or absence of the importance of the portion of the document is a type and the type of document being stored in a predetermined storage device to a storage medium readable to a computer which stores a program for executing a critical position identification step to identify key points in the document of interest to the computer.

【0189】したがって、文書タイプに応じて適切に重要文の抽出をすることができる。 [0189] Thus, it is possible to properly extract the important sentences in accordance with the document type.

【0190】請求項23に記載の発明は、請求項22に記載の記憶媒体において、前記テーブルとして、文書中の非重要個所の要件を記述しているものを用い、前記重要個所特定工程は、前記テーブルを参照して対象となる文書中で前記非重要個所の要件に該当する部分以外の部分を前記重要個所として特定する。 [0190] The invention according to claim 23, in the storage medium of claim 22, as the table, used as describing the requirements for non-critical point in the document, the key position identification step, identifying a portion other than the portion corresponding to the requirements of the non-critical point in the document in which the target by referring to the table as the critical point.

【0191】したがって、文書中の重要でない個所をテーブルに規定することで、その他の部分については漏らさずに抽出することを可能とし、重要である可能性がある個所は落とさずに抽出することができる。 [0191] Therefore, by defining a non-critical point in the document on the table, make it possible to extract without leaking the other parts, to be extracted without reducing points which may be important is it can.

【0192】請求項24に記載の発明は、請求項22に記載の記憶媒体において、前記テーブルとして、文書中の重要個所の要件を記述し、かつ、この各要件の重要度の大きさを記述しているものを用い、前記重要個所特定工程は、前記テーブルを参照し前記重要度の大きさを付して対象となる文書中で前記重要個所を特定する。 [0192] The invention according to claim 24, described in the storage medium of claim 22, as the table describes the requirements of important points in the document, and the size of the importance of each requirement used as being the critical position identification step identifies the critical points in the document in which the target are given the magnitude of the importance degree by referring to the table.

【0193】したがって、重要度によって多段階に文書中の重要個所を特定することができる。 [0193] Thus, it is possible to identify key points in the document at multiple stages importance.

【0194】請求項25に記載の発明は、請求項22に記載の記憶媒体において、前記テーブルとして、文書中の重要個所の要件を記述し、かつ、この要件間を関連付けているものを用い、前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記関連付けに基づく前記重要個所間の関連付けを行って前記重要個所を特定する。 [0194] The invention according to claim 25, in the storage medium of claim 22, as the table describes the requirements of important points in the document, and using those associated between this requirement, the key position identification step identifies the critical point associated with performing between said critical points based on associating the document in which the target by referring to the table.

【0195】したがって、対象文書中で重要個所として特定した部分の他にそれと関係する部分を必要に応じて特定することが可能となり、文書を効率的に読み進めることができる。 [0195] Thus, it is possible to specify as needed in addition to a portion related to that particular portion as an important point in the target document can proceed to read the document efficiently.

【0196】請求項26に記載の発明は、請求項25に記載の記憶媒体において、前記テーブルとして、前記関連付けの関係名を記述しているものを用い、前記重要個所特定工程は、前記関連付けを行って前記重要個所の特定を行う際に前記関係名も関連付ける。 [0196] The invention according to claim 26, in the storage medium of claim 25, as the table, used as describing the relationship name of the association, the critical position identification step, the association performed also associates the relationship name when performing certain of the important points.

【0197】したがって、重要個所を追加で特定し、または、特定する個所を増加する際に、関係名を手がかりとして所望の個所を特定することができる。 [0197] Therefore, to identify an additional important point, or, when increasing the point of identifying can identify the desired location a relationship name as a clue.

【0198】請求項27に記載の発明は、請求項24に記載の記憶媒体において、前記テーブルとして、前記要件に対応させて当該要件を具備する個所の記載に関する条件を記述しているものを用い、前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記重要度が比較的大きい前記要件を具備する個所を前記重要個所として特定し、また、この特定した重要個所から前記重要度が比較的大きい前記条件に合致する部分を探し、 [0198] The invention according to claim 27, in the storage medium of claim 24, as the table in correspondence with the requirements with those describing the condition relating to the description of point comprising the requirements the key position identification step identifies the location having a level of importance is relatively large the requirements document in which the target by referring to the table as the critical point, also, important from said the identified critical points locate the portion degrees matches the larger the condition,
前記対象となる文書中で前記重要度が比較的小さい前記要件を具備する部分で前記合致する部分が出現するものも前記重要個所として特定する。 Wherein said importance in the document of interest is the matching portion at a portion having a relatively small the requirements also identified as the key point that appears.

【0199】したがって、文書中の重要度が比較的高い個所の表現を解析し、それによって他の部分の重要度を判定することで、より重要度の高い部分だけを文書中で特定することができる。 [0199] Thus, to analyze the expression of importance is relatively high location in the document, thereby by determining the importance of the other part, be determined only by a document in the higher degree of importance part it can.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】この発明の実施の形態である重要文抽出装置の機能ブロック図である。 1 is a functional block diagram of a sentence extraction apparatus according to an embodiment of the present invention.

【図2】前記重要文抽出装置の電気的な接続を示すブロック図である。 2 is a block diagram showing an electrical connection of the sentence extraction device.

【図3】この発明の実施の形態1である重要文抽出装置の文書構造情報重要度テーブルの説明図である。 Figure 3 is an illustration of the document structure information importance level table of sentence extraction device according to the first embodiment of the present invention.

【図4】前記重要文抽出装置の文書解析部の処理を説明するフローチャートである。 4 is a flowchart for explaining the processing of the document analysis unit of the sentence extraction device.

【図5】この発明の実施の形態2である重要文抽出装置の文書構造情報重要度テーブルの説明図である。 5 is an explanatory diagram of the document structure information importance level table of sentence extraction apparatus according to a second embodiment of the present invention.

【図6】前記重要文抽出装置の文書解析部の処理を説明するフローチャートである。 6 is a flowchart for explaining the processing of the document analysis of the sentence extraction device.

【図7】この発明の実施の形態3である重要文抽出装置の文書構造情報重要度テーブルの説明図である。 7 is an explanatory view of the document structure information importance level table of sentence extraction apparatus according to a third embodiment of the present invention.

【図8】前記重要文抽出装置の文書解析部の処理を説明するフローチャートである。 8 is a flowchart for explaining the processing of the document analysis of the sentence extraction device.

【図9】この発明の実施の形態4である重要文抽出装置の文書構造情報重要度テーブルの説明図である。 9 is an explanatory view of the document structure information importance level table of sentence extraction apparatus according to a fourth embodiment of the present invention.

【図10】前記重要文抽出装置の文書解析部の処理を説明するフローチャートである。 10 is a flowchart for explaining the processing of the document analysis unit of the sentence extraction device.

【図11】この発明の実施の形態5である重要文抽出装置の文書構造情報重要度テーブルの説明図である。 11 is an explanatory view of the document structure information importance level table of sentence extraction device according to the fifth embodiment of the present invention.

【図12】この発明の実施の形態6である重要文抽出装置の文書構造情報重要度テーブルの説明図である。 12 is an explanatory view of the document structure information importance level table of sentence extraction apparatus according to a sixth embodiment of the present invention.

【図13】この発明の実施の形態7である重要文抽出装置の文書構造情報重要度テーブルの説明図である。 13 is an illustration of the document structure information importance level table of sentence extraction device according to a seventh embodiment of the present invention.

【符号の説明】 DESCRIPTION OF SYMBOLS

1 重要文抽出装置 2 重要個所特定手段 3 テーブル 13 記憶手段、記憶装置 15 記憶手段、記憶装置 1 key sentence extraction device 2 key position identification means 3 Table 13 storage unit, memory device 15 storage means, the storage device

Claims (27)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 文書構造の種類と当該構造を有する文書中の部分の重要性の有無とを対応付けて記述しているテーブルを記憶する記憶手段と、 前記テーブルを参照して対象となる文書中の重要個所を特定する重要個所特定手段と、を備えている重要文抽出装置。 1. A storage means for storing a table describing correspondence between the presence or absence of the importance of the portion of the document with the type and the structure of the document structure, the document of interest by referring to the table sentence extraction device comprising a the importance position identification unit to identify key points in the.
  2. 【請求項2】 前記テーブルは、文書構造を明示する表現の有無を用いて前記文書構造の種類を表現している請求項1に記載の重要文抽出装置。 Wherein said table, sentence extraction device according to claim 1 which expresses the type of the document structure with the presence of demonstrating represents the document structure.
  3. 【請求項3】 前記テーブルは、文書の長さを用いて前記文書構造の種類を表現している請求項1または2に記載の重要文抽出装置。 Wherein the table, sentence extraction device according to claim 1 or 2 expresses the type of the document structure with the length of the document.
  4. 【請求項4】 文書のタイプと当該タイプである文書中の部分の重要性の有無とを対応付けて記述しているテーブルを記憶する記憶手段と、 前記テーブルを参照して対象となる文書中の重要個所を特定する重要個所特定手段と、を備えている重要文抽出装置。 4. A storage means for storing a table describing correspondence between the presence or absence of the importance of the portion of the document is a type and the type of document, the document in which the target by referring to the table sentence extraction device comprising a the importance position identification unit to identify key points of the.
  5. 【請求項5】 前記テーブルは、文書中の非重要個所の要件を記述していて、 前記重要個所特定手段は、前記テーブルを参照して対象となる文書中で前記非重要個所の要件に該当する部分以外の部分を前記重要個所として特定する請求項4に記載の重要文抽出装置。 Wherein said table is not describe the requirements for non-critical point in the document, the key position identification means, corresponding to the requirements of the non-critical point in the document in which the target by referring to the table key sentence extraction device according except portions to claim 4 identified as the key point to.
  6. 【請求項6】 前記テーブルは、文書中の重要個所の要件を記述し、かつ、この各要件の重要度の大きさを記述していて、 前記重要個所特定手段は、前記テーブルを参照し前記重要度の大きさを付して対象となる文書中で前記重要個所を特定する請求項4に記載の重要文抽出装置。 Wherein said table describes a requirement of important points in the document, and not describe the size of the importance of each requirement, the important point specifying unit, by referring to the said table key sentence extraction device according to claim 4 for identifying the important points in the document in which the target are given the magnitude of importance.
  7. 【請求項7】 前記テーブルは、文書中の重要個所の要件を記述し、かつ、この要件間を関連付けていて、 前記重要個所特定手段は、前記テーブルを参照し対象となる文書中で前記関連付けに基づく前記重要個所間の関連付けを行って前記重要個所を特定する請求項4に記載の重要文抽出装置。 Wherein said table describes a requirement of important points in the document, and have associated between this requirement, the important point specifying unit, the association with the document in which the target by referring to the table key sentence extraction device according to claim 4, wherein performing the association between critical points wherein to identify key points based on.
  8. 【請求項8】 前記テーブルは、前記関連付けの関係名を記述していて、 前記重要個所特定手段は、前記関連付けを行って前記重要個所の特定を行う際に前記関係名も関連付ける請求項7に記載の重要文抽出装置。 Wherein said table is not describe the relation name of the association, the critical position identification means, the relationship name is also associated Claim 7 when performing the key position identification by performing the association important sentence extraction device as claimed.
  9. 【請求項9】 前記テーブルは、前記要件に対応させて当該要件を具備する個所の記載に関する条件を記述していて、 前記重要個所特定手段は、前記テーブルを参照し対象となる文書中で前記重要度が比較的大きい前記要件を具備する個所を前記重要個所として特定し、また、この特定した重要個所から前記重要度が比較的大きい前記条件に合致する部分を探し、前記対象となる文書中で前記重要度が比較的小さい前記要件を具備する部分で前記合致する部分が出現するものも前記重要個所として特定する請求項6に記載の重要文抽出装置。 Wherein said table is not in correspondence with the requirements described conditions regarding the description of locations comprising the requirements, the important position identification means, the document in which the target by referring to the table identify locations comprising the importance is relatively large the requirements as the critical point, also look for parts that match the importance is relatively large the condition from the specified critical point, the document in which the said target in key sentence extraction device according to claim 6 also be specified as the key point that the importance to the match in the portion having a relatively small the requirements moiety appears.
  10. 【請求項10】 所定の記憶装置に記憶されていて文書構造の種類と当該構造を有する文書中の部分の重要度とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程を含んでなる重要文抽出方法。 10. Referring to table describing in association with severity of portions of the document with the type and the structure of the document structure is stored in a predetermined storage device, a document in which the target sentence extraction process comprising key point specifying step of specifying the important point of the.
  11. 【請求項11】 前記テーブルは、文書構造を明示する表現の有無を用いて前記文書構造の種類を表現している請求項10に記載の重要文抽出方法。 Wherein said table, sentence extraction method according to claim 10 which expresses the type of the document structure with the presence of demonstrating represents the document structure.
  12. 【請求項12】 前記テーブルは、文書の長さを用いて前記文書構造の種類を表現している請求項10または1 12. The table according to claim expresses the type of the document structure with the length of the document 10 or 1
    1に記載の重要文抽出方法。 Key sentence extraction method described in 1.
  13. 【請求項13】 所定の記憶装置に記憶されていて文書のタイプと当該タイプである文書中の部分の重要性の有無とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程を含んでなる重要文抽出方法。 13. Referring to table describing in association with the presence or absence of the importance of the portion of the document is a type and the type of document being stored in a predetermined storage device, a target document sentence extraction process comprising key position identification step to identify key points in the.
  14. 【請求項14】 前記テーブルは、文書中の非重要個所の要件を記述していて、 前記重要個所特定工程は、前記テーブルを参照して対象となる文書中で前記非重要個所の要件に該当する部分以外の部分を前記重要個所として特定する請求項13に記載の重要文抽出方法。 14. The table is not describe the requirements for non-critical point in the document, the key position identification step, corresponding to the requirements of the non-critical point in the document in which the target by referring to the table important sentence extraction method according to claim 13 for identifying the portion other than the portion as the important point to.
  15. 【請求項15】 前記テーブルは、文書中の重要個所の要件を記述し、かつ、この各要件の重要度の大きさを記述していて、 前記重要個所特定工程は、前記テーブルを参照し前記重要度の大きさを付して対象となる文書中で前記重要個所を特定する請求項13に記載の重要文抽出方法。 15. The table describes the requirements of important points in the document, and not describe the size of the importance of each requirement, the important point specifying step refers to said table the important sentence extraction method according to claim 13 for identifying the key points in the document in which the target are given the magnitude of importance.
  16. 【請求項16】 前記テーブルは、文書中の重要個所の要件を記述し、かつ、この要件間を関連付けていて、 前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記関連付けに基づく前記重要個所間の関連付けを行って前記重要個所を特定する請求項13に記載の重要文抽出方法。 16. The table describes the requirements of important points in the document, and have associated between this requirement, the important position identification step, the association with the document in which the target by referring to the table key sentence extraction method of claim 13, wherein performing the association between key points to identify the critical points based on.
  17. 【請求項17】 前記テーブルは、前記関連付けの関係名を記述していて、前記重要個所特定工程は、前記関連付けを行って前記重要個所の特定を行う際に前記関係名も関連付ける請求項16に記載の重要文抽出方法。 17. The table is not describe the relation name of the association, the critical position identification step, the relationship name is also associated claim 16 in performing the critical position identification by performing the association important sentence extraction method described.
  18. 【請求項18】 前記テーブルは、前記要件に対応させて当該要件を具備する個所の記載に関する条件を記述していて、 前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記重要度が比較的大きい前記要件を具備する個所を前記重要個所として特定し、また、この特定した重要個所から前記重要度が比較的大きい前記条件に合致する部分を探し、前記対象となる文書中で前記重要度が比較的小さい前記要件を具備する部分で前記合致する部分が出現するものも前記重要個所として特定する請求項15に記載の重要文抽出方法。 18. The table is not in correspondence with the requirements described conditions regarding the description of locations comprising the requirements, the important position identification step, the document in which the target by referring to the table identify locations comprising the importance is relatively large the requirements as the critical point, also look for parts that match the importance is relatively large the condition from the specified critical point, the document in which the said target key sentence extraction method of claim 15 wherein the importance to the match in the portion having a relatively small the requirements portion also be identified as the key point that appears in.
  19. 【請求項19】 所定の記憶装置に記憶されていて文書構造の種類と当該構造を有する文書中の部分の重要度とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程をコンピュータに実行させるプログラムを記憶したコンピュータに読み取り可能な記憶媒体。 19. Referring to table describing in association with severity of portions of the document with the type and the structure of the document structure is stored in a predetermined storage device, a document in which the target readable storage medium in a computer which stores a program for executing the critical point specifying step of specifying the computer key point of the.
  20. 【請求項20】 前記テーブルとして、文書構造を明示する表現の有無を用いて前記文書構造の種類を表現しているものを用いる請求項19に記載の記憶媒体。 20. As the table storage medium of claim 19 to use those that represent the type of the document structure with the presence of demonstrating represents the document structure.
  21. 【請求項21】 前記テーブルとして、文書の長さを用いて前記文書構造の種類を表現しているものを用いる請求項19または20に記載の重要文抽出方法。 21. As the table, sentence extraction method according to claim 19 or 20 used those representing the type of the document structure with the length of the document.
  22. 【請求項22】 所定の記憶装置に記憶されていて文書のタイプと当該タイプである文書中の部分の重要性の有無とを対応付けて記述しているテーブルを参照して、対象となる文書中の重要個所を特定する重要個所特定工程をコンピュータに実行させるプログラムを記憶したコンピュータに読み取り可能な記憶媒体。 22. Referring to table describing in association with the presence or absence of the importance of the portion of the document is a type and the type of document being stored in a predetermined storage device, a target document readable storage medium in a computer which stores a program for executing the critical point specifying step of specifying the computer key points in.
  23. 【請求項23】 前記テーブルとして、文書中の非重要個所の要件を記述しているものを用い、 前記重要個所特定工程は、前記テーブルを参照して対象となる文書中で前記非重要個所の要件に該当する部分以外の部分を前記重要個所として特定する請求項22に記載の記憶媒体。 As claimed in claim 23, wherein the table used as describing the requirements for non-critical point in the document, the key position identification step, the non-critical point in the document in which the target by referring to the table storage medium according to claim 22 for identifying the portion other than that portion of the requirements as the critical point.
  24. 【請求項24】 前記テーブルとして、文書中の重要個所の要件を記述し、かつ、この各要件の重要度の大きさを記述しているものを用い、 前記重要個所特定工程は、前記テーブルを参照し前記重要度の大きさを付して対象となる文書中で前記重要個所を特定する請求項22に記載の記憶媒体。 As claimed in claim 24, wherein said table describes the requirements of important points in the document, and used as describing the magnitude of the importance of each requirement, the important position identification step, the table storage medium according to claim 22 for identifying the key points in the document in which reference of interest denoted by the magnitude of the importance.
  25. 【請求項25】 前記テーブルとして、文書中の重要個所の要件を記述し、かつ、この要件間を関連付けているものを用い、 前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記関連付けに基づく前記重要個所間の関連付けを行って前記重要個所を特定する請求項22に記載の記憶媒体。 As claimed in claim 25, wherein said table describes the requirements of important points in the document, and using those associated between this requirement, the important position identification step, reference document in which the target to the table in medium according to claim 22 for identifying the important point association performed between the critical points based on the association.
  26. 【請求項26】 前記テーブルとして、前記関連付けの関係名を記述しているものを用い、 前記重要個所特定工程は、前記関連付けを行って前記重要個所の特定を行う際に前記関係名も関連付ける請求項25に記載の記憶媒体。 As claimed in claim 26, wherein the table used as describing the relationship name of the association, the critical position identification step also associates the relationship name when performing the key position identification by performing the association claims storage medium according to claim 25.
  27. 【請求項27】 前記テーブルとして、前記要件に対応させて当該要件を具備する個所の記載に関する条件を記述しているものを用い、 前記重要個所特定工程は、前記テーブルを参照し対象となる文書中で前記重要度が比較的大きい前記要件を具備する個所を前記重要個所として特定し、また、この特定した重要個所から前記重要度が比較的大きい前記条件に合致する部分を探し、前記対象となる文書中で前記重要度が比較的小さい前記要件を具備する部分で前記合致する部分が出現するものも前記重要個所として特定する請求項24に記載の記憶媒体。 As claimed in claim 27, wherein the table used as describing the condition relating to the description of point comprising the requirement in correspondence with the requirements, the important position identification step, the reference documents of interest to the table the importance to identify the locations having a relatively large the requirements as the critical point in the middle, also look for parts that match the importance is relatively large the condition from the specified critical point, and the target storage medium of claim 24 wherein the importance to the match in the portion having a relatively small the requirements portion also be identified as the key point that appears in the document in made.
JP2000141140A 2000-05-15 2000-05-15 Important sentence extraction device, method therefor and storage medium Pending JP2001325273A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000141140A JP2001325273A (en) 2000-05-15 2000-05-15 Important sentence extraction device, method therefor and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000141140A JP2001325273A (en) 2000-05-15 2000-05-15 Important sentence extraction device, method therefor and storage medium

Publications (1)

Publication Number Publication Date
JP2001325273A true true JP2001325273A (en) 2001-11-22

Family

ID=18648300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000141140A Pending JP2001325273A (en) 2000-05-15 2000-05-15 Important sentence extraction device, method therefor and storage medium

Country Status (1)

Country Link
JP (1) JP2001325273A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012533817A (en) * 2009-07-22 2012-12-27 ファンデーションアイピー,エルエルシー How to send the query results from the electronic document collection, system and apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012533817A (en) * 2009-07-22 2012-12-27 ファンデーションアイピー,エルエルシー How to send the query results from the electronic document collection, system and apparatus

Similar Documents

Publication Publication Date Title
Casti Searching for Certainty: what science can know about the future
Klink Creating brand names with meaning: The use of sound symbolism
Bynon Historical linguistics
West Homeric Hymns. Homeric Apocrypha. Lives of Homer (Loeb Classical Library No. 496)
Earle Innovation in the food industry
Kay English loanwords in Japanese
McArthur et al. The English Languages
US6038567A (en) Method and system for propagating object properties in a desktop publishing program
US5724594A (en) Method and system for automatically identifying morphological information from a machine-readable dictionary
Burridge Syntactic change in Germanic: Aspects of language change in Germanic with particular reference to Middle Dutch
Koptjevskaja-Tamm „A piece of the cake‟ and „a cup of tea‟
US6438515B1 (en) Bitextual, bifocal language learning system
Hayes The growing inaccessibility of science
Gonzalez-Wippler Santeria: African Magic in Latin America
Nurgel et al. Sensory and chemical characteristics of Canadian ice wines
Stone et al. Successful direct marketing methods
James Cultural implications for translation
Cook et al. Eating into Britishness: multicultural imaginaries and the identity politics of food
Giraud et al. Consumers’ perception of food traceability in Europe
US20070005649A1 (en) Contextual title extraction
US20140163980A1 (en) Multimedia message having portions of media content with audio overlay
CN102346730A (en) Method and device for displaying catalog in electronic reader
Bogue et al. Market-oriented methodologies to optimise consumer acceptability of Cheddar-type cheeses
Martindale et al. The Quotable Lewis
Pendergast et al. Fashion, Costume, and Culture: Clothing, Headwear, Body Decorations, and Footwear Through the Ages; 5 Volume Set.

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040928