JPH0944497A - Title sentence preparing device - Google Patents

Title sentence preparing device

Info

Publication number
JPH0944497A
JPH0944497A JP7193426A JP19342695A JPH0944497A JP H0944497 A JPH0944497 A JP H0944497A JP 7193426 A JP7193426 A JP 7193426A JP 19342695 A JP19342695 A JP 19342695A JP H0944497 A JPH0944497 A JP H0944497A
Authority
JP
Japan
Prior art keywords
sentence
adopted
title
word
predicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7193426A
Other languages
Japanese (ja)
Inventor
Tamotsu Iwabuchi
保 岩渕
Koichiro Tsuda
好一郎 津田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maruzen KK
Original Assignee
Maruzen KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maruzen KK filed Critical Maruzen KK
Priority to JP7193426A priority Critical patent/JPH0944497A/en
Publication of JPH0944497A publication Critical patent/JPH0944497A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To automatically prepare a title sentence and to save manpower by judging whether a phrase which is possible to be adopted as a title sentence between extracted subject and predicate or not. SOLUTION: A WRITE condition decision part 17 decides as to whether each of the title sentence of the subject and predicate that a WHO discovery part 13 and a predicate discovery part 14 extract and the title sentence including the adaptable phrase that a first stage and second stage WHAT/WHERE discovery parts 15 and 16 extract can be adopted as the title sentence or not. A 40- character compression part 18 performs a number of character compression processing within 40 characters for the sentence which is made adaptable in the WRITE condition decision part 17 when this sentence exceeds 40 characters. The adaptability as the title sentence is decided by performing the dicision for the WRITE condition decision part 17 once from the predicate discovery part 14. When the title sentence is adapted, the title sentence as it is outputted when the number of character is within 40 characters. When the number of character exceeds 40 characters, a number of character compression processing is performed in the 40-character compression part 18.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、新聞記事データベ
ースシステムに提供されるタイトル文を記事本文から自
動作成する装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus for automatically creating a title sentence provided in a newspaper article database system from an article body.

【0002】[0002]

【従来の技術】このような新聞記事データベースでは、
タイトル文の字数には制限があり(40字以内)、その
字数以内で、記事本文中よりタイトル文に必要な情報を
抽出して作成する必要がある。すなわち、誰が、誰と、
どこで、なにを、どうしたという情報があるタイトル文
を作成する必要がある。
2. Description of the Related Art In such a newspaper article database,
There is a limit to the number of characters in the title sentence (up to 40 characters), and it is necessary to extract the information necessary for the title sentence from the article body within that number of letters. That is, who and who
You need to create a title sentence that has information about where and what.

【0003】従来は、これらのデータベースシステム用
のタイトル文の作成は、専門家による人手作業で行って
いた。専門家は、記事に付されている見出しを参考にし
て本文を参照しながらタイトル文を作成している。
Conventionally, the title sentences for these database systems have been manually created by experts. The expert creates the title sentence while referring to the text by referring to the headline attached to the article.

【0004】[0004]

【発明が解決しようとする課題】新聞記事の見出しは、
往々にして読者に本文を読ませることを使命にしている
ので、本文に忠実な内容ではない。また、人手を介する
場合はタイトル文を作成する専門家の個性がタイトル文
に反映する。データベースシステムでは、タイトル文
は、利用者にとって必要情報の判定をするための最も重
要な項目である。したがって、データベース情報として
のタイトル文は、本文に忠実で、しかも標準化(一定の
品質をもつ)文であることが要請される。
[Problems to be Solved by the Invention] The headline of a newspaper article is
Since it is often the mission to make the reader read the text, it is not faithful to the text. In the case of manual intervention, the personality of the expert who creates the title sentence is reflected in the title sentence. In the database system, the title sentence is the most important item for the user to judge necessary information. Therefore, the title sentence as the database information is required to be a sentence that is true to the body and is standardized (having a certain quality).

【0005】また、新聞記事データベースは、毎日発生
する多量の記事を、より短い日時でデータベース化しな
いと本来の使命を失ってしまう。このため、一定時間以
内にタイトル文を作成してデータベースへ登録する必要
がある。このような作業を人手で行うには、データベー
ス作成のために専門家を多数養成しなければならない
し、また、作業者は毎日時間に追いかけられながら、同
一の作業をしなくてはならないという苦痛を伴う。
The newspaper article database loses its original mission unless a large number of articles that occur every day are made into a database in a shorter time. Therefore, it is necessary to create a title sentence and register it in the database within a fixed time. In order to do this kind of work manually, it is necessary to train a large number of specialists for database creation, and the worker has to do the same work every day while being chased by time. Accompanied by.

【0006】本発明は、このような課題を解決するもの
で、タイトル文を記事から自動的に作成し、速やかにデ
ータベースに提供して新聞記事としての速報性を維持す
ることを目的とする。また、タイトル文を自動的に作成
することで、省力化を図り、人手によるタイトル文作成
にともなうばらつきを防止することを目的とする。
The present invention solves such a problem, and an object of the present invention is to automatically create a title sentence from an article and promptly provide it to a database so as to maintain promptness as a newspaper article. Further, another object of the present invention is to automatically create a title sentence to save labor and prevent variations caused by manually creating the title sentence.

【0007】[0007]

【課題を解決するための手段】本発明は、原記事の本文
の先頭からタイトル文作成に適合する候補原文を文単位
で抽出する候補文抽出手段と、抽出した候補原文からタ
イトル文に必要な主語を表す語句および述語を表す語句
を発見して抽出する主語および述語抽出手段と、抽出し
た語句でタイトル文として適合するか否かを判断する判
定手段と、この判定手段でタイトル文として適合すると
判断された文をタイトル文に必要な字数に圧縮する圧縮
手段とを含み、前記判定手段は、抽出した主語および述
語との間にタイトル文として採用可能な語句があるか否
かを判断する手段を含むことを特徴とする。
The present invention requires a candidate sentence extracting means for extracting a candidate original sentence suitable for creating a title sentence from the beginning of the text of an original article in sentence units, and a title sentence from the extracted candidate original sentence. A subject and predicate extraction means for discovering and extracting a phrase representing a subject and a phrase representing a predicate, a determination means for determining whether or not the extracted phrase matches as a title sentence, and a matching sentence as a title sentence by this determination means Compression means for compressing the judged sentence to the number of characters required for the title sentence, and the judging means judges whether or not there is a phrase that can be adopted as a title sentence between the extracted subject and predicate. It is characterized by including.

【0008】なお、前記判定手段で主語および述語の間
にタイトル文として採用可能な語句があると判断された
場合に、主語および述語との間に存在する文の目的語ま
たは補語を示す第一のWHAT採用語句があるか否かを
検索する第一のWHAT発見手段を備え、前記判定手段
は、この第一のWHAT発見手段で発見した第一のWH
AT採用語句と主語との間にタイトル文として採用可能
な語句があるか否かを判断する手段を含むことが好まし
い。
When the determining means determines that there is a phrase that can be used as a title sentence between the subject and the predicate, the first object indicating the object or the complement of the sentence existing between the subject and the predicate is given. A first WHAT finding means for searching whether or not there is a WHAT adoption word of, and the judging means is the first WH found by the first WHAT finding means.
It is preferable to include means for determining whether or not there is a phrase that can be adopted as a title sentence between the AT adopted phrase and the subject.

【0009】また、前記判定手段で第一のWHAT採用
語句と主語との間にタイトル文として採用可能な語句が
あると判断された場合に、主語と第一のWHAT採用語
句との間に文の目的語または補語を表す第二のWHAT
採用語句があるか否かを検索する第二のWHAT発見手
段を含むことが好ましい。
Further, when the determining means determines that there is a phrase that can be adopted as a title sentence between the first WHAT adopted word and the subject, a sentence exists between the subject and the first WHAT adopted word or phrase. Second WHAT representing the object or complement of
It is preferable to include a second WHAT discovery means for searching whether or not there is a adopted phrase.

【0010】主語および述語発見手段は、候補原文中の
主語を表す語の後につく語彙の主語採用詞を発見して主
語を抽出し、候補原文中の述語を表す語の前につく語彙
の述語採用詞を発見して述語を抽出する手段を含むこと
が好ましい。
The subject and predicate finding means finds a subject adoptive word of a vocabulary that follows the word representing the subject in the candidate original sentence, extracts the subject, and predicates the vocabulary that precedes the word representing the predicate in the candidate original sentence. It is preferable to include means for discovering a hieroglyph and extracting a predicate.

【0011】主語および述語発見手段の前段に、採用し
た候補原文中からタイトル文に不要な語句または記号を
削除する前処理手段を含むことが好ましい。
It is preferable that a pre-processing unit for deleting unnecessary words or symbols in the title sentence from the adopted candidate original sentence is preferably included in the preceding stage of the subject and predicate finding unit.

【0012】まず、ここで、本明細書で使用する語句に
ついて説明する。
First, the terms used in this specification will be described.

【0013】まず、本明細書で、文とは、文頭から句点
(。)で区切られて完結する一つのまとまった意味を終
わりまで表した一続きの文字列をいう。また、採用可能
語句(主語としてのWHO採用語句、述語採用語句、第
一WHAT採用語句、第二WHAT採用語句等)は、タ
イトル文に採用可能となる語句をいう。採用可能語句
は、次のものである。 1.漢字、カタカナ文字(符号の「ー」(長音符号)と
「・」(中黒)とを含む)、英文字、数詞で構成される
2文字以上の文字列。 2.1.の採用語句で挟まれた符号の「、」、「・」、
「−」(長い中棒)、「〜」、「&」も採用語句を構成
する語とし、採用語句+左記符号+採用語句を一連の採
用語句として一括採用する。例.中国・大連 3.符号の「」(鍵かっこ)も採用語句に含まれる。
例.「ヤマゼン」ブランド 4.クォーテーションマーク(“ ”)で囲まれた語句
は、その符号も含めて採用語句とする。例“くせ”
(これは、平仮名は1.の条件により採用可能語句に入
らないがクォーテーションマークで囲まれた場合には採
用可能語句になることを示している。) 5.送り仮名テーブル(日本新聞協会発行の新聞用語集
に準拠したもの)も採用可能語句になる。例.明らか 本発明では、まず、原記事を先頭から文単位で読み込
み、記事本文の主題を述べている文を発見してタイトル
文を作成するための候補原文を抽出する。記事は、文章
のはじめの方で、いわゆる5W1Hが述べられる逆三角
形の文章構造をしているので、文の最初から候補原文が
ないかを発見するステップを行う。この候補文抽出手段
は、タイトル文候補としては不適格である文を除外する
とともに、文中に主語採用詞および述語採用詞があるか
否かでタイトル候補文として採用してよいか否かを判定
する。
First, in the present specification, a sentence refers to a continuous character string that represents one complete meaning that is separated from the beginning of a sentence by a punctuation mark (.) And completes. Further, the adoptable words (WHO adopted words as a subject, predicate adopted words, first WHAT adopted words, second WHAT adopted words, etc.) are words that can be adopted as a title sentence. The words and phrases that can be adopted are as follows. 1. A character string of two or more characters consisting of Kanji, Katakana characters (including the signs "-" (long-sign) and "." (Middle black)), English characters, and numbers. 2.1. Codes sandwiched between the adopted words ",", "・",
"-" (Long center bar), "~", and "&" are also adopted as words constituting the adopted phrase, and the adopted phrase + the left sign + adopted phrase are collectively adopted as a series of adopted phrases. Example. Dalian, China 3. The code "" (brackets) is also included in the adopted words.
Example. "Yamazen" brand 4. Words enclosed in quotation marks (“”), including their signs, are adopted words. Example “Kuse”
(This means that hiragana is not included in the terms that can be adopted due to the condition of 1. However, if it is enclosed in quotation marks, it becomes an acceptable term.) The sending kana table (which conforms to the glossary of newspapers published by the Japan Shimbun Association) can also be adopted. Example. Obviously, in the present invention, first, the original article is read from the beginning on a sentence-by-sentence basis, a sentence that describes the subject of the article body is discovered, and candidate original sentences for creating a title sentence are extracted. Since the article has an inverted triangular sentence structure in which the so-called 5W1H is mentioned at the beginning of the sentence, the step of discovering whether there is a candidate original sentence is performed from the beginning of the sentence. This candidate sentence extraction means excludes sentences that are not qualified as title sentence candidates, and determines whether or not they can be adopted as title candidate sentences based on whether or not there are subject adoptive words and predicate adoptive words in the sentence. To do.

【0014】次に、採用した候補原文から、不要な記号
等を削除、あるいは特定の語について略語に変換する前
処理を行う。
Next, pre-processing is performed to remove unnecessary symbols or the like from the adopted candidate original text or convert specific words into abbreviations.

【0015】この前処理を行った候補原文から、主語を
表す語句につく語彙である主語採用詞の直前の採用可能
語句を主語採用詞とともに切り出してタイトル文の主語
として採用し、必要な置換を行う。また、候補原文から
述語を表す語句につく語彙である述語採用詞の後の採用
語句または特定の述語(例えば“を設立”、“を実施”
等)を述語採用詞とともに述語として採用し、必要な置
換を行う。
From the candidate original sentence that has been subjected to this preprocessing, the adoptable phrase immediately before the subject adoptive vocabulary, which is the vocabulary attached to the phrase representing the subject, is cut out together with the subject adoptive verb and adopted as the subject of the title sentence, and the necessary replacement is performed. To do. In addition, an adopted term or a specific predicate (for example, “establish” or “execute”) that follows the predicate adoptive, which is a vocabulary attached to a phrase representing a predicate from the candidate original text.
Etc.) is adopted as a predicate together with the predicate adoptive verb, and the necessary substitution is performed.

【0016】採用した主語の採用可能語句と述語の採用
可能語句とでタイトル文として記述してよいか否かを判
定し、もしタイトル文として他の採用可能語句がある場
合には、さらに、必要な採用可能語句を取得するステッ
プを行い、よい場合には、タイトル文として必要な字数
に圧縮する圧縮手順を経てタイトル文を作成する。
It is judged whether or not the adoptable words of the adopted subject and the adoptable words of the predicate may be described as a title sentence, and if there are other adoptable phrases as the title sentence, it is further necessary. The step of acquiring the applicable phrase is performed, and if it is good, the title sentence is created through a compression procedure of compressing the number of characters required for the title sentence.

【0017】主語および述語との間に採用可能語句があ
る場合には、第一WHAT発見手段を経て、さらに採用
可能語句があるか否かを発見する第二WHAT発見手段
を経てタイトル文として採用可能語句があるか否かを判
定する。
When there is an employable phrase between the subject and the predicate, it is adopted as a title sentence through the first WHAT discovering means and further through the second WHAT discovering means for discovering whether or not there is an employable phrase. It is determined whether there is a possible phrase.

【0018】主語および述語採用可能語句以外に発見し
た採用可能語句がある場合にも、タイトル文として必要
な字数に文字数を圧縮してタイトル文を作成する。
Even when there is an employable phrase found other than the subject and predicate adoptable phrase, the number of characters is compressed to the number of characters required as the title sentence to create the title sentence.

【0019】なお、新聞記事中には、タイトル文を自動
的には記述できない記事、例えば連載記事や座談記事な
どがあり、このような特殊な記事は、従来どおり手動
(人手)によりタイトル文を作成する。
Note that some newspaper articles include articles for which title sentences cannot be automatically described, such as serialized articles and roundtable articles. For such special articles, the title sentences are manually (manually) manually used. create.

【0020】本発明は、一部の限られた新聞記事を除
き、このような手順を行って自動的に新聞記事のタイト
ル文を作成できるので、タイトル文作成の省力化を図る
ことができる。また、作業者の作業効率を高めることが
できる。さらに、タイトル文を短時間で作成できるた
め、新聞記事データベースに短時間で、ニュース性のあ
る記事を提供することができる。
According to the present invention, except for some limited newspaper articles, the title sentence of a newspaper article can be automatically created by performing such a procedure, so that the labor of creating the title sentence can be reduced. Further, the work efficiency of the worker can be improved. Furthermore, since the title sentence can be created in a short time, news articles can be provided to the newspaper article database in a short time.

【0021】[0021]

【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。図1は、本発明の一つの実施の形
態を説明する図である。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram for explaining one embodiment of the present invention.

【0022】この本発明を例示する一実施の形態は、タ
イトル文を作成する原記事中から記事の主題を記述して
いる候補原文を発見して抽出する候補原文発見部11
と、抽出された候補原文にタイトル文を作成するに必要
な前処理を行う前処理部12と、候補原文から文の主語
を抽出するWHO発見部13と、候補原文から文の述語
を抽出する述語発見部14と、主語および述語以外に採
用可能語句があった場合に、文の目的語あるいは補語を
示すような採用可能語句を抽出する第1段階WHAT・
WHERE発見部15と、第1段階WHAT・WHER
E発見部15で抽出した採用可能語句以外の採用可能語
句を抽出する第2段階WHAT・WHERE発見部16
と、WHO発見部13および述語発見部14の抽出した
主語および述語のタイトル文、第1段階WHAT・WH
ERE発見部15で抽出した採用可能語句を含むタイト
ル文、第2段階WHAT・WHERE発見部16で抽出
した採用可能語句を含むタイトル文のそれぞれがタイト
ル文として採用してよいか否かを判定するWRITE条
件判定部17と、WRITE条件判定部17で採用可能
とした文が40文字を越えるときに、この文を40文字
以内に文字数圧縮処理を行う40文字圧縮部18とを備
える。
In one embodiment exemplifying the present invention, a candidate source text discovering unit 11 for discovering and extracting a candidate source text describing a subject of an article from an original article for creating a title sentence.
And a preprocessing unit 12 that performs preprocessing necessary to create a title sentence in the extracted candidate original sentence, a WHO discovery unit 13 that extracts the subject of the sentence from the candidate original sentence, and a predicate of the sentence from the candidate original sentence. The predicate finding unit 14 and the first stage WHAT that extracts an employable phrase indicating an object or a complement of a sentence when there is an employable phrase other than the subject and the predicate.
WHERE discovery section 15 and the first stage WHAT / WHER
Second stage WHAT / WHERE discovering unit 16 for extracting adoptable phrases other than the adoptable phrases extracted by the E discovering unit 15
And the title sentences of the subject and the predicate extracted by the WHO discovery unit 13 and the predicate discovery unit 14, the first stage WHAT / WH
It is determined whether each of the title sentence including the adoptable phrase extracted by the ERE finding unit 15 and the title sentence including the adoptable phrase extracted by the second stage WHAT / WHERE discovering unit 16 can be adopted as the title sentence. A WRITE condition determining unit 17 and a 40-character compressing unit 18 that compresses the number of characters of this sentence to within 40 characters when the sentence that can be adopted by the WRITE condition determining unit 17 exceeds 40 characters.

【0023】なお、ステップとして、述語発見部14か
ら、一度WRITE条件判定部17に行って、タイトル
文としての適合性を判定し(主語と述語との間に採用可
能語句があるか否かを判定する)、適合する場合は、文
字数が40文字以内のときはそのままタイトル文を出力
し、40文字を越えるときは、40文字圧縮部18で文
字数圧縮処理を行う。タイトル文として適合しない場合
は、第1段階WHAT・WHERE発見部15へ行き、
第1段階WHAT・WHERE発見処理を行う。第1段
階WHAT・WHERE発見部15の処理後は、またW
RITE条件判定部17へ行って、タイトル文との適合
性を判定し、40文字以内のときはそのままタイトル文
を出力し、40文字を越えるときは40文字圧縮部18
で文字数圧縮処理を行う。タイトル文として適合しない
場合は、第2段階WHAT・WHERE発見部16へ行
き第2段階WHAT・WHERE発見処理を行う。その
結果をまたWRITE条件判定部17で判定し、40文
字以内のときは、タイトル文を出力し、40文字を越え
るときは40文字圧縮部18で文字数圧縮処理を行う。
As a step, the predicate discovering unit 14 once goes to the WRITE condition determining unit 17 to determine the suitability as a title sentence (whether there is an employable phrase between the subject and the predicate). If the number of characters is within 40 characters, the title sentence is output as it is. If it exceeds 40 characters, the 40-character compression unit 18 performs a character number compression process. If the title text does not match, go to the first stage WHAT / WHERE discovery section 15,
The first stage WHAT / WHERE discovery processing is performed. After the processing of the first stage WHAT / WHERE discovery unit 15,
It goes to the RITE condition determination unit 17 to determine the compatibility with the title sentence, and outputs the title sentence as it is if it is within 40 characters, and if it exceeds 40 characters, the 40 character compression unit 18
The number of characters is compressed with. If the title sentence does not match, the process goes to the second stage WHAT / WHERE discovery unit 16 to perform the second stage WHAT / WHERE discovery process. The result is again judged by the WRITE condition judging unit 17, and when it is within 40 characters, the title sentence is output, and when it exceeds 40 characters, the 40-character compressing unit 18 performs character number compression processing.

【0024】以下、それぞれ各部の構成および動作を説
明する。
The configuration and operation of each part will be described below.

【0025】図2は、候補原文発見部11での動作を示
すフローチャートである。この候補原文発見部11は、
原記事の先頭から文単位で記事を読み込んで、記事本文
の主題を述べている文を発見してタイトル文作成の候補
原文を抽出するためのものである。新聞記事は、文章の
はじめの方で、いわゆる5W1Hが述べられている逆三
角形の文章構造をしている。このため、候補原文発見部
11では、先頭文より、タイトル文となる候補原文を発
見する処理を行う。
FIG. 2 is a flow chart showing the operation of the candidate original sentence finding section 11. This candidate text finding unit 11
This is for reading an article in sentence units from the beginning of the original article, discovering a sentence that describes the subject of the article body, and extracting candidate original sentences for creating a title sentence. The newspaper article has an inverted triangular sentence structure in which the so-called 5W1H is mentioned at the beginning of the sentence. Therefore, the candidate original text discovering unit 11 performs a process of discovering a candidate original text that becomes a title sentence from the first sentence.

【0026】まず、原記事の先頭から文単位で読み込む
(S21)。次に、文の先頭が“「”(鍵かっこ)から
始まるか否かを判定して、その場合には次の文に行く
(S22)。これは、“「”は話し言葉から始まる文で
あり、タイトル文候補としては不適格であり、除外する
ためである。次に、文中にWHO採用詞があるか否かを
判断する(S23)。WHO採用詞がない場合は、主語
がないので次の文に対する処理を行うためステップS2
1へいく。
First, the original article is read in sentence units from the beginning (S21). Next, it is determined whether the beginning of the sentence starts with "" (brackets), and in that case, the process proceeds to the next sentence (S22). This is because ““ ”is a sentence starting from a spoken language and is not qualified as a title sentence candidate, and is excluded. Next, it is determined whether or not there is a WHO adopted word in the sentence (S23). If there is no WHO adopted word, there is no subject, so the processing for the next sentence is performed, so step S2
Go to 1.

【0027】このWHO採用詞は、“は”、“が”“ら
は”であり、主語を表現する語彙として主語を表現する
語の後についている語句である。
The WHO adopted words are "ha", "ga" and "hara", and are words and phrases following the word expressing the subject as a vocabulary expressing the subject.

【0028】そして、文内のWHO採用詞がある場合
に、このWHO採用詞の後ろに述語採用詞があるか否か
を判断する(S24)。述語採用詞がないときは、主語
はあるが述語がないので、次の文にいくためステップS
21へいく。
Then, if there is a WHO adopted word in the sentence, it is judged whether or not there is a predicate adopted word after this WHO adopted word (S24). If there is no predicate adopter, there is a subject but no predicate, so go to the next sentence in step S.
Go to 21.

【0029】述語採用詞は、“を”、“に”、“で”、
“が”、“から”、“について”、“として”、“する
と”、“と”、“相次いで”、“することを”、“へ”
であり、述語を表現する語彙として述語となる語の前に
ついている語句である。
The predicate adjectives are "wo", "ni", "de",
"Ga", "from", "about", "as", "do", "to", "succession", "do something", "to"
And is a phrase that precedes the word that is the predicate as a vocabulary that expresses the predicate.

【0030】さらに、文内でWHO採用詞の後ろの文字
数が、8文字以内であるか否かを判断する(S25)。
これは、WHO採用詞の後に述語含みの文字数が少ない
ので文の主題を述べている文ではないとして候補原文か
ら外すためである。
Further, it is judged whether or not the number of characters after the WHO adopted word in the sentence is within 8 characters (S25).
This is because the number of characters including the predicate after the WHO adopted word is small, and the sentence is excluded from the candidate original sentence because it is not a sentence that describes the subject of the sentence.

【0031】このような判断ステップを経て、タイトル
文作成の候補原文を確定して候補原文を取得する。
Through such a judgment step, the candidate original sentence for creating the title sentence is confirmed and the candidate original sentence is acquired.

【0032】次に、取得した候補原文からタイトル文を
作成するに際して、あらかじめ実行する前処理を図3を
参照して説明する。これは、候補原文から不要な語句、
記号を削除すること、特定の語句を略語に置き換えるこ
となどの処理をタイトル文作成処理に先立って行うもの
である。
Next, the preprocessing executed in advance when creating a title sentence from the acquired candidate original sentence will be described with reference to FIG. This is an unnecessary phrase from the candidate original text,
Prior to the title sentence creation process, processes such as deleting symbols and replacing specific words with abbreviations are performed.

【0033】まず、候補原文内の文字列と略語辞書との
マッチングを行い、略語に置換する(S31)。これ
は、例えば、日立製作所を“日立”に、住友特殊金属を
“住特金”の略語に置き換えるものである。次に、候補
原文内の“(写真)”、“=写真”、“=写真(上)”
等の写真の文字を含む漢字、“=”、“()”で構成さ
れる文字列を削除して文を詰める(S32)。さらに、
候補文内の“()”内は、かっこも含め削除して文字を
詰める(S33)。また、“「」”内は、次の条件の文
字種のときにのみ残し、他は鍵かっこを含め削除して文
字を詰める(S34)。
First, the character string in the candidate original sentence is matched with the abbreviation dictionary and replaced with an abbreviation (S31). This means replacing Hitachi with "Hitachi" and Sumitomo Special Metals with "Sumikin". Next, "(photo)", "= photo", "= photo (top)" in the candidate text
The text is deleted by deleting the kanji including the characters of the photo, such as "=" and "()" (S32). further,
Characters in "()" in the candidate sentence are deleted by including characters in parentheses (S33). In addition, "" is left only for the character type of the next condition, and other characters are deleted including key brackets to fill the characters (S34).

【0034】1.全て漢字、 2.漢字と平仮名、 3.漢字とカタカナ、 4.漢字と英字、 5.全てカタカナ、 6.英字とカタカナ、 7.“装置”が含まれているとき このような前処理を終了した候補原文からWHO発見部
13でWHO(主語)を抽出する。図4を参照してその
動作を説明する。
1. All kanji, 2. Kanji and Hiragana, 3. Kanji and Katakana, 4. Kanji and English, 5. All Katakana, 6. English letters and katakana, 7. When "device" is included, the WHO (subject) is extracted by the WHO discovery unit 13 from the candidate original text for which such preprocessing has been completed. The operation will be described with reference to FIG.

【0035】日本語文は、その先頭部分に主語を含む主
部がくる。したがって、候補原文の先頭文字より後部に
向かって後述する処理を行い、主語もしくは主部を発見
し、タイトル文に向けに整形して採用する。この採用さ
れた語句をWHO採用語句という。
A Japanese sentence has a main part including the subject at the beginning thereof. Therefore, the process to be described later is performed from the first character of the candidate original sentence toward the rear part, the subject or the main part is found, and the candidate sentence is shaped and adopted for the title sentence. This adopted phrase is called a WHO adopted phrase.

【0036】なおここで、修飾詞は、“の”、“と”、
“な”、“や”、“との”、“への”、“から”、“な
ど”をいう。ただし、“など”は、第2段階WHAT・
WHERE発見部での処理のときのみ使用する。また、
企業・団体抽出名詞とは、“社長”、“会長”、“頭
取”、“理事長”、“所長”、“首脳”の語をいう。
Here, the modifiers are "no", "to",
"Na", "or", "to", "to", "from", "etc." However, "etc." means the second stage WHAT
It is used only when processing in the WHERE detection section. Also,
The company / group extraction nouns mean the words "president", "chairman", "chief", "director", "director", "leader".

【0037】まず、WHO発見部の処理は、WHO採用
詞(前出の“は”、“が”“らは”)の直前の採用可能
語句をWHO採用詞とともに切り出し、WHO採用
詞“、”(読点)に置換し、タイトル文の主語として採
用する。なお、この語句の直前が、“と”、“や”のと
き、その直前の採用可能語句も共に採用する(S4
1)。例001.候補原文 「松下電器と松下電子は十
二日、中国・上海市に」を、採用語句 「松下電器と松
下電子、」にする。
First, in the processing of the WHO finding section, the employable phrase immediately before the WHO adopting words (the above "wa", "ga" and "hara") are cut out together with the WHO adopting words, and the WHO adopting words ",". Replaced with (punctuation) and adopted as the subject of the title sentence. When the word immediately before this word is “to” or “ya”, the applicable word immediately before that is also adopted (S4).
1). Example 001. Candidate original text "Matsushita Electric and Matsushita Electronics are in Shanghai, China on the 12th" is adopted phrase "Matsushita Electric and Matsushita Electronics."

【0038】次に、WHO採用語句の前方に“など”が
あると、先頭文字からWHO採用語句までを採用する
(S42)。例002.候補原文「熊本地区の機械、金
属など異機種の製造5社は」を、採用語句「熊本地区の
機械、金属など異機種の製造5社、」にする。
Next, if there is "etc." in front of the WHO adopted word, the characters from the first character to the WHO adopted word are adopted (S42). Example 002. Candidate original text "5 manufacturers of different types of machines and metals in the Kumamoto area" is adopted phrase "5 manufacturers of different types of machines and metals in the Kumamoto area."

【0039】WHO採用語句が“”(クォーテーション
マーク)で囲まれているとき、マーク付きで採用する
(S43)。例003.候補原文「一ドル=九十円台の
“二ケタ円高”が定着しつつある状況で」を、採用語句
「“二ケタ円高”」とする。
When the WHO adoption word is surrounded by "" (quotation mark), it is adopted with a mark (S43). Example 003. The candidate text "In the situation where the" double-digit yen appreciation "of one dollar = 90 yen level is becoming established" is adopted as the phrase "" double-digit yen appreciation ".

【0040】WHO採用語句の直前に“による”、“に
おける”があるとき、その直前の採用可能語句も採用す
る。また、直前採用語句の直前に修飾詞があるとき、そ
の直前の採用可能語句も採用する(S44)。例00
4.候補原文「ロスアンゼルスで開かれていた日本、米
国、EU、カナダの通商閣僚による四極通商会合は十一
日午前、」を、採用語句「日本、米国、EU、カナダの
通商閣僚による四極通商会合、」とする。
When there is "by" or "at" immediately before the WHO adoption word, the adoptionable word immediately before that is also adopted. Also, when there is a modifier immediately before the immediately preceding adopted phrase, the immediately preceding adoptable phrase is also adopted (S44). Example 00
4. Candidate original text "The four-pole trade meeting of trade ministers of Japan, the United States, the EU, and Canada held in Los Angeles was on the 11th,"".

【0041】WHO採用語句の後尾が、企業・団体抽出
名詞である場合、先頭文字から該当語句まで採用する。
また、WHO採用語句が“両者”、“両社”であるとき
も先頭文字から採用する。なお、“各社”でその直前が
“の”であるとき、その直前の採用可能語句も共に採用
する(S45)。例005.候補原文「経団連の豊田章
一郎会長は二十一日の定例会見で、」を採用語句「経団
連の豊田章一郎会長、」とする。
When the end of the WHO adopted word is a company / organization extracted noun, the words from the first character to the corresponding word are adopted.
Also, when the WHO adopted words are "both" and "both companies", the words are adopted from the first character. When "immediately before" in "each company" is "no", the applicable phrase immediately before that is also adopted (S45). Example 005. Candidate original text "Keidanren Chairman Shoichiro Toyoda at the 21st Regular Meeting" is adopted as the phrase "Keidanren Chairman Shoichiro Toyoda."

【0042】WHO採用語句が「」(鍵かっこ)で囲ま
れているとき、鍵かっこを外して採用する。その直前に
修飾詞があるとき、その直前の採用可能語句も採用する
(S46)。例006.候補原文 「日本と韓国の円滑
な技術移転を促すための「日韓テクノマート」が十三日
から四日間の日程で」を採用語句 「日韓テクノマー
ト」とする。また、例007.「秋田県内三港のマリー
ナを一括管理・運営する第三セクターの「マリーナ秋
田」が、十月に設立」を採用語句 「第三セクタのマリ
ーナ秋田、」にする。
When the WHO adoption phrase is surrounded by "" (brackets), the braces are removed and employed. When there is a modifier immediately before that, the adoptable word immediately before that is also adopted (S46). Example 006. Candidate original text "The Japan-Korea technomart for promoting smooth technology transfer between Japan and South Korea is scheduled for 13 to 4 days" is adopted as the phrase "Japan-Korea technomart". Also, for example 007. "The third sector" Marina Akita ", which manages and operates the marinas of three ports in Akita Prefecture, was established in October" is adopted as the phrase "third sector Marina Akita."

【0043】WHO採用語句の後尾に、“教授ら”、
“教授”があり、その語句の直前に修飾詞があるとき、
WHO採用語句を不採用とし、修飾詞の直前の採用可能
語句をWHO採用語句とする(S47)。例008.候
補原文 「小山高専の黒須茂教授らは、山武ハネウェル
と共同で」を、採用語句 「小山高専、」とする。
"Professor et al."
When there is a "professor" and there is a modifier immediately before that phrase,
The WHO adopted phrase is not adopted, and the adoptable phrase immediately before the modifier is set as the WHO adopted phrase (S47). Example 008. Candidate original sentence "Professor Shigeru Kurosu of Koyama National College of Technology and others in collaboration with Yamatake Honeywell" is adopted as "Oyama National College of Technology."

【0044】WHO採用語句の直前に、修飾詞があり、
その直前が“()”(かっこ)で、かっこ内に企業・団
体名抽出名詞があるとき、かっこの直前の採用可能語句
も共に採用する(S48)。例009.候補原文 「花
正(東京都江戸川区平井六の五十四の一、社長小野弘
氏)の低価格ワインが小売各社の間で」を、採用語句
「花正の低価格ワイン、」とする。
There is a modifier immediately before the WHO adoption word,
Just before that is "()" (parentheses), and when there is a company / organization name extraction noun in the parentheses, the applicable phrase immediately before the parentheses is also adopted (S48). Example 009. Candidate original text "Hanamasa (54, Hirai, Edogawa-ku, Tokyo, 51st, Mr. Hiroshi Ono, low-priced wine among retailers)" is adopted as "Hanamasa's low-priced wine," .

【0045】WHO採用語句の直前、及び前部に複数の
“の”があり、その前後が採用可能語句のとき、2個ま
での“の”に付加する採用可能語句を共に採用する(S
49)。例010.候補原文 「渋谷の代官山の再開発
事業が大詰めを迎えている」を、採用語句 「渋谷の代
官山の再開発事業、」とする。
When there are a plurality of "no" s immediately before and after the WHO adopted word, and before and after there are available words, the adopted words added to up to two "nos" are both adopted (S
49). Example 010. Candidate original text "The redevelopment project of Daikanyama in Shibuya is nearing its final stage" is adopted as the phrase "Redevelopment project of Daikanyama in Shibuya."

【0046】WHO採用語句+採用可能語句、または、
WHO採用語句+採用可能語句+“の”+採用可能語句
の直後に、“と”、“と共同で”、“と共同出資で”、
“と合弁で”、“と提携して”、“に向け”、“で”、
“から”があるとき、該当する全てを採用する。ただ
し、“から”は、その直前の採用可能語句に数詞が入る
ときは棄却する(S50)。これは、このような場合
に、主語として採用すべきものは2語以上あり、両者を
採用するためである。例011.候補原文 「新日鉄
は、三井物産と共同でフィンランドの製鉄会社であるフ
ンディア社から」を、採用語句 「新日鉄、三井物産と
共同で」とする。例012.候補原文 「ノリタケは米
国の洋食器メーカ、オネイダ社と提携し、米国で販売す
る」を、採用語句 「ノリタケ、米国の洋食器メーカオ
ネイダ社と提携、」とする。例013.候補原文 「松
下電池は携帯電話機用の充電器で、業界で初めて」を、
採用語句「松下電池、携帯電話機用の充電器で、」とす
る。例014.候補原文 「大林組はシンガポール航空
から新本社ビルの」を、採用語句 「大林組、シンガポ
ール航空から」とする。
WHO adopted phrase + adapted phrase, or
WHO Adopted phrase + Admissible phrase + "No" + Immediately after the admissible phrase, "to", "jointly with", "jointly invest with",
"In joint venture", "in partnership with", "toward", "in",
When there is "from", adopt all that apply. However, "kara" is rejected when a number is included in the employable word immediately before it (S50). This is because, in such a case, there are two or more words to be adopted as the subject, and both are adopted. Example 011. Candidate original text "Nippon Steel and Finnish steelmaking company Hundia in collaboration with Mitsui & Co., Ltd." are adopted as the phrase "Nippon Steel and Mitsui & Co., Ltd.". Example 012. Candidate original text "Noritake is affiliated with American tableware maker Oneida Inc. in the United States and sold in the United States" is adopted phrase "Noritake, American tableware maker Oneida Inc. in the United States," is adopted. Example 013. Candidate original text "Matsushita Battery is the first charger in the industry for mobile phones"
The adopted phrase is "Matsushita battery, a charger for mobile phones,". Example 014. Candidate original text "Obayashi from Singapore Airlines to new headquarters building" is adopted as the phrase "Obayashi from Singapore Airlines."

【0047】最後に、WHO採用詞と、“、”(読点)
に挟まれた採用可能語句に数詞+“年”、“月”、
“日”が含まれるとき、その採用可能語句を削除する
(S51)。例015.候補原文 「ロスアンゼルスで
開かれていた、日本、米国、EU、カナダの通商閣僚に
よる四極通商会合は十一日午前、」を、採用語句 「日
本、米国、EU、カナダの通商閣僚による四極通商会
合、」とする。
Finally, the WHO adopted word and "," (punctuation)
The number of words that can be hired between the numbers is "number" + "year", "month",
When “day” is included, the applicable phrase is deleted (S51). Example 015. Candidate original text "The four-way trade meeting held by the trade ministers of Japan, the United States, the EU, and Canada in Los Angeles was held on the 11th of the morning." , ”.

【0048】このようなWHO発見部13によるWHO
採用語句の抽出処理の後に、候補原文から述語を述語発
見部14により抽出する。この処理を図5を参照して説
明する。日本語文は、述語および述語を含む述部が文末
にくる。したがって、候補原文の末尾より文頭に向けて
遡り、以下に述べる処理を行って、述語もしくは述部を
発見し、タイトル文向けに整形して採用する。採用され
た語句を述語採用語句という。
WHO by such WHO discovery unit 13
After the adopted phrase is extracted, the predicate finding unit 14 extracts a predicate from the candidate original sentence. This process will be described with reference to FIG. A Japanese sentence has a predicate and a predicate including the predicate at the end of the sentence. Therefore, the candidate original sentence is traced back from the end toward the beginning of the sentence, the processing described below is performed, the predicate or predicate is discovered, and the sentence is formatted for the title sentence and adopted. The adopted phrase is called a predicate adopted phrase.

【0049】まず、候補原文の文頭よりチェックし、
“を設立”、“を実施”、“を設備”、“を開発”、
“を開設”、“を値上げ”、“に諮問”の語句があれ
ば、それ以降の文字列を無視し、述語として採用する。
以後の述語抽出処理は行わず、WRITE条件判定部へ
行く(S61)。これは、特定の述語については無条件
で述語として採用するものであり、この特定の述語の後
は、記事の明細部分に入り、タイトル文として不要なも
のであるため、無視する。例016.候補原文 「米の
有力パソコン・ソフトウエアハウスであるシマンテック
社は100%出資の日本法人であるシマンテックを設
立、日本市場に対する本格的な営業活動を開始した。」
を、採用語句 「シマンテック社、100%出資の日本
法人であるシマンテックを設立」とする。
First, check from the beginning of the candidate original sentence,
"Establish", "Implement", "Equipment", "Develop",
If there are phrases such as "open", "raise", and "inquiry", the subsequent character strings are ignored and adopted as a predicate.
The subsequent predicate extraction processing is not performed, and the process goes to the WRITE condition determination unit (S61). This is because a specific predicate is unconditionally adopted as a predicate, and after this specific predicate, it enters the detailed portion of the article and is unnecessary as a title sentence, so it is ignored. Example 016. Candidate original text "Symantec, Inc., a leading US computer and software house, established a wholly owned Japanese corporation, Symantec, and started full-scale sales activities for the Japanese market."
Is adopted as "Symantec, Inc., a wholly-owned Japanese corporation, Symantec, is established."

【0050】次に、候補原文の末尾より遡り、述語採用
詞があり、その直後に採用可能語句があれば、共に採用
する。もし、述語採用詞の直後に採用可能語句がなけれ
ば、後部に向かってチェックを行い、採用可能語句があ
れば、そこまでの文字列を採用する。衝突する採用語句
がないときは、“。”(句点)までの文字列を句点を除
き採用する(S62)。例017.候補原文 「生保業
界は中小・中堅や地方の企業への株式投資を積極化して
いる。」を、採用語句 「生保業界、中小・中堅や地方
の企業への株式投資を積極化」とする。
Next, if there is a predicate adoptive word, which is traced back from the end of the candidate original sentence, and there is an applicable phrase immediately after that, it is adopted together. If there is no applicable phrase immediately after the predicate adoptive word, a check is performed toward the rear part, and if there is an applicable phrase, the character string up to that is adopted. When there is no conflicting adopted phrase, the character string up to "." (Phrase) is adopted except the phrase (S62). Example 017. Candidate original text "The life insurance industry is actively investing in stocks in small and medium-sized enterprises and local companies" is adopted as the phrase "life insurance industry is actively investing in stocks in medium and small-sized enterprises and local companies."

【0051】次に述語採用語句に数詞を含む“年”、
“月”、“日”があればそれを削除する(S63)。例
018.候補原文 「オムロンソフトは、ワープロ文書
中にCADの図やイメージを取り込む機能を搭載したU
NIXWS用日本語ソフトを二一日発売する。」を、採
用語句 「オムロンソフト、ワープロ文書中にCADの
図やイメージを取り込む機能を搭載したUNIXWS用
日本語ソフトを発売」とする。
Next, "year", which includes a number in the predicate adopted word,
If there are "month" and "day", they are deleted (S63). Example 018. Candidate original text "Omron Soft is a U with a function to import CAD drawings and images into word processing documents.
Japanese software for NIXWS will be released for two days. "Omron software releases Japanese software for UNIXWS equipped with a function to import CAD drawings and images into word processing documents."

【0052】述語採用語句決定後、再度文を遡り、述語
テーブルとマッチング処理し、述語テーブル内の語句が
あれば、それを述語採用語句とし、初回の述語採用語句
を却下する(S64)。例019.候補原文 「サンデ
ンは一二日、九五年二月から米国でカーエアコン用スク
ロールコンプレッサーの一貫生産を開始すると正式発表
した。」を、採用語句 「サンデン、米国でカーエアコ
ン用スクロールコンプレッサーの一貫生産を開始」とす
る。これは、「開始」のみを述語テーブルに入れてお
き、それ以下の語句を削除してタイトル文に不要な語句
を除くためである。
After determining the predicate adoption phrase, the sentence is traced back again and the matching process with the predicate table is performed. If there is a phrase in the predicate table, that phrase is used as the predicate adoption phrase, and the first predicate adoption phrase is rejected (S64). Example 019. Candidate original text "Sanden officially announced that it will start integrated production of scroll compressors for car air conditioners in the United States on February 12, 1995." Adopted phrase "Sanden, integrated production of scroll compressors for car air conditioners in the United States To start. " This is because only "start" is put in the predicate table, and words and phrases below it are deleted to remove unnecessary words and phrases in the title sentence.

【0053】このような述語抽出処理を終了すると、W
RITE条件判定部17へいく。
When such predicate extraction processing is completed, W
Go to the RITE condition determination unit 17.

【0054】WRITE条件判定部17では、タイトル
文としてWRITEしてよいか否かを判定するものであ
るが、述語発見部14での出力であるWHO採用語句+
述語採用語句、第1段階WHAT・WHERE発見部1
5での出力であるWHO採用語句+第1段階WHAT・
WHERE採用語句+述語採用語句、第2段階WHAT
・WHERE発見部16での出力であるWHO採用語句
+第2段階WHAT・WHERE採用語句+第1段階W
HATE・WHERE採用語句+述語採用語句、につい
て判定を行う。なお、第2段階WHAT・WHERE採
用語句は複数である場合も含む。これらWRITE条件
判定部17が処理対象とする文字列をタイトル候補文と
いう。
The WRITE condition judging unit 17 judges whether or not WRITE may be performed as the title sentence. The WHO adopted word / phrase output from the predicate finding unit 14+
Predicate adopted phrase, 1st stage WHAT / WHERE discovery section 1
WHO adoption phrase output in 5 + 1st stage WHAT
WHERE adopted phrase + predicate adopted phrase, 2nd stage WHAT
・ WHO adopted word / phrase output from WHERE discovery unit 16 + second stage WHAT / WHERE adopted word + first stage W
HATE / WHERE adopted words + predicate adopted words are judged. In addition, the case where the second stage WHAT / WHERE adopted words and phrases are plural is also included. The character string to be processed by the WRITE condition determination unit 17 is called a title candidate sentence.

【0055】WRITE条件判定部17の処理のうち、
述語発見部14の出力に対するWRITE条件判定につ
いて図8に基づいて説明する。
Of the processing of the WRITE condition judging section 17,
The WRITE condition determination for the output of the predicate finding unit 14 will be described with reference to FIG.

【0056】まず、候補原文で述語採用語句の直前がW
HO採用語句であるかを判断する(S111)。YES
の場合は、タイトル候補文が40文字以内であるかを判
断し(S112)、40文字以内であるときは、タイト
ル文として採用し、次の文(記事)を処理するため候補
原文発見部11へいく(S113)。例020.候補原
文 「パプキンは、宮城県下から撤退する。」を、タイ
トル文 「パプキン、宮城県下から撤退」とする。ステ
ップS112でタイトル候補文が40文字を越えたとき
は、40文字圧縮部18へいく。また、ステップS11
1で候補原文で述語採用語句の直前がWHO採用語句で
ない場合は、他の情報をとるため、第1段階WHAT・
WHERE発見部15へいく(S115)。
First, in the candidate original sentence, the word W is immediately before the predicate adopted word.
It is determined whether or not it is a HO adoption phrase (S111). YES
In this case, it is determined whether the title candidate sentence is within 40 characters (S112). If it is within 40 characters, it is adopted as the title sentence and the candidate original sentence finding unit 11 is used to process the next sentence (article). Go to (S113). Example 020. The original text of the candidate, "Papkin withdraws from Miyagi prefecture.", Is referred to as the title sentence "Papkin withdraws from Miyagi prefecture." If the title candidate sentence exceeds 40 characters in step S112, the process proceeds to the 40-character compression unit 18. Step S11
In the case of 1 in the candidate original text, if the word immediately before the predicate adopted word is not the WHO adopted word, the first stage WHAT
Go to the WHERE discovery section 15 (S115).

【0057】WRITE条件判定部17で、タイトル文
の条件に適合しないと判定された場合に、WHAT・W
HERE発見部でのWHAT・WHERE発見処理に移
る。この処理は、タイトル文内にある目的語、補語等を
採用するためのものである。WHAT・WHERE発見
部は、第1段階WHAT・WHERE発見部15、第2
段階WHAT・WHERE発見部16にその論理が分か
れている。日本語文は、文の重要な性質を表す語の順位
で文末から遡って配置されている。したがって、述語採
用語句から遡って、WHAT・WHEREを発見してタ
イトル文向けに整形して採用するように動作する。
If the WRITE condition determining unit 17 determines that the condition of the title sentence is not satisfied, WHAT.W
Move to WHAT / WHERE discovery processing in HERE discovery section. This process is for adopting the object, complement, etc. in the title sentence. The WHAT / WHERE discovery unit is the first stage WHAT / WHERE discovery unit 15 and the second stage.
The logic is divided into the stage WHAT / WHERE discovery unit 16. Japanese sentences are arranged backward from the end of the sentence in the order of words that represent the important properties of the sentence. Therefore, it operates so as to find the WHAT / WHERE retroactively from the predicate adoption phrase, shape it for the title sentence, and adopt it.

【0058】WRITE条件判定部17のステップS1
11の判断で述語採用語句の直前にWHO採用語句がな
いときは、第1WHAT・WHERE発見部15での第
1段階WHAT・WHERE発見処理を行う。この第1
段階WHAT・WHERE発見部15の処理動作を図6
を参照して説明する。
Step S1 of the WRITE condition judging section 17
If there is no WHO adopted word immediately before the predicate adopted word in the judgment of 11, the first stage WHAT • WHERE finding processing in the first WHAT • WHERE finding unit 15 is performed. This first
The processing operation of the stage WHAT / WHERE discovery unit 15 is shown in FIG.
This will be described with reference to FIG.

【0059】まず、候補原文を述語採用詞から遡り、そ
の直前の採用可能語句を採用する(S71)。例02
1.候補原文 「米の有力パソコン・ソフトハウスであ
るシマンテック社は100%出資の日本法人であるシマ
ンテックを設立、日本市場に対する本格的な営業活動を
開始した。」を、採用語句 「シマンテック社、100
%出資の日本法人であるシマンテックを設立」とする。
この場合「を設立」の直前の「シマンテック」が第1W
HAT・WHERE採用語句である。
First, the candidate original sentence is traced back from the predicate adoptive word and the immediately preceding adoptable word is adopted (S71). Example 02
1. Candidate original text "Symantec, a leading US computer / software house, established a wholly-owned Japanese corporation, Symantec, and started full-scale sales activities for the Japanese market."
Established Symantec, a wholly owned Japanese subsidiary. "
In this case, "Symantec" just before "Establishing" is the first W
HAT / WHERE adopted phrase.

【0060】次に、第1WHAT・WHERE採用語句
(以下第1WHAT採用語句という)の直前に、修飾詞
があるとき、その直前の採用語句も共に採用する。ま
た、採用語句の直前にさらに修飾詞があるときは、順次
採用しながら遡る(S72)。ただし、“から”の直前
の採用可能語句が数詞含みであるときは不採用とする。
例022.候補原文 「生保業界は中小・中堅や地方の
企業への株式投資を積極化している。」を、採用語句
「生保業界、中小・中堅や地方の株式投資を積極化」と
する。ここで「中小・中堅や地方の株式投資」が第1W
HAT採用語句である。
Next, if there is a modifier immediately before the first WHAT / WHERE adopted word (hereinafter referred to as the first WHAT adopted word), the adopted word immediately before that modifier is also adopted. If there is a further modifier immediately before the adopted word, the words are successively adopted while going back (S72). However, if the word that can be adopted immediately before "kara" contains a number, it is not adopted.
Example 022. Candidate original text "The life insurance industry is actively investing in stocks in small and medium-sized companies and local companies."
"Actively invest in stocks in the life insurance industry, small and medium-sized companies, and regions". Here, "small and medium-sized enterprises and regional stock investment" is the first W
It is a HAT adoption phrase.

【0061】次にステップS73では、次のような処理
を行う。まず、採用可能語句+「XXX」(鍵かっこ付
き語句)+述語採用詞のとき、鍵かっこの前の採用可能
語句を採用する。例023.候補原文 「森精機はOA
機器に使用されるアルミロールの表面を切削加工だけで
面祖度〇.二Sの高精度に仕上げる専用加工機「SFL
−10/600」を開発した。」を、採用語句 「森精
機、OA機器に使用されるアルミロールの表面を切削加
工だけで面祖度〇.二Sの高精度に仕上げる専用加工機
を開発」とする。ここで、鍵かっこ直前の「専用加工
機」が第1WHAT採用語句である。また、採用可能語
句ではない単語+鍵かっこ付き語句+述語採用詞のと
き、述語採用詞を“、”(読点)に置換する。例02
4.候補原文「花園工具は、プリント配線板のリード線
の切りくずをエアで吸引する「リードクリーナー」を発
売した。」を、採用語句 「花園工具、プリント配線板
のリード線の切りくずをエアで吸引する、発売」とす
る。ここで、発売の直前の「を」が「、」に置換されて
いる。ただし、採用可能語句でない単語+鍵かっこ付き
語句+述語採用語句で、述語が“を設立”、“を設
置”、“を実施”、“を開発”、“を完成”、“に署
名”、“を策定”のとき、鍵かっこ内を鍵かっこ付きで
採用する。例025.候補原文 「素材センターは、鋳
造・鍛造などに国内素形材産業で増加している海外調達
や海外展開の支援策として同センター内に「海外相談
室」を設置した。」を、採用語句 「素材センター、鋳
造・鍛造などに国内素形材産業で増加している海外調達
や海外展開の支援策として同センター内に「海外相談
室」を設置」とする。ここで、述語採用語句が「を設
置」であるため、「海外相談室」を鍵かっこ付きで第1
WHAT採用語句として採用する。なお、採用可能語句
でない単語+鍵かっこ付き語句+修飾詞+第1WHAT
採用語句のとき、鍵かっこ内を鍵かっこ付きで修飾詞、
第1WHAT採用語句をともに採用する。例026.候
補原文 「黒東第三発電所は、通産が九四年度から新設
した「グッド・デザイン施設」の認定を受けた」を、採
用語句 「黒東第三発電所、通産が九四年度から新設し
た「グッド・デザイン施設」の認定を受けた」とする。
Next, in step S73, the following processing is performed. First, when adoptable words + “XXX” (word / phrase with parentheses) + predicate adopter, adoptable words before the brackets are adopted. Example 023. Candidate original text "Mori Seiki is OA
The surface roughness of the aluminum roll used in the machine is simply cut. Special processing machine "SFL
-10/600 "was developed. "Mori Seiki develops a dedicated processing machine that finishes the surface of aluminum rolls used in OA equipment with high precision with a surface roughness of 0.2S simply by cutting." Here, the "dedicated processing machine" immediately before the parentheses is the first WHAT adoption phrase. Further, when the word is not an adoptable word + the word with key brackets + the predicate adoptive word, the predicate adoptive word is replaced with "," (a reading point). Example 02
4. Candidate original text "Hanazono Tool Co., Ltd. has released" Lead Cleaner, "which sucks chips from the lead wires of printed wiring boards with air. ”Is adopted as the adoption phrase,“ Hanazono tools, air suctioning chips of lead wires of printed wiring boards ”. Here, "o" just before the release is replaced with ",". However, the words that are not applicable words + the words with parentheses + the predicate are the adopted words, and the predicates are "establish", "install", "implement", "developing", "complete", "sign", At the time of “formulation”, the inside of the brackets is adopted with the brackets. Example 025. Candidate original text "The Material Center has established an" Overseas Consultation Office "within the center as a measure to support overseas procurement and overseas expansion, which are increasing in the domestic material industry such as casting and forging. ”Is adopted as the phrase“ establishment of an “overseas consultation room” within the center as a measure to support overseas procurement and overseas expansion, which is increasing in the domestic raw material industry such as the material center and casting / forging ”. Here, because the predicate adoption phrase is "install", the "overseas consultation room" is the first with parentheses.
Adopted as a WHAT adoption word. Note that words that are not applicable words + words with parentheses + modifiers + first WHAT
When hiring a phrase, the modifier inside the brackets with brackets,
The first WHAT adoption word is adopted together. Example 026. Candidate original text "Kuroto No. 3 power plant was certified as a" Good Design Facility "which was newly established by Tsutsumi in 1994." Has been certified as a "Good Design Facility".

【0062】なお、数詞と年、月、日、または、円を含
む採用可能語句+述語採用詞のとき、不採用にして遡る
(S74)。例027.候補原文 「NECホームエレ
は、画面サイズが業界標準で最も大きい九.五インチの
液晶テレビ「NEXTV」を十月一日に発売する。」
を、採用語句 「NECホームエレは、画面サイズが業
界標準で最も大きい九.五インチの液晶テレビを発売」
とする。
Incidentally, in the case of adoptable words / phrases including numerical, year, month, day, or yen + predicate adoptive words, they are rejected and the process goes back (S74). Example 027. Candidate original text "NEC Home Electronics will release the 9.5-inch LCD TV" NEXTV "with the largest screen size in the industry standard on October 1st. "
"The NEC Home Electronics launches a 9.5-inch LCD TV with the largest screen size in the industry standard."
And

【0063】これらの第1段階WHAT・WHERE発
見処理が終了すると、WRITE条件判定部17の第1
段階WHAT・WHERE発見部でのWRITE条件判
定処理へ行く(S75)。
When the first-stage WHAT / WHERE discovery processing is completed, the first condition of the WRITE condition judging section 17
The process goes to the WRITE condition determination process in the stage WHAT / WHERE discovery section (S75).

【0064】ここで、図9を参照してWRITE条件判
定処理部17での第1段階WHAT・WHERE発見部
15の出力に対するWRITE条件判定処理を説明す
る。
Here, the WRITE condition determination processing for the output of the first stage WHAT / WHERE discovery section 15 in the WRITE condition determination processing section 17 will be described with reference to FIG.

【0065】まず、候補原文で第1WHAT採用語句の
直前がWHO採用語句であるかを判断する(S12
1)。YESの場合は、タイトル候補文が40文字以内
であるかを判断し(S122)、40文字以内であると
きは、タイトル文として採用し、次の文を処理するため
候補原文発見部11へいく(S123)。例028.候
補原文 「NECは独自の無機レジスト形成法を開発
し、走査型電子線露光で世界最小の5ナノメートルのパ
ターン形成に成功した。」を、タイトル文 「NEC、
独自の無機レジスト形成法を開発」とする。ステップS
122でタイトル候補文が40文字を越えたときは、4
0文字圧縮部18へいく。また、ステップS121で候
補原文で第1WHAT採用語句の直前がWHO採用語句
でない場合は、第2段階WHAT・WHERE発見部1
6へいく(S125)。
First, it is determined whether or not the word just before the first WHAT adopted word in the candidate original text is the WHO adopted word (S12).
1). In the case of YES, it is judged whether the title candidate sentence is within 40 characters (S122), and when it is within 40 characters, it is adopted as a title sentence and the candidate original sentence discovering unit 11 is processed to process the next sentence. (S123). Example 028. Candidate original text "NEC has developed its own inorganic resist formation method and succeeded in forming the world's smallest pattern of 5 nm by scanning electron beam exposure."
Developed original inorganic resist formation method. " Step S
122 when the candidate title sentence exceeds 40 characters, 4
Go to the 0 character compression unit 18. If it is determined in step S121 that the word immediately before the first WHAT adopted word is not the WHO adopted word in the candidate original sentence, the second stage WHAT / WHERE finding unit 1
Go to 6 (S125).

【0066】WRITE条件判定部17のステップS1
21の判断で第1WHAT採用語句の直前にWHO採用
語句がないときは、第2段階WHAT・WHERE発見
部16での第2段階WHAT・WHERE発見処理を行
う。この第2段階WHAT・WHERE発見部16の処
理動作を図7を参照して説明する。
Step S1 of the WRITE condition judging section 17
When there is no WHO adopted word immediately before the first WHAT adopted word in the judgment of 21, the second step WHAT • WHERE finding processing is performed by the second step WHAT • WHERE finding section 16. The processing operation of the second stage WHAT / WHERE discovery unit 16 will be described with reference to FIG.

【0067】第2段階WHAT・WHERE発見部17
の処理は、候補原文で第1WHAT採用語句に引続き、
文頭に向かって遡り、以下の動作を行って第2段階WH
AT・WHEREを発見し、タイトル文向けに整形して
採用する。ここで、第2段階WHAT・WHERE発見
部での採用語句を第2WHAT採用語句という。また、
第2WHAT・WHERE発見のための語句を第2WH
AT採用詞という。この第2WHAT採用詞は、
“を”、“などを”、“などと”、“は”、“で”、
“である”、“では”、“でも”、“でのみ”、“でき
る”、“でできる”、“に”、“による”、“におけ
る”、“について”、“も”、“が”、“へ”、“へ
の”、“として”の語句である。
Second stage WHAT / WHERE discovery unit 17
Processing of the first WHAT adoption phrase in the candidate original text,
Go back to the beginning of the sentence and perform the following actions to perform the second stage WH
Discover AT ・ WHERE and format it for title sentences. Here, the word / phrase adopted by the second stage WHAT / WHERE discovery unit is referred to as the second WHAT / word adopted word / phrase. Also,
2nd WHAT / WHERE 2nd WH
It is called AT Adjective. This second WHAT Adjective is
“Oh”, “Ohto”, “Ototo”, “Ha”, “By”,
“Is”, “in”, “even”, “only”, “can”, “can”, “to”, “by”, “in”, “about”, “mo”, “ga” , "To", "to", and "as".

【0068】まず、候補原文を第1WHAT採用語句か
ら遡り、第2WHAT採用詞があれば、その前後の採用
可能語句を採用する。または、WRITE条件判定部1
7からのときは、第2WHAT採用詞があれば、その前
後の採用可能語句を採用する。直後が、漢字1文字もし
くは平仮名のときは、続く採用可能語句または読点まで
採用する。採用可能語句の採用のとき、その直後が平仮
名のときは、読点を付与する。直前が数詞のみの場合、
不採用とし、第2WHAT採用詞は読点に置換する(以
上S81)。例029.候補原文 「健康食品メーカー
の玄米酵母は、東京で外食・小売り分野に進出した。」
を、採用語句 「玄米酵母、東京で外食・小売り分野に
進出」とする。ここで“で”が第2WHAT採用詞であ
り“東京で”が第1WHAT採用語句の“外食・小売り
分野”の直前にあることで第2WHAT採用語句として
採用する。例030.候補原文 「フランスベットは輸
送コストの削減、ユーザーサービスの強化を図るため物
流の拠点倉庫を統廃合する。」を、採用語句「フランス
ベット、輸送コストの削減、ユーザーサービスの強化を
図るため物流の拠点倉庫を統廃合」とする。ここで、
“強化を図るため”の“を”が第2WHAT採用詞であ
り、前後の語句を含めて採用する。例031.候補原文
「シークエント、コンピューターズ・ジャパンは、マ
イクロソフトのディトナに対応する「WinServe
r」の520と3500を年内に出荷する。」を、採用
語句 「シークエント、コンピューターズ・ジャパン、
マイクロソフトのディトナに対応、年内に出荷」とす
る。“3500を”の“を”を読点として数詞を不採用
としている。
First, the candidate original sentence is traced back from the first WHAT adopted word, and if there is a second WHAT adopted word, the adoptable words before and after that are adopted. Alternatively, the WRITE condition determination unit 1
From 7 on, if there is a second WHAT adopted word, the applicable words before and after that word are adopted. If there is one Kanji character or Hiragana character immediately after, adopt up to the next applicable phrase or reading point. When hiring a phrase that can be adopted, and if it is followed by hiragana, a reading point is added. If the last word is only numbers,
It is not adopted, and the second WHAT adopted word is replaced with a reading point (above S81). Example 029. Candidate original text "Health food manufacturer brown rice yeast has entered the food and retail sector in Tokyo."
Is the hiring phrase, "Brown Rice Yeast, Entering the Food and Retail Field in Tokyo". Here, “de” is the second WHAT adopted word and “Tokyo de” is immediately before the first WHAT adopted word “restaurant / retail field”, so that it is adopted as the second WHAT adopted word. Example 030. Candidate original text "France Bet consolidates and abolishes logistics base warehouses to reduce transportation costs and enhance user services." Adopts the phrase "France Bet, logistics bases to reduce transportation costs and enhance user services. The warehouse is consolidated. here,
“To” of “to strengthen” is the second WHAT adopted word, and it is adopted including the words before and after. Example 031. Candidate original text "Sequent, Computers Japan corresponds to Microsoft's Daytona" WinService
The "r" 520 and 3500 will be shipped within the year. ”, The adopted phrase“ Sequent, Computers Japan,
It will be compatible with Microsoft's Daytona and will be shipped within the year. " Numerical words are not adopted as a reading point of "" of "3500 wo".

【0069】次にステップS82に進み、まず、第2W
HAT採用語句の直前に、修飾詞があるとき、その直前
の採用可能語句も共に採用する。また、採用語句の直前
に修飾詞があるときは順次採用しながら遡る。ただし、
直前の採用可能語句が数詞含みであるときは不採用とす
る。また、第2WHAT採用語句の直後に、修飾詞の
“の”、“から”があれば、その直後の採点可能語句も
採用する。直後が漢字1文字もしくは平仮名のとき、続
く採用可能語句または読点まで採用する。採用可能語句
の採用時にその直後が平仮名のときは、読点を付与す
る。例032.候補原文 「フランスベッドは輸送コス
トの削減、ユーザーサービスの強化を図るため物流の拠
点倉庫を統廃合する。」を、採用語句 「フランスベッ
ド、輸送コストの削減、ユーザーサービスの強化を図る
ため物流の拠点倉庫を統廃合」とする。ここで、“ユー
ザーサービスの”の“の”が第2WHAT採用語句の直
前の修飾詞であり、その直前の“ユーザーサービス”を
第2WHAT採用語句とともに採用する。例033.候
補原文 「森精機はOA機器に使用されるアルミロール
の表面を切削加工だけで面祖度〇.二Sの高精度に仕上
げる専用加工機「SFL−10/600」を開発し
た。」を、採用語句 「森精機、OA機器に使用される
アルミロールの表面を切削加工だけで高精度に仕上げる
専用加工機を開発した」とする。ここで第2WHAT採
用語句の直前の修飾詞“の”の直前の“面祖度〇.二
S”は数詞含みであるので、削除する。例034.候補
原文 「ディスカウントストアの栄ショッピングセンタ
ーは、ビールをケースのまま販売できる自動販売機「ロ
ボット自販機」を開発、九五年夏をめどに全国のDS向
けに販売する。」を、採用語句 「栄ショッピングセン
ター、ビールをケースのまま販売できる自動販売機を開
発」とする。“をケースのまま販売”が第2WHAT採
用語句となる。
Next, in step S82, the second W
When there is a modifier immediately before the HAT adopted phrase, the applicable phrase immediately before that is also adopted. If there is a qualifier immediately before the adopted phrase, it is adopted while going backward. However,
If the immediately preceding adoptable phrase contains a number, it will be rejected. If there are modifiers “no” and “from” immediately after the second WHAT adopted word, the scoring word immediately after that is also adopted. If there is one Kanji character or Hiragana character immediately after, adopt up to the next applicable phrase or reading point. When hiragana is used immediately after the adoption of an applicable phrase, a reading mark is added. Example 032. Candidate original text "France Bed will consolidate the logistics base warehouse to reduce transportation costs and enhance user services." Adopted the phrase "France Bed, logistics base to reduce transportation costs and enhance user services. The warehouse is consolidated. Here, "no" of "user service" is a modifier immediately before the second WHAT adoption word, and "user service" immediately before that is adopted together with the second WHAT adoption word. Example 033. Candidate original text "Mori Seiki has developed a dedicated processing machine" SFL-10 / 600 "that finishes the surface of aluminum rolls used in OA equipment with high precision with a surface roughness of 0.2S only by cutting. "Mori Seiki has developed a special processing machine that finishes the surface of aluminum rolls used in OA equipment with high precision only by cutting." Here, the "face ancestry degree 0.2 S" immediately before the modifier "no" immediately before the second WHAT adopted word is deleted because it includes a numeral. Example 034. Sakae shopping center of the candidate original "discount stores, we developed a vending machine" robot vending machine "that can sell beer to leave the case, to sell to the whole country of the DS for the prospect of the 1995 summer. "Sakae Shopping Center develops vending machine that can sell beer as it is." “Sell as is” is the second word adopted.

【0070】次にステップS83に進む。ここでは、採
用可能語句+「XXX」(鍵かっこ付き語句)+第2W
HAT採用詞のとき、鍵かっこの前の採用語句を採用す
る。例035.候補原文 「通信販売会社の二光は、既
存の主力カタログ「シーズニング」を商品カテゴリー別
に三分割し、それぞれの顧客に配布した。」を、採用語
句 「二光、既存の主力カタログを商品カテゴリー別に
三分割、顧客に配布」とする。ここで、第2WHAT採
用詞“を”の前の鍵かっこの前の“主力カタログ”を第
2WHAT採用語句として採用する。また、“の”、読
点、第2WHAT採用詞+鍵かっこ付き語句+第2WH
AT採用詞のとき、鍵かっこ内を鍵かっこ付きで採用す
る。それ以外は不採用とし、第2WHAT採用詞を読点
に置換する。例036.候補原文 「松下電器はパソコ
ンと接続してデスクトップのミーティングから多人数の
会議まで対応できるテレビ会議システム用の「電子ミー
ティングユニット」を十一月二五日から発売する。」
を、採用語句 「松下電器、テレビ会議システム用の
「電子ミーティングユニット」を、発売」とする。ここ
で、鍵かっこの直前が“の”であるため、鍵かっこ内を
含めて“テレビ会議システム用の”を第2WHAT採用
語句とする。ただし、採用可能語句ではない単語+鍵か
っこ付き語句+第2WHAT採用語句で、述語採用語句
が、“を設立”、“を設置”、“を実施”、“を開発”
のとき、鍵かっこ内を鍵かっこ付きで採用する。例03
7.候補原文 「郵政省は一二日、マルチメディア振興
に向けた本格推進組織として一四日に発足させる「情報
通信基盤整備推進連絡会議」に、幹事会と三部会を設置
する方針を固めた。」を、採用語句 「郵政省、一四日
に発足、「情報通信基盤整備推進連絡会議」に、幹事会
と三部会を設置」とする。また、採用可能語句+鍵かっ
こ付き語句+修飾詞+第2WHAT採用語句のとき、鍵
かっこの前の採用可能語句を採用する。なお、採用可能
語句ではない単語+鍵かっこ付き語句+修飾詞+第2W
HAT採用語句のとき、鍵かっこ内をはずして採用する
(以上ステップS83)。
Then, the process proceeds to step S83. Here, adoptable words + "XXX" (words with brackets) + 2W
In the case of HAT adoptive words, the adopted word before the brackets is adopted. Example 035. Candidate original text "The mail order company Nikko has divided the existing main catalog" Seasoning "into three product categories and distributed them to each customer. Is adopted as "Hikari, existing main catalog is divided into three product categories and distributed to customers." Here, the "main catalog" before the brackets before the second WHAT adopted word "o" is adopted as the second WHAT adopted word. Also, "no", punctuation, second WHAT Adjective + Keyword phrase + Second WH
When using the AT hieroglyph, the inside of the parenthesis is adopted with the parenthesis. Otherwise, the second WHAT adoption word is replaced with a reading point. Example 036. Candidate original text "Matsushita Electric Co., Ltd. will release" Electronic Meeting Unit "for video conferencing system that can be connected to a personal computer from desktop meetings to multi-party meetings from November 25th. "
Is adopted as the phrase "Matsushita Electric releases" electronic meeting unit for video conferencing system "." Here, since the character immediately before the parentheses is "no", "for the video conference system" including the inside of the parentheses is the second WHAT adoption phrase. However, the words that are not applicable words + the words with parentheses + the second WHAT adoption words are the predicate adoption words, "establishment", "installation", "implementation", and "development"
When, the inside of the key bracket is adopted with the key bracket. Example 03
7. Candidate original text "The Ministry of Posts and Telecommunications has established a policy of establishing a secretariat and a subcommittee in the" Information and Communication Infrastructure Development Promotion Liaison Conference "which will be established on the 12th as a full-scale promotion organization for multimedia promotion on the 14th. Is adopted as the hiring phrase "Ministry of Posts and Telecommunications, launched on the 14th, and the" Information and Communication Infrastructure Development Promotion Liaison Conference "has a secretariat and a subcommittee." In addition, when adoptable phrase + phrase with parentheses + modifier + second WHAT adoptable phrase, adoptable phrase before the bracket is adopted. Note that words that are not applicable words + words with brackets + modifiers + 2nd W
In the case of the HAT adoption word, the key parentheses are removed and adopted (above step S83).

【0071】このステップS83を終了すると、WRI
TE条件判定部17へいく。
Upon completion of step S83, the WRI
Go to the TE condition determination unit 17.

【0072】ここで、図10を参照してWRITE条件
判定処理部17での第2段階WHAT・WHERE発見
部16の出力に対するWRITE条件判定処理を説明す
る。
Now, with reference to FIG. 10, the WRITE condition judgment processing for the output of the second stage WHAT / WHERE discovery section 16 in the WRITE condition judgment processing section 17 will be described.

【0073】まず、候補原文で第2WHAT採用語句の
直前がWHO採用語句であるか、または最終採用語句か
ら遡るも第2WHAT採用詞がないかを判断する(S1
31)。YESの場合は、タイトル候補文が40文字以
内であるかを判断し(S132)、40文字以内である
ときは、タイトル文として採用し、次の文を処理するた
め候補原文発見部11へいく(S133)。例038.
候補原文 「生保業界は中小・中堅や地方の企業への株
式投資を積極化している。」を、タイトル文「生保業
界、中小・中堅の企業への株式投資を積極化」とする。
例039.候補原文 「大成建設は全社挙げてファシリ
ティー・マネジメント事業を推進、展開する。」を、タ
イトル文 「大成建設、ファシリティー・マネジメント
事業を推進」とする。ステップS132でタイトル候補
文が40文字を越えたときは、40文字圧縮部18へい
く(ステップS134)。また、ステップS131で候
補原文で第2WHAT採用語句の直前がWHO採用語句
でないか、または最終採用語句から遡るも第2WHAT
採用詞があるときは、ステップS135で、タイトル候
補文が40文字を越えているか否かを判断し、越えてい
る場合には、40文字圧縮部18へいく(S136)。
また、タイトル候補文が40文字を越えていないとき
は、再度、第2段階WHAT・WHERE発見部16へ
いく(S137)。
First, it is judged whether the word just before the second WHAT adopted word in the candidate original sentence is the WHO adopted word, or whether there is no second WHAT adopted word even if it goes back from the last adopted word (S1).
31). In the case of YES, it is determined whether the title candidate sentence is within 40 characters (S132). If it is within 40 characters, it is adopted as a title sentence, and the candidate original sentence finding unit 11 is processed to process the next sentence. (S133). Example 038.
Candidate original text "Life insurance industry is aggressively investing in stocks in small and medium-sized enterprises and local companies." The title sentence is "Active insurance investment in life insurance industry, small and medium-sized enterprises and companies."
Example 039. Candidate original text "Taisei Construction promotes and develops facility management business as a whole company." The title sentence is "Taisei Construction promotes facility management business." When the title candidate sentence exceeds 40 characters in step S132, the process proceeds to the 40-character compression unit 18 (step S134). Further, in step S131, the word just before the second WHAT adopted word in the candidate original text is not the WHO adopted word or is traced from the last adopted word, but the second WHAT
If there is an admission word, it is determined in step S135 whether or not the title candidate sentence exceeds 40 characters, and if it exceeds, the process proceeds to the 40-character compression unit 18 (S136).
If the title candidate sentence does not exceed 40 characters, the process goes to the second stage WHAT / WHERE discovering unit 16 again (S137).

【0074】WRITE条件判定部17で、タイトル候
補文が40字を越えた場合、40文字圧縮部で40文字
以内にするように文整形を行う。以下、図11および図
12を参照してその動作を説明する。
When the title candidate sentence exceeds 40 characters, the WRITE condition determining unit 17 reformulates the sentence so that it is within 40 characters by the 40-character compressing unit. The operation will be described below with reference to FIGS. 11 and 12.

【0075】ここで、以下の40文字圧縮処理で用いる
「一連の採用語句」とは、例えば“関税機能と保税倉庫
機能を備えた”のように、修飾採用詞により採用された
採用語句(従の採用語句)も含めたときの語句をいう。
Here, "a series of adopted words" used in the following 40-character compression process means an adopted word adopted by a modifier adopted word (for example, "having a customs duty function and a bonded warehouse function"). (Adopted phrase) is included.

【0076】図11は、述語発見部14および第1段階
WHAT・WHERE発見部15の出力に対する40文
字圧縮処理の動作を示すものである。
FIG. 11 shows the operation of the 40-character compression processing for the outputs of the predicate finding unit 14 and the first stage WHAT / WHERE finding unit 15.

【0077】まず、タイトル候補文中に、次の単語が存
在していたときは読点に変換する。“について”、“と
して”、“すると”、“相次いで”、“することを”、
“などを”、“などと”、“である”、“でのみ”、
“できる”、“でできる”、“による”、“におけ
る”、“について”。この読点の置換で40文字以内に
なるか否かを判断して40文字以内になったときはタイ
トル文として採用し、次の文を処理するため候補原文発
見部11へいく(S141)。
First, when the next word is present in the title candidate sentence, it is converted into a reading point. “About”, “as”, “do”, “sequel”, “do”,
"Etc.", "etc.", "is", "only in",
“Can”, “Can”, “By”, “In”, “About”. It is determined whether or not this reading point substitution is within 40 characters, and when it is within 40 characters, it is adopted as a title sentence, and the candidate original sentence finding unit 11 is processed to process the next sentence (S141).

【0078】40文字以内にならないとき、タイトル候
補文中に発出の“の”の採用語句を“の”とともに削除
し、文を詰める。この処理で40文字以内になったか判
断し、40文字以内であると、タイトル文として採用す
る(S142、S143)。これにより、ふたつの
“の”があった場合、前の方の“の”の採用語句を削除
することになる。このステップS142によっても40
文字以内にならないときは、ステップS143へいき、
タイトル候補文の後ろに“(手修正)”と付加してタイ
トル文として出力し、これを手修正扱いとして、候補原
文発見部11へいく。例040.候補原文 「古河機械
金属はバケット容量が2.5、3.0、3.8立方メー
トルの大型ホイールローダー3機種を開発、16日から
発売する。」を、タイトル文 「古河金属、大型ホイー
ルローダー3機種を開発」とする。
When the number of characters is less than 40 characters, the adopted word of "no" is deleted together with "no" in the title candidate sentence, and the sentence is packed. In this process, it is determined whether the number of characters is within 40 characters, and if the number of characters is within 40, it is adopted as a title sentence (S142, S143). As a result, when there are two "no" s, the adopted word of the previous "no" is deleted. 40 also in step S142
If it is not within the characters, go to step S143,
The title candidate sentence is added with “(hand correction)” and output as a title sentence. Example 040. Candidate original text "Furukawa Kikinzoku develops 3 large wheel loaders with bucket capacities of 2.5, 3.0 and 3.8 cubic meters and will be released from the 16th.""Develop a model".

【0079】次に図12は、第2段階WHAT・WHE
RE発見部16の出力に対する40文字圧縮処理の動作
を示すものである。
Next, FIG. 12 shows the second stage WHAT / WHE.
The operation of the 40-character compression process for the output of the RE finding unit 16 is shown.

【0080】まず、タイトル候補文中に、採用語句+
“の”+採用語句+“の”・・・のような“の”による
繋がりがあるとき、先頭の“の”による採用語句を
“の”と共に削除して文を詰める。これにより40文字
以内になればタイトル文として採用し、後、候補原文発
見部11へ行く(S151)。40文字以内にならない
ときは次のステップS152へいく。例041.候補原
文 「NECは表示画面の輝度を従来の2倍に高めた1
2インチサイズのTFT方式の液晶表示装置を開発、9
5年2月からサンプル出荷する。」のタイトル候補文
は、「NEC、表示画面の輝度を従来の2倍に高めた1
2インチサイズのTFT方式の液晶表示装置を開発」
(45文字)で、40文字オーバーであるので、ステッ
プS151の処理により、「12インチサイズの」を削
除し、タイトル文 「NEC、表示画面の輝度を従来の
2倍に高めたTFT方式の液晶表示装置を開発」(36
文字)にする。
First, in the title candidate sentence, the adopted phrase +
When there is a connection by "no" such as "no" + adopted phrase + "no" ..., the adopted phrase by "no" at the beginning is deleted together with "no" and the sentence is packed. As a result, if it is within 40 characters, it is adopted as a title sentence, and thereafter, it goes to the candidate original sentence finding unit 11 (S151). If it is not within 40 characters, go to the next step S152. Example 041. Candidate original text "NEC has doubled the brightness of the display screen to 1
Developed 2-inch TFT type liquid crystal display, 9
Samples will be shipped from February 5th. The title candidate sentence is "NEC, the brightness of the display screen is doubled from the conventional one.
Developed 2-inch TFT type LCD device
Since (45 characters) is over 40 characters, the process of step S151 deletes "12-inch size", and the title sentence "NEC, the liquid crystal of the TFT system in which the brightness of the display screen is doubled from the conventional one" is displayed. Development of display device "(36
Character).

【0081】次にステップS152では、タイトル候補
文中に、一連の採用語句+“向け”があるとき、これを
削除する。また、一連の採用語句+“向けを”+一連の
採用語句+“に”のとき、すべてを削除する。これによ
り40文字以内になればタイトル文として採用する(S
158)。また、40文字以内にならないときは次のス
テップS153へいく。例042.候補原文 「松下電
器と松下電子は12日、中国・上海市に現地企業と合弁
で家庭用VTR向け半導体の製造・販売会社を設立する
と発表した。」のタイトル候補文は、「松下電器と松下
電子、中国・上海市に現地企業と合弁で家庭用VTR向
け半導体の製造・販売会社を設立」(47文字)であ
り、「家庭用VTR向け」を削除し、タイトル文「松下
電器と松下電子、中国・上海市に現地企業と合弁で半導
体の製造・販売会社を設立」(39文字)とする。例0
43.候補原文 「新日鉄、NKKなど高炉大手会社は
94年度3四半期積み鋼材の輸出価格を東南アジア向け
を主体に値上げする。」のタイトル候補文は、「新日
鉄、NKKなど高炉大手会社、94年度3四半期積み鋼
材の輸出価格を東南アジア向けを主体に値上げ」(48
文字)であり、「東南アジア向けを主体に」を削除し、
タイトル文「新日鉄、NKKなど高炉大手会社、94年
度3四半期積み鋼材の輸出価格を値上げ」(37文字)
とする。
Next, in step S152, when there is a series of adopted words + “for” in the title candidate sentence, this is deleted. In addition, when a series of adopted words + "for" + a series of adopted words + "to", all are deleted. If it is within 40 characters, it will be adopted as the title sentence (S
158). If it is not within 40 characters, go to the next step S153. Example 042. Candidate original text "Matsushita Electric and Matsushita Electronics announced on the 12th that they will establish a joint venture with a local company to manufacture and sell semiconductors for household VTRs in Shanghai, China." Denshi established a joint venture with a local company to manufacture and sell semiconductors for home VTRs in Shanghai, China (47 characters), and deleted "for home VTRs" and gave the title sentence "Matsushita Electric and Matsushita Electronics". Established a semiconductor manufacturing and sales company in a joint venture with a local company in Shanghai, China "(39 characters). Example 0
43. Candidate original text "Large blast furnace companies such as Nippon Steel and NKK will increase the export price of steel products in Southeast Asia mainly for Southeast Asia." The title candidate sentence is "Nippon Steel, NKK, etc. Raising the export price of steel products mainly to Southeast Asia ”(48
Character) and deleted "Mainly for Southeast Asia",
Title sentence "Nippon Steel, NKK and other major blast furnace companies raise the export price of steel products loaded in the third quarter of 1994" (37 characters)
And

【0082】次にステップS153では、タイトル候補
文中に、一連の採用語句+“などを”+採用語句がある
とき、すべてを削除する。また、一連の採用語句+“な
ど”+採用語句があるとき、一連の採用語句+“など”
までを削除する。この処理により40文字以内となれば
タイトル文として採用する(S158)。また、40文
字以内にならないときは次のステップS154へいく。
例044.候補原文「NTTは12日、簡易型携帯電話
PHSの事業化に向け、10月下旬をめどに設立する企
画・調査などを行う準備会社9社の概要を発表した。」
のタイトル候補文は、「NTT、PHSの事業化に向
け、10月下旬をめどに設立、企画・調査などを行う準
備会社9社の概要を発表」(49字)であり、「企画・
調査などを行う」を削除し、タイトル文「NTT、PH
Sの事業化に向け、10月下旬をめどに設立、準備会社
9社の概要を発表」(39字)とする。例045.候補
原文 「三菱自工は20日、「シャリオ」にグリルガー
ド付きフロントバンパーなどRV関連装置を装着した特
装車「シャリオロード」を発売したと発表した。」のタ
イトル候補文は、「三菱自工、「シャリオ」にグリルガ
ード付きフロントバンパーなどRV関連装置を装着、特
装車を発売」(46字)であり、「グリルガード付きフ
ロントバンパーなど」を削除し、タイトル文「三菱自
工、「シャリオ」にRV関連装置を装着、特装車を発
売」(28文字)とする。
Next, in step S153, if the title candidate sentence contains a series of adopted words + “such as” + adopted words, all are deleted. Also, when there is a series of adopted words + "etc." + adopted words, a series of adopted words + "etc."
Delete up to. If the number of characters is within 40 characters by this processing, it is adopted as a title sentence (S158). If it is not within 40 characters, go to the next step S154.
Example 044. Candidate original "NTT is 12 days, announced the outline of preparation company 9 companies towards the commercialization of the personal handyphone PHS, carry out the planning and investigation to establish the end of October to the prospect."
Is the title of candidate statement, is "NTT, towards the commercialization of PHS, founded in prospect the end of October, announced the outline of preparation company nine companies to do the planning and investigation" (49 characters), "Planning and
"Do an investigation, etc." is deleted, and the title sentence "NTT, PH
Toward the commercialization of S, founded in prospect the end of October, announced the outline of preparation company nine companies "and (39 characters). Example 045. Candidate original text "Mitsubishi Motors Co., Ltd. announced on the 20th that it launched a specially equipped vehicle" Shario Road "equipped with RV related equipment such as a front bumper with a grill guard on the" Shario. " The candidate sentence for the title is "Mitsubishi Motors," Shario "equipped with RV related equipment such as front bumper with grill guard, specially equipped vehicle is on sale" (46 characters), and "Front bumper with grill guard etc." was deleted. "Mitsubishi Motors attaches RV-related equipment to" Shario "and sells specially-equipped vehicles" (28 characters).

【0083】次に、ステップS154では、タイトル候
補文中の“(数詞)カ国”、“(数詞)社”,“の(数
詞)社”の直前が、採用語句+読点で複数存在すると
き、先頭の採用語句に、“など”を付与して他を削除す
る。この処理により40文字以内となればタイトル文と
して採用する(S158)。また40文字以内にならな
いときは次のステップS155へいく。例046.候補
原文 「太平洋交流センターは94年度中に中国、ロシ
ア、ベトナム3カ国の帰国研修生による同窓会を組織す
る。」のタイトル候補文は、「太平洋交流センター、9
4年度中に中国、ロシア、ベトナム3カ国の帰国研修生
による同窓会を組織」(45文字)であり、「中国、ロ
シア、ベトナム」を「中国など」に置換し、タイトル文
「太平洋交流センター、94年度中に中国など3カ国の
帰国研修生による同窓会を組織」(38文字)とする。
Next, in step S154, when there are a plurality of adopted words + reading points immediately before "(numerical) country", "(numerical) company", and "no (numerical) company" in the title candidate sentence, the head is found. Add "etc." to the adopted word and delete the others. If the number of characters is within 40 characters by this processing, it is adopted as a title sentence (S158). If it is not within 40 characters, go to the next step S155. Example 046. Candidate original text "Pacific Exchange Center will organize an alumni association of returnees from China, Russia, and Vietnam in 1994." The title candidate sentence is "Pacific Exchange Center, 9
"Alumni association organized by returnees from three countries, China, Russia, and Vietnam during the 4th fiscal year" (45 characters), replacing "China, Russia, Vietnam" with "China, etc." Organized an alumni association of returnees from three countries such as China during 1994 "(38 letters).

【0084】次に、ステップS155では、タイトル候
補文中に、一連の採用語句+“備えた”があるとき、す
べてを削除する。この処理により40文字以内となれば
タイトル文として採用する(S158)。また40文字
以内とならないときは次のステップS156へいく。例
047.候補原文 「日通は滋賀県栗東町の栗東支店内
に税関機能と保税倉庫機能とを備えた内陸物流基地であ
るインランドデポを開設、運用を開始した。」のタイト
ル候補文は、「日通、滋賀県栗東町の栗東支店内に税関
機能と保税倉庫機能とを備えた内陸物流基地であるイン
ランドデポを開設」(50文字)であり、「税関機能と
保税倉庫機能とを備えた」を削除してタイトル文「日
通、滋賀県栗東町の栗東支店内に内陸物流基地であるイ
ンランドデポを開設」(35文字)とする。
Next, in step S155, when the title candidate sentence includes a series of adopted words + “prepared”, all of them are deleted. If the number of characters is within 40 characters by this processing, it is adopted as a title sentence (S158). If it is not within 40 characters, go to the next step S156. Example 047. Candidate original text "Nippon has opened and started operation of Inland Depot, an inland logistics base with a customs function and a bonded warehouse function in the Ritto branch in Ritto-cho, Shiga Prefecture.""Inland Depot, an inland logistics base with customs and bonded warehouse functions, was opened in the Ritto branch in Ritto-cho, Shiga Prefecture" (50 characters), and "with both customs and bonded warehouse functions" Deleted and added the title sentence "Nippon Express, Inland Depot, which is an inland logistics base, in the Ritto Branch in Ritto Town, Shiga Prefecture" (35 characters).

【0085】次に、ステップS156では、候補原文
に、“期決算”があるときには、「WHO採用語句+読
点+“(数詞)年”+“(数詞)月”期決算見通し”+
句点+第1WHAT採用語句+述語採用語句」のパター
ンで出力する。この処理により40文字以内となればタ
イトル文として採用する。また40文字以内とならない
ときは次のステップS157へいく。これは決算発表等
の定型的な文章は、定型的なタイトル文に変換する例で
ある。例048.候補原文 「松屋は、19日、95年
2月期決算予想で当初見込みの経常利益3億5千万円を
5億8千万円へ、当期利益も1億5千万円から2億7千
万円へとそれぞれ上方修正すると発表した。」のタイト
ル候補文は、「松屋、当初見込みの経常利益3億5千万
円を5億8千万円、当期利益も1億5千万円から2億7
千万、上方修正すると発表」であり、タイトル文は、
「松屋、95年2月期決算見通し。上方修正すると発
表」とする。
Next, in step S156, when the candidate original sentence includes "term settlement", "WHO adopted word + reading point +" (number) year "+" (number) month "term settlement forecast" +
The phrase "first point + first WHAT adopted word + predicate adopted word" is output. If this process results in less than 40 characters, it is adopted as a title sentence. If it is not within 40 characters, the process goes to the next step S157. This is an example of converting a standard sentence such as a financial statement announcement into a standard title sentence. Example 048. Candidate original text "Matsuya forecasted ordinary income of 350 million yen to 580 million yen on the 19th February 1995 financial forecast, and net income also increased from 150 million yen to 207 million yen. The title candidate sentence of "Announced upward revision to 10 million yen each," was "Matsuya, initial forecast ordinary income of 350 million yen, 580 million yen, and net income of 150 million yen. From 207
It is announced that 10 million will be revised upwards, and the title sentence is,
"Matsuya forecasts the financial results for the fiscal year ending February 1995. It will be announced when the upward revision is made."

【0086】最後にステップS157では、最終の第2
段階WHAT採用語句を採用することで、40字オーバ
ーとなっているので、その語句を不採用とする。例.候
補原文 「シンオウは、ネットワーク部門強化の一環と
して米国アポジー社のUNIX機向けコンパイラーソフ
ト「アポジー・スパーク・コンパイラーズ」の販売を開
始した。」のタイトル候補文は、「シンオウ、ネットワ
ーク部門強化の一環として米国アポジー社のUNIX機
向けコンパイラーソフトの販売を開始」であり、40文
字オーバーであるので、第2段階WHAT採用語句の
「ネットワーク部門強化の一環として」を不採用とし、
タイトル文は、「シンオウ、米国アポジー社のUNIX
機向けコンパイラーソフトの販売を開始」に圧縮する。
Finally, in step S157, the final second
By adopting the staged WHAT adoption word, it is over 40 characters, so the word is not adopted. Example. Candidate original text "Shin-Oh began selling" Apogee Spark Compilers ", a compiler software for UNIX machines by Apogee, USA as part of strengthening the network division. The candidate sentence for the title is "Shin Oh, we are beginning to sell compiler software for UNIX machines by Apogee, USA as part of strengthening the network division." Since it exceeds 40 characters, the second stage WHAT adoption phrase "Network division" As a part of strengthening, ”
The title sentence is "Shin Ou, UNIX of Apogee, USA
Start selling the compiler software for machines. "

【0087】[0087]

【発明の効果】本発明はこのような処理を行うことで、
自動的にタイトル文を作成できるため、省力化を図るこ
とができる効果がある。また、短時間で処理ができるよ
うになったため、短時間で記事データベースをユーザに
提供できる効果がある。
According to the present invention, by performing such processing,
Since the title sentence can be created automatically, there is an effect that labor can be saved. Further, since the processing can be performed in a short time, there is an effect that the article database can be provided to the user in a short time.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明実施例のタイトル文作成装置の構成例を
示す図。
FIG. 1 is a diagram showing a configuration example of a title sentence creation device according to an embodiment of the present invention.

【図2】候補原文発見部の動作を説明するフローチャー
ト。
FIG. 2 is a flowchart illustrating an operation of a candidate original text finding unit.

【図3】前処理部の動作を説明するフローチャート。FIG. 3 is a flowchart illustrating an operation of a preprocessing unit.

【図4】WHO発見部の動作を説明するフローチャー
ト。
FIG. 4 is a flowchart illustrating an operation of a WHO discovery unit.

【図5】述語発見部の動作を説明するフローチャート。FIG. 5 is a flowchart illustrating an operation of a predicate finding unit.

【図6】第1段階WHAT・WHERE発見部の動作を
説明するフローチャート。
FIG. 6 is a flowchart for explaining the operation of the first stage WHAT / WHERE discovery unit.

【図7】第2段階WHAT・WHERE発見部の動作を
説明するフローチャート。
FIG. 7 is a flowchart for explaining the operation of the second stage WHAT / WHERE discovery unit.

【図8】WRITE条件判定部の動作を説明するフロー
チャート。
FIG. 8 is a flowchart illustrating the operation of a WRITE condition determination unit.

【図9】WRITE条件判定部の動作を説明するフロー
チャート。
FIG. 9 is a flowchart illustrating the operation of a WRITE condition determination unit.

【図10】WRITE条件判定部の動作を説明するフロ
ーチャート。
FIG. 10 is a flowchart illustrating the operation of a WRITE condition determination unit.

【図11】40文字圧縮部の動作を説明するフローチャ
ート。
FIG. 11 is a flowchart illustrating the operation of the 40-character compression unit.

【図12】40文字圧縮部の動作を説明するフローチャ
ート。
FIG. 12 is a flowchart illustrating an operation of a 40-character compression unit.

【符号の説明】[Explanation of symbols]

11 候補原文発見部 12 前処理部 13 WHO発見部 14 述語発見部 15 第1段階WHAT・WHERE発見部 16 第2段階WHAT・WHERE発見部 17 WRITE条件判定部 18 40文字圧縮部 11 Candidate Original Text Finding Section 12 Pre-Processing Section 13 WHO Finding Section 14 Predicate Finding Section 15 First Stage WHAT / WHERE Discovering Section 16 Second Stage WHAT / WHERE Discovering Section 17 WRITE Condition Determining Section 18 40 Character Compressing Section

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 原記事の本文の先頭からタイトル文作成
に適合する候補原文を文単位で抽出する候補文抽出手段
(11)と、 抽出した候補原文からタイトル文に必要な主語を表す語
句および述語を表す語句を発見して抽出する主語および
述語抽出手段(13、14)と、 抽出した語句でタイトル文として適合するか否かを判断
する判定手段(17)と、 この判定手段でタイトル文として適合すると判断された
文をタイトル文に必要な字数に圧縮する圧縮手段(1
8)とを含み、 前記判定手段は、抽出した主語および述語との間にタイ
トル文として採用可能な語句があるか否かを判断する手
段を含むことを特徴とするタイトル文作成装置。
1. A candidate sentence extracting unit (11) for extracting a candidate original sentence suitable for creating a title sentence from the beginning of a main body of an original article, sentence by sentence, and a phrase representing a subject necessary for a title sentence from the extracted candidate original sentence, and Subject and predicate extraction means (13, 14) for finding and extracting a word representing a predicate, judgment means (17) for judging whether or not the extracted word is suitable as a title sentence, and this judgment means for the title sentence A compression means (1) for compressing a sentence determined to match as the number of characters required for a title sentence.
8) and the determination means includes means for determining whether or not there is a phrase that can be adopted as a title sentence between the extracted subject and predicate.
【請求項2】 前記判定手段で主語および述語の間にタ
イトル文として採用可能な語句があると判断された場合
に、主語および述語との間に存在する文の目的語または
補語を示す第一のWHAT採用語句があるか否かを検索
する第一のWHAT発見手段(15)を備え、 前記判定手段は、この第一のWHAT発見手段で発見し
た第一のWHAT採用語句と主語との間にタイトル文と
して採用可能な語句があるか否かを判断する手段を含む
請求項1記載のタイトル文作成装置。
2. A first object indicating an object or a complement of a sentence existing between the subject and the predicate when the determining unit determines that there is a phrase that can be adopted as a title sentence between the subject and the predicate. A first WHAT finding means (15) for searching whether or not there is a WHAT adopted word or phrase, wherein the determining means is between the first WHAT adopted word and the subject found by the first WHAT finding means. The title sentence creating apparatus according to claim 1, further comprising means for determining whether or not there is a phrase that can be adopted as a title sentence.
【請求項3】 前記判定手段で第一のWHAT採用語句
と主語との間にタイトル文として採用可能な語句がある
と判断された場合に、主語と第一のWHAT採用語句と
の間に文の目的語または補語を表す第二のWHAT採用
語句があるか否かを検索する第二のWHAT発見手段
(16)を含む請求項2記載のタイトル文作成装置。
3. The sentence between the subject and the first WHAT adopted word, when the judgment unit judges that there is a word that can be adopted as a title sentence between the first WHAT adopted word and the subject. 3. The title sentence creating device according to claim 2, further comprising second WHAT finding means (16) for searching whether or not there is a second WHAT adopted word or phrase that represents the object or complement of the above.
【請求項4】 主語および述語発見手段は、候補原文中
の主語を表す語の後につく語彙の主語採用詞を発見して
主語を抽出し、候補原文中の述語を表す語の前につく語
彙の述語採用詞を発見して述語を抽出する手段を含む請
求項1ないし3のいずれか記載のタイトル文作成装置。
4. The subject and predicate finding means finds a subject adoptive word of a vocabulary that follows a word representing a subject in a candidate original sentence, extracts the subject, and adds the vocabulary before a word representing a predicate in the candidate original sentence. 4. The title sentence creating device according to claim 1, further comprising means for finding a predicate adopting word and extracting the predicate.
【請求項5】 主語および述語発見手段の前段に、採用
した候補原文中からタイトル文に不要な語句または記号
を削除する前処理手段を含む請求項1記載のタイトル文
作成装置。
5. The title sentence creating apparatus according to claim 1, further comprising a pre-processing unit for deleting unnecessary words or symbols in the title sentence from the adopted candidate original sentence, before the subject and predicate finding unit.
JP7193426A 1995-07-28 1995-07-28 Title sentence preparing device Pending JPH0944497A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7193426A JPH0944497A (en) 1995-07-28 1995-07-28 Title sentence preparing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7193426A JPH0944497A (en) 1995-07-28 1995-07-28 Title sentence preparing device

Publications (1)

Publication Number Publication Date
JPH0944497A true JPH0944497A (en) 1997-02-14

Family

ID=16307780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7193426A Pending JPH0944497A (en) 1995-07-28 1995-07-28 Title sentence preparing device

Country Status (1)

Country Link
JP (1) JPH0944497A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112966A (en) * 1998-10-02 2000-04-21 Nippon Telegr & Teleph Corp <Ntt> Headline generation device, headline generation processing method and record medium recording program describing the method
JP2000339250A (en) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> Dialog message generating method, its device and medium in which its program is recorded
JP2001147937A (en) * 1999-11-22 2001-05-29 Toshiba Corp Job support system
JP2003076688A (en) * 2001-08-30 2003-03-14 Just Syst Corp Sentence end expression simplifying device, method therefor, and sentence end expression simplifying program
WO2005078604A1 (en) * 2004-02-13 2005-08-25 Hitachi, Ltd. Character display method
JP2005258676A (en) * 2004-03-10 2005-09-22 Seiko Epson Corp Document outputting device and its control method
JP2019057266A (en) * 2017-09-20 2019-04-11 ヤフー株式会社 Generation device, learning apparatus, generation method, learning method, generation program, learning program, and model
CN111353070A (en) * 2020-02-18 2020-06-30 北京百度网讯科技有限公司 Video title processing method and device, electronic equipment and readable storage medium

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112966A (en) * 1998-10-02 2000-04-21 Nippon Telegr & Teleph Corp <Ntt> Headline generation device, headline generation processing method and record medium recording program describing the method
JP2000339250A (en) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> Dialog message generating method, its device and medium in which its program is recorded
JP2001147937A (en) * 1999-11-22 2001-05-29 Toshiba Corp Job support system
JP2003076688A (en) * 2001-08-30 2003-03-14 Just Syst Corp Sentence end expression simplifying device, method therefor, and sentence end expression simplifying program
WO2005078604A1 (en) * 2004-02-13 2005-08-25 Hitachi, Ltd. Character display method
KR100865825B1 (en) * 2004-02-13 2008-10-28 가부시키가이샤 히타치세이사쿠쇼 Character display method and information terminal
JP2005258676A (en) * 2004-03-10 2005-09-22 Seiko Epson Corp Document outputting device and its control method
JP4572321B2 (en) * 2004-03-10 2010-11-04 セイコーエプソン株式会社 Document output apparatus and control method thereof
JP2019057266A (en) * 2017-09-20 2019-04-11 ヤフー株式会社 Generation device, learning apparatus, generation method, learning method, generation program, learning program, and model
CN111353070A (en) * 2020-02-18 2020-06-30 北京百度网讯科技有限公司 Video title processing method and device, electronic equipment and readable storage medium
CN111353070B (en) * 2020-02-18 2023-08-18 北京百度网讯科技有限公司 Video title processing method and device, electronic equipment and readable storage medium

Similar Documents

Publication Publication Date Title
Prasad et al. The penn discourse treebank 2.0 annotation manual
US7356541B1 (en) Processing business data using user-configured keys
CN110210952B (en) Bidding evaluation method and device
CN112907333B (en) Intelligent matching method, device and equipment based on block chain and storage medium
CN102332133A (en) Virtual item trading method and system using electronic tags
JPH0944497A (en) Title sentence preparing device
JP2004139208A (en) Device, system, method, and program for accounting
CN114549241A (en) Contract examination method, device, system and computer readable storage medium
CN112434501A (en) Work order intelligent generation method and device, electronic equipment and medium
JP2003091694A (en) Method for processing abstract
CN1641704A (en) Self-assistant service terminal with visual dialogue, self-assistant service system and use method
JP2015049741A (en) Accounting information processing device, accounting information processing method, and program
Zhou et al. China's advertising and the export marketing learning curve: the first decade
CN108830610A (en) A kind of contract automatic generation method based on online sale, social software
CN2718685Y (en) Self-service terminal and self-service system with visual conversation
Lee et al. Intelligent agent based contract process in electronic commerce: UNIK-AGENT approach
Najjar Designing e-commerce user interfaces
WO2004027668A1 (en) Estate group purchasing matching system
US7546304B1 (en) Configuring keys for use in processing business data
TWM590719U (en) Intelligent conversation management system based on natural language processing
CN108959241A (en) A kind of contract automatic generation method based on session log, social software
Roberts Coming out of Covid
Uchihira Stage gate analysis in business-academia collaborative project
Heng Understanding electronic commerce from a historical perspective
Lewis Electronic data interchange in the construction industry