JPS60157659A - Japanese language analyzing system - Google Patents

Japanese language analyzing system

Info

Publication number
JPS60157659A
JPS60157659A JP59011918A JP1191884A JPS60157659A JP S60157659 A JPS60157659 A JP S60157659A JP 59011918 A JP59011918 A JP 59011918A JP 1191884 A JP1191884 A JP 1191884A JP S60157659 A JPS60157659 A JP S60157659A
Authority
JP
Japan
Prior art keywords
clause
case
word
phrase
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59011918A
Other languages
Japanese (ja)
Inventor
Yoshimitsu Oshima
大島 義光
Masahiro Abe
正博 阿部
Noriyuki Takechi
武市 宣之
Akira Nakajima
晃 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59011918A priority Critical patent/JPS60157659A/en
Publication of JPS60157659A publication Critical patent/JPS60157659A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To analyze exactly a sentence of Japanese language by executing a determination of a related destination of a sentence clause by deciding a coincidence of the sentence clause, a particle of the case of a case pattern, and a meaning. CONSTITUTION:An input sentence 200 is inputted to a word dividing part 1, and the dividing part 1 utilizes word information accumulated in advance in a word dictionary storage part 4, divides the input sentence 200 into trains of a word unit and sends it to a sentence clause assembling part 2. The assembling part 2 uses grammar information in a sentence clause, stored in an in-sentence clause grammar information storage part 5, basing on a received word train data 210, and assembles the word train data 210 to plural sentence clause units. A relation receiving and analyzing part 3 uses case pattern information of a term stored in a case pattern dictionary storage part 6, analyzes a sentence train data 220 sent from the assembling part 2, decides a related reception of a sentence clause and outputs an analysis result 230.

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は日本語文章會解析する方式に係り、特に用言の
格パターン内用いて文節と文節の係り受けの解析全行な
う日本語解析方式に関する。
[Detailed Description of the Invention] [Field of Application of the Invention] The present invention relates to a method for analyzing Japanese text, and particularly relates to a Japanese language analysis method that performs all the analysis of clauses and their dependencies by using them within case patterns of predicates. .

〔発明の背景〕[Background of the invention]

従来格パターン、すなわち日本語の用言が特有の格支配
構造ケ持つことに注目し、日本語の用言とそれに支配さ
れる単語特に名詞との文法および意味的な制約条件ケ利
用して、日本語文章の解析を行なう方法がある。これは
、一つの用言と、それに係る名詞文節の関係茫解析する
ものであり、基本的には単文用の解析方法である。
Focusing on the conventional case pattern, that is, the unique case-dominant structure of Japanese pragmatics, we use the grammatical and semantic constraints of Japanese pragmatics and the words that are dominated by them, especially nouns. There is a method to analyze Japanese sentences. This is a method for analyzing the relationship between a single predicate and the noun clause related to it, and is basically an analysis method for simple sentences.

しかし、実際の文章に現われる文には単文は少なく、殆
んどの場合、用言?複数台む複文である。
However, the sentences that appear in actual sentences are rarely simple sentences, and in most cases they are phrases? It is a complex sentence containing multiple units.

単文の場合、用言に先行する名詞文節は全てその用言に
係るので、係り受けのあい渣いさはない。
In the case of a simple sentence, all noun clauses preceding the predicate are related to the predicate, so there is no difference in dependencies.

したがって、このときの解析は、各名詞文節の用言に対
する格と意味による解析が主体となる。
Therefore, the analysis at this time is mainly based on the case and meaning of the predicate of each noun clause.

ところが、複文の場合、一般に名詞文節と用言の間には
係り受けのあいまいさがある。
However, in the case of complex sentences, there is generally ambiguity in the dependency between the noun clause and the predicate.

従来、これに対して格支配栴造以外の日本語の文法的情
報や、予め作成しである典型的複文ノ′:ターンケ利用
して、あい捷いさ?減らすことが行なわれている。部分
的にはこれで解決できるものもめるが、一般には、あい
まいさが解消されないか、または解析ケ誤ることが多い
という問題がある。
Conventionally, Japanese grammatical information other than the case-dominant Senzo, or the typical compound sentence ': Turnke, which is prepared in advance, has been used to make use of Aisyisa? efforts are being made to reduce it. Although this may partially solve the problem, the general problem is that ambiguities are not resolved or the analysis is often incorrect.

〔発明の目的〕[Purpose of the invention]

本発明の目的は、上記のような文法内情wないしは経験
的な複文パターンでは解消されない複文内の係り受けの
めい捷いさ茫解消するために、用言の格支配構造が持つ
情報ケ、複文の解析レベルで利用して、日本語文章ケ適
確に解析する日本語解析方式ケ提供することにある。
The purpose of the present invention is to solve the problems of dependencies in complex sentences that cannot be solved by the above-mentioned grammatical information or empirical complex sentence patterns. The objective is to provide a Japanese language analysis method that can be used at the analysis level to accurately analyze Japanese sentences.

〔発明の概要〕[Summary of the invention]

本発明は、上記の目的ケ達成するために、日本語の単語
とそれに関わる文法情報・意味情報ケ格納した単語辞書
、およびこれケ用いて日本語文ケ単語要素に分割する単
語分割部と、文節内の単語要素間の文法的関係?格納し
た文節的文法情報記憶部とこれケ用いて分割された単語
要素から文節2組み立て文節列音出力する文節組み立て
部と、用言とそれが支配する単語との文法的および意味
的関係に関する情報?格納した格パターン辞書お工びこ
れケ利用して文節列からなる日本語の係り受け解析全行
なう係り受け解析部とケ有する日本語解析方式において
、文節と格パターンの格の助詞と意味の一致判定?利用
することにより、文節の係り先ケ決定し、捷た、用言の
格パターンの格が全て照合済で、照合対象となる格がな
い文節が生じたときは、そのこれケ利用して、その文節
?より後方の用言の係り受け解析対象とすることケ特徴
とする。
In order to achieve the above object, the present invention provides a word dictionary that stores Japanese words and their related grammatical and semantic information, a word division unit that uses this to divide a Japanese sentence into word elements, and a phrase dictionary. Grammatical relationships between word elements within? The stored phrase-like grammatical information storage section, the phrase assembly section that assembles phrase 2 from the divided word elements and outputs the sounds of the phrase sequence, and information regarding the grammatical and semantic relationships between the phrasal and the word it controls. ? In the Japanese language analysis method that includes a dependency analysis unit that uses the stored case pattern dictionary to perform all the dependency analysis of Japanese consisting of a string of phrases, it is possible to match the case particles and meanings of phrases and case patterns. judgement? By using this method, you can determine the dependencies of a clause, and if all the cases in the case pattern of the disjunction have been matched, and there is a clause that does not have a case to match, use this, That phrase? It is characterized by the dependency analysis of later predicates.

〔発明の実施例〕[Embodiments of the invention]

以下、本発明の一実施例ケ図面?用いて詳細に説明する
The following is a drawing of an embodiment of the present invention. This will be explained in detail using

第1図は、本発明ケ実現するための日本語解析システム
の一実施例を示した構成図である。lは単語分割部、2
は文節組み立て部、3は係り受け解析部、4は単語辞書
記憶部、5は文節的文法情報記憶部、および6は格パタ
ーン辞書記憶部である。
FIG. 1 is a block diagram showing an embodiment of a Japanese language analysis system for realizing the present invention. l is word segmentation part, 2
3 is a clause assembly section, 3 is a dependency analysis section, 4 is a word dictionary storage section, 5 is a clause-like grammar information storage section, and 6 is a case pattern dictionary storage section.

電子耐昇機等のキーボードなどケ利用して作成された入
力文200は、単語分割部lに入力される。
An input sentence 200 created using a keyboard such as an electronic lifter is input to a word dividing section l.

単語分割部lは、単語辞書記憶部4に予め蓄積されてい
る単語情@會利用して、入力文200ケ年飴単位の列(
単語列)に分割し、次の文節組み立て部2に送る。単語
辞書記憶部4には、日本語の単語およびその単語の文法
情報、意味情報などが記憶されており、単語分割部lに
より入力文200が単語に分割されたとき、単語に付随
している文法情報、意味情報は、単語列データ210と
ともに次の文節組み立て部2に送られる。
The word dividing unit l uses the word information stored in advance in the word dictionary storage unit 4 to divide the input sentence into a string of 200 pieces of candy (
It is divided into word strings) and sent to the next clause assembly section 2. The word dictionary storage unit 4 stores Japanese words and grammatical information, semantic information, etc. of the words, and when the input sentence 200 is divided into words by the word division unit l, the words attached to the words are stored. The grammatical information and semantic information are sent to the next phrase assembly section 2 together with the word string data 210.

文節組み立て部2は、受は取った単語列データ210に
もとに、文節的文法情報記憶部5に記憶している文節白
文it*@i使用して、単語列データ210に複数の文
節単位に組み立てる。通常、日本語の文節は、一つの自
立語と、それに続く0個以上の付拠飴から成ると考えら
れており、文節的文法情報記憶部5には、これらの自立
語・付楓飴の連接条件が記憶されている。また、一般に
、文節が後続する体言に係るか用言に係るかt示す修飾
の型は、文節末尾の飴により判別可能であり、これケ示
す情報も、文節的文法情報記憶部5に記憶されている。
Based on the received word string data 210, the phrase assembling section 2 uses the phrase white sentence it*@i stored in the phrase-based grammar information storage section 5 to assemble a plurality of phrase units into the word string data 210. Assemble to. Normally, a Japanese phrase is considered to consist of one independent word followed by zero or more dependent candy, and the phrase-based grammar information storage unit 5 stores the information of these independent words and attached maple candy. Connection conditions are memorized. Additionally, in general, the type of modification that indicates whether the clause is related to the following nominal or predicate can be determined by the candy at the end of the clause, and information indicating this is also stored in the clause-based grammatical information storage unit 5. ing.

例えば、単語列データ210中に「・・・私は・・・」
という単語列かめるとき、「私」は自立語であり、「は
」は付&語の一つである係り助詞でるる。係り助詞は、
通常、名詞とともに連用修飾文節(用言に係る文節)ケ
構成するので、文節組み立て部2はこれらの情報ケ利用
して、単語列データ210中から「私は」紫切り出して
、文節に組み立て、かつ、これケ連用修飾文節と判定す
る。
For example, in the word string data 210, "...I am..."
When we write the word string, ``wa'' is an independent word, and ``wa'' is a dependent particle, which is one of the attached & words. The dependent particle is
Normally, conjunctive modifier clauses (clauses related to predicates) are formed together with nouns, so the clause assembling unit 2 uses this information to cut out "Watashi wa" purple from the word string data 210 and assemble it into a clause. And this is determined to be a conjunctive modifier clause.

係り受け解析部3は、格パターン辞書記憶部6に記憶さ
れている用言の格パターン情報ケ使用して、文節組み立
て部2から送られた文節列テーク220ケ解析して、文
節の係り受けケ判定し、解析結果230ケ出力する。
The dependency analysis unit 3 uses the case pattern information of the predicates stored in the case pattern dictionary storage unit 6 to analyze the 220 clause strings sent from the clause assembly unit 2, and determines the dependencies of the clauses. 230 analysis results are output.

第2図に、係り受け解析部3の内部構成ケ示す。FIG. 2 shows the internal configuration of the dependency analysis section 3.

31は文節列記憶部で、文節組み立て部2から送られて
きた文節列データ220げ、一時的にここに貯えられる
。32は単文切り出し部で、文節列記憶部31に走査し
て、用言1個と1つ以上の連用修飾文節からなる単文単
位ケ切り出して、連用修飾文節記憶部34と用言文節記
憶部35に得られた単文データケ格納して、制御ケ格パ
ターン照合部33に渡す。
Reference numeral 31 denotes a phrase string storage section, in which the phrase string data 220 sent from the phrase assembling section 2 is temporarily stored. Reference numeral 32 denotes a simple sentence extraction section which scans the clause string storage section 31, cuts out single sentence units consisting of one predicate and one or more conjunctive modifier clauses, and extracts them into the clause string storage section 34 and the conjunctive modification clause storage section 35. The obtained simple sentence data is stored and passed to the control case pattern matching unit 33.

格パターン照合部33は、連用修飾文節記憶部34と、
用言文節記憶部35に格納されたデータに従がい、まず
、用言文節記憶部35の内容ケもとに、格パターン辞書
記憶部6葡参照し、注目している用言の格パターンケ、
格パターン一時的記憶部36に取り込む。次に、この格
パターンを用いて、連用修飾文節記憶部34内の文節の
係り受け解析全行ない、結果ケ文節列記憶s31の対応
するスロットに書き込む。解析は、単文切り出し部32
が最も最近連用修飾文節記憶部34に登録した文節から
順に一つずつ行なう。解析可能な全ての連用修飾文節の
処理終了後、格パターン照合部33は、単文切り出し部
32に処理終了葡報告する。このとき、係り受け解析が
失敗し、係り先が固定できない文節が残ることがあるが
、これらは、連用修飾文節記憶部34に残し、解析が成
功したものは、連用修飾文節記憶部34から消去する。
The case pattern matching unit 33 has a conjunctive modifier clause storage unit 34,
Following the data stored in the predicate phrase storage section 35, first, based on the contents of the predicate phrase storage section 35, refer to the case pattern dictionary storage section 6 to determine the case pattern of the predicate of interest,
The case pattern is imported into the temporary storage section 36. Next, using this case pattern, all lines of the dependency analysis of the phrase in the conjunctive modifier phrase storage section 34 are written into the corresponding slots of the resultant phrase string storage s31. The analysis is performed by the simple sentence extraction section 32.
The phrases are performed one by one in the order starting from the phrase most recently registered in the conjunctive modification phrase storage section 34. After completing the processing of all the conjunctive modifier clauses that can be analyzed, the case pattern matching unit 33 notifies the simple sentence extraction unit 32 that the processing has been completed. At this time, the dependency analysis may fail and some phrases whose dependencies cannot be fixed may remain, but these will remain in the conjunctive modifying phrase storage section 34, and those for which the analysis is successful will be deleted from the conjunctive modifying phrase storage section 34. do.

単文切り出し部32は、格パターン照合部33から終了
報告ケ受けると、文節列記憶部31に残っている文節列
?走査し、単文単位?切り出して、連用修飾文節記憶部
34と用言文節記憶部35に誉き込み、その後、格パタ
ーン照合部33紫再び起動する。このとき、連用修飾文
節記憶部34には、前回の解析の結果、解析が失敗して
残されている文節があることがめるが、このときは、そ
れに続けて、新らしく切り出した連用修飾文節?書き込
む。しかし、格パターン照合部33では、これらの積み
残しの文節と、新しく切り出した文節は区別せず解析全
行なう。
When the simple sentence extraction section 32 receives the completion report from the case pattern matching section 33, the simple sentence extraction section 32 selects the phrase string remaining in the phrase string storage section 31. Scan and single sentence unit? It is cut out and stored in the conjunctive modifier phrase storage section 34 and the pragmatic phrase storage section 35, and then the case pattern matching section 33 is activated again. At this time, it can be seen that there are phrases left as a result of the previous analysis failure in the conjunctive-modifying phrase storage section 34, but in this case, the continuation-modifying phrase storage unit 34 may contain phrases that have been left as a result of failure in the previous analysis. Write. However, the case pattern matching unit 33 performs all analyzes without distinguishing between these remaining clauses and newly cut clauses.

以上の、単文切り出しs32と格パターン照合部33に
よる交互の処理からなるサイクルケ、文節外記憶部31
内に解析すべき文節が失くなるまで続け、この結果、文
節列記憶部31に得られ九結果?解析結果230として
出力する。
The cycle consisting of the above-mentioned simple sentence extraction s32 and the alternating processing by the case pattern matching unit 33, the extra-bunsetsu storage unit 31
This continues until there are no more phrases to be analyzed, and as a result, nine results are obtained in the phrase string storage section 31. It is output as an analysis result 230.

第3図、第4図はそれぞれ単文切り出し部32お工び格
パターン照合g33の一動作例ケ示すフローチャートで
ある。
FIGS. 3 and 4 are flowcharts each showing an example of the operation of the simple sentence segmentation section 32 and case pattern matching g33.

捷だ、第5図は、単語分割部1と文節組み立て部2によ
る処理の結果、文節外記憶部31内に生成された文節列
の例紫示す。第5図の係り売文節の欄と格の欄は空白に
なっているが、ここは、格パターン照合部33の処理後
、必要な情報が曹き込まれる。
5 shows an example of a phrase string generated in the extra phrase storage section 31 as a result of the processing by the word segmentation section 1 and the phrase assembly section 2. In FIG. 5, the column of dependent phrases and the column of case are blank, but necessary information is filled in after processing by the case pattern matching section 33.

第3因〜第5図?用いて、例題により本実施例の動作音
より詳細に説明する。
3rd cause ~ 5th figure? The operation sounds of this embodiment will be explained in more detail using examples.

(A)単文切り出し部32での処理(そのl)普す、最
初に、文節列記憶部31の読み出し位首全文節列記憶部
31の先頭に合わせる(ステップ101 )。次に、文
節外記憶部31内のデータケすべて読みとったか確認す
るが(ステップ102)、今は最初であるため次へ進み
、文節列記憶部31から文節チー%?r1つ読み出しく
ステップ103)、文節列記憶部31の読み出し位置に
1つ進めておく(ステップ104)。今読み出した文節
は、第5図の符号231で示すように、 「私は」であ
る。
(A) Processing in the simple sentence extraction section 32 (Part 1) First, the reading position of the phrase string storage section 31 is adjusted to the beginning of the entire phrase string storage section 31 (step 101). Next, it is checked whether all the data in the bunsetsu string memory section 31 have been read (step 102), but since this is the first time, proceed to the next step and read the bunsetsu column storage section 31 to find the bunsetsu string %? Read out one r item (step 103), and advance one position to the reading position in the phrase string storage section 31 (step 104). The clause just read out is ``I am'' as shown by the reference numeral 231 in Figure 5.

この文節(1用言文節ではないため(ステップ105)
、この文節?連用修飾文節記憶m34に登録しくステッ
プ106)、ステップ102へもどる。角度、ステップ
102,103,104と進み、次に符号231で示す
「桜が」が呼み出されるが、これも用言文節ではないた
め、連用修飾文節記憶部34に登魅し、ステップ102
へもどる(ステップ105,106)。また、ステップ
102゜103.104に進むと、今度は符号231で
示す「咲いたので」が読み出されるが、これは用言文節
であるためステップ107へ進み、(ステップ105)
、その用1文節ケ用ぎ文節記憶部35に登録して、格パ
ターン照会部33?起動する(ステップ107,108
)。この状態での用言文節記憶部35と連用修飾文節記
憶部340内答r第6図の符号235と符号234に示
す。
This clause (because it is not a 1-phrase clause (step 105)
, this clause? Step 106) returns to step 102 to register it in the continuous modifier phrase storage m34. Then, the process proceeds to steps 102, 103, and 104, and then "sakura ga" indicated by the reference numeral 231 is called, but since this is also not a pragmatic clause, it is stored in the conjunctive modifier clause storage unit 34, and step 102
Return to step 105, 106. Further, when the process proceeds to steps 102, 103, and 104, the phrase ``Sakumono de'' indicated by the reference numeral 231 is read out, but since this is a pragmatic phrase, the process proceeds to step 107, and (step 105)
, the first phrase is registered in the phrase storage unit 35, and the case pattern inquiry unit 33? Start (steps 107, 108
). In this state, the predicate clause storage unit 35 and the conjunctive modifier clause storage unit 340 are shown at 235 and 234 in FIG.

次に、格パターン照合部33の動作について第4図のフ
ローチャートにより説明する。
Next, the operation of the case pattern matching section 33 will be explained with reference to the flowchart shown in FIG.

(B)格パターン照合部33の処理(そのl)格パター
ン照合部33は、単文切り出し部32から起動がかかる
と、まず、用言文節記憶部35の内容ケもとに、格パタ
ーン辞簀記憶fft16から対応する格パターンケ読み
出し、格パターン一時的記憶部36に格納する(ステッ
プ109)。
(B) Processing of the case pattern matching section 33 (Part 1) When the case pattern matching section 33 is activated by the simple sentence segmentation section 32, the case pattern matching section 33 first stores a case pattern dictionary based on the contents of the pragmatic clause storage section 35. The corresponding case pattern is read out from the memory fft16 and stored in the case pattern temporary storage section 36 (step 109).

今、用言文節記憶部35に入っているのは、第6図の符
号235のように「咲いたので」であり、この基本形は
「咲く」であるから、格バクーン辞誓記憶5336から
1咲く」の格パターンが読み出され、格パターン一時的
配憶部36に入れられる。
What is currently stored in the pragmatic phrase storage unit 35 is "Sakumaru wo" as indicated by the reference numeral 235 in FIG. 6, and since its basic form is "Saku", 1 The case pattern of ``Saku'' is read out and stored in the case pattern temporary storage section 36.

このときの格パターン一時的記憶部36の内容ケ第7図
の符号236に示す。ここでは、説明ケ簡単にするため
に、「咲く」の格として、「生体」m) 「時間」 「場所」の3つがあるとした。捷だ、おのお
のの格に対応して、その格倉表わす助詞と、その格に立
つ単語の意味情報が、格パターン辞誉記憶部6から読み
出され、格パターン一時的記憶部36に格納される。第
7図の符号236で示される照合済フラグの欄は、処理
時の格の照合状況ケ官理するだめのもので、最初は空白
である。
The contents of the case pattern temporary storage section 36 at this time are shown at 236 in FIG. Here, to simplify the explanation, we assume that there are three cases of ``bloom'': ``living body,''``time,'' and ``place.'' Corresponding to each case, the particle expressing the case and the meaning information of the word standing in that case are read out from the case pattern dictionary storage section 6 and stored in the case pattern temporary storage section 36. Ru. The collated flag column indicated by reference numeral 236 in FIG. 7 is used to determine the case collation status at the time of processing, and is initially blank.

次に、ステップ110で、連用修飾文節記憶部34に処
理すべき文節が残っているかチェックするが、今は最初
であるため、ステップ111へ進み、連用修飾文節記憶
部34の最後から、文節のデータケ一つ読み出す。これ
は、今の場合、第6図の符号234かられかるように「
桜が」である。
Next, in step 110, it is checked whether there are any remaining clauses to be processed in the conjunctive modifier clause storage unit 34, but since this is the first clause, the process proceeds to step 111, and from the end of the conjunctive modifier clause storage unit 34, the clauses to be processed are checked. Read out one data box. In this case, as can be seen from the reference numeral 234 in FIG.
The cherry blossoms are.

次ニ、ステップ112で、格パターン−1時的記憶部3
6に未照合の格が残っているかチェックするが、これも
、今は最初であるため、そのままステップ113へ進み
、文節の助詞すなわち「桜が」の「が」と、格パターン
の未照合の格スロットの助詞とr照合する。この場合、
第7図の符号236會見ると、主体の格の助詞「が」が
一致するため、(12) ステップ114のチェックは成功し、ステップ115へ
進む。ステップ115では、助詞が指示する格の意味と
、連用修飾文節の自立語の意味と紫照合する。今、文節
の自立語は「桜」であり、格パターンの「主体」の格に
ある意味は、「植物」、「花」であるから、意味が一致
するため、ステップ116のチェックは成功し、ステッ
プ117へ進む。なお、自立語の意味情報は、第5図お
よび第6図では明示していないが、第1図の単語分割f
l11での処理時、単語辞書記憶部4から文法情報など
とともに取り出され、文節列記憶部31に文節データ2
20が書かれるときに一緒に渡される。
Next, in step 112, case pattern-1 temporal storage unit 3
It is checked whether there are any unmatched cases remaining in 6, but since this is also the first case, the process goes directly to step 113 and compares the particle of the clause, ``ga'' of ``sakuraga'', with the unmatched case of the case pattern. Match r with the particle in the case slot. in this case,
Looking at reference numeral 236 in FIG. 7, since the particle "ga" of the subject case matches, (12) the check in step 114 is successful and the process proceeds to step 115. In step 115, the meaning of the case indicated by the particle is compared with the meaning of the independent word of the conjunctive modifier clause. Now, the independent word of the bunsetsu is "cherry blossoms" and the meanings in the case of "subject" in the case pattern are "plant" and "flower", so the meanings match, so the check in step 116 is successful. , proceed to step 117. Note that although the semantic information of independent words is not clearly shown in Figures 5 and 6, the word segmentation f in Figure 1
During processing in l11, the phrase data 2 is extracted from the word dictionary storage section 4 along with grammatical information, etc., and stored in the phrase string storage section 31.
It is passed together when 20 is written.

今の場合、「桜」に対して「植物」などの意味分類デー
タが、意味情報として渡される。
In this case, semantic classification data such as "plant" for "cherry blossoms" is passed as semantic information.

ステップ117では、文節と格の助詞と意味の照合が一
致した結果として、その係り受けと格の情報を第8図の
符号331で示すように文節列記憶部31の対応する位
置に書き込む。今の場合、「桜が」は、「咲いたので」
に係るから、係り受け情報として、係り先文節の文節番
号3金「桜がコの対応する位(13) 置に誉く。L1格の欄には、助詞と意味の照合の結果得
られた格の名称、すなわちこの場合「主体」葡誓き込む
。また、この格を使用したしるしとして、格パターン一
時的記憶部36、すなわち第7(¥Jの符号236で示
す照合済フラグ欄に、照合済フラグとして′l″ケ書き
込む。
In step 117, as a result of matching between the phrase and case particles and meanings, the dependency and case information is written into the corresponding position of the phrase string storage unit 31 as indicated by reference numeral 331 in FIG. 8. In this case, "cherry blossoms" means "because they bloomed."
Therefore, as dependency information, the clause number 3 of the dependent clause "Sakura ga Ko's corresponding position (13) is honour." The name of the case, in this case the ``subject'', is the name of the case. Further, as a sign that this case has been used, 'l'' is written as a verified flag in the case pattern temporary storage unit 36, that is, in the verified flag field indicated by the 7th symbol 236 (\J).

ステップ118では、係り受け解析が成功した「桜が」
の文節データケ、連用修飾文節記憶部34から消去し、
ステップ110へもどる。
In step 118, "Sakura ga" whose dependency analysis was successful is
delete the clause data from the conjunctive modification clause storage unit 34,
Return to step 110.

褥度、ステップ110.Illと進むが、今度は、連用
修飾文節記憶部34から「桜が」が消されているため、
第9図の符号334で示すように、最後は「私は」であ
り、これが読み出される。次゛ に、ステップ112,
113と進み、文節の助詞と格パターンの助詞と葡照合
するが、今回文節の助詞は「は」であり、これと一致す
るものは第7図の符号236で示す格パターンのなかに
ない。
Bed degree, step 110. However, this time, since "Sakura ga" has been deleted from the conjunctive modifier phrase storage section 34,
As shown by reference numeral 334 in FIG. 9, the last word is "I am", which is read out. Next, step 112,
113, the particle of the clause is compared with the particle of the case pattern, but this time the particle of the clause is ``wa'', and there is no match with this in the case pattern shown by reference numeral 236 in FIG.

しかし、日本語の場合、格文法の収点からすると、「は
」が単独で現われたとき、「が」または(ト)に置きか
えが可能である。
However, in the case of Japanese, from the point of view of case grammar, when ``wa'' appears alone, it can be replaced with ``ga'' or (to).

(14) この点は、国立国語研究所発行の「電子計算機による国
賠研■」に掲載の論文1日本語の生成語案論的記述と言
胎処理への応用」の174ページなどに示されている。
(14) This point is illustrated on page 174 of paper 1, “Description of Japanese Generated Words and its Application to Pregnancy Processing,” published in “National Insurance Research on Electronic Computers ■” published by the National Institute for Japanese Language and Linguistics. has been done.

これに従がって、「は」ケ、「が」捷たは「を」に置き
かえて、第7図の符号236で示す格パターン照合部す
ると、「ゲ」には対応するものがなく、「が」に一致す
るものがあることがわかる。
According to this, when we replace ``ha'' ke, ``ga'' ka, or ``wo'' in the case pattern matching section shown by reference numeral 236 in Figure 7, there is no corresponding one for ``ge''. You can see that there are matches for "ga".

ところが、 「が」に対応する格すなわち「主体」の格
には、この前の処理で照合術フラグに′l”が立てられ
ており、すでに照合済である。一般に、二つ以上の異な
る文節が同一の格に立つことはない(簡単に百9と、例
えば、一つの用言が二つの主鎖?持つことはない)ため
、「が」に対する格、「主体」の格にも文節「私は」ケ
一致させることができない。そこで、ステップ113の
結果として、ステップ114の判定処理は失敗し、ステ
ップ119の終了処理に移り、格パターン照合部33は
、単文切り出し部32に終了報告全行ない、処理ヶ終わ
る。
However, in the case corresponding to ``ga'', that is, the case ``subject'', 'l'' was set in the matching technique flag in the previous process, and the matching has already been completed.In general, two or more different clauses do not stand in the same case (easily 109, for example, one phrase does not have two main chains?), so the case for ``ga'' and the case for ``subject'' also have the clause `` I can't match 'ke'. Therefore, as a result of step 113, the determination process of step 114 fails, and the process moves to the end process of step 119, where the case pattern matching unit 33 sends a completion report to the simple sentence extraction unit 32, and the process ends.

(15) この段階での、文節列記憶部31.連用修飾文節記憶部
34、および格パターン−詩的記憶部36の内容ケ、第
8図の符号3311第9図の符号334、第1O図の符
号336に示す。
(15) At this stage, the phrase string storage unit 31. The contents of the conjunctive modifier clause storage section 34 and the case pattern-poetic storage section 36 are indicated by reference numeral 3311 in FIG. 8, reference numeral 334 in FIG. 9, and reference numeral 336 in FIG. 1O.

(C)単文切り出し111132の処理(その2)単文
切り出し部32は、格パターン照合部33から処理終了
報告を受けると(第3図ステップ100)、再度、文節
列記憶部31?走査して、新たな単文の切り出し紫行な
う。ただし、前回の処理で文節列記憶部31に入ってい
る文節データの文節番号3「咲いたので」まで読み出し
が終っており、次の読み出し位置は文節番号4「公園へ
」に設定されているため、そこから読み出し?開始する
(C) Processing of simple sentence extraction 111132 (part 2) When the simple sentence extraction unit 32 receives a processing completion report from the case pattern matching unit 33 (step 100 in FIG. 3), it again searches the phrase string storage unit 31? Scan and cut out a new simple sentence. However, in the previous process, the reading of the phrase data stored in the phrase string storage unit 31 up to phrase number 3, "Because it bloomed," has been completed, and the next reading position is set to phrase number 4, "To the park." So read from there? Start.

前回と同様の処理にエリ、文節データ「公園へ」と「行
った」が読み出され、それぞれ連用修飾文節記憶部34
お工び用言文節記憶部35に登録される。ただし、今回
は連用修飾文節記憶部34内には、前回の格パターン照
合部33の処理の積み残しとして、文節データ「私は」
が残っており、(16) 第11図の符号434で示す工うに、文節データ「公園
へ」はそのうしろに登録される。
The phrase data “to the park” and “went to the park” are read out in the same process as the previous time, and are stored in the conjunctive modifier phrase storage unit 34.
The words are registered in the phrase storage section 35 for use in the work. However, this time, the clause data ``Watashi wa'' is stored in the conjunctive modifier clause storage unit 34 as a leftover from the previous case pattern matching unit 33.
remains, and (16) the phrase data ``to the park'' is registered behind it, as indicated by reference numeral 434 in FIG. 11.

以上の処理の結果、この段階での連用修飾文節記憶部3
4お工び用言文節記憶部35の内容倉第11図の符号4
35と符号434に示す。
As a result of the above processing, the conjunctive modifier phrase storage unit 3 at this stage
4 Contents of the phrase storage section 35 Reference numeral 4 in Fig. 11
35 and 434.

次に、再度、格パターン照合部33の処理に進む。Next, the process proceeds to the case pattern matching section 33 again.

(D)格パターン照合部33の処理(その2)前回と同
様に、格パターン照合部33は、まず、格パターン辞書
記憶部6を参照して、用言に対応する格パターン紫読み
出す。今、用言文節は「行った」であり、その基本形は
「行く」であるから、「行く」に対応する格パターンが
読み出され、格パターン一時的記憶部36に格納される
。このときの格パターン一時的記憶部36の内容金弟1
2図の符号436に示す。
(D) Processing of the case pattern matching section 33 (Part 2) As in the previous case, the case pattern matching section 33 first refers to the case pattern dictionary storage section 6 and reads out the case pattern corresponding to the predicate. Now, the predicate phrase is "go" and its basic form is "go", so the case pattern corresponding to "go" is read out and stored in the case pattern temporary storage section 36. At this time, the contents of the case pattern temporary storage unit 36 Kintei 1
It is shown at 436 in FIG.

前回と同様、格パターン照合部33は、格パターン一時
的記憶部36の内容(第12図符号436)を参照しつ
つ、連用修飾文節記憶s34のうしろから一つずつ文節
と格との照合?行なう。
As in the previous case, the case pattern matching unit 33 references the contents of the case pattern temporary storage unit 36 (reference numeral 436 in FIG. 12) and matches the clauses and cases one by one starting from the back of the conjunctive modifier clause storage s34. Let's do it.

(17) まず、第12図の符号436で「公園へ」は、格パター
ン一時的記憶部36の内容ケ参照すると、「場所」の格
で助詞「へ」が一致し、意味も「公園」は「場所」の一
種であるから一致するため、「公園へ」は「場所」の格
として「行った」に係ることがわかる。この情報を文節
列記憶部31に誉き込む。
(17) First, referring to the contents of the case pattern temporary storage unit 36, "to the park" with the reference numeral 436 in FIG. Since they are a type of ``place'', they match, so ``to the park'' is a case of ``place'' and is related to ``went''. This information is loaded into the phrase string storage section 31.

次に、文節データ「私は」音処理する。助詞の「は」は
、前述したように「が」または「を」に置きかえること
ができ、「が」または「會」で格パターン一時的記憶部
36の内容(第12図の符号436)k参照すると、「
主体」の格で一致するものがあり、このとき、「私」は
「人」の一種であるから意味も一致し、文節と格との照
合が成功する。このデータを文節列記憶部31に書き込
む。
Next, the phrase data "I am" is processed. As mentioned above, the particle "wa" can be replaced with "ga" or "wo", and the contents of the case pattern temporary storage unit 36 (reference numeral 436 in FIG. 12) k If you refer to '
There is a match in the case of ``subject,'' and in this case, since ``I'' is a type of ``person,'' the meanings also match, and the match between the clause and the case is successful. This data is written into the phrase string storage section 31.

以上で、連用修飾文節記憶11fl134内の文節デー
タの処理は終わり、格パターン照合部33は、第4図の
ステップ100の判定で終了処理のはうに向かい、単文
切り出し部32に処理終了ケ報告しく18) し処理ケ終わる。
With this, the processing of the phrase data in the conjunctive modifier phrase memory 11fl134 is completed, and the case pattern matching unit 33 proceeds to the end process based on the determination in step 100 in FIG. 4, and reports the completion of the process to the simple sentence extraction unit 32. 18) The processing is finished.

(E)単文切り出しs32の処理(その3)単文切り出
し部32は終了報告ケ受けると(第3図のステップ10
0)、6度、文節外記憶部31の内容ケ走査するが、す
でに、文節外記憶部31の内容は全て読み終わっている
ので、ステップ102の判定は終了へ向かい、処理ケ終
了する。
(E) Processing of simple sentence extraction s32 (Part 3) When the simple sentence extraction unit 32 receives the completion report (step 10 in FIG.
0), the contents of the extra-clause storage unit 31 are scanned six times, but since all the contents of the extra-clause storage unit 31 have already been read, the determination in step 102 is directed to completion, and the process is completed.

以上で係り受け解析部3の処理が終了する。With this, the processing of the dependency analysis unit 3 is completed.

係り受け解析の結果、最終的に得られた文節外記憶部3
1の内容?第13図の符号431に示す。
As a result of dependency analysis, extra-clause memory section 3 finally obtained
Contents of 1? It is shown at 431 in FIG.

これが係り受け解析部3の解析出力230となる。This becomes the analysis output 230 of the dependency analysis unit 3.

なお、本例題では、用言42個含む文ケ用いたが、用言
i1個または3個以上含む文についても同様の手順で解
析が可能である。
In this example, a sentence containing 42 predicates was used, but sentences containing one or three or more predicates i can be analyzed using the same procedure.

以上、例題倉用いて、本実施例の詳細動作?説明したが
、ここで用いた例題は助詞の一致不一致?オU用して、
係り受けのあい1いさケ解消するものであった( 「私
は」が「咲いたので」に係らないことケ判定する)。
The detailed operation of this example is explained above using the example problem. As I explained, is the example problem used here about particle agreement and disagreement? For OU,
It was to eliminate one problem in the relationship (it was determined that ``Watashi wa'' was not related to ``Hasamagaro'').

次に、助詞は一致するものがあるが、意味が−(19) 致しないこと?利用して、係り受けの解析全行なう第2
の例題について説明する。
Next, there are some particles that match, but the meaning is - (19) Does it not match? The second step is to perform all the dependency analysis using
An example problem will be explained.

第14図の符号531は文節外記憶部31内に生成され
た文からなる第2の例題である。この例では、捷す、単
文切り出し部32が文節外記憶部31r走査して単文ケ
切り出し、連用修飾文節記憶部34と用言文節記憶部3
5に第15図の符号535と符号534VC示す工うな
文節データを格納する。
Reference numeral 531 in FIG. 14 is a second example consisting of sentences generated in the extra-clause storage unit 31. In this example, the simple sentence extraction section 32 scans the extra-clause storage section 31r and cuts out simple sentences, and the conjunctive modification phrase storage section 34 and the phrasal phrase storage section 3
5 stores the phrase data indicated by reference numerals 535 and 534VC in FIG.

次に、格パターン照合部33は、用言文節記憶部31の
内容、すなわち「回すと」の基本形「回す」に対応する
格パターンt1格パターン辞書記憶部6から読み出し、
格パターン一時的記憶部36に格納する(第16図の符
号536)。続いて、連用修飾文節記憶部34會下から
一つずつ読んで、文節と格の照合全行なう。まず、最初
は、「取手を」であるが、助詞「ケ」に対応するものに
動作の対象ケ示す対象の格がある。次に、対象の格の意
味の部分を見ると1物体」とあり、「取手」は物体の一
種でおるから意味照合も成功し、(20) 「取手」は対象の格としてraすと」に係ることがわか
る。
Next, the case pattern matching unit 33 reads out the case pattern t1 corresponding to the contents of the phrasal phrase storage unit 31, that is, the basic form “Mawaru” of “Mawaru”, from the case pattern dictionary storage unit 6,
The case pattern is stored in the temporary storage unit 36 (numeral 536 in FIG. 16). Next, the conjunctive modifier clause storage unit 34 reads the clauses one by one from the bottom and performs all clause and case matching. First of all, it is ``toride'', but there is a case corresponding to the particle ``ke'' that indicates the object of the action. Next, if we look at the meaning part of the target case, it says "It's an object," and since "Toride" is a type of object, the semantic matching is successful, and (20) "Toride" can be considered as the target case. It can be seen that this is related to

次に「ドアは」であるが、「は」は前記したとおり「が
」または「會」に読みかえが可能である。
Next is ``Door wa'', but ``HA'' can be read as ``GA'' or ``AI'' as mentioned above.

第16図の符号536で示す格パターンには、「が」も
l”k」も両方ある。しかし、1ケ」に対する格は「取
手葡」で、すでに使われているため、「が」に対する格
が照合対象となる。[−がJに対する格すなわち主体の
格の意味の部分ケ見ると1人」とめる。一方、文節は「
ドアは」であるが、「ドア」は「入」でないので意味照
合が失敗し、この結果、第4図のステップ116の判定
処理は、終了処理のほうへ向かう。したがって、「ドア
は」は処理未完了として連用修飾文節記憶部34に残さ
れ、次の単文の処理に供される。
The case pattern indicated by reference numeral 536 in FIG. 16 includes both "ga" and "l"k. However, since the case for ``1 ke'' is ``toride 葡'', which is already in use, the case for ``ga'' is the subject of matching. [If you look at the meaning of the case for J, that is, the case of the subject, there is one person.'' On the other hand, the clause is “
However, since "door" is not "enter", the meaning verification fails, and as a result, the determination process at step 116 in FIG. 4 moves toward the end process. Therefore, "Door wa" is left in the conjunctive modifier phrase storage unit 34 as unprocessed, and is subjected to processing of the next simple sentence.

次のサイクルで、単文切り出し部32Vi用言文節とし
て、「開いた」を切り出す。連用修飾文節として切り出
す対象はない。したがって、「開いた」の基本形「開く
」の格フレームと照合すべき文節は、連用修飾文節記憶
部34に残っている1つ1) 「ドアは」である。「開く」の格フレームは、ここでは
示さないが、容易に分かるように、文節「ドアは」は主
体の格で「開いたコに係る。
In the next cycle, "open" is cut out as a phrase for the simple sentence cutout section 32Vi. There is no target to be extracted as a conjunctive modifier clause. Therefore, the phrase to be compared with the case frame of the basic form of "open" is the one remaining in the conjunctive modifier phrase storage unit 34: 1) "Door wa." The case frame for ``open'' is not shown here, but as can be easily seen, the clause ``door wa'' is a subject case, ``related to open.

以上の処理の結果、解析出力230は第17図の符号6
31に示すようになる。
As a result of the above processing, the analysis output 230 is the number 6 in FIG.
31.

さらに、用言の格パターンに記載されている格が、単文
中の文節とすべて対応が取られているときに、管だ、未
処理の文節が残っている場合、その文節について照合す
べき格がないことヶ利用して、その文節?後続の用言の
処理に回すことにより、係り受けケ正しく解析する第3
の例題倉示す。
Furthermore, if all the cases listed in the case pattern of a predicate have been matched with clauses in a simple sentence, but there are still unprocessed clauses, the case to be matched for that clause is Is that clause using the fact that it doesn't exist? The third method correctly parses the dependency by passing it on to the processing of subsequent predicates.
An example of this is shown below.

第18図の符号731は、文節外記憶部31に格納され
た文からなる第3の例題である。これに対し、まず、単
文切り出し部32は、第19の符号735と符号734
に示すような単文要素を切り出し、連用修飾文節記憶部
34と用言文節記憶部35に格納する。用言文節「行く
ので」の基本型は「行く」で、その格パターンは第12
図の符号436に示してめる。これ音用いて、格パター
ン照合s33は、文節データと格との照合全行な(22
) う。「行く」の格パターン中には3個の格があり、連用
修飾文節記憶i34には、この3個の格に対応するもの
が全てそろっている。これらの照合処理ケした結果、文
節外記憶部31の内容は、第20図の符号831で示す
工うになる。この状態で、文節「彼は」は未照合状態で
残っているが、すでに述べたように、「行く」の格パタ
ーンの格は、他の文節とすべて対応がとられており、文
節「彼は」r照合すべき格はない。したがって、第4図
のフロチャートのステップ112の判定処理は、終了処
理へ向かう。この結果、文節「彼は」は、照合すべき格
がないことにより、より後続の用言文節の処理に回きれ
る。次のサイクルで、「彼は」は「荷造リケ」とともに
、用言「手伝った」の基本型「手伝う」の格パターンと
照合される。この処理は、前述の例題と同様であり、こ
こでは詳しく述べないが、正しく解析される。
Reference numeral 731 in FIG. 18 is a third example problem consisting of sentences stored in the extra-clause storage unit 31. In contrast, first, the simple sentence cutting unit 32 selects the nineteenth code 735 and the code 734.
A simple sentence element as shown in FIG. The basic form of the pragmatic phrase ``go, so'' is ``go'', and its case pattern is the 12th case pattern.
It is shown at 436 in the figure. Using this sound, case pattern matching s33 matches all lines of phrase data and cases (22
) cormorant. There are three cases in the case pattern of ``go'', and the continuous modifier clause memory i34 has all the cases corresponding to these three cases. As a result of these collation processes, the contents of the extra-clause storage section 31 become as shown by reference numeral 831 in FIG. In this state, the phrase ``he'' remains unmatched, but as mentioned earlier, the cases in the case pattern of ``go'' are all matched with other phrases, and the phrase ``he'' remains unmatched. ``r'' There is no case to check. Therefore, the determination process at step 112 in the flowchart of FIG. 4 proceeds to the end process. As a result, since there is no case to match, the phrase ``he'' can be used to process the subsequent pragmatic phrase. In the next cycle, ``he'' is matched with the case pattern of the basic form ``help'' of the predicate ``helped'' along with ``packing rikke''. This process is similar to the previous example, and although it will not be described in detail here, it will be correctly analyzed.

以上のようにして、第18図の文節列の係り受け解析が
行なわれ、最終的に第21図の符号931に示す解析出
力230が得られる。
As described above, the dependency analysis of the phrase string shown in FIG. 18 is performed, and finally an analysis output 230 shown at 931 in FIG. 21 is obtained.

(23) なお、本実施例では、用言?2個含む文の例について説
明したが、用言(f−3個以上含む文についても同様な
手順で解析?行なうことができる。また、用言に1個し
か含捷ない文についても解析可能であることは明らかで
ある。
(23) In this example, the term ? Although we have explained an example of a sentence containing two predicates (f-3 or more), it is also possible to analyze sentences containing three or more predicates using the same procedure.It is also possible to analyze sentences containing only one predicate. It is clear that

さらに、本実施例で述べた解析方式に、用言の格支配構
造以外の文法情報なども併用すれば、工す精度の高い解
析全行なうことができるのは言うまでもない。
Furthermore, it goes without saying that if the analysis method described in this embodiment is used together with grammatical information other than the case-dominant structure of the predicate, it is possible to perform the entire analysis with high accuracy.

〔発明の効果〕〔Effect of the invention〕

以上の説明から明らかなように、本発明によれば、用言
の格パターン情報?利用して、複文の解析全行なうこと
ができ、また意味を利用して解析全行なうため、より精
度の高い解析が可能になるという効果がめる。
As is clear from the above explanation, according to the present invention, case pattern information of predicates? By using this method, you can perform all analyzes of complex sentences, and because all analyzes are performed using meanings, you can achieve higher-precision analysis.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例ケ示す日本語解析装置の全体
構成図、第2図は係り受け解析の構成図、第3図は単文
切り出し部の動作例を示すフローチャート、第4図(イ
)、(ロ)は格パターン照合部の動作(24) 例ケ示すフローチャート、第5図、第6図、第7図、第
8図、第9図、第1O図、第11図、第12図、第13
図は第1の例題による係り受け解析部の動作例の説明図
、第14図、第15図、第16図、第17図は第2の例
題による係り受け解析部の動作例の説明図、第18図、
第19図、第20図、第21図は第3の例題にLる係し
受け解析部の動作例の説明図である。 l・・・単語分割部、2・・・文節組み立て部、3・・
・係り受け解析部、4・・・単語辞書記憶部、5・・・
文節内文法情報記憶部、6・・・格パターン辞書記憶部
、31・・・文節外記憶部、32・・・単文切り出し部
、33・・・格パターン照合部、34・・・連用修飾文
節記憶部、35・・・用言文節記憶部、36・・・格パ
ターン一時的(25) 第 l 国 30 第 ? 圓 3 第 5目 第 4 日 第 4 口 (ロ) 第 6 図 第7図 第 8 日 第 ? 圀 も 10 口 第 /l 国 第 12 図 第 74 口 も /古 口 第 76 ■ 第t7’h 6vt 第18図 特開昭GO−157659(1■
FIG. 1 is an overall configuration diagram of a Japanese language analysis device showing one embodiment of the present invention, FIG. 2 is a configuration diagram of dependency analysis, FIG. 3 is a flow chart showing an example of the operation of the simple sentence extraction section, A) and (B) are the operations of the case pattern matching section (24). Flowcharts showing examples, FIG. 5, FIG. 6, FIG. 7, FIG. 8, FIG. 9, FIG. 1O, FIG. Figure 12, 13
14, 15, 16, and 17 are explanatory diagrams of operation examples of the dependency analysis unit according to the second example, Figure 18,
FIG. 19, FIG. 20, and FIG. 21 are explanatory diagrams of an example of the operation of the dependency analysis unit according to the third example problem. l...Word division part, 2...Phrase assembly part, 3...
- Dependency analysis section, 4... Word dictionary storage section, 5...
Intra-clause grammatical information storage unit, 6... Case pattern dictionary storage unit, 31... Out-of-clause memory unit, 32... Simple sentence extraction unit, 33... Case pattern matching unit, 34... Conjunctive modification clause Memory section, 35... Dative phrase memory section, 36... Case pattern temporary (25) No. l Country 30 No. ? Circle 3 5th eye 4th day 4th mouth (b) 6th figure 7th day 8th day ? Country No. 10 /l Country No. 12 Figure 74 / Furukuchi No. 76 ■ No. t7'h 6vt Figure 18 JP-A Showa GO-157659 (1 ■

Claims (1)

【特許請求の範囲】 1、 日本語の単語とそれに関わる文法情報および意味
情報全格納した単語辞誉記憶部と、これを用いて日本語
文倉単語要素に分割する単語分割部と、文節内の単V&
要素間の文法的関係r格納した文節内文法情報記憶部と
、これ倉出いて分割された単語要素から文節を組み立て
て文節列を出力する文節組み立て部と、用言と該用言が
支配する単語との文法および意味的関係に関する情報全
格納した格パターン辞書記憶部と、該格パターン辞誓記
憶部の情報にエリ文節列からなる日本語文の係す受け解
析?行なう係り受け解析部と?有する日本語解析方式に
おいて、文節と格パターンの格の助詞と意味の一致判定
により文節の係り先の決定?行なう日本語解析方式。 2、用言の格パターン内に残る未照合の格の有無會判定
し、該未照合の格が無いときに係り受け解析未処理の文
節を、現在注目している用言より後方の用言の係り受け
解析処理対象とすることケ特徴とする特許請求の範囲第
1項記載の日本語解析方式。
[Claims] 1. A word dictionary storage unit that stores all Japanese words and related grammatical information and semantic information; a word division unit that uses this to divide Japanese words into Japanese word elements; Single V&
An intra-clause grammatical information storage unit that stores grammatical relationships between elements, a clause assembly unit that assembles clauses from the divided word elements and outputs a clause string, and a predicate and a predicate that governs the clause. A case pattern dictionary storage unit that stores all information regarding grammar and semantic relationships with words, and a case pattern dictionary storage unit that uses the information in the case pattern dictionary storage unit to perform uke analysis of a Japanese sentence consisting of a string of phrases. With the dependency analysis section? In the Japanese language analysis method that has a Japanese language analysis method, is it possible to determine the attachment of a clause by determining the agreement between the clause and the case particle of the case pattern and the meaning? Japanese language analysis method. 2. Determine whether or not there is an unmatched case remaining in the case pattern of the predicate, and if there is no unmatched case, change the unprocessed clause to the predicate after the currently focused predicate. 1. A Japanese language analysis method according to claim 1, wherein the Japanese language analysis method is characterized in that dependency analysis processing is performed on the following.
JP59011918A 1984-01-27 1984-01-27 Japanese language analyzing system Pending JPS60157659A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59011918A JPS60157659A (en) 1984-01-27 1984-01-27 Japanese language analyzing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59011918A JPS60157659A (en) 1984-01-27 1984-01-27 Japanese language analyzing system

Publications (1)

Publication Number Publication Date
JPS60157659A true JPS60157659A (en) 1985-08-17

Family

ID=11791074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59011918A Pending JPS60157659A (en) 1984-01-27 1984-01-27 Japanese language analyzing system

Country Status (1)

Country Link
JP (1) JPS60157659A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6165358A (en) * 1984-09-06 1986-04-03 Ricoh Co Ltd Japanese language analyzer
JPS61221876A (en) * 1985-03-08 1986-10-02 Sharp Corp Sentence structure analyzer
JPS63298668A (en) * 1987-05-29 1988-12-06 Matsushita Electric Ind Co Ltd Natural language analyzer
WO1992003796A1 (en) * 1990-08-20 1992-03-05 Kabushiki Kaisha Csk System for syntax analysis of japanese language
WO1992011600A1 (en) * 1990-12-20 1992-07-09 Kabushiki Kaisha Csk Syntax analyzing system for japanese language

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6165358A (en) * 1984-09-06 1986-04-03 Ricoh Co Ltd Japanese language analyzer
JPH0576658B2 (en) * 1984-09-06 1993-10-25 Ricoh Kk
JPS61221876A (en) * 1985-03-08 1986-10-02 Sharp Corp Sentence structure analyzer
JPH0550777B2 (en) * 1985-03-08 1993-07-29 Sharp Kk
JPS63298668A (en) * 1987-05-29 1988-12-06 Matsushita Electric Ind Co Ltd Natural language analyzer
WO1992003796A1 (en) * 1990-08-20 1992-03-05 Kabushiki Kaisha Csk System for syntax analysis of japanese language
WO1992011600A1 (en) * 1990-12-20 1992-07-09 Kabushiki Kaisha Csk Syntax analyzing system for japanese language

Similar Documents

Publication Publication Date Title
US4685060A (en) Method of translation between languages with information of original language incorporated with translated language text
US5848385A (en) Machine translation system using well formed substructures
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
US20040254781A1 (en) Machine translation
US20020120451A1 (en) Apparatus and method for providing information by speech
US20050137853A1 (en) Machine translation
Roche Parsing with finite-state transducers
JP2002117027A (en) Feeling information extracting method and recording medium for feeling information extracting program
Huet Formal structure of Sanskrit text: Requirements analysis for a mechanical Sanskrit processor
JPS60157659A (en) Japanese language analyzing system
US20020129066A1 (en) Computer implemented method for reformatting logically complex clauses in an electronic text-based document
Kawtrakul et al. Backward transliteration for Thai document retrieval
JPH11272710A (en) Information retrieval system, information retrieval method, and storage medium
JP3441400B2 (en) Language conversion rule creation device and program recording medium
JP2000040085A (en) Method and device for post-processing for japanese morpheme analytic processing
JPS5892063A (en) Idiom processing system
Yamron et al. The automatic component of the LINGSTAT machine-aided translation system
Sagot et al. From raw corpus to word lattices: robust pre-parsing processing
Hoste et al. Using rule-induction techniques to model pronunciation variation in Dutch
JPH0773200A (en) Key word extracting method
Mammadova et al. Principles of Formation of Transliteration Rules for the Azerbaijani Language using Expert Systems
JP3893600B1 (en) Base database generation method, base list generation method and apparatus, and computer program
Didakowski Local syntactic tagging of large corpora using weighted finite state transducers.
JPH0417064A (en) System for maintaining cooccurrence relation dictionary
JPH05250403A (en) Japanese sentence word analyzing system