JPH0827797B2 - 構文解析装置 - Google Patents

構文解析装置

Info

Publication number
JPH0827797B2
JPH0827797B2 JP61286348A JP28634886A JPH0827797B2 JP H0827797 B2 JPH0827797 B2 JP H0827797B2 JP 61286348 A JP61286348 A JP 61286348A JP 28634886 A JP28634886 A JP 28634886A JP H0827797 B2 JPH0827797 B2 JP H0827797B2
Authority
JP
Japan
Prior art keywords
rule
morpheme
syntactic
syntax
definite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61286348A
Other languages
English (en)
Other versions
JPS63138465A (ja
Inventor
祐司 菅野
健司 長尾
隆一 間藤
芳弘 上田
修 岩崎
謙一 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61286348A priority Critical patent/JPH0827797B2/ja
Publication of JPS63138465A publication Critical patent/JPS63138465A/ja
Publication of JPH0827797B2 publication Critical patent/JPH0827797B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、機械翻訳システムやデータベース検索シス
テム等の自然言語処理部の構文解析装置に関するもので
ある。
従来の技術 自然言語の文を解析して構文構造を求める方法として
は、第2図のような構成のものが知られている。図にお
いて、入力文1は文字列として形態素解析装置2に読み
込まれ、品詞と表記とを持つ形態素の列に分解される。
このとき、形態素の同定のために形態素辞書3を用い
る。形態素解析装置2の出力は、形態素の列4として構
文解析装置5に供給され、構文規則6を用いて統語構造
が解析され、構文木7として出力される。構文規則6と
して現在よく用いられている形式の1つに、文脈自由文
法、または各規則毎に、何らかの拡張機能が付加された
拡張文脈自由文法がある。文脈自由文法を用いる利点の
1つは、構文解析が有限ステップで終了することが保障
された手法(アルゴリズム)が知られていることであ
る。
発明が解決しようとする問題点 しかし、従来の解析手法では、解析に要する時間や記
憶容量が、入力文の形態素数nが多くなるにつれて急激
に増大するという問題点があった。最も効率がよいとさ
れているアーリー(Earley)の解析手法を用いた場合で
も、解析に要する時間はn3のオーダーであり、他の手法
の中にはenのオーダーのものもある。本発明は上記問題
点を解決するもので、構文解析を行なう前に、適用可能
な構文規則が一意的に定まる箇所について、あらかじめ
構文規則を適用して、入力文の形態素数を減らし、その
結果を構文解析部の入力とする事により、効率のよい構
文解析手法を提供することを目的とする。
問題点を解決するための手段 本発明は上記目的を達成するために、形態素情報を記
憶する形態素辞書格納手段と、前記形態素辞書格納手段
に記憶された形態素情報に基づき入力文から形態素列を
生成する形態素解析手段と、構文規則を格納する構文規
則格納手段と、前記構文規則格納手段に格納された構文
規則から与えられた形態素列の部分列に一意的に適用可
能な構文規則を判別する確定規則判別手段と、前記確定
規則判別手段により判別された規則を形態素列の部分列
に適用する確定規則適用手段と、前記構文規則格納手段
に格納された構文規則に基づき構文解析を行う構文解析
手段とを備えたものである。
作用 本発明は上記構成により、形態素解析結果のうち、適
用できる構文規則が確定できる箇所について、構文規則
を適用して形態素数を順次減らしてゆき、その結果を、
構文解析部の入力とすることにより解析に要する時間を
大幅に短縮するようにしたものである。
実施例 以下、図面を参照しながら本発明の実施例について説
明する。第1図は本発明の実施例による構文解析装置で
ある。図において、分かち書きされていない、べた書き
の漢字かな混じり日本語文11が、形態素解析装解12に入
力される。形態素解析装置12は、形態素辞書13を参照し
て、文中の形態素を同定し、隣接形態素が接続し得るか
どうかのチェックを行ない、形態素の列14を、妥当性の
高い順に出力する。確定規則判別装置16は、形態素の列
14と文脈自由文法規則15から、形態素の部分列に対し、
一意的に適用可能な文脈自由文法規則を探索し、もし存
在した場合には、それらの規則を確定構文規則として確
定規則適用装置17に出力する。確定規則適用装置17は、
確定構文規則を形態素の列14に対して適用し、その結
果、形態素の列14は確定構文規則による変更を受けて構
文要素の数が減少する。変更後の形態素の列に対して、
再び確定規則判別装置16が確定構文規則を探索し、確定
構文規則が存在する場合には、再び確定構文規則の適用
が、確定規則適用装置17で行なわれる。この手続きは、
確定構文規則が無くなるまで繰り返され、形態素の列の
長さは順次減少してゆき、最終的に、短縮された形態素
列18が構文解析装置19に出力される。構文解析装置19は
短縮された形態素列18を受け取って文脈自由文法規則15
を用いて、構文解析し、構文木20が得られる。
なお、構文解析装置として「Earleyのアルゴリズム」
(「日本語情報処理」、昭和59年5月、電子通信学会編
を参照)を用いたとすれば、確定規則判別装置と確定規
則適用装置として、各種のコンパイラでプログラム言語
の解析に用いられている、「LR(1)構文解析アルゴリ
ズム」(Alfred V.Aho,and Jeffrey D.Ullman: “Principles of Compiler Design",Addison−Wesley P
ub.,1977,邦訳:土居範久著、「コンパイラ」、培風
館、1986を参照)を用いることができる。
ただし、LR(1)構文解析アルゴリズムにおいて、動
作が一意的に定まらない場合には、シフト動作を行なっ
て、その部分の処理を構文解析装置であるEarleyアルゴ
リズムに託することにする。
発明の効果 以上のように、本発明は構文解析する前に、確定構文
規則のみを適用して入力文の形態素数を減らし、後段の
構文解析の負担を減らすことにより、効率のよい構文解
析を行なうことができ、その効果は大きい。
【図面の簡単な説明】
第1図は本発明の実施例における日本語構文解析装置の
概念図、第2図は従来の構文解析装置の概念図である。 11…べた書き・漢字かな混じり文、12…形態素解析装
置、13…形態素辞書、14…形態素の列、15…文脈自由文
法規則、16…確定規則判別装置、17…確定規則適用装
置、18…短縮された形態素列、19…構文解析装置、20…
構文木。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 上田 芳弘 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 (72)発明者 岩崎 修 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 (72)発明者 上田 謙一 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 (56)参考文献 特開 昭61−105671(JP,A) 特開 昭59−183469(JP,A) 特開 昭59−140582(JP,A)

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】形態素情報を記憶する形態素辞書格納手段
    と、前記形態素辞書格納手段に記憶された形態素情報に
    基づき入力文から形態素列を生成する形態素解析手段
    と、構文規則を格納する構文規則格納手段と、前記構文
    規則格納手段に格納された構文規則から与えられた形態
    素列の部分列に一意的に適用可能な構文規則を判別する
    確定規則判別手段と、前記確定規則判別手段により判別
    された規則を形態素列の部分列に適用する確定規則適用
    手段と、前記構文規則格納手段に格納された構文規則に
    基づき構文解析を行う構文解析手段とを備え、 前記確定規則判別手段が前記形態素解析手段により生成
    された形態素列と前記確定規則適用手段の適用結果であ
    る形態素列に対し一意的に適用可能な構文規則の判別を
    行い、一意的に適用可能な構文規則が存在する場合に
    は、その中から1つを選んで前記確定規則適用手段で当
    該規則の適用を行って形態素列を変更し、 一意的に適用可能な構文規則が存在しない場合には、一
    意的に適用可能な構文規則は全て適用されたものとして
    形態素列を構文解析手段に送り、前記構文解析手段が一
    意的に適用可能な構文規則が全て適用された前記確定規
    則適用手段からの形態素列に対し構文解析を行うことを
    特徴とする構文解析装置。
  2. 【請求項2】構文規則として文脈自由文法または拡張文
    脈自由文法の形式を用いることを特徴とする、特許請求
    の範囲第1項記載の構文解析装置。
JP61286348A 1986-12-01 1986-12-01 構文解析装置 Expired - Fee Related JPH0827797B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61286348A JPH0827797B2 (ja) 1986-12-01 1986-12-01 構文解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61286348A JPH0827797B2 (ja) 1986-12-01 1986-12-01 構文解析装置

Publications (2)

Publication Number Publication Date
JPS63138465A JPS63138465A (ja) 1988-06-10
JPH0827797B2 true JPH0827797B2 (ja) 1996-03-21

Family

ID=17703222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61286348A Expired - Fee Related JPH0827797B2 (ja) 1986-12-01 1986-12-01 構文解析装置

Country Status (1)

Country Link
JP (1) JPH0827797B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063868A (ja) 2010-09-14 2012-03-29 Internatl Business Mach Corp <Ibm> 言語処理パーサーを組み合わせて、組み合わせパーサーを生成する方法、並びにそのコンピュータ及びコンピュータ・プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59140582A (ja) * 1983-01-31 1984-08-11 Hitachi Ltd 自然言語翻訳援助方式
JPS59183469A (ja) * 1983-03-31 1984-10-18 Fujitsu Ltd 機械翻訳装置
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置

Also Published As

Publication number Publication date
JPS63138465A (ja) 1988-06-10

Similar Documents

Publication Publication Date Title
US7236925B2 (en) Left-corner chart parsing
WO2001029698A9 (en) System and method to compile instructions to manipulate linguistic structures into separate functions
WO2001029700A1 (en) Method and system for transforming a source language linguistic structure into a target language linguistic structure
Heering et al. Incremental generation of lexical scanners
Friedman et al. A parsing method for Montague grammars
Koskimies et al. The design of a language processor generator
JPH0827797B2 (ja) 構文解析装置
JP2807236B2 (ja) 形態素解析方法
JPH0320866A (ja) テキストベース検索方式
Nirenburg et al. HUHU: the hebrew university hebrew understander
US20220004708A1 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons
Begel et al. Language analysis and tools for ambiguous input streams
JPH06124211A (ja) プログラム解析装置
Buchsbaum Head Automata and Bilingual Tiling: Translation with Minimal Representations
JPH09160920A (ja) 機械翻訳装置
Rus et al. PHRASE parsers from multi-axiom grammars
Razi An empirical study of robust natural language processing (ill-formed input)
JPH08278973A (ja) 並列句解析装置および学習データ作成装置
Ciortuz Inductive learning of attribute path values in typed-unification grammars
Ferro E cient sharing in ambiguous parsing
JPH05225232A (ja) テキスト自動前編集装置
JPH04372047A (ja) 仮名漢字変換装置
JPH02208775A (ja) 機械翻訳方式
Carmichael et al. S/SL revisited
Cohen Analysis Tools for Fortran 77

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees