JPH0827797B2 - 構文解析装置 - Google Patents
構文解析装置Info
- Publication number
- JPH0827797B2 JPH0827797B2 JP61286348A JP28634886A JPH0827797B2 JP H0827797 B2 JPH0827797 B2 JP H0827797B2 JP 61286348 A JP61286348 A JP 61286348A JP 28634886 A JP28634886 A JP 28634886A JP H0827797 B2 JPH0827797 B2 JP H0827797B2
- Authority
- JP
- Japan
- Prior art keywords
- rule
- morpheme
- syntactic
- syntax
- definite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
Description
【発明の詳細な説明】 産業上の利用分野 本発明は、機械翻訳システムやデータベース検索シス
テム等の自然言語処理部の構文解析装置に関するもので
ある。
テム等の自然言語処理部の構文解析装置に関するもので
ある。
従来の技術 自然言語の文を解析して構文構造を求める方法として
は、第2図のような構成のものが知られている。図にお
いて、入力文1は文字列として形態素解析装置2に読み
込まれ、品詞と表記とを持つ形態素の列に分解される。
このとき、形態素の同定のために形態素辞書3を用い
る。形態素解析装置2の出力は、形態素の列4として構
文解析装置5に供給され、構文規則6を用いて統語構造
が解析され、構文木7として出力される。構文規則6と
して現在よく用いられている形式の1つに、文脈自由文
法、または各規則毎に、何らかの拡張機能が付加された
拡張文脈自由文法がある。文脈自由文法を用いる利点の
1つは、構文解析が有限ステップで終了することが保障
された手法(アルゴリズム)が知られていることであ
る。
は、第2図のような構成のものが知られている。図にお
いて、入力文1は文字列として形態素解析装置2に読み
込まれ、品詞と表記とを持つ形態素の列に分解される。
このとき、形態素の同定のために形態素辞書3を用い
る。形態素解析装置2の出力は、形態素の列4として構
文解析装置5に供給され、構文規則6を用いて統語構造
が解析され、構文木7として出力される。構文規則6と
して現在よく用いられている形式の1つに、文脈自由文
法、または各規則毎に、何らかの拡張機能が付加された
拡張文脈自由文法がある。文脈自由文法を用いる利点の
1つは、構文解析が有限ステップで終了することが保障
された手法(アルゴリズム)が知られていることであ
る。
発明が解決しようとする問題点 しかし、従来の解析手法では、解析に要する時間や記
憶容量が、入力文の形態素数nが多くなるにつれて急激
に増大するという問題点があった。最も効率がよいとさ
れているアーリー(Earley)の解析手法を用いた場合で
も、解析に要する時間はn3のオーダーであり、他の手法
の中にはenのオーダーのものもある。本発明は上記問題
点を解決するもので、構文解析を行なう前に、適用可能
な構文規則が一意的に定まる箇所について、あらかじめ
構文規則を適用して、入力文の形態素数を減らし、その
結果を構文解析部の入力とする事により、効率のよい構
文解析手法を提供することを目的とする。
憶容量が、入力文の形態素数nが多くなるにつれて急激
に増大するという問題点があった。最も効率がよいとさ
れているアーリー(Earley)の解析手法を用いた場合で
も、解析に要する時間はn3のオーダーであり、他の手法
の中にはenのオーダーのものもある。本発明は上記問題
点を解決するもので、構文解析を行なう前に、適用可能
な構文規則が一意的に定まる箇所について、あらかじめ
構文規則を適用して、入力文の形態素数を減らし、その
結果を構文解析部の入力とする事により、効率のよい構
文解析手法を提供することを目的とする。
問題点を解決するための手段 本発明は上記目的を達成するために、形態素情報を記
憶する形態素辞書格納手段と、前記形態素辞書格納手段
に記憶された形態素情報に基づき入力文から形態素列を
生成する形態素解析手段と、構文規則を格納する構文規
則格納手段と、前記構文規則格納手段に格納された構文
規則から与えられた形態素列の部分列に一意的に適用可
能な構文規則を判別する確定規則判別手段と、前記確定
規則判別手段により判別された規則を形態素列の部分列
に適用する確定規則適用手段と、前記構文規則格納手段
に格納された構文規則に基づき構文解析を行う構文解析
手段とを備えたものである。
憶する形態素辞書格納手段と、前記形態素辞書格納手段
に記憶された形態素情報に基づき入力文から形態素列を
生成する形態素解析手段と、構文規則を格納する構文規
則格納手段と、前記構文規則格納手段に格納された構文
規則から与えられた形態素列の部分列に一意的に適用可
能な構文規則を判別する確定規則判別手段と、前記確定
規則判別手段により判別された規則を形態素列の部分列
に適用する確定規則適用手段と、前記構文規則格納手段
に格納された構文規則に基づき構文解析を行う構文解析
手段とを備えたものである。
作用 本発明は上記構成により、形態素解析結果のうち、適
用できる構文規則が確定できる箇所について、構文規則
を適用して形態素数を順次減らしてゆき、その結果を、
構文解析部の入力とすることにより解析に要する時間を
大幅に短縮するようにしたものである。
用できる構文規則が確定できる箇所について、構文規則
を適用して形態素数を順次減らしてゆき、その結果を、
構文解析部の入力とすることにより解析に要する時間を
大幅に短縮するようにしたものである。
実施例 以下、図面を参照しながら本発明の実施例について説
明する。第1図は本発明の実施例による構文解析装置で
ある。図において、分かち書きされていない、べた書き
の漢字かな混じり日本語文11が、形態素解析装解12に入
力される。形態素解析装置12は、形態素辞書13を参照し
て、文中の形態素を同定し、隣接形態素が接続し得るか
どうかのチェックを行ない、形態素の列14を、妥当性の
高い順に出力する。確定規則判別装置16は、形態素の列
14と文脈自由文法規則15から、形態素の部分列に対し、
一意的に適用可能な文脈自由文法規則を探索し、もし存
在した場合には、それらの規則を確定構文規則として確
定規則適用装置17に出力する。確定規則適用装置17は、
確定構文規則を形態素の列14に対して適用し、その結
果、形態素の列14は確定構文規則による変更を受けて構
文要素の数が減少する。変更後の形態素の列に対して、
再び確定規則判別装置16が確定構文規則を探索し、確定
構文規則が存在する場合には、再び確定構文規則の適用
が、確定規則適用装置17で行なわれる。この手続きは、
確定構文規則が無くなるまで繰り返され、形態素の列の
長さは順次減少してゆき、最終的に、短縮された形態素
列18が構文解析装置19に出力される。構文解析装置19は
短縮された形態素列18を受け取って文脈自由文法規則15
を用いて、構文解析し、構文木20が得られる。
明する。第1図は本発明の実施例による構文解析装置で
ある。図において、分かち書きされていない、べた書き
の漢字かな混じり日本語文11が、形態素解析装解12に入
力される。形態素解析装置12は、形態素辞書13を参照し
て、文中の形態素を同定し、隣接形態素が接続し得るか
どうかのチェックを行ない、形態素の列14を、妥当性の
高い順に出力する。確定規則判別装置16は、形態素の列
14と文脈自由文法規則15から、形態素の部分列に対し、
一意的に適用可能な文脈自由文法規則を探索し、もし存
在した場合には、それらの規則を確定構文規則として確
定規則適用装置17に出力する。確定規則適用装置17は、
確定構文規則を形態素の列14に対して適用し、その結
果、形態素の列14は確定構文規則による変更を受けて構
文要素の数が減少する。変更後の形態素の列に対して、
再び確定規則判別装置16が確定構文規則を探索し、確定
構文規則が存在する場合には、再び確定構文規則の適用
が、確定規則適用装置17で行なわれる。この手続きは、
確定構文規則が無くなるまで繰り返され、形態素の列の
長さは順次減少してゆき、最終的に、短縮された形態素
列18が構文解析装置19に出力される。構文解析装置19は
短縮された形態素列18を受け取って文脈自由文法規則15
を用いて、構文解析し、構文木20が得られる。
なお、構文解析装置として「Earleyのアルゴリズム」
(「日本語情報処理」、昭和59年5月、電子通信学会編
を参照)を用いたとすれば、確定規則判別装置と確定規
則適用装置として、各種のコンパイラでプログラム言語
の解析に用いられている、「LR(1)構文解析アルゴリ
ズム」(Alfred V.Aho,and Jeffrey D.Ullman: “Principles of Compiler Design",Addison−Wesley P
ub.,1977,邦訳:土居範久著、「コンパイラ」、培風
館、1986を参照)を用いることができる。
(「日本語情報処理」、昭和59年5月、電子通信学会編
を参照)を用いたとすれば、確定規則判別装置と確定規
則適用装置として、各種のコンパイラでプログラム言語
の解析に用いられている、「LR(1)構文解析アルゴリ
ズム」(Alfred V.Aho,and Jeffrey D.Ullman: “Principles of Compiler Design",Addison−Wesley P
ub.,1977,邦訳:土居範久著、「コンパイラ」、培風
館、1986を参照)を用いることができる。
ただし、LR(1)構文解析アルゴリズムにおいて、動
作が一意的に定まらない場合には、シフト動作を行なっ
て、その部分の処理を構文解析装置であるEarleyアルゴ
リズムに託することにする。
作が一意的に定まらない場合には、シフト動作を行なっ
て、その部分の処理を構文解析装置であるEarleyアルゴ
リズムに託することにする。
発明の効果 以上のように、本発明は構文解析する前に、確定構文
規則のみを適用して入力文の形態素数を減らし、後段の
構文解析の負担を減らすことにより、効率のよい構文解
析を行なうことができ、その効果は大きい。
規則のみを適用して入力文の形態素数を減らし、後段の
構文解析の負担を減らすことにより、効率のよい構文解
析を行なうことができ、その効果は大きい。
第1図は本発明の実施例における日本語構文解析装置の
概念図、第2図は従来の構文解析装置の概念図である。 11…べた書き・漢字かな混じり文、12…形態素解析装
置、13…形態素辞書、14…形態素の列、15…文脈自由文
法規則、16…確定規則判別装置、17…確定規則適用装
置、18…短縮された形態素列、19…構文解析装置、20…
構文木。
概念図、第2図は従来の構文解析装置の概念図である。 11…べた書き・漢字かな混じり文、12…形態素解析装
置、13…形態素辞書、14…形態素の列、15…文脈自由文
法規則、16…確定規則判別装置、17…確定規則適用装
置、18…短縮された形態素列、19…構文解析装置、20…
構文木。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 上田 芳弘 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 (72)発明者 岩崎 修 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 (72)発明者 上田 謙一 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 (56)参考文献 特開 昭61−105671(JP,A) 特開 昭59−183469(JP,A) 特開 昭59−140582(JP,A)
Claims (2)
- 【請求項1】形態素情報を記憶する形態素辞書格納手段
と、前記形態素辞書格納手段に記憶された形態素情報に
基づき入力文から形態素列を生成する形態素解析手段
と、構文規則を格納する構文規則格納手段と、前記構文
規則格納手段に格納された構文規則から与えられた形態
素列の部分列に一意的に適用可能な構文規則を判別する
確定規則判別手段と、前記確定規則判別手段により判別
された規則を形態素列の部分列に適用する確定規則適用
手段と、前記構文規則格納手段に格納された構文規則に
基づき構文解析を行う構文解析手段とを備え、 前記確定規則判別手段が前記形態素解析手段により生成
された形態素列と前記確定規則適用手段の適用結果であ
る形態素列に対し一意的に適用可能な構文規則の判別を
行い、一意的に適用可能な構文規則が存在する場合に
は、その中から1つを選んで前記確定規則適用手段で当
該規則の適用を行って形態素列を変更し、 一意的に適用可能な構文規則が存在しない場合には、一
意的に適用可能な構文規則は全て適用されたものとして
形態素列を構文解析手段に送り、前記構文解析手段が一
意的に適用可能な構文規則が全て適用された前記確定規
則適用手段からの形態素列に対し構文解析を行うことを
特徴とする構文解析装置。 - 【請求項2】構文規則として文脈自由文法または拡張文
脈自由文法の形式を用いることを特徴とする、特許請求
の範囲第1項記載の構文解析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61286348A JPH0827797B2 (ja) | 1986-12-01 | 1986-12-01 | 構文解析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61286348A JPH0827797B2 (ja) | 1986-12-01 | 1986-12-01 | 構文解析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63138465A JPS63138465A (ja) | 1988-06-10 |
JPH0827797B2 true JPH0827797B2 (ja) | 1996-03-21 |
Family
ID=17703222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61286348A Expired - Fee Related JPH0827797B2 (ja) | 1986-12-01 | 1986-12-01 | 構文解析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0827797B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012063868A (ja) | 2010-09-14 | 2012-03-29 | Internatl Business Mach Corp <Ibm> | 言語処理パーサーを組み合わせて、組み合わせパーサーを生成する方法、並びにそのコンピュータ及びコンピュータ・プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59140582A (ja) * | 1983-01-31 | 1984-08-11 | Hitachi Ltd | 自然言語翻訳援助方式 |
JPS59183469A (ja) * | 1983-03-31 | 1984-10-18 | Fujitsu Ltd | 機械翻訳装置 |
JPS61105671A (ja) * | 1984-10-29 | 1986-05-23 | Hitachi Ltd | 自然言語処理装置 |
-
1986
- 1986-12-01 JP JP61286348A patent/JPH0827797B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPS63138465A (ja) | 1988-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7236925B2 (en) | Left-corner chart parsing | |
WO2001029698A9 (en) | System and method to compile instructions to manipulate linguistic structures into separate functions | |
WO2001029700A1 (en) | Method and system for transforming a source language linguistic structure into a target language linguistic structure | |
Heering et al. | Incremental generation of lexical scanners | |
Friedman et al. | A parsing method for Montague grammars | |
Koskimies et al. | The design of a language processor generator | |
JPH0827797B2 (ja) | 構文解析装置 | |
JP2807236B2 (ja) | 形態素解析方法 | |
JPH0320866A (ja) | テキストベース検索方式 | |
Nirenburg et al. | HUHU: the hebrew university hebrew understander | |
US20220004708A1 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons | |
Begel et al. | Language analysis and tools for ambiguous input streams | |
JPH06124211A (ja) | プログラム解析装置 | |
Buchsbaum | Head Automata and Bilingual Tiling: Translation with Minimal Representations | |
JPH09160920A (ja) | 機械翻訳装置 | |
Rus et al. | PHRASE parsers from multi-axiom grammars | |
Razi | An empirical study of robust natural language processing (ill-formed input) | |
JPH08278973A (ja) | 並列句解析装置および学習データ作成装置 | |
Ciortuz | Inductive learning of attribute path values in typed-unification grammars | |
Ferro | E cient sharing in ambiguous parsing | |
JPH05225232A (ja) | テキスト自動前編集装置 | |
JPH04372047A (ja) | 仮名漢字変換装置 | |
JPH02208775A (ja) | 機械翻訳方式 | |
Carmichael et al. | S/SL revisited | |
Cohen | Analysis Tools for Fortran 77 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |