JPS61136171A - 構文解析処理方式 - Google Patents
構文解析処理方式Info
- Publication number
- JPS61136171A JPS61136171A JP59258200A JP25820084A JPS61136171A JP S61136171 A JPS61136171 A JP S61136171A JP 59258200 A JP59258200 A JP 59258200A JP 25820084 A JP25820084 A JP 25820084A JP S61136171 A JPS61136171 A JP S61136171A
- Authority
- JP
- Japan
- Prior art keywords
- syntax
- rules
- analysis
- rule
- frequency information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(A)産業上の利用分野
本発明は、構文解析処理方式、特に、与えられた入力文
を解析して構文規則と対応づけてゆく構文解析処理方式
において1個々の構文規則に対応して被利用頻度情報を
もたせるようにし、高頻度の構文規則から順に適用を試
みるようにした構文解析処理方式に関するものである。
を解析して構文規則と対応づけてゆく構文解析処理方式
において1個々の構文規則に対応して被利用頻度情報を
もたせるようにし、高頻度の構文規則から順に適用を試
みるようにした構文解析処理方式に関するものである。
(B)従来の技術と発明が解決しようとする問題点従来
から9文章を構成している所定の単位が如何なる下位単
位によって構成されているかなどを指示する構文規則を
構文規則記憶装置上に保持しておき、与えられた入力文
の個々の単語間について、どの構文規則にそった規則が
存在しているかをチェ’7りすることが行われている。
から9文章を構成している所定の単位が如何なる下位単
位によって構成されているかなどを指示する構文規則を
構文規則記憶装置上に保持しておき、与えられた入力文
の個々の単語間について、どの構文規則にそった規則が
存在しているかをチェ’7りすることが行われている。
即ち9例えば第2図に示す英文Aが入力文として与えら
れた場合に、 (i)与えられた文章(S)が名詞句(
NP)と動詞句(VP)とによって構成され。
れた場合に、 (i)与えられた文章(S)が名詞句(
NP)と動詞句(VP)とによって構成され。
(11)単語Iが名詞句(NP)に該当し、(iiiン
動詞句(V P)が動詞(V)と名詞句(NP)とによ
って構成され、 (iv)単語haveが動詞(V)
に該当し、 (■)名詞句(NP)が冠詞(D)と名詞
(N)とによって構成され、(vi)単語aが冠詞(D
)に該当し、 (vii)単語bookが名詞(N)
に該当していることを解析することが行われている。
動詞句(V P)が動詞(V)と名詞句(NP)とによ
って構成され、 (iv)単語haveが動詞(V)
に該当し、 (■)名詞句(NP)が冠詞(D)と名詞
(N)とによって構成され、(vi)単語aが冠詞(D
)に該当し、 (vii)単語bookが名詞(N)
に該当していることを解析することが行われている。
この場合9例えば名詞句(NP)について言えば、一般
に。
に。
名詞句(NP)−名詞(N)
−冠詞(D)十名詞(N)
−形容詞(Adj)十名詞(N)
などに対応する複数種類の規則が存在するが、入力文に
対していずれの規則が適合するかは夫々の規則を順次適
合させてみることが必要となる。従来の場合には、この
ような適合を試みる順番は。
対していずれの規則が適合するかは夫々の規則を順次適
合させてみることが必要となる。従来の場合には、この
ような適合を試みる順番は。
予め固定的に定められていたために、成る入力文中に当
該入力文に特異な慣用表現が存在していても、当該慣用
表現を効率よく見分lすることが必ずしも期待できない
ものであった。
該入力文に特異な慣用表現が存在していても、当該慣用
表現を効率よく見分lすることが必ずしも期待できない
ものであった。
(D)問題点を解決するための手段
本発明は、この点を解決しており1個々の構文規則に被
利用頻度情報をもたせ、高い頻度の構文規則から順に適
合を試みるようにしている。そしてそのため1本発明の
構文解析処理方式は2文章を構成している所定の単位が
如何なる下位単位によりて構成されるかを指示する規則
を含む構文規則が格納されている構文規則記憶装置、与
えられた入力文に対応して上記構文規則記憶装置の内容
を索引し上記入力文を上記構文規則にもとづいて解析す
る構文解析装置、および解析結果を保持する解析結果記
憶装置を有する構文解析処理システムにおいて、上記構
文規則記憶装置内に格納されている個々の構文規則に対
応して被利用頻度情報をもたせると共に、上記解析結果
を参照して当該被利用頻度情報を更新する頻度情報更新
手段をもうけ、上記構文解析装置は、上記被利用頻度情
報の大きい構文規則から順次上記入力文と対応づけて行
くようにしたことを特徴としている。以下図面を参照し
つつ説明する。
利用頻度情報をもたせ、高い頻度の構文規則から順に適
合を試みるようにしている。そしてそのため1本発明の
構文解析処理方式は2文章を構成している所定の単位が
如何なる下位単位によりて構成されるかを指示する規則
を含む構文規則が格納されている構文規則記憶装置、与
えられた入力文に対応して上記構文規則記憶装置の内容
を索引し上記入力文を上記構文規則にもとづいて解析す
る構文解析装置、および解析結果を保持する解析結果記
憶装置を有する構文解析処理システムにおいて、上記構
文規則記憶装置内に格納されている個々の構文規則に対
応して被利用頻度情報をもたせると共に、上記解析結果
を参照して当該被利用頻度情報を更新する頻度情報更新
手段をもうけ、上記構文解析装置は、上記被利用頻度情
報の大きい構文規則から順次上記入力文と対応づけて行
くようにしたことを特徴としている。以下図面を参照し
つつ説明する。
(D)実施例
第1図は本発明の一実施例構成を示す。図中の符号1は
入力文、2は構文解析装置、3は構文規則記憶装置、4
は解析結果記憶装置、5は頻度情報更新装置6−1は左
辺シンボル保持部、6−2は右辺シンボル保持部を表し
ている。
入力文、2は構文解析装置、3は構文規則記憶装置、4
は解析結果記憶装置、5は頻度情報更新装置6−1は左
辺シンボル保持部、6−2は右辺シンボル保持部を表し
ている。
左辺シンボル保持部6−1と右辺シンボル保持部6−2
とは組になって構文規則と対応づけられている。即ち1
例えば文章(S)が名詞句(NP)と動詞句(VP)と
から構成されることを示すために1文章(S)が左辺シ
ンボル保持部6−1内に記述されており、当該文章(S
)を構成するいわば解答が右辺シンボル保持部6−2内
のアドレスrlJからアドレス「1」内に記述されてい
ることが示される。また当該解答に該当する規、則は、
2個のシンボルに・て構成され1名詞句(NP)と動詞
句(VP)であることが示される。言うまでもなく、左
辺シンボルが名詞句(NP)である場合には、解答とな
る構文規則が3個存在し。
とは組になって構文規則と対応づけられている。即ち1
例えば文章(S)が名詞句(NP)と動詞句(VP)と
から構成されることを示すために1文章(S)が左辺シ
ンボル保持部6−1内に記述されており、当該文章(S
)を構成するいわば解答が右辺シンボル保持部6−2内
のアドレスrlJからアドレス「1」内に記述されてい
ることが示される。また当該解答に該当する規、則は、
2個のシンボルに・て構成され1名詞句(NP)と動詞
句(VP)であることが示される。言うまでもなく、左
辺シンボルが名詞句(NP)である場合には、解答とな
る構文規則が3個存在し。
1つが冠詞(D)十名詞(N)を示す規則であり。
他の1つが形容詞(Adj)十名詞(N)を示す規則で
あり、更に他の1つが名詞(N)そのものである規則で
あることが明らかにされている。
あり、更に他の1つが名詞(N)そのものである規則で
あることが明らかにされている。
本発明の場合には1図示個々の構文規則に対応して、被
利用頻度情報(図示情報「頻度」)が用意されている。
利用頻度情報(図示情報「頻度」)が用意されている。
そして、当該被利用頻度情報は。
構文解析装置2が入力文と構文規則を対応づけてゆく際
に利用される。即ち、頻度の高い規則から順に対応を試
みるようにされる。そして解析結果が得られたとき、頻
度情報更新装置5は2例えば解析結果記憶装置4の内容
を参照して、上記被利用頻度情報の値を更新する。
に利用される。即ち、頻度の高い規則から順に対応を試
みるようにされる。そして解析結果が得られたとき、頻
度情報更新装置5は2例えば解析結果記憶装置4の内容
を参照して、上記被利用頻度情報の値を更新する。
今、第2図図示の英文Aが入力されたとき、構文解析装
置2は。
置2は。
(S)→(NP)+ (VP)
なる規則を読み出して適合を試みる。成功したことから
、当該規則に対して頻度情報が+1にされる。次に構文
解析装置2は。
、当該規則に対して頻度情報が+1にされる。次に構文
解析装置2は。
(NP)→(D)+ (N)
→(Adj)+ (N)
→(N3
なる規則を読み出して、頻度の高い規則(NP)→(N
) から単語Iに対して適合を試みる。そして、その結果、
成功したことから、当該規則に対して頻度情報が+1に
される。次いで構文解析装置2は。
) から単語Iに対して適合を試みる。そして、その結果、
成功したことから、当該規則に対して頻度情報が+1に
される。次いで構文解析装置2は。
(V P)→(V)+ (NP)
なる規則を読み出すようにする。以下、同様にして、順
次構文解析が行われてゆ(。
次構文解析が行われてゆ(。
(E)発明の詳細
な説明した如く1本発明によれば、被利用頻度の高い規
則から順に適合を試みることができ。
則から順に適合を試みることができ。
処理効率が向上される。特に、構文解析装置2において
は、従来、いわば与えられた規則について適合を1つ1
つ試みるように働(ものであるために2本発明による場
合には、処理効率が大幅に改善される。
は、従来、いわば与えられた規則について適合を1つ1
つ試みるように働(ものであるために2本発明による場
合には、処理効率が大幅に改善される。
第1図は本発明の一実施例構成を示す。第2図は構文解
析の一例を説明する説明図を示す。 図中、1は入力文、2は構文解析装置、3は構文規則記
憶装置、4は解析結果記憶装置、5は頻度情報更新装置
を表す。
析の一例を説明する説明図を示す。 図中、1は入力文、2は構文解析装置、3は構文規則記
憶装置、4は解析結果記憶装置、5は頻度情報更新装置
を表す。
Claims (1)
- 文章を構成している所定の単位が如何なる下位単位によ
って構成されるかを指示する規則を含む構文規則が格納
されている構文規則記憶装置、与えられた入力文に対応
して上記構文規則記憶装置の内容を索引し上記入力文を
上記構文規則にもとづいて解析する構文解析装置、およ
び解析結果を保持する解析結果記憶装置を有する構文解
析処理システムにおいて、上記構文規則記憶装置内に格
納されている個々の構文規則に対応して被利用頻度情報
をもたせると共に、上記解析結果を参照して当該被利用
頻度情報を更新する頻度情報更新手段をもうけ、上記構
文解析装置は、上記被利用頻度情報の大きい構文規則か
ら順次上記入力文と対応づけて行くようにしたことを特
徴とする構文解析処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59258200A JPS61136171A (ja) | 1984-12-06 | 1984-12-06 | 構文解析処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59258200A JPS61136171A (ja) | 1984-12-06 | 1984-12-06 | 構文解析処理方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61136171A true JPS61136171A (ja) | 1986-06-24 |
Family
ID=17316893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59258200A Pending JPS61136171A (ja) | 1984-12-06 | 1984-12-06 | 構文解析処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61136171A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6391776A (ja) * | 1986-09-30 | 1988-04-22 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 自然言語解析装置 |
JPS63143669A (ja) * | 1986-12-05 | 1988-06-15 | Matsushita Electric Ind Co Ltd | 構文解析装置 |
-
1984
- 1984-12-06 JP JP59258200A patent/JPS61136171A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6391776A (ja) * | 1986-09-30 | 1988-04-22 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 自然言語解析装置 |
JPH0444304B2 (ja) * | 1986-09-30 | 1992-07-21 | Intaanashonaru Bijinesu Mashiinzu Corp | |
JPS63143669A (ja) * | 1986-12-05 | 1988-06-15 | Matsushita Electric Ind Co Ltd | 構文解析装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA1301935C (en) | System and method for natural language parsing by initiating processing prior to entry of complete sentences | |
Al‐Sughaiyer et al. | Arabic morphological analysis techniques: A comprehensive survey | |
US5848385A (en) | Machine translation system using well formed substructures | |
US6965857B1 (en) | Method and apparatus for deriving information from written text | |
Nagata | Robo-Sensei's NLP-based error detection and feedback generation | |
Guo | Critical tokenization and its properties | |
Sedláček et al. | A new Czech morphological analyser ajka | |
JPS61163467A (ja) | 機械翻訳システム | |
JP2002334071A (ja) | 言語的にインテリジェントなテキスト圧縮 | |
Mamrak et al. | Chameleon: A system for solving the data-translation problem | |
JP3794716B2 (ja) | 単語を語形変化させる方法及びその方法を実行するデータ処理装置 | |
Frank | Automatic F-Structure annotation of treebank trees | |
JPS61136171A (ja) | 構文解析処理方式 | |
Calzolari | Towards the organization of lexical definitions on a database structure | |
US7107582B2 (en) | System and method for source-driven form-independent dynamic content resolution | |
Deksne et al. | Extended CFG formalism for grammar checker and parser development | |
Elmi | A natural language parser with interleaved spelling correction supporting lexical functional grammar and ill-formed input | |
KR100371135B1 (ko) | 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법 | |
KR20010037309A (ko) | 형태소 접속 그래프를 사용한 형태소 및 구문 분석 방법 | |
Simpson | The design and implementation of a structured programming language with few arbitrary restrictions: the compilation phase: a dissertation presented in partial fulfilment of the requirements for the degree of Master of Science in Computer Science at Massey University | |
Bernth et al. | LMT at Tivoli Gardens | |
SIMPSON | LANGUAGEWITH FEW ARBITRARY RESTRICTIONS | |
Tagashira | The Articles in English: A Structural Analysis of Usage | |
Grigoriadou et al. | Semantic Modeling in Morpheme-based Lexica for Greek | |
JPH02118835A (ja) | 原始プログラム短縮形入力方式 |