JPS61187077A - 日本語解析装置 - Google Patents

日本語解析装置

Info

Publication number
JPS61187077A
JPS61187077A JP60025150A JP2515085A JPS61187077A JP S61187077 A JPS61187077 A JP S61187077A JP 60025150 A JP60025150 A JP 60025150A JP 2515085 A JP2515085 A JP 2515085A JP S61187077 A JPS61187077 A JP S61187077A
Authority
JP
Japan
Prior art keywords
storage means
stack
phrase data
speech
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60025150A
Other languages
English (en)
Inventor
Toshiyuki Funabe
舟部 敏行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60025150A priority Critical patent/JPS61187077A/ja
Publication of JPS61187077A publication Critical patent/JPS61187077A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、日本語解析装置に関し、特に日本語の構文を
解析するに好適な日本語解析装置に関する。
従来技術 斯かる日本語解析装置にm−られる構文解析文法は、従
来、解析結果の正確さを期すあまシ、次のような欠点を
有しており、しかも必らずしも正確な解析結果を得られ
ないことがあるという問題があった。
解析文法の構造が複雑であった。たとえば解析文法の量
が多く、メンテナンスが困難であった。−側音あげると
、一部の修正が他のどの部分にどのような影響を及ぼす
かの判断が困難であった。したがって、解析処理システ
ム自体も大規模なものになり、解析処理速度が遅いとい
う欠点がち92だ。
目的 本発明の目的は、構文解析文法を簡単化して解析処理速
度を向上させることができる日本語解析装置を提供する
ことにある。
構成 本発明は、上記の目的を達成させるため、文節、および
この文節に付加された形態素情報を含む文節データを格
納する第1.第2および第3の記憶手段と、形態素相互
間の関連性を規定した形態素情報関連表が記憶されてい
る第4の記憶手段と、第1ないし第4の記憶手段を制御
し、入力文の解析を行なう制御手段とを有し、制御手段
は、形態素解析された入力文の文節データを順に第1の
記憶手段に格納し、第1の記憶手段の1つの文節データ
を第2の記憶手段に格納し、形態素関連表を参照して、
第3記憶手段に格納されている1つの文節データと第2
の記憶手段に格納されている文@r−夕との間の関連性
を抽出し、この抽出の結果、関連性があるときは、第2
および第3の記憶手段に格納されている文節データの形
態素情報をその関連性に従って確定してそれらの文節デ
ータを第3の記憶手段に格納し、関連性がないときは、
第2の記憶手段の文節データを関連性のある文節データ
とは区別して第3の記憶手段に格納し、これらの動作を
第1の記憶手段に格納されている文節データについて順
次行なう日本語解析装置を特徴とするものである。
以下、本発明を実施例に基づいて具体的に説明する。
第1図に本発明の一実施例の主要部機能ブロック図を示
す。制御部10は、図示されていない形態素確析装置に
よシ解析された入力文を取シ込み、文節ごとにAスタッ
ク12に格納するとともに、この人スタック12に格納
されている文節を先頭文節から順次取シ出してBスタッ
ク14に一時格納し、前後文節間の品詞関連性、格関連
性、および意味関連性を抽出すべく、品詞関連抽出部1
6、格関連抽出部18、および意味関連抽出部20を起
動制御し、その結果をCスタック22に上から順次下に
シフトして格納するようになっている。したがりて、C
スタック22には係シ受は関係が未定の文節あるいは解
析処理された文節の構造が順次格納され、最終的には入
力文の構文解析結果となシ、出力文として制御部10か
ら外部へ出力されるようになっている。一方、各関連抽
出部io、is。
20にはそれぞれ対応する品詞関連表24゜格関連表2
6.意味関連表28が接続されている。
品詞関連表24は第2図に示すように、後続文節として
Bスタック14に格納されている文節(以下入力文節と
称する)の品詞種@を行方向に配列し、先行文節(前文
節、前々文節、・・・)としてCスタック24に格納さ
れている文節(以下スタック文節と称する)の品詞種類
を列方向に配列し、それら対応する品詞間の係シ受けの
関連性を規定するマトリックスを構成している。同図中
のコードrOJは関連性なしを、コード「1」は関連性
有シを表わす関連性コードである。なお、品詞中の「何
月」とは、付属語又は連用修飾語を表わしている。
格関連表26は入力文節が動詞、形容動詞又は形容詞な
どのように格を有する品詞のときに参照されるものであ
シ、第3図に示すように、形態素解析の結果として入力
される入力文節の格・ぐターンKl  + K3  H
K3  r・・・を行とし、スタック文節の格(主体、
道具、目的2等々・・・)を列としてマトリックスを形
成し、格パターンに関連する格を規定している。図中の
関連性コードrOJ、rlJは品詞関連表24と同様に
定義されている。
意味関連表28は入力文節の意味とスタック文節の意味
の関連性を規定するものであシ、第4図に示すように、
入力文節の意味(移動、単位、形状1等々・・・)を行
とし、スタック文節の意味(人間、物、場所2等々・・
・)を列としてマトリックスを形成し、それらの間の関
連性を規定している。図中のコードroj、rlJ牡記
2つの関連表24.26と同様に定義されている。
このように構成される第1図の実施例の構文解析処理手
順を、第5図に示すフローチャートを参照しながら次に
説明する。なお、具体的な入力文例として「彼は学校へ
行った」という文が入力されたものとして説明する。
まず、上記入力文は形態素解析装置によシ解析され、次
のような文節単位に区分されるとともに、品詞、意味、
格、格ノ4ターンなどの形態素情報と一緒に、制御部1
0を介してAスタック12に格納される。
入力文例 次に、Aスタック12に格納されている入力文の先頭文
節から1文節づつ取シ出してBスタック14に格納する
(ステップ10G)。Aスタック12に格納されている
文節がなければ文区切シと判定し、構文解析処理を終了
する(ステラ7’102)。Bスタック14に入力文節
が格納されればステップ104に進んで、Cスタック2
2に格納されている最上位(前文節)のスタック文節と
の品詞関連性の有無を、品詞関連表24を検索すること
によシ行なう(ステップ104,106,110)。こ
こで、入力文節が先頭文節のときは、Cスタック22に
はスタック文節が格納されていないので、品詞関連表2
4を行末まで検索しても関連性は「0」であるため、ス
テップ106の判定でステップ108に進−み、入力文
節をCスタック22の最上位に格納してステップ100
に戻る。そして、Aスタック12から後続の文節を取シ
出してBスタック14に格納する。このときのBスタッ
ク14とCスタック22の格納状態を次に示す。
Bスタック(入力文節) Cスタック(スタック文節) ここで、ステラ7’104における品詞関連性を抽出す
る手順について詳しく説明すると、入力文節の自立語の
品詞は「名詞」であシ、スタック文節の付属語の品詞は
「何月」である。そこで第2図の品詞関連表24の該当
欄を見ると「0」となっておシ、品詞の関連性はないこ
とを示している。したがって、ステラ7’10gからス
テラf108に移行して、スタック文節「(彼−は(・
・・・・・・・・・・・)」はCスタック22の最上位
に格納され、ステラ7’lGOに戻りて次の文節がBス
タック14に格納されて入力文節となる。このときのB
、Cスタック14.22の格納状態は次のようになる。
Bスタック(入力文節) Cスタック(スタック文節) このようにして入れ替えられたBスタック14の入力文
節とCスタック22の最上位スタック文節との間で、前
述と同様に品詞の関連性抽出がなされる(ステップ10
4)。入力文節の品詞は「動詞」であシ、最上位スタッ
ク文節の品詞は「何月」であるから、それらに対応する
第2図の品詞関連表24の欄を見ると、「1」即ち関連
性有シとなっている。したがって、ステップ110の判
定はYESとなシ、ステップ112に進んで入力文節は
格・ぐターンを有しているか否かが判断される。この場
合入力文節の格/4’ターンはに3となっていることか
らステップ114に進んで、最上位スタック文節に対し
て格の関連性の有無が検索される。
第3図の格関連表26のに3の行を検索すると、「主体
」と「場所」が関連性有シとなっているが、スタック文
節は格として「終状態」「場所」「目的」しか有してい
ないので、ナれらが一致する「場所」が関連性有りとし
て確定される(ステップ116.1is)。そして、次
に意味の関連性抽出がなされる(ステップ120〜12
4)。
入力文節は意味として「移動」を有しているので、第4
図の意味関連表28の「移動」の行が検索される。その
行では「人間」、「物」。
「場所」が関連性有シとなっているが、スタック文節の
自立語の意味は「組織」と「場所」しか有していないの
で、それらが一致する「場所」が確定される。
そしてステップ126に進んでCスタック22から最上
位スタック文節を取シ出し、入力文節と最上位スタック
文節との形態素情報を、確定したものに書き換えて、つ
まシ関連性のない属性を削除して、それらをまとめて入
力文節としてBスタック14に格納する。このときのB
スタック14の格納状態を次に示す。
Bスタック(入力文節) そしてステラf104に戻って、同様に入力文節と最上
位スタック文節についてステップ104〜126の処理
がなされ、形態素情報が確定された構文解析の最終結果
はCスタック22に格納されたものとなる(ステラ7’
108)。
その結果を次に示す。
上述したように、本実施例によれば、構文解析文法を品
詞、格、意味の3つの表にコン/Jクトに区分してまと
めたことから、解析処理時間が短縮されるとともに、文
法のメンテナンスが容易になるという効果がある。また
、解析処理システムを小規模化できるうえ、ユーザとの
インタラクティブ処理を可能にすることができる。
なお、上記実施例においては前文節とそれに続く後続文
節との2つの文節相互間についての関連性有無によって
、形態素情報(属性)を確定するようにしていたが、前
文節が例えば接続詞などの場合には、前々文節との関連
性をみて属性を確定することが望ましい場合がある。こ
のような場合の実施例の主要部機能ブロック図を第6図
に示す。第1図の実施例と異なる点は、制御部10に関
連させて照合パターンスタック30が設けられているこ
とと、品詞関連表32の内容が第7図に示すように、先
行するスタック文節の品詞によっては、1つ前のスタッ
ク文節(最上位から2番目のスタック文節)と関連性が
あれば関連性有りとするコード「2」が書き込まれてい
ることにある。その他の構成は第1図の実施例と同様で
よいので説明を省略する。
この第6図の実施例における解析処理手順は基本的に第
1図の実施例と同様でよいが、品詞関連性の検索時に関
連性有無の内容が「1」又は「2」のときは、その「1
」又は「2」を照合ノEターンスタック30に格納し、
この照合パターンスタック30の内容に従って品詞、格
、意味関連性の処理をする点が異なる。即ち、「1」の
場合は第1図の実施例と同一であるが、「2」の場合に
はCスタック22の最上位から2番目の文節とBスタッ
ク14の入力文節との間について各関連性を検索し、そ
れらの間に関連性があれば最上位スタック文節を含めて
全体的に関連性有シとし、形態素情報を確定する。
したがって、本実施例によれば、注目している2つの文
節の周辺にある文節をも見て解析していることから、前
記第1図の実施例の効果に加えて、一層正確さが向上さ
れるという効果がある。
効果 以上説明したように、本発明によれば、構文解析文法が
簡単化されるとともに、解析処理速度が向上するという
効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例による日本語解析装置の機能
ブロック図、 第2図ないし第4図は、第1図の実施例のそれぞれ品詞
関連表、格関連表、意味関連表の内容例を!示す図、 第5図は第1図の実施例の動作を説明する要部フローチ
ャート、 第6図は本発明の他の実施例の機能ブロック図、 第7図は第6図の実施例の品詞関連表の内容例を示す図
である。 主要部の符号の説明 10・・・制御部 12・・・Aスタック 14・・・Bスタック 22・・・Cスタック 24.32・・・品詞関連表 26・・・格関連表 28・・・意味関連表 30・・・照合/” ターンスタック 第1図 第2図 第7図

Claims (1)

  1. 【特許請求の範囲】 1、文節、および該文節に付加された形態素情報を含む
    文節データを格納する第1、第2および第3の記憶手段
    と、 形態素相互間の関連性を規定した形態素情報関連表が記
    憶されている第4の記憶手段と、第1ないし第4の記憶
    手段を制御し、入力文の解析を行なう制御手段とを有し
    、 該制御手段は、 形態素解析された入力文の前記文節データを順に第1の
    記憶手段に格納し、 第1の記憶手段の1つの文節データを第2の記憶手段に
    格納し、 前記形態素関連表を参照して、第3記憶手段に格納され
    ている1つの文節データと第2の記憶手段に格納されて
    いる文節データとの間の関連性を抽出し、 この抽出の結果、関連性があるときは、第2および第3
    の記憶手段に格納されている文節データの形態素情報を
    該関連性に従って確定してそれらの文節データを第3の
    記憶手段に格納し、関連性がないときは、第2の記憶手
    段の文節データを前記関連性のある文節データとは区別
    して第3の記憶手段に格納し、 これらの動作を第1の記憶手段に格納されている文節デ
    ータについて順次行なうことを特徴とする日本語解析装
    置。 2、特許請求の範囲第1項記載の装置において、前記形
    態素情報関連表は、文節に含まれる語の品詞、格および
    意味のうちの少なくとも1つについての関連性を含むこ
    とを特徴とする日本語解析装置。 3、特許請求の範囲第2項記載の装置において、第3記
    憶手段に格納されている文節データのうち前記関連性抽
    出の対象となるものは、前記形態素情報関連表における
    品詞についての関連性によって規定されることを特徴と
    する日本語解析装置。
JP60025150A 1985-02-14 1985-02-14 日本語解析装置 Pending JPS61187077A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60025150A JPS61187077A (ja) 1985-02-14 1985-02-14 日本語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60025150A JPS61187077A (ja) 1985-02-14 1985-02-14 日本語解析装置

Publications (1)

Publication Number Publication Date
JPS61187077A true JPS61187077A (ja) 1986-08-20

Family

ID=12157971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60025150A Pending JPS61187077A (ja) 1985-02-14 1985-02-14 日本語解析装置

Country Status (1)

Country Link
JP (1) JPS61187077A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02230369A (ja) * 1989-03-02 1990-09-12 Nec Corp 形態素解析方式
JPH02230370A (ja) * 1989-03-02 1990-09-12 Nec Corp 形態素解析装置
JPH06314294A (ja) * 1993-04-28 1994-11-08 Ibm Japan Ltd 機械翻訳方法及び機械翻訳装置
JPH07129589A (ja) * 1993-07-29 1995-05-19 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 形態素解析装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02230369A (ja) * 1989-03-02 1990-09-12 Nec Corp 形態素解析方式
JPH02230370A (ja) * 1989-03-02 1990-09-12 Nec Corp 形態素解析装置
JPH06314294A (ja) * 1993-04-28 1994-11-08 Ibm Japan Ltd 機械翻訳方法及び機械翻訳装置
JPH07129589A (ja) * 1993-07-29 1995-05-19 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 形態素解析装置

Similar Documents

Publication Publication Date Title
Al‐Sughaiyer et al. Arabic morphological analysis techniques: A comprehensive survey
US6973429B2 (en) Grammar generation for voice-based searches
US5890103A (en) Method and apparatus for improved tokenization of natural language text
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JP2012520528A (ja) 自然言語テキストの自動的意味ラベリングのためのシステム及び方法
JPH0242572A (ja) 共起関係辞書生成保守方法
JPH0447364A (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
WO2008059111A2 (en) Natural language processing
JPH0567144A (ja) 前編集支援方法およびその装置
US5283737A (en) Mechanism for generating linguistic expressions based on synonyms and rules derived from examples
JPS58192173A (ja) 機械翻訳装置
JPS61187077A (ja) 日本語解析装置
JPH07244669A (ja) 文書検索方式
JP4007630B2 (ja) 対訳例文登録装置
JPH0561902A (ja) 機械翻訳システム
JPH0612451A (ja) 例文検索システム
Fraj et al. Patterns of syntactic trees for parsing Arabic texts
JPH0258166A (ja) 知識検索方法
JP3892227B2 (ja) 機械翻訳システム
Walker Computational linguistic techniques in an on-line system for textual analysis
JPH0540783A (ja) 自然言語解析装置
JPH0320866A (ja) テキストベース検索方式
JPH04123264A (ja) 関連語テーブル作成装置及び文書検索装置
JPH0752391B2 (ja) 複数データベース記述を含む原始プログラムの翻訳方式
Shaalan et al. Automatic morphological generation for the indexing of Arabic speech recordings