JPH0765004A - 文脈相関の日本語解析法 - Google Patents

文脈相関の日本語解析法

Info

Publication number
JPH0765004A
JPH0765004A JP5196343A JP19634393A JPH0765004A JP H0765004 A JPH0765004 A JP H0765004A JP 5196343 A JP5196343 A JP 5196343A JP 19634393 A JP19634393 A JP 19634393A JP H0765004 A JPH0765004 A JP H0765004A
Authority
JP
Japan
Prior art keywords
analysis
grammar
speech
sentence
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5196343A
Other languages
English (en)
Inventor
Heiko Ri
炳 煌 李
Kancho Rin
煥 超 林
Tatsui Cho
達 維 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Technology Research Institute ITRI
Original Assignee
Industrial Technology Research Institute ITRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial Technology Research Institute ITRI filed Critical Industrial Technology Research Institute ITRI
Priority to JP5196343A priority Critical patent/JPH0765004A/ja
Publication of JPH0765004A publication Critical patent/JPH0765004A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 語法分析及び語義分析を併用して、正確な構
文分析を容易とする。 【構成】 解析される文を分割し、各単語を既定の品詞
に分類する。各単語の品詞を順に解析文法の品詞の組合
せとマッチングさせ、対応する文法動作を実行する。も
しマッチングしないで解析が終わらないまま文末に至る
と、次の単語に移り、語義の解析を繰返し解析文法ツリ
ーを形成する。形成された解析文法ツリーに対し、格分
析を実施し、数値の高いものを選択する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文脈相関の日本語解析
法に係り、特に語法分析と語義分析を結合させた文脈相
関の日本語解析法に係るものである。
【0002】
【従来の技術】これまで日本語を解析する際には、語法
分析と語義分析は別物とし、先ず語法分析を行い、その
後に語義分析を行っていた。その方法では一つの文に対
し、まずあらゆる可能性のある文章構造を分析し判断す
るが、構文上の不明瞭が存在するため、構文分析のみか
らでは文の語法分析ツリーがどのようであるか決定でき
ない。したがって当該文の可能性のあらゆる構文分析ツ
リーを生成しなければならない。その後、改めて生成さ
れた各々の構文分析ツリーに語義分析を施し、可能性の
少ないものから排除してゆく。最後に一本以上の分析ツ
リーが残った場合は数値(Scoring function) をとり、
各ツリーに対する数値評価の上、最高数値のものを最終
的に解析器よりアウトプットする。したがってこの種の
日本語解析法では、語法分析に相当大きな負担を強いて
いた。
【0003】
【発明が解決しようとする課題】本発明の目的は、これ
らの点をふまえた上で、上記の問題を解決するための一
種の文脈相関の日本語解析法を提供することにある。即
ちこの文脈相関の日本語解析法を既存の解析文法に適用
し、解析される文に対してマッチングを行い、解析文法
ツリーを生成させるのである。そして上述の解析文法に
は、品詞の組合せ及び上述の品詞組合せに対応する文法
動作が備えられており、上述の解析文法ツリーには既定
の数値が設定されている。この文脈相関の日本語解析法
には、下記のステップがある。
【0004】(1)上述の解析される文を分割し、解析
文の各単語を既定の品詞に分類する。 (2)上述の解析される文の単語の品詞を、順に上述の
解析文法の品詞の組合せとマッチングさせる。 (3)上述の解析文法の品詞の組合せとマッチングしな
い場合は、ステップ(5)へと進む。上述の解析文法の
品詞組合せとマッチングするなら、次のステップに移
る。
【0005】(4)上述の品詞組合せのマッチングに対
応する文法動作を実行し、解析文法ツリーを生成する。 (5)もし上述の解析される単語の解析が終わらないま
ま文末に至ると、次の単語に移り、ステップ(2)にゆ
く。上述の解析される文の単語が解析されて文末に至る
と、次のステップに移る。
【0006】(6)上述の得られた解析文法ツリーに対
し、格分析を実施する。 (7)上述の解析文法ツリーのうち、数値の高いものを
取り出す。 格分析の完成後、上述の文法解析ツリーの数値はプラス
される。
【0007】
【課題を解決するための手段】本発明は語法分析と語義
分析を結合し、語法分析のプロセス中に語義分析の方法
を応用するため、構造分析上の不確実性を解決でき、あ
らかじめ構文分析上の問題点を解決し、不可能な構文分
析ツリーを排除するため、構文分析の速度を速め、正確
さも一定の水準を維持することができる。また語義分析
の応用により、構文分析の際の条件判断を補助し、不可
能な組合せを減少させるので、不合理な構文分析ツリー
が完全に生成されるのを待った後にその合理性を判断さ
せる必要がなく、その生成過程において直接その不合理
性を捜しだし、そのツリーの生成を阻害するのである。
【0008】
【実施例】以下、図面と共に本発明の文脈相関の日本語
解析法の実施例を説明する。図1を参照するに、図1は
本発明の文脈相関の日本語解析法のフローチャートを示
している。本発明の文脈相関の日本語解析法は、既存の
解析文法に適用され、解析される文とマッチングされ、
文法解析ツリーが生成される。上述の解析文法は品詞の
組合せ及び上述の品詞組合せに対応する文法動作を有し
ており、上述の解析文法ツリーには既定の数値を設定す
るのである。上記発明の文脈相関の日本語解析法は、次
のステップをふむ。
【0009】ステップ1 S10において上述の解析される文を分割し、上述の解
析される文の各単語を既定の品詞に分類した後、S20
に進む。 ステップ2 S20において、上述の解析される文の各語の品詞を順
に上述の解析文法の品詞の組合せとマッチングさせ、S
30へと進む。
【0010】ステップ3 S30において、上述の解析される語の品詞と上述の解
析文法の組合せが一致しない場合、S50へと進む。も
し上述の解析される文の語の品詞と上述の解析文法の品
詞の組合せがマッチするなら、S40へと進む。 ステップ4 S50において、もし上述の解析される文の解析が終わ
らないまま文末に至ると、S60へと進む。S60にお
いて、上述の解析される文の語から次の語に移り、その
後S20に戻り、S20で再びマッチングさせる。もし
上述の解析される文が文末まで解析されたなら、S70
へと進む。
【0011】ステップ5 S70において、上述の解析文法ツリーに対し格分析を
行い、それにより語義分析の目的を達する。また格分析
の際、上述の解析文法ツリーの数値は再び加算される。
そしてS80へと進む。 ステップ6 S80において、上述の解析文法ツリーのうち、数値が
最高のものを取り出し、上述の解析される文の解析文法
ツリーとする。これにより、日本語を中国語に翻訳する
際、最も正確な翻訳が得られるのである。
【0012】実例 解析文法(Context-Sensitive Grammar)は主に品詞組合
せ(Pattern) と文法動作(Action)の二つの部分に分かれ
る(表1に示した通り)。パターン(品詞組合せ)とは
解析過程で遭遇した文中の品詞の組合せのことである。
ある品詞の組合せが、一旦解析文法に符合すれば、当該
文法の後半部分を実行する。これがアクション(文法動
作)である。いわゆる文法動作とは、マッチングした品
詞の組合せに何かを行うことであり、ある種の属性を測
定する検査であるか、もしくは生成文法分析ツリーの一
部分である。
【0013】 表1 パターン アクション 8 (n) $ N(1)>! 26 (N ha) $ TP(12)del 2 >! 38 (NUM num) $ NUM(21)ex >! 55 (P vvt) $ vvt(21) >! 74 (TP vvt) $ Vtt(21)node 1 set syn SJ>! 157 (<Vtt emk >) $ V(23) in-act(2) end>! 24 (N ga) $ SJ(12) del 2(if(and pre form(4)) back ex >! 246 (sxnp no n/sxnn) $ NO(12)>$ N(31)node 3 sele 1>! 229 (N num n p) $ N(32) node 2 set syn NUM >$ P(314)ex>! このうち、文法動作の主なものには、以下何種類かがあ
る。
【0014】(1)ノーマル 一般に行われる動作はノーマル動作に含まれる。複数の
パターンの中から、一つのパターンを取り出し、併せて
解析文法ツリーにそれが進入するポイントがあるかどう
かを探索する。これが解析文法のまず最初のパターンで
ある。もし探し出せれば、探し出したパターン及びその
所属する解析ツリー、解析文法ツリー中の位置等をメモ
リーに記録し、次にコンティニューを実行し、新しいパ
ターンをマッチングさせる。もし探し出せなければスキ
ップ動作を行う。
【0015】(2)コンティニュー 文法の進入ポイントを探し出した後、次のパターンをマ
ッチングする準備をする。コンティニュー動作は、メモ
リー中の資料を取り出し、メモリー中に記録された文法
解析ツリーの位置を探しだし、そこからパターンマッチ
ングを開始するものである。またパターンの位置を探し
出せれば、それはノーマル動作と同様に新しく探し出し
たパターンの関連資料をメモリーに記録し、次のコンテ
ィニュー動作に備えるものである。例えば、ノーマルが
“<”の後の“N”が、解析文法ツリーの進入ポイント
であると探し出したのなら、“N”の関連資料をメモリ
ーに記録させる。コンティニューは“N”の資料をメモ
リーから取り出し、解析文法ツリーの“N”の位置に跳
び、そこから新しいパターン“ha”のマッチングを始
めるのである。
【0016】(3)Ex:一つの文法が、目下探している
パターンに符合するのを見つけた時、動作部において
は、実際に解析ツリーを成長させて行く動作を行う。あ
るパターンでは、下記のようなツリー関係を形成する: Aはこのツリーのルートである。いわゆるExとは、もう
一度Aをノーマルの起点とするものである。通常は文法
にマッチングした後、マッチングされたパターンはツリ
ー関係を形成し、その後そのパターンの後にくる一つ目
のパターンが次のノーマルの起点となる。例えば、一組
のパターンABCDEがあり、ABCDがある解析文法
に符合し、上記のツリーを形成していたのなら、次のノ
ーマル動作はEから探し始めるという文法である。ただ
し、ExはAを次のノーマルの起点とし、AE…を持つか
どうかを探索する文法である。もしExが失敗したのな
ら、Aはスキップされ、Eが次のノーマルの起点とな
る。すなわち、Exとはノーマルをもう一度行うという動
作である。
【0017】(5)バック:バックとは、反対方向を向
いたマッチング動作である。一般的には、左から右へと
文法とマッチングするが、バックは右から左へと文法と
マッチングしてゆく。例えば、上述のパターンが幾つか
の文法を経過し、下記のツリー関係に変化していったと
き、 “vt”までマッチングし、その品詞を“Vt" に改めた
後、バック動作を行う。バック動作に出会うと、下記の
順序で文法にマッチングしてゆく。
【0018】 もし文法を探し出せたなら、すぐその文法を実行し、探
し出せなければVtを先頭とし、Ex動作を行う。
【0019】続いての方法はすべてEx動作に基づいた定
義である。 (6)Ret :Ret に遭遇すれば、この回の語法分析が終
了したことを示している。再び左から右へパターンのマ
ッチングを行い新たな解析が開始されるのである。どの
回の解析でもその探し求めるパターンはすべての前回の
解析ツリーのルートである。 (7)スキップ ある一つのパターンを先頭にしても、文法を見付けられ
なければ、その時はこのパターンを跳び越し、このパタ
ーンの次のパターンをノーマルの起点とする。例えば、
“N vt" をマッチングする時、この様な組の文法のパタ
ーンを発見できなければ解析器は"N" をスキップし、併
せて"vt"をノーマルの文法探索の起点とする。
【0020】(8)ブランチ:解析ツリーの一部分の生
成を準備している時、ある動作が2種類の違った形態の
部分を作り出すことがある。例えは下記の2種類: この2つは同様のパターンを有しているが、上下関係は
異なっている。通常この様な語義上の問題を解決する方
法がない場合は、可能な情況をすべて生成し、最後にツ
リーの選択から決定するしかない。この様な情況は通常
は滅多に出現せず、もし出現したなら、それは本来一本
の木が2本に分割されたものである。
【0021】格分析には主に内部格分析と外部格分析が
含まれる。内部格分析は内部格文法(表2に示した通
り)により実行される。内部格文法の文法形式の前半部
は語義記号が形成する集合であり、中間部分は品詞と
格、後半部は動作部分であり、主要には測定部分であ
る。どの内部格文法もともに幾つかの下位文法を有して
おり、どの下位文法も品詞、格と動作部分で構成されて
いる。 表2 1 (3860 3860 3860) P MNS mk (τ) sm(990 995 996 997 998 999)% 1 >!. 2 (2150 216 2230 2250 ) P ATTA mk (に)% 1 >!. 3 (2231) P AGAINST mk (に)>!. 5 (4000 411 432) V PRED mk(と)d syn (V)% 1 >!. TP P T % 1 >!. 6 (7421) SJ A sm (5 71 70) %>!. OJ O t % 1 >!. P R mk (に)sm(5 71) % 1>!. 7 (4125) SJ A sm (5 71) % 1 >!. OJ O t % 1 >!. P AS mk(に)% 1 >!. 11 (283) AN SC t % 1>!. 12 (4491) TP ACT sm (7420) >!. SJ A t % 1 >!. 16 (999) P L mk (に)% 1 >!. 内部格文法の語法定義: 文法:=左式 品詞 格 右式 左式:=(語義記号1 語義記号2……語義記号n) 品詞: 格: 右式:=下位文法 下位文法 下位文法:=関数 関数 関数::=測定関数 抗充関数 (and 関数 関数 関数・) (or関数 関数 関数・) (if関数 関数 関数) 測定関数:=MK SYN SM 抗充関数:=U D 文法において品詞が代表しているのは、下位文法が成立
する際の十分条件であり、この品詞に符合するノードに
対して下位文法の動作部を実行する。;格が指し示して
いるのは下位文法の動作部に符合した後、下位文法の品
詞に符合するノードに設定されるべき格の数値である。
【0022】数値の統計は主に内部格文法の計数欄を利
用する。どの下位文法にもその最後に先頭に“%”が記
された数値欄がある。例えば 2(2150 216 2230 2250) P ATTA mk (に) % 1 >! もしこの文法が成立するならば、この内部格文法の解析
ツリーはこの文法の“%”の後の数値を加えることにな
る。上記の例で言えば数値1を加えるのである。幾つか
の下位文法が成立する時、例えは下記のような場合、 3つの下位文法があれば、この内どれかの下位文法が成
立すれば、その下位文法の数値を加えるのである。例え
は2本の解析ツリーがあり、第一のツリーが第二の下位
文法に符合すれば数値2を加えるのであり、第二のツリ
ーが第一の下位文法に符合するならば数値1を加えるの
である。どの解析ツリーも自己の数値を一個のtagScore
Score[Max Tree]という資料構造の上に加えていくの
であり、tagScoreの構造は (1)short TreeScore 個別の解析ツリーの数値 解析ツリーの数値を保存 (2)short WhichTree 解析ツリーのナンバー 対応する解析ツリーのナンバーは、上述の数値を有す
る。
【0023】Score [n],tree Score は第 n+1本目
のツリーの数値を代表している。外部格分析は外部格文
法(第3に表示)により実行される。外部格文法は接続
詞・前置詞・断片語及び付属語の格問題を処理するもの
である。この文法形態は非常に簡単であり、簡単な形式
を持っているだけである。 表3 接続詞・前置詞・断片語の外部格文法 で out LOC >! と out PARTN >! とともに out ACC >! に (or(and syn(v)out PUR) (and sm(1 15) out TIME)out LOC)>! について out RANGE >! まで (or(and sm(1 15)out T.END)out GOAL) >! をまえに out EXCEPT>! を原料に out P AS>! 付属語の外部格文法 から out CAOSE >! が out CONC >! たれども out CONC >! ため out PUR >! ためた out PUR >! ても out CONC>! 外部格文法の語法定義 文法:=左式 右式 左式:=日本語単語 右式:=関数 関数 out 格 関数::=測定関数 (and 関数 関数 関数) (or 関数 関数 関数) (if 関数 関数 関数) 測定関数:=MKL SYN SM out:=欄の説明 以下、「価格は20万ドル前後に設定する」という文章
に、図1に示す解析法を実行する。
【0024】
【表1】
【0025】次に、上述の解析文法の品詞組合せとマッ
チングし、併せて対応する文法動作(表5に表示)及び
格分析を実行する。解析プロセスは表6に示す通りであ
り、同時に得られる解析ツリーは表7に示す通りであ
る。
【0026】
【表2】
【0027】
【表3】
【0028】
【表4】
【0029】
【発明の効果】上述の如く、本発明の文脈相関の日本語
解析法に基づくと、語法分析と語義分析を結合し、語法
分析のプロセス中に語義分析の方法を応用するため、構
造分析上の不確実性を解決でき、あらかじめ構文分析上
の問題点を解決し、不可能な構文分析ツリーを排除する
ため、構文分析の速度を速め、正確さも一定の水準を維
持することができる。また語義分析の応用により、構文
分析の際の条件判断を補助し、不可能な組合せを減少さ
せるので、不合理な構文分析ツリーが完全に生成される
のを待った後にその合理性を判断させる必要がなく、そ
の生成過程において直接その不合理性を捜し出し、その
ツリーの生成を阻害するのである。
【図面の簡単な説明】
【図1】本発明の文脈相関の日本語解析法のフローチャ
ートである。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 解析される文に対してマッチングを行
    い、解析文法ツリーを生成させ、品詞の組合せ及び上述
    の品詞組合せに対応する文法動作が備えられており、既
    定の数値が設定されており、 (1)上述の解析される文を分割し、解析文の各単語を
    既定の品詞に分類し、 (2)上述の解析される文の単語の品詞を、順に上述の
    解析文法の品詞の組合せとマッチングさせ、 (3)もし上述の解析文法の品詞の組合せとマッチング
    しないならば、下記ステップ(5)に進み、上述の解析
    文法の品詞組合せとマッチングするならば、次のステッ
    プに移り、 (4)上述の品詞組合せのマッチングに対応する文法動
    作を実行し、解析文法ツリーを生成し、 (5)もし上述の解析される文の単語が解析されないま
    ま文末に至ると、次の単語に移り、ステップ(2)に行
    き、上述の解析される文の単語が解析されて文末に至る
    と、次のステップに移り、 (6)上述の得られた解析文法ツリーに対し、格分析を
    実施し、 (7)上述の解析文法ツリーのうち、数値の最も高いも
    のを取り出す 各ステップよりなる文脈相関の日本語解析法。
  2. 【請求項2】 上述の格分析の際、上述の解析文法ツリ
    ーの数値に点数を加算する請求項1記載の文脈相関の日
    本語解析法。
JP5196343A 1993-08-06 1993-08-06 文脈相関の日本語解析法 Pending JPH0765004A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5196343A JPH0765004A (ja) 1993-08-06 1993-08-06 文脈相関の日本語解析法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5196343A JPH0765004A (ja) 1993-08-06 1993-08-06 文脈相関の日本語解析法

Publications (1)

Publication Number Publication Date
JPH0765004A true JPH0765004A (ja) 1995-03-10

Family

ID=16356260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5196343A Pending JPH0765004A (ja) 1993-08-06 1993-08-06 文脈相関の日本語解析法

Country Status (1)

Country Link
JP (1) JPH0765004A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016541219A (ja) * 2014-09-30 2016-12-28 小米科技有限責任公司Xiaomi Inc. 通信メッセージ識別方法、通信メッセージ識別装置、プログラム及び記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016541219A (ja) * 2014-09-30 2016-12-28 小米科技有限責任公司Xiaomi Inc. 通信メッセージ識別方法、通信メッセージ識別装置、プログラム及び記録媒体

Similar Documents

Publication Publication Date Title
US5752052A (en) Method and system for bootstrapping statistical processing into a rule-based natural language parser
US20050192793A1 (en) System and method for generating a phrase pronunciation
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
JPH05197394A (ja) 音声信号のワードシーケンス認識方法および装置
JPH0567144A (ja) 前編集支援方法およびその装置
US4931936A (en) Language translation system with means to distinguish between phrases and sentence and number discrminating means
US5132901A (en) System and method for input of target language equivalents and determination of attribute data associated therewith
Chow et al. Speech understanding using a unification grammar
JPH0765004A (ja) 文脈相関の日本語解析法
Fissore et al. Experimental results on large-vocabulary continuous speech recognition and understanding
JPH0877196A (ja) 文書情報抽出装置
KR100327115B1 (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
JPH06274546A (ja) 情報量一致度計算方式
Foth et al. An experiment on incremental analysis using robust parsing techniques
KR100582408B1 (ko) 연속음성인식시스템에서의 묵음 모델 명명 방법
JPH0297999A (ja) 音声合成装置
JP3592353B2 (ja) 形態素解析装置
JPH10198392A (ja) 音声認識方法
JPS6368972A (ja) 未登録語処理方式
JPH01114976A (ja) 文書処理装置の辞書構造
JP2005173753A (ja) 自然語辞書更新装置、更新方法、プログラム及び記録媒体
JP3137329B2 (ja) 文書編集装置
JPH0392957A (ja) 仮名漢字変換装置
JPH07249040A (ja) 機械翻訳用文書構造解析方法並びにそれを用いた機械翻訳方法、文書構造解析装置及び機械翻訳装置
JPH0198056A (ja) 自動かな漢字変換装置