JPH04343173A - 省略語補完装置及び日本語解析システム - Google Patents

省略語補完装置及び日本語解析システム

Info

Publication number
JPH04343173A
JPH04343173A JP3143812A JP14381291A JPH04343173A JP H04343173 A JPH04343173 A JP H04343173A JP 3143812 A JP3143812 A JP 3143812A JP 14381291 A JP14381291 A JP 14381291A JP H04343173 A JPH04343173 A JP H04343173A
Authority
JP
Japan
Prior art keywords
clause
case
word
theme
completion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3143812A
Other languages
English (en)
Other versions
JP2775655B2 (ja
Inventor
Yoshitaka Hiratsuka
平墳 芳隆
Yuji Okamura
岡村 裕治
Akira Takagi
高木 朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSK Corp
Original Assignee
CSK Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSK Corp filed Critical CSK Corp
Priority to JP3143812A priority Critical patent/JP2775655B2/ja
Publication of JPH04343173A publication Critical patent/JPH04343173A/ja
Application granted granted Critical
Publication of JP2775655B2 publication Critical patent/JP2775655B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力した日本語文の省
略語を機械的に補完する省略語補完装置及びかかる省略
語補完装置を備えた日本語解析システムに関する。
【0002】
【従来の技術】電子計算機による日本語解析、あるいは
これを用いた機械翻訳などの情報処理システムにおいて
、入力した日本語文中の省略語がいかなる語と照応する
かを把握することが、しばしば重要になる。これは日本
語文には聞き手あるいは読み手が再現できる要素は省略
する傾向が強いという性質があるからで、省略語を補完
する技術は上記の情報処理システムには極めて重要なも
のとなる。
【0003】従来、この省略語を補完する技術としては
、省略された格成分と同じ格の語を、以前に入力された
文または節の新しい方から上記の意味的制約条件とは無
関係に探し補完するというものがあった。
【0004】また、さらに進んだ省略語補完技術として
、単語が有する意味素性などの概念的情報を用いたもの
があった。すなわち、動詞などの各述語に対し、その格
成分になり得る語の意味的制約条件を予め定義し、以前
に入力された文または節の中の名詞のうち新しいものか
ら、制約条件に当てはまるものを探しだし、そうして見
付かった語を補完するというものである。例えば、「太
郎の目の前に奇妙な食べ物が出された。ところが、(φ
が)(φを)食べてみると…。」という文章について考
えてみる(文中の“φ”は省略されていることを表して
いる)。
【0005】「食べる」の助詞「が」の表示する格にな
り得るのは動物、助詞「を」の表示する格になり得るの
は食べ物と定義されていた場合、第一文の名詞の新しい
方から「食べ物」「前」「目」「太郎」の順で意味情報
を調べ、動物・食べ物を探す。その結果、動物に含まれ
る「太郎」を「食べる」の「が」の表示する格とし、食
べ物である「食べ物」を「を」の表示する格として補完
することとなる。
【0006】
【発明が解決しようとする課題】しかしながら、省略語
補完技術においては、意味的制約条件に合うものでなけ
れば補完することができないというのは、通常の文では
最低限必要な条件である。したがって、これと無関係に
以前の同じ格の成分の語を補完する語として選択する場
合、正確な補完を期待することはできなかった。
【0007】また、意味素性などの概念的情報を用いた
省略補完技術では、省略されているところに近いところ
に補完すべき語があるといったことを前提としており、
その蓋然性は必ずしも高くない。このため、かかる従来
技術でも省略語の補完に関して、あまり良好な精度は得
られなかった。そして、これら従来の技術により省略さ
れている語を全て補おうとすると、かえって誤りの絶対
数が増加し、機械翻訳などの後編集に負担がかかるため
、応用技術上どうしても省略語の補完が必要な場合には
、助詞「が」の表示する格の成分あるいは主語などの補
完に限定しておこなっていた。また、省略語補完技術を
機械翻訳に応用する場合、例えば、「花」の対訳として
、flowerとblossomのどちらかを選ぶには
、「桜、バラ」などの連体修飾成分の補完が必要となる
。しかし、このような補完を行うことは従来の省略語補
完技術ではほとんど不可能であった。
【0008】本発明は上記従来の課題を解決すべくなさ
れたものであり、以前の文または節の主題を含む文脈に
関する情報を利用して省略語の補完を行うことにより、
精度の高い省略語補完を実現すると共に、必要な連体修
飾成分の補完をも実現することを目的とする。
【0009】
【課題を解決するための手段】上記の目的を達成するた
め、本発明は、日本語文を単語に分割し、該単語に単語
の持つ構文情報及び意味情報を付加する形態素解析処理
と、上記形態素解析処理により分割された単語相互の係
り受け関係や句構造などの文構造を上記構文情報と意味
情報及び上記文構造に関する所定の解析規則に従って解
析する構文解析処理とを施された文の節を入力し、上記
入力した節中の省略された語を補完する省略語補完装置
において、上記入力した節中の省略語のうち格成分とな
るべき語を、上記構文情報と意味情報と以前の文または
節の主題を含む文脈に関する情報とに基づき所定の省略
補完規則に従って補完する格成分省略補完部と、上記格
成分となるべき語を補完された節の主題を、上記構文情
報と意味情報と以前の文または節の主題を含む文脈に関
する情報と語彙関係情報とに基づき所定の主題判定規則
に従って判定する主題判定部と、上記格成分省略補完部
によって格成分となるべき語の補完がなされた節と上記
主題判定部によって判定された主題とを文脈に関する情
報として格納する文脈情報保特部とを備えることを特徴
とする。
【0010】また、請求項6の発明は、日本語文を単語
に分割し、該単語に単語の持つ構文情報及び意味情報を
付加する形態素解析処理と、上記形態素解析処理により
分割された単語相互の係り受け関係や句構造などの文構
造を上記構文情報と意味情報及び上記文構造に関する所
定の解析規則に従って解析する構文解析処理とを行う日
本語解析システムにおいて、上記入力した文の節中の省
略された語を補完する省略語補完装置を備え、かかる省
略語補完装置が、上記入力した節中の省略語のうち格成
分となるべき語を、上記構文情報と意味情報と以前の文
または節中の主題を含む文脈に関する情報とに基づき所
定の省略補完規則に従って補完する格成分省略補完部と
、上記格成分となるべき語を補完された節の主題を、上
記構文情報と意味情報と以前の文または節の主題を含む
文脈に関する情報と語彙関係情報とに基づき所定の主題
判定規則に従って判定する主題判定部と、上記格成分省
略補完部によって格成分となるべき語の補完がなされた
節と、上記主題判定部によって判定された主題とを文脈
に関する情報として格納する文脈情報保特部とを備えて
なることを特徴とする。
【0011】請求項2、請求項3、請求項7及び請求項
8の発明は、格成分省略補完部が、入力した節中の述語
に付加された構文情報及び意味情報に基づき、入力した
節において成分が省略されている格及びその格の成分の
名詞句が満たすべき条件を検出する省略格検出手段と、
上記単語が省略されている格成分となり得る語を、上記
構文情報及び意味情報に基づき文脈情報保特部に格納さ
れた以前の文または節の中から選び出す補完候補選択手
段と、上記補完候補選択手段が選択した語に対して所定
の省略補完規則を適用し、上記格成分の省略された語で
ある蓋然性が高いと判断された語から順に優先順位を決
定する優先順位決定手段と、上記優先順位の最上位の語
を上記格成分となるべき語として上記入力した節にかけ
る省略語補完手段とを備えてなることを特徴とする。
【0012】請求項4及び請求項9の発明は、主題判定
部が、入力した節の主題となり得る語を該入力した節あ
るいは文脈情報保持部に格納された以前の文または節の
中から選び出す主題候補選択手段と、上記主題候補選択
手段が選択した語に対して所定の主題判定規則を適用し
、上記入力した節の主題である蓋然性が最も高いと判断
された語を上記入力した節の主題として決定する主題決
定手段とを備えてなることを特徴とする。
【0013】請求項5及び請求項10の発明は、主題判
定部による節の主題判定の根拠となった名詞間の関係に
基づき、上記節の省略語のうち連体修飾成分となるべき
語を補完する連体修飾成分補完部を備えることを特徴と
する。
【0014】
【実施例】以下、本発明の実施例について図面を参照し
て詳細に説明する。図1は、本発明の一実施例に係る省
略語補完装置の構成を示すブロック図である。
【0015】図示のように、本実施例の省略語補完装置
1は、入力した日本語の文の節中の省略語のうち格成分
となるべき語を補完する格成分省略補完部2と、格成分
となるべき語を補完された節の主題を判定する主題判定
部3と、かかる文または節中の省略語のうち連体修飾成
分となるべき語を補完する連体修飾成分省略語補完部4
と、かかる節の解析結果とその主題とを文脈に関する情
報(以下、文脈情報と称す)として格納する文脈情報保
持部5とを備えてなる。また、本実施例には、省略語を
補完するための省略補完ルール集6と、主題を判定する
ための主題判定ルール集7及び語彙関係データベース8
を格納する外部メモリが接続されている。
【0016】本実施例の省略語補完装置1には、構文解
析装置等によって、日本語文を単語に分割し各単語に構
文情報及び意味情報を付加する形態素解析処理と、形態
素解析処理により分割された単語相互の係り受け関係や
句構造等の文構造を上記構文情報と意味情報及び上記文
構造に関する所定の解析規則に従って解析する構文解析
処理とを施された文の節が入力される。これらの形態素
解析処理や構文解析処理を行う手段としては、従来から
用いられている手段を用いることができる。
【0017】上記格成分省略補完部2は、図2に示すよ
うに入力した節中において単語が省略されている格成分
(以下、省略格と称す)を検出する省略格検出手段21
と、かかる省略格に該当する語を文脈情報保持部5に格
納された以前の文または節の文脈情報の中から選び出す
補完候補選択手段22と、選び出された語に対し省略補
完ルール集6中のルール(省略補完規則)を適用し省略
格に該当する蓋然性が高い語から順に優先順位を決定す
る優先順位決定手段23と、優先順位が最上位の語を入
力した節の省略格の位置にかける省略語補完手段24と
を補えてなる。
【0018】形態素解析処理及び構文解析処理が施され
た文の節が入力されると、省略格検出手段21は入力し
た節中の述語に着目し、これに付加された構文情報及び
意味情報に基づいてその述語に実際に係っている語を検
査し、省略格の有無及びその格の成分の名詞句が満たす
べき条件を判断する。
【0019】省略格が検出されると、補完候補選択手段
22は省略格が係る述語の構文情報及び意味情報に基づ
いて文脈情報保持部5の文脈情報よりその省略格の条件
を満たす語、すなわち補完候補を選び出す。ここで、文
脈情報保持部5には以前に省略語補完処理がなされた節
の解析結果及びその節の主題が文脈情報として格納され
ている。
【0020】補完候補が選択されると、優先順位決定手
段23は各補完候補に対して外部メモリに格納された省
略補完ルール集6のルールを適用し、各補完候補が省略
格に該当する蓋然性がどれくらいあるかを判断する。そ
して、蓋然性の高い補完候補から順に優先順位を決定す
る。
【0021】ここで省略補完ルール集6には、補完候補
が以前の文または節中でどのような特徴(主題、格成分
等)を有していたかを条件として、省略格に該当する蓋
然性がどの程度あるかを得点化したルールを集めてある
。そして、かかる省略補完ルールのうち一致したルール
の得点の総計により各補完候補が省略格に該当する蓋然
性が評価されることとなる。
【0022】省略補完ル−ルは、以前の主題が助詞「が
」「を」「に」の表示する省略格の成分となりやすいこ
と、前の節または前の文の主節の格成分の語及びそれら
を修飾する語、そこにおいて省略語補完に用いられた語
、及びそこにおいて比喩的に場所化されている語のよう
な次の節の主題になりやすい語が省略格の成分になりや
すいこと、ただし、原因理由を述べる節のような従属的
な前の節で助詞「が」に係っている語が主格を補完する
語とならないこと、などが、個々にル−ル化されている
【0023】下記の表に省略補完ルールの例を示す。な
お、表中の各ル−ルの得点の大小は、言語現象の調査に
基づいて設定されており、得点が大きいほど省略格に該
当する蓋然性が高い。
【0024】
【表1】
【0025】補完候補の優先順位が決定すると、省略語
補完手段24は優先順位の最も高い補完候補を省略格に
該当する語として入力した節に補完する。ここで、補完
すべき省略格が複数あり、かつ同一の語が複数の省略格
の補完候補となっている場合、最も蓋然性の高い(ルー
ルの得点の総計が高い)補完候補と省略格の組合わせを
優先させる。そして、他の省略格には次に優先順位の高
い補完候補によって補完する。
【0026】省略格の補完が完了すると、省略語補完手
段24は補完のなされた節を主題判定部3及び連体修飾
語補完部4へ送る。
【0027】なお、入力した節に省略格がないとき(省
略格検出手段21が省略格を検出しなかったとき)は上
記の省略語補完処理を行わずにかかる節を主題判定部3
及び連体修飾成文補完部4へ送る。
【0028】上記主題判定部3は、図3に示すように格
成分を補完された節を入力してかかる節の主題となり得
る語をその節あるいは文脈情報保持部5の以前の文また
は節の文脈情報の中から選び出す主題候補選択手段31
と、選び出された語に対し主題判定ルール集7中のルー
ル(主題判定規則)及び語彙関係データベース8中の語
彙関係情報を適用し主題に該当する蓋然性が最も高い語
を主題として決定する主題決定手段32とを備えてなる
【0029】格成分省略補完部2によって省略格の補完
がなされた節が入力されると、主題候補選択手段31は
入力した節の主題となるべき語、すなわち主題候補を入
力した節自体あるいは文脈情報保持部5の文脈情報の中
から選び出す。
【0030】ここで主題候補選択手段31は、入力した
節あるいは文脈情報において明示されている語及び格成
分省略補完部2により補完された省略語を主題候補とし
て選ぶ。入力した節の中から主題候補として選ばれるの
は、係助詞「は」「こそ」「も」や「の場合」「なら」
などに係る語、時間格場所格以外の助詞「が」「を」「
に」の表示する省略格に補われた語、及び「と思う」の
節の「と」に係る節の主題などである。文脈情報の中か
ら主題候補として選ばれるのは、以前の文または節の主
題、以前の文または節の格成分の語、それらを修飾する
語、及びそこにおいて比喩的に場所化されている語のよ
うな次の節の主題になりやすい語などである。
【0031】主題候補が選び出されると、主題決定手段
32は各主題候補に対して外部メモリに格納された主題
判定ルール集7のルールを適用し、各主題候補が主題に
該当する蓋然性がどれくらいあるかを判断する。そして
最も蓋然性の高い語を入力した節の主題として決定する
【0032】ここで主題判定ル−ル7には、主題候補が
入力した節中より選出されたものである場合には、その
主題候補がその節において語順的にどんな位置にあるか
、節内においてどんな役割を担っているか、以前の節の
主題等と同一であるか、あるいは以前の節の主題などと
上位下位などの概念的関係にあるか、また主題候補が文
脈情報中より選出されたものである場合には、その主題
候補が入力した節の名詞句と上位下位などの概念的関係
にあるか、その主題候補がそこの格成分などに明示され
ているかなどを条件として、主題に該当する蓋然性がど
の程度あるかを得点化したル−ルを集めてある。そして
、かかる主題判定ルールのうち一致したルールの得点の
総計により各主題候補が主題に該当する該然性が評価さ
れることとなる。下記の表に主題判定ルールの例を示す
。なお、表中の各ルールの得点の大小は、言語現象の調
査に基づいて設定されており、得点が大きいほど主題に
該当する蓋然性が高い。また、表中「第1名詞句」「第
2名詞句」とあるのは入力した節中の名詞句に前のもの
から順に番号を付したものである。
【0033】
【表2】
【0034】主題決定手段32が主題候補と文脈情報中
の語との間など語と語の上位下位などの概念的関係を判
断する際には語彙関係データベース8の情報を参照する
。語彙関係データベース8には、どの名詞がどの名詞と
どのような関係にあるかといった情報が多数格納されて
いる。格納した名詞間の関係には、上位と下位、集合と
要素、全体と部分、実体と属性等がある。
【0035】主題が決定されると、主題決定手段32は
その情報を連体修飾成分補完部4へ送る。なお、入力し
た節が主題を持たない種類のものである場合(例えば、
従属的な節や関係節等)は上記の主題判定処理を行わず
にかかる節を連体修飾成分省略補完部4へ送る。
【0036】上記連体修飾成分補完部4は主題判定部3
による主題決定の根拠のひとつとなった名詞間の関係に
基づき、入力した節の省略語のうち連体修飾成分となる
べき語を補完する。そして、連体修飾成分を補完された
節と主題とを文脈情報保持部5に送り、さらに補完され
た節を出力して構文解析装置等へ送る。この補完により
、次の文または節の省略語補完や主題判定の際、判断材
料が増えることとなり、精度の向上を図ることができる
。また、本実施例を機械翻訳システムに応用する場合に
も、より正確な翻訳処理を行うことができる。
【0037】なお、連体修飾成分補完部4は必須の構成
要件ではなく、連体修飾成分の省略語を補完する必要が
ない場合は設けなくても良い。この場合、格成文省略補
完部2から格成分を補完された節が、また主題判定部3
からその節の主題が直接文脈情報保持部5に送られる。 また、格成分省略補完部2から格成分を補完された節が
直接出力され、構文解析装置等へ送られる。
【0038】上記文脈情報保持部5は、入力した省略語
を補完された節及びその主題を文脈情報として格納する
。格納された文脈情報は次に入力される節の省略語の補
完及び主題の判定に利用されることとなる。
【0039】以上のように構成した本実施例の省略語補
完装置1は、単独で利用してもよくまた日本語解析シス
テムや機械翻訳システム等の内部に内在させて利用して
もよい。日本語解析システム中に内在させた場合の構成
例を図4に示す。
【0040】図示のように、日本語解析システム中に省
略語補完装置を内在させた場合、構文解析装置9によっ
て形態素解析及び構文解析がなされた文の節が格成分省
略補完部2へ送られ、主題判定部3と連体修飾成分補完
部4を経て節の解析結果が構文解析装置9に返されるこ
ととなる。また、補完されるべき語を一旦構文解析装置
9に送り、文または節の解析結果(文または節内の単語
の係り受け関係を示す解析木等)に加えて新たな解析結
果とすることもできる。
【0041】次に、図4に示す日本語解析システムによ
り、「バイオ関連株が魅力的だが、小型株が多く、機関
投資家に勧めにくい。値動きが予想以上に激しい。」と
いう文の省略語の補完を行った場合を例として、本実施
例の動作について説明する。まず、構文解析装置9で「
バイオ関連株が魅力的だが」まで形態素解析及び構文解
析が進んだところで、解析結果が格成分省略補完部2へ
送られる。
【0042】格成分省略補完部2は入力した解析結果中
の述語「魅力的だ」に着目し、辞書の「魅力的だ」の項
から取り出された情報に基づき、「魅力的だ」が助詞「
を」「に」の表示する格(以下、「を」格、「に」格と
称す)を持たないこと、及び助詞「が」の表示する格(
以下、「が」格と称す)をもつが解析結果からすでに「
バイオ関連株」が係っていることから、省略格がないと
判断する。そこで省略格の補完を行なわずに解析結果を
連体修飾成分省略補完部4へ送る。
【0043】主題判定部3は、解析結果中にも文脈情報
中にも主題候補となる語がないことからこの節には主題
がないと判断する。そして、かかる判定結果を連体修飾
成分省略補完部4と文脈情報保持部5へ送る。また、主
題がなく上位下位などの概念的関係の存在を主題決定に
利用していないことから、連体修飾成分省略補完部4は
省略語の補完を行わず、解析結果をそのまま文脈情報保
持部5と構文解析装置9へ送る。
【0044】次に、構文解析装置9で「バイオ関連株が
魅力的だが、小型株が多く」まで解析され、解析結果が
格成分省略補完部2へ送られる。
【0045】格成分省略補完部2は述語「多い」に着目
して省略格を補完する。「多い」の辞書情報から「多い
」は「が」格、「に」格をもつが、「が」格には「小型
株」が係っているので、まず、省略格検出手段21によ
って助詞「に」格が省略されていること及び「に」格に
係る名詞の条件が検出される。そして、補完候補選択手
段22によって補完候補「バイオ関連株」が選出され、
優先順位決定手段23によって「に」格に該当する蓋然
性が判断され、省略語の補完手段によって「バイオ関連
株」が述語「多い」の「に」格にかけられる。下記の表
に補完候補「バイオ関連株」への省略補完ル−ルの適用
例を示す。
【0046】
【表3】
【0047】主題判定部3は、この補完済みの解析結果
と、文脈情報保持部5の文脈情報をもとに、この節の主
題を判定する。省略格に補完された語は主題候補になる
ので、主題候補選択手段31によって「バイオ関連株」
が主題候補として選出される。他に前の節の「が」格の
格成分「バイオ関連株」及び前の節全体を示す「これ」
が主題候補となり、主題決定手段32によって「バイオ
関連株」などがこの節の主題となる蓋然性が判断され、
「バイオ関連株」がこの節の主題として決定され、連体
修飾成分補完部4と文脈情報保持部5に送られる。なお
、同じ語が節内の主題候補であると同時に節外の主題候
補であるとき、節内の主題候補としてのみ扱い主題判定
ルールを適用する。表4に各主題候補に対する主題判定
ル−ルの適用例を示す。
【0048】
【表4】
【0049】連体修飾成分補完部4は、主題「バイオ関
連株」と同一の語が文脈情報中にあり、上位下位などの
概念的関係を主題決定の根拠としていないことから連体
修飾成分の補完を行わず補完済みの解析結果を構文解析
装置9と文脈情報保持部5へ送る。
【0050】構文解析装置9は、以上の補完に基づいて
次の文または節の解析処理を続ける。したがって、文脈
情報保持部5には「バイオ関連株が魅力的だが、{バイ
オ関連株に}小型株が多く、」という解析結果とこの節
の主題「バイオ関連株」とが格納される。
【0051】次に、構文解析装置9で「バイオ関連株が
魅力的だが、{バイオ関連株に}小型株が多く、機関投
資家に勧めにくい。」まで解析され、解析結果が格成分
省略補完部2へ送られる。
【0052】格成分省略補完部2は述語「勧める」に着
目して省略語を補完する。まず、省略格検出手段21に
よって「が」格及び「を」格が省略されていること及び
、それぞれの格に係る名詞の条件が検出される。そして
、補完候補選択手段22によってそれぞれの格の補完候
補が文脈情報から選出される。ここでは「が」格には該
当する語がなく、「を」格についてのみ「バイオ関連株
」「小型株」「これ(前の節全体を表す)」が補完候補
として選出される。
【0053】補完候補が選出されると、優先順位決定手
段23によって各補完候補が「を」格に該当する蓋然性
が判断され、「バイオ関連株」「小型株」「これ」の順
で優先順位が決定される。表5に各補完候補に対する省
略補完ル−ルの適用例を示す。
【0054】
【表5】
【0055】補完候補の優先順位が決定すると、省略語
補完手段24によって最も優先順位の高い「バイオ関連
株」が述語「勧める」の「を」格にかけられる。
【0056】主題判定部3は、この補完済みの解析結果
よりこの節の主題を判定する。まず、主題候補選択手段
31によって省略格に補完された「バイオ関連株」、前
の節の主題「バイオ関連株」及び前の節の「が」格の格
成分「小型株」が節内の主題候補として選出される。
【0057】主題候補が選出されると、主題決定手段3
2によって各主題候補がこの節の主題となる蓋然性が判
断され、最も蓋然性の高い「バイオ関連株」が節内の主
題として決定される。
【0058】連体修飾成分補完部4は、主題「バイオ関
連株」と同一の語が文脈情報中にあり、概念的な上位下
位関係を主題決定の根拠としていないことから補完を行
わず、補完された解析結果等を構文解析装置9と文脈情
報保持部5に送る。したがって、文脈情報保持部5には
「バイオ関連株が魅力的だが、{バイオ関連株に}小型
株が多く、{バイオ関連株を}機関投資家に勧めにくい
。」という解析結果とこの節の主題「バイオ関連株」と
が格納される。
【0059】次に、構文解析装置9で「値動きが予想以
上に激しい。」という文が解析され、解析結果が格成分
省略補完部2へ送られる。
【0060】格成分省略補完部2は述語「激しい」に着
目し、「が」格、「を」格、「に」格のいずれにも格成
分の省略がないと判断し、解析結果を主題判定部3へ送
る。
【0061】主題判定部3はかかる解析結果によりこの
節の主題を判定する。  まず、主題候補選択手段31
によって「バイオ関連株」、「機関投資家」、「これ(
前の節全体を表す)」が主題候補として選出される。
【0062】主題候補が選出されると、主題決定手段3
2によって各主題候補がこの節の主題となる蓋然性が判
断され、最も蓋然性の高い「バイオ関連株」が主題とし
て決定される。
【0063】連帯修飾成分補完部4は、主題判定の際に
検出した名詞間の関係(ここでは主体現象関係)に基づ
き「バイオ関連株」を「値動き」にかけ、その結果を構
文解析装置9と文脈情報保持部5へ送る。したがって文
脈情報保持部5には「{バイオ関連株の}値動きが予想
以上に激しい。」という解析結果とこの文の主題「バイ
オ関連株」とが格納される。
【0064】以上で「バイオ関連株が魅力的だが、小型
株が多く、機関投資家に勧めにくい。値動きが予想以上
に激しい。」という文の省略語補完処理を終了する。こ
の処理の結果日本語解析システムから出力される解析結
果は、「バイオ関連株が魅力的だが、{バイオ関連株に
}小型株が多く、{バイオ関連株を}機関投資家に勧め
にくい。{バイオ関連株の}値動きが予想以上に激しい
。」となる。
【0065】
【発明の効果】以上説明したように、請求項1及至3及
び請求項6及至8の発明は、日本語文に対して省略語の
補完を行う省略語補完装置において、格成分省略補完部
と主題判定部と文脈情報保持部とを備え、文脈情報保持
部に格納した文脈情報を次の文または節の省略語補完や
主題判定の際に利用することとしたため、精度の高い省
略語補完をすることができる。
【0066】また、文脈情報として以前の文または節し
の主題をも利用することにより、特に日本語文において
主題と関係の深い助詞「が」、「を」あるいは「に」が
表示する格の格成分の省略に対し、精度の高い補完をす
ることができるという効果がある。
【0067】請求項4及び請求項9の発明は、主題判定
部が、主題候補を処理中の節あるいは文脈情報の中から
選び出す主題候補選択手段と、選び出された各主題候補
の主題となる蓋然性を判断し最も蓋然性の高い主題候補
をその節の主題として決定する主題決定手段とを備える
ことにより、節の主題の判定を正確に行うことができ、
これによって判定された主題を利用する省略語補完装置
の精度の向上を図ることができる。
【0068】請求項5及び請求項10の発明は、主題判
定部による節の主題決定の根拠のひとつとなった名詞間
の関係に基づき、上記節の省略語のうち連体修飾成分と
なるべき語を補完する連体修飾成分補完部を備えること
により、次の文または節の解析や省略語補完を行う際、
また機械翻訳システムへの応用の際により正確な処理を
行うことができるという効果がある。
【0069】
【図面の簡単な説明】
【図1】本発明の一実施例による省略語補完装置を示す
ブロック図である。
【図2】図1の格成分省略補完部の機能を示す機能ブロ
ック図である。
【図3】図1の主題判定部の機能を示す機能ブロック図
である。
【図4】本発明の一実施例による日本語解析システムを
示すブロック図である。
【符号の説明】
1  省略語補完装置 2  格成分省略補完部 3  主題判定部 4  連体修飾成分省略補完部 5  文脈情報保持部 6  省略補完ル−ル集 7  主題判定ル−ル集 8  語彙関係デ−タベ−ス 9  構文解析装置 21  省略格検出手段 22  補完候補選択手段 23  優先順位決定手段 24  省略語補完手段 31  主題候補選択手段 32  主題決定手段

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】  日本語文を単語に分割し、該単語に単
    語の持つ構文情報及び意味情報を付加する形態素解析処
    理と、上記形態素解析処理により分割された単語相互の
    係り受け関係や句構造などの文構造を上記構文情報と意
    味情報及び上記文構造に関する所定の解析規則に従って
    解析する構文解析処理とを施された文の節を入力し、上
    記入力した文の節中の省略された語を補完する省略語補
    完装置において、上記入力した節中の省略語のうち格成
    分となるべき語を、上記構文情報と意味情報と以前の文
    または節の主題を含む文脈に関する情報とに基づき所定
    の省略補完規則に従って補完する格成分省略補完部と、
    上記格成分となるべき語を補完された節の主題を、上記
    構文情報と意味情報と以前の文または節の主題を含む文
    脈に関する情報と語彙関係情報とに基づき所定の主題判
    定規則に従って判定する主題判定部と、上記格成分省略
    補完部によって格成分となるべき語の補完がなされた節
    と上記主題判定部によって判定された主題とを文脈に関
    する情報として格納する文脈情報保特部とを備えること
    を特徴とする省略語補完装置。
  2. 【請求項2】  格成分省略補完部が、入力した節中の
    述語に付加された構文情報及び意味情報に基づき、入力
    した節において成分が省略されている格及びその格の成
    分の名詞句が満たすべき条件を検出する省略格検出手段
    と、上記単語が省略されている格成分となり得る語を、
    上記構文情報及び意味情報に基づき文脈情報保特部に格
    納された以前の文または節の中から選び出す補完候補選
    択手段と、上記補完候補選択手段が選択した語に対して
    所定の省略補完規則を適用し、上記格成分の省略された
    語である蓋然性が高いと判断された語から順に優先順位
    を決定する優先順位決定手段と、上記優先順位の最上位
    の語を上記格成分となるべき語として上記入力した節に
    かける省略語補完手段とを備えてなることを特徴とする
    請求項1に記載の省略語補完装置。
  3. 【請求項3】  格成分省略補完部に備えた省略格検出
    手段が、少なくとも助詞「が」、「を」あるいは「に」
    が表示する格であって時間格及び場所格以外の格につい
    て成分が省略されている格及びその格の成分の名詞句が
    満たすべき条件を検出することを特徴とする請求項2に
    記載の省略語補完装置。
  4. 【請求項4】  主題判定部が、入力した節の主題とな
    り得る語を該入力した節あるいは文脈情報保持部に格納
    された以前の文または節の中から選び出す主題候補選択
    手段と、上記主題候補選択手段が選択した語に対して所
    定の主題判定規則を適用し、上記入力した節の主題であ
    る蓋然性が最も高いと判断された語を上記入力した節の
    主題として決定する主題決定手段とを備えてなることを
    特徴とする請求項1に記載の省略語補完装置。
  5. 【請求項5】  主題判定部による節の主題判定の根拠
    となった名詞間の関係に基づき、上記節の省略語のうち
    連体修飾成分となるべき語を補完する連体修飾成分補完
    部を備えることを特徴とする請求項1、2または4のい
    ずれかに記載の省略語補完装置。
  6. 【請求項6】  日本語文を単語に分割し、該単語に単
    語の持つ構文情報及び意味情報を付加する形態素解析処
    理と、上記形態素解析処理により分割された単語相互の
    係り受け関係や句構造などの文構造を上記構文情報と意
    味情報及び上記文構造に関する所定の解析規則に従って
    解析する構文解析処理とを行う日本語解析システムにお
    いて、上記入力した文の節中の省略された語を補完する
    省略語補完装置を備え、かかる省略語補完装置が、上記
    入力した節中の省略語のうち格成分となるべき語を、上
    記構文情報と意味情報と以前の文または節の主題を含む
    文脈に関する情報とに基づき所定の省略補完規則に従っ
    て補完する格成分省略補完部と、上記格成分となるべき
    語を補完された節の主題を、上記構文情報と意味情報と
    以前の文または節の主題を含む文脈に関する情報と語彙
    関係情報とに基づき所定の主題判定規則に従って判定す
    る主題判定部と、上記格成分省略補完部によって格成分
    となるべき語の補完がなされた節と、上記主題判定部に
    よって判定された主題とを文脈に関する情報として格納
    する文脈情報保特部とを備えることを特徴とする日本語
    解析システム。
  7. 【請求項7】  格成分省略補完部が、入力した節中の
    述語に付加された構文情報及び意味情報に基づき、入力
    した節において成分が省略されている格及びその格の成
    分の名詞句が満たすべき条件を検出する省略格検出手段
    と、上記単語が省略されている格成分となり得る語を、
    上記構文情報及び意味情報に基づき文脈情報保特部に格
    納された以前の文または節の中から選び出す補完候補選
    択手段と、上記補完候補選択手段が選択した語に対して
    所定の省略補完規則を適用し、上記格成分の省略された
    語である蓋然性が高いと判断された語から順に優先順位
    を決定する優先順位決定手段と、上記優先順位の最上位
    の語を上記格成分となるべき語として上記入力した節に
    かける省略語補完手段とを備えてなることを特徴とする
    請求項6に記載の日本語解析システム。
  8. 【請求項8】  格成分省略補完部に備えた省略格検出
    手段が、少なくとも助詞「が」、「を」あるいは「に」
    が表示する格であって時間格及び場所格以外の格につい
    て成分が省略されている格及びその格の成分の名詞句が
    満たすべき条件を検出することを特徴とする請求項7に
    記載の日本語解析システム。
  9. 【請求項9】  主題判定部が、入力した節の主題とな
    り得る語を該入力した節あるいは文脈情報保持部に格納
    された以前の文または節の中から選び出す主題候補選択
    手段と、上記主題候補選択手段が選択した語に対して所
    定の主題判定規則を適用し、上記入力した節の主題であ
    る蓋然性が最も高いと判断された語を上記入力した節の
    主題として決定する主題決定手段とを備えてなることを
    特徴とする請求項6に記載の日本語解析システム。
  10. 【請求項10】  主題判定部による節の主題判定の根
    拠となった名詞間の関係に基づき、上記節の省略語のう
    ち連体修飾成分となるべき語を補完する連体修飾成分補
    完部を備えることを特徴とする請求項6、7または9の
    いずれかに記載の日本語解析システム。
JP3143812A 1991-05-20 1991-05-20 省略語補完装置及び日本語解析システム Expired - Fee Related JP2775655B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3143812A JP2775655B2 (ja) 1991-05-20 1991-05-20 省略語補完装置及び日本語解析システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3143812A JP2775655B2 (ja) 1991-05-20 1991-05-20 省略語補完装置及び日本語解析システム

Publications (2)

Publication Number Publication Date
JPH04343173A true JPH04343173A (ja) 1992-11-30
JP2775655B2 JP2775655B2 (ja) 1998-07-16

Family

ID=15347545

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3143812A Expired - Fee Related JP2775655B2 (ja) 1991-05-20 1991-05-20 省略語補完装置及び日本語解析システム

Country Status (1)

Country Link
JP (1) JP2775655B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09179875A (ja) * 1995-12-25 1997-07-11 Sharp Corp 情報検索装置
US7873508B2 (en) 2005-05-25 2011-01-18 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for supporting communication through translation between languages

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09179875A (ja) * 1995-12-25 1997-07-11 Sharp Corp 情報検索装置
US7873508B2 (en) 2005-05-25 2011-01-18 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for supporting communication through translation between languages

Also Published As

Publication number Publication date
JP2775655B2 (ja) 1998-07-16

Similar Documents

Publication Publication Date Title
Gildea et al. The necessity of parsing for predicate argument recognition
US20110040552A1 (en) Structured data translation apparatus, system and method
JPS61163467A (ja) 機械翻訳システム
US9075864B2 (en) Method and system for semantic searching using syntactic and semantic analysis
JP2011118689A (ja) 検索方法及びシステム
US9582492B2 (en) Extraction of lexical kernel units from a domain-specific lexicon
Lenci et al. Multilingual Summarization by Integrating Linguistic Resources in the MLIS-MUSI Project.
JPH04343173A (ja) 省略語補完装置及び日本語解析システム
Hirano et al. Detecting semantic relations between named entities in text using contextual features
Constant et al. Statistical MWE-aware parsing
Shimojo How missing is the missing verb?
JP5245291B2 (ja) 文書解析装置、および文書解析方法、並びにコンピュータ・プログラム
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
KR100371135B1 (ko) 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법
JP2661934B2 (ja) 日本語処理システム
JP4033089B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3058511B2 (ja) 中国語文解析方法および中国語文解析装置
JP2008204010A (ja) 質問内容抽出装置と質問内容抽出方法
JP2006190226A (ja) 用言自動換言装置、用言換言方法及び用言換言処理プログラム
Vassiliou et al. Evaluating Specifications for Controlled Greek
JP3244286B2 (ja) 翻訳処理装置
Mráková et al. From Czech morphology through partial parsing to disambiguation
Estigarribia Automatic detection of syntactic patterns from texts with application to Spanish clitic doubling
JPH0262668A (ja) 文章情報解析技法を用いた文章情報検索方式
CN117009511A (zh) 语义表达生成方法、语义表达生成装置、以及记录介质

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees