JPH0410161A - 省略補完処理装置 - Google Patents

省略補完処理装置

Info

Publication number
JPH0410161A
JPH0410161A JP2114109A JP11410990A JPH0410161A JP H0410161 A JPH0410161 A JP H0410161A JP 2114109 A JP2114109 A JP 2114109A JP 11410990 A JP11410990 A JP 11410990A JP H0410161 A JPH0410161 A JP H0410161A
Authority
JP
Japan
Prior art keywords
subject
sentence
noun phrase
actor
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2114109A
Other languages
English (en)
Inventor
Yoshihiko Hayashi
良彦 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2114109A priority Critical patent/JPH0410161A/ja
Publication of JPH0410161A publication Critical patent/JPH0410161A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野〕 本発明は9日本語文書を入力して処理するに当たって9
省略されている動作主を補完する省略補完処理装置に関
するものである。
〔従来の技術] 動作主の意味役割をもつ名詞句は、能動文では主語(「
ガ」で示される名詞句)であり、省略主語を同定する手
法がいくつか提案されている。ここでは従来の主語同定
手法について述べる。
一般に、省略要素は復元可能な1文中で既知の情報であ
ると言われている(文献〔1)久野すすむ、「談話の文
法」大修能書店、 1983)。そのため、省略されて
いる主語(動作主)を補完する手法としては、前文の主
語で同定する手法、および主題名詞句(「ハ」で示され
る名詞句の)で同定する手法が一般的であった。例えば
下記の例1■のような文の省略主語Xは、主題名詞句で
補完する手法によって、「ハ」で示される名詞句゛Rm
ail コマンド”で補完し1例1■の省略主語Yは、
前文の主語で補完する手法によって、前文で同定された
主語“Rma i l コマンドで同定する。
例1: ■Rmail コマンドは。
[χガ]各メツセージの ヘッダを整形します。
(X=“Rmailコマンド″) ■また。  [Yガ]はとんどのヘッダフィールドを消
去します。
(’1’ =”Rmailコマンド″)(発明が解決し
ようとする課題〕 能動文の主語(動作主)を前文の主語で同定する手法お
よび「ハ、・で示される王題名詞句で同定する手法は多
くの場合において有効であるが、実際の文書には、省略
されている主語(動作主)が指示するものが、前文まで
の文に一度も現れておらず、またその文の主題名詞句で
もない場合が多い。例えば2例2のような文は、操作の
説明書などで頻繁に使われ1文頭から現れることがある
読み手にはその主語(動作主)が「読み手一般」を指示
していることが明らかである。前文から省略要素を同定
する従来の手法では、この文に前文がないため、省略さ
れている動作主は同定できず主題名詞句で同定する手法
では、主題名詞句゛検索”を誤って同定してしまう。
例2:文字の検索は[Xガココントロールキーとfを押
します。
(X−「読み手」、=「検索」) また、従来の手法は主語(「ガ」で示される名詞句)の
名詞句を対象とするので、受動文の動作主(主語ではな
い)を同定する手法は現在提案されていない。
本発明の目的は、上記の問題点を解決し2文頭から省略
されているような主語(動作主)でも受動文の動作主で
も同定し、補完する省略補完処理装置を提供することに
ある。
〔課題を解決するための手段] 上述の例2の主語(動作主)が指示する「読み手」のよ
うに1文書には読む前から予め前提とされている要素が
ある。すなわち、「筆者」 「読み手」はどの文につい
ても関係しているので、前提情報と考えることができる
。したがって、省略動作主を同定する候補として「筆者
」 「読み手」を用意する。また、書き言葉の文書では
記述の対象となっているものがある。記述の対象は、実
際は各段落ごと8あるいは文ごとに異なるが9例えば受
動文の能動化操作のような文書処理では、動作主が「筆
者」か「読み手」か記述の対象物かが問題になり、その
文で記述の対象物となっている名詞句を正確に同定する
必要がない。よって「筆者」r9み手」以外の名詞句は
2字面で同定できる場合を除き、「記述の対象物」とし
て−括し「筆者」 「読み手」 「記述の対象物」の三
つを省略動作主を同定する候補として予め用意しておく
本発明では2人力された日本語文書を処理する日本語文
書処理装置において、特定表現を予め格納する特定表現
辞書を用いてその省略動作主を同定できるか判定する特
定表現判定部と、対象文書の専門分野に限れば一定の動
作主をとることがわかっている動詞を予め格納する分野
動詞辞書を用いて省略動作主を同定できるか判定する分
野動詞判定部と、主題の名詞句によって同定できるか判
定する主題名詞句判定部と1従文の主語あるいは主題で
主文の主語を同定する接続表現を予め格納した接続表現
辞書を用いて省略動作主を同定できるか判定する接続表
現判定部と、同定された動作主を補完する動作主補完部
とを有することを特徴とするものである。
〔作 用] 省略補完処理装置では、すでに構文意味解析の処理を行
った文が入力される。制御部では、各文について、主語
(動作主)を同定する各判定部によって同定された動作
主名詞句を動作主補完部に供給する。特定表現判定部で
は主語(動作主)を同定する特定表現を該入力文が含む
かどうか9分野動詞判定部では動作主を同定する特定の
動詞を該入力文が含むかどうか、主題名詞句判定部では
該入力文が主題名詞句を含むかどうか、接続表現判定部
では主語(動作主)を同定する特定の接続表現を該入力
文が含むかどうか判定する。動作主補完部では、同定し
た名詞句を文の省略動作主の位置に補完する。
〔実施例〕
以下1本発明の一実施例について図面により説明する。
第1図は1本発明の省略補完処理装置の一実施例を示す
構成図である。該省略補完処理装置は。
入力部1.制御部2.特定表現判定部3.特定表現辞書
42分野動詞判定部57分野動詞辞書6゜主題名詞句判
定部7.接続表現判定部8.接続表現辞書9.動作主補
完部10.出力部11から構成される。
人力部1からは、構文意味解析の処理をすでに行った文
が入力されるものとする。構文意味解析は1文全体の構
文構造を解析し1文を構成している名詞句の意味役割や
文の様相などを明らかにする処理で9通常3日本語文書
処理装置には、このような構文意味解析機能が具備され
ている。
制御部2は、第2図図示の制御部の動作フローに従って
、各文の入力された解析結果を判定部へ供給する。まず
、各入力文の解析結果の態の種別によって(処理■)、
それが能動ならその主語(動作主)が同定されるまで、
順に、特定表現判定部32分野動詞判定部5.主題名詞
句判定部7゜接続表現判定部8へ解析結果を供給する(
処理■)。それが受動なら9分野動詞判定部5へ解析結
果を供給する(処理■)ようにする。そして処理■に進
む。
特定表現判定部3は、まず該入力文の様相属性をキーと
して、特定表現辞書4(A)を検索する。
特定表現辞書4(A)は、主語が限られた場合に使う様
相を格納している。第3図(A)に様相属性をキーとし
て検索する特定表現辞書4(A)のエントリー例を示す
。検索に成功した場合には。
その様相属性によって特定された名詞句と文の解析結果
を動作主補完部10に供給する。失敗した場合には、つ
ぎに該入力文の述語の動詞の字面をキーとして特定表現
辞書4(B)を検索する。特定表現辞書4(B)は、主
語が限られた場合に使う動詞を格納している。第3図(
B)に動詞の字面をキーとして検索する特定表現辞書4
(B)のエントリー例を示す、検索に成功した場合には
その動詞によって特定された名詞句と文の解析結果を動
作主補完部10に供給する。検索に失敗した場合には9
文の解析結果を分野動詞判定部5に供給する。
分野動詞判定部5は、該入力文の述語動詞の字面をキー
として2分野動詞辞書6を検索する。分野動詞辞書6に
は、動作主を特定する動詞がソフトウェア、ハードウェ
ア等の分野ごとに予め収集され、格納されている。文書
処理開始時には処理対象とする文書の分野が特定され、
該当辞書が選択されているものとする。第4図にソフト
ウェア分野の分野動詞辞書の一例を示す。検索に成功し
た場合には、その動詞によって特定された動作主名詞句
と文の解析結果を、動作主補完部10に供給する。検索
に失敗した場合には5文の解析結果を主題名詞句判定部
7に供給する。
主題名詞句判定部7は5該入力文の主題名詞句前文の動
作主補完部の他動性をキーとして、主題名詞句で主語を
同定できるかどうか判定する。第5図は主題名詞句判定
部7の動作のフローである。
主題名詞句が主語(動作主)であると判定した場合には
主題名詞句と文の解析結果とを動作主補完部10に供給
する。判定に失敗した場合には2文の解析結果を接続表
現判定部8に供給する。
接続表現判定部8は、該入力文に構文がある場合、該入
力文の接続表現、構文の主語、主題をキーとして、接続
表現辞書9を検索し、構文の主語あるいは主題で主文の
主語を同定できるかどうか判定する。構文というのは、
その文の中心となる述語(句点の前の述語)を含む主文
に、接続詞などでつながる文や、主文の名詞句を修飾す
る文をさす。例えば、「システムが入力部を解析しなが
ら、応答文を作成します。」では、主文が「システムが
応答文を作成します。」で、「入力部を解析しながら」
が構文である。第6図は接続表現判定部8の動作のフロ
ーである。第7図は接続表現辞書の一例である。判定に
成功した場合には構文の主語あるいは主題名詞句と文の
解析結果とを動作主補完部10に供給する。判定に失敗
した場合には、前文の動作主を動作主補完部10に供給
する。
第6図が上記例文「システムが入力部を解析しながら、
応答文を作成します。」を処理するものとすると次の如
くなる。即ち ステップ61:複文なので、ステップ62aへ進む。
ステップ62a:構文(システムが入力文を解析しなが
ら)に、ガ格名詞句(ン ステムが)があるので、ステラ プ63aへ進む。
ステップ63a:接続表現辞書(A):第7回を検索す
る。エントリ (1)がマ ・7チするので検索成功。ステラ プ65aへ進む。
ステップ65a:構文の主語(システム)を出力する。
動作主補完部10は、供給された名詞句が空文字列でな
ければ、その名詞句を文の解析結果の省略動作主の位置
に補完し、解析結果全体を出力部11を介して出力する
。供給された名詞句が空文字列である場合、すなわち2
文書の第1文で、前文の動作主がなく、特定表現判定部
31分野動詞判定部5.主題名詞句判定部7.接続表現
判定部8を経ても動作主が同定されなかった場合、ユー
ザに問うことによって主語(動作主)の名詞句を得、補
完する。
以下、具体例について説明する。ここでは例3の文書を
処理の対象とする。文書の分野はソフトウェアで、該当
分野動詞辞書がすでに選択されているものとする。
例3 ■データは頻繁に保存してください。
■セットされたウィンドウ数は、クローズ時に消えてし
まいます。
入力部1は、各文の構文意味解析結果を人力する。文■
■は、解析の結果1次の単文に分けられる。文番号は文
頭から、主文を先に、続いて主文に属する構文に対して
順につける。
(1)データは頻繁に保存してください。
(2)ウィンドウ数はクローズ時に消えてしまいます。
(3)(ウィンドウ数が)セットされた。
第8図に上記例3の各単文の構文意味解析結果の一部を
示す。?印はこの段階では値が未定なことを示す。−一
−は値が存在しないことを示す。
制御部2ではまず2文番号の若い順に、能動化の第2図
のフローに従ってその文の省略動作主の補完を行う。ま
ず、(処理■)では1文(1)の解析結果から態の値を
得る。そして、それが「能動」と一致することから、 
(処理■)へ進む。
(処理■)では、まず、特定表現判定部3で文(1)の
構文解析結果(第8図)から、様相の値「依願」を得、
それをキーとして特定表現辞書4(A)(第3図(A)
)を検索する。辞書項目(4)に「依願」があるので検
索は成功し、動作主が「読み手」に特定される。特定し
た動作主名詞句[読み手」と文の解析結果とを動作主補
完部10へ供給する。動作主補完部10では、同定され
た動作主「読み手」を文(1)の解析結果の動作主スロ
ントに補完する。
制御部2は、つぎに文(2)の省略動作主の補完を行う
。第2図のフローの(処理■)では文(2)の態が能動
であることから8文(1)と同様、(処理■)に進み、
特定表現判定部3において、省略動作主の同定を試みる
特定表現判定部3では1文(2)の様相値述語動詞“消
える゛をキーとして特 定表現辞書4 (A)(B)  (第3図(A)(B)
 )をそれぞれ検索するが、いずれも検索に失敗する。
そこで制御部2は文の解析結果を分野動詞判定部5へ供
給する。
分野動詞判定部5では、述語動詞“°消える”をキーと
して分野動詞辞書6(第4図)を検索するが失敗する。
そこで制御部2は文の解析結果を主題名詞句判定部7へ
供給する。
主題名詞句判定部7では、第5図図示のフローに従って
、主題名詞句で省略動作主を同定できるか判定する。ま
ず、 (ステップ51)では、入力された解析結果(第
8図)に主題名詞句“ウィンドウ数°゛があることを確
認し、 (ステップ52)に進む、(ステップ52)で
は、解析結果から前文・文(1)の動作主「読み手」を
得、それが「読み手」と一致することを確認し、 (ス
テップ53)に進む。(ステップ53)では1文(2)
の解析結果(第8図)からその述語動詞の意志性値〔+
]を得、それが[+](意志性の動詞)であることを確
認し、 (ステップ54)においてその主題名詞句“ウ
ィンドウ数”と文の解析結果を動作主補完部10へ供給
する。動作主補完部10では、供給された“°ウィンド
ウ数”を文(2)の解析結果の動作主スロットに補完す
る。
制御部2では、つぎに例文■の構文である文(3)の省
略動作主の同定を行う。第2図のフローの(処理■)で
は文(3)の態が受動であることを確認し、(処理■)
へ進む、ここでは1分野動詞判定部5において、その述
語動詞“セットする”をキーとして分野動詞辞書6(第
4図)を検索し、辞書項目(4)から動作主「読み手」
を得る。つぎに(処理■)において、得られた動作主「
読み手」と文の解析結果とを動作主補完部10へ供給す
る。動作主補完部lOでは、同定された動作主「読み手
」を文1の解析結果の動作主スロットに補完する。出力
部11は各文に同定された動作主が補完された解析結果
を出力する。出力された解析結果を第9図に示す。
例えば日英機械翻訳では3日本語の能動文の省略されて
いる主語を英語でどの代名詞で訳し出すべきかが問題に
なっている。本発明においては省略されている能動文の
主語が「筆者J、[読み手1.「記述の対象物」のいず
れであるかを同定するので、工学マニュアルのような、
°“she”や“he″と訳すべき2人を表す3人称名
詞句がほとんどない文書の翻訳では「筆者」、「読み手
J「記述の対象物」と同定された名詞句をそれぞれ“ビ
、Vou”+”+t” と訳し出すことができる。
また、(1)連続する省略主語は同しものをさすと解釈
されやすい(文献[3]神尾昭雄「談話における視点」
日本語学、 4(12)、10−21.1981) 。
(2)受動文は主張が弱く、明確さに欠けるため。
能動文に書き換えるほうが良い(文献[4]テクニカル
コミユニケーシヨン研究会「ユーザマニュアルのための
文章・用字用語スタイルブック)と言われており2文推
敲の立場からは、(1)(2)より、受動文の動作主(
能動化されれば主語の位置にくる)が前文の能動文の主
語と同しなら能動文に書き換える方が良いと言える。本
発明の省略補完処理装置を組み込んだ文章推敲支援シス
テムにおいては、省略されている能動文の主語、受動文
の動作主を同定できるので5人力された文書中の各受動
文を能動化すべきがどうが判定することができる。例え
ば1本発明の省略補完処理装置を組み込んだ文章推敲支
援システムで例3の文書を処理すると、省略動作主が同
定された結果(第9図)に基づいて1文(2)の受動文
の動作主「読み手」が前文の主語(動作主)「読み手」
と一致することから、第1O図に示す如く、システムは
文(2)を能動化した方がよいとのメソセージを提示す
ることができる。
〔発明の効果〕
以上説明した如く9本発明によれば1文中で省略されて
いる動作主を同定することができ、Il械翻訳などを対
象とした支援装置に組み込んで翻訳を明解にするなどの
利点を有する。
【図面の簡単な説明】
第1図は本発明の省略補完処理装置の一実施例を示す構
成図1第2図は制御部の動作の概略フロー図1第3図は
特定表現辞書(A)(B)のエントリー例、第4図はソ
フトウェア分野の分野動詞辞書のエントリー例、第5図
は主題名詞句判定部の動作概略フロー図、第6図は接続
表現判定部の動作概略フロー図、第7図は接続表現辞書
のエントリー例、第8図は「例3」の各単文に対する構
文意味解析結果を示す図、第9図は第8図の省略動作主
の値が補完された構文解析結果を示す図、第10図は本
発明を組み込んだ日本語文書推敲支援装置の推敲支援イ
メージを示す図である。 1・・・入力部、2・・・制御部、3・・・特定表現判
定部。 4・・・特定表現辞書、5・・・分野動詞判定部、6・
・・分野動詞辞書、7・・・主題名詞句判定部、8・・
・接続表現判定部、9・・・接続表現辞書310・・・
動作主補完部、11・・・出力部。 特許出願人 日本電信電話株式会社

Claims (1)

  1. 【特許請求の範囲】 入力された日本語文書を処理する日本語文書処理装置に
    おいて、 特定表現を予め格納する特定表現辞書を用いて、その省
    略動作主を同定できるか判定する特定表現判定部と、 対象文書の専門分野に限れば一定の動作主をとることが
    わかっている動詞を予め格納する分野動詞辞書を用いて
    、省略動作主を同定できるか判定する分野動詞判定部と
    、 主題の名詞句によって同定できるか判定する主題名詞句
    判定部と、 従文の主語あるいは主題で主文の主語を同定する接続表
    現を予め格納した接続表現辞書を用いて、省略動作主を
    同定できるか判定する接続表現判定同定された動作主を
    補完する動作主補完部とをそなえ、 文中の省略されている動作主を補完するようにした ことを特徴とする省略補完処理装置。
JP2114109A 1990-04-27 1990-04-27 省略補完処理装置 Pending JPH0410161A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2114109A JPH0410161A (ja) 1990-04-27 1990-04-27 省略補完処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2114109A JPH0410161A (ja) 1990-04-27 1990-04-27 省略補完処理装置

Publications (1)

Publication Number Publication Date
JPH0410161A true JPH0410161A (ja) 1992-01-14

Family

ID=14629353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2114109A Pending JPH0410161A (ja) 1990-04-27 1990-04-27 省略補完処理装置

Country Status (1)

Country Link
JP (1) JPH0410161A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301719A (ja) * 1993-04-16 1994-10-28 Nec Corp 文書解析方法および装置
US8755543B2 (en) 2010-03-23 2014-06-17 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
JP2021117578A (ja) * 2020-01-23 2021-08-10 株式会社リコー 情報処理システム、情報補完方法、プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301719A (ja) * 1993-04-16 1994-10-28 Nec Corp 文書解析方法および装置
US8755543B2 (en) 2010-03-23 2014-06-17 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
JP2021117578A (ja) * 2020-01-23 2021-08-10 株式会社リコー 情報処理システム、情報補完方法、プログラム

Similar Documents

Publication Publication Date Title
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US5020021A (en) System for automatic language translation using several dictionary storage areas and a noun table
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
JP3220560B2 (ja) 機械翻訳装置
US6910004B2 (en) Method and computer system for part-of-speech tagging of incomplete sentences
EP1111514B1 (en) Phrase translation method and system
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPH09198395A (ja) 文書検索装置
JPH0410161A (ja) 省略補完処理装置
JPH1185766A (ja) キーワード抽出方法及び装置及びキーワード抽出プログラムを格納した記憶媒体
JP3300142B2 (ja) 自然言語処理装置
JPS61260366A (ja) 学習機能付機械翻訳システム
JP3580760B2 (ja) 自動編集装置及び方法並びにこれに利用される記憶媒体
JP2966473B2 (ja) 文書作成装置
JP2570681B2 (ja) ワード・プロセッサ
JPH01126767A (ja) 辞書参照装置
JP2546486B2 (ja) 文書解析方法および装置
JP3244286B2 (ja) 翻訳処理装置
JPH07200592A (ja) 文章処理装置
JPH04257064A (ja) 要約情報抽出装置
JPH0462665A (ja) データ検索装置
JPH05233686A (ja) 日本語処理装置
JPH02110771A (ja) 電訳機
JPH04295963A (ja) 自然言語解析方式
JPH0877170A (ja) 機械翻訳装置