JPH0793332A - 辞書作成支援装置 - Google Patents

辞書作成支援装置

Info

Publication number
JPH0793332A
JPH0793332A JP5233819A JP23381993A JPH0793332A JP H0793332 A JPH0793332 A JP H0793332A JP 5233819 A JP5233819 A JP 5233819A JP 23381993 A JP23381993 A JP 23381993A JP H0793332 A JPH0793332 A JP H0793332A
Authority
JP
Japan
Prior art keywords
dictionary
idiomatic
expression
distribution chart
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5233819A
Other languages
English (en)
Inventor
Shinichiro Kamei
眞一郎 亀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5233819A priority Critical patent/JPH0793332A/ja
Publication of JPH0793332A publication Critical patent/JPH0793332A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 自然言語の機械処理用辞書を計算機上に作成
する際に、日本語に存在する慣用表現の種類とその関係
を図示した慣用表現分布図を辞書作成作業者に提示し、
慣用表現の辞書作成の効率、品質を向上させる。 【構成】 1はキーボードのような文字入力手段、2は
入力された情報を辞書に格納したり、入力された情報や
辞書内の情報など画面表示手段に送ったりする制御を行
なう辞書情報制御手段、3はディスプレイ装置のような
情報の画面表示手段、4は辞書、5は慣用表現分布図が
格納された慣用表現分布図格納部である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は自然言語処理分野、特に
機械翻訳などに用いられる辞書の作成を支援する装置に
関するものである。
【0002】
【従来の技術】自然言語処理装置、例えば機械翻訳シス
テム等においては、個々の単語あるいは句(複数の単語
からから構成される表現)の各々に対して、その文法的
・意味的性質を辞書情報として一つ一つ記述する必要が
ある。
【0003】従来からある辞書作成装置では、登録した
い単語の綴りを入力し、その綴りを見出しとする辞書内
容を作成する、という基本機能が提供されていた。従来
の辞書作成支援装置は個々の単語を単位とするの辞書の
作成が効率的に行なえるように作られている。
【0004】
【発明が解決しようとする課題】しかしながら現実の文
書を処理するためには、単語単位の辞書だけでなく、特
定の単語同士の決まった組合せ全体が特別な意味を表す
句(慣用表現)の辞書情報を充実させる必要がある。
【0005】従来から日本語の慣用表現には様々な種類
の存在が指摘されている。例えば「あぐらをかく」とい
う句は慣用的と感じられる読みを二つ持っている。一つ
は「足を組んで座ること」という意味、もう一つは「い
い気な態度でいる様子」という意味である。ここでこの
二つの読みを比較してみると、この二つで「慣用的」と
感じる点が異なっていることがわかる。
【0006】前者の「足を組んで座る」という意味の場
合、名詞部分「あぐら」には本来の意味からの変化はな
いが、そのように座ることを表す動詞部分に「かく」と
いう語を使う点が特殊であり、なおかつ動詞「かく」が
このような意味に用いられるのはこの表現の場合だけに
限られるという点が慣用的なところである。
【0007】他方、後者の「いい気な態度でいる様子」
という用法の場合には、この句の個々の構成要素である
名詞「あぐら」にも動詞「かく」にも元来の意味は残っ
ておらず、この句全体として比喩的な新たな意味で用い
られている点が慣用的なところである。
【0008】ここで述べたのは慣用表現のごく一部の側
面であり、慣用的と感じられる要因には他にも様々な種
類がある。このような表現の機械処理用辞書を作成する
際には、その「慣用」の種類によって、そこに記述する
情報や辞書構成を変える必要がある。また、上記の「あ
ぐらをかく」の例のように同じ表現が複数の慣用的な意
味で用いられる時には、それらの登録もれを低減させる
手立てを講じて辞書品質を向上させる必要がある。
【0009】慣用表現が意味的なものである以上、最終
的な判断は人間が行なわなければならないのでそれを支
援する必要があるが、従来の辞書作成支援装置にはその
ような機能は備わっていなかった。本発明の目的は、上
記のような慣用表現の辞書作成を効率化させ辞書品質を
向上させるための支援機能を提供するところにある。
【0010】
【課題を解決するための手段】本発明は、自然言語の機
械処理用辞書を計算機上に作成する時に用いる辞書作成
支援装置において、日本語に存在する慣用表現の種類と
その関係を図示した慣用表現分布図を格納する手段と、
前記慣用表現分布図を画面表示する手段を有することを
特徴としている。
【0011】
【作用】本発明によれば、辞書作成作業者が慣用表現の
辞書内容を作成しようとするとき、日本語の慣用表現の
分布図が画面に提示される。辞書作成者はまず作成しよ
うとしている慣用表現がこの分布図のどこに相当するか
を判断する。
【0012】分布図には慣用表現の全体像が示されてい
るので、例えば「あぐらをかく」などのように複数の慣
用的な読みをもつ表現に対しても、この分布図を用いる
ことでそれら複数の読みの登録もれを低減することがで
きる。
【0013】
【実施例】次に本発明について図面を参照して説明す
る。図1は本発明の一実施例を示すブロック図である。
図1において、1はキーボードのような文字入力手段、
2は入力された情報を辞書に格納したり、入力された情
報や辞書内の情報など画面表示手段に送ったりする制御
を行なう辞書情報制御手段、3はディスプレイ装置のよ
うな情報の画面表示手段、4は辞書、5は慣用表現分布
図が格納された慣用表現分布図格納部である。図1内の
1、2、3で構成されるのが従来型の辞書作成支援装置
(辞書エディタ)である。本発明の特徴は図1の慣用表
現分布図格納部5に格納されている慣用表現の分布図が
画面表示手段3に表示されるところにある。
【0014】以下では本装置の特徴を説明するため、ま
ず例を用いて慣用表現について詳しく説明する。慣用表
現には、表現全体が名詞句のように振舞うもの、動詞句
のように振舞うもの、形容詞句のように振舞うものなど
種々の種類があり、本発明はそのような慣用表現のどの
ようなものに対しても適用できるが、ここでは動詞句に
相当する慣用表現を例にとって説明する。
【0015】図2は、慣用表現分布図格納部5に格納さ
れている、慣用表現の種類を示す分布図の一例で、表現
全体が動詞句として振舞う表現の分布図である。
【0016】この分布図は慣用句の成立要件として次の
3つの要因を考えて作成してある。それぞれの要因を意
味空間の3つの座標軸になぞらえて、慣用句の種類を便
宜的に(010)類、(020)類、等と名付けてあ
る。図中、(000)類は一般句であり、それ以外が種
々の慣用句の類を表している。
【0017】3つの要因(3つの軸)とは以下の通りで
ある。
【0018】体言部(x軸):体言の意味が基本義か
(x=0)、派生義か(x=1)に関する軸。
【0019】用言部(y軸):用言の格スロットが広い
語義を受け付けるか(y=0)、特定の語類のみを許す
か(y=1)、単一の語だけと結合するか(y=2)と
いう、体言と用言の結合に関する軸。
【0020】表現全体(z軸):表現全体が新たな意味
を生じることに関する軸。
【0021】この分布図の各類には次のような特徴があ
る。
【0022】(000)類 [通常句]:体言と用言の
通常の組合せからなるもので慣用表現ではない。例にあ
る「足を洗う」は文字通りの意味である。
【0023】(010)類 [制約不整合]:用言の語
義制約と整合しない体言の組み合わせが固定化したもの
である。例えば「声がはずむ」では「はずむ」の制約
「物理的具体物」と整合しない「声」が結合している。
【0024】(020)類 [特定類]:特定の体言の
一群と結合することで用言の意味が一つに定まる点に特
徴をもつ。
【0025】動詞「かかる」は多数の意味を持つが、
「医者」の類(内科/外科 etc.)と組合わさるこ
とで意味が一意に定まる(特定類(a))。同類とし
て、ある種の動作性体言と結び付く特定の動詞が助動詞
的な役割をする一群がある(特定類(b))。例えば
「攻撃を受ける」の「受ける」は受身の助動詞と同様に
働き、全体で「攻撃される」とほぼ同義となる。このよ
うに元の実質的な意味が薄らいだ動詞は 機能動詞と呼
ばれる。
【0026】(030)類 [単一語]:体言がほぼ
唯一に固定されている一群である。「あぐらをかく」の
「かく」がこの意に用られるのはこの表現に限られる
(単一語(a))。同様な表現であるが、「功を奏す
る」の場合には体言「功」が、また「口をつぐむ」の場
合には用言「つぐむ」が、この表現でだけ使われる語で
ある点が特殊である(単一語(b)、(c))。
【0027】(100)類,(110)類,(120)
類,(130)類 [換喩]:「頭を使う」という句を
「考える」の意で用いるとき、体言「頭」は換喩的意味
である「頭の機能」を表している点で、通常句と区別さ
れる。
【0028】z類 [比喩的慣用句]:構成要素の元
の意味はほとんど残っておらず、全体が新しい意味をも
つ典型的な慣用句である。中には「しのぎを削る」のよ
うに元々存在した文字通りの読みが失われ、慣用句とし
てのみ機能するようになった例もある。
【0029】「首をひねる」という句はその動作がその
象徴的動作として用いられるところから「不思議がる」
の意となる。このような象徴的動作に起因した表現も比
喩的慣用句の一つである。
【0030】また「ような」、「ほど」といった語を伴
う例えを示す表現(直喩)の中で慣用的に用いられる表
現も「後ろ髪をひかれる(ような名残惜しい思い)」、
「手にとる(ようによくわかる)」など多数ある。直喩
と慣用句とは以下のような「直喩→暗喩→比喩的慣用
句」という過程をたどって関係するものと考えられる。
【0031】 段階 表現 直喩マーカ 様態 事柄 1.例え しのぎを削る ような 激しい 戦い 2.直喩 しのぎを削る ような 戦い 3.暗喩 しのぎを削る 戦い 4.独立 しのぎを削る 個々の表現により上記のどのレベルにまで独立度が進ん
でいるかに差があるが、これらの表現も比喩的慣用句の
中に含まれる。
【0032】本発明ではこのような慣用表現分布図が画
面表示され、辞書作成作業者に提示されることで辞書作
成作業者の注意が喚起される。
【0033】
【発明の効果】慣用句が意味的なまとまりである以上、
その収集に際しては最終的には人間の判断が必要であ
る。従って句の収集の効率化、句の分類の高品質化は大
きな課題である。本発明では図2で示したような慣用表
現分布図が、辞書作成作業者に提示されるので、この分
布図を用いれば「慣用」の種々の要因が視覚的に把握で
き、慣用的と感じられる表現がどのような観点で慣用的
であるのかが判断できる。また、「あぐらをかく」「口
をきく」のように一つの表現が複数の慣用的読みを持つ
場合の収集もれの危険を低減することができる。また
「足を洗う」「首をひねる」などのように通常句と慣用
表現としての用法の両方を持つ場合にも、分布図に示さ
れた分類を参照することで辞書作業者の注意が喚起さ
れ、辞書登録の誤りが低減する。以上のように本発明を
用いると慣用表現の辞書内容の品質が向上する。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図
【図2】図1中の慣用表現分布図格納部5に格納されて
いる慣用表現分布図の例を示す図である。
【符号の説明】
1 文字入力手段 2 辞書情報制御手段 3 画面表示手段 4 辞書 5 慣用表現分布図格納部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 自然言語の機械処理用辞書を計算機上に
    作成するための辞書作成支援装置において、日本語に存
    在する慣用表現の種類とその関係を図示した慣用表現分
    布図を格納する手段と、前記慣用表現分布図を画面表示
    する手段を有することを特徴とする辞書作成支援装置。
JP5233819A 1993-09-20 1993-09-20 辞書作成支援装置 Pending JPH0793332A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5233819A JPH0793332A (ja) 1993-09-20 1993-09-20 辞書作成支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5233819A JPH0793332A (ja) 1993-09-20 1993-09-20 辞書作成支援装置

Publications (1)

Publication Number Publication Date
JPH0793332A true JPH0793332A (ja) 1995-04-07

Family

ID=16961066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5233819A Pending JPH0793332A (ja) 1993-09-20 1993-09-20 辞書作成支援装置

Country Status (1)

Country Link
JP (1) JPH0793332A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03129555A (ja) * 1989-10-16 1991-06-03 Sharp Corp 辞書登録機能付き文字処理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03129555A (ja) * 1989-10-16 1991-06-03 Sharp Corp 辞書登録機能付き文字処理装置

Similar Documents

Publication Publication Date Title
EP0749075A2 (en) Machine translation system
JPH06195373A (ja) 機械翻訳装置
Alkhuli A contrastive transformational grammar
JPH0793332A (ja) 辞書作成支援装置
KR900008402B1 (ko) 기계번역장치
Levinson et al. Introduction: Spatial conceptualization in Mayan languages
Herschensohn et al. Features and interfaces in Romance
JPS621062A (ja) 文書作成支援装置
JP2859882B2 (ja) 機械翻訳装置
JPS6320569A (ja) 機械翻訳装置
JP2737160B2 (ja) 文章処理装置
JPS60200369A (ja) 機械翻訳装置
JPS62242272A (ja) ワ−ドプロセツサの文末表現統一装置
JP3353873B2 (ja) 機械翻訳装置
JPS62203274A (ja) 機械翻訳システム
JPS60112175A (ja) 仮名漢字変換装置における略称語変換方式
JPS6282465A (ja) 機械翻訳装置
Raii Formal Treatment of Definiteness in Arabic
JPS62203272A (ja) 機械翻訳システム
JPH06295310A (ja) 機械翻訳装置
JPH03148764A (ja) 機械翻訳装置
JP2005309533A (ja) 文書編集装置、文書視覚方法法およびそのプログラム
JPS63255767A (ja) 日本語ワ−ドプロセツサ
JPH05151199A (ja) 文書作成装置
JPH01230177A (ja) 翻訳処理システム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19961008