JPH0371260A - 複合語の辞書情報推定装置 - Google Patents

複合語の辞書情報推定装置

Info

Publication number
JPH0371260A
JPH0371260A JP1207358A JP20735889A JPH0371260A JP H0371260 A JPH0371260 A JP H0371260A JP 1207358 A JP1207358 A JP 1207358A JP 20735889 A JP20735889 A JP 20735889A JP H0371260 A JPH0371260 A JP H0371260A
Authority
JP
Japan
Prior art keywords
word
dictionary
dictionary information
information
compound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1207358A
Other languages
English (en)
Other versions
JPH0675264B2 (ja
Inventor
Hiroko Tanabe
田邊 裕子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1207358A priority Critical patent/JPH0675264B2/ja
Publication of JPH0371260A publication Critical patent/JPH0371260A/ja
Publication of JPH0675264B2 publication Critical patent/JPH0675264B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は複合語の辞書情報推定装置に関し、特に機械翻
訳等の自然言語処理において頻出する複合語の辞書情報
を推定する辞書情報推定装置に関する。
〔従来の技術〕
自然言語処理においては、機械処理用辞書への辞書情報
の登録作業は大きなウェイトを占めている。殊に、複合
語の辞書情報の登録は、機械処理用辞書がある程度充実
してからも常に一定量ずつ発生する作業である。
従来、この種の複合語の辞書情報の登録は、他の一般の
語の辞書情報の登録と全く同様に行われていた。すなわ
ち、全体としての品詞に始まって、名詞の場合には固有
名詞であるか普通名詞であるかの別、動詞の場合には意
志をもって行われる動作か否かといった情報から、概念
体系(シソーラス)上の分類番号、そして訳語に至るま
でを登録者が逐一判断し、各複合語毎に辞書情報を入力
して機械処理用辞書に登録していた。
〔発明が解決しようとする課題〕
上述した従来の複合語の辞書情報の登録方法では、各複
合語毎にゼロから辞書情報を構築する必要があったので
、 ■ 辞書情報の登録に多くの時間を要する、■ 例えば
、「ベクトル演算」と「スカラ演算」といった関連語間
での辞書情報の整合性が保証されない という欠点がある。
本発明の目的は、上述の点に鑑み、辞書情報の登録作業
を軽減するとともに、関連する複合語の辞書情報間の整
合性を保つことができるようにした複合語の辞書情報推
定装置を提供することにある。
〔課題を解決するための手段〕
本発明の複合語の辞書情報推定装置は、機械処理用辞書
を参照して複合語を構成要素である形態素に切り分ける
語切り手段と、この語切り手段により切り分けられた形
態素から複合語の意味および役割上の中心となる中心語
を造語規則情報を参照して認定する中心語認定手段と、
この中心語認定手段により認定された中心語の辞書情報
を前記機械処理用辞書から検索し複合語の辞書情報とし
てコピーする辞書情報検索−転送手段とを有する。
〔作用〕 本発明の複合語の辞書情報推定装置では、語切り手段が
機械処理用辞書を参照して複合語を構成要素である形態
素に切り分け、中心語認定手段が語切り手段により切り
分けられた形態素から複合語の意味および役割上の中心
となる中心語を造語規則情報を参照して認定し、辞書情
報検索−転送手段が中心語認定手段により認定された中
心語の辞書情報を機械処理用辞書から検索し複合語の辞
書情報としてコピーする。
〔実施例〕
次に、本発明について図面を参照して詳細に説明する。
第1図は、本発明の一実施例に係る複合語の辞書情報推
定装置が配設された辞書情報登録装置の構成を示すブロ
ック図である。この辞書情報登録装置は、登録したい複
合語を入力する人力装置11と、入力された複合語を機
械処理用辞書17に登録されている単位(形態素)に切
り分ける語切り手段1−2と、複合語の構成要素である
形態素から複合語の意味および役割上の中心となる中心
語を認定する中心語認定部1−3と、中心語認定部1−
3による中心語の認定の際に利用される日本語の造語規
則情報を格納した造語規則情報テーブル1−4と、中心
語認定部1−3により認定された中心語の辞書情報を機
械処理用辞書1−7から検索して人出カバッファ1−8
にコピーする辞書情報検索−転送手段1−5と、入出力
バッファ1−8にコピーされた辞書情報の追加、修正お
よび削除を行う辞書編集部1−6と、辞書情報を格納す
る機械処理用辞書1−7と、上記各手段で用いられる中
間情報を格納しておく入出力バッファ1−8と、辞書情
報の追加、修正および削除のための情報を入力する編集
入力装置1−9 (入力装置1−2と同じものであって
もよい)とから構成されている。
中心語認定部1−3と造語規則情報テーブル1−4とか
ら、中心語認定手段が構成されている。
辞書編集部1−6と編集入力装置1−9とから、辞書編
集手段が構成されている。
造語規則情報テーブル1−6における造語規則情報は、
第2図に示すように、指定された形態素の指定された辞
書情報に関する条件部と、その条件に合致した場合の動
作を記述した判定部とからなる。すなわち、造語規則情
報とは、ある辞書情報をもった語が他の語と結びついて
複合語を形成するときにその複合語は一般にどういう辞
書情報をもつことになるかを記述するものである0例え
ば、「X十名詞J  (Xは形態素であって、その辞書
情報の有無およびその内容の如何は問わない)という形
の複合語では、全体としての品詞は名詞でありXの語は
十の右側の名詞を修飾している、すなわちその複合語の
中心的な語は十の右側の名詞であることが多い、といっ
たような規則情報である。
次に、このように構成された本実施例の複合語の辞書情
報推定装置の動作について説明する。
登録者が辞書情報を登録したい複合語を入力装置1−1
を用いて入力すると、入力された複合語は、語切り手段
1−2を介して人出力バッファ1−8に格納される。
語切り手段1−2は、入出力バッファ1−8に格納され
た複合語の文字列を機械処理用辞書17を参照して登録
されている単位(形態素)に基づいて切り分ける。
次に、中心語認定部1−3は、造語規則情報テーブル1
−4の造語規則情報を参照して、語切り手段1−2によ
る語切りの結果得られた形態素の列に対してどの形態素
が複合語の意味および役割上の中心となる形態素(中心
語)であるかを認定する。
中心語認定部1−3により中心語が認定されたならば、
辞書情報検索−転送手段1−5は、認定された中心語の
辞書情報を機械処理用辞書1−7から抽出し、人力され
た複合語の推定辞書情報として入出力バッファ1−8に
転送(コピー)する。
入出力バッファ1−8に転送された推定辞書情報は中心
語に関する辞書情報であり、複合語の辞書情報としては
一般的に不完全であるので、登録者は、編集入力装置1
−9を用いて辞書編集部1−6により入出力バッファ1
−8上の推定辞書情報に対して追加、修正および削除を
行い、追加。
修正および削除が行われた後に入出カバソファ1−8上
の辞書情報を機械処理用辞書1−7に登録する。
次に、本実施例の複合語の辞書情報推定装置の動作につ
いて、第3図を参照しながらより具体的に説明する。
入力装置1−1から人力された複合語の文字列abed
erは、語切り手段1−2によって機械処理用辞書1−
7にある単位abおよびefに従って語切りが行われ、
a b / c d / e fという形態素の列とし
て中心語認定部1−3に渡される。
ここでは、cd、cde、f、c、defおよびcde
fという文字列の辞書情報は機械処理用辞書1−7に登
録されていないものとした。なお、この場合、cdは対
応する辞書情報が機械処理用辞書1−7に登録されてい
ないが、語切りにおいては1つの形態素として認定され
る。
次に、中心語認定部1−3により造語規則情報テーブル
1−4の造語規則情報が参照され、efが中心語として
認定されたとする。
すると、辞書情報検索−転送手段1−5は、efの辞書
情報を機械処理用辞書1−7から抽出し、abcdef
の推定辞書情報として入出力バッファ1−8に転送する
したがって、登録者は、実際のabcdefに与えられ
るべき辞書情報と入出力バッファ1−8に格納された推
定辞書情報とのずれの部分を編集入力装置1−9を通じ
て辞書編集部1−6により追加、修正および削除し、そ
の結果をabcdefの辞書情報として機械処理用辞書
1−7に登録させる。
〔発明の効果〕 以上説明したように本発明は、複合語の辞書情報の登録
の際に語切りを行って複合語の中心となる中心語の辞書
情報を機械処理用辞書から抽出して複合語の辞書情報と
してあらかじめ推定しておくことにより、 ■ 辞書情報の登録作業が軽減される、■ 関連する複
合語の辞書情報の推定についても、例えば「ベクトル演
算」と「スカラ演算」とならば、ともに「演算」の辞書
情報が推定され、この辞書情報を出発点として「ベクト
ル演算」および「スカラ演算」の辞書情報を作成するこ
とができるので、辞書情報間の整合性を保つことができ
る という効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例に係る複合語の辞書情報推定
装置が配設された辞書情報登録装置の構成を示すブロッ
ク図、 第2図は第1図中の造語規則情報テーブルの造語規則情
報を例示する図、 第3図は本実施例の複合語の辞書情報推定装置における
データの流れを例示する図である。 図において、 1−1・・・入力装置、 1−2・・・語切り手段、 1−3  ・ 1−4 ・ 1−5 ・ 1−6 ・ 1−7 ・ 1−8 ・ 1−9 ・ ・中心語認定部、 ・造語規則情報テーブル、 ・辞書情報検索−転送手段、 ・辞書編集部、 ・機械処理用辞書、 ・入出力バッファ、 ・編集入力装置である。

Claims (1)

  1. 【特許請求の範囲】 機械処理用辞書を参照して複合語を構成要素である形態
    素に切り分ける語切り手段と、 この語切り手段により切り分けられた形態素から複合語
    の意味および役割上の中心となる中心語を造語規則情報
    を参照して認定する中心語認定手段と、 この中心語認定手段により認定された中心語の辞書情報
    を前記機械処理用辞書から検索し複合語の辞書情報とし
    てコピーする辞書情報検索−転送手段と を有することを特徴とする複合語の辞書情報推定装置。
JP1207358A 1989-08-10 1989-08-10 複合語の辞書情報推定装置 Expired - Lifetime JPH0675264B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1207358A JPH0675264B2 (ja) 1989-08-10 1989-08-10 複合語の辞書情報推定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1207358A JPH0675264B2 (ja) 1989-08-10 1989-08-10 複合語の辞書情報推定装置

Publications (2)

Publication Number Publication Date
JPH0371260A true JPH0371260A (ja) 1991-03-27
JPH0675264B2 JPH0675264B2 (ja) 1994-09-21

Family

ID=16538409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1207358A Expired - Lifetime JPH0675264B2 (ja) 1989-08-10 1989-08-10 複合語の辞書情報推定装置

Country Status (1)

Country Link
JP (1) JPH0675264B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03105464A (ja) * 1989-09-20 1991-05-02 Fujitsu Ltd 翻訳装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021051613A (ja) * 2019-09-25 2021-04-01 株式会社日立製作所 自然言語処理において使用される辞書を作成する方法およびシステム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6368972A (ja) * 1986-09-10 1988-03-28 Hitachi Ltd 未登録語処理方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6368972A (ja) * 1986-09-10 1988-03-28 Hitachi Ltd 未登録語処理方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03105464A (ja) * 1989-09-20 1991-05-02 Fujitsu Ltd 翻訳装置

Also Published As

Publication number Publication date
JPH0675264B2 (ja) 1994-09-21

Similar Documents

Publication Publication Date Title
JP3114703B2 (ja) 対訳文検索装置
JPH1153384A (ja) キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JP3594701B2 (ja) キーセンテンス抽出装置
JPH0371260A (ja) 複合語の辞書情報推定装置
JP2003303194A (ja) 慣用句辞書作成装置、検索用インデックス作成装置、文書検索装置、それらの方法、プログラム及び記録媒体
JPH05224687A (ja) 日本文読み上げ単語変換編集処理方式
JPH0877196A (ja) 文書情報抽出装置
JPH10149370A (ja) 文脈情報を用いた文書検索方法および装置
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPS61248160A (ja) 文書情報登録方式
JP4283038B2 (ja) 文書登録装置、文書検索装置、プログラム及び記憶媒体
JPH04330565A (ja) 自然言語処理システム
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH06295308A (ja) 自然言語解析方法および装置
JPH0668134A (ja) 翻訳用例ベース利用翻訳方式
JPH05233689A (ja) 文書自動要約方法
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPS6368972A (ja) 未登録語処理方式
JP2742059B2 (ja) 翻訳用辞書編集装置
JPH04211868A (ja) Cd―romデータの検索用キーワードの作成方法
JP2560224B2 (ja) 文脈構造解析装置
JPH08287083A (ja) 辞書未登録語展開方法及び装置
JP5032453B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JPH05181900A (ja) 固有名詞処理装置
JPH07219952A (ja) 日本語文章処理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090921

Year of fee payment: 15

EXPY Cancellation because of completion of term