JP2692362B2 - 辞書作成支援装置 - Google Patents

辞書作成支援装置

Info

Publication number
JP2692362B2
JP2692362B2 JP2239497A JP23949790A JP2692362B2 JP 2692362 B2 JP2692362 B2 JP 2692362B2 JP 2239497 A JP2239497 A JP 2239497A JP 23949790 A JP23949790 A JP 23949790A JP 2692362 B2 JP2692362 B2 JP 2692362B2
Authority
JP
Japan
Prior art keywords
word
inflectional
dictionary
active
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2239497A
Other languages
English (en)
Other versions
JPH04119468A (ja
Inventor
眞一郎 亀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2239497A priority Critical patent/JP2692362B2/ja
Publication of JPH04119468A publication Critical patent/JPH04119468A/ja
Application granted granted Critical
Publication of JP2692362B2 publication Critical patent/JP2692362B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は計算機によって人間の言葉を処理する自然言
語処理装置に関するものであり、特に計算機上に機械処
理用の辞書を作成する際に用いる辞書作成支援装置に関
するものである。
〔従来の技術〕
ある単語の辞書を作成するとき、必ず入力しなければ
ならない項目として、その語の表記,品詞,活用の型が
ある。
従来の辞書作成支援装置では、単に辞書作成者が入力
した表記,品詞,活用の型に関する情報をそのまま辞書
に入力するだけであった。
例えば「要る」という語を辞書に入力しようとすると
きには、「要る」という表記,「動詞」という品詞,
「五段活用」という活用の型を入力する必要があるが、
これらの情報を単に辞書に入力するだけであり、これら
の情報を組み合わせて何かをする、ということはなかっ
た。
〔発明が解決しようとする課題〕
上述した従来の辞書作成装置では、その単語の品詞や
活用の型を誤まって入力しても、その誤まりがそのまま
辞書に記述されてしまい、辞書の質を保障できない、と
いう欠点がある。
例えば、「いる」という語は「要る」という語の場合
と「居る」という語の場合と両方の可能性があるが、
「要る」の意味のときには五段活用,「居る」の意味の
ときには一段活用である。つまり、「要る」の意味のと
きは否定形は「いらない」であり、「居る」の意味のと
きは「いない」である。このような語の場合、辞書入力
者は活用の型の情報を誤まって入力してしまうおそれが
あるが、従来の技術ではそれを防止することができなか
った。
この種の誤りは他にもたくさんおこりうる。例えば、
「活発だ」という語は通常形容動詞という品詞に分類さ
れている。この語は「活発だ」というふうに最後に
「だ」まで含めて一語として感じられる。しかし、通常
このような語はすべての国語辞典,和英辞典の見出しと
しては最後の「だ」をとった「活発」を単位として登録
されている。
機械処理用の辞書にも「活発」を単位として見出しと
する規則になっている場合が多いが、辞書入力者は誤ま
って見出しとして「活発だ」を入力してしまうかもしれ
ない。このとき、この語は「活発だ」という部分にさら
に「だ」がついた形の「活発だだ」を終止形とする語、
ということになってしまうが、従来の技術ではこのよう
な誤まりを入力時に防ぐことができなかった。
計算機によって自然言語を処理する場合、計算機は処
理しようとする単語の辞書をその表記を手がかりにして
検索する。つまり、単語の表記すなわち辞書の見出し
は、この理由で処理過程の第一段階で重要な役割を果た
す。従来の技術では辞書の見出しの質を保証できず、自
然言語処理全体の質の向上をうながすことができなかっ
た。
「課題を解決するための手段〕 本発明の装置は、日本語,英語などの自然言語の辞書
を計算機上に作成するときに用いる辞書作成支援装置に
おいて、 単語の基本形の綴りと、品詞、活用の型とを条件と
し、基本形の綴りの文字の何文字かを削除し、何文字か
を付加することで当該単語の各活用形を導出する形式で
単語の活用形の綴りについての知識を格納した活用形知
識ベースと、その活用形知識ベースを検索することで、
辞書作成者の入力した語の表記と品詞と活用の型とか
ら、その語の各活用形を作成する活用形展開部と、 作成した活用形を表示する活用形表示部とを有してい
る。
〔実施例〕 次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例を示すブロック図である。
第1図において、1はキーボードのような文字入力装
置、2は単語の活用の型と具体的な活用形についての知
識を格納した活用形知識ベース、3は活用形展開部で、
文字入力装置1から入力された単語の表記,品詞,活用
の型についての情報をもとにして活用形知識ベース2を
検索し、入力された単語の各活用形を作成し、その活用
形の文字列をディスプレイのような表示装置である活用
形表示装置4に出力する。
次に例を用いて本装置の動作を詳しく説明する。
本発明は、日本語,英語などどのような言語について
も適用できるがここでは日本語を例にとって説明する。
第2図は活用形知識ベース2に格納されている活用の
型と具体的な活用形に関する知識の一例を示す図であ
る。
第2図において、「品詞」とは動詞,形容詞,形容動
詞,といった単語の品詞分類をあらわす。「活用の型」
とは、動詞の場合の五段活用,一段活用,サ行変格活
用,カ行変格活用のような活用のタイプをあらわす。
「語尾」とは、その単語の表記の語尾に対する条件をあ
らわす。以上の3つ、すなわち、「品詞」「活用の型」
「語尾」がこの活用形知識ベース2を検索するための条
件部である。
第2図には、説明に使う例として、動詞五段活用で語
尾が「る」で終わる場合,動詞一段活用で語尾が「る」
で終わる場合,形容動詞で「だ」「な」「に」という活
用語尾をもちうる場合の三つの場合の知識の例を記して
ある。
第2図において、「各活用形の合成規則」の部分は、
入力された単語の「品詞」「活用の型」「語尾」が条件
に合致した場合に、その単語の各活用形を合成するため
の規則を記した部分である。例えば、「取る」という語
は動詞の五段活用で語尾が「る」であるが、この語の場
合、語尾から文字「る」を削除し、そのかわりに「ら」
「り」「る」「る」「れ」「れ」「っ」を付加した活用
形をもつということが、この「各活用形の合成規則」の
部分からわかる。つまり「取ら」「取り」「取る」「取
る」「取れ」「取れ」「取っ」が単語「取る」の各活用
形の具体的な表示である。
第2図の「各活用形の合成規則」の部分の「一緒に表
示する文字」の部分には、合成した各活用形を入力者に
対して表示する際に、各活用形の具体的な表記と一緒に
表示するべき文字列が記してある。単語「取る」の場
合、「取ら」という活用形に対しては「ない」を一緒に
表示する。
すなわち、入力者に表示する文字列は全体として「取
らない」である。結果として、「取る」の場合、「取ら
ない」「取ります」「取る。」「取るとき」「取れば」
「取れ!」「取った」を表示せよ、という指示が書かれ
ていることになる。
同様に「見る」という語は動詞の一段活用で語尾が
「る」であるので、第2図によってこの「見る」という
語に対しては「見ない」「見ます」「見る。」「見ると
き」「見れば」「見ろ!」「見よ!」という活用を表示
することになる。また、同様に「活発」という語は形容
動詞であり、「だ」「な」「に」という活用形をとるの
で、第2図によってこの「活発」という語に対しては
「活発だろう」「活発になる」「活発だ。」「活発なと
き」「活発ならば」「活発で、」「活発だった」という
活用を表示することになる。なお図中−線は該当する文
字がないことを示している。
このように、活用形知識ベース2には単語の品詞,活
用の型,表記に対する条件が書かれており、それぞれの
条件に合致した単語がどのような活用形をもつか、また
それぞれの活用形と一緒にどのような文字列を表示した
らよいかが記されている。
第3図は第1図中の活用形展開部3の動作を示したフ
ローチャートである。次にこのフローチャートに沿って
具体的に本発明の動作を説明する。
例えば、入力者が「いる」という単語を辞書に登録す
る場合を考える。単語の「いる」という表記と、「動
詞」という品詞と、「五段活用」という活用の型とが文
字入力装置1を通じて入力され、活用形展開部3に伝達
される。活用形展開部3は受けとったその表記,品詞,
活用の型を入力条件として活用形知識ベース2を検索す
る。
単語「いる」は動詞の五段活用で語尾が「る」である
から、第2図に示した活用形知識ベース2の内容から、
この単語は「いら」「いり」「いる」「いる」「いれ」
「いれ」「いっ」と活用することがわかる。
そこで、活用形展開部3は活用形知識ベース2の書か
れている活用形合成規則に従って各活用形の表記を合成
する。そして合成した各活用形の表記とともに、その活
用形に対して一緒に表示すべき文字を合わせて活用形表
示装置4に送る。「いら」の場合でいえば、文字列「な
い」と組み合わせた「いらない」という文字列が活用形
表示装置4に送られ、その文字列全体が入力者に提示さ
れる。
入力者は現在自分か入力している「いる」という単語
が「いらない」「いります」「いる。」というように活
用する語であることを表示によって確認することができ
る。
ここで、もし入力者が誤りをおかしていて、現在入力
しようとしている「いる」は「要る」を意味ではなくて
「居る」の意味の語であったとすると、入力者は本発明
の辞書作成支援装置にされた「いらない」「いります」
といった活用を見て自分の誤りに気がつく。
「居る」の意味では「いる」は「いない」「います」
「いる。」というように活用するからである。これは一
段活用であるから「活用の型」を入力し直す。すると、
今度は活用形知識ベース2に記された動詞の一段活用の
条件に合致するから、その場合の合成規則に従って活用
形展開部3が各活用形を合成し、活用形表示装置4に動
詞の一段活用の場合の各活用形が表示される。
この場合は、「いない」「います」「いる。」といっ
た表示がなされるので、辞書入力者は自分の修正が正し
く反映されたことを確認できる。
また、同様に形容動詞の辞書入力の単位を誤まってし
まったときにも入力者は自分の誤まりに気づくことがで
きる。形容動詞は通常の国語辞典,和英辞典などの見出
しとしては最後の「だ」を除いた部分を単位として登録
されている。機械処理用の辞書の場合にも、システムに
より登録単位が異なることがあるかもしれないが、通常
は最後の「だ」を除いた部分を見だしとする。
例えば、「活発だ」という語の場合「活発な」「活発
に」と変化するが、辞書への登録の際には「活発」を見
出しとする。ところが辞書入力者が誤まって「活発だ」
を見出しとして入力してしまうこともありうる。そのよ
うなときには、単語の表記として「活発だ」、品詞とし
て「形容動詞」,活用の型として「だ,な,に活用」が
入力される。
このような情報を受けとった活用展開部3は、活用形
知識ベース2の合成規則に従って活用形を合成し、活用
形表示装置4に送る。結果として入力者に対して表示さ
れるのは「活発だ」にさらに「だろ」「に」「だ」等が
ついた文字列である。つまり、「活発だだろう」「活発
だになる」「活発だだ。」といった文字列が入力者に提
示される。入力者はこの表示により自分の入力の誤りに
気づき、見出し語の登録単位を「活発だ」ではなく「活
発」に修正することができる。
〔発明の効果〕
以上説明したように本発明では、単語の辞書を作成す
る際に単語の表記と品詞と活用の型とから、その語の各
活用形の具体的な形を策り出して表示するので、辞書入
力者が表示,品詞,活用の型の指定を自ら、確認するこ
とができ、誤まりがあったときにそれを発見し、修正す
ることができる。
具体的には、「要る」という意味の「いる」という語
の活用の型を「居る」という意味の語とまちがえて「一
段活用」と入力してしまうことや、「活発だ」のような
形容動詞の入力単位を「活発」ではなく「活発だ」とし
てしまう、といった誤まりをなくすことができる。
このように、辞書入力者に対して各活用形の具体的な
形を表示して入力に対する注意を促すことで、辞書の質
を見だしの点で高めることができる。ひいては機械によ
る自然言語処理全体の質を向上させることげできる、と
いう効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図の中に記した活用形知識ベース2に格納されてい
る単語の各活用形に関する知識の例を示す図、第3図は
第1図の中に記した活用形展開部3の動作を示すフロー
チャートである。 1…文字入力装置、2…活用形知識ベース、3…活用形
展開部、4…活用形表示装置。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】日本語、英語などの自然言語の辞書を計算
    機上に作成するときに用いる辞書作成支援装置におい
    て、単語の基本形の綴りと、品詞と、活用の型とを条件
    とし、基本の綴りの文字の何文字かを削除し、何文字か
    を付加することで当該単語の各活用形を導出する形式で
    単語の活用形の綴りについての知識を格納した活用形知
    識ベースと、その活用形知識ベースを検索することで、
    辞書作成者の入力した語の表記と品詞と活用の型とか
    ら、その語の各活用形を作成する活用形展開部と、作成
    した活用形と表示する活用形表示部とを有することを特
    徴とする辞書作成支援装置。
JP2239497A 1990-09-10 1990-09-10 辞書作成支援装置 Expired - Fee Related JP2692362B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2239497A JP2692362B2 (ja) 1990-09-10 1990-09-10 辞書作成支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2239497A JP2692362B2 (ja) 1990-09-10 1990-09-10 辞書作成支援装置

Publications (2)

Publication Number Publication Date
JPH04119468A JPH04119468A (ja) 1992-04-20
JP2692362B2 true JP2692362B2 (ja) 1997-12-17

Family

ID=17045665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2239497A Expired - Fee Related JP2692362B2 (ja) 1990-09-10 1990-09-10 辞書作成支援装置

Country Status (1)

Country Link
JP (1) JP2692362B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62271057A (ja) * 1986-05-20 1987-11-25 Ricoh Co Ltd 翻訳装置における辞書登録方式
JPS6474668A (en) * 1987-09-17 1989-03-20 Fujitsu Ltd Register system for word dictionary

Also Published As

Publication number Publication date
JPH04119468A (ja) 1992-04-20

Similar Documents

Publication Publication Date Title
US5873055A (en) Sentence translation system showing translated word and original word
US7529656B2 (en) Translating method, translated sentence outputting method, recording medium, program, and computer device
JPH11203311A (ja) 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体
JPS62163173A (ja) 機械翻訳方法
US20240193194A1 (en) Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program
US20080040352A1 (en) Method for creating a disambiguation database
JP2692362B2 (ja) 辞書作成支援装置
JPH09179875A (ja) 情報検索装置
JPH11161650A (ja) 電子辞書
JP2621999B2 (ja) 文書処理装置
JP2004318480A (ja) 電子機器装置、新語抽出方法、およびプログラム
JP2817497B2 (ja) 辞書編集装置
JPH0612451A (ja) 例文検索システム
JPH0477857A (ja) 不適切表現検出装置
JP3387421B2 (ja) 単語入力支援装置及び単語入力支援方法
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH0410052A (ja) 外国語電子辞書検索方法及び装置
JP2002108878A (ja) 辞書、および検索システム
JPH07121542A (ja) 機械翻訳装置
JPS60112175A (ja) 仮名漢字変換装置における略称語変換方式
JP2005070873A (ja) 電子辞書
JPH03238525A (ja) 変数名設定支援方式
Gustedt et al. How to format T with the journal’s own LATEX2e-style
JPH05266065A (ja) 機械翻訳装置
JPH1166073A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees