JP3226913B2 - 自然言語処理用辞書の辞書表示・編集装置 - Google Patents

自然言語処理用辞書の辞書表示・編集装置

Info

Publication number
JP3226913B2
JP3226913B2 JP30117689A JP30117689A JP3226913B2 JP 3226913 B2 JP3226913 B2 JP 3226913B2 JP 30117689 A JP30117689 A JP 30117689A JP 30117689 A JP30117689 A JP 30117689A JP 3226913 B2 JP3226913 B2 JP 3226913B2
Authority
JP
Japan
Prior art keywords
speech
classification
dictionary
information
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30117689A
Other languages
English (en)
Other versions
JPH03160565A (ja
Inventor
壽彦 横川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP30117689A priority Critical patent/JP3226913B2/ja
Publication of JPH03160565A publication Critical patent/JPH03160565A/ja
Application granted granted Critical
Publication of JP3226913B2 publication Critical patent/JP3226913B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は、自然言語処理用辞書の辞書表示装置及び編
集装置、より詳細には、機械翻訳装置における辞書エデ
ィタに関する。
従来技術 機械翻訳等一般の自然言語処理で用いられる場合の辞
書において、各単語(熟語を含む)に与えられる品詞分
類(品詞の細分類)は、非常に細かなものとなってい
る。例えば、補語として形容詞を取る動詞・補語として
名詞を取る動詞……といったように普通の品詞細分類よ
りもさらに細かくなっている。そういう情報を与えなけ
れば精密な解析処理が(場合によっては生成処理も)不
可能である。したがって自然言語処理装置における辞書
においては人間用の辞書以上に細かい分類が必要であ
る。
従来の辞書編集装置は、辞書の構造をそのまま画面に
表示する場合が多い。あるいは、動詞・名詞といった品
詞(の大分類あるいは形態的な品詞のレベル)で表示す
る。
品詞における非常に細かい分類をそのまま出す場合、
使用者は、これらの細分類を知っている必要があり、一
般の言語的な知識(普通の文法知識)以上のその機械翻
訳システム等自然言語処理システム特有の細かい分類に
関する知識を要求されるばかりでなく、画面も(非常に
細かいこれらの細分類を表示する必要から)見づらくな
るという欠点がある。
また、例えば動詞なら動詞といった大きな分類でユー
ザに利用させるものの場合、品詞の分類が大まかすぎる
ので、機械翻訳等自然言語処理の精度が向上しないとい
う欠点があった。
例えば、特開昭61−70660号公報、特開昭63−10265号
公報、特開昭63−136265号公報、及び特開昭63−223871
号公報等においては、辞書内容をそのまま表示するよう
にしている。そして、実施例では非常に簡単な品詞の分
類でしか示されていないので、問題ないように見える
が、実際の処理用の辞書は非常に細かな品詞分類を行な
うために、表示が複雑になる可能性がある。また、実施
例で示されているような簡単な品詞のレベルで処理する
と考えるならば、品詞の分類が大まか過ぎるため、実際
に解析等に必要な情報が不足することになる。
自然言語処理システム(解析システム)では、例え
ば、動詞といっても、自動詞・他動詞、他動詞といって
も補語を取る場合と取らない場合、補語も形容詞の場
合、名詞の場合等種々の分類を行なっているはずであ
り、それらをすべてそのまま開示するのでは非常に繁雑
でユーザは非常に困難をしいられる。
それに対して、例えば動詞という範疇にあるものを区
別しないとすると、例えば、不完全他動詞の情報がない
ために処理が失敗したような場合の理由が辞書情報を見
ても分からないし、成功するように辞書を辞書エディタ
を通して編集するようなことも困難である。
また、特開昭62−271056号公報においては、辞書内容
を2段階に分けて、第1段階においては、必要最小限の
情報を、2段階においては詳細な情報を登録する方法が
開示されているが、第1段階における表示等は品詞の大
分類レベルのものであり、この段階の登録では必要な情
報が得られない場合がある。また、第2段階の登録は詳
細情報であり、辞書や翻訳装置の処理の詳細な知識が必
要となる。また、第2段階の登録ではその語の全体像が
見失われやすいので、余分な訳語の登録等が行なわれる
といった欠点がある。
目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、特に、ユーザが利用できる情報を、辞書の構造その
ままでない利用しやすいものにすることを目的としてな
されたものである。
構成 本発明は、上記目的を達成するために、(1)ある言
語の語を見出し語としてもち、少なくとも、自然言語処
理で用いられる構文的な品詞の分類(品詞細分類)とそ
れに従属する情報をもつ自然言語処理用辞書と、その検
索手段と、指定された語を検索し、その内容を表示する
表示手段とを有する自然言語処理用辞書表示装置におい
て、品詞中分類とその下位分類となる1個以上の品詞細
分類の組とのペアとして表わす品詞中分類テーブルと、
各品詞中分類ごとに、その下にいくつの品詞細分類に関
する情報が管理されているかを示す情報と、管理してい
る品詞細分類以下の情報へのポインタを格納している品
詞中分類管理テーブルとを有し、品詞細分類を表示する
際、同一の品詞中分類に属する品詞細分類を前記管理数
情報およびポインターによって順次表示することを特徴
とするものであり、(2)前記(1)において、同一の
品詞中分類で、表示対象となる従属内容の等しいもの
は、1個しか表示しないこと、また、(3)前記(1)
又は(2)において、表示品詞中分類は、構文的な振舞
の似た品詞細分類を集めたものであることを特徴とする
ものであり、更には、(4)ある言語の語を見出し語と
してもち、少なくとも、構文的な品詞の分類(品詞細分
類)とそれに従属する情報をもつ自然言語処理用辞書
と、その検索手段と、指定された語を検索し、その内容
を表示する表示手段と、表示された内容を修正する辞書
表示編集手段と、修正された内容を辞書に格納する手段
とを有する自然言語処理用辞書編集装置において、品詞
中分類とその下位分類となる1個以上の品詞細分類の組
とのペアとして表わす品詞中分類テーブルと、各品詞中
分類ごとに、その下にいくつの品詞細分類に関する情報
が管理されているかを示す情報と、管理している品詞細
分類以下の情報へのポインタを格納している品詞中分類
管理テーブルとを有し、品詞細分類を表示する際、同一
の品詞中分類に属する品詞細分類を前記管理数情報およ
びポインターによって順次表示することを特徴とするも
のであり、また、(5)前記(4)において、同一の品
詞中分類で表示対象となる従属内容の等しいものは、1
個しか表示しないこと、また、(6)前記(4)又は
(5)において、表示品詞中分類は、構文的な振舞の似
た品詞細分類を集めたものであること、また、(7)前
記(5)又は(6)において、複数の品詞細分類から、
従属内容が等しいために1個しか表示されなかったもの
が修正された場合は、元の複数の品詞細分類に対してそ
の修正を加えること、また、(8)前記(4)乃至
(7)において、ある表示品詞中分類に新たな情報が追
加された場合は、その表示品詞中分類に属するすべての
品詞細分類に対してその追加を行なうこと、また、
(9)前記(8)において辞書の情報として、優先度の
情報を持ち、ある表示品詞中分類に新たな情報が追加さ
れた場合は、その表示品詞中分類に属し、現在情報を持
っている品詞細分類に対しては、その追加を行うととも
に、その表示品詞中分類に属し、現在情報を持っていな
い品詞細分類に対しては、優先度を下げた形で同様の追
加を行なうこと、また、(10)前記(4)乃至(7)に
おいて、ある表示品詞中分類に新たな情報が追加された
場合は、その表示品詞中分類に属し、現在情報を持って
いる品詞細分類に対してのみその追加を行なうこと、ま
た、(11)前記(4)乃至(10)において、存在しない
表示品詞中分類を追加した場合、その追加した表示品詞
中分類に属するすべての品詞細分類に対してその追加を
行なうことを特徴としたものである。
上述のように、本発明の目的はユーザが利用できる情
報を辞書の構造そのままでない利用しやすいものにする
ものであるが、この時、「動詞」といった大き過ぎる分
類はとらず、ある程度まで構文的な振舞を反映した分類
を用いるものである。
このため、品詞の大分類と(形態的な品詞といっても
よく、「動詞」「名詞」……、あるいは、「自動詞」
「他動詞」くらいのレベルになっている場合もある得
る。)品詞の細分類(実際に処理に用いられる品詞の細
かな分類)の中間段階として、品詞の細分類を1個以上
まとめた、品詞細分類グループ(表示のグループ=品詞
の中分類)を設定する。この表示グループは、構文的な
振舞が似た品詞細分類をグループとしたもの(たとえ
ば、補語として現在分詞・過去分詞を取る完全自動詞と
いったようなものである。現在分詞をとる完全自動詞
と、過去分詞をとる完全自動詞は品詞の細分類としては
異なるものであるが、表示グループとしては同一とな
る。)にすることによって、ある程度の文法知識がある
人間には容易に理解できるように設定することができ
る。したがって自然言語処理の細かな処理の中身までを
知る必要はなくなる。また、大まかな形態的なレベルの
品詞ではないので辞書編集の内容は充分な程度に実際の
処理に反映することが可能となる(完全ではないことは
もちろんである)。
さらには、ユーザのレベルに合せて、このグループを
変更することも可能である。つまり、熟練したユーザに
は細かな分類までを示し、細かな指示を許すようにする
ことができるし、熟練したユーザにはおおまかな分類
で、細かな知識が必要ないようにすることが簡単に可能
となる。以下、本発明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための全体構
成図、第2図は、本発明の動作説明をするためのフロー
チャートで、第1図において、1は辞書、2は辞書検索
手段、3は辞書表示(編集)手段、4は表示グループ対
応テーブル、5は辞書格納手段で、本発明は、機械翻訳
システムの辞書エディタの一部として実現されている。
以下、本発明を英日機械翻訳システムに組込んだ場合を
実施例として説明する。
本発明の辞書表示・編集装置は、機械翻訳システムの
エディタ等から、エントリを指定して、辞書エディタを
呼びだすことによって起動される。
初期化処理(Step1) まず、初期化処理が行なわれるが、詳細は後述する。
辞書検索処理(Step2) 辞書エディタが起動されると、指定されたエントリで
辞書が検索され、その内容がエディタ内の辞書情報領域
に格納される(これは処理効率を上げるために行なって
いるものである。例えば、主記憶領域が小さい等の理由
により充分な領域が取れない場合は、常に辞書を参照す
るようにすることによって辞書情報領域を用いないでも
同等の処理が実現可能である)。
辞書は、第3図にその一例を示しているように、一つ
のエントリの下に、品詞、各品詞の下に(複数の)品詞
の細分類(構文的な品詞)、各品詞細分類ごとに(複数
の)訳語やその他の付属情報が存在するというツリー状
の構造をしているものを用いている。もちろん、構造は
これに限らない。エントリに対して、品詞、品詞細分類
とその下位の情報というようにレベル分けされていれば
充分である。辞書エディタ領域内においては、品詞細分
類とその付属する領域は、品詞細分類の表示グループ
(以下品詞中部類と呼ぶことにする)ごとに分けられて
管理される。これは、実際には、一つずつ、品詞細分類
とその付属する情報を辞書から取りだし、辞書情報領域
のその品詞細分類が属する品詞中分類の下位情報の1つ
として追加される形を取る。(辞書情報領域にその品詞
細分類が属する品詞中分類がない場合は、その品詞中分
類を辞書情報領域に追加したのち同様の処理を行なうよ
うに構成する。) ある品詞細分類がどの品詞中分類に属するかは、品詞
中分類テーブル(第4図)、を参照して行なう。
品詞中分類テーブルは、第4図に示すように、品詞中
分類とその下位分類となる1個以上の品詞細分類(辞書
中の品詞細分類)の組とのペアとして表わされている。
もちろん、辞書中の辞書領域として品詞中分類を設
け、品詞中分類の情報を辞書中にもたせることは可能で
ある。しかし、品詞中分類テーブルを設けることによっ
て以下のような効果がある。
辞書の構成が簡単になり、辞書内部のデータ量を減ら
すことができる。
従来の辞書のままでも、そのまま用いることができ
る。
品詞中分類テーブルのみを変更することにより、使用
形態に適した表示方法を選択できる。例えば、翻訳専門
ユーザには、より細かな分類を許す中分類テーブルを設
けるのに対し、一般ユーザや初心ユーザには、もっと大
まかな分類しか許さないように中分類テーブルを設定す
ることも可能となる。
初期化処理の詳細 実施例では、起動されたときに、辞書エディタ中の辞
書情報エリア中に品詞中分類管理テーブル(第5図)を
設ける。この管理テーブルは、各中分類ごとに、その下
に現在いくつの細分類に関する情報が管理されているか
という情報と、管理している品詞細分類以下の情報への
(複数の)ポインタを格納している。最初は、管理して
いる数は0として初期化する。ポインタ領域は、複数個
数のポインタを管理できるように配列として構成してあ
る(内部的なあるいはプログラム的な実現手段は種々考
えられることはいうまでもない。たとえば、記憶領域を
節約するために、ポインタ領域を、実際の情報エリアへ
のポインタと、次の情報を示すポインタ領域へのポイン
タの組として実現することもできる。この場合、NULLポ
インタは、情報がもうないことを示す。この場合は、管
理している数に関する情報は必ずしも必要ではないが、
数の情報があると効率良くできる場合もある)。この初
期化は辞書検索の前に初期化処理として実施するように
構成してある。
なお、第5図の品詞中分類管理テーブルにおいて、 (1)「補語を取り、目的語は取らない動詞」の管理数
は、辞書情報としてvi5、viaがないために、2である。
vi5、viaの辞書情報ポインタも存在しない。
(2)ポインタの指し示すエリアは、実際の辞書中にあ
っても良いが、本実施例では、処理速度を向上させる等
のために、辞書情報を辞書エディタ中のエリアにコピー
しておき、そこを指し示すようにする。また、辞書情報
の修正・追加等もその辞書エディタ内のエリアにおいて
行ない、登録の命令が出された場合に実際の辞書に反映
するように構成してある。
品詞中分類管理テーブルへの登録(Step3) 第6図は、品詞中分類管理テーブルへの辞書情報の取
り込み(管理テーブル等のエリアの準備)の概要を説明
するためのフローチャートで、辞書情報領域から、1個
ずつ品詞細分類を取り出して、その品詞細分類がどの品
詞中分類に属するかを検査する。品詞中分類管理テーブ
ル中のその品詞細分類の属する品詞中分類に登録する。
品詞細分類はその下位項目として、複数の訳語等の情報
を持っている。現在は、同一の品詞細分類が存在しない
として処理しているが、同一の品詞細分類が複数出現し
ても可能であるように構成することももちろん可能であ
る。この場合は、一つの品詞中分類の下の情報は品詞細
分類によってソートするように構成することで処理を効
率良く行なうことが可能である。
表 示(Step4) 次に、管理テーブルの各品詞中分類毎につぎの処理を
行ない表示する。
第7図は、表示処理の概要を説明するためのフローチ
ャートで、まず、管理数を評価する。管理数が0の場合
は、つぎの品詞中分類に進む。
管理数が1以上の場合は、まず、その品詞中分類の名
称を表示し、その中分類の下に管理されている品詞細分
類ごとに表示対象の情報を表示する。この表示は例えば
第8図のように品詞中分類に続いて、それに属する表示
情報が表示されるものとする。本実施例は、翻訳システ
ムで用いられる辞書エディタへの応用であるので、表示
情報は訳語の情報とする。
なお、第8図において、「なる」はvi3、vicの2つに
あるが共通なので1個しか表示しない。また、「目的語
に分詞を取る動詞」、「目的語に節を取る動詞」等は管
理数0のため表示されない。
もちろん、訳語の情報に限る必要はない。例えば、意
味的な素性を示すこともまた可能であるし、構文的な内
容を示すことも可能である。あるいは、ひとまず訳語を
表示しておき、詳細表示を要求されたら、それに付随す
る細かな情報を表示するようにすることもまた可能であ
る。
また、最初に、大きな管理テーブルを設けずに、ある
品詞中分類(に属する品詞細分類)が出現した場合に
は、その中分類への情報を管理テーブルに追加して行く
という方法を取ることも可能である。この場合は、後述
する表示の際に、管理数を評価して、0の場合は表示し
ないようにするという処理は必要なくなる。管理テーブ
ル中の品詞中分類を辿りながら、同様の表示処理を行な
えばよい。また、管理テーブルへの追加を品詞中分類テ
ーブルのならびにそった形で行なうようにすることによ
って、表示の際の統一性を保つことも可能となる。
表示の際に、表示しようとする表示対象情報と等しい
表示対象情報をもつ情報がすでに表示されている場合
(つまり、ポインタテーブル中の現在までに処理した領
域中に表示対象領域が等しいものが存在する場合)は、
その表示を取り止める。
本実施例のように表示対象が訳語である場合は訳語が
等しいもの。品詞中分類は似た用法の品詞細分類を集め
たものであるため、同一の訳語が異なる品詞細分類に頻
出する場合があるが、そういった場合にも、1個の訳語
しか表示しないので、表示が非常に分かりやすくなる。
この品詞中分類テーブルにしたがって、第3図の辞書
(make)を表示すると第8図のような表示が得られる。
指示(処理の選択)(Step5) 訳語の修正・追加等は品詞中分類ごとに行なわれる。
例えば、ある品詞中分類に訳語を追加するあるいは、あ
る品詞中分類のある訳語を修正するという形で行なわれ
る。これらの修正や追加は、カーソルキーやマウス等で
指示することにより起動される。
品詞中分類内の情報修正(Step7) 修正が行なわれて確定すると、それらの修正項目は、
品詞中分類中の全ての品詞細分類に対して行なわれるこ
ととなる。品詞中分類中の品詞細分類のうち、修正対象
となった情報を持つ品詞細分類それぞれの当該情報がす
べて修正されることを意味する。
第9図は、修正処理の概要を説明するためのフローチ
ャートで、例えば、訳語が修正された場合は、その修正
された訳語は、修正される前の訳語をもっていたその品
詞中分類管理テーブルに管理されるすべての品詞細分類
に有効となる。(該当する品詞中分類管理テーブルが管
理する全ての品詞細分類をチェックし、修正された訳語
をもっている場合は、その訳語を修正することにより実
現する。) 品詞中分類内の情報追加(Step8) 第10図及び第11図は、品詞中分類内の情報追加処理の
概要を説明するためのフローチャートで、第10図は、あ
る表示グループに新たな情報が追加された場合に、その
表示グループに属するすべての品詞細分類に対してその
追加を行なう場合、第11図は、ある表示グループに新た
な情報が追加された場合に、その表示グループに属し、
現在の情報を持つ品詞細分類に対してのみその追加を行
なう場合を示す。而して、訳語が追加される場合は、そ
の品詞中分類管理テーブルに管理される全ての品詞細分
類の訳語の一つとして追加された訳語を登録する(追加
された訳語がもっとも優先される訳語になるように構成
することもまた可能である)。あるいは、訳語が追加さ
れる場合には、上記の処理とともに、品詞中分類管理テ
ーブルに登録されていないが、品詞中分類テーブルでそ
の品詞中分類に属するとされている品詞細分類について
も追加登録することも可能である。この場合、品詞中分
類管理テーブルに、あらたに、その品詞細分類を追加し
(同時に管理数等も修正する)、その訳語として追加さ
れた訳語を登録するようにする。例えば、各品詞細分類
あるいは訳語等に優先度あるいは頻度のような情報があ
る場合は、もともとなかった品詞細分類あるいはその品
詞細分類の訳語優先度あるいは頻度を他の品詞細分類あ
るいは他の品詞細分類下の訳語の優先度あるいは頻度よ
り下げることも当然可能である。そうすることにより、
無駄な品詞細分類を作りだしたとしてもその悪影響を最
小限に止めることが可能となる。
品詞中分類の追加(Step9) また、もとの辞書中にない品詞中分類を登録すること
も可能である。第12図は、品詞中分類の追加処理を説明
するためのフローチャートで、この場合は、品詞中分類
管理テーブルに新たに追加された品詞中分類を追加す
る。この品詞中分類は、品詞中分類テーブルでその品詞
中分類の下位分類とされた品詞細分類の全てを情報とし
て保持し、各品詞細分類の情報として、追加された品詞
中分類に与えられた訳語等の情報を登録する。
登録処理(Step10) 辞書中分類管理テーブルに基づいて、辞書内容を書き
換える処理を行なう。
前述のようにして修正・追加等が終了し、登録を指示
されると、その品詞中分類管理テーブルに管理されてい
る内容が辞書に登録される(登録処理は辞書エディタの
終了と同時に行なうことも可能である)。
終了処理(Step6) 最後に辞書エディタの終了が指示されると辞書エディ
タを終了する。
もし修正等と変更等が行なわれておりその後に登録処
理が行なわれていない場合は、ユーザに問い合せる等に
よって登録処理を起動した後に終了する(辞書エディタ
エリアの開放等も含んでいても良い)。
効果 以上の説明から明らかなように、請求項1の発明によ
ると、(1)ある言語の語を見出し語としてもち、少な
くとも、自然言語処理で用いられる構文的な品詞の分類
(品詞細分類)とそれに従属する情報をもつ自然言語処
理用辞書と、その検索手段と、指定された語を検索し、
その内容を表示する表示手段とを有する自然言語処理用
辞書表示装置において、品詞中分類とその下位分類とな
る1個以上の品詞細分類の組とのペアとして表わす品詞
中分類テーブルと、各品詞中分類ごとに、その下にいく
つの品詞細分類に関する情報が管理されているかを示す
情報と、管理している品詞細分類以下の情報へのポイン
タを格納している品詞中分類管理テーブルとを有し、品
詞細分類を表示する際、同一の品詞中分類に属する品詞
細分類を前記管理数情報およびポインターによって順次
表示するように構成したことにより、自然言処理用の辞
書の処理の際の細かな分類を表示品詞中分類としてまと
めて表示することができ、処理の詳細の知識がない場合
においても表示の内容を簡単に把握できるとともに、表
示が詳細なすべての表示に比べて見やすくなる。
また、品詞細分類を表示する際の品詞中分類の対応テ
ーブルを有し、この対応テーブルにしたがって、表示の
品詞中分類分けを行なうようにすることにより、表示品
詞中分類を辞書とは独立テーブルとして管理するので、
辞書のデータ量を少なくできるとともに、辞書の内部デ
ータは従来のままで表示品詞中分類にまとめた表示が可
能となる。また、表示品詞中分類の対応テーブルをユー
ザの習熟度等に合せて、変更することも簡単であるの
で、ユーザのニーズに合わせたフレキシブルな表示が可
能となる。
また、(2)同一の品詞中分類で、表示対象となる従
属内容の等しいものは、1個しか表示しないようにする
ことにより、表示品詞中分類内の同一の表示内容は1度
しか表示しないので、ダブッた表示がなくなり、見やす
くなる。
また、(3)表示品詞中分類は、構文的な振舞の似た
品詞細分類を集めたものであるようにすることにより、
表示品詞中分類を処理の内部では異なる働きを持ってい
るが、構文的にはよく似たものにすることができ、ユー
ザが情報を把握しやすくなる。
更に、請求項4の発明によると、(4)ある言語の語
を見出し語としてもち、少なくとも、構文的な品詞の分
類(品詞細分類)とそれに従属する情報をもつ自然言語
処理用辞書と、その検索手段と、指定された語を検索
し、その内容を表示する表示手段と、表示された内容を
修正する辞書表示編集手段と、修正された内容を辞書に
格納する手段とを有する自然言語処理用辞書編集装置に
おいて、品詞中分類とその下位分類となる1個以上の品
詞細分類の組とのペアとして表わす品詞中分類テーブル
と、各品詞中分類ごとに、その下にいくつの品詞細分類
に関する情報が管理されているかを示す情報と、管理し
ている品詞細分類以下の情報へのポインタを格納してい
る品詞中分類管理テーブルとを有し、品詞細分類を表示
する際、同一の品詞中分類に属する品詞細分類を前記管
理数情報およびポインターによって順次表示するように
構成したことにより、自然言語処理用の辞書の処理の際
の細かな分類を表示品詞中分類としてまとめて表示する
ことができ、処理の詳細の知識がない場合においても表
示の内容を簡単に把握できるとももに、表示が詳細なす
べての表示に比べて見やすくなり、修正等に際しても一
般の言語知識だけで可能となる。
また、品詞細分類を表示する際の品詞中分類の対応テ
ーブルを、この対応テーブルにしたがって、表示の品詞
中分類分けを行なうことにより、表示品詞中分類を辞書
とは独立のテーブルとして管理するので、辞書のデータ
量を少なくできるともに、辞書の内部データは従来のま
まで表示品詞中分類にまとめた表示が可能となる。ま
た、表示品詞中分類の対応テーブルをユーザの習熟度等
に合せて、変更することも簡単であるので、ユーザのニ
ーズに合わせたフレキシブルな表示・編集が可能とな
る。
また、(5)前記(4)において、同一の品詞中分類
で、表示対象となる従属内容の等しいものは、1個しか
表示しないようにすることにより、表示品詞中分類内の
同一の表示内容は1度しか表示しないので、ダブッた表
示がなくなり、見やすくなり、修正も簡単に行なえるよ
うになる。
また、(6)前記(4)又は(5)において、表示品
詞中分類は、構文的な振舞の似た品詞細分類を集めたも
のであるようにすることにより、表示品詞中分類を処理
の内部では異なる働きを持っているが、構文的にはよく
似たものにすることができ、ユーザが情報を把握しやす
くなる。
また、修正・追加等を行なう際には、構文が似ている
ものの情報を一括して扱うために、誤った修正等による
副作用を最小限に止めることが可能となる。
また、(7)前記(5)又は(6)において複数の品
詞細分類から、従属内容が等しいために1個しか表示さ
れなかったものが修正された場合は、元の複数の品詞分
類に対してその修正を加えるようにすることにより、修
正が同一表示品詞中分類内の同一の辞書情報に対して行
なわれる場合は、1度の修正ですべての修正を行なうこ
とが可能となり、同じ修正を行なう必要がなく簡単にな
る。
また、(8)前記(4)乃至(7)において、ある表
示品詞中分類に新たな情報が追加された場合は、その表
示品詞中分類に属するすべての品詞細分類に対してその
追加を行なうようにすることにより、表示品詞中分類に
対する追加は、その表示品詞中分類に属するすべての品
詞細分類について行なわれるので、各細分類に対してひ
とつひとつ同じ追加を加える必要がなく簡単な処理で追
加が行なえる。
また、(9)前記(8)において、辞書の情報とし
て、優先度の情報を有し、ある表示品詞中分類に新たな
情報が追加された場合は、その表示品詞中分類に属し、
現在情報を持っている品詞細分類に対してその追加を行
なうとともに、その表示品詞中分類に属し、現在情報を
持っていない品詞細分類に対しては、優先度を下げた形
で同様の追加を行なうようにすることにより、表示品詞
中分類に対する追加は、その表示品詞中分類に属し現在
存在する品詞細分類に対してのみまず行なわれ、その後
優先度を下げた形で、その表示品詞中分類に属する残り
の品詞細分類に対して行なわれるので、その語が持つ可
能性の少ない品詞細分類へは優先度を下げた形で追加で
き、副作用を最小限に止めることが可能となる。
また、(10)前記(4)乃至(7)において、ある表
示品詞中分類に新たな情報が追加された場合は、その表
示品詞中分類に属し、現在情報を持っている品詞細分類
に対してのみその追加を行なうようにすることにより、
表示品詞中分類に対する追加は、その表示品詞中分類に
属し、現在存在する品詞細分類に対してのみ行なわれる
ので、その語が持つ可能性の少ない品詞細分類への追加
を防ぐことが可能となる。
また、(11)前記(4)乃至(10)において、存在し
ない表示品詞中分類を追加した場合、その追加した表示
品詞中分類に属するすべての品詞細分類に対してその追
加を行なうようにすることにより、表示品詞中分類の追
加の際には、その表示品詞中分類に属するすべての品詞
細分類について同一の追加処理が行なわれるので、各細
分類に対して一つ一つ同じ追加を行なう必要がなく、簡
単な処理で追加が可能である等の利点がある。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための全体構成
図、第2図は、本発明の動作説明をするためのフローチ
ャート、第3図は、辞書の構成例を示す図、第4図は、
品詞中分類(表示グループ)テーブルの例を示す図、第
5図は、品詞中分類管理テーブルの構成例を示す図、第
6図は、品詞中分類管理テーブルへの辞書情報の取り込
みの概要を説明するためのフローチャート、第7図は、
表示処理の概要を説明すめためのフローチャート、第8
図は、表示の一例を示す図、第9図は、修正処理の概要
を説明するためのフローチャート、第10図及び第11図
は、品詞中分類内の情報追加処理の概要を説明するため
のフローチャート、第12図は、品詞中分類の追加処理の
概要を説明すめためのフローチャートである。 1……辞書、2……辞書検索手段、3……辞書表示(編
集)手段、4……表示グループ対応テーブル、5……辞
書格納手段。
フロントページの続き (56)参考文献 特開 昭63−79175(JP,A) 特開 昭60−120465(JP,A) 特開 昭63−223871(JP,A) 特開 平1−42767(JP,A) 特開 平1−94481(JP,A) 特開 昭63−236168(JP,A) 特開 昭63−165962(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/20 - 17/28 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】ある言語の語を見出し語としてもち、少な
    くとも、自然言語処理で用いられる構文的な品詞の分類
    (品詞細分類)とそれに従属する情報をもつ自然言語処
    理用辞書と、その検索手段と、指定された語を検索し、
    その内容を表示する表示手段とを有する自然言語処理用
    辞書表示装置において、品詞中分類とその下位分類とな
    る1個以上の品詞細分類の組とのペアとして表わす品詞
    中分類テーブルと、各品詞中分類ごとに、その下にいく
    つの品詞細分類に関する情報が管理されているかを示す
    情報と、管理している品詞細分類以下の情報へのポイン
    タを格納している品詞中分類管理テーブルとを有し、品
    詞細分類を表示する際、同一の品詞中分類に属する品詞
    細分類を前記管理数情報およびポインターによって順次
    表示することを特徴とする自然言語処理用辞書表示装
    置。
  2. 【請求項2】ある言語の語を見出し語としてもち、少な
    くとも、構文的な品詞の分類(品詞細分類)とそれに従
    属する情報をもつ自然言語処理用辞書と、その検索手段
    と、指定された語を検索し、その内容を表示する表示手
    段と、表示された内容を修正する辞書表示編集手段と、
    修正された内容を辞書に格納する手段とを有する自然言
    語処理用辞書編集装置において、品詞中分類とその下位
    分類となる1個以上の品詞細分類の組とのペアとして表
    わす品詞中分類テーブルと、各品詞中分類ごとに、その
    下にいくつの品詞細分類に関する情報が管理されている
    かを示す情報と、管理している品詞細分類以下の情報へ
    のポインタを格納している品詞中分類管理テーブルとを
    有し、品詞細分類を表示する際、同一の品詞中分類に属
    する品詞細分類を前記管理数情報およびポインターによ
    って順次表示することを特徴とする自然言語処理用辞書
    編集装置。
JP30117689A 1989-11-20 1989-11-20 自然言語処理用辞書の辞書表示・編集装置 Expired - Fee Related JP3226913B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30117689A JP3226913B2 (ja) 1989-11-20 1989-11-20 自然言語処理用辞書の辞書表示・編集装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30117689A JP3226913B2 (ja) 1989-11-20 1989-11-20 自然言語処理用辞書の辞書表示・編集装置

Publications (2)

Publication Number Publication Date
JPH03160565A JPH03160565A (ja) 1991-07-10
JP3226913B2 true JP3226913B2 (ja) 2001-11-12

Family

ID=17893702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30117689A Expired - Fee Related JP3226913B2 (ja) 1989-11-20 1989-11-20 自然言語処理用辞書の辞書表示・編集装置

Country Status (1)

Country Link
JP (1) JP3226913B2 (ja)

Also Published As

Publication number Publication date
JPH03160565A (ja) 1991-07-10

Similar Documents

Publication Publication Date Title
US5140522A (en) Method and apparatus for machine translation utilizing previously translated documents
US7512575B2 (en) Automated integration of terminological information into a knowledge base
JP2783558B2 (ja) 要約生成方法および要約生成装置
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
WO1998013774A1 (en) System and method for search and retrieval of digital information
JPH05298360A (ja) 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置
Beckwith et al. Implementing a lexical network
JP2002229981A (ja) 文字列の正規化表示を生成するシステム
JPH02271468A (ja) データ処理方法
JP2005251115A (ja) 連想検索システムおよび連想検索方法
JPH03172966A (ja) 類似文書検索装置
EP0813160B1 (en) Apparatus for and method of accessing a database
US5289376A (en) Apparatus for displaying dictionary information in dictionary and apparatus for editing the dictionary by using the above apparatus
JP2968151B2 (ja) 機械翻訳装置
JP2020067971A (ja) 情報処理システムおよび情報処理方法
JPH0484271A (ja) 文書内情報検索装置
JP2019021194A (ja) 情報処理システムおよび情報処理方法
JPS58192173A (ja) 機械翻訳装置
JP3226913B2 (ja) 自然言語処理用辞書の辞書表示・編集装置
JP2778025B2 (ja) 共起関係辞書の学習方法
JP3744136B2 (ja) 訳語選択装置と記憶媒体
JP3804609B2 (ja) 検索チューニング方法および情報検索システム
Bai Describing the Grammatical Knowledge of Chinese Words for Natural Language Processing
List Normalization

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees