JPH0310369A - 辞書作成支援装置 - Google Patents
辞書作成支援装置Info
- Publication number
- JPH0310369A JPH0310369A JP1146362A JP14636289A JPH0310369A JP H0310369 A JPH0310369 A JP H0310369A JP 1146362 A JP1146362 A JP 1146362A JP 14636289 A JP14636289 A JP 14636289A JP H0310369 A JPH0310369 A JP H0310369A
- Authority
- JP
- Japan
- Prior art keywords
- different
- spelling
- knowledge base
- foreign
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は自然言語の辞書を作成する際に単語登録の作業
を支援する辞書作成支援装置に関する。
を支援する辞書作成支援装置に関する。
自然言語処理装置、たとえは機械翻訳システム等におい
ては、辞書に単語を登録する必要がある。
ては、辞書に単語を登録する必要がある。
従来からある辞書作成装置では、登録したい単語の綴り
を入力し、その綴りを見出しとする辞書自答を作成する
という機能が提供されていたが、見出しの綴りに対する
性態を作業者にうながす機能はもっていなかった。
を入力し、その綴りを見出しとする辞書自答を作成する
という機能が提供されていたが、見出しの綴りに対する
性態を作業者にうながす機能はもっていなかった。
上述した従来の辞書作成装置では、入力した綴りに対し
て辞書を作成するだけなので、単語に異なる表記のしか
たがありうる場合、登録者が異表記の辞書見出しを作り
忘れるという欠点があった。
て辞書を作成するだけなので、単語に異なる表記のしか
たがありうる場合、登録者が異表記の辞書見出しを作り
忘れるという欠点があった。
異表記の例としては、日本語では送りがなのゆれの問題
があシ、英語では大文字表記の問題がある。
があシ、英語では大文字表記の問題がある。
まず、日本語の送シがなのゆれの問題について例を挙げ
て説明する。例えば「ことなる」という動詞の場合、「
異なる」「異る」という少なくとも二通りの送りがなの
送り方がありうる。「異なる」と1異る」という二つの
表記は、一般に、辞書登録の見出しとしては全く別のも
のと見做される。したがって、「ことなる」という動詞
に対して新たに辞書を作成したり、情報を追加したりす
る場合には、「異なる」、「異る」の両方の見出しに対
して作業を行なわなければならない。
て説明する。例えば「ことなる」という動詞の場合、「
異なる」「異る」という少なくとも二通りの送りがなの
送り方がありうる。「異なる」と1異る」という二つの
表記は、一般に、辞書登録の見出しとしては全く別のも
のと見做される。したがって、「ことなる」という動詞
に対して新たに辞書を作成したり、情報を追加したりす
る場合には、「異なる」、「異る」の両方の見出しに対
して作業を行なわなければならない。
しかし、従来はこのような異表記に対する注意は登録作
業者が行なうだけであり、機械による支援がなされてい
なかったので、登録のし忘れが多かった。
業者が行なうだけであり、機械による支援がなされてい
なかったので、登録のし忘れが多かった。
英語の大文字表記の問題も、上記の日本語の送りがなの
例と同様の問題である。英語では通常単語はすべて小文
字で綴られる。しかし、その単語が固有名詞として用い
られていたり、表題の一部であったりすると、先頭の1
文字を大文字で表記したり単語全体全太文字で表記した
りすることがある。例えば、システムという単語は通常
systemと綴られるが、上記のような場合にはSy
stemあるいUSYSTEM と表記される。この
ような表記法があるので、辞書登録の見出しとしては標
準のsystemの他に、SystemあるいはSYS
TEMという見出しを作ることがありうる。
例と同様の問題である。英語では通常単語はすべて小文
字で綴られる。しかし、その単語が固有名詞として用い
られていたり、表題の一部であったりすると、先頭の1
文字を大文字で表記したり単語全体全太文字で表記した
りすることがある。例えば、システムという単語は通常
systemと綴られるが、上記のような場合にはSy
stemあるいUSYSTEM と表記される。この
ような表記法があるので、辞書登録の見出しとしては標
準のsystemの他に、SystemあるいはSYS
TEMという見出しを作ることがありうる。
登録者がSystem という見出しを作る場合には2
つの可能性がある。第1は、Systemという表記特
有の意味が有り、systemやSYSTEM には
その意味がない、という場合がある。
つの可能性がある。第1は、Systemという表記特
有の意味が有り、systemやSYSTEM には
その意味がない、という場合がある。
第2は、Systemという表記だけでな(、syst
emあるいはSYSTEM という別表記にも共通の
一つの意味が有る場合である。第1の場合には、Sys
temという見出しに対して辞書を作成するだけでよい
が、第2の場合は、Systemという見出しに対する
作業だけでは不十分である。一般に、Systemはs
ystemおよびSYSTEM とは全く別の見出し
と見做さtしるからである。このような文字の違いに対
する注意も、従来は登録者が行なうだけであり、機械に
よる注意の喚起がなされていなかったので、登録の不備
が多かった。
emあるいはSYSTEM という別表記にも共通の
一つの意味が有る場合である。第1の場合には、Sys
temという見出しに対して辞書を作成するだけでよい
が、第2の場合は、Systemという見出しに対する
作業だけでは不十分である。一般に、Systemはs
ystemおよびSYSTEM とは全く別の見出し
と見做さtしるからである。このような文字の違いに対
する注意も、従来は登録者が行なうだけであり、機械に
よる注意の喚起がなされていなかったので、登録の不備
が多かった。
本発明の目的は、以上述べたような、異表記に対する辞
4F登録の不備全減少させるために、異表記の可能性を
作業者に知セせる#1:作成支援装置を提供することに
ある。
4F登録の不備全減少させるために、異表記の可能性を
作業者に知セせる#1:作成支援装置を提供することに
ある。
本発明の辞書作成支援装置は、文字を入力するための文
字入力装置と、単語の異表記に関する知識を格納した異
表記知識ベースと、入力された単語の表記に前記異表記
がありうるか否かを前記異表記知瞳ベースを検索して調
べる異表記知識ベース検索装置と、前記異表記知識ベー
ス検索装置による検索結果を出力する表示装置とを有え
て構成されている。
字入力装置と、単語の異表記に関する知識を格納した異
表記知識ベースと、入力された単語の表記に前記異表記
がありうるか否かを前記異表記知瞳ベースを検索して調
べる異表記知識ベース検索装置と、前記異表記知識ベー
ス検索装置による検索結果を出力する表示装置とを有え
て構成されている。
次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例を示すブロック図である。
第1図において、文字入力装置1は例えばキーボードの
ような、文字を入力するための装置である。異表記知識
ベース2には、単語の綴りの異表記についての知識が格
納しである。異表記知識ベース検索装置3は、文字入力
装置1から入力された単語の綴りに対して、異表記があ
りうるかどうかを知るために、異表記知識ベース2を検
索し、その検索結果を表示装w4に送る。表示装置4は
例えばデイスプレィのような、処理の結果を表示する装
置である。
ような、文字を入力するための装置である。異表記知識
ベース2には、単語の綴りの異表記についての知識が格
納しである。異表記知識ベース検索装置3は、文字入力
装置1から入力された単語の綴りに対して、異表記があ
りうるかどうかを知るために、異表記知識ベース2を検
索し、その検索結果を表示装w4に送る。表示装置4は
例えばデイスプレィのような、処理の結果を表示する装
置である。
第2図は異表記知識ベース2に格納しておく知識の例を
示し/こ図である。
示し/こ図である。
格納する知識には2棟類ある。1種類は個別の単語につ
いての知識であり、他の1種類は、単語の綴りが持って
いる一般規則に関する知識である。
いての知識であり、他の1種類は、単語の綴りが持って
いる一般規則に関する知識である。
第2図では、前者を1個別単語データ部」、後者を1一
般規則部」として示した。第2図(a)は日本語の異表
記に関する知識の例、第2図(b)は英語の異表記に関
する知識の例である。
般規則部」として示した。第2図(a)は日本語の異表
記に関する知識の例、第2図(b)は英語の異表記に関
する知識の例である。
以下では具体例を挙げて第2図を説明する。
まず、第2図(atに示した日本語の異表記に関する知
識について説明する。日本語において異表記が存在する
代表的な例は動詞の送りがなである。
識について説明する。日本語において異表記が存在する
代表的な例は動詞の送りがなである。
具体的には、動詞「ことなる」に対する「°異なる」「
異る」という表記のゆれや、動詞[−おこなう」に対す
る「行なう」「行う」という表記のゆれがある。このよ
うに、あらかじめ異表記が存在することがわかっている
場合には、個別単語デー6 タとしてその表記を格納しておく。さらに、個別単語デ
ータに対応した一般的な規則がある場合には、それを一
般規則として格納しておく。
異る」という表記のゆれや、動詞[−おこなう」に対す
る「行なう」「行う」という表記のゆれがある。このよ
うに、あらかじめ異表記が存在することがわかっている
場合には、個別単語デー6 タとしてその表記を格納しておく。さらに、個別単語デ
ータに対応した一般的な規則がある場合には、それを一
般規則として格納しておく。
「異なる」と1異る」のような表記のゆれに対応する一
般規則としては、「勲詞の表記として漢字のあとに、ひ
らがなが2文字以上あシ、そ′i″Lが「する、でない
、場合には、異表記が存在する可能性がある。そして、
その異次記はひらがな文手部の最初の文字を一文字削っ
てひらがな文字数を一文字分短くした表記である」とい
う規則をたてることができる。異表記に関するこのよう
な規則かたてられる場合には、そJlを異表記知識ベー
ス2に一般規則として格納する。同様の異表記例ならび
にその一般規則は、「短かい」と「短い」のように形容
詞の場合にもあり、また「受は付け」「受付け」「受付
」のような動詞から派生してできた名詞の場合にもある
。
般規則としては、「勲詞の表記として漢字のあとに、ひ
らがなが2文字以上あシ、そ′i″Lが「する、でない
、場合には、異表記が存在する可能性がある。そして、
その異次記はひらがな文手部の最初の文字を一文字削っ
てひらがな文字数を一文字分短くした表記である」とい
う規則をたてることができる。異表記に関するこのよう
な規則かたてられる場合には、そJlを異表記知識ベー
ス2に一般規則として格納する。同様の異表記例ならび
にその一般規則は、「短かい」と「短い」のように形容
詞の場合にもあり、また「受は付け」「受付け」「受付
」のような動詞から派生してできた名詞の場合にもある
。
次に、第2図(b)に示した英語の異表記に関する知識
について説明する。英語においても、異表記か存在する
代表的な例は語尾の表記である。例として、ana l
i zeとanalise の対、theatre
とtheater の対、favourとfavor
の対などが挙げられる。
について説明する。英語においても、異表記か存在する
代表的な例は語尾の表記である。例として、ana l
i zeとanalise の対、theatre
とtheater の対、favourとfavor
の対などが挙げられる。
これらの異表記対に関する一般規則としては、「語尾が
izeの場合、異表記としてiseもありうる。逆もま
た真である。語尾がireの場合、異表記としてter
もありうる。逆もまた真である。
izeの場合、異表記としてiseもありうる。逆もま
た真である。語尾がireの場合、異表記としてter
もありうる。逆もまた真である。
語尾がour の場合、異表記としてOr もありう
る。逆もまた真である」 という規則がたてられる。日本語の場合と同様、英語の
場合にも、あらかじめ異表記がわがっているものに関し
ては個別単語データとして格納し、綴シによる一般的な
規則がたてられる場合には、一般規則として格納する。
る。逆もまた真である」 という規則がたてられる。日本語の場合と同様、英語の
場合にも、あらかじめ異表記がわがっているものに関し
ては個別単語データとして格納し、綴シによる一般的な
規則がたてられる場合には、一般規則として格納する。
英語における異表記のもう−りの代表例としては、大文
字表記の問題がある。本明細書の「発明が解決しようと
する課題」の項でも指摘したように、「システム」とい
う英単語の緩りとしてはsystem 、 Syste
m 、 SYSTEMといった複数の登録の可能性があ
る。大文字を含んだSystemあるいは5YSTii
という見出しを登録する場合には、二通りの可能性
がある。第1は、SystemあるいはSYSTEM
という見出しに対してだけ辞書を作成したい場合であ
り、第2は、SystemあるいはSYSTEM だ
けではなく、大文字小文字の差を無視して異表記に対し
ても同じ辞書作成作業をほどこすべき場合である。一般
に、大文字を含む見出しを登録する際には、そ八が上述
の第1の場合なのか第2の場合なのかを考えなければな
らない。そして、それがもし第2の場合であるなら、異
表記の見出しに対しても同等の辞書作成をおこなう必要
がある。このような異表記に関する一般規則としては、
1語の先頭が大文字である語の場合、異表記として、す
べてを小文字に直した語、およびすべてを大文字に直し
た語がありうる。単語すべてが大文字である飴の場合、
異表記として、すべてを小文字に直した語および、語の
先頭のみ大文字で、残りを小文字に直した語かあシうる
jという規則をたてることができる。このような規則も
、異表記知識ベース2に一般規則として格納する。
字表記の問題がある。本明細書の「発明が解決しようと
する課題」の項でも指摘したように、「システム」とい
う英単語の緩りとしてはsystem 、 Syste
m 、 SYSTEMといった複数の登録の可能性があ
る。大文字を含んだSystemあるいは5YSTii
という見出しを登録する場合には、二通りの可能性
がある。第1は、SystemあるいはSYSTEM
という見出しに対してだけ辞書を作成したい場合であ
り、第2は、SystemあるいはSYSTEM だ
けではなく、大文字小文字の差を無視して異表記に対し
ても同じ辞書作成作業をほどこすべき場合である。一般
に、大文字を含む見出しを登録する際には、そ八が上述
の第1の場合なのか第2の場合なのかを考えなければな
らない。そして、それがもし第2の場合であるなら、異
表記の見出しに対しても同等の辞書作成をおこなう必要
がある。このような異表記に関する一般規則としては、
1語の先頭が大文字である語の場合、異表記として、す
べてを小文字に直した語、およびすべてを大文字に直し
た語がありうる。単語すべてが大文字である飴の場合、
異表記として、すべてを小文字に直した語および、語の
先頭のみ大文字で、残りを小文字に直した語かあシうる
jという規則をたてることができる。このような規則も
、異表記知識ベース2に一般規則として格納する。
さて次に、実際に単語の綴りが文字入力装置1から入力
されたときの、本発明の全体の動作を説明する。
されたときの、本発明の全体の動作を説明する。
第3図は異表記知識ベース検索装置3の動作を説明する
ためのフローチャートである。
ためのフローチャートである。
文字入力装置1から入力された単語の綴りを受けとると
(ステップ11)、異表記知識ベース検索装置3は異表
記知識ベース2の個別単語データ部を検索する(ステッ
プ12)。そして、入力された綴りに対して異表記があ
るという知識が検索できれば(ステップ13)、その異
表記を表示装置4に送り(ステップ14)、表示する。
(ステップ11)、異表記知識ベース検索装置3は異表
記知識ベース2の個別単語データ部を検索する(ステッ
プ12)。そして、入力された綴りに対して異表記があ
るという知識が検索できれば(ステップ13)、その異
表記を表示装置4に送り(ステップ14)、表示する。
例えば、第2図(alに示した知識が異表記知識データ
ベース2に格納されているときに、「異なる」という綴
シが入力された場合には、異表記として「異る」がある
ことがわかるので1異る」を表示装置4に表示し、作業
者の注意を促す。もし異表記知識ベース2の個別単語デ
ータ部で異表記の情報が得られなかった場合には(ステ
ップ13)、次に異表−′11’D区 記知識ベース2の一般規則部を検索する(ステップ15
)。そして、一般規則部に格納されている異表記があり
うるための条件に、その綴りが合致しているかどうかを
確かめる(ステップ16)。
ベース2に格納されているときに、「異なる」という綴
シが入力された場合には、異表記として「異る」がある
ことがわかるので1異る」を表示装置4に表示し、作業
者の注意を促す。もし異表記知識ベース2の個別単語デ
ータ部で異表記の情報が得られなかった場合には(ステ
ップ13)、次に異表−′11’D区 記知識ベース2の一般規則部を検索する(ステップ15
)。そして、一般規則部に格納されている異表記があり
うるための条件に、その綴りが合致しているかどうかを
確かめる(ステップ16)。
もし合致していれば、一般規則部にある知識に基づいて
考えられる異表記を合成しくステップ17)、その異表
記を表示装置4に送り表示する(ステップ18)。
考えられる異表記を合成しくステップ17)、その異表
記を表示装置4に送り表示する(ステップ18)。
例えば、「基づく」という緩りか入力された場合を考え
る。個別単語データ部には「基づく」に関する知識は無
いが、一般規則部に格納されている知識によって、「基
づく」の異表記として1−基く」がありうると判断でき
る。そこで1基く」を表示装置4に表示し、作業者に異
表記がありうるという注意を促す。
る。個別単語データ部には「基づく」に関する知識は無
いが、一般規則部に格納されている知識によって、「基
づく」の異表記として1−基く」がありうると判断でき
る。そこで1基く」を表示装置4に表示し、作業者に異
表記がありうるという注意を促す。
もし異表記知識ベース2の個別単語データ部からも一般
規則部からも異表記の可能性が得られなかったならば(
ステップ16)、異表記知識データベース検索装置3は
異表記の可能性がみつからなかったという情報を表示装
置4に送り(ステップ19)、動作を終了する。
規則部からも異表記の可能性が得られなかったならば(
ステップ16)、異表記知識データベース検索装置3は
異表記の可能性がみつからなかったという情報を表示装
置4に送り(ステップ19)、動作を終了する。
以上説明したように本発明は、あらかじめ異表記かあり
うる場合の知識をもっておくことによって、辞書登録作
業時に、異表記の可能性を作業者に表示し、注意を促す
ことができ、異表記に対する辞書登録の不備やもれが減
少し、辞書データの質が向上するという効果がをする。
うる場合の知識をもっておくことによって、辞書登録作
業時に、異表記の可能性を作業者に表示し、注意を促す
ことができ、異表記に対する辞書登録の不備やもれが減
少し、辞書データの質が向上するという効果がをする。
第1図は本発明の一実施例のブロック図、第2図は第1
図の異表記知識ベース2に格納しておくべき知識の例を
示す図、第3図は第1図の異表記知識ベース検索装置3
の動作を説明するための70−チャートである。 1・・・・・・文字人力装酋、2・・・・・・異表記知
識ベース、3・・・・・・異表記知識ベース検索装置、
4・・・・・・表示装置従。
図の異表記知識ベース2に格納しておくべき知識の例を
示す図、第3図は第1図の異表記知識ベース検索装置3
の動作を説明するための70−チャートである。 1・・・・・・文字人力装酋、2・・・・・・異表記知
識ベース、3・・・・・・異表記知識ベース検索装置、
4・・・・・・表示装置従。
Claims (1)
- 文字を入力するための文字入力装置と、単語の異表記に
関する知識を格納した異表記知識ベースと、入力された
単語の表記に前記異表記がありうるか否かを前記異表記
知識ベースを検索して調べる異表記知識ベース検索装置
と、前記異表記知識ベース検索装置による検索結果を出
力する表示装置とを有えたことを特徴とする辞書作成支
援装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1146362A JPH0310369A (ja) | 1989-06-07 | 1989-06-07 | 辞書作成支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1146362A JPH0310369A (ja) | 1989-06-07 | 1989-06-07 | 辞書作成支援装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0310369A true JPH0310369A (ja) | 1991-01-17 |
Family
ID=15406005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1146362A Pending JPH0310369A (ja) | 1989-06-07 | 1989-06-07 | 辞書作成支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0310369A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5720255A (en) * | 1994-02-14 | 1998-02-24 | Yamaha Hatsudoki Kabushiki Kaisha | Control valve for multi-valve engine |
-
1989
- 1989-06-07 JP JP1146362A patent/JPH0310369A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5720255A (en) * | 1994-02-14 | 1998-02-24 | Yamaha Hatsudoki Kabushiki Kaisha | Control valve for multi-valve engine |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPWO2002101578A1 (ja) | スペースの自動生成によって文章入力を支援するシステム | |
JPH0310369A (ja) | 辞書作成支援装置 | |
JP2595934B2 (ja) | 仮名漢字変換処理装置 | |
JPH05233716A (ja) | 自動属性判定方式 | |
JP2792147B2 (ja) | 文字処理方法およびその装置 | |
JP3343941B2 (ja) | 例文検索システム | |
JP2621999B2 (ja) | 文書処理装置 | |
JP3382257B2 (ja) | 文字処理装置及びその方法 | |
JP2737662B2 (ja) | 外国語キーワード文献検索処理装置 | |
JP3187671B2 (ja) | 電子辞書表示装置 | |
JPH08221443A (ja) | 漢字を含むテキストの検索方法及び装置 | |
JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
JPS613267A (ja) | 仮名漢字変換処理装置 | |
JPH0696117A (ja) | 文書変更支援システム | |
JP3305343B2 (ja) | 辞書編集装置 | |
JPH0523458B2 (ja) | ||
JPH02136970A (ja) | 英単語検索装置 | |
JPH0512251A (ja) | 文書処理装置 | |
JPS60112175A (ja) | 仮名漢字変換装置における略称語変換方式 | |
JPH0460754A (ja) | 仮名漢字変換方法 | |
JPH05225183A (ja) | 日本文単語誤り自動検出装置 | |
JPH0567146A (ja) | データ編集装置 | |
JPH07249035A (ja) | 仮名漢字変換装置及び方法 | |
JPH0727526B2 (ja) | かな漢字変換装置 | |
JPH02309448A (ja) | 誤り検出装置 |