JP2628775B2 - 辞書作成装置 - Google Patents

辞書作成装置

Info

Publication number
JP2628775B2
JP2628775B2 JP2131068A JP13106890A JP2628775B2 JP 2628775 B2 JP2628775 B2 JP 2628775B2 JP 2131068 A JP2131068 A JP 2131068A JP 13106890 A JP13106890 A JP 13106890A JP 2628775 B2 JP2628775 B2 JP 2628775B2
Authority
JP
Japan
Prior art keywords
dictionary
reading
word
kanji
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2131068A
Other languages
English (en)
Other versions
JPH0425966A (ja
Inventor
芳史 大山
賢治 今村
恒昭 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2131068A priority Critical patent/JP2628775B2/ja
Publication of JPH0425966A publication Critical patent/JPH0425966A/ja
Application granted granted Critical
Publication of JP2628775B2 publication Critical patent/JP2628775B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、読みが困難な語に対して、一般に知られた
単語の読みや漢字の読みおよび漢字を構成する部分の読
みを付与することにより、オペレータが容易にカナ漢字
変換で漢字を入力できるようにするための辞書を自動的
に作成する装置に関するものである。
〔従来技術〕
従来、ワープロ等のシステムにおいて、システムに組
み込まれた辞書(システム辞書)およびユーザが作成す
るユーザ辞書(個人辞書)を組み合わせてカナ漢字変換
を提供するものがある。例えば、日本語エディタ(JEDI
/LEIA)〔日本語ユーティリティ利用者の手引き(AA-A1
14G-TE-JO)昭和63年8月第7版発行,日本ディジタル
イクイップメント株式会社〕に開示されている。
〔発明が解決しようとする課題〕
しかしながら、固有名詞や専門用語が多いデータを入
力する場合、システム辞書では語が不足し、また、ユー
ザ辞書を利用する場合、正しい読みまたは専門的な読み
をあらかじめユーザ辞書に登録することはできても、正
しい読みを知らない人にとっては、読みを最初に覚えて
おかないと入力法の改善とはならないという問題があっ
た。
〔発明が解決しようとする課題〕
本発明は、前記問題点を解決するためになされたもの
であり、その課題は、利用者は、読みが分からない用語
の入力を支援するためのカナ漢字変換辞書を一般的な読
みの組み合わせで自動的に作成することができる技術を
提供することにある。
本発明の他の課題は、ワープロ等に組み込むことによ
り、読みが不明な固有名詞や用語を一文字単位で漢字を
探して投入することなく容易に入力することができる技
術を提供することにある。
本発明の他の課題は、読みが困難な固有名詞または専
門語に対して、誤った入力を低減することができる技術
を提供することにある。
〔課題を解決するための手段〕
前記課題を解決するために、本発明は、辞書をつくる
ための用語の表記を入力する表記入力部と、単語の表記
と読みおよび優先度を収録した単語辞書と、前記入力さ
れた用語の表記を単語辞書を用いてマッチングする単語
マッチング部と、マッチングした単語の表記に対してそ
の読みを生成する単語読み生成部と、漢字の読み,音訓
種別および優先度を収録した漢字辞書と、入力された表
記に対する読みが生成されていない文字に対して、前記
漢字辞書により当て読み用の読みを生成する当て読み生
成部と、漢字の構造上の構造情報と関連する漢字情報を
収録する構造辞書と、該構造辞書にもとづき構造に関す
る読みを作成する構造読み生成部と、該単語読み生成
部、前記当て読み生成部、該構造読み生成部から読み情
報とそれぞれ文字位置情報を一時的に収録するワーク辞
書と、該ワーク辞書のデータをもとに、読み情報の組み
合わせで辞書の読みを生成する辞書登録部と、該辞書登
録部から出力される結果を蓄積するカナ漢字変換辞書と
から構成されることを最も主要な特徴とする。
〔作用〕
前述の手段によれば、固有名詞または専門語の表記を
この装置に入力する。この入力された語を以下では「入
力語」と呼ぶ。つぎに、入力語の表記と単語辞書の語の
表記とのマッチングを行い、完全に一致した場合でかつ
単語辞書の読み方が一般的でかつ読みが、入力されたも
のと異なる場合、一般的な読みで変換辞書ワークに出力
する。(ここで「一般的」とは、辞書に収録されている
優先度の値がある一定値以上のものとする。)これを単
語辞書の同一表記の別の読みに対して繰り返す。表記が
完全に一致するもので一般的な読みのものがなかった場
合は以下の処理を行う。
入力語を単語辞書の語に分割し、その読み方が一般的
な読みの場合には、単語の読みを変換辞書ワークに出力
する。単語に分割できない部分は、漢字辞書による一般
的な当て読みを生成し変換辞書ワークに登録する。さら
に、一般的な当て読みも存在しないときには、その漢字
に類似した漢字に置き換えて、類似の属性情報付きで読
みを生成し、変換辞書ワークに出力する。
これらの読み情報をまとめて、入力語のカナ漢字変換
用の読み情報として、変換辞書に登録データを出力す
る。このとき、登録する読みの組み合わせが1通りしか
なくそれが入力語の読みと等しいときを除いて、カナ漢
字変換辞書として登録する。
このように、一般的な読みを単語辞書,漢字辞書,構
造辞書に登録しておくことで、利用者の希望する読みを
付与した辞書が生成される。これにより利用者はこの辞
書をカナ漢字変換用の辞書として利用することができ、
正しい表記の固有名詞または専門語を入力することが可
能となる。さらに、利用者毎に、既に覚えた単語を単語
辞書に優先度を高くして登録していけばその利用者に合
ったカナ漢字変換用辞書を再構築できることになる。
〔発明の実施例〕
以下、本発明の一実施例を図面を用いて具体的に説明
する。
第1図は、この発明の辞書作成装置の一実施例の概略
構成を示すブロック図である。
本実施例の辞書作成装置は、第1図に示すように、辞
書をつくるための用語の表記を入力する表記入力部1
と、単語の表記と読みおよび優先度を収録した単語辞書
3と、前記入力された用語の表記を単語辞書3を用いて
マッチングする単語マッチング部2と、マッチングした
単語の表記に対してその読みを生成する単語読み生成部
4と、漢字の読み、音訓種別および優先度を収録した漢
字辞書5と、入力された表記に対する読みが生成されて
いない文字に対して、前記漢字辞書5により当て読み用
の読みを生成する当て読み生成部6と、漢字の構造上の
構造情報と関連する漢字情報を収録する構造辞書7と、
該構造辞書7にもとづき構造に関する読みを作成する構
造読み生成部8と、前記単語読み生成部4、当て読み生
成部6、構造読み生成部8からの読み情報とそれぞれ文
字位置情報を一時的に収録するワーク辞書10と、該ワー
ク辞書10のデータをもとに、読み情報の組み合わせで辞
書の読みを生成する辞書登録部9と、該辞書登録部9か
ら出力される結果を蓄積するカナ漢字変換辞書11とから
構成される。
第2図は、前記単語辞書3の内容の一構成例であり、
単語の表記と読みおよび読み毎に付与された優先度から
なる。優先度はある一定以上の値(K)の時に、該当す
る読みを有効とするための情報である。例えば、第2図
で、K=150のとき、「大和」の読み「だいわ」だけが
有効となる。有効な読みがなくなる場合、例えば、第2
図でK=5の時の「留保」は、単語辞書に存在しないの
と同様の働きをする。
第3図は、前記漢字辞書5の内容の一構成例であり、
漢字1文字毎の音読み,訓読みおよび優先度を収録して
いる。この優先度の働きは、該当する読みに対して、第
2図の単語辞書3と同じ働きをする。
第4図は、前記構造辞書7の内容の構成例であり、漢
字の表記の類似性や部首名などの漢字の構成要素情報と
その読みまたは単語辞書へのポインタを収録している。
次に、本実施例の辞書作成装置の動作を説明する。
第1図において、用語の表記は入力部1より入力され
る。入力された表記は、単語マッチング部2で単語辞書
3の表記と照らし合わされ、入力語の表記と同じ表記を
持つ単語辞書の語でかつ優先度があらかじめ決められた
値(例えば5)より大きい場合その単語を抽出し、一致
するものがない場合、入力された表記の先頭文字を開始
点として、単語辞書3の単語の表記を完全に含むもので
最長の語を抽出する。さらに、抽出された残りの文字列
に対して、この単語マッチング部2で、単語辞書3の単
語の表記を完全に含むもので最長のものを抽出する処理
を繰り返す。この処理の結果、入力された文字列には、
単語辞書3の単語と一致する部分と、マッチしなかった
部分の組み合わせとなる。この一致する部分に対して、
単語読み生成部4で、入力語の表記の位置とこの単語辞
書3の読みが対応付けられワーク辞書10に出力される。
前記マッチしなかった部分に対しては、漢字辞書5を
検索し、あらかじめ決められた値(例えば2)より大き
い読みをすべて候補として、当て読み生成部6で生成
し、入力語の表記位置とともにワーク辞書10に出力され
る。
この結果、まだ読みが付いていない文字すべてに対し
て、各々構造辞書7を検索し、構造辞書7に読みが付与
されていれば、その読みを該当する漢字の読みとする。
読みが付与されていない場合、構造辞書7からポイント
される表記の漢字を対象として、当て読み生成部8にも
どり、漢字辞書5を検索して、当て読みの処理を行い、
読みが作成されていなかった漢字毎の読み候補を生成
し、同様にワーク辞書10に出力する。
次に、ワーク辞書10に蓄積された漢字の読み候補を組
み合わせて、辞書登録部9において、ラティス構造また
は読みを展開した形でカナ漢字変換辞書11に蓄積する。
以下に具体例で処理の流れを説明する。
入力として「豊富村(とよとみむら)」が入力された
とする。ここでは、K=5として処理を説明する。
まず、単語マッチング部2で、第2図の単語辞書3を
参照することにより「豊富」の読みが「ほうふ」である
ことから、読みの候補として「豊富(ほうふ)」が生成
され、入力語の文字位置とともにワーク辞書10に出力さ
れる。次に、第3図の漢字辞書から「村」の読み「む
ら」「そん」が候補として出され、それぞれ入力語の位
置情報とともにワーク辞書に出力される。この段階での
ワーク辞書10の内容を第5図に示す。これですべての文
字の読みが付与されたので辞書登録部9へ移り、読みを
展開した形で生成する場合、第6図に示す結果をカナ漢
字変換辞書11へ登録して終了する。
次の例として、「留萌(るもい)」が入力されたとす
る。
まず、単語マッチング部2では該当するものがないた
め、単語マッチング部2および単語読み生成部4の処理
をスキップする。漢字辞書に「留」「萌」があるが、優
先度2以上の情報を抽出するため「留」の「りゅう」
「る」「とめ」が当て読み生成部6で抽出され、位置情
報とともにワーク辞書10に出力される。次に、構造読み
生成部8では、第4図の構造辞書7から「萌」を検索
し、「くさかんむり」と漢字辞書5の「明」へのポイン
タを取得する。この漢字辞書5から「めい」「あかる
い」「あけ」の読みを取得し、ラティス構造で辞書を作
成する場合、最終的に第7図に示すカナ漢字変換辞書11
へ登録して終了する。
また、展開した形で生成する場合には、例えば、音読
み同士,訓読み同士の組み合わせを優先して、出力する
ことも可能である。この場合は、音読み同士では「りゅ
うめい」,「るめい」、また訓読み同士では「とめるあ
かるい」「とめるあけ」が生成される。
以上説明からわかるように、本実施例によれば、一般
的な読みを単語辞書3,漢字辞書5,構造辞書7に登録して
おくことで、利用者の希望する読みを付与した辞書(カ
ナ漢字変換辞書11)が生成される。これにより利用者は
この辞書をカナ漢字変換用の辞書として利用することが
でき、正しい表記の固有名詞または専門語を入力するこ
とが可能となる。
さらに、利用者毎に、既に覚えた単語を単語辞書3に
優先度を高くして登録していけばその利用者に合ったカ
ナ漢字変換用辞書を再構築できることになる。
以上、本発明を実施例にもとづき具体的に説明した
が、本発明は、前記実施例に限定されるものではなく、
その要旨を逸脱しない範囲において種々変更可能であ
る。
〔発明の効果〕
以上、説明したように、本発明によれば、利用者は、
読みが分からない用語の入力を支援するためのカナ漢字
変換辞書を一般的な読みの組み合わせで自動的に作成す
ることができ、ワープロ等に組み込むことにより、読み
が不明な固有名詞や用語を一文字単位で漢字を探して投
入することなく容易に、しかも辞書に存在するため誤っ
た入力を削減することができるという効果がある。
【図面の簡単な説明】
第1図は、この発明の辞書作成装置の一実施例の概略構
成を示すブロック図、 第2図は、第1図の単語辞書の内容の一構成例を示す
図、 第3図は、第1図の漢字辞書の内容の一構成例を示す
図、 第4図は、第1図の構造辞書の内容の構成例を示す図、 第5図は、第1図のワーク辞書の構成例を示す図、 第6図は、第1図に示すカナ漢字変換辞書の展開型の構
成例を示す図、 第7図は、第1図に示すカナ漢字変換辞書のラティス型
の構成例を示す図である。 図中、1……入力部、2……単語マッチング部、3……
単語辞書、4……単語読み生成部、5……漢字辞書、6
……当て読み生成部、7……構造辞書、8……構造読み
生成部、9……辞書登録部、10……ワーク辞書、11……
カナ漢字変換辞書。
フロントページの続き (56)参考文献 特開 昭62−117064(JP,A) 特開 昭62−189569(JP,A) 特開 昭61−54559(JP,A) 特公 昭49−39854(JP,B2)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】辞書をつくるための用語の表記を入力する
    表記入力部と、単語の表記と読みおよび優先度を収録し
    た単語辞書と、前記入力された用語の表記を単語辞書を
    用いてマッチングする単語マッチング部と、マッチング
    した単語の表記に対してその読みを生成する単語読み生
    成部と、漢字の読み,音訓種別および優先度を収録した
    漢字辞書と、入力された表記に対する読みが生成されて
    いない文字に対して、前記漢字辞書により当て読み用の
    読みを生成する当て読み生成部と、漢字の構造上の構造
    情報と関連する漢字情報を収録する構造辞書と、該構造
    辞書にもとづき構造に関する読みを作成する構造読み生
    成部と、前記単語読み生成部,当て読み生成部,構造読
    み生成部からの読み情報とそれぞれ文字位置情報を一時
    的に収録するワーク辞書と、該ワーク辞書のデータをも
    とに、読み情報の組み合わせで辞書の読みを生成する辞
    書登録部と、該辞書登録部から出力される結果を蓄積す
    るカナ漢字変換辞書とから構成されることを特徴とする
    辞書作成装置。
JP2131068A 1990-05-21 1990-05-21 辞書作成装置 Expired - Lifetime JP2628775B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2131068A JP2628775B2 (ja) 1990-05-21 1990-05-21 辞書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2131068A JP2628775B2 (ja) 1990-05-21 1990-05-21 辞書作成装置

Publications (2)

Publication Number Publication Date
JPH0425966A JPH0425966A (ja) 1992-01-29
JP2628775B2 true JP2628775B2 (ja) 1997-07-09

Family

ID=15049253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2131068A Expired - Lifetime JP2628775B2 (ja) 1990-05-21 1990-05-21 辞書作成装置

Country Status (1)

Country Link
JP (1) JP2628775B2 (ja)

Also Published As

Publication number Publication date
JPH0425966A (ja) 1992-01-29

Similar Documents

Publication Publication Date Title
JP2628775B2 (ja) 辞書作成装置
JPH08339376A (ja) 外国語検索装置及び情報検索システム
JP2633978B2 (ja) 仮名漢字変換方法
JP3187671B2 (ja) 電子辞書表示装置
JPH0728845A (ja) 文書検索装置及びその方法
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPS6175954A (ja) 漢字デ−タ入力方式
JPH01185766A (ja) かな漢字変換装置
JPS6243769A (ja) 仮名漢字変換装置
JPH04223550A (ja) 日本語処理装置
JPH0727526B2 (ja) かな漢字変換装置
JPS62189565A (ja) かな漢字変換装置
JPH0567146A (ja) データ編集装置
JPH04263356A (ja) 日本語入力装置
JPH03122768A (ja) 索引付け支援装置
JPH0731675B2 (ja) 仮名漢字相互変換装置
JPH0341551A (ja) 文字入力装置
JPS62271173A (ja) 仮名漢字変換方式
JPH1091627A (ja) 漢字よみがな自動変換方法およびシステム
JPH05282290A (ja) 文章作成支援装置
JPH07287709A (ja) 仮名漢字変換装置
JPS59167737A (ja) かな漢字変換装置
JP2002108878A (ja) 辞書、および検索システム
JPS6210764A (ja) 仮名漢字変換方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 14