JP3305343B2 - 辞書編集装置 - Google Patents

辞書編集装置

Info

Publication number
JP3305343B2
JP3305343B2 JP34308891A JP34308891A JP3305343B2 JP 3305343 B2 JP3305343 B2 JP 3305343B2 JP 34308891 A JP34308891 A JP 34308891A JP 34308891 A JP34308891 A JP 34308891A JP 3305343 B2 JP3305343 B2 JP 3305343B2
Authority
JP
Japan
Prior art keywords
heading
input
dictionary
word data
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34308891A
Other languages
English (en)
Other versions
JPH05174010A (ja
Inventor
勇之 相川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP34308891A priority Critical patent/JP3305343B2/ja
Publication of JPH05174010A publication Critical patent/JPH05174010A/ja
Application granted granted Critical
Publication of JP3305343B2 publication Critical patent/JP3305343B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、自然言語処理用辞書
を編集する辞書編集装置に関するものである。
【0002】
【従来の技術】自然言語処理において、表記の揺れは辞
書のメモリ効率、メンテナンス効率を落とす原因となっ
ている。表記の揺れを吸収する方法がある。
【0003】図4は例えば「カタカナ異表記処理」(情
報処理学会第38回全国大会P.351)に示された異
表記処理方式のアルゴリズムである。1で従来通り辞書
を検索し、2で検索できたかどうかを判定し、検索でき
なかった場合に、4で異表記変換処理により正表記に変
換した後、5で再度正表記にて辞書検索を行なう。
【0004】
【発明が解決しようとする課題】従来の異表記処理方式
によれば、異表記変換処理の対象は、内容の変化しない
静的データを格納した辞書のみで、内容が随時変化する
ユーザ辞書など動的データを格納した辞書に異表記処理
は適用されなかった。そのため、利用者が、辞書登録を
行なう場合、数多くの異表記見出しをすべて登録する必
要があり、メモリ効率、メンテナンス効率の悪さといっ
た問題点があった。
【0005】この発明は、上記のような問題点を解消す
るためになされたもので、動的データを格納した辞書に
対しても異表記変換処理によって表記の揺れを吸収でき
るように、自然言語処理用辞書を編集できる辞書編集装
置を得ることを目的とする。
【0006】
【課題を解決するための手段】この発明に係る辞書編集
装置は、単語データ、該単語データに対応する入力見出
し、および上記単語データに対応する検索キーとなる正
規化見出しを格納する自然言語処理用辞書と、単語デー
タおよび入力見出しを入力する入力装置と、入力見出し
を表記変換規則に基づいて正規化見出しに変換する変換
手段と、該正規化見出しが上記自然言語処理用辞書に
登録の場合、正規化見出し、単語データおよび入力見出
しを上記自然言語処理用辞書に登録する登録手段と、
登録の場合は、該正規化見出しに対応する入力見出しが
登録されているか否かを判定する判定手段と、入力見出
しが既登録の場合は、新たに入力された単語データと
ージし、入力見出しが未登録の場合は、既登録入力見出
しと比べ、異表記であると判定する信号を入力し、新た
に入力された単語データをマージする単語データマージ
手段と、前記単語データをマージした後、前記自然言語
辞書における正規化見出しを検索キーとして更新し、前
記自然言語辞書に登録する更新手段とから構成される編
集装置とからなるものである。ものである。
【0007】
【作用】この発明における辞書編集装置は、表記の揺れ
を吸収したメモリ効率、メンテナンス効率のよい辞書作
成を可能とする。
【0008】また、動的データを格納した辞書に対して
も異表記変換処理を実行できるため、処理できる入力文
の範囲が広げられる。
【0009】
【実施例】実施例1 以下、この発明の一実施例を図について説明する。図1
におぴて、1は自然言語処理用の単語データを格納した
辞書、2はこの発明による編集装置で、表記変換規則
5、単語データマージ手段6を備えている。3は表示装
置、4は入力装置である。
【0010】図2は、辞書1に格納されるデータの形式
を示している。入力見出し7及び単語データ9は、入力
装置4より入力される。入力見出し7は表記変換規則5
により正規化見出し8に変換される。このとき、表示装
置3には、入力見出し7及び単語データが表示されてお
り、正規化見出しは利用者には見えない。
【0011】図3は、単語データを辞書に登録するとき
の手順を示したフローチャートである。ステップ10で
単語データ9及び入力見出し7が入力される。ステップ
11で表記変換規則5により正規化見出し8に変換され
る。ステップ12で正規化見出し8を辞書1から検索す
る。
【0012】正規化見出し8が未登録であれば、ステッ
プ17で図2に示したデータを辞書1に格納する。正規
化見出し8が既登録であれば、辞書1より得られたデー
タ中の入力見出しフィールドに、入力見出しが含まれ
ているかどうかをステップ13にて判定する。
【0013】入力見出し7が、既登録データ中の入力見
出しフィールドに含まれている場合、既登録語の単語デ
ータと入力された単語データとを単語データマージ手段
6によりマージしてから更新手段により正規化見出しを
検索キーとして更新し、上記自然言語処理用辞書1に登
録する。
【0014】入力見出し7が、既登録データ中の入力見
出しフィールドに含まれていない場合、入力見出し7が
既登録データの異表記であるかを、表示装置3に質問文
を表示することにより、利用者に問い合わせる。利用者
が回答を入力装置4により編集装置2に入力すると、ス
テップ14にて回答がYESかNOかを判定し、YESの場合
は、既登録語と入力された単語データとを単語データマ
ージ手段6によりマージし上記自然言語処理用辞書1に
おける正規化見出しを検索キーとして更新する。
【0015】
【発明の効果】以上のように、この発明によれば、利用
者は表記の揺れを意識せず単語データを登録でき、異表
記見出しをすべて辞書に登録する必要はないので、メモ
リ効率、メンテナンス効率の向上が図れる。
【図面の簡単な説明】
【図1】この発明の一実施例を示す構成図である。
【図2】辞書に登録されるデータ形式を示す説明図であ
る。
【図3】この発明における単語登録の手順を示すフロー
チャートである。
【図4】従来の異表記処理方式を示すフローチャートで
ある。
【符号の説明】
1 自然言語処理用辞書 2 編集装置 3 表示装置 4 入力装置 5 表記変換規則 6 単語データマージ手段 7 入力見出し 8 正規化見出し

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 単語データ、該単語データに対応する入
    力見出し、および上記単語データに対応する検索キーと
    なる正規化見出しを格納する自然言語処理用辞書と、単
    語データおよび入力見出しを入力する入力装置と、入力
    見出しを表記変換規則に基づいて正規化見出しに変換
    る変換手段と、該正規化見出しが上記自然言語処理用辞
    書に登録の場合、正規化見出し、単語データおよび入
    力見出しを上記自然言語処理用辞書に登録する登録手段
    と、既登録の場合は、該正規化見出しに対応する入力見
    出しが登録されているか否かを判定する判定手段と、入
    力見出しが既登録の場合は、新たに入力された単語デー
    をマージし、入力見出しが未登録の場合は、既登録入
    力見出しと比べ、異表記であると判定する信号を入力
    し、新たに入力された単語データをマージする単語デー
    タマージ手段と、前記単語データをマージした後、前記
    自然言語処理用辞書における正規化見出しを検索キーと
    して更新し前記自然言語処理用辞書に登録する更新手段
    とから構成される編集装置とからなる辞書編集装置。
JP34308891A 1991-12-25 1991-12-25 辞書編集装置 Expired - Fee Related JP3305343B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34308891A JP3305343B2 (ja) 1991-12-25 1991-12-25 辞書編集装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34308891A JP3305343B2 (ja) 1991-12-25 1991-12-25 辞書編集装置

Publications (2)

Publication Number Publication Date
JPH05174010A JPH05174010A (ja) 1993-07-13
JP3305343B2 true JP3305343B2 (ja) 2002-07-22

Family

ID=18358851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34308891A Expired - Fee Related JP3305343B2 (ja) 1991-12-25 1991-12-25 辞書編集装置

Country Status (1)

Country Link
JP (1) JP3305343B2 (ja)

Also Published As

Publication number Publication date
JPH05174010A (ja) 1993-07-13

Similar Documents

Publication Publication Date Title
JPS58192173A (ja) 機械翻訳装置
JP3305343B2 (ja) 辞書編集装置
JPS595335A (ja) 日本語入力装置
JPS58123126A (ja) 辞書検索装置
JP3164086B2 (ja) 手書き文字フォント作成方法及びそれを適用した手書き文字情報処理装置
JP3028104B2 (ja) 文章処理装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JP2988046B2 (ja) かな漢字変換装置
JP3118880B2 (ja) 日本語文章処理装置
JPH07192014A (ja) 日本語活用形吸収機構つき辞書検索装置
JPH0685169B2 (ja) 文書処理方式
JP2000194389A (ja) 情報処理装置
JPH05298374A (ja) デジタル複写機
JPH0554145B2 (ja)
JPH0460754A (ja) 仮名漢字変換方法
JPH01197876A (ja) 電子辞書
JPH03217997A (ja) 文書処理装置
JPH08263472A (ja) 文章検索方法及び装置
JPS62180465A (ja) 仮名漢字変換方式
JPH07105232A (ja) 文字列検索方法
JPH01205371A (ja) 仮名漢字変換装置
JPS60217452A (ja) 日本語入力処理装置
JPH05197752A (ja) 機械翻訳装置
JPS62140165A (ja) 仮名漢字変換方式
JPS62117064A (ja) 漢字かな変換装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080510

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090510

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees