JPS6172355A - 仮名漢字変換辞書形式 - Google Patents

仮名漢字変換辞書形式

Info

Publication number
JPS6172355A
JPS6172355A JP59192545A JP19254584A JPS6172355A JP S6172355 A JPS6172355 A JP S6172355A JP 59192545 A JP59192545 A JP 59192545A JP 19254584 A JP19254584 A JP 19254584A JP S6172355 A JPS6172355 A JP S6172355A
Authority
JP
Japan
Prior art keywords
index
page
reading
kana
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59192545A
Other languages
English (en)
Inventor
Toshio Sekiya
磧谷 利夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59192545A priority Critical patent/JPS6172355A/ja
Publication of JPS6172355A publication Critical patent/JPS6172355A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、ホスト型の仮名漢字変換処理に適用できるが
、ホスト型だけに留まらず、スタンドアロン型の仮名漢
字変換処理でも利用できる仮名漢字変換辞書形式に関す
るものである。
〔発明の背景〕
データをその内容から多段インデックス化してアクセス
の効率を上げる手法はよく知られている。本発明は、日
本語の見出し語の長さを調査し、6文字以下の見出し語
を標準的な格納対象とすることで余分な空白文字の入り
込むことを防ぐ方式と日本語の見出しを3段階に分けて
管理する方式を融合させ、仮名漢字変換用辞書のディス
ク容量を最小化することを特長とするものである。
仮名漢字変換用辞書をメモリ上に置いた場合の見出し語
と漢字表記の圧縮に関連するものとして、特開昭57−
55479号がある。
〔発明の目的〕
本発明の目的は、小容量でかつ高速アクセスに耐える仮
名漢字変換用辞書を提供することにある。
〔発明の概要〕
本発明は以下の特徴を有するものである。
t 読みの可変化による容量の圧縮 辞書内の読みの長さは24バイトまでの読みを格納でき
る。しかし、1文字の読みを持つ用語もあり、全ての用
語を24バイトの固定長で持つと無駄が多い。(第2図
参照) また、可変長にすれば読みの前に長さが格納され、読み
を検索する処理が複雑になり実行時の処理時間がかかる
。(第6図参照)そこで、読みの長さの分布を調査した
結果、格納する6万語の87%が6文字以内に収まるこ
とがわかり、6文字を越える読みはオーバフロー領域に
格納する辞書形式を考案し、辞書の小容量化を実現した
。(第4図参照)2.2段階インデックスの採用による
高速アクセス用構造 辞書を2048バイト単位に区切り(区切ったものをペ
ージと呼ぶ)、ページアクセス用に2段階のインデック
スを作成した。
この結果、どの用語の検索に対しても入力動作は1回だ
ゆで済むようになり、高速で辞書をアクセスできるよう
になった。
〔発明の実施例〕
本発明の実施例を第1図により説明する。
辞書は、第1インデックス1.第2インデツメ1   
 クス2.及び本体3から構成される。
第1インデツクス1は、五十音のキーを持ち、第2イン
デツクス2のアドレスを示す。同−音で始まる第2イン
デツクス2が複数個存在するときは、その先頭のアドレ
スを示す。
第2インデツクス2は、本体301ペ一ジ単位のキーと
そのページのアドレスを示す。キーには、ページの先頭
に格納されている用語の読み(6文字)を使用する。
先頭から6文字までが同−読みを持つ用語は、同一ペー
ジ内に格納しているため、第2インデツクスのキーの大
小関係で、検索する用語が格納されているページが判別
できる。
本実施例によれば、辞書容量の圧縮及びアクセス時間の
短縮に効果がある。
〔発明の効果〕
本発明によれば、読みの可変化により、読みの24バイ
ト固定長時の−の容量で同一用語数を格納した辞書がで
きる。
また、辞書のブロック化及び2段階インデックスの採用
により、常に1回の入力動作により希望する用語が検索
できるので、アクセス時間の短縮に効果がある。平均ア
クセス時間では■に短縮できる。
【図面の簡単な説明】
第1図は、本発明の一実施例の小容量の高速アクセス用
仮名漢字変換辞書形式の構成図、第2図は、読みの長さ
を固定長にした場合の様式の説明図、 第3図は、読みの長さを可変長にした場合の様式の説明
図、 第4図は、読みの長さを固定長にし、オーバ70−領域
を併用した様式の説明図である。 1・・・第1インデツクス、 2・・・第2インデツクス、 3・・・本体。

Claims (1)

    【特許請求の範囲】
  1. 1、仮名漢字変換用辞書の読みの可変化による容量圧縮
    と、2段階インデックスの採用による高速アクセス構造
    を持つことを特徴とする仮名漢字変換辞書形式。
JP59192545A 1984-09-17 1984-09-17 仮名漢字変換辞書形式 Pending JPS6172355A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59192545A JPS6172355A (ja) 1984-09-17 1984-09-17 仮名漢字変換辞書形式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59192545A JPS6172355A (ja) 1984-09-17 1984-09-17 仮名漢字変換辞書形式

Publications (1)

Publication Number Publication Date
JPS6172355A true JPS6172355A (ja) 1986-04-14

Family

ID=16293059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59192545A Pending JPS6172355A (ja) 1984-09-17 1984-09-17 仮名漢字変換辞書形式

Country Status (1)

Country Link
JP (1) JPS6172355A (ja)

Similar Documents

Publication Publication Date Title
US5655129A (en) Character-string retrieval system and method
JPS60159970A (ja) 情報蓄積検索方式
US20080133565A1 (en) Device and method for constructing inverted indexes
JP2534600B2 (ja) 文字列照合装置
JP3770919B2 (ja) ファイル処理方法、データ処理装置及び記憶媒体
CN108304384B (zh) 拆词方法及设备
JP2010198425A (ja) 文書管理方法、装置
JPS6172355A (ja) 仮名漢字変換辞書形式
JPH056398A (ja) 文書登録装置及び文書検索装置
JPH0140372B2 (ja)
JP2785168B2 (ja) 単語検索のための電子辞書圧縮方法及び装置
JPH0410104B2 (ja)
JPH07182354A (ja) 電子文書の作成方法
JPH0140370B2 (ja)
JPS6118071A (ja) 辞書検索方式
JPH0752450B2 (ja) 辞書デ−タ検索装置
KR20030006638A (ko) 셀 기반의 고차원 데이터 색인 장치 및 그 방법
Kelly et al. Glossary Lookup Made Easy
JPH03127254A (ja) 単語検索装置
KR930011444B1 (ko) 한글조합형 코드의 변환방법
JPS61255465A (ja) 言語処理装置
JPS5947669A (ja) 辞書検索装置
JPS62197822A (ja) 辞書デ−タ検索方式
JPS6382547A (ja) 日本語辞書デ−タ管理方式
JPH0338772A (ja) 文字コードデータの圧縮方式