JPS615369A - かな漢字変換用辞書 - Google Patents

かな漢字変換用辞書

Info

Publication number
JPS615369A
JPS615369A JP59124967A JP12496784A JPS615369A JP S615369 A JPS615369 A JP S615369A JP 59124967 A JP59124967 A JP 59124967A JP 12496784 A JP12496784 A JP 12496784A JP S615369 A JPS615369 A JP S615369A
Authority
JP
Japan
Prior art keywords
kana
kanji
pointer
character
header
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59124967A
Other languages
English (en)
Inventor
Yasuo Koyama
小山 泰男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Suwa Seikosha KK
Epson Corp
Original Assignee
Seiko Epson Corp
Suwa Seikosha KK
Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp, Suwa Seikosha KK, Epson Corp filed Critical Seiko Epson Corp
Priority to JP59124967A priority Critical patent/JPS615369A/ja
Publication of JPS615369A publication Critical patent/JPS615369A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) 本発明は・かなコードで入力された日本語文章をかな漢
字混じり文に変換して出力する、かな漢字変換の為の辞
書に関する。
(従来技術) 従来のかな漢字変換装置の為の辞書は、第5図の様にか
な見出し部81と漢字表記部82を対にして、固定長デ
ータとして登録するか、あるいは第6図の様にかな見出
し部81と漢字表記部82とを可変長データとして登録
し、データ間にデータの切れ目を認識させるセパレータ
86を置くか、又は第7図の様に最初に辞書項目(かな
見出し部81+漢字表記部82)の長さを示す語長84
を置きその後にかな見出し部81と漢字表記部82を可
変長で登録するか、さらにこれらに対して圧縮手法を駆
動し、圧縮するかという方法が取られてきた。しかし、
これらの方法では、まず語、牽の格納効率がわるく、ま
たそのままでは検索スピードが遅く、この辞書を速くす
る為には、辞書記憶媒体の読み書きの容量゛などを基本
としたブロック分けをおこない、そのブロック単位にイ
ンデックスを付けな(づれはならない等の不都合があっ
た。
(目 的) 本発明はこのような問題に鑑み、かな漢字変換の為の、
高速に検索でき、記憶容量を節約できる辞書構成方法を
提案しその方法を実施する為の装置を提供する事を目的
とする。
(発明の特徴) 本発明の特徴は、漢字表記部の位置を示すポインタを有
する木構造のがな見出し部と、それに対応する漢字表記
を可変長で記憶する漢字表記部を別に備え、さらに第1
文字の位置を示すポインタ・テーブルをもち辞書検索を
高速化するとともに、木構造のかな見出し部を圧縮する
為、同属レベルの位置を示すポインタ及び漢字表記部の
位置を示すポインタを一定の数値で割った値とし、なお
見出し文字データの1部を次のかな見出しが下位レベル
のものであるというフラグとし、下位レベルの位置を示
すポインタをなくし辞書容量を圧縮した点にある。
(実施例) ここで、以下に本発明の詳細を図示した実施例に基づい
て説明する。
第1図は本発明のかな漢字変換用辞書が適用された装置
を示すブロック図である。図中符号1は、入力部2(キ
ーボード等)により入力されたデータに基づき、システ
ム全体のf!ilI御を行なう中央処理装置−である。
入力部2により読み込まれた文字列および制御コードは
、まず入カバノ7アろにたくわえらrlかな漢字変換を
行なう制御コーードにより、かな漢字変換装置6に送ら
れる。
ここでは、文法解析部7において、国語辞89を辞書索
引部8により検索し文法解析を行ない解析データを候補
一時格納部10に格納するとともに第1候補を表示文字
発生部12により表示部4に表示する。オペレータは、
候補表示選択部11の機能により表示部4を見ながら、
希望するかな漢字文字列を選択し、出力・格納部5に格
納する。
また第2図は、本発明のかな漢字変換用の辞書構造を示
したものである◇索引したい文字列の先頭文字により第
ルベル・インデックス21を参照し、第1文字目のかな
見出し部25のかな見出しの位置が確定する。さらに、
索引文字によりかな見出しのポインタをたどり、目的の
位置にまで索引したら、最後のかな見出しの漢字表記ポ
インタにより、漢字表記部22における該当する漢字文
字列の先頭を算出し、指定の格納バッファに格 。
納する。
次に第4図のフローチャートを用いて、本発明のかな漢
字用変換辞書を用いである単語を検索する場合の動作を
説明する。
まず、ポインタの値が1に初期設定される(101)。
次に、ポインタの値と検索しようとしている単語の最大
の文字数が比較され(102) 、ポインタの値が、最
大文字数をこえている場合には、漢字記述部の先頭位置
が調整され(150)、さらに漢字が読み込まれ(15
1)で、処理がおわる。
また、102の処理で、最大文字数以下の場合には、次
に検索される単語の中の1文字とかな見出し部の7−ド
の値が比較され(qa3)、(イ)検索単語の中の1文
字の7−ド〉かな見出し部のメートの場合、 次に・左見出しがあるかが探され(104)、もしあれ
ば、ポインタの値を左へ移動させ(1−05)、その後
再び103の処理にもどる。又、左見出しがない場合に
は、エラー処理(20)をして、処理をおえる。
(ロ)検索単語の中の1文字のノード=かな見出し部の
7−ドの場合、 次に、下かな見出しがあるか探しく106)、ある場合
には検索単語の文字数ポインタの値を1つ増やして(1
07)再び102の処理にもどる。又、下かな見出しが
ない場合にはエラー処理(140)をして処理をおえる
(ハ)検索単語の中の1文字のノード〈かな見出し部の
ノードの場合、 この場合には、すぐエラー処理(140)をして処理を
おえる。
なお、第3図はかな見出し部23の内容と漢字表記i2
2の内容を図示したものである0かな見出し部26は、
1文字の見出し230があり、同時にこれに第2図の下
方向のデータの有無を示すフラグが付いている。また左
方向のポインタ251と漢字部ポインタ232は、デー
タ量を圧縮する為、後にアドレスを計算できるある整数
で割った値となっている。また、漢字表記部22は、漢
字表記文字220の他に文法情報221と同音異鈴語が
その後に継続するかの7ラグ222を持っている。
(効 果) 以上説明した様に本発明によれば、次の効果がある。
(1)木構造にチェイニングされている上に第1文字検
索用のインデックスを持っている為、辞書読みの回数が
少なく検索スピードが速い。
(2)木構造のかな見出し部を圧縮している為、辞書容
量が圧縮できる。
【図面の簡単な説明】
第1図は本発明のかな漢字変換用辞書を用いた装置の概
略を示す機能ブロック図である。 第2図は、本発明のかな漢字変換用辞書の概略を示す図
である。 第3図は、本発明のかな漢字変換用辞書のかな見出し部
と漢字表記部の内容を示す図である。 第4図は本発明のかな漢字変換用辞書を用いて、ある単
語を検索する場合の処理フローチャートである〇 第5図は、かな見出し部と漢字表記部が固定長でもたれ
る国語辞書の例を示す図である。 第6図はかな見出し部と漢字表記部が可変長で    
4もたれセパレータで分割された国語辞書の例を示す図
である。 第7図はかな見出し部と漢字表記部が可変長でもたれ、
その合計文字数をもつ国語辞書の例を示す図である。 22・・・・・漢字表記部 26・・・・・・かな見出し部 以  上

Claims (2)

    【特許請求の範囲】
  1. (1)かなで入力された文字列を、漢字かな混じり文に
    変換する為の辞書において、漢字表記部の位置を示すポ
    インタを有する木構造のかな見出し部と、それに対応す
    る漢字表記を可変長で記憶する漢字表記部を別に備える
    構造とすると共に、同属レベルの位置を示すポインタ及
    び漢字表記部の位置を示すポインタを一定の数値で割っ
    た値とし、なお見出し文字データの1部を次のかな見出
    しが下位レベルのものであるというフラグとし、下位レ
    ベルの位置を示すポインタをなくした事を特徴とするか
    な漢字変換用辞書。
  2. (2)かなで入力された文字列を、漢字かな混じり文に
    変換する為の辞書において、漢字表記部の位置を示すポ
    インタを有する木構造のかな見出し部と、それに対応す
    る漢字表記を可変長で記憶する漢字表記部を別に備える
    構造を有し、さらに、最高レベルであるかな見出し第1
    文字の位置を示すポインタ・テーブルを有する事を特徴
    とするかな漢字変換用辞書。
JP59124967A 1984-06-18 1984-06-18 かな漢字変換用辞書 Pending JPS615369A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59124967A JPS615369A (ja) 1984-06-18 1984-06-18 かな漢字変換用辞書

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59124967A JPS615369A (ja) 1984-06-18 1984-06-18 かな漢字変換用辞書

Publications (1)

Publication Number Publication Date
JPS615369A true JPS615369A (ja) 1986-01-11

Family

ID=14898645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59124967A Pending JPS615369A (ja) 1984-06-18 1984-06-18 かな漢字変換用辞書

Country Status (1)

Country Link
JP (1) JPS615369A (ja)

Similar Documents

Publication Publication Date Title
US5655129A (en) Character-string retrieval system and method
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
JP2929963B2 (ja) 文書検索装置および単語索引作成方法および文書検索方法
GB2259596A (en) Compressed language dictionary
US20040225497A1 (en) Compressed yet quickly searchable digital textual data format
KR100288144B1 (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
JPS615369A (ja) かな漢字変換用辞書
US20020116358A1 (en) Method to reduce storage requirements when storing semi-redundant information in a database
JP2785168B2 (ja) 単語検索のための電子辞書圧縮方法及び装置
JPH0140372B2 (ja)
JPH0140370B2 (ja)
JPH07152756A (ja) 文書処理装置
JPH0227423A (ja) 日本語文字データの並び換え方法
JPS6389976A (ja) 言語解析装置
JPS62214468A (ja) かな漢字変換装置
JPH03282961A (ja) 相互変換辞書方式
JP2738386B2 (ja) 仮名漢字変換装置
JPH06161995A (ja) 氏名データ整形方法および装置
JPH01181154A (ja) かな漢字変換装置
JPH0140371B2 (ja)
JPH04671A (ja) 電子辞書の検索方式
JPS6198475A (ja) 日本語文章入力装置
JPS6243769A (ja) 仮名漢字変換装置
JPH06332666A (ja) データの圧縮方法
JPS6293746A (ja) カナ漢字変換用辞書