JPH0140370B2 - - Google Patents

Info

Publication number
JPH0140370B2
JPH0140370B2 JP56036157A JP3615781A JPH0140370B2 JP H0140370 B2 JPH0140370 B2 JP H0140370B2 JP 56036157 A JP56036157 A JP 56036157A JP 3615781 A JP3615781 A JP 3615781A JP H0140370 B2 JPH0140370 B2 JP H0140370B2
Authority
JP
Japan
Prior art keywords
kana
kanji
word
characters
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56036157A
Other languages
English (en)
Other versions
JPS57150070A (en
Inventor
Hitoshi Suzuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP56036157A priority Critical patent/JPS57150070A/ja
Publication of JPS57150070A publication Critical patent/JPS57150070A/ja
Publication of JPH0140370B2 publication Critical patent/JPH0140370B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 本発明は文字の発音に従つてカナキーボードか
らカナ文字で入力し、漢字又は漢字カナ混じり文
を出力するように和文ワードプロセツサに係り、
特にカナ―漢字変換を行うための辞書に関するも
のである。
その目的とするところはカナ―漢字変換用辞書
のメモリ容量を縮小できるようフアイル容量を圧
縮するための技法にあり、圧縮辞書を提供するも
のである。
一般にカナ―漢字変換用辞書の語数は装置のレ
ベルによつて様々であるが、市販の国語辞典をみ
てみると小型のもので2〜3万語、中型で5〜7
万語、大型では10万語以上を収容している。この
場合、1語の語長は長いものでカナ見出し14文
字、漢字表記部6文字程度である。
この様な語を一般的な固定長形式でメモリに収
容して辞書を作成すると、第1図に示す様な辞書
10(メモリ)になる。つまり、各語はカナ見出
し部分11と漢字表記部12から構成される。
そして、カナ文字は7ビツトで表わされると共
に8ビツト目を漢字と区別するために“1”とし
て、カナ1文字を1バイト必要とする。また漢字
コード(JIS―6226)は7ビツト×2で表わすと
共にこの各8ビツト目を“0”としてカナと区別
し、結局2バイト必要とする。
従つて、カナ見出し部分11は14文字分で14バ
イト必要とし、漢字表記部12は6文字分で12バ
イト必要とする。このため例えば4万語の辞書1
0を作成すると、(14バイト+12バイト)×4万語
=1Mバイトとなり、この辞書10は約1Mバイト
もの容量を必要とする。
また、前記カナ見出し及び漢字表記の他に、品
詞や活用形等の文法情報さらには出現頻度情報等
も含めるとメモリ容量は常に大きなものになる。
この様に辞書フアイルが大容量になるとデイス
ク等の外部記憶装置が必要となるばかりか、入力
装置全体が大きくなると共に装置の価格も上昇す
る。しかもこのフアイルのアクセスタイムも長く
なつて処理スピードにも影響がある。
他方、上記の様な辞書フアイルのメモリ容量を
圧縮する方法として、第1図の如く1語当りのメ
モリ領域を固定長せず、第2図に示す様にカナ見
出しと漢字表記の長さに夫々合せてメモリ領域を
とる可変長構造にする方式が提案されている。
この方式では第2図Aに示す如く、1語は語長
部分21とカナ見出し部22と漢字表記部23か
ら構成され、この語長部分21はカナ見出しと漢
字表記部の総バイト数を記憶するところである。
第2図Bに示す如く各語つまり“あ”、“あい”、
“あいうち”等はその文字数に応じてカナ見出し
部22と漢字表記部23の容量が夫々可変され
る。
この可変構造の方式におけるカナ見出し部22
の平均が約4バイト、漢字表記部23の平均が約
4.5バイトであり、そして語長部分21として1
バイトが必要であり、結局4万語の辞書を作成す
る場合に、 (4バイト+4.5バイト+1バイト)×4万語=
380Kバイト となり、約380Kバイトもの容量が必要である。
この可変長構造の方式では上述した固定長方式
に比して容量が縮少されるが、しかしこれでもま
た大容量のメモリを必要とし、辞書の大容量化を
避けることができない。
上述の様な問題点に鑑み、本発明は上記固定長
方式や可変長構造の方式よりフアイル容量を小さ
くできる圧縮技法を提案するものである。
以下本発明について説明するが、初めに基本的
なカナ―漢字変換の方式について第3図を用いて
説明する。
31はカナ―キーボードであり、第4図にて更
に詳細に示している様に50音のカナキー群31A
と漢字変換指示を行う変換キー31Bと漢字変換
された時に同音語の漢字が複数ある場合にその中
から特定のものを選択する選択キー31Cを備え
ている。
前記カナキーボード31より入力されたカナ文
字列はCPU32を介して入力文バツフア33へ
一旦導入される。ここで前記した変換キー31B
が押圧操作されると、CPU32が処理プログラ
ム装置34のプログラムに従つて辞書35を検索
して漢字変換を行う。
この辞書35は第1図或は第2図で示した様な
自立語の辞書フアイル35Aと文法情報テーブル
35Bを備えている。この自立語の辞書フアイル
35Aは第2図Aに示した様に語長部、カナ見出
し部、漢字表記部から構成されたフオーマツトに
なつている。
従つて、入力文バツフア33に例えば「あいが
ん」と導入された場合には、処理プログラムに従
つて自立語の辞書フアイル35Aを検索し、該フ
アイル35Aのカナ見出し部の「あいがん」と同
じカナ見出しを見つけた後その漢字表記部の内容
「哀願」を検索該当バツフア36へ取出す。この
時、同音語がある場合にはそれも該バツフア36
へ取出される。
そして、CPU32は検索該当バツフア36に
取出された第1番目の漢字を出力装置38に表示
する。同音語が複数個ある場合には順次バツフア
36から第2番目、第3番目の漢字を出力装置3
8へ呼び出し、同音選択キー31Cによつて漢字
を特定するとCPU32によつて特定された漢字
情報が出力文バツフア37へ転送される。その
後、CPU32は入力文バツフアメモリ33と検
索該当バツフアメモリ36を初期化してキーボー
ド31より次のカナ入力の待状態となる。
なお、同音語が複数存在する時にはそれら同音
語を一度に番号を付して表示し、その番号を選択
することで同音語の選択ができる。また、上記し
た文法情報テーブル35Bは一般の文章を対象に
する場合に活用する語(動詞、形容詞、形容動詞
等)や付属語(助詞、助動詞等)についても処理
する必要がある場合に用いるものである。
以上の様な動作でカナ―漢字変換が行なわれる
が、本発明は上記した辞書35つまり自立語の辞
書フアイル35Aを圧縮することにある。
(1) カナ見出し部の圧縮 自立語辞書のカナ見出しをJISコード順(JIS
―6226の下位バイトの降順)に並べてみると、
例えば第1図のカナ見出し部のようになる。こ
れを見ると大半の見出しが前見出しの一部と重
複していることがわかる。例えば、「あい」は
前見出しの「あ」と1文字重複しているし、
「あいうち」は前見出しの「あい」と2文字重
複している。さらに「あいがん」(愛玩)は
「あいがん」(哀願)と4文字も重複している。
このことを利用してカナ見出し部のメモリ圧縮
を図つたのが本発明にかかわる第5図の差分構
造辞書である。
この差分構造辞書の各語のフオーマツトは第
5図Aに示す如く、先頭に前見出し語との重複
文字数を示す重複文字数領域51を3ビツト構
成で設けている。この3ビツトで表わされる最
大数は7であるから重複文字数は7文字まで可
能であり、重複文字数が7文字を越えること殆
んどない。
また、前記重複文字数領域51に続く5ビツ
トをカナ見出し部と漢字表記部の総バイト数を
表わす語長領域52に設け、これは次のカナ見
出し語の先頭アドレスを演算するのに用いる。
この5ビツトで表わせる最大数は31であるか
ら、第1図に示した固定長の場合の1語当りの
総バイト数26バイト(カナ見出し部14バイト,
漢字表記部12バイト)を充分満足するものとな
つている。
次に前記語長領域52に続いてカナ見出し部
53が設けれる。このカナ見出し部53は前の
カナ見出し部の語との重複部を除いた残りの文
字を収容する。そして前記カナ見出し部53に
続いて漢字表記部54が設けられる。
第5図Bに差分構造辞書を示しており、例え
ば第4語の「あいうち」の場合、前見出し(第
3語)が「あい」であるから、重複文字数領域
51に“2”が保持され、この重複文字「あい
ぃを除いた「うち」だけがカナ見出し部53に
収容される。また、第8語目の「あいがん」は
前の見出し(第7語目)も「あいがん」であつ
てすべてのカナ文字が重複する。このため、重
複文字数領域51が“4”となり、カナ見出し
部53は不要となつている。
前記カナ見出し部53のカナ文字コードは上
述した様に7ビツトで表わされると共に8ビツ
ト目を漢字と区別するためのビツトとなして1
文字を1バイトで構成している。
この様に一連の自立語列の中で1つ前の語の
カナ文字と重複する部分をカナ文字コードを使
わずに重複文字数で表わし、重複しない文字だ
けカナ見出し部53にカナ文字コードで保持さ
せる構成とすることにより、約2万語の辞書を
圧縮した結果、カナ見出し部53の平均は約
1.3バイト(固定長形式14バイト、可変長方式
平均4バイト)となり、重複文字数領域51の
3ビツトを含めても、大幅な圧縮が可能とな
る。
なお、もし重複文字数が7文字をオーバーす
ることがある場合にはそのオーバーした文字を
カナ見出し部53に収容すればよい。
(2) 漢字表記部の圧縮 漢字表記部54は漢字だけでなくカナ文字を
含む場合も多く、例えば「いい加減」、「言いぐ
さ」等である。この漢字コードは上述した様に
JIS―6226では1文字を2バイトで表わすよう
になつているので、前記4文字からなる例のも
のでは8バイト必要となる。
しかし、この漢字表記部54に含まれるカナ
文字部分はカナ見出し部53と同じであるか
ら、文字数だけを1バイトで示せば全体を復元
できる。
即ち、前記例示した「いい加減」及び「言い
ぐさ」をコードで表わすと、 となる。つまり「いい加減」では前の2文字が
カナであるのでその文字数“02”(16進)であ
り、漢字の“加”のコードの上位と下位が3243
(16進)でありまた“減”のコードが383A
(16進)である。
従つて、この漢字表記部53は前記「いい加
減」の例では上記表の如く5バイトで収容で
き、「言いぐさ」の例では3バイトで収容でき、
今まで4文字で8ビツト必要としていたものに
比して大きく圧縮できる。
この場合、JIS―6226の漢字コードは第6図
に示す様なコード表となつており、Aの部分が
カナ、英数、記号の領域、Bの部分が第1水準
漢字(2965字)の領域、Cの部分が第2水準漢
字(3384字)の領域となつている。
この第6図から分るように漢字コードは上位
(第1バイト)と下位(第2バイト)とも21
〜7E(16進)の範囲であり、漢字と共に附さ
れるカナ文字数が“20”(16進)つまり32文字
以下なら上記漢字コード21〜7F(16進)と
区別することができる。
このため、この漢字表記部54の内容を復元
する場合には第7図に示す様に、「いい加減」
の例において、カナ見出し部53と漢字表記部
54があり、この漢字表記部54の“20”(16
進)以下の部分を検出し、最初の1バイトのブ
ロツク53Aが“20”以下であるところから最
初がカナ文字であつてカナ見出し部53の最初
の文字を参照する必要がある。そしてブロツク
53Aは“02”で文字数として2文字参照しな
さいと言うことであり、カナ見出し部53の最
初から2文字分参照してそのカナコード“24”
を持つてくる。この時、漢字コードは2バイト
で表わす必要があるので、上位バイトはカナ領
域を示すコード“24”を附すと共にその下位バ
イトに前記参照カナコード“24”を付ける。
そのため“い”は「24 24」で表わされ、従
つて「いい加減」は に復元されて検索該当バツフア36へ転送され
る。
この様に漢字表記部54を、この漢字の接頭
及び接尾に含まれるカナ文字を文字数で表わ
し、漢字のみ漢字コードで表わして構成するこ
とにより、約2万語の辞書を圧縮した結果、該
漢字表記部54の1語平均は約3.7バイト(固
定長形式12バイト、可変長方式平均4.5バイト)
となり、上記固定長、可変長方式より圧縮する
ことができる。
従つて、第5図Aに示した差分構造辞書のフ
オーマツト構成では、重複文字数領域51が3
ビツト、語長領域52が5ビツト、カナ見出し
部53が平均1.3バイト、漢字表記部54が平
均3.7バイトで合計平均6バイトである。
このため、例えば4万語の辞書を作成した合
には、約240Kバイトでよく、従来の固定長と
可変方式では夫々1Kバイト、380Kバイト必要
としていたものに比して大幅に縮小することが
できる。また、その様な固定長や可変長方式よ
りも検索時間が短縮できるのみならず、フアイ
ル容量が小さくなれば半導体メリの使用も可能
になり、入力装置の小型化・低価格化を一層増
進することができる。
(3) 圧縮辞書の検索方法 第8図にこの圧縮辞書を用いた検索方法そし
て第9図にその動作フローを示し、特に第3図
のカナ―漢字変換の装置における一部を取り出
して詳細に示したものである。従つて、第3図
と同一部分は同符号をもつて示している。ま
た、第9図のN1〜N22はフローの各ステツプを
示す。
第8図において32はCPU,33は入力文
バツフアであつて入力情報として「あいきよ
う」と入力され、またその後にENDマーク3
3Aが入力されている。35Aは自立語の辞書
フアイルであり、第5図に示す様な構成となつ
ている。34は処理プログラム装置、36は検
索該当バツフアメモリである。
そして、CPU32内には各種レジスタが備
えられており、先ず自立語辞書ワードスタート
アドレスレジスタ2―1は自立語辞書35Aの
現在参照している語のスタートアドレスを記憶
するレジスタである。自立語辞書カレントアド
レスレジスタ2―2は、自立語辞書35の現在
参照している語の中の現在示している位置アレ
スが入つている。自立語辞書語長レジスタ2―
3は、自立語辞書35Aに書かれている現在参
照している語の語長すなわち、カナ見出し部と
漢字表記部の総バイト数を入れるレジスタであ
る。重複文字数レジスタ2―3は自立語辞書3
5Aに書かれている現在参照している語の重複
文字数、すなわち現在参照している語と、1つ
前の語とのカナ見出しの重複文字数を入れるレ
ジスタである。入力文バツフアカレントアドレ
スレジスタ2―5は、入力文バツフアメモリ3
3の現在示しているアドレスが入つている。
入力文バツフア文字ポイン2―6は、入力文
バツフアカレントアドレスレスタ2―5が入力
文バツフアの何文字目を指しているかを示す。
入力文1文字レジスタ2―7は自立語辞書のカ
ナ見出しと比較するために入力文の1文字をと
つてくる為のレジスタであり、同様にカナ見出
し1文字レジスタ2―8は、入力文と比較する
為に自立語辞書35Aのカナ見出し1文字を入
れるレジスタである。ALU2―9は演算比較
装置である。
次に例として、入力文が「あいきよう」であ
る場合によいて説明する。
まず、自立語辞書ワードスタートアドレスレ
ジレタ2―1と、自立語辞書カレントアドレス
レジスタ2―2に、自立語辞書35Aの先頭ア
ドレスをセツトする。又、入力文バツフアカレ
ントアドレスレジスタ2―5には文字文バツフ
アの先頭アドレスを、入力文バツフア文字ポイ
ンタ2―6には「1」をそれぞれセツトする。
次に、入力文1文字目と、自立語辞書第1語
のカナ見出し1文字目を比較する(第5図参
照)。いずれも「あ」で等しいので、続いて2
文字目を比較するが、自立語辞書第1語のカナ
見出し2文字目は存在しないので、自立語辞書
は第2語目に進める。第2語目のアドレスを演
算するために、自立語辞書ワードスタートアド
レスレジスタ2―1と自立語辞書語長レジスタ
2―3の内容を加えたものにさらに1を加え、
自立語辞書ワードスタートアドレスレジスタ2
―1と自立語辞書カレントアドレスレジスタ2
―2に入れる。
自立語辞書第2語目は重複文字数1であるか
らカナ見出しは2文字目から始まる。これを入
力文2文字目と比較するといずれも「い」で等
しいので3文字目に進む。自立語辞書の第2語
目、第3語目とも3文字目はないので第4語目
で初めて3文字目を比較する。入力文3文字目
は「き」、自立語辞書は「う」で異なる。
第5語目は第4語目と同様で、第6語目は重
複文字数が3なのでカナ見出しと比較すること
なく次の語に進める。第7語目は第4語目と同
様で、第8語目は第5語目と同様。第9語目は
重複文字数が再び2となり、カナ見出しが3文
字目から始まる。3文字目、4文字目、5文字
目いずれも入力文と等しく、6文字目は入力
文、自立語辞書共に存在しないので、第9語目
(愛嬌)が該当したことになる。第9語目の漢
字表記部を該当バツフア36に転送した後他に
同音語がないかを調べるためにさらに次の語に
進める。
ここで、もしカナ見出し部が存在しなければ
同音語であるが、この例の場合に第10語目はカ
ナ見出し部が存在するので、同音語は存在しな
かつたとして検索を打ち切る。
なお、上記では入力文と完全一致したものの
検索であるが、前方部分一致の検索もカナ見出
しENDを検出した時の処理を変えれば可能で
ある。又、説明では自立語辞書の先頭からすべ
てを調べていつたが、自立語辞書をいくつかの
ブロツクに分け各ブロツクの先頭見出しと先頭
アドレスを表にしたインデツクスを作れば、ブ
ロツク内だけの検索だけですみ、検索時間は短
縮される。
以上の様に差分構造辞書(第5図)の検索方
法を単純可変長構造辞書(第2図)と比較する
と、単準可変長構造辞書では各語ごとに入力文
の第1文字目からすべて比較する必要があるの
に対して、差分構造辞書では以前の語で一致し
た部分は比較する必要がないので比較回路が大
巾に減少する。さらに重複文字数が(比較しよ
うとしている文字位置―1)より大きい場合つ
まり第3文字目を比較する時に重複文字数が
“4”となつている様な場合はその語をスキツ
プして次の語に移れるし、小さい場合は、そこ
で検索を打ち切ればよく、等しい場合のみカナ
見出しと比較すればよい。
(4) 変形実施例 説明では漢字コードにJIS―6226、カナコ
ードにJIS―6226の下位バイトを使つたが、
漢字コードは7ビツト×2バイト構成で各バ
イトが21〜7F(16進)であればよい。又
カナコードも7ビツトで構成で1ビツト余つ
ていれば何でもよい。
説明ではカナ見出しのソート(並び換え)
をJIS―6226下位バイトの降順としたが、昇
順でもよい。
説明の便宜上カナ見出しと漢字部だけを辞
書に収容しているが、他の情報例えば、品
詞、出現頻度等を各語に付加することもでき
る。
カナ漢字変換用自立語辞書だけでなく、意
味情報を付加した電子国語辞典や、音訓辞書
(漢字1字)、さら言語翻釈用辞書にも応用で
きる。
説明では重複文字数3ビツト、語長5ビツ
トとしたが、この値は一例であり、辞書の性
質によつて変えることはできる。
【図面の簡単な説明】
第1図は固定長形式の辞書の構成を示す図、第
2図A,Bは可変長構造の辞書の構成を示す図、
第3図はカナ―漢字変換装置の構成を示すブロツ
図、第4図は第3図のカナキーボード部を詳細に
示した図、第5図A,Bは本発明に係る差分構造
辞書の構成を示す図、第6図はJIS―6226のコー
ド表を概略的に示す図、第7図は漢字表記部の復
元動作を説明するための図、第8図は本発明辞書
を用いた検索動作を示すための第3図の一部を詳
細に示したブロツク図、第9図はその検索動作の
フローを示す図である。 31:カナ―キーボード、32:CPU、3
3:入力文バツフア、34:処理プログラム装
置、35:辞書、35A:自立語辞書フアイル、
35B:文法情報テーブル、36:検索該当バツ
フア、37:出力文バツフア、38:出力装置、
51:重複文字数領域、52:語長領域、53:
カナ見出し部、54:漢字表記部。

Claims (1)

  1. 【特許請求の範囲】 1 カナで入力された文字列を漢字又は漢字カナ
    混じりの文に変換するための辞書において、 各語に対し可変長で収容するカナ見出し部と漢
    字表記部、または前記カナ見出し部と漢字表記部
    の長さを示す語長部とを備えるとともに、 前記カナ見出し部の圧縮と検索時間の短縮を図
    るため、一連の語列の中で1つ前のカナ見出し部
    のカナと重複する部分を、文字コードを使わずに
    重複文字数で表わす重複文字数部を有し、 前記可変長のカナ見出し部には重複文字以外の
    文字のみ文字コードで収容させる構成となしたこ
    とを特徴とするカナ漢字変換用辞書。 2 カナで入力された文字列を漢字又は漢字カナ
    混じり文に変換するための辞書において、 各語に対し可変長で収容するカナ見出し部と漢
    字表記部、また前記カナ見出し部と漢字表記部の
    長さを示す語長部とを備えるとともに、 前記漢字表記部の圧縮を図るため、該可変長の
    漢字表記部にはカナ文字をともなう漢字に対して
    そのカナ文字部分を文字コードを使わずにカナ文
    字数で表わし、該カナ文字数と漢字コードで収容
    させる構成となしたことを特徴とするカナ漢字変
    換用辞書。
JP56036157A 1981-03-12 1981-03-12 Dictionary for "kana"-"kanji" conversion Granted JPS57150070A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56036157A JPS57150070A (en) 1981-03-12 1981-03-12 Dictionary for "kana"-"kanji" conversion

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56036157A JPS57150070A (en) 1981-03-12 1981-03-12 Dictionary for "kana"-"kanji" conversion

Publications (2)

Publication Number Publication Date
JPS57150070A JPS57150070A (en) 1982-09-16
JPH0140370B2 true JPH0140370B2 (ja) 1989-08-28

Family

ID=12461929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56036157A Granted JPS57150070A (en) 1981-03-12 1981-03-12 Dictionary for "kana"-"kanji" conversion

Country Status (1)

Country Link
JP (1) JPS57150070A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0644264B2 (ja) * 1983-12-23 1994-06-08 シャープ株式会社 単語記憶方式
JPS6180450A (ja) * 1984-09-28 1986-04-24 Matsushita Electric Ind Co Ltd カナ漢字変換装置
JPS6180449A (ja) * 1984-09-28 1986-04-24 Matsushita Electric Ind Co Ltd カナ漢字変換装置
JPS61221866A (ja) * 1985-03-27 1986-10-02 Seiko Epson Corp 文書作成装置用付属語辞書

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5510694A (en) * 1978-02-17 1980-01-25 Son Jung Eui Portable translation machine
JPS5592923A (en) * 1978-12-29 1980-07-14 Fuji Xerox Co Ltd Typewriter for japanese letter
JPS55131870A (en) * 1979-03-30 1980-10-14 Sharp Corp Data storing method of electronic dictionary

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5510694A (en) * 1978-02-17 1980-01-25 Son Jung Eui Portable translation machine
JPS5592923A (en) * 1978-12-29 1980-07-14 Fuji Xerox Co Ltd Typewriter for japanese letter
JPS55131870A (en) * 1979-03-30 1980-10-14 Sharp Corp Data storing method of electronic dictionary

Also Published As

Publication number Publication date
JPS57150070A (en) 1982-09-16

Similar Documents

Publication Publication Date Title
JP3152868B2 (ja) 検索装置および辞書/テキスト検索方法
US5655129A (en) Character-string retrieval system and method
US5560037A (en) Compact hyphenation point data
US20040225497A1 (en) Compressed yet quickly searchable digital textual data format
JP2000201080A (ja) 付加コ―ドを用いたデ―タ圧縮/復元装置および方法
JPH0140370B2 (ja)
JPH0140372B2 (ja)
JPH056398A (ja) 文書登録装置及び文書検索装置
US6731229B2 (en) Method to reduce storage requirements when storing semi-redundant information in a database
JPH0554077A (ja) 単語辞書検索装置
JP2785168B2 (ja) 単語検索のための電子辞書圧縮方法及び装置
JPS6057421A (ja) 文書作成装置
JPH0140371B2 (ja)
JP2795038B2 (ja) データ検索装置
JP3021224B2 (ja) 辞書検索装置
JP3585944B2 (ja) データ処理方法及びその装置
JPH0410104B2 (ja)
JPS61285573A (ja) 仮名漢字変換装置
JPS62214468A (ja) かな漢字変換装置
JPH04167821A (ja) データ符号化及び復号化方法
JPS60251461A (ja) 仮名漢字変換装置
JPS6162970A (ja) 仮名漢字変換装置
JPH06187371A (ja) 圧縮地名データの格納方法及び読み出し方法
JP3720060B2 (ja) 関連ワードを得る方法及びシステム
JPH0338772A (ja) 文字コードデータの圧縮方式