JPH0277964A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0277964A
JPH0277964A JP63230471A JP23047188A JPH0277964A JP H0277964 A JPH0277964 A JP H0277964A JP 63230471 A JP63230471 A JP 63230471A JP 23047188 A JP23047188 A JP 23047188A JP H0277964 A JPH0277964 A JP H0277964A
Authority
JP
Japan
Prior art keywords
word
synonym
antonym
information
synonyms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63230471A
Other languages
English (en)
Inventor
Yoshizo Saito
齋藤 佳三
Yoshiyuki Murashima
村島 義幸
Takuji Kawamura
卓司 川村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP63230471A priority Critical patent/JPH0277964A/ja
Publication of JPH0277964A publication Critical patent/JPH0277964A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、同義語や反意語を検索できる文字処理装置
に関する。
〈従来の技術〉 従来、この種の文字処理装置としては、通常の辞書の他
に、第11図に示すような、単語の同義−語または反意
語の文字列をその単語の文字列と対応させたテーブルを
記憶装置に記憶させ、入力装置から入力された単語をも
とにこのテーブルを検索して、その同義語または反意語
を表示装置に表示するようにしていた。
〈発明が解決しようとする課題〉 しかしながら、上記従来の文字処理装置では、単語とそ
の単語の同義語または反意語を文字列として記憶するた
め、記憶装置の容量が大きくなるという問題や、この文
字列のデータ長が単語によって異なるため、同義語また
は反意語を追加したり、削除したりする時の容量的判断
のためや、検索するときのマツチング処理がむずかしい
ために、処理速度が遅くなるという問題がある。
そこで、この発明の目的は、単語とそれに対応する同義
語または反意語を固定長の数値情報として記憶すること
により、記憶装置の容量を小さくし、この数値情報をも
とに同義語または反意語を求めることにより、処理速度
を速くした文字処理装置を提供することにある。
く課題を解決するための手段〉 上記目的を達成するため、この発明は、文字情報および
各種の指示を入力する入力手段と、文字情報を記憶する
記憶手段と、文字情報を表示する表示手段と、上記入力
手段の指示に基づき上記記憶手段に記憶されている文字
情報を上記表示手段に出力する制御手段と、単語を見出
し情報毎のグループに分類すると共に単語データとそれ
に関連する単語データを対応づけて記憶している辞書本
体部と、上記見出し情報と辞書本体部の所定箇所を示す
アドレスポインタを対応づけて記憶しているインデック
ス部とを備えた文字処理装置において、上記インデック
ス部に、上記見出し情報に、辞書本体部における所定箇
所を表す固定長の数値情報を対応づけて記憶すると共に
、単語のその単語の属するグループにおける順序を表す
固定長の数値情報と、その単語の同義語または反意語の
その同義語または反意語の属するグループにおける順序
を表す固定長の数値情報を対応づけて記憶している同義
語または反意語用のテーブルを備え、上記入力手段によ
って人力された単語の辞書本体部における固定長の数値
情報を、上記単語に対応するインデックス部の見出し情
報をもとにその単語の属するグループをその先頭から検
索して求め、上記テーブルを参照して、上記単語の同義
語または反意語を表す固定長の数値情報を求めて、上記
同義語または反意語の数値情報を含む辞書本体部のグル
ープをその先頭から検索して、同義語または反意語を求
めて、上記記憶装置に同義語または反意語を記憶させる
同義語または反意語検索処理装置を備えたことを特徴と
している。
〈作用〉 上記構成において、同義語または反意語検索処理装置が
、人力手段によって人力された単語の辞書本体部におけ
る固定長の数値情報を、上記単語に対応するインデック
ス部の見出し情報をもとにその単語の属するグループを
その先頭から検索して求め、同義語または反意語用のテ
ーブルを参照して、上記単語の辞書本体部における固定
長の数値情報に対応する同義語または反意語を表す固定
長の数値情報を求めて、上記同義語または反意語の数値
情報を含む辞書本体部のグループをその先頭から検索し
て、同義語または反意語を求めて、記憶装置に同義語ま
たは反意語を記憶させる。そして、この記憶装置に記憶
されている同義語法たは反意語を、制御手段が上記入力
手段の指示に基づき表示手段に出力する。
従って、同義語または反意語用のテーブルを記憶するた
めの記憶容量が少なくて済み、処理速度が速くなる。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1の実施例 第1図は本実施例の日本語ワードプロセッサの回路構成
を示すブロック図である。
第1図において、lは文字や単語情報および各種の指示
を入力するための入力装置であり、例えば、キーボード
、タブレット装置、光学式文字読み取り装置、磁気テー
プ装置等からなる。2は上記入力装置1から入力された
文字情報を記憶する記憶装置であり、例えば、コアメモ
リ、ICメモリ、磁気ディスク等からなる。3は上記記
憶装置2において記憶、編集された情報を出力する出力
装置であり、例えば、プリンタ、デイスプレィ装置、磁
気テープ、磁気ディスク装置等からなる。
4は単語の同義語または反意語を提供する同義語または
反意語検索処理装置であり、例えば、−コアメモリ、I
Cメモリ、ROM、磁気ディスク装置等からなる。5は
上記構成の各装置間の信号のやり取りを制御する制御装
置であり、例えば、コンピュータからなる。
上記同義語または反意語検索処理装置4は第2図に示す
インデックス部と、第3図に示す辞書本体部と、第4図
に示す同義語または反意語テーブル(以下、テーブルと
略称する)を備えている。
上記インデックス部には単語の先頭かな情報である見出
し情報と、上記辞書本体部へのアドレスポインタと、そ
の見出し情報の一つ前までの見出し情報を有する単語の
累積語数とが対応づけて記憶されている。また、上記辞
書本体部には単語の語長と、かな文字列を表す°かなデ
ータ′と、該当漢字を表す゛漢字データ゛およびその他
のデータが記憶されている。また、上記テーブルには単
語の辞書本体部における累積語数である元番号と、その
単語の同義語または反意語の辞書本体部における累積語
数である相手先番号と、同義語または反意語の数を示す
語数が対応づけて記憶されている。
この元番号と相手先番号はそれぞれ固定長(2バイト)
の数値データである。いま、第11図に従来例の説明の
ために引例したr強情jという単語を例にとると、この
単語の同義語としては「意地っ張り」、「負けず嫌い」
および「頑固」の3つの単語があり、「強情」の累積語
数は1000であり、上記同義語の累積語数はそれぞれ
550.2650.600であるので、上記テーブルに
はこれらの数値データが第4図に示すように記憶されて
いる。
以下、同義語または反意語を求めるための動作を、上記
「強情」を例にとって説明する。「強情」を表す単語情
報が人力装置lから入力されると、その”かな情報”で
ある”ごうじよう”からインデックス部の見出し情報の
”ご”を検索し、アドレスポインタで辞書本体部にポイ
ンタを移し、そこから′かな文字列′のマツチ検索を行
う。その際、インデックス部にある”ご”に対応する累
積語数を、l単語マツチ処理するごとにカウントアツプ
する。”かな文字列°がマツチしたら、後にある°漢字
文字列゛がマツチするかどうかチエツクし、マツチする
まで処理を行う。そして、マツチした時の累積語数であ
る”1000”を記憶しておき、その累積語数と一致す
る数値をテーブルの元番号の中から探す。
一致する数値がなければ同義語または反意語がないこと
を出力装置3に出力するが、この場合は一致する数値が
あるのでその元番号に対応する相手先番号の最初の相手
先番号である“0550”を読み出し、インデックス部
の累積語数を参照して、上記相手先番号より小さく上記
相手先番号に最も近い累積語数をもってくる。次に、ア
ドレスポインタで辞書本体部にポインタを移し、単語ご
とにカウントアツプし、上記相手先番号と同じになるよ
うにポインタを移動し、その文字列である「意地っ張り
」を読み出して出力装置3に出力する。
この操作をテーブルの語数だけ繰り返して、その数だけ
同義語または反意語を出力装置3に出力する。すなわち
、相手先番号が”2650“である「負けず嫌い」と”
0600”である「頑固」を出力する。
東玄Δ寒青匹 第5図は本実施例の欧文ワードプロセッサの回路構成を
示すブロック図である。
本実施例における入力装置51.記憶装置52、出力装
置53および制御装置55はそれ、ぞれ第1図に示す第
1の実施例におけるにおける入力装置11記憶装置2、
出力装置3および制御装置5と同等の機能を有するもの
であり、ここでは説明を省略する。スペルチェックおよ
び同義語または反意語検索処理装置(以下、処理装置と
略称する)54は、スペルチェック機能の他に第1の実
施例における同義語または反意語検索処理装置4と同様
の同義語または反意語検索処理機能を備えている。
上記処理装置54は、第6図に示すインデックス部と辞
書本体部からなる圧縮辞書を備えている。
上記インデックス部には、先頭の2文字が同じ単語が格
納されている辞書本体部におけるグループの辞書本体部
の先頭からのオフセットと、後述するブロック数と、そ
のインデックスの1つ前までのインデックスで示される
単語列の辞書本体部における累積語数が格納されている
。また、上記辞書本体部はnバイト毎に分割されたブロ
ックを単位に構成され、各ブロックには、先頭第1単語
が、内部コードに変面された非圧縮なバイト単位の文字
列として格納され、第2単語以降が、相対圧縮コード(
一つ前の単語との共通部分を表すコード)および相対圧
縮ができなかった非圧縮文字コードを出現頻度より割り
付けたハフマンコードに置き換えて格納されている。そ
して、先頭の2文字が同一文字列の単語列がブロック長
であるnバイトを超えたときは、その単語列のブロック
数は複数となる。このブロック数が上記インデックス部
に格納される。
今、人力装置から入力された単語(以下、キーワードと
称す)のスペルチェックを行う場合、キーワードの先頭
2文字よりインデックス情報の格納されるアドレスを計
算し、そのインデックスのオフセットおよびブロック数
を取り出す。次に、オフセット、ブロック数、ブロック
長nが既知であるため、先程のブロック先端の非圧縮単
語についてブロック単位で2分探索を行う。この段階で
キーワードがどこのブロックに格納されているかを知る
ことができるので、対象となったブロックの先頭から順
次ハフマンコードを複合しキーワードを検索する。
上記処理装置54は、また、第7図に示す同義語または
反意語テーブル(以下、テーブルと略称する)を備えて
いる。
上記テーブルには単語の辞書本体部における累積語数で
ある番号と、その単語の同義語または反意語の辞書本体
部における累積語数であるオフセットと、同義語または
反意語の数を示す語数が対応づけて記憶されている。こ
の番号とオフセットはそれぞれ固定長(2バイト)の数
値データである。
いま、第8図に示したよう(ごadvise”という単
語を例にとると、この単語の同義語としてはcouns
ed”および” reco+++mend”の2つの単
語があり、”advise”の累積語数は412であり
、上記同義語の累積語数はそれぞれ612.1050で
あるので、上記テーブルにはこれらの数値データが対応
づけて記憶されている。
以下、同義語または反意語を求めるための動作を、上記
”advise”を例にとって説明する。”advis
e”を表す単語情報が人力装置51から入力されると、
その先頭の2文字”ad“よりインデックス情報の格納
されるアドレスを計算し、そのインデックスのオフセッ
トおよび累積語数を取り出す。次に、辞書本体部の上記
オフセットで示されるプロらりに移り、そこから°文字
列°のマツチ検索を行う。その際、インデックス部にあ
る”ad”に対応する累積語数を、■単語マツチ処理す
るごとにカウントアツプする。この処理を°文字列°が
マツチするまで行い、マツチした時の累積語数である”
4・12”を記憶しておき、その累積語数と一致する数
値をテーブルの番号の中から探す。一致する数値がなけ
れば同義語または反意語がないことを出力装置53に出
力するが、この場合は一致する数値があるのでその数値
に対応するオフセット欄の最初の累積語数である”06
12”を読み出し、インデックス部の累積語数を参照し
て、上記“0612”より小さくそれに最も近い累積語
数をもってくる。次に、この累積語数に対応するオフセ
ットで示される辞書本体部のブロックに移り、単語ごと
にカウントアツプし、上記累積語数”0612”と同じ
になるまでカウントし、その文字列である”couns
ed”を読み出して出力装置3に出力する。この操作を
テーブルの語数だけ繰り返して、その数だけ同義語また
は反意語を出力装置3に出力する。すなわち、累積語数
が0612”である” counsed”と1050+
である” recommend”を出力する。
第9図は以上述べたスペルチェックの動作と同義語また
は反意語検索動作を含む本実施例の動作を示すフローチ
ャートである。
まず、ステップS1で入力装置から入力された文字列か
ら単語を切り出すことにより単語を抽出する。次に、ス
テップS、で単語に付随する不要な文字を削減する。例
えば、xxx’はXXXに、xxx’sはXXXにする
。そして、ステップS3に進み、探索する単語(キーワ
ード)の長さを判断し、単語の長さが1文字ならばスペ
ルチェックのための辞書探索を行わず、ステップS、の
同義語・反意語検索に進む。単語の長さが1文字でない
場合、ステップS4に進んで辞書探索を開始し、ステッ
プS、でキーワードが辞書に登録されているかを判断す
る。そして、登録されていなければステップS8に進み
現単語のすべての変化形について探索を行い、探索を行
う単語がなければステップS8に進む。一方、ステップ
S、ですべての変化形についての探索が行なわれていな
い場合、ステップS7に進み、変化形(例えば、ABC
の場合Abcまたはabcなどの変化形)生成を行った
後再び辞書検索を行う。
ステップS8の同義語・反意語検索では、第10図のフ
ローチャートに示すように、上述した同義語・反意語検
索動作が行なわれる。
このように、第1および第2の実施例共、単語とその単
語の同義語または反意語を辞書本体部における順序を表
す固定長の数値情報として記憶し、この数値情報をもと
に辞書本体部を検索して同義語または反意語を求めるよ
うにしているので、同義語または反意語を記憶するため
の記憶容量が少なくて済み、同義語または反意語を検索
するための処理速度が速くなる。
〈発明の効果〉 以上より明らかなように、この発明の文字処理装置は、
単語の辞書本体部における順序を表す固定長の数値情報
と、その単語の同義語または反意語の上記辞書本体部に
おける順序を表す固定長の数値情報を対応づけて記憶し
ている同義語または反意語用のテーブルを備え、入力手
段によって入力された単語の辞書本体部における固定長
の数値情報を、上記単語の見出し情報をもとに辞書本体
部を検索して求め、上記テーブルを参照して、上記単語
の同義語または反意語を表す固定長の数値情報を求めて
、その数値情報をもとに辞書本体部を検索して、同義語
または反意語を求めるようにしているので、同義語また
は反意語を記憶するための記憶容量が少なくて済み、同
義語または反意語を検索するための処理速度が速くなる
【図面の簡単な説明】
第1図はこの発明の第1の実施例の回路構成を示すブロ
ック図、第2図、第3図および第4図はそれぞれ上記第
1の実施例におけるインデックス部、辞書本体部および
同義語または反意語テーブルを示す図、第5図はこの発
明の第2の実施例の回路構成を示すブロック図、第6図
は上記第2の実施例におけるインデックス部と辞書本体
部を示す図、第7図および第8図はそれぞれ上記第2の
実施例における同義語または反意語テーブルおよびその
テーブルに記憶されている内容の一例を示す図、第9図
および第10図は上記第2の実施例の動作を示すフロー
チャート、第11図は従来例において単語とその単語の
同義語または反意語が文字列として記憶されていること
を説明する図である。 ■、51・・・入力装置、2.52・・・記憶装置、3
.53・・・出力装置、 4・・・同義語または反意語検索処理装置、54・・・
スペルチェックおよび同義語または反意語検索処理装置
、 5.55・・・制御装置。 特 許 出 願 人  シャープ株式会社代 理 人 
弁理士  前出 葆 ほか1名第 1 図 第2図 イー〒°ツ7ス静 わ 第3図 第4図 第5図 第6図 第7図 第8図 advise” 0412 counssd■0612 第10図 」 @II丸曙厖會語 フし

Claims (1)

    【特許請求の範囲】
  1. (1)文字情報および各種の指示を入力する入力手段と
    、文字情報を記憶する記憶手段と、文字情報を表示する
    表示手段と、上記入力手段の指示に基づき上記記憶手段
    に記憶されている文字情報を上記表示手段に出力する制
    御手段と、単語を見出し情報毎のグループに分類すると
    共に単語データとそれに関連する単語データを対応づけ
    て記憶している辞書本体部と、上記見出し情報と辞書本
    体部の所定箇所を示すアドレスポインタを対応づけて記
    憶しているインデックス部とを備えた文字処理装置にお
    いて、 上記インデックス部に、上記見出し情報に、辞書本体部
    における所定箇所を表す固定長の数値情報を対応づけて
    記憶すると共に、 単語のその単語の属するグループにおける順序を表す固
    定長の数値情報と、その単語の同義語または反意語のそ
    の同義語または反意語の属するグループにおける順序を
    表す固定長の数値情報を対応づけて記憶している同義語
    または反意語用のテーブルを備え、上記入力手段によっ
    て入力された単語の辞書本体部における固定長の数値情
    報を、上記単語に対応するインデックス部の見出し情報
    をもとにその単語の属するグループをその先頭から検索
    して求め、上記テーブルを参照して、上記単語の同義語
    または反意語を表す固定長の数値情報を求めて、上記同
    義語または反意語の数値情報を含む辞書本体部のグルー
    プをその先頭から検索して、同義語または反意語を求め
    て、上記記憶装置に同義語または反意語を記憶させる同
    義語または反意語検索処理装置を備えたことを特徴とす
    る文字処理装置。
JP63230471A 1988-09-14 1988-09-14 文字処理装置 Pending JPH0277964A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63230471A JPH0277964A (ja) 1988-09-14 1988-09-14 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63230471A JPH0277964A (ja) 1988-09-14 1988-09-14 文字処理装置

Publications (1)

Publication Number Publication Date
JPH0277964A true JPH0277964A (ja) 1990-03-19

Family

ID=16908342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63230471A Pending JPH0277964A (ja) 1988-09-14 1988-09-14 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0277964A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58195929A (ja) * 1982-05-11 1983-11-15 Fujitsu Ltd 日本語入力装置
JPS59197923A (ja) * 1983-04-26 1984-11-09 Toshiba Corp 文書作成装置
JPS60262263A (ja) * 1984-06-07 1985-12-25 Toshiba Corp 情報検索装置
JPS62197864A (ja) * 1986-02-26 1987-09-01 Toshiba Corp 言語情報提供装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58195929A (ja) * 1982-05-11 1983-11-15 Fujitsu Ltd 日本語入力装置
JPS59197923A (ja) * 1983-04-26 1984-11-09 Toshiba Corp 文書作成装置
JPS60262263A (ja) * 1984-06-07 1985-12-25 Toshiba Corp 情報検索装置
JPS62197864A (ja) * 1986-02-26 1987-09-01 Toshiba Corp 言語情報提供装置

Similar Documents

Publication Publication Date Title
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
US4384329A (en) Retrieval of related linked linguistic expressions including synonyms and antonyms
GB2259596A (en) Compressed language dictionary
US5297038A (en) Electronic dictionary and method of codifying words therefor
JPS6359660A (ja) 情報処理装置
US5553283A (en) Stored mapping data with information for skipping branches while keeping count of suffix endings
JPH0277964A (ja) 文字処理装置
JP2595934B2 (ja) 仮名漢字変換処理装置
EP0649105B1 (en) Word/number and number/word mapping
JPH07182354A (ja) 電子文書の作成方法
JPH03118661A (ja) 単語検索装置
JP3585944B2 (ja) データ処理方法及びその装置
JPH0140370B2 (ja)
JPH03127254A (ja) 単語検索装置
JPS6259810B2 (ja)
JPS59106029A (ja) カナ漢字変換装置
JPH03208162A (ja) 入力装置
JPH0546666A (ja) 情報検索装置
JPH10334122A (ja) 類似名検索システムおよび記録媒体
JPH0721212A (ja) 文書処理装置
JPS61281368A (ja) 画像情報検索装置
JPS6243769A (ja) 仮名漢字変換装置
JPS61286966A (ja) 言語処理装置
JPH0660063A (ja) 漢字変換装置
JPH08115318A (ja) かな漢字変換用共起辞書及びかな漢字変換装置