JPS61175848A

JPS61175848A - ワ−ドプロセツサにおけるスペルチエツク方式

Info

Publication number: JPS61175848A
Application number: JP60016778A
Authority: JP
Inventors: Toshio Miyama; 宮間　俊雄
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1985-01-31
Filing date: 1985-01-31
Publication date: 1986-08-07

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は１語幹によってスペルチェックを行なうワード
プロセッサにおけるスペルチェック方式に関する。

〔発明の技術的背景とその問題点〕

近年、オフィスにも近代化の波が押し寄せ。

コンピュータを応用したテレビスクリーン（ＣＲＴモニ
タ）とプリンタとを組合わせた電子タイプライタ、いわ
ゆるワードプロセッサがオフィスの一画を占めるに至っ
た。ワードプロセｙすは、ＯＡ（オフィスオー）メーシ
１ン）の中核装置として発展を続けており、ＣＲＴモニ
タ上で文書を入力し、訂正・追加・削除等。

修正後プリンタを起動してドキュメントを得る比較的単
純なものから、入力文書のスペルチェックを行なう等、
使い勝手の良い高級なもの迄種々市販されている。

ところで、上記スペルチェック機能を持つワードプロセ
ッサは基本辞書として、接頭語、接尾語、および辞書に
登録されている語を登録しており、スペルをチェックす
る場合には、与えられた単語より活用語尾、接頭語、接
尾語を分析して除去しチェックを行なう。

しかしながらこの方式では分析の処理が複雑であり、ま
た毎回ハツシュ関数を計算しなくてはならないため処理
速度に難があった。

〔発日月の目的〕

本発明は上記欠点に鑑みてなされたものであり、基本辞
書に語幹を分離したものを登録することにより、スペル
チェック処理速度の向上をはかったワードプロセッサに
おけるスペルチェック方式を提供することを目的とする
。

〔発明の概要〕

本発明は上記目的を実現するため、辞書に複数の接尾語
が合成されたものも登録しておき。

単一の接尾語と同等に扱った。辞書には通常の単語の他
に語幹（それ自体では意味をなさないものもある）を登
録しておき１語尾変化の処理を簡単（＝あるといった手
法で実現した。

このため接頭語、接尾語を除去し１語幹を求める語幹抽
出部と１語幹とマスクパターンにより生成される基本辞
書ハッシュテーブルと１語幹データ（：よりハツシュ関
数を計算するハツシュ演算装置とを備え、このハツシュ
関数とマスクパターンに従がい基本辞書ハツシュテーブ
ルを参照し、そのマスクパターンに設定された特定のピ
ットセットを調べることによりスペルの正否をチェック
する構成としたものである。

このことにより、接尾語、接頭語をたどりながらチェッ
クする。従来方式に比べて処理が高速化され、且つ少な
い登録語数で多くの単語のチェックが可能となる。

〔発明の実施例〕

以下１図面を使用して本発明に関し詳細に説明する。

第１図は本発明の実施例を示すブロック図であり、具体
的には英文ワードプロセッサへの適用例が示されている
。機能的に大別すれば、ワードプロセッサ全体の制御を
司どる制御部本体Ｊ（ＣＰＵ）と、キー人力を行ないそ
れを表示するキーボードディスプレイ（ＫＢ／ＣＲＴ）
２、そして内部に収納された基本辞書（ＲｅａｄＯｎｌ
ｙ　）と暫定辞書（Ｒｅａｄ　／１ｉＶｒｉｔｅ可）を
必要に応じ制御部本体Ｊ上ヘロードするフロッピーディ
スク装置（ＦＤ）３から成る。

制御部本体１は、マイクロプロセッサ１１゜文！！：片
メモリ１２．単語抽出部１３１語幹抽出部１４．ハツシ
ュ演算装置ｚｓ、スペル正否チェック部１６．ハツシュ
テーブル展開用メモリ１７、ハツシュ演算装置１８で構
成される、マイクロプロセッサ１１は１個々のブロック
の制御および全体の統轄を行なう。文書用メモリ１２に
はスペルチェックの対象となる文書が格納される。単語
抽出部１３は文書用メモリ１２から１単語毎単語を抽出
し、又１語幹抽出部１４は単語抽出部１３で抽出された
単語より。

あらかじめ設定されている接頭語および接尾語を取りは
ずし語幹を抽出する部分である。更にハツシュ演算装置
１５は語幹抽出部１４により抽出された単語の語幹より
そのハツシユ値を求める装置である。ハツシュテーブル
展開用メモリＪ７はフロッピーディスク装置３より読み
出された基本辞書のハツシュテーブルと暫定辞書より、
暫定辞書のハツシュテーブルを展開するためのメモリ、
ハツシュ演算装置１８は上述した１５と同装置、スペル
正否チェック部１５はハツシュ演算装置１５より求まる
ハツシユ値とｈａｓｈテーブルＪ７よりスペルの正否を
決定する部分である。

第２図は本発明実施例の動作を示す流れ図でありＰＡＤ
記法により示しである。

以下、第２図に示した流れ図を参照しながら第１図に示
した実施例の動作につき詳細に説明する。

まず、キーボードディスプレイ２からスペルチェック開
始のキーが入力されると、マイクロプロセッサ１ノはフ
ロッピーディスク装置３から基本辞著のハツシュテーブ
ルを読み出し、ハツシュテーブル展開用メモリ１７にそ
の内容な転送する。次にマイクロプロセッサ１ノはフロ
ッピーディスク装置３より暫定辞書を読み出しハツシュ
演算装置Ｊ８に入力する。ハツシュ演算装置１８は入力
されたデータに単語ごとにハッシュ関数を計算しハツシ
ュテーブル展開用のメモリ１７の計算により求まるアド
レスにビットをセットする。フロッピーディスク装置３
より読み込まれた全ての単語に対してハッシュ演算を終
了するとハツシュテーブル展開用メモリ１７には基本辞
書と暫定辞書により暫定ハツシュテーブルが展開される
。

次にマイクロプロセッサ１ノは文書用メモリＪ２の内容
を単語抽出部１３に入力する。単語抽出部１３は入力さ
れたデータより単語を一単語づつ（二分離して語幹抽出
部１４に入力する。

語幹抽出部１４はまず単語抽出部１３より渡された単語
データをそのままハツシュ演算装置１５に送り、スペル
チェック部１６よりスティタスが戻ってくるのを待つ。

ハッシュ演算装置Ｊ５は渡された単語よりハツシュ関数
値を計算しこれをスペル正否チェック部１６に入力する
。

スペル正否チェック部１６は渡されたバッジ−Ｓ関数値
に従って、ハツシュテーブル展開用メモリ１７を参ハロ
し、ハツシュ関数値により指定されたアドレスのビット
がセットされている場合は与えられたスペルは正しいと
して語幹抽出部１４と、マイクロプロセッサ１）にスペ
ル正とのスティタスを返す。語幹抽出部１４はスペル正
とのスティタスを受けたら処理を終わる。

またマイクロプロセッサ１ノはこのスティタスを受ける
とＣＲＴ　ｌ：チェックした単語は正しいという意味の
情報を出力し１次の単語のスペルチェックに移る。また
スペル正否チェック部１６が渡されたハツシュ関数値に
従って、ハツシュテーブル展開用メモ９１７を参照し、
指定されたアドレスのビットがセットされていない場合
は語幹抽出部ノ４にスペル否のスティタスを返す。語幹
抽出部１４はこのスティタスを受けると単語抽出部１３
より渡された単語から。

語幹抽出部１４内にあらかじめ記憶されている本スペル
チェック処理用の接頭語と接尾語を除去して残った文字
列（語幹）をハツシュ演算装置１５に入力する。またこ
のとき除去し゛た接頭語、接尾語の種類によって定まる
あるマスクパターンをスペル正否チェック部１６にも入
力する。

ここでマスクパターンについて説明する。

前述したフロッピーディスク装置３中に保存しである基
本辞書のハツシュテーブルは全て接頭語、接尾語を除去
した語幹より作られている。

またハッシュ関数自体は、１単語に対して１つのハッシ
ュ関数が１バイトを表わすようになっており、その単語
の性質によって１バイト内の特定のビットがセットされ
るようになっている。

例えば末尾のＩ　ｙ　ｌ’ｌを′ｉ″に変えて’ｉｅｓ
″とする単語の場合は２ビツト目をセット、末尾の文字
を重ねてｌ　ｉｎ　ｇ　ｌ″を付加する単語なら５ビツ
ト目をセットする。これがハツシュテーブルの作り方で
、逆に語幹抽出部１４で除去した語に従って語幹はどう
いう性質を持たなくてはならないかが分るので例えば”
ｉｅｓ”を除去した場合は”５０１ｙｆ；ｆ９ｆｆｌ　
１　Ｍ”末尾が重なってｉｎｇ”を除去した場合は”９
ａ９ｆ　１　、ｆｆｙｙｙ”というデータをスペル正否
チェック部１６に知らせてやればハツシュテーブル展開
用メモリ１７のどのビットをチェックすればよいかが分
かる。このデータがマスクパターンである。

次に語幹抽出部１４により抽出された語幹データを受は
取ったハツシュ演算装置１５は、その語幹のハツシュ関
数値を計算し、スペル正否チェック部１６にそのデータ
を渡す。スペル正否チェック部１６は受は取ったハツシ
ュ関数値と語幹抽出部１４より渡されたマスクパターン
に従ってハッシュテーブル展開用メモリ１７を参照する
。ここでマスクパターンに設定されたビットがセットさ
れている場合は、マイクロプロセッサ１１にスペル正の
スティタスを返す。

また、そうでない場合はマイクロプロセッサ１ノのスペ
ル否のスティタスを返す。マイクロプロセッサ１１はス
ペル正のスティタスを受ケるとＣＲＴ２にチェックした
単語は正しいという情報を出力しく具体的にはノーマル
表示を行なう）次の単語のチェックに移る。またスペル
否のスティタスを受けた場合はＣＲＴｘにチェックした
単語は誤りという情報を出力しく具体的にはリバース表
示を行なう）次の単語のチェックに移る。この処理を繰
り返し文書用メモジノ２内の最終単語までチェックした
らスペルチェックの処理を終了する。

尚１本発明実施例は英文ワードプロセッサへの適用につ
いてのみ述べたが、他の言語系へ応用することも当然可
能である。

〔発明の効果〕

以上説明の如く本発明によれば、単語を語幹と接頭語、
接尾語に分けて登録しであるためにそれらの組み合せに
よって少ない登録語数で多くの単語のチェックが可能で
ある。またチェックするときに、接尾語、接頭語を除去
して、マスクパターンによってチェックするので接尾語
。

接頭語をたどりながらチェックする方式に比べて処理が
高速である。

【図面の簡単な説明】

第１図は本発明の実施例を示すブロック図。第２図は本発明実施例の動作を示す流れ因である。１・・・制御部本体（ＣＰＵ）、ｚ・・・キーボードデ
ィスプレイ（ＫＢ／ＣＲＴ）　、ｓ・・・フロッピーデ
ィスク装置（ＦＤ）、１７°・・マイクロプロセッサ、
１２・・・文書用メモリ、１３・・・単語抽出部。１４・・・語幹抽出部、Ｉｓ、Ｉｌｌ・・・八ツシエ演
算装置、１６・・・スペル正否チェック部、１７・・・
ハツシエテープル展開用メモリ。

Claims

【特許請求の範囲】

接頭語、接尾語を除去し語幹を求める語幹抽出部と、語
幹とその語が持つ特性により特定ビットがセットされた
マスクパターンにより作成される基本辞書ハッシュテー
ブルと、上記語幹抽出部により抽出された語幹データに
よりその語幹のハッシュ関数値を計算するハッシュ演算
装置とを具備し上記ハッシュ演算装置によって求まるハ
ッシュ関数値と上記語幹抽出部により渡されるマスクパ
ターンに従がい上記基本辞書ハッシュテーブルを参照し
、そのマスクパターンに設定された特定のビットセット
を調べることによりその語が有するスペルの正否をチェ
ックすることを特徴とするワードプロセッサにおけるス
ペルチェック方式。