JPS61175848A - ワ−ドプロセツサにおけるスペルチエツク方式 - Google Patents

ワ−ドプロセツサにおけるスペルチエツク方式

Info

Publication number
JPS61175848A
JPS61175848A JP60016778A JP1677885A JPS61175848A JP S61175848 A JPS61175848 A JP S61175848A JP 60016778 A JP60016778 A JP 60016778A JP 1677885 A JP1677885 A JP 1677885A JP S61175848 A JPS61175848 A JP S61175848A
Authority
JP
Japan
Prior art keywords
word
spelling
hash
check
correct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60016778A
Other languages
English (en)
Inventor
Toshio Miyama
宮間 俊雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60016778A priority Critical patent/JPS61175848A/ja
Publication of JPS61175848A publication Critical patent/JPS61175848A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は1語幹によってスペルチェックを行なうワード
プロセッサにおけるスペルチェック方式に関する。
〔発明の技術的背景とその問題点〕
近年、オフィスにも近代化の波が押し寄せ。
コンピュータを応用したテレビスクリーン(CRTモニ
タ)とプリンタとを組合わせた電子タイプライタ、いわ
ゆるワードプロセッサがオフィスの一画を占めるに至っ
た。ワードプロセyすは、OA(オフィスオー)メーシ
1ン)の中核装置として発展を続けており、CRTモニ
タ上で文書を入力し、訂正・追加・削除等。
修正後プリンタを起動してドキュメントを得る比較的単
純なものから、入力文書のスペルチェックを行なう等、
使い勝手の良い高級なもの迄種々市販されている。
ところで、上記スペルチェック機能を持つワードプロセ
ッサは基本辞書として、接頭語、接尾語、および辞書に
登録されている語を登録しており、スペルをチェックす
る場合には、与えられた単語より活用語尾、接頭語、接
尾語を分析して除去しチェックを行なう。
しかしながらこの方式では分析の処理が複雑であり、ま
た毎回ハツシュ関数を計算しなくてはならないため処理
速度に難があった。
〔発日月の目的〕
本発明は上記欠点に鑑みてなされたものであり、基本辞
書に語幹を分離したものを登録することにより、スペル
チェック処理速度の向上をはかったワードプロセッサに
おけるスペルチェック方式を提供することを目的とする
〔発明の概要〕
本発明は上記目的を実現するため、辞書に複数の接尾語
が合成されたものも登録しておき。
単一の接尾語と同等に扱った。辞書には通常の単語の他
に語幹(それ自体では意味をなさないものもある)を登
録しておき1語尾変化の処理を簡単(=あるといった手
法で実現した。
このため接頭語、接尾語を除去し1語幹を求める語幹抽
出部と1語幹とマスクパターンにより生成される基本辞
書ハッシュテーブルと1語幹データ(:よりハツシュ関
数を計算するハツシュ演算装置とを備え、このハツシュ
関数とマスクパターンに従がい基本辞書ハツシュテーブ
ルを参照し、そのマスクパターンに設定された特定のピ
ットセットを調べることによりスペルの正否をチェック
する構成としたものである。
このことにより、接尾語、接頭語をたどりながらチェッ
クする。従来方式に比べて処理が高速化され、且つ少な
い登録語数で多くの単語のチェックが可能となる。
〔発明の実施例〕
以下1図面を使用して本発明に関し詳細に説明する。
第1図は本発明の実施例を示すブロック図であり、具体
的には英文ワードプロセッサへの適用例が示されている
。機能的に大別すれば、ワードプロセッサ全体の制御を
司どる制御部本体J(CPU)と、キー人力を行ないそ
れを表示するキーボードディスプレイ(KB/CRT)
2、そして内部に収納された基本辞書(ReadOnl
y )と暫定辞書(Read /1iVrite可)を
必要に応じ制御部本体J上ヘロードするフロッピーディ
スク装置(FD)3から成る。
制御部本体1は、マイクロプロセッサ11゜文!!:片
メモリ12.単語抽出部131語幹抽出部14.ハツシ
ュ演算装置zs、スペル正否チェック部16.ハツシュ
テーブル展開用メモリ17、ハツシュ演算装置18で構
成される、マイクロプロセッサ11は1個々のブロック
の制御および全体の統轄を行なう。文書用メモリ12に
はスペルチェックの対象となる文書が格納される。単語
抽出部13は文書用メモリ12から1単語毎単語を抽出
し、又1語幹抽出部14は単語抽出部13で抽出された
単語より。
あらかじめ設定されている接頭語および接尾語を取りは
ずし語幹を抽出する部分である。更にハツシュ演算装置
15は語幹抽出部14により抽出された単語の語幹より
そのハツシユ値を求める装置である。ハツシュテーブル
展開用メモリJ7はフロッピーディスク装置3より読み
出された基本辞書のハツシュテーブルと暫定辞書より、
暫定辞書のハツシュテーブルを展開するためのメモリ、
ハツシュ演算装置18は上述した15と同装置、スペル
正否チェック部15はハツシュ演算装置15より求まる
ハツシユ値とhashテーブルJ7よりスペルの正否を
決定する部分である。
第2図は本発明実施例の動作を示す流れ図でありPAD
記法により示しである。
以下、第2図に示した流れ図を参照しながら第1図に示
した実施例の動作につき詳細に説明する。
まず、キーボードディスプレイ2からスペルチェック開
始のキーが入力されると、マイクロプロセッサ1ノはフ
ロッピーディスク装置3から基本辞著のハツシュテーブ
ルを読み出し、ハツシュテーブル展開用メモリ17にそ
の内容な転送する。次にマイクロプロセッサ1ノはフロ
ッピーディスク装置3より暫定辞書を読み出しハツシュ
演算装置J8に入力する。ハツシュ演算装置18は入力
されたデータに単語ごとにハッシュ関数を計算しハツシ
ュテーブル展開用のメモリ17の計算により求まるアド
レスにビットをセットする。フロッピーディスク装置3
より読み込まれた全ての単語に対してハッシュ演算を終
了するとハツシュテーブル展開用メモリ17には基本辞
書と暫定辞書により暫定ハツシュテーブルが展開される
次にマイクロプロセッサ1ノは文書用メモリJ2の内容
を単語抽出部13に入力する。単語抽出部13は入力さ
れたデータより単語を一単語づつ(二分離して語幹抽出
部14に入力する。
語幹抽出部14はまず単語抽出部13より渡された単語
データをそのままハツシュ演算装置15に送り、スペル
チェック部16よりスティタスが戻ってくるのを待つ。
ハッシュ演算装置J5は渡された単語よりハツシュ関数
値を計算しこれをスペル正否チェック部16に入力する
スペル正否チェック部16は渡されたバッジ−S関数値
に従って、ハツシュテーブル展開用メモリ17を参ハロ
し、ハツシュ関数値により指定されたアドレスのビット
がセットされている場合は与えられたスペルは正しいと
して語幹抽出部14と、マイクロプロセッサ1)にスペ
ル正とのスティタスを返す。語幹抽出部14はスペル正
とのスティタスを受けたら処理を終わる。
またマイクロプロセッサ1ノはこのスティタスを受ける
とCRT l:チェックした単語は正しいという意味の
情報を出力し1次の単語のスペルチェックに移る。また
スペル正否チェック部16が渡されたハツシュ関数値に
従って、ハツシュテーブル展開用メモ917を参照し、
指定されたアドレスのビットがセットされていない場合
は語幹抽出部ノ4にスペル否のスティタスを返す。語幹
抽出部14はこのスティタスを受けると単語抽出部13
より渡された単語から。
語幹抽出部14内にあらかじめ記憶されている本スペル
チェック処理用の接頭語と接尾語を除去して残った文字
列(語幹)をハツシュ演算装置15に入力する。またこ
のとき除去し゛た接頭語、接尾語の種類によって定まる
あるマスクパターンをスペル正否チェック部16にも入
力する。
ここでマスクパターンについて説明する。
前述したフロッピーディスク装置3中に保存しである基
本辞書のハツシュテーブルは全て接頭語、接尾語を除去
した語幹より作られている。
またハッシュ関数自体は、1単語に対して1つのハッシ
ュ関数が1バイトを表わすようになっており、その単語
の性質によって1バイト内の特定のビットがセットされ
るようになっている。
例えば末尾のI y l’lを′i″に変えて’ies
″とする単語の場合は2ビツト目をセット、末尾の文字
を重ねてl in g l″を付加する単語なら5ビツ
ト目をセットする。これがハツシュテーブルの作り方で
、逆に語幹抽出部14で除去した語に従って語幹はどう
いう性質を持たなくてはならないかが分るので例えば”
ies”を除去した場合は”501yf;f9ffl 
1 M”末尾が重なってing”を除去した場合は”9
a9f 1 、ffyyy”というデータをスペル正否
チェック部16に知らせてやればハツシュテーブル展開
用メモリ17のどのビットをチェックすればよいかが分
かる。このデータがマスクパターンである。
次に語幹抽出部14により抽出された語幹データを受は
取ったハツシュ演算装置15は、その語幹のハツシュ関
数値を計算し、スペル正否チェック部16にそのデータ
を渡す。スペル正否チェック部16は受は取ったハツシ
ュ関数値と語幹抽出部14より渡されたマスクパターン
に従ってハッシュテーブル展開用メモリ17を参照する
。ここでマスクパターンに設定されたビットがセットさ
れている場合は、マイクロプロセッサ11にスペル正の
スティタスを返す。
また、そうでない場合はマイクロプロセッサ1ノのスペ
ル否のスティタスを返す。マイクロプロセッサ11はス
ペル正のスティタスを受ケるとCRT2にチェックした
単語は正しいという情報を出力しく具体的にはノーマル
表示を行なう)次の単語のチェックに移る。またスペル
否のスティタスを受けた場合はCRTxにチェックした
単語は誤りという情報を出力しく具体的にはリバース表
示を行なう)次の単語のチェックに移る。この処理を繰
り返し文書用メモジノ2内の最終単語までチェックした
らスペルチェックの処理を終了する。
尚1本発明実施例は英文ワードプロセッサへの適用につ
いてのみ述べたが、他の言語系へ応用することも当然可
能である。
〔発明の効果〕
以上説明の如く本発明によれば、単語を語幹と接頭語、
接尾語に分けて登録しであるためにそれらの組み合せに
よって少ない登録語数で多くの単語のチェックが可能で
ある。またチェックするときに、接尾語、接頭語を除去
して、マスクパターンによってチェックするので接尾語
接頭語をたどりながらチェックする方式に比べて処理が
高速である。
【図面の簡単な説明】
第1図は本発明の実施例を示すブロック図。 第2図は本発明実施例の動作を示す流れ因である。 1・・・制御部本体(CPU)、z・・・キーボードデ
ィスプレイ(KB/CRT) 、s・・・フロッピーデ
ィスク装置(FD)、17°・・マイクロプロセッサ、
12・・・文書用メモリ、13・・・単語抽出部。 14・・・語幹抽出部、Is、Ill・・・八ツシエ演
算装置、16・・・スペル正否チェック部、17・・・
ハツシエテープル展開用メモリ。

Claims (1)

    【特許請求の範囲】
  1. 接頭語、接尾語を除去し語幹を求める語幹抽出部と、語
    幹とその語が持つ特性により特定ビットがセットされた
    マスクパターンにより作成される基本辞書ハッシュテー
    ブルと、上記語幹抽出部により抽出された語幹データに
    よりその語幹のハッシュ関数値を計算するハッシュ演算
    装置とを具備し上記ハッシュ演算装置によって求まるハ
    ッシュ関数値と上記語幹抽出部により渡されるマスクパ
    ターンに従がい上記基本辞書ハッシュテーブルを参照し
    、そのマスクパターンに設定された特定のビットセット
    を調べることによりその語が有するスペルの正否をチェ
    ックすることを特徴とするワードプロセッサにおけるス
    ペルチェック方式。
JP60016778A 1985-01-31 1985-01-31 ワ−ドプロセツサにおけるスペルチエツク方式 Pending JPS61175848A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60016778A JPS61175848A (ja) 1985-01-31 1985-01-31 ワ−ドプロセツサにおけるスペルチエツク方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60016778A JPS61175848A (ja) 1985-01-31 1985-01-31 ワ−ドプロセツサにおけるスペルチエツク方式

Publications (1)

Publication Number Publication Date
JPS61175848A true JPS61175848A (ja) 1986-08-07

Family

ID=11925651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60016778A Pending JPS61175848A (ja) 1985-01-31 1985-01-31 ワ−ドプロセツサにおけるスペルチエツク方式

Country Status (1)

Country Link
JP (1) JPS61175848A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231569A (ja) * 1987-03-12 1988-09-27 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 複合語の解析方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231569A (ja) * 1987-03-12 1988-09-27 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 複合語の解析方法

Similar Documents

Publication Publication Date Title
JPS59216189A (ja) 文字発生方法
JPS61175848A (ja) ワ−ドプロセツサにおけるスペルチエツク方式
JPS59165179A (ja) 辞書引方式
KR100434526B1 (ko) 문맥정보및지역적문서형태를이용한문장추출방법
JPS62245366A (ja) 文書処理装置
JP4919245B2 (ja) 行組版装置、行組版プログラム及びそれを記録した記録媒体
JP2009003717A (ja) ふり仮名収集利用装置及びふり仮名収集利用方法
JPH0537315Y2 (ja)
JPH08190561A (ja) 文書修正装置
JP3035105B2 (ja) 文章情報処理装置
Haralambous et al. Ω, a TEX extension including Unicode and featuring Lex-like filtering processes
Beccari Language management and patterns for line breaking
JP2744430B2 (ja) 自然言語処理装置
JPS638820A (ja) 文書清書装置
JPS61202273A (ja) 電子式辞書
JP3809238B2 (ja) 文書処理方法及びその装置
JPS5832418B2 (ja) 漢字まじり文入力装置
JP2864691B2 (ja) 学習支援装置
JP2965578B2 (ja) 文書作成支援方法
JPH02136956A (ja) レイアウト情報の抽出方法
JPH032963A (ja) 文書処理装置
JPH05135006A (ja) 文字処理方法及び装置
JPH0778133A (ja) 文書作成装置および文字パターン出力方法
JPH01318153A (ja) 文字処理装置
JPH07141345A (ja) 日本語文章処理方法