JPS61175848A - ワ−ドプロセツサにおけるスペルチエツク方式 - Google Patents
ワ−ドプロセツサにおけるスペルチエツク方式Info
- Publication number
- JPS61175848A JPS61175848A JP60016778A JP1677885A JPS61175848A JP S61175848 A JPS61175848 A JP S61175848A JP 60016778 A JP60016778 A JP 60016778A JP 1677885 A JP1677885 A JP 1677885A JP S61175848 A JPS61175848 A JP S61175848A
- Authority
- JP
- Japan
- Prior art keywords
- word
- spelling
- hash
- check
- correct
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は1語幹によってスペルチェックを行なうワード
プロセッサにおけるスペルチェック方式に関する。
プロセッサにおけるスペルチェック方式に関する。
近年、オフィスにも近代化の波が押し寄せ。
コンピュータを応用したテレビスクリーン(CRTモニ
タ)とプリンタとを組合わせた電子タイプライタ、いわ
ゆるワードプロセッサがオフィスの一画を占めるに至っ
た。ワードプロセyすは、OA(オフィスオー)メーシ
1ン)の中核装置として発展を続けており、CRTモニ
タ上で文書を入力し、訂正・追加・削除等。
タ)とプリンタとを組合わせた電子タイプライタ、いわ
ゆるワードプロセッサがオフィスの一画を占めるに至っ
た。ワードプロセyすは、OA(オフィスオー)メーシ
1ン)の中核装置として発展を続けており、CRTモニ
タ上で文書を入力し、訂正・追加・削除等。
修正後プリンタを起動してドキュメントを得る比較的単
純なものから、入力文書のスペルチェックを行なう等、
使い勝手の良い高級なもの迄種々市販されている。
純なものから、入力文書のスペルチェックを行なう等、
使い勝手の良い高級なもの迄種々市販されている。
ところで、上記スペルチェック機能を持つワードプロセ
ッサは基本辞書として、接頭語、接尾語、および辞書に
登録されている語を登録しており、スペルをチェックす
る場合には、与えられた単語より活用語尾、接頭語、接
尾語を分析して除去しチェックを行なう。
ッサは基本辞書として、接頭語、接尾語、および辞書に
登録されている語を登録しており、スペルをチェックす
る場合には、与えられた単語より活用語尾、接頭語、接
尾語を分析して除去しチェックを行なう。
しかしながらこの方式では分析の処理が複雑であり、ま
た毎回ハツシュ関数を計算しなくてはならないため処理
速度に難があった。
た毎回ハツシュ関数を計算しなくてはならないため処理
速度に難があった。
本発明は上記欠点に鑑みてなされたものであり、基本辞
書に語幹を分離したものを登録することにより、スペル
チェック処理速度の向上をはかったワードプロセッサに
おけるスペルチェック方式を提供することを目的とする
。
書に語幹を分離したものを登録することにより、スペル
チェック処理速度の向上をはかったワードプロセッサに
おけるスペルチェック方式を提供することを目的とする
。
本発明は上記目的を実現するため、辞書に複数の接尾語
が合成されたものも登録しておき。
が合成されたものも登録しておき。
単一の接尾語と同等に扱った。辞書には通常の単語の他
に語幹(それ自体では意味をなさないものもある)を登
録しておき1語尾変化の処理を簡単(=あるといった手
法で実現した。
に語幹(それ自体では意味をなさないものもある)を登
録しておき1語尾変化の処理を簡単(=あるといった手
法で実現した。
このため接頭語、接尾語を除去し1語幹を求める語幹抽
出部と1語幹とマスクパターンにより生成される基本辞
書ハッシュテーブルと1語幹データ(:よりハツシュ関
数を計算するハツシュ演算装置とを備え、このハツシュ
関数とマスクパターンに従がい基本辞書ハツシュテーブ
ルを参照し、そのマスクパターンに設定された特定のピ
ットセットを調べることによりスペルの正否をチェック
する構成としたものである。
出部と1語幹とマスクパターンにより生成される基本辞
書ハッシュテーブルと1語幹データ(:よりハツシュ関
数を計算するハツシュ演算装置とを備え、このハツシュ
関数とマスクパターンに従がい基本辞書ハツシュテーブ
ルを参照し、そのマスクパターンに設定された特定のピ
ットセットを調べることによりスペルの正否をチェック
する構成としたものである。
このことにより、接尾語、接頭語をたどりながらチェッ
クする。従来方式に比べて処理が高速化され、且つ少な
い登録語数で多くの単語のチェックが可能となる。
クする。従来方式に比べて処理が高速化され、且つ少な
い登録語数で多くの単語のチェックが可能となる。
以下1図面を使用して本発明に関し詳細に説明する。
第1図は本発明の実施例を示すブロック図であり、具体
的には英文ワードプロセッサへの適用例が示されている
。機能的に大別すれば、ワードプロセッサ全体の制御を
司どる制御部本体J(CPU)と、キー人力を行ないそ
れを表示するキーボードディスプレイ(KB/CRT)
2、そして内部に収納された基本辞書(ReadOnl
y )と暫定辞書(Read /1iVrite可)を
必要に応じ制御部本体J上ヘロードするフロッピーディ
スク装置(FD)3から成る。
的には英文ワードプロセッサへの適用例が示されている
。機能的に大別すれば、ワードプロセッサ全体の制御を
司どる制御部本体J(CPU)と、キー人力を行ないそ
れを表示するキーボードディスプレイ(KB/CRT)
2、そして内部に収納された基本辞書(ReadOnl
y )と暫定辞書(Read /1iVrite可)を
必要に応じ制御部本体J上ヘロードするフロッピーディ
スク装置(FD)3から成る。
制御部本体1は、マイクロプロセッサ11゜文!!:片
メモリ12.単語抽出部131語幹抽出部14.ハツシ
ュ演算装置zs、スペル正否チェック部16.ハツシュ
テーブル展開用メモリ17、ハツシュ演算装置18で構
成される、マイクロプロセッサ11は1個々のブロック
の制御および全体の統轄を行なう。文書用メモリ12に
はスペルチェックの対象となる文書が格納される。単語
抽出部13は文書用メモリ12から1単語毎単語を抽出
し、又1語幹抽出部14は単語抽出部13で抽出された
単語より。
メモリ12.単語抽出部131語幹抽出部14.ハツシ
ュ演算装置zs、スペル正否チェック部16.ハツシュ
テーブル展開用メモリ17、ハツシュ演算装置18で構
成される、マイクロプロセッサ11は1個々のブロック
の制御および全体の統轄を行なう。文書用メモリ12に
はスペルチェックの対象となる文書が格納される。単語
抽出部13は文書用メモリ12から1単語毎単語を抽出
し、又1語幹抽出部14は単語抽出部13で抽出された
単語より。
あらかじめ設定されている接頭語および接尾語を取りは
ずし語幹を抽出する部分である。更にハツシュ演算装置
15は語幹抽出部14により抽出された単語の語幹より
そのハツシユ値を求める装置である。ハツシュテーブル
展開用メモリJ7はフロッピーディスク装置3より読み
出された基本辞書のハツシュテーブルと暫定辞書より、
暫定辞書のハツシュテーブルを展開するためのメモリ、
ハツシュ演算装置18は上述した15と同装置、スペル
正否チェック部15はハツシュ演算装置15より求まる
ハツシユ値とhashテーブルJ7よりスペルの正否を
決定する部分である。
ずし語幹を抽出する部分である。更にハツシュ演算装置
15は語幹抽出部14により抽出された単語の語幹より
そのハツシユ値を求める装置である。ハツシュテーブル
展開用メモリJ7はフロッピーディスク装置3より読み
出された基本辞書のハツシュテーブルと暫定辞書より、
暫定辞書のハツシュテーブルを展開するためのメモリ、
ハツシュ演算装置18は上述した15と同装置、スペル
正否チェック部15はハツシュ演算装置15より求まる
ハツシユ値とhashテーブルJ7よりスペルの正否を
決定する部分である。
第2図は本発明実施例の動作を示す流れ図でありPAD
記法により示しである。
記法により示しである。
以下、第2図に示した流れ図を参照しながら第1図に示
した実施例の動作につき詳細に説明する。
した実施例の動作につき詳細に説明する。
まず、キーボードディスプレイ2からスペルチェック開
始のキーが入力されると、マイクロプロセッサ1ノはフ
ロッピーディスク装置3から基本辞著のハツシュテーブ
ルを読み出し、ハツシュテーブル展開用メモリ17にそ
の内容な転送する。次にマイクロプロセッサ1ノはフロ
ッピーディスク装置3より暫定辞書を読み出しハツシュ
演算装置J8に入力する。ハツシュ演算装置18は入力
されたデータに単語ごとにハッシュ関数を計算しハツシ
ュテーブル展開用のメモリ17の計算により求まるアド
レスにビットをセットする。フロッピーディスク装置3
より読み込まれた全ての単語に対してハッシュ演算を終
了するとハツシュテーブル展開用メモリ17には基本辞
書と暫定辞書により暫定ハツシュテーブルが展開される
。
始のキーが入力されると、マイクロプロセッサ1ノはフ
ロッピーディスク装置3から基本辞著のハツシュテーブ
ルを読み出し、ハツシュテーブル展開用メモリ17にそ
の内容な転送する。次にマイクロプロセッサ1ノはフロ
ッピーディスク装置3より暫定辞書を読み出しハツシュ
演算装置J8に入力する。ハツシュ演算装置18は入力
されたデータに単語ごとにハッシュ関数を計算しハツシ
ュテーブル展開用のメモリ17の計算により求まるアド
レスにビットをセットする。フロッピーディスク装置3
より読み込まれた全ての単語に対してハッシュ演算を終
了するとハツシュテーブル展開用メモリ17には基本辞
書と暫定辞書により暫定ハツシュテーブルが展開される
。
次にマイクロプロセッサ1ノは文書用メモリJ2の内容
を単語抽出部13に入力する。単語抽出部13は入力さ
れたデータより単語を一単語づつ(二分離して語幹抽出
部14に入力する。
を単語抽出部13に入力する。単語抽出部13は入力さ
れたデータより単語を一単語づつ(二分離して語幹抽出
部14に入力する。
語幹抽出部14はまず単語抽出部13より渡された単語
データをそのままハツシュ演算装置15に送り、スペル
チェック部16よりスティタスが戻ってくるのを待つ。
データをそのままハツシュ演算装置15に送り、スペル
チェック部16よりスティタスが戻ってくるのを待つ。
ハッシュ演算装置J5は渡された単語よりハツシュ関数
値を計算しこれをスペル正否チェック部16に入力する
。
値を計算しこれをスペル正否チェック部16に入力する
。
スペル正否チェック部16は渡されたバッジ−S関数値
に従って、ハツシュテーブル展開用メモリ17を参ハロ
し、ハツシュ関数値により指定されたアドレスのビット
がセットされている場合は与えられたスペルは正しいと
して語幹抽出部14と、マイクロプロセッサ1)にスペ
ル正とのスティタスを返す。語幹抽出部14はスペル正
とのスティタスを受けたら処理を終わる。
に従って、ハツシュテーブル展開用メモリ17を参ハロ
し、ハツシュ関数値により指定されたアドレスのビット
がセットされている場合は与えられたスペルは正しいと
して語幹抽出部14と、マイクロプロセッサ1)にスペ
ル正とのスティタスを返す。語幹抽出部14はスペル正
とのスティタスを受けたら処理を終わる。
またマイクロプロセッサ1ノはこのスティタスを受ける
とCRT l:チェックした単語は正しいという意味の
情報を出力し1次の単語のスペルチェックに移る。また
スペル正否チェック部16が渡されたハツシュ関数値に
従って、ハツシュテーブル展開用メモ917を参照し、
指定されたアドレスのビットがセットされていない場合
は語幹抽出部ノ4にスペル否のスティタスを返す。語幹
抽出部14はこのスティタスを受けると単語抽出部13
より渡された単語から。
とCRT l:チェックした単語は正しいという意味の
情報を出力し1次の単語のスペルチェックに移る。また
スペル正否チェック部16が渡されたハツシュ関数値に
従って、ハツシュテーブル展開用メモ917を参照し、
指定されたアドレスのビットがセットされていない場合
は語幹抽出部ノ4にスペル否のスティタスを返す。語幹
抽出部14はこのスティタスを受けると単語抽出部13
より渡された単語から。
語幹抽出部14内にあらかじめ記憶されている本スペル
チェック処理用の接頭語と接尾語を除去して残った文字
列(語幹)をハツシュ演算装置15に入力する。またこ
のとき除去し゛た接頭語、接尾語の種類によって定まる
あるマスクパターンをスペル正否チェック部16にも入
力する。
チェック処理用の接頭語と接尾語を除去して残った文字
列(語幹)をハツシュ演算装置15に入力する。またこ
のとき除去し゛た接頭語、接尾語の種類によって定まる
あるマスクパターンをスペル正否チェック部16にも入
力する。
ここでマスクパターンについて説明する。
前述したフロッピーディスク装置3中に保存しである基
本辞書のハツシュテーブルは全て接頭語、接尾語を除去
した語幹より作られている。
本辞書のハツシュテーブルは全て接頭語、接尾語を除去
した語幹より作られている。
またハッシュ関数自体は、1単語に対して1つのハッシ
ュ関数が1バイトを表わすようになっており、その単語
の性質によって1バイト内の特定のビットがセットされ
るようになっている。
ュ関数が1バイトを表わすようになっており、その単語
の性質によって1バイト内の特定のビットがセットされ
るようになっている。
例えば末尾のI y l’lを′i″に変えて’ies
″とする単語の場合は2ビツト目をセット、末尾の文字
を重ねてl in g l″を付加する単語なら5ビツ
ト目をセットする。これがハツシュテーブルの作り方で
、逆に語幹抽出部14で除去した語に従って語幹はどう
いう性質を持たなくてはならないかが分るので例えば”
ies”を除去した場合は”501yf;f9ffl
1 M”末尾が重なってing”を除去した場合は”9
a9f 1 、ffyyy”というデータをスペル正否
チェック部16に知らせてやればハツシュテーブル展開
用メモリ17のどのビットをチェックすればよいかが分
かる。このデータがマスクパターンである。
″とする単語の場合は2ビツト目をセット、末尾の文字
を重ねてl in g l″を付加する単語なら5ビツ
ト目をセットする。これがハツシュテーブルの作り方で
、逆に語幹抽出部14で除去した語に従って語幹はどう
いう性質を持たなくてはならないかが分るので例えば”
ies”を除去した場合は”501yf;f9ffl
1 M”末尾が重なってing”を除去した場合は”9
a9f 1 、ffyyy”というデータをスペル正否
チェック部16に知らせてやればハツシュテーブル展開
用メモリ17のどのビットをチェックすればよいかが分
かる。このデータがマスクパターンである。
次に語幹抽出部14により抽出された語幹データを受は
取ったハツシュ演算装置15は、その語幹のハツシュ関
数値を計算し、スペル正否チェック部16にそのデータ
を渡す。スペル正否チェック部16は受は取ったハツシ
ュ関数値と語幹抽出部14より渡されたマスクパターン
に従ってハッシュテーブル展開用メモリ17を参照する
。ここでマスクパターンに設定されたビットがセットさ
れている場合は、マイクロプロセッサ11にスペル正の
スティタスを返す。
取ったハツシュ演算装置15は、その語幹のハツシュ関
数値を計算し、スペル正否チェック部16にそのデータ
を渡す。スペル正否チェック部16は受は取ったハツシ
ュ関数値と語幹抽出部14より渡されたマスクパターン
に従ってハッシュテーブル展開用メモリ17を参照する
。ここでマスクパターンに設定されたビットがセットさ
れている場合は、マイクロプロセッサ11にスペル正の
スティタスを返す。
また、そうでない場合はマイクロプロセッサ1ノのスペ
ル否のスティタスを返す。マイクロプロセッサ11はス
ペル正のスティタスを受ケるとCRT2にチェックした
単語は正しいという情報を出力しく具体的にはノーマル
表示を行なう)次の単語のチェックに移る。またスペル
否のスティタスを受けた場合はCRTxにチェックした
単語は誤りという情報を出力しく具体的にはリバース表
示を行なう)次の単語のチェックに移る。この処理を繰
り返し文書用メモジノ2内の最終単語までチェックした
らスペルチェックの処理を終了する。
ル否のスティタスを返す。マイクロプロセッサ11はス
ペル正のスティタスを受ケるとCRT2にチェックした
単語は正しいという情報を出力しく具体的にはノーマル
表示を行なう)次の単語のチェックに移る。またスペル
否のスティタスを受けた場合はCRTxにチェックした
単語は誤りという情報を出力しく具体的にはリバース表
示を行なう)次の単語のチェックに移る。この処理を繰
り返し文書用メモジノ2内の最終単語までチェックした
らスペルチェックの処理を終了する。
尚1本発明実施例は英文ワードプロセッサへの適用につ
いてのみ述べたが、他の言語系へ応用することも当然可
能である。
いてのみ述べたが、他の言語系へ応用することも当然可
能である。
以上説明の如く本発明によれば、単語を語幹と接頭語、
接尾語に分けて登録しであるためにそれらの組み合せに
よって少ない登録語数で多くの単語のチェックが可能で
ある。またチェックするときに、接尾語、接頭語を除去
して、マスクパターンによってチェックするので接尾語
。
接尾語に分けて登録しであるためにそれらの組み合せに
よって少ない登録語数で多くの単語のチェックが可能で
ある。またチェックするときに、接尾語、接頭語を除去
して、マスクパターンによってチェックするので接尾語
。
接頭語をたどりながらチェックする方式に比べて処理が
高速である。
高速である。
第1図は本発明の実施例を示すブロック図。
第2図は本発明実施例の動作を示す流れ因である。
1・・・制御部本体(CPU)、z・・・キーボードデ
ィスプレイ(KB/CRT) 、s・・・フロッピーデ
ィスク装置(FD)、17°・・マイクロプロセッサ、
12・・・文書用メモリ、13・・・単語抽出部。 14・・・語幹抽出部、Is、Ill・・・八ツシエ演
算装置、16・・・スペル正否チェック部、17・・・
ハツシエテープル展開用メモリ。
ィスプレイ(KB/CRT) 、s・・・フロッピーデ
ィスク装置(FD)、17°・・マイクロプロセッサ、
12・・・文書用メモリ、13・・・単語抽出部。 14・・・語幹抽出部、Is、Ill・・・八ツシエ演
算装置、16・・・スペル正否チェック部、17・・・
ハツシエテープル展開用メモリ。
Claims (1)
- 接頭語、接尾語を除去し語幹を求める語幹抽出部と、語
幹とその語が持つ特性により特定ビットがセットされた
マスクパターンにより作成される基本辞書ハッシュテー
ブルと、上記語幹抽出部により抽出された語幹データに
よりその語幹のハッシュ関数値を計算するハッシュ演算
装置とを具備し上記ハッシュ演算装置によって求まるハ
ッシュ関数値と上記語幹抽出部により渡されるマスクパ
ターンに従がい上記基本辞書ハッシュテーブルを参照し
、そのマスクパターンに設定された特定のビットセット
を調べることによりその語が有するスペルの正否をチェ
ックすることを特徴とするワードプロセッサにおけるス
ペルチェック方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60016778A JPS61175848A (ja) | 1985-01-31 | 1985-01-31 | ワ−ドプロセツサにおけるスペルチエツク方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60016778A JPS61175848A (ja) | 1985-01-31 | 1985-01-31 | ワ−ドプロセツサにおけるスペルチエツク方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61175848A true JPS61175848A (ja) | 1986-08-07 |
Family
ID=11925651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60016778A Pending JPS61175848A (ja) | 1985-01-31 | 1985-01-31 | ワ−ドプロセツサにおけるスペルチエツク方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61175848A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63231569A (ja) * | 1987-03-12 | 1988-09-27 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 複合語の解析方法 |
-
1985
- 1985-01-31 JP JP60016778A patent/JPS61175848A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63231569A (ja) * | 1987-03-12 | 1988-09-27 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 複合語の解析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS59216189A (ja) | 文字発生方法 | |
JPS61175848A (ja) | ワ−ドプロセツサにおけるスペルチエツク方式 | |
JPS59165179A (ja) | 辞書引方式 | |
KR100434526B1 (ko) | 문맥정보및지역적문서형태를이용한문장추출방법 | |
JPS62245366A (ja) | 文書処理装置 | |
JP4919245B2 (ja) | 行組版装置、行組版プログラム及びそれを記録した記録媒体 | |
JP2009003717A (ja) | ふり仮名収集利用装置及びふり仮名収集利用方法 | |
JPH0537315Y2 (ja) | ||
JPH08190561A (ja) | 文書修正装置 | |
JP3035105B2 (ja) | 文章情報処理装置 | |
Haralambous et al. | Ω, a TEX extension including Unicode and featuring Lex-like filtering processes | |
Beccari | Language management and patterns for line breaking | |
JP2744430B2 (ja) | 自然言語処理装置 | |
JPS638820A (ja) | 文書清書装置 | |
JPS61202273A (ja) | 電子式辞書 | |
JP3809238B2 (ja) | 文書処理方法及びその装置 | |
JPS5832418B2 (ja) | 漢字まじり文入力装置 | |
JP2864691B2 (ja) | 学習支援装置 | |
JP2965578B2 (ja) | 文書作成支援方法 | |
JPH02136956A (ja) | レイアウト情報の抽出方法 | |
JPH032963A (ja) | 文書処理装置 | |
JPH05135006A (ja) | 文字処理方法及び装置 | |
JPH0778133A (ja) | 文書作成装置および文字パターン出力方法 | |
JPH01318153A (ja) | 文字処理装置 | |
JPH07141345A (ja) | 日本語文章処理方法 |