JPH0218514B2 - - Google Patents

Info

Publication number
JPH0218514B2
JPH0218514B2 JP57202220A JP20222082A JPH0218514B2 JP H0218514 B2 JPH0218514 B2 JP H0218514B2 JP 57202220 A JP57202220 A JP 57202220A JP 20222082 A JP20222082 A JP 20222082A JP H0218514 B2 JPH0218514 B2 JP H0218514B2
Authority
JP
Japan
Prior art keywords
value
representation
character string
angle
modulo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57202220A
Other languages
English (en)
Other versions
JPS58119033A (ja
Inventor
Jon Aaguhaato Robaato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS58119033A publication Critical patent/JPS58119033A/ja
Publication of JPH0218514B2 publication Critical patent/JPH0218514B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
発明の技術的分野 本発明は一般的にテキスト処理システムに係
り、特にテキスト処理システムにおいて辞書を圧
縮して記憶し、テキスト・ワードのつづり字を検
証するため辞書にアクセスする方法及び手段に係
る。 発明の技術的背景 入力されたワードのつづり字が正しいかどうか
を検証する機能を含む、先行技術を用いたテキス
ト処理システムは、たいていの場合、使用頻度の
高いワードが永久記憶された辞書を含む。限られ
た記憶容量のマイクロプロセツサによつて駆動さ
れるテキスト処理システムの出現以来、つづり字
を検証する機能として辞書を圧縮して記憶し、記
憶された辞書を高速にアクセスする方法の研究が
続けられている。このような辞書圧縮機能に関す
る先行技術の1つは米国特許第3925761号に2進
参照マトリツクスとして開示され、アルフアベツ
トの各文字は特定の数値を指定され、各々の辞書
ワードのベクトルの絶対値と角度を計算するため
ハツシユされる。ベクトルの絶対値と角度はマト
リツクスのXY座標を形成し、マトリツクスの各
位置に記憶される2進数1は有効辞書ワードを表
わし、2進数0は有効辞書ワードを表わさない。
アルフアベツト文字の数値を文字のエラー傾向に
反比例して選択することにより、2進参照マトリ
ツクスの構成は正確な検証に必要なアレイの大き
さを最小限にするのに対し、2進参照マトリツク
ス(BRM)による辞書ワードの表現は特定され
ず、絶対値と角度のBRM表示のまるめのエラー
による誤つた検証の可能性を最小限にするよう
に、エラー事象はマトリツクスの希薄領域にガー
ブルされたワードを写像する傾向に関連付けされ
なければならない。これは、必要な希薄領域を作
成するために多くの空白記憶位置が用意されなけ
ればならないことを意味する。 BRMベクトル記憶技術を改善するものとし
て、米国特許第3995254号は、各々の有効辞書項
目のベクトルの絶対値と角度をデイジタル表示す
る記憶アレイを含む装置を開示している。デイジ
タル表示はアルフア・ワード・ベクトル表示式に
従つて決定され、表示された各ワードの絶対値及
び完全に特定された角度を生成する。前記絶対値
及び角度は符号化され、記憶アレイに書込まれ
る。実際の絶対値と角度は前記記憶アレイに記憶
されるので、前記誤つた検証の可能性を最小限に
する希薄領域の必要性が取除かれる。しかしなが
ら、前記特許では実際の絶対値及び角度の値の記
憶が必要とされる。これらの値は入力ワードに対
して計算された絶対値及び角度の値と比較され、
入力されたワードが辞書に現われるかどうかが決
定される。前記特許では、順次に絶対値をインデ
ツクスすることによつて、絶対値を圧縮して記憶
する方法が開示されているが、インデツクス機能
には4ビツトが必要であり、復号されなければな
らないので、辞書アクセス・アルゴリズムの動作
速度が低下する。 本発明の概要 本発明は入力ワードの正しいつづり字を検証す
る際に用いる符号化されたデータの辞書フアイル
を記憶し、且つ高速にアクセスする、よりすぐれ
た方法を開示する。辞書ワードは数値に符号化さ
れ、絶対値及び角度にハツシユされ、その結果生
じたペアは最初に絶対値で分類され、次に同じ絶
対値において角度で分類される。次に、絶対値は
各々の可能な絶対値の2進表示と各々の実際の絶
対値の2進表示を有するポインタ・ビツト・ベク
トルに写像される。ポインタ・ビツト・ベクトル
は、そのままの値で記憶される角度の値と整合さ
れる。つづり字が検証される入力ワードは同様に
ハツシユされる。入力ワードの絶対値の値はポイ
ンタ・ビツト・ベクトルをアクセスし、ポイン
タ・ビツト・ベクトルは入力ワードと同じ絶対値
を有する角度のすべてに対してポインタを生成す
る。これらの角度は入力ワードに対して計算され
た角度と比較され、比較の結果及び、それに応じ
て入力ワードが正しくつづられているかどうかを
示す標識が生成される。絶対値当りの記憶を2ビ
ツトにすることにより、絶対値を表わすポイン
タ・ビツト・ベクトルの必要な記憶容量は最小限
になる。極めて少数の2進値の比較と平均して1
回未満の実際の角度の比較としか必要としないの
で辞書占有の有無を決定する速度が向上する。 詳細な説明 第1図に示す型の対話式情報処理システムにお
ける本発明の良好な実施例について説明する。第
1図の情報処理システムはターミナル1と、それ
に接続されたデイスケツト記憶装置16を含む。
ターミナル1はデイスプレイ14とキーボード1
0を有する。操作員はキーボード10の動作を介
してターミナル1にコマンドを入力し、ターミナ
ル1とデイスケツト記憶装置16の間の情報転送
を行なうことができる。更に、操作員は文字及び
数字と、デイスプレイ14の表示を制御するコマ
ンドを入力することができる。 第2図は第1図の情報処理システムの詳細を示
すブロツク図である。第2図に示すように、情報
処理システムはキーボード10、マイクロプロセ
ツサ11、表示リフレツシユ・バツフア12、デ
イスプレイ14、及びデイスケツト・ドライブの
ような補助直接アクセス記憶装置(以下、デイス
ケツト記憶装置という)16を含む。更に、ハー
ド・コピーを出力するプリンタ15がマイクロプ
ロセツサ11に接続され、且つシステムのそれぞ
れの構成要素の同期を保持するクロツク17が各
装置に有効に接続されている。 キーボード10は文字、数字、句読点のような
グラフイツク記号キーの通常のセツト、特殊キヤ
ラクタ・キー、及びキヤリア・リターン,タブ,
インデツクス等のようなテキスト・フオーマツ
ト・キーまたはテキスト制御キーを含む。更に、
キーボード10はシステムに特殊制御コマンドを
出す制御キーのもう1つのセツトを含む。制御キ
ーにはキーボード10を複数の異なるモードにセ
ツトするカーソル移動キー等が含まれる。 キーボード10はバス20によつてマイクロプ
ロセツサ11に接続されている。マイクロプロセ
ツサ11は第3図に示すように、入力ポート2
1、出力ポート22、ランダム・アクセス・メモ
リ(以下、RAMという)23、及びプロセス実
行ユニツト24を含む。 RAM23は機能的には命令とデータの両者を
記憶する。命令とデータはキーボーード10から
入力ポート21を介してRAM23に2進情報の
バイトとして入力される。第4図に示すように、
RAM23で、キーボード10からキーストロー
ク・データを受取るセクシヨンはキーストローク
待行列26と呼ばれる。表示されるデータは1組
の命令によつてキーボード待行列26からテキス
ト・バツフア27に転送され、次にマイクロプロ
セツサ11の出力ポート22を介して表示リフレ
ツシユ・バツフア12に転送される。これは1組
の転送命令を実行するマイクロプロセツサ11に
よつて通常の方法で行なわれる。 マイクロプロセツサ11はIBMシリーズ1、
Intelモデル8086または機能的に同等と認められ
る、現在市販のマイクロプロセツサのいずれでも
よい。 表示リフレツシユ・バツフア12は、出力ポー
ト22とデイスプレイ14の間に接続された別個
のバツフアとして示されているが、実際には通常
はデイスプレイ14の一部分であり、表示スクリ
ーンの1組の水平線をトレースする電子ビームの
ON−OFF制御を実行することによつて、デイス
プレイ14の表示スクリーン上のキヤラクタの生
成を制御するように作用する。 出力ポート22はまた、RAM23に記憶され
たデータをプリンタ15及びデイスケツト記憶装
置16に供給する。プリンタ15及びデイスケツ
ト記憶装置16の各々はそれ自身のバツフアを内
蔵していることがある(図示せず)。データを
RAM23からプリンタ15またはデイスケツト
記憶装置16に転送するコマンドは、操作員によ
つてキーボード10からマイクロプロセツサ11
に送られる。 プリンタ15は技術的に既知な適合するどのプ
リンタでもよい。大部分のテキスト処理システム
では、プリンタ15は基本的に、タイプ・ボール
素子又はデイジイ・ホイール素子を有する標準入
出力ターミナル・プリンタである。 デイスケツト記憶装置16もまた、データを検
索するのにマイクロプロセツサ11によつて各々
がランダムにアドレス指定可能な、決められたセ
クタ・アドレス位置で供給されるデータを、バイ
ト・シリアルで記憶することが可能な、適合する
どのデイスケツト記憶装置でもよい。デイスケツ
ト記憶装置16から供給される位置関連のデータ
はRAM23の表示データ・エリア28に符号化
された形式で記憶される。第4図に示すRAM2
3の他のセクシヨンは表示フオーマツト・バツフ
ア29である。表示フオーマツト・バツフア29
は本発明に従つて位置関連のデータを復号された
形式で処理するのに関連する。 第5図はデイスプレイ14のスクリーンの概要
図である。第4図に示すように、スクリーンは、
例えば、各行が80キヤラクタのカラム位置から成
る行を25行表示する能力を有する。実際には、1
キヤラクタ位置にドツト位置すなわちペルと呼ば
れる画素のマトリツクスから成る。デイスプレイ
14で表わされる型のデイスプレイの代表的なキ
ヤラクタ・マトリツクスは幅6ペル、高さ10ペル
のマトリツクス32である。表示リフレツシユ・
バツフア12とデイスプレイ14の対話は、表示
リフレツシユ・バツフア12にある位置に記憶さ
れたキヤラクタを、デイスプレイ14のスクリー
ンの同等の位置に、6×10のドツト・マトリツク
スの形式の対応するキヤラクタに変換することで
ある。デイスプレイ14は一般に前記変換を実行
する電子回路を内蔵している。マイクロプロセツ
サ11は表示リフレツシユ・バツフア12にアド
レスを供給し、適切なキヤラクタをロードするこ
とのみを必要とする。 デイスケツト記憶装置16もまた、一般に、
RAM23の表示データ・エリア28から出力ポ
ート22を介して供給されたデータ・バイトをビ
ツト・シリアルのデータ・ストリームに変換し、
デイスケツト上のアドレス指定された同心円の記
憶トラツクの1つの所定のセクタに記録させる電
子回路を内蔵している。デイスケツト記憶装置1
6からのデータは、要求されると、記憶されたト
ラツクのアドレス指定されたセクタからバイト・
シリアルで、マイクロプロセツサ11に供給され
る。 これまでに説明したマイクロプロセツサ11に
関連する機能及び対話のすべては適合するプログ
ラムによつて実行される。前記プログラムもまた
RAM23に記憶され、キーボード10からのデ
ータ、または第1図に示すシステムのそれぞれの
構成要素によつて生成される割込信号に対応する
動作が行なわれる。 システムの組合せを利用する本発明の動作につ
いて、第2、第6及び第7図によつて説明する。
第6図は本発明に従つてテキスト・ワードの辞書
フアイルを符号化する機能の論理的流れ図を示
す。辞書フアイルを符号化する機能と入力ワード
を復号する機能は極めて類似していることは明白
であるから、符号化機能についての詳細な説明の
みを第7図によつて説明する。 第6図において、符号化され、RAM23また
はデイスケツト記憶装置16に記憶される辞書フ
アイルはブロツク40で入力され、ブロツク41
でハツシユ・アルゴリズムによつて処理される。
ブロツク41のハツシユ・アルゴリズムの詳細は
前記米国特許第3995254号において完全に説明さ
れているハツシユ・アルゴリズムに類似してい
る。ハツシユ・アルゴリズムは各々のワードの中
の各々のキヤラクタに数値を指定し、各々のワー
ドのベクトルの絶対値と角度を計算する。ブロツ
ク42で、ベクトルの値は最初に絶対値によつて
分類され、次にそれぞれの絶対値内で角度の値に
よつて分類される。 ブロツク43で、絶対値は符号化され、ポイン
タ・ビツト・ベクトル(PVEC)が生成される。 ハツシユ・アルゴリズムは、絶対値が0からN
−1の範囲になるように修正され、且つN個の辞
書ワードをハツシユすることによつて生じた絶対
値が前記の絶対値の範囲にわたつて一様に分散さ
れるように修正される。これは、ワードの絶対値
を前記の範囲内にランダム化乃至分散させるのに
十分な頻度でそれらのワードの絶対値が前記の範
囲を循環するように、絶対値の重みの値を選択
し、モジユロNを計算することによつて達成され
る。 フアイルがハツシユされ、(辞書の中のワード
数をNとして、i=0 to N−1)分類された
後m(i)とa(i)がi番目の絶対値と角度のペ
アを表わすものとする。正確に2Nビツトのポイ
ンタ・ビツト・ベクトル(PVEC(j),j=0
to 2N−1)が構成される。PVECには正確にN
個の0及びN個の1がある。各々の0は可能な絶
対値(すなわち、0,1,……N−1)の1つを
表わす。各々のm(i)は1個の1によつて表わ
される。i番目の絶対値m(i)を表わす1は
PVECの(i+m(i)+1)番目のビツト位置に
置かれる。 このベクトルは、各ワードに対して正確に2ビ
ツトを要求しているので、本来の絶対値の情報の
すべてを保有する。この写像は次のループによつ
て行なわれる。 do i=0 to N−1 PVEC(i+m(i)+1)=1 end このベクトルは次のように解釈される。すなわ
ち、j番号の0(j=0から数えて)は、jに等
しい絶対値m(i)の位置保持者と見なされる。
jの値を有するm(i)のすべては、前記j番目
の0の直後の1によつて表わされる。例えば、3
個のm(i)が174に等しければ、174番目の0の
後に3個の1が続く。PVECの中のk番目の1
(k=0 to N−1)は与えられた分類シーケン
スの中のk番目の辞書項目を表わす。 ブロツク43のポインタ・ビツト・ベクトルの
符号化に続いて、ブロツク44で、MTABと呼
ばれるインデツクス・テーブルが計算され、各々
のアクセスでポインタ・ビツト・ベクトルの最初
から走査することを必要とせずに、ポインタ・ビ
ツト・ベクトルを速かにアクセスする手段が与え
られる。ポインタ・ビツト・ベクトルへの入力点
の間隔については辞書項目の全数に基づき、設計
者が選択する。ポインタ・ビツト・ベクトル
PVECの先頭から開始されるサーチの平均の長さ
は、Nが辞書項目の全数を表わすものとして、
N/2である。インデツクス・デルタMDELが
選択される場合、MTABが計算され、PVECに
おいて最も近いMDEL入力点からのサーチ距離
が与えられる。従つて、サーチの平均の長さは
MDEL/2に減少される。使用されているイン
デツクス技術はPVECにおいて直接に0を指し、
最も近い複数のMDELを表わし、そこから、絶
対値のMDELを法とする計算に基づいて走査す
る。例えば、選択されたインデツクス値が
MDEL=32であるものとする。絶対値MAG=89
に対して、64に対する0が直接に指定され、
PVECはその点から、絶対値25の分に対して順方
向に走査される。 第1表はインデツクス・デルタ4(MDEL=
4)を用いて8ワード(N=8)の簡単な辞書の
インデツクス・テーブルを計算するプログラム・
ルーチンを示す。前に説明したように、ポイン
タ・ビツト・ベクトルPVECは各々のワードの絶
対値に対して2ビツト、すなわち2Nビツトを有
する。従つて、N=8の場合、PVECは16ビツト
を有する。PVECにおけるビツト位置は第1表で
j(0〜15)によつて識別される。8ワードのそ
れぞれの絶対値はMAG(i)で示される。
【表】 MTABインデツクス・ポイントは絶対値カウ
ント及び選択されたインデツクス・デルタの関数
として計算される。この例では、絶対値0〜3に
対してはMTABは0であり、絶対値4〜7に対
してはMTABは−1である。これによつて
PVECへの入力点は、絶対値0〜3に対しては位
置0に、絶対値4〜7に対しては位置7に与えら
れる。入力点のアクセスについては復号方法に関
連して後に詳細に説明する。ここでは説明を容易
にするため意図的に簡単な例を用いたが、この方
法は非常に大きい辞書にも適用することができ
る。例えば、インデツクス・デルタ64、ワード
50kの辞書は782のMTAB入力を有するであろ
う。 ブロツク44のMTABの計算に続いて、ブロ
ツク45で、PVEC,MTAB、及び分類された
角度の値のテーブルはデイスケツト記憶装置16
に記憶され、システムに入力されたワードのつづ
り字の検査に使用される。 入力ワードのつづり字を検査する方法について
第7図及び第2表に関連して説明する。つづり字
のエラーが検査されるテキスト・ワードは、デー
タ入力動作の一部としてキーボード10を介して
システムに入力されることもあり、データ修正動
作の一部としてデイスケツト記憶装置16から入
力されることもある。いずれの場合も、テキス
ト・ワードはマイクロプロセツサ11のRAM2
3に記憶され、前に説明したように、符号化され
ているシステム辞書に対して検証される。その場
合、各入力ワードはシステム辞書との比較前に同
じように符号化される。ハツシユ・アルゴリズム
50(第7図)を介してワードを入力することに
よつて符号化は達成され、ワードの絶対値及び角
度表示が生成される。第7図に示す例は、第1表
に関連して説明した8ワード辞書に対する辞書表
現及び復号である。第2表は第7図の機能を実行
するプログラム・ルーチンである。入力ワードの
符号化は絶対値6及び角度の値76を生じるもの
とする。絶対値はレジスタ51で高い成分
(MHI)と低い成分(MLO)に分解される。低
い成分は絶対値のインデツクス・デルタを法とす
る。第1表に関連して説明したように、インデツ
クス・デルタ(MDEL)は4である。高い成分
は絶対値から低い成分を差引いた値に等しい。絶
対値の高い成分(MHI)はブロツク52で
MDELによつて割られる。その結果はインデツ
クス・テーブル54に送られ、ポインタ・ビツ
ト・ベクトルPVECへの入力点の調整を行なう。
ブロツク52の結果が0の場合にはMTABの値
として0が生成され、ブロツク52の結果が1の
場合にはMTABの値として−1が生成される。
ここに示す例では、MTABの値として−1が生
成され、ブロツク55で、絶対値における高い成
分に加えられ、ブロツク56で、高い成分の2倍
の値に加えられる。これによつて、角度テーブル
59へのアクセス点DINDを位置3で生じ、
PVEC57へのアクセス点PIND(第2表)を位
置7で生じる。次に、PVECは右に走査し、角度
テーブルは下方に走査する。PVECで出会つた
各々の0はレジスタ51のMLO出力を、その値
が−1に達するまで減分させる(ブロツク58)。
出会つた各々の1は角度テーブルのインデツクス
値DINDを1ずつ増加させる。MLOの値が−1
に達したとき、DINDに対応し、かつDINDに続
く角度の値は入力ワードに対して生成された角度
と比較される(ブロツク60)。その結果、一致
が生じた場合には、入力ワードのつづりが正しい
ことを示すコードがセツトされる。角度テーブル
からの角度の値を越える場合には、入力ワードの
つづりが正しくないことを示すコードがセツトさ
れる。
【表】 前に述べたように、説明を容易にするため小さ
い辞書の例を用いて本発明の説明を行なつたが、
既に明らかなように、単にMDELの値とPVECの
大きさを変更するだけで、本発明の範囲は非常に
大きい辞書にも適用可能である。
【図面の簡単な説明】
第1図はターミナル及び記憶装置を含む情報処
理システムの概観図、第2図は第1図の情報処理
システムのブロツク図、第3図は第2図に示すマ
イクロプロセツサの機能図、第4図はメモリの一
部分と、マイクロプロセツサと、表示リフレツシ
ユ・バツフアの間のデータ・フロー経路を示す機
能図、第5図は第1図に示すデイスプレイのスク
リーンの概要図、第6図は本発明の符号化機能の
動作を示す論理的流れ図、第7図は本発明の検証
機能の動作の流れの詳細図である。 1……ターミナル、10……キーボード、11
……マイクロプロセツサ、12……表示リフレツ
シユ・バツフア、14……デイスプレイ、15…
…プリンタ、16……デイスケツト記憶装置、1
7……クロツク、20……バス、21……入力ポ
ート、22……出力ポート、23……RAM、2
4……プロセス実行ユニツト、26……キースト
ローク待ち行列、27……テキスト・バツフア、
28……表示データ・エリア、29……表示フオ
ーマツト・バツフア。

Claims (1)

  1. 【特許請求の範囲】 1 辞書のキヤラクタ・ストリング中に、或る入
    力されたキヤラクタ・ストリングがあるか検査す
    ることのできるテキスト処理装置に於て、 各キヤラクタ・ストリングに対応する、数値び
    及角度の表現を計算する手段50と、 前記キヤラクタ・ストリングの数値表現のモジ
    ユロNの値を計算する手段50と、 前記辞書のキヤラクタ・ストリングの全数をN
    として、2N個のビツト位置を有するメモリ・バ
    ツフアであつて、数値の順序に分類されたN個の
    キヤラクタ・ストリングの数値表現のモジユロN
    の値の各々に対して第1の値のビツト位置が一つ
    ずつ割り当てられるよう、基準ビツト位置から前
    記割り当てられた第1の値のビツト位置までの間
    の第2の値のビツト位置の数によつて、その間の
    他の第1の値のビツト位置の在在に関係なく、前
    記モジユロNの値の各々をあらわした前記メモ
    リ・バツフア57と、 前記数値の順序に分類されたN個のキヤラク
    タ・ストリングの数値表現のモジユロNの値に対
    応して前記角度の表現を記憶するメモリ手段59
    と、 入力されたキヤラクタ・ストリングについて計
    算された数値表現のモジユロNの値に対し割り当
    てられた第1の値のビツト位置を求めて、前記メ
    モリ・バツフアを走査する手段56,58と、 前記入力されたキヤラクタ・ストリングについ
    て計算された角度の表現を求めて、前記メモリ手
    段を、前記メモリ・バツフアの走査と同期して走
    査する手段55と、 前記入力されたキヤラクタ・ストリングのモジ
    ユロNの値を有する、前記メモリ・バツフアのビ
    ツト位置に対応する位置の、メモリ手段中の角度
    の表現を、前記入力されたキヤラクタ・ストリン
    グの角度の表現に比較し、一致するか否かを表す
    出力を生じる比較手段60とを有するテキスト処
    理装置。 2 前記第1の値が2進数の1であり、前記第2
    の値が2進数の0であることを特徴とする特許請
    求の範囲第1項記載のテキスト処理装置。 3 前記メモリ・バツフアを走査する手段が、前
    記N個の2進数の1の前記メモリ・バツフア中で
    の相対的な位置に基づいて前記基準のビツト位置
    以外の途中のビツト位置から走査を開始できるこ
    とを特徴とする特許請求の範囲第2項記載のテキ
    スト処理装置。
JP57202220A 1981-12-29 1982-11-19 テキスト処理装置 Granted JPS58119033A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US06/335,478 US4503514A (en) 1981-12-29 1981-12-29 Compact high speed hashed array for dictionary storage and lookup
US335478 1981-12-29

Publications (2)

Publication Number Publication Date
JPS58119033A JPS58119033A (ja) 1983-07-15
JPH0218514B2 true JPH0218514B2 (ja) 1990-04-25

Family

ID=23311945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57202220A Granted JPS58119033A (ja) 1981-12-29 1982-11-19 テキスト処理装置

Country Status (2)

Country Link
US (1) US4503514A (ja)
JP (1) JPS58119033A (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4689768A (en) * 1982-06-30 1987-08-25 International Business Machines Corporation Spelling verification system with immediate operator alerts to non-matches between inputted words and words stored in plural dictionary memories
US4730269A (en) * 1983-02-18 1988-03-08 Houghton Mifflin Company Method and apparatus for generating word skeletons utilizing alpha set replacement and omission
JPS59167738A (ja) * 1983-03-11 1984-09-21 Brother Ind Ltd スペル照合装置
US4677550A (en) * 1983-09-30 1987-06-30 Amalgamated Software Of North America, Inc. Method of compacting and searching a data index
US4742481A (en) * 1984-04-13 1988-05-03 Brother Kogyo Kabushiki Kaisha Electronic dictionary having means for linking two or more different groups of vocabulary entries in a closed loop
US4775251A (en) * 1984-10-08 1988-10-04 Brother Kogyo Kabushiki Kaisha Electronic typewriter including spelling dictionary
JPS6195472A (ja) * 1984-10-16 1986-05-14 Brother Ind Ltd 電子タイプライタ
US4771385A (en) * 1984-11-21 1988-09-13 Nec Corporation Word recognition processing time reduction system using word length and hash technique involving head letters
US5091950A (en) * 1985-03-18 1992-02-25 Ahmed Moustafa E Arabic language translating device with pronunciation capability using language pronunciation rules
JPS61214051A (ja) * 1985-03-20 1986-09-22 Brother Ind Ltd 電子辞書
JPH0762848B2 (ja) * 1985-03-23 1995-07-05 ブラザー工業株式会社 電子辞書
JPS61217863A (ja) * 1985-03-23 1986-09-27 Brother Ind Ltd 電子辞書
US4758955A (en) * 1985-07-19 1988-07-19 Carson Chen Hand-held spelling checker and method for reducing redundant information in the storage of textural material
US4773039A (en) * 1985-11-19 1988-09-20 International Business Machines Corporation Information processing system for compaction and replacement of phrases
US4915546A (en) * 1986-08-29 1990-04-10 Brother Kogyo Kabushiki Kaisha Data input and processing apparatus having spelling-check function and means for dealing with misspelled word
JPS6359660A (ja) * 1986-08-29 1988-03-15 Brother Ind Ltd 情報処理装置
US4829472A (en) * 1986-10-20 1989-05-09 Microlytics, Inc. Spelling check module
US5008818A (en) * 1989-04-24 1991-04-16 Alexander K. Bocast Method and apparatus for reconstructing a token from a token fragment
US5055049A (en) * 1990-01-25 1991-10-08 Kasravi Peter B Word listing system
US5204966A (en) * 1990-03-09 1993-04-20 Digital Equipment Corporation System for controlling access to a secure system by verifying acceptability of proposed password by using hashing and group of unacceptable passwords
US5671426A (en) * 1993-06-22 1997-09-23 Kurzweil Applied Intelligence, Inc. Method for organizing incremental search dictionary
US5812882A (en) * 1994-10-18 1998-09-22 Lanier Worldwide, Inc. Digital dictation system having a central station that includes component cards for interfacing to dictation stations and transcription stations and for processing and storing digitized dictation segments
US5649221A (en) * 1995-09-14 1997-07-15 Crawford; H. Vance Reverse electronic dictionary using synonyms to expand search capabilities
US8631796B2 (en) * 1997-04-10 2014-01-21 Cookgas, L.L.C. Laryngeal mask
US9020964B1 (en) * 2006-04-20 2015-04-28 Pinehill Technology, Llc Generation of fingerprints for multimedia content based on vectors and histograms
US8156132B1 (en) 2007-07-02 2012-04-10 Pinehill Technology, Llc Systems for comparing image fingerprints
US7991206B1 (en) 2007-07-02 2011-08-02 Datascout, Inc. Surrogate heuristic identification
US8463000B1 (en) 2007-07-02 2013-06-11 Pinehill Technology, Llc Content identification based on a search of a fingerprint database
US8549022B1 (en) 2007-07-02 2013-10-01 Datascout, Inc. Fingerprint generation of multimedia content based on a trigger point with the multimedia content
US7840540B2 (en) 2006-04-20 2010-11-23 Datascout, Inc. Surrogate hashing
US8086953B1 (en) * 2008-12-19 2011-12-27 Google Inc. Identifying transient portions of web pages
US8121991B1 (en) 2008-12-19 2012-02-21 Google Inc. Identifying transient paths within websites
US8830714B2 (en) * 2012-06-07 2014-09-09 International Business Machines Corporation High speed large scale dictionary matching

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3625761A (en) * 1969-12-23 1971-12-07 Texaco Inc Method for the treatment of alkaline earth metal sulfate scale
US3995254A (en) * 1975-07-16 1976-11-30 International Business Machines Corporation Digital reference matrix for word verification

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3717851A (en) * 1971-03-03 1973-02-20 Ibm Processing of compacted data
US3932859A (en) * 1974-03-07 1976-01-13 Anastasios Kyriakides Electronic dictionary with word length responsive decoder
US3925761A (en) * 1974-08-02 1975-12-09 Ibm Binary reference matrix for a character recognition machine
US3949208A (en) * 1974-12-31 1976-04-06 International Business Machines Corporation Apparatus for detecting and correcting errors in an encoded memory word
US4159536A (en) * 1977-04-08 1979-06-26 Willard E. Kehoe Portable electronic language translation device
JPS6239467Y2 (ja) * 1978-11-20 1987-10-08
US4290105A (en) * 1979-04-02 1981-09-15 American Newspaper Publishers Association Method and apparatus for testing membership in a set through hash coding with allowable errors
GB2061575B (en) * 1979-10-24 1984-09-19 Matsushita Electric Ind Co Ltd Method and apparatus for encoding low redundancy check words from source data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3625761A (en) * 1969-12-23 1971-12-07 Texaco Inc Method for the treatment of alkaline earth metal sulfate scale
US3995254A (en) * 1975-07-16 1976-11-30 International Business Machines Corporation Digital reference matrix for word verification

Also Published As

Publication number Publication date
JPS58119033A (ja) 1983-07-15
US4503514A (en) 1985-03-05

Similar Documents

Publication Publication Date Title
JPH0218514B2 (ja)
US3995254A (en) Digital reference matrix for word verification
US4689768A (en) Spelling verification system with immediate operator alerts to non-matches between inputted words and words stored in plural dictionary memories
EP0277356B1 (en) Spelling error correcting system
JP2502021B2 (ja) 多バイトデ―タ変換方法及びシステム
US5537425A (en) Parity-based error detection in a memory controller
US4650349A (en) Speed typing apparatus and method
EP0098959A2 (en) Method for producing right margin justified text data in a text processing system
JPH0634260B2 (ja) 単語辞書照合装置
GB2097974A (en) Spelling error detector apparatus and methods
US5329598A (en) Method and apparatus for analyzing character strings
US3925761A (en) Binary reference matrix for a character recognition machine
JPH0218987B2 (ja)
US5297038A (en) Electronic dictionary and method of codifying words therefor
Rosenbaum et al. Multifont OCR postprocessing system
EP0097818B1 (en) Spelling verification method and typewriter embodying said method
JP4451908B2 (ja) ユニコード・コンバータ
US4988997A (en) Method for character code generation
US6226411B1 (en) Method for data compression and restoration
JPH07101382B2 (ja) マ−ジ処理装置
JPS62165238A (ja) 電子辞書の検索方法
JP2993539B2 (ja) データベース検索システムおよびその方法
JPH0677252B2 (ja) 和文データ入力処理装置
JPH0528194A (ja) データアクセス方式
JPH04283853A (ja) カナ−漢字変換方法