JPS62239264A - 文字列処理装置 - Google Patents

文字列処理装置

Info

Publication number
JPS62239264A
JPS62239264A JP61081084A JP8108486A JPS62239264A JP S62239264 A JPS62239264 A JP S62239264A JP 61081084 A JP61081084 A JP 61081084A JP 8108486 A JP8108486 A JP 8108486A JP S62239264 A JPS62239264 A JP S62239264A
Authority
JP
Japan
Prior art keywords
word
spelling
input
character string
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61081084A
Other languages
English (en)
Inventor
Yasuyuki Numata
泰之 沼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61081084A priority Critical patent/JPS62239264A/ja
Publication of JPS62239264A publication Critical patent/JPS62239264A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 皮亙欠1 本発明は文字列処理装置に関し、特につづりのチェック
を効率的に行う文字列処理装置に関する。
従」Uえ出 ワード・プロセッサや翻訳装置等の文字列処理装置は、
操作者により入力された文字列を文節、単語等に分割し
て解析する必要がある0例えば英文を和文に翻訳する英
日翻訳装置においては英文の解析のためまず形態素解析
を行なう必要があるが、形態素解析にあたっては誤った
つづりの単語が存在しないことが正しい解析結果を得る
ために必要な条件である。そこで入力された英文を単語
に分割して、入力された各I′n +;/jのつづりが
正しいか否かの検査を行なう必要がある。
従来、このようなつづりの検査は入力された英文を?i
i語に分割した後、装置内の辞書により分割した各I′
It語を順番に照合することにより行っていた。すなわ
ち、各々の単語について1回ずつ辞書にアクセスし、そ
のCp−ii5のつづりと辞書中のLli語のつづりと
のマツチングをとることによりつづりのチェックを行っ
ていた。ところが、従来は頻繁に出現する冠詞やbe動
詞等を含むすべての単語について、すべての単語が記憶
された同一の辞書にアクセスすることによりつづりのチ
ェックを行っていたため、つづりの検査が翻訳動作の前
処理的なプロセスにもかかわらず時間がかり、装この動
作上非能率的になるという欠点があった。
ト1的 本発明はこのような従来技術の欠点を解消し、入力され
た文字列のつづりの検査を迅速に処理することができる
文字列処理袋ごを提供することを目的とする。
構  成 本発明は上記の目的を達成させるため、文字列を入力す
る入力手段と、入力手段から入力された文字列により構
成される単語のつづりを検査するつづり検査手段と、入
力手段から入力された文字列およびつづり検査手段によ
りつづりの検査をされた単語を表示する表示手段とを有
し、つづり検査手段は、頻繁に使用される単語を記憶し
た頻出解析辞書と、その他の単語を記憶した一般解析辞
書と、これらの辞書を検索する辞書検索手段とを有する
ことを特徴としたものである。以下、本発明の一実施例
に基づいて具体的に説明する。
第1図に本発明による文字列処理装置を適用した英日翻
訳装置におけるスペルチェック装置の一実施例の機部ブ
ロック図を示す。
本装置は、入力部2、入力文字列保存部4、単語分割処
理部6、単語列保存部8、スペルチェックモジュールI
O1頻出解析辞書12、一般解析辞書14、辞書検索部
18、文書編集部18、表示制御部20および表示部2
2を有する。
入力部2は、:f、数字、記す、カーソル移動、翻訳開
始、訳1i1%選択などのキーを含むキーボードまたは
光学的読取装置(OCR) 、フロッピーディスク等か
らの読取装置等の入力装置からなり、翻訳される英語の
文字列により構成される入力文が入力される。
入力文字列保存部4は、入力部2から入力された英語の
入力文を一時的に保存する。
ti語分;1,1処理部6は、入力文字列保存部4に保
存された英語の入力文を読み出し、ブランクやピリオド
等の設定条件に従い、英語の入力文を単語中位に分割す
る。
単語列保存部8は、単語分割処理部6においてrn語分
割された英語単語列を一時的に保存する。
スペルチェックモジュール10は、単語列保存部8に保
存された英35!’11語列を読み出し、英語単語列の
各単語について単++11のつづりを検査する。
辞占検索部16は、スペルチェックモジュールi。
においてつづりの検査をする英語単311列の各単語を
順番に読み出し、各単語の見出しを用いて冠詞1代名詞
、be動詞等の頻出単語が記憶された頻出解析辞書12
および一般単語が記憶された一般解析辞書14を検索す
る。
頻出解析辞書12には、rthe J 、  ra J
、r anJ等の冠詞やris」、ramJ、rare
J等のbe動詞およびr(」、r l1eJ、ryou
4等の代名詞等頻出単語が記憶されており、一般解析辞
書14には、汗通名詞や動詞および副詞等の一般単語が
記憶されている。
文書編集部18は、入力部2から入力された英語の入力
文、単語列保存部8に保存された英語単語列およびスペ
ルチェックモジュール10において英語単語列の各単語
について単語のつづりを検査した結果を読み出し編集す
る。
表示制御部20は、文書編集部18で編集された文字列
を表示部22に送り、表示部22を制御する。また、ス
ペルチェックモジュール10において英語単語列の各単
語について単語のつづりを検査した結果、誤ったつづり
があった場合には、誤ったつづりの単語を点滅表示する
等の方法を用いることにより、つづりの正しい部分とつ
づりが誤っている部分とを差別表示するように表示部2
2を制御する。
表示部22は、CRT¥;−の表示装置からなり1表示
制御部20を介して送られた文字列を、表示制御部20
の指示による表示方法に従い表示する。
次に、スペルチェー2クプロセスについて第2図に示す
フローチャートにより説明する。
例えば、次のような英文が入力部2から入力された場合
について説明する。
入力文:  rThe  edetar  has a
 set ofaptians which can 
be very usaful 、 Jこの入力文にお
いて、  redetorJとrusafulJがミス
スペルであり、正しいスペルはreditorJとru
sefulJである・ 入力文であるr The edetor hasa s
et ofoptions  which  can 
 be  very  usaful  、  J  
は、 一旦、入力文字列保存部4に保存された後、単語
分−11処理部6においてブランクやピリオド等の単語
中位に分’Mするための設定条件に従い第3図(a)に
示すように単語分割され、単語列保存部8に保存される
次に、スペルチェックをするためにスペルチェックモジ
ュール10のレジスタに、単語分割され11i語列保存
部8に保存されている英語の単語列から先ずrThe 
Jをセットする(102) 。
次に、rThe Jが頻出解析辞書12中に存在するか
否かを調べるため、辞書検索部IBにより頻出解析辞書
12を検索しく104)、rTheJが願出解析辞書1
2中に存在する場合は正しいスペルとしてマーキングを
行なう(110)。
次に、単語分割され単語列保存部8に保存された英語の
単語列から次の単語r 6detarJのスペルチェッ
クをするために、スペルチェックモジュール10のレジ
スタにセットする(102) 。
次に、redetorJが頻出解析辞書12中に存在す
るか否かを調べるため、辞書検索部16により頻出解析
辞書12を検索しく104) 、存在する場合は前述の
rTheJと同様の動作を行ない、存在しない場合はr
 edetoBが一般解析辞書14中に存在するか否か
を調べるため、辞書検索部!8により一般解析辞書14
を検索する( toe)。
r edetorJが一般解析辞書14中に存在する場
合はステップ110に移り、redetorJが一般解
析辞書14中に存在しない場合には、ミススペルとして
マーキングを行なう(108) 、この場合にはr 2
detorJは、頻出解析辞書12と一般解析辞書14
のいずれにも存在しないことによりミススペルと判断さ
れ、ミススペルとしてのマーキングがされる(108)
このような動作を繰り返すことにより、単語分割処理部
6において単語分割され、単語列保存i′il!8に保
存された英語の単語列のスペルチェックを行ない分割さ
れた全ての単語についてスペルが正しいか否かのマーキ
ングを行なう[第3図(b月。 このように木実流側に
おいては、英日翻訳装置で翻訳する英文が操作者により
入力され、その英文の各単語についてのスペルのチェッ
クをするときに、スペルチェックのために頻出解析辞書
12と一般解析辞書14を有している。しかも最初に頻
出解析辞書12により単語の検索をし、次に一般解析辞
書14による単語の検索をするので、頻繁に出現するr
theJ、r allJ、ra4、「Is」、「■」等
の冠詞、be!!IJ詞、代名詞は頻出解析辞書12に
より短時間で検索できる。したがって、一般解析辞書だ
けで処理を行なう装置と比較して、能率よく短時間でス
ペルチェックの処理を行なうことができる。
次に、スペルチェック機能におけるミススペルの警告プ
ロセスについて第4図に示すフローチャートにより説明
する。
第2図の動作と同様にスペルチェックモジュール10に
おいてスペルのチェックを行ない、単語列保存部8に保
存された英語の単語列について、先ず単語列保存部8の
単語バッファの中に未確認の単語があるか否かを判断す
る(120)。
単語バッファの中に未確認の単語がない場合は動作を終
了し、未確認の単語がある場合にはステップ140に移
る。
次に、未確認の単語についてミススペルであることを知
らせるマーキングがされているか否かを’14 tfi
しく+40) 、  ミススペルであることを知らせる
マーキングがされていない場合はポインタを次の単語に
移動して(160)ステップ+20に移る。
ミススペルであることを知らせるマーキングがされてい
る場合には、操作者にその単語がミススペルであること
を警告するための指示を表示制御部20に送出する(1
80) 。
このステップ180の指示に従い、表示制御部20は点
滅表示等の方法により、ミススペルの単語と正しいスペ
ルの単語との差別表示を行なう。
本実施例によれば、スペルチェック機能に加えてミスス
ペルを知らせる警告機能を有しているため、入力された
英文にミススペルの単語があった場合に、ミススペルの
m語は点滅表示等の方法により、正しいスペルの単語と
差別表示される。したがって、操作者はミススペルの単
語をすぐに認識でき修正することができる。
以上の実施例は英日翻訳装置における英文のつづりのチ
ェックについて説明したが、英語以外のアルファベット
等の通常1文字では記号のように言語としての意味を成
さないが、文字の組合せにより単語を形成し言語として
の意味を成す、例えばフランス語やドイツ語等の言語に
よる入力文のつづりのチェックにも適用でき、さらには
漢字等の入力文における誤字のチェックにも適用できる
効  果 本発明によれば、入力された語句に誤ったつづりの単語
があった場合に、つづりの検査を装置内にある頻出解析
辞書と一般解析辞書の2つの辞書により行なうため、短
時間にしかも能率よくつづりの検査を行なうことができ
る。
【図面の簡単な説明】
第1図は、本発明による文字列処理装置の一実施例を示
す機能ブロック図、 第2図は、第1図の装置におけるスペルチェックプロセ
スの動作を示すフローチャート。 第3図は、第1図の装置における単語列保存部に保存さ
れた英語CD +iW列の保存状態の例を示す説明図、 第4図は、第1図の装置におけるスペルチェック機能に
おける警告プロセスの動作を示すフローチャートである
。 主要部分の符号の説明 219.入力部 4111入力文字列保存部 e、、、I′liシlI分割処理部 B、、、CI′i語列保存部 10、、、スペルチェックモジュール 12、、、頻出解析辞;g 14、、、一般解析辞占 1B、、、辞1り検索部 18、、、文、り編集部 20、、、表示制御部 22、、、表示部 集l 面 纂2図

Claims (1)

  1. 【特許請求の範囲】 1、文字列を入力する入力手段と、 該入力手段から入力された文字列により構成される単語
    のつづりを検査するつづり検査手段と、前記入力手段か
    ら入力された文字列および前記つづり検査手段によりつ
    づりの検査をされた前記単語を表示する表示手段とを有
    し、 前記つづり検査手段は、頻繁に使用される単語を記憶し
    た頻出解析辞書と、その他の単語を記憶した一般解析辞
    書と、これらの辞書を検索する辞書検索手段とを有する
    ことを特徴とする文字列処理装置。 2、特許請求の範囲第1項記載の装置において、前記つ
    づり検査手段は、前記単語のつづりを検査するときに、
    前記辞書検索手段により先ず前記頻出解析辞書を検索し
    、次に前記一般解析辞書を検索することを特徴とする文
    字列処理装置。 3、特許請求の範囲第2項記載の装置において、前記表
    示手段は、前記つづり検査手段による検査の結果、前記
    入力手段から入力された前記単語のうちつづりが誤って
    いると判断された単語について、正しいつづりの単語と
    差別表示をすることを特徴とする文字列処理装置。 4、特許請求の範囲第1項ないし第3項のいずれかに記
    載の装置において、 該装置はさらに、 前記入力手段から入力された文字列を一時的に記憶する
    入力文字列保存手段と、 該入力文字列保存手段に保存された文字列を単語に分割
    する単語分割手段と、 該単語分割手段により分割された単語列を一時的に記憶
    する単語列保存手段と、 前記入力手段から入力された入力文および前記つづり検
    査手段により単語のつづりを検査して前記単語列保存手
    段に保存された単語列を編集をする文書編集手段と、 前記表示部を制御する制御手段とを有し、 前記つづり検査手段は、前記単語列保存手段に保存され
    た単語の各々についてつづりを検査し、前記表示手段は
    、前記文書編集手段により編集された入力文および前記
    単語列保存手段に保存された単語列を表示することを特
    徴とする文字列処理装置。
JP61081084A 1986-04-10 1986-04-10 文字列処理装置 Pending JPS62239264A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61081084A JPS62239264A (ja) 1986-04-10 1986-04-10 文字列処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61081084A JPS62239264A (ja) 1986-04-10 1986-04-10 文字列処理装置

Publications (1)

Publication Number Publication Date
JPS62239264A true JPS62239264A (ja) 1987-10-20

Family

ID=13736519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61081084A Pending JPS62239264A (ja) 1986-04-10 1986-04-10 文字列処理装置

Country Status (1)

Country Link
JP (1) JPS62239264A (ja)

Similar Documents

Publication Publication Date Title
US5587902A (en) Translating system for processing text with markup signs
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
US5680628A (en) Method and apparatus for automated search and retrieval process
US8041557B2 (en) Word translation device, translation method, and computer readable medium
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
GB2234614A (en) Machine translation apparatus
Liyanapathirana et al. Sinspell: A comprehensive spelling checker for sinhala
US4860206A (en) Translation system allowing user designation of postpositional words
JPS59165179A (ja) 辞書引方式
JPS62239264A (ja) 文字列処理装置
JP2632806B2 (ja) 言語解析装置
JP2621999B2 (ja) 文書処理装置
JP2817497B2 (ja) 辞書編集装置
JP2719453B2 (ja) 機械翻訳装置
KR100247055B1 (ko) 맞춤법 검사방법
JP4361146B2 (ja) テキスト翻訳装置と記録媒体
Trushkina Automatic error detection in second language learners' writing
Silberztein INTEX 4.1 for Windows: a Walkthrough
JPH02110771A (ja) 電訳機
JPS63136264A (ja) 機械翻訳装置
Cowie CRL’s Approach to MET
Grosjean et al. Corinne Tschumi, Franck Bodmer, Etienne Cornu, François
JPH04268669A (ja) 日本語解析装置
JPH05233619A (ja) 日本語文章誤り訂正方法およびその装置