JPS62239264A - 文字列処理装置 - Google Patents
文字列処理装置Info
- Publication number
- JPS62239264A JPS62239264A JP61081084A JP8108486A JPS62239264A JP S62239264 A JPS62239264 A JP S62239264A JP 61081084 A JP61081084 A JP 61081084A JP 8108486 A JP8108486 A JP 8108486A JP S62239264 A JPS62239264 A JP S62239264A
- Authority
- JP
- Japan
- Prior art keywords
- word
- spelling
- input
- character string
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007689 inspection Methods 0.000 claims abstract 2
- 238000000034 method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
皮亙欠1
本発明は文字列処理装置に関し、特につづりのチェック
を効率的に行う文字列処理装置に関する。
を効率的に行う文字列処理装置に関する。
従」Uえ出
ワード・プロセッサや翻訳装置等の文字列処理装置は、
操作者により入力された文字列を文節、単語等に分割し
て解析する必要がある0例えば英文を和文に翻訳する英
日翻訳装置においては英文の解析のためまず形態素解析
を行なう必要があるが、形態素解析にあたっては誤った
つづりの単語が存在しないことが正しい解析結果を得る
ために必要な条件である。そこで入力された英文を単語
に分割して、入力された各I′n +;/jのつづりが
正しいか否かの検査を行なう必要がある。
操作者により入力された文字列を文節、単語等に分割し
て解析する必要がある0例えば英文を和文に翻訳する英
日翻訳装置においては英文の解析のためまず形態素解析
を行なう必要があるが、形態素解析にあたっては誤った
つづりの単語が存在しないことが正しい解析結果を得る
ために必要な条件である。そこで入力された英文を単語
に分割して、入力された各I′n +;/jのつづりが
正しいか否かの検査を行なう必要がある。
従来、このようなつづりの検査は入力された英文を?i
i語に分割した後、装置内の辞書により分割した各I′
It語を順番に照合することにより行っていた。すなわ
ち、各々の単語について1回ずつ辞書にアクセスし、そ
のCp−ii5のつづりと辞書中のLli語のつづりと
のマツチングをとることによりつづりのチェックを行っ
ていた。ところが、従来は頻繁に出現する冠詞やbe動
詞等を含むすべての単語について、すべての単語が記憶
された同一の辞書にアクセスすることによりつづりのチ
ェックを行っていたため、つづりの検査が翻訳動作の前
処理的なプロセスにもかかわらず時間がかり、装この動
作上非能率的になるという欠点があった。
i語に分割した後、装置内の辞書により分割した各I′
It語を順番に照合することにより行っていた。すなわ
ち、各々の単語について1回ずつ辞書にアクセスし、そ
のCp−ii5のつづりと辞書中のLli語のつづりと
のマツチングをとることによりつづりのチェックを行っ
ていた。ところが、従来は頻繁に出現する冠詞やbe動
詞等を含むすべての単語について、すべての単語が記憶
された同一の辞書にアクセスすることによりつづりのチ
ェックを行っていたため、つづりの検査が翻訳動作の前
処理的なプロセスにもかかわらず時間がかり、装この動
作上非能率的になるという欠点があった。
ト1的
本発明はこのような従来技術の欠点を解消し、入力され
た文字列のつづりの検査を迅速に処理することができる
文字列処理袋ごを提供することを目的とする。
た文字列のつづりの検査を迅速に処理することができる
文字列処理袋ごを提供することを目的とする。
構 成
本発明は上記の目的を達成させるため、文字列を入力す
る入力手段と、入力手段から入力された文字列により構
成される単語のつづりを検査するつづり検査手段と、入
力手段から入力された文字列およびつづり検査手段によ
りつづりの検査をされた単語を表示する表示手段とを有
し、つづり検査手段は、頻繁に使用される単語を記憶し
た頻出解析辞書と、その他の単語を記憶した一般解析辞
書と、これらの辞書を検索する辞書検索手段とを有する
ことを特徴としたものである。以下、本発明の一実施例
に基づいて具体的に説明する。
る入力手段と、入力手段から入力された文字列により構
成される単語のつづりを検査するつづり検査手段と、入
力手段から入力された文字列およびつづり検査手段によ
りつづりの検査をされた単語を表示する表示手段とを有
し、つづり検査手段は、頻繁に使用される単語を記憶し
た頻出解析辞書と、その他の単語を記憶した一般解析辞
書と、これらの辞書を検索する辞書検索手段とを有する
ことを特徴としたものである。以下、本発明の一実施例
に基づいて具体的に説明する。
第1図に本発明による文字列処理装置を適用した英日翻
訳装置におけるスペルチェック装置の一実施例の機部ブ
ロック図を示す。
訳装置におけるスペルチェック装置の一実施例の機部ブ
ロック図を示す。
本装置は、入力部2、入力文字列保存部4、単語分割処
理部6、単語列保存部8、スペルチェックモジュールI
O1頻出解析辞書12、一般解析辞書14、辞書検索部
18、文書編集部18、表示制御部20および表示部2
2を有する。
理部6、単語列保存部8、スペルチェックモジュールI
O1頻出解析辞書12、一般解析辞書14、辞書検索部
18、文書編集部18、表示制御部20および表示部2
2を有する。
入力部2は、:f、数字、記す、カーソル移動、翻訳開
始、訳1i1%選択などのキーを含むキーボードまたは
光学的読取装置(OCR) 、フロッピーディスク等か
らの読取装置等の入力装置からなり、翻訳される英語の
文字列により構成される入力文が入力される。
始、訳1i1%選択などのキーを含むキーボードまたは
光学的読取装置(OCR) 、フロッピーディスク等か
らの読取装置等の入力装置からなり、翻訳される英語の
文字列により構成される入力文が入力される。
入力文字列保存部4は、入力部2から入力された英語の
入力文を一時的に保存する。
入力文を一時的に保存する。
ti語分;1,1処理部6は、入力文字列保存部4に保
存された英語の入力文を読み出し、ブランクやピリオド
等の設定条件に従い、英語の入力文を単語中位に分割す
る。
存された英語の入力文を読み出し、ブランクやピリオド
等の設定条件に従い、英語の入力文を単語中位に分割す
る。
単語列保存部8は、単語分割処理部6においてrn語分
割された英語単語列を一時的に保存する。
割された英語単語列を一時的に保存する。
スペルチェックモジュール10は、単語列保存部8に保
存された英35!’11語列を読み出し、英語単語列の
各単語について単++11のつづりを検査する。
存された英35!’11語列を読み出し、英語単語列の
各単語について単++11のつづりを検査する。
辞占検索部16は、スペルチェックモジュールi。
においてつづりの検査をする英語単311列の各単語を
順番に読み出し、各単語の見出しを用いて冠詞1代名詞
、be動詞等の頻出単語が記憶された頻出解析辞書12
および一般単語が記憶された一般解析辞書14を検索す
る。
順番に読み出し、各単語の見出しを用いて冠詞1代名詞
、be動詞等の頻出単語が記憶された頻出解析辞書12
および一般単語が記憶された一般解析辞書14を検索す
る。
頻出解析辞書12には、rthe J 、 ra J
、r anJ等の冠詞やris」、ramJ、rare
J等のbe動詞およびr(」、r l1eJ、ryou
4等の代名詞等頻出単語が記憶されており、一般解析辞
書14には、汗通名詞や動詞および副詞等の一般単語が
記憶されている。
、r anJ等の冠詞やris」、ramJ、rare
J等のbe動詞およびr(」、r l1eJ、ryou
4等の代名詞等頻出単語が記憶されており、一般解析辞
書14には、汗通名詞や動詞および副詞等の一般単語が
記憶されている。
文書編集部18は、入力部2から入力された英語の入力
文、単語列保存部8に保存された英語単語列およびスペ
ルチェックモジュール10において英語単語列の各単語
について単語のつづりを検査した結果を読み出し編集す
る。
文、単語列保存部8に保存された英語単語列およびスペ
ルチェックモジュール10において英語単語列の各単語
について単語のつづりを検査した結果を読み出し編集す
る。
表示制御部20は、文書編集部18で編集された文字列
を表示部22に送り、表示部22を制御する。また、ス
ペルチェックモジュール10において英語単語列の各単
語について単語のつづりを検査した結果、誤ったつづり
があった場合には、誤ったつづりの単語を点滅表示する
等の方法を用いることにより、つづりの正しい部分とつ
づりが誤っている部分とを差別表示するように表示部2
2を制御する。
を表示部22に送り、表示部22を制御する。また、ス
ペルチェックモジュール10において英語単語列の各単
語について単語のつづりを検査した結果、誤ったつづり
があった場合には、誤ったつづりの単語を点滅表示する
等の方法を用いることにより、つづりの正しい部分とつ
づりが誤っている部分とを差別表示するように表示部2
2を制御する。
表示部22は、CRT¥;−の表示装置からなり1表示
制御部20を介して送られた文字列を、表示制御部20
の指示による表示方法に従い表示する。
制御部20を介して送られた文字列を、表示制御部20
の指示による表示方法に従い表示する。
次に、スペルチェー2クプロセスについて第2図に示す
フローチャートにより説明する。
フローチャートにより説明する。
例えば、次のような英文が入力部2から入力された場合
について説明する。
について説明する。
入力文: rThe edetar has a
set ofaptians which can
be very usaful 、 Jこの入力文にお
いて、 redetorJとrusafulJがミス
スペルであり、正しいスペルはreditorJとru
sefulJである・ 入力文であるr The edetor hasa s
et ofoptions which can
be very usaful 、 J
は、 一旦、入力文字列保存部4に保存された後、単語
分−11処理部6においてブランクやピリオド等の単語
中位に分’Mするための設定条件に従い第3図(a)に
示すように単語分割され、単語列保存部8に保存される
。
set ofaptians which can
be very usaful 、 Jこの入力文にお
いて、 redetorJとrusafulJがミス
スペルであり、正しいスペルはreditorJとru
sefulJである・ 入力文であるr The edetor hasa s
et ofoptions which can
be very usaful 、 J
は、 一旦、入力文字列保存部4に保存された後、単語
分−11処理部6においてブランクやピリオド等の単語
中位に分’Mするための設定条件に従い第3図(a)に
示すように単語分割され、単語列保存部8に保存される
。
次に、スペルチェックをするためにスペルチェックモジ
ュール10のレジスタに、単語分割され11i語列保存
部8に保存されている英語の単語列から先ずrThe
Jをセットする(102) 。
ュール10のレジスタに、単語分割され11i語列保存
部8に保存されている英語の単語列から先ずrThe
Jをセットする(102) 。
次に、rThe Jが頻出解析辞書12中に存在するか
否かを調べるため、辞書検索部IBにより頻出解析辞書
12を検索しく104)、rTheJが願出解析辞書1
2中に存在する場合は正しいスペルとしてマーキングを
行なう(110)。
否かを調べるため、辞書検索部IBにより頻出解析辞書
12を検索しく104)、rTheJが願出解析辞書1
2中に存在する場合は正しいスペルとしてマーキングを
行なう(110)。
次に、単語分割され単語列保存部8に保存された英語の
単語列から次の単語r 6detarJのスペルチェッ
クをするために、スペルチェックモジュール10のレジ
スタにセットする(102) 。
単語列から次の単語r 6detarJのスペルチェッ
クをするために、スペルチェックモジュール10のレジ
スタにセットする(102) 。
次に、redetorJが頻出解析辞書12中に存在す
るか否かを調べるため、辞書検索部16により頻出解析
辞書12を検索しく104) 、存在する場合は前述の
rTheJと同様の動作を行ない、存在しない場合はr
edetoBが一般解析辞書14中に存在するか否か
を調べるため、辞書検索部!8により一般解析辞書14
を検索する( toe)。
るか否かを調べるため、辞書検索部16により頻出解析
辞書12を検索しく104) 、存在する場合は前述の
rTheJと同様の動作を行ない、存在しない場合はr
edetoBが一般解析辞書14中に存在するか否か
を調べるため、辞書検索部!8により一般解析辞書14
を検索する( toe)。
r edetorJが一般解析辞書14中に存在する場
合はステップ110に移り、redetorJが一般解
析辞書14中に存在しない場合には、ミススペルとして
マーキングを行なう(108) 、この場合にはr 2
detorJは、頻出解析辞書12と一般解析辞書14
のいずれにも存在しないことによりミススペルと判断さ
れ、ミススペルとしてのマーキングがされる(108)
。
合はステップ110に移り、redetorJが一般解
析辞書14中に存在しない場合には、ミススペルとして
マーキングを行なう(108) 、この場合にはr 2
detorJは、頻出解析辞書12と一般解析辞書14
のいずれにも存在しないことによりミススペルと判断さ
れ、ミススペルとしてのマーキングがされる(108)
。
このような動作を繰り返すことにより、単語分割処理部
6において単語分割され、単語列保存i′il!8に保
存された英語の単語列のスペルチェックを行ない分割さ
れた全ての単語についてスペルが正しいか否かのマーキ
ングを行なう[第3図(b月。 このように木実流側に
おいては、英日翻訳装置で翻訳する英文が操作者により
入力され、その英文の各単語についてのスペルのチェッ
クをするときに、スペルチェックのために頻出解析辞書
12と一般解析辞書14を有している。しかも最初に頻
出解析辞書12により単語の検索をし、次に一般解析辞
書14による単語の検索をするので、頻繁に出現するr
theJ、r allJ、ra4、「Is」、「■」等
の冠詞、be!!IJ詞、代名詞は頻出解析辞書12に
より短時間で検索できる。したがって、一般解析辞書だ
けで処理を行なう装置と比較して、能率よく短時間でス
ペルチェックの処理を行なうことができる。
6において単語分割され、単語列保存i′il!8に保
存された英語の単語列のスペルチェックを行ない分割さ
れた全ての単語についてスペルが正しいか否かのマーキ
ングを行なう[第3図(b月。 このように木実流側に
おいては、英日翻訳装置で翻訳する英文が操作者により
入力され、その英文の各単語についてのスペルのチェッ
クをするときに、スペルチェックのために頻出解析辞書
12と一般解析辞書14を有している。しかも最初に頻
出解析辞書12により単語の検索をし、次に一般解析辞
書14による単語の検索をするので、頻繁に出現するr
theJ、r allJ、ra4、「Is」、「■」等
の冠詞、be!!IJ詞、代名詞は頻出解析辞書12に
より短時間で検索できる。したがって、一般解析辞書だ
けで処理を行なう装置と比較して、能率よく短時間でス
ペルチェックの処理を行なうことができる。
次に、スペルチェック機能におけるミススペルの警告プ
ロセスについて第4図に示すフローチャートにより説明
する。
ロセスについて第4図に示すフローチャートにより説明
する。
第2図の動作と同様にスペルチェックモジュール10に
おいてスペルのチェックを行ない、単語列保存部8に保
存された英語の単語列について、先ず単語列保存部8の
単語バッファの中に未確認の単語があるか否かを判断す
る(120)。
おいてスペルのチェックを行ない、単語列保存部8に保
存された英語の単語列について、先ず単語列保存部8の
単語バッファの中に未確認の単語があるか否かを判断す
る(120)。
単語バッファの中に未確認の単語がない場合は動作を終
了し、未確認の単語がある場合にはステップ140に移
る。
了し、未確認の単語がある場合にはステップ140に移
る。
次に、未確認の単語についてミススペルであることを知
らせるマーキングがされているか否かを’14 tfi
しく+40) 、 ミススペルであることを知らせる
マーキングがされていない場合はポインタを次の単語に
移動して(160)ステップ+20に移る。
らせるマーキングがされているか否かを’14 tfi
しく+40) 、 ミススペルであることを知らせる
マーキングがされていない場合はポインタを次の単語に
移動して(160)ステップ+20に移る。
ミススペルであることを知らせるマーキングがされてい
る場合には、操作者にその単語がミススペルであること
を警告するための指示を表示制御部20に送出する(1
80) 。
る場合には、操作者にその単語がミススペルであること
を警告するための指示を表示制御部20に送出する(1
80) 。
このステップ180の指示に従い、表示制御部20は点
滅表示等の方法により、ミススペルの単語と正しいスペ
ルの単語との差別表示を行なう。
滅表示等の方法により、ミススペルの単語と正しいスペ
ルの単語との差別表示を行なう。
本実施例によれば、スペルチェック機能に加えてミスス
ペルを知らせる警告機能を有しているため、入力された
英文にミススペルの単語があった場合に、ミススペルの
m語は点滅表示等の方法により、正しいスペルの単語と
差別表示される。したがって、操作者はミススペルの単
語をすぐに認識でき修正することができる。
ペルを知らせる警告機能を有しているため、入力された
英文にミススペルの単語があった場合に、ミススペルの
m語は点滅表示等の方法により、正しいスペルの単語と
差別表示される。したがって、操作者はミススペルの単
語をすぐに認識でき修正することができる。
以上の実施例は英日翻訳装置における英文のつづりのチ
ェックについて説明したが、英語以外のアルファベット
等の通常1文字では記号のように言語としての意味を成
さないが、文字の組合せにより単語を形成し言語として
の意味を成す、例えばフランス語やドイツ語等の言語に
よる入力文のつづりのチェックにも適用でき、さらには
漢字等の入力文における誤字のチェックにも適用できる
。
ェックについて説明したが、英語以外のアルファベット
等の通常1文字では記号のように言語としての意味を成
さないが、文字の組合せにより単語を形成し言語として
の意味を成す、例えばフランス語やドイツ語等の言語に
よる入力文のつづりのチェックにも適用でき、さらには
漢字等の入力文における誤字のチェックにも適用できる
。
効 果
本発明によれば、入力された語句に誤ったつづりの単語
があった場合に、つづりの検査を装置内にある頻出解析
辞書と一般解析辞書の2つの辞書により行なうため、短
時間にしかも能率よくつづりの検査を行なうことができ
る。
があった場合に、つづりの検査を装置内にある頻出解析
辞書と一般解析辞書の2つの辞書により行なうため、短
時間にしかも能率よくつづりの検査を行なうことができ
る。
第1図は、本発明による文字列処理装置の一実施例を示
す機能ブロック図、 第2図は、第1図の装置におけるスペルチェックプロセ
スの動作を示すフローチャート。 第3図は、第1図の装置における単語列保存部に保存さ
れた英語CD +iW列の保存状態の例を示す説明図、 第4図は、第1図の装置におけるスペルチェック機能に
おける警告プロセスの動作を示すフローチャートである
。 主要部分の符号の説明 219.入力部 4111入力文字列保存部 e、、、I′liシlI分割処理部 B、、、CI′i語列保存部 10、、、スペルチェックモジュール 12、、、頻出解析辞;g 14、、、一般解析辞占 1B、、、辞1り検索部 18、、、文、り編集部 20、、、表示制御部 22、、、表示部 集l 面 纂2図
す機能ブロック図、 第2図は、第1図の装置におけるスペルチェックプロセ
スの動作を示すフローチャート。 第3図は、第1図の装置における単語列保存部に保存さ
れた英語CD +iW列の保存状態の例を示す説明図、 第4図は、第1図の装置におけるスペルチェック機能に
おける警告プロセスの動作を示すフローチャートである
。 主要部分の符号の説明 219.入力部 4111入力文字列保存部 e、、、I′liシlI分割処理部 B、、、CI′i語列保存部 10、、、スペルチェックモジュール 12、、、頻出解析辞;g 14、、、一般解析辞占 1B、、、辞1り検索部 18、、、文、り編集部 20、、、表示制御部 22、、、表示部 集l 面 纂2図
Claims (1)
- 【特許請求の範囲】 1、文字列を入力する入力手段と、 該入力手段から入力された文字列により構成される単語
のつづりを検査するつづり検査手段と、前記入力手段か
ら入力された文字列および前記つづり検査手段によりつ
づりの検査をされた前記単語を表示する表示手段とを有
し、 前記つづり検査手段は、頻繁に使用される単語を記憶し
た頻出解析辞書と、その他の単語を記憶した一般解析辞
書と、これらの辞書を検索する辞書検索手段とを有する
ことを特徴とする文字列処理装置。 2、特許請求の範囲第1項記載の装置において、前記つ
づり検査手段は、前記単語のつづりを検査するときに、
前記辞書検索手段により先ず前記頻出解析辞書を検索し
、次に前記一般解析辞書を検索することを特徴とする文
字列処理装置。 3、特許請求の範囲第2項記載の装置において、前記表
示手段は、前記つづり検査手段による検査の結果、前記
入力手段から入力された前記単語のうちつづりが誤って
いると判断された単語について、正しいつづりの単語と
差別表示をすることを特徴とする文字列処理装置。 4、特許請求の範囲第1項ないし第3項のいずれかに記
載の装置において、 該装置はさらに、 前記入力手段から入力された文字列を一時的に記憶する
入力文字列保存手段と、 該入力文字列保存手段に保存された文字列を単語に分割
する単語分割手段と、 該単語分割手段により分割された単語列を一時的に記憶
する単語列保存手段と、 前記入力手段から入力された入力文および前記つづり検
査手段により単語のつづりを検査して前記単語列保存手
段に保存された単語列を編集をする文書編集手段と、 前記表示部を制御する制御手段とを有し、 前記つづり検査手段は、前記単語列保存手段に保存され
た単語の各々についてつづりを検査し、前記表示手段は
、前記文書編集手段により編集された入力文および前記
単語列保存手段に保存された単語列を表示することを特
徴とする文字列処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61081084A JPS62239264A (ja) | 1986-04-10 | 1986-04-10 | 文字列処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61081084A JPS62239264A (ja) | 1986-04-10 | 1986-04-10 | 文字列処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62239264A true JPS62239264A (ja) | 1987-10-20 |
Family
ID=13736519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61081084A Pending JPS62239264A (ja) | 1986-04-10 | 1986-04-10 | 文字列処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62239264A (ja) |
-
1986
- 1986-04-10 JP JP61081084A patent/JPS62239264A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5587902A (en) | Translating system for processing text with markup signs | |
US5794177A (en) | Method and apparatus for morphological analysis and generation of natural language text | |
US4962452A (en) | Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence | |
US5680628A (en) | Method and apparatus for automated search and retrieval process | |
US8041557B2 (en) | Word translation device, translation method, and computer readable medium | |
WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
GB2234614A (en) | Machine translation apparatus | |
Liyanapathirana et al. | Sinspell: A comprehensive spelling checker for sinhala | |
US4860206A (en) | Translation system allowing user designation of postpositional words | |
JPS59165179A (ja) | 辞書引方式 | |
JPS62239264A (ja) | 文字列処理装置 | |
JP2632806B2 (ja) | 言語解析装置 | |
JP2621999B2 (ja) | 文書処理装置 | |
JP2817497B2 (ja) | 辞書編集装置 | |
JP2719453B2 (ja) | 機械翻訳装置 | |
KR100247055B1 (ko) | 맞춤법 검사방법 | |
JP4361146B2 (ja) | テキスト翻訳装置と記録媒体 | |
Trushkina | Automatic error detection in second language learners' writing | |
Silberztein | INTEX 4.1 for Windows: a Walkthrough | |
JPH02110771A (ja) | 電訳機 | |
JPS63136264A (ja) | 機械翻訳装置 | |
Cowie | CRL’s Approach to MET | |
Grosjean et al. | Corinne Tschumi, Franck Bodmer, Etienne Cornu, François | |
JPH04268669A (ja) | 日本語解析装置 | |
JPH05233619A (ja) | 日本語文章誤り訂正方法およびその装置 |