JPH0282348A - 文書校正支援装置 - Google Patents

文書校正支援装置

Info

Publication number
JPH0282348A
JPH0282348A JP63233598A JP23359888A JPH0282348A JP H0282348 A JPH0282348 A JP H0282348A JP 63233598 A JP63233598 A JP 63233598A JP 23359888 A JP23359888 A JP 23359888A JP H0282348 A JPH0282348 A JP H0282348A
Authority
JP
Japan
Prior art keywords
word
hiragana
kanji
words
okurigana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63233598A
Other languages
English (en)
Inventor
Tetsuo Tamura
田村 鉄夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63233598A priority Critical patent/JPH0282348A/ja
Publication of JPH0282348A publication Critical patent/JPH0282348A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概 要] 文書校正装置の誤った単語を検出するため辞書に登録す
る単語の生成方式に関し、 誤った単語を自動的に生成する方式に関し、送り仮名の
正否の試験に用いる誤った単語の生成手段として、入力
された正しい単語について該単語の入力コードの漢字と
平板名を識別し、漢字から平板名への変化点を検出する
手段と、該単語の漢字の直後の平板名を削除する手段と
を設けることにより構成するか、更に、単語を複数の文
字列に分割して、該文字列における漢字の次の平板名を
削除した文字列同士あるいはこれと、先に分割した元の
文字列とを組み合せて誤った単語を生成する手段とを設
けることにより構成する。
「産業上の利用分野コ 本発明は、誤りやすい単語や禁止用語などをその正しい
単語と対で辞書に登録しておき、この辞書と入力文書と
を照合して、辞書に登録された単語を文書中に検出する
と操作者に通知するとともに、正しい単語を正解候補と
して操作者に通知し、文書の校正を支援する文書校正支
援装置に関し、特に、前記辞書への送り仮名のチエツク
用単語としての誤った単語を登録する手段として、正し
い送り仮名の単語から送り仮名の誤りパターンを自動的
に作成する手段を設けた文書校正支援装置に係る。
[従来の技術] 第3図は従来の文書校正装置の構成の例を示すブロック
図であって、51は単語抽出部、52は辞書照合部、5
3は校正結果出力部、54はチエツク用語辞書、55は
登録制御部を表わしている。
同図において、入力された文書は単語抽出部51におい
て、単語単位に分割され、辞書照合部52に送られる。
該辞書照合部52においては、該単語をチエツク用語辞
書54内の単語と照合し、合致するものがあるか否かを
調べる。
校正結果出力部53は、前記辞書照合部52による入力
単語とチエツク用語辞書との照合結果に基づき、該当す
る単語が正しければその旨を、また、誤っているときは
、それが誤っている旨、および対応する正しい単語とを
出力して利用者に知らせる。
チエツク用語辞書には、上記のような動作を可能とする
た必、正しい単語と、これに対応する誤り易い形式の誤
った単語とを予め登録しておく必要がある。
そのため、従来は、操作者が、登録制御部55を介して
、正しい単語とこれに対応する過ちを犯し易いと考えら
れる単語を想定して登録を行なっていた。
[発明が解決しようとする課題] 上述したように、文書校正装置における、チエツク用語
辞書には、入力文書中から誤った単語を抽出するための
照合用単語として、誤った単語を登録しておく必要があ
る。
すなわち、文書校正装置は入力文書中から抽出した単語
を、上記チエツク用語辞書内の各単語と照合を行ない、
それらが一致したとき、その単語を認識したことになる
が、チエツク用語辞書内に誤った単語として登録してお
くことにより、該当する単語が誤っていることを認識し
得ることになる。
このような誤った単語は、対応する正しい単語を基に、
犯し易い誤りのパターンを想定して作成し、予め登録し
ておく必要はあるが、識別すべき単語数が多い場合には
、その作成はかなり困難で膨大な工数を要するものとな
る。
本発明は、このような従来の問題点に鑑み、誤った単語
の内、特に送りがなを誤った単語を、基となる正しい単
語から自動的に生成することの可能な手段を提供するこ
とを目的としている。
[課題を解決するための手段] 本発明によれば、上述の目的は前記特許請求の範囲に記
載した手段により達成される。
すなわち、本発明は、誤った用語や禁止用語などを該用
語を表わす正しい単語と対にして、単語辞書に登録して
おいて、入力文書中の単語を該辞書と照合して、誤った
用語や禁止用語などと一致する単語を検出したとき、操
作者に通知すると共に、該用語を表わす正しい単語を正
解候補として操作者に示す如く構成された、文書の校正
を支援する装置であって、送り仮名の正否の試験に用い
る誤った単語の生成手段として、入力された正しい単語
について該単語の入力コードの漢字と平仮名を識別し、
漢字から平仮名への変化点を検出する手段と、 該単語の漢字の直後の平仮名を削除する手段とを設けた
文書校正支援装置、あるいは、これに、更に入力された
正しい単語について、入力コードの平仮名から漢字への
変化点を検出し、該変化点を境として、該単語を複数の
文字列に分割する手段と、 上記文字列ごとに漢字の直後の平仮名を削除する手段と
、 前記手段により分割した文字列と漢字の直後の平仮名を
削除した文字列、あるいは漢字の直後の平仮名を削除し
た文字列同士を組み合わせる手段とを付加した文書校正
支援装置により達成される。
[作 用] 上述の手段において、例えば「異なる」と言う単語登録
を行なう場合、「異」と言う漢字の直後の平仮名「な」
を削除することにより「異る」と言う誤った表記の単語
を自動的に生成することができる。
また、例えば「振り出し」と言う単語のような場合、ま
ず平仮名から漢字への変化点を境として、該単語を「振
り」と「出し」の二つの文字列に分割し、それぞれ、漢
字の直後の平仮名を削除し、これらを元の文字列と漢字
の直後の平仮名を削除した文字列、あるいは、漢字の直
後の平仮名を削除した文字列同士を組み合わせることに
より「振出し」、「振り出」、「振出」の三通りの誤っ
た単語を生成することができる。
[実施例] 第1図は本発明の第1の実施例の構成を示すブロック図
で、1は単語抽出部、2は辞書照合部、3は校正結果出
力部、4はチエツク用語辞書、5は登録制御部、6は送
り仮名検出部、7は平仮名削除部、8は登録単語入力部
、9は本発明による文書校正支援装置を表わしている。
同図において、通常、文書の校正を行なう場合は、入力
された文書から単語抽出部1が単語を抽出し、該単語を
辞書照合部2がチエツク用語辞書4に格納されている単
語と照合して、その結果を校正結果出力部3が出力する
ことにより行なわれる。
一方、チエツク用語辞書4に対する単語の登録は、操作
者が入力した単語が、登録単語入力部8、送り仮名検出
部6、登録制御部5を経て、チエツク用語辞書4に格納
されることにより行なわれるが、このとき、該単語の漢
字の直後の平仮名を送り仮名検出部6が検出し、これを
平仮名削除部7が削除することにより、送り仮名の誤っ
た単語を生成して、登録制御部5に転送する。
登録制御部5は該単語を、元の正しい単語と対にしてチ
エツク用語辞書4に登録する。
第2図は本発明の第2の実施例の構成を示すブロック図
であって、1〜5は第1図の場合と同様であり、10は
本発明による文書校正支援装置、11は登録単語入力部
、12は単語分割部、13は送り仮名検出部、14は平
仮名削除部、15は送り仮名チエツク用語作成部を表わ
している。
同図における文書校正支援装置10の動作について、以
下、[押し上げる]と言う単語が入力された場合を例に
採って説明する。
登録単語入力部11は「押し上げる」と言う単語が入力
されると、これを単語分割部12に転送する。
単語分割部12は、該単語中の平仮名から漢字への変化
点を見出し「押し」と「上げる」の二つの文字列に分割
する。
送り仮名検出部13は、前記「押し」と「上げる」の二
つの文字列について、それぞれ漢字の直後の送り仮名「
シ」と「げ」を検出し、平仮名削除部14がこれらを削
除して「押」および「上る」と言う文字列を作り出す。
送り仮名ヂエツク用語作成部15は、これらの「押」お
よび「上る」と、元の文字列「押し」と「上げる」を組
み合わせて、「押上げる」、「押上る」、「押し上る」
の三つの単語を生成する。
そして、登録制御部5がチエツク用語辞書に、正しい単
語として「押し上げる」を、また、該単語に対応する送
り仮名の誤った単語として前記「押上げるJ、r押上る
Jおよび「押し上る」の三つを登録する。
これらの誤った単語の生成は、総て元となる正しい単語
を元に自動的に生成され登録されるので、操作者は正し
い単語のみを登録すれば良い。
[発明の効果] 以上説明したように本発明によれば、文書校正装置のチ
エツク用語辞書への送り仮名校正用の誤った送り仮名を
有する単語を、元の正しい単語から自動的に生成するこ
とが可能となる。
従って、従来、膨大な工数を費して作成していたチエツ
ク用語辞書を非常に効率的に作成し得る利点がある。
【図面の簡単な説明】
第1図は本発明の第1の実施例の構成を示すブロック図
、第2図は本発明の第2の実施例の構成を示すブロック
図、第3図は従来の文書校正装置の構成の例を示すブロ
ック図である。 1・・・・・・単語抽出部、2・・・・・・辞書照合部
、3・・・・校正結果出力部、4・・・・・・チエツク
用語辞書、5・・・・・・登録制御部、6.13・・・
・・・送り仮名検出部、7.14・・・・・・平仮名削
除部、8,11・・・・・・登録車9吾入力部、9,1
0・・・・・・文書校正支援装置、12・・・・単語分
割部、15・・・・・・送り仮名チエツク用語作成部

Claims (1)

  1. 【特許請求の範囲】 1、誤った用語や禁止用語などを該用語を表わす正しい
    単語と対にして単語辞書に登録しておいて、入力文書中
    の単語を該辞書と照合して誤った用語や禁止用語などと
    一致する単語を検出したとき、操作者に通知すると共に
    、該用語を表わす正しい単語を正解候補として操作者に
    示す如く構成された、文書の校正を支援する装置であっ
    て、 送り仮名の正否の試験に用いる誤った単語の生成手段と
    して、 入力された正しい単語について該単語の入力コードの漢
    字と平板名を識別し、漢字から平仮名への変化点を検出
    する手段と、 該単語の漢字の直後の平仮名を削除する手段とを設けた
    ことを特徴とする文書校正支援装置。 2、入力された正しい単語について、入力コードの平仮
    名から漢字への変化点を検出し、該変化点を境として該
    単語を複数の文字列に分割する手段と、 上記文字列ごとに漢字の直後の平仮名を削除する手段と
    、 前記手段により分割した文字列と漢字の直後の平仮名を
    削除した文字列あるいは漢字の直後の平仮名を削除した
    文字列同士を組み合せる手段とを設けた請求項1記載の
    文書校正支援装置。
JP63233598A 1988-09-20 1988-09-20 文書校正支援装置 Pending JPH0282348A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63233598A JPH0282348A (ja) 1988-09-20 1988-09-20 文書校正支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63233598A JPH0282348A (ja) 1988-09-20 1988-09-20 文書校正支援装置

Publications (1)

Publication Number Publication Date
JPH0282348A true JPH0282348A (ja) 1990-03-22

Family

ID=16957569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63233598A Pending JPH0282348A (ja) 1988-09-20 1988-09-20 文書校正支援装置

Country Status (1)

Country Link
JP (1) JPH0282348A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0372523A (ja) * 1989-05-31 1991-03-27 Mitsui Petrochem Ind Ltd ポリエチレンテレフタレート
WO2002003240A1 (en) * 2000-07-05 2002-01-10 Palman System Ltd. Proofreading system of chinese characters by means of one-to-one comparison

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0372523A (ja) * 1989-05-31 1991-03-27 Mitsui Petrochem Ind Ltd ポリエチレンテレフタレート
WO2002003240A1 (en) * 2000-07-05 2002-01-10 Palman System Ltd. Proofreading system of chinese characters by means of one-to-one comparison

Similar Documents

Publication Publication Date Title
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
JP2693780B2 (ja) テキストプロセシングシステム、及び単位又は化学式が正確且つ一貫して使用されているかどうかをテキストプロセシングシステムでチェックするための方法
JPH0282348A (ja) 文書校正支援装置
JPH077415B2 (ja) 日本文文書誤り検定装置
JPH0484360A (ja) 文章検査装置
JPH087046A (ja) 文書認識装置
JP3856515B2 (ja) 文書校正装置
JPH03176715A (ja) 文章入力装置
JPS63103375A (ja) 文書処理装置
JP3292595B2 (ja) 文字認識装置
JP2000276467A (ja) 変換装置
JPH03156589A (ja) 誤読文字の検出,修正方法
JPS5899829A (ja) 誤り文字検出・修正支援装置
JPS61202273A (ja) 電子式辞書
JP3077820B2 (ja) 文章の不適正箇所検出装置
JPH0632091B2 (ja) 日本文読取装置
JPH06168243A (ja) 綴り誤り訂正方法および綴り誤り訂正装置
JPH02309448A (ja) 誤り検出装置
JPH02136959A (ja) 日本文訂正候補抽出装置
JPH0486948A (ja) 分野別辞書を利用したカナ振りデータベースの作成方法
JPH01292569A (ja) 日本文誤り自動検定装置
JPH04188269A (ja) 文章校正方法およびその装置
JPH0682366B2 (ja) 文字列訂正方式
JPH0432958A (ja) 日本文誤り語検出装置
JPH04256193A (ja) 認識文字の単語登録処理方式