JPS63234348A

JPS63234348A - 文章校正支援方式

Info

Publication number: JPS63234348A
Application number: JP62068211A
Authority: JP
Inventors: Fukami Kamiyama; 神山　ふかみ
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-03-23
Filing date: 1987-03-23
Publication date: 1988-09-29

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概要〕日本語文章を入力し、その文章中の誤字を検出する文章
校正装置で、該入力された文字列に対して、少なくとも
表記、読み９文法を格納した単語辞書を検索し、単語の
同定を行った結果、２文字以上の漢字列であって、１文
字漢字単語を含んだ漢字列を誤字として検出する文章校
正支援方式において、該文章校正装置に、１文字漢字単
語であっても正しい漢字列゛を形成する単語を登録する
非検出単語辞書を設けることにより、該非検出単語辞書
−に登録されている１文字漢字単語を含んだ漢字列は、
誤字を含まないと判定するようにしたものである。

〔産業上の利用分野〕

本発明は、日本語文章を入力し、その文章中の誤字を検
出する文章校正装置における文章校正支援方式に関する
。

最近の計算機システムの進歩に伴って、該計算機システ
ムにより、企業内の文書、或いは新聞出版における記事
等の文章９文書の作成１編集１紙面の割り付は等の分野
において、ある程度機械化が行われているが、該文書、
記事の校正作業については、未だ多くの人手に頬ってお
り、該校正時の誤字の検出の自動化が期待されている。

〔従来の技術と発明が解決しようとする問題点〕第４図
は従来の文章校正支援方式を説明する図である。

現在、行われている新聞等での記事の校正作業では、例
えば、２人１組による読み合わせ校正が行われており、
一方が原稿を読み上げ、他方が赤ペンを持って「ゲラ刷
り」文書をチェックする方法が採られている。

上記の読み手側を代表する手段として、例えば、日本語
音声出力装置等があるが、該装置から出力される「読み
」を聞いているだけでは、例えば、「酷鉄」と「国鉄」
とか、「相異」と「相違」の区別ができない問題がある
。

そこで、本願出願者は、その解決策として、１文字漢字
単語の組み合わせを誤字として検出する文章校正支援方
式を開示している。

本図は、この１文字漢字単語の組み合わせを誤字として
検出する文章校正支援方式を示したもので、詳細は該別
件の特許出願に開示されているので省略するが、要約す
ると、以下の通りとなる。

一般に、漢字で構成されている単語（一般語。

固有名詞）の構成文字数の分布は、２文字以下で構成さ
れている単語が・９０％で、特に、その８０％は２文字
で構成されている。

本図の文章解析用の単語辞書５も、同じような分布で構
成されている為、２文字以上の漢字列が１文字車語で分
割されると云うことは、そこに誤りを含んでいる可能性
が高いこと、及び該２文字以上の漢字列が１文字車語で
分割される例を、例えば、新聞記事の文字出現顧度で分
析すると、「日Ｊ　ｒ−Ｊ　ｒ十Ｊ　ｒ二」「人」「年
」「三」「本」　「五」　「四」　「時」が、その上位
を占めており、数字、助数詞が約半分を占めていること
に着目して、上記１文字漢字単語の組み合わせを、無意
味漢字列検出部６で検出した後、検出制限部６１におい
て、１．数詞−数詞、２．数詞−助数詞、３．姓−名前
２等を検出しないようにして、正しい単語列を見つけ、
残りを誤字とするようにしたものである。

然しなから、この従来方式においては、例えば、１文字
漢字単語がキーワードとなっている文章を作成している
場合、その１文字漢字単語を使った複合語１派生語を全
て誤字として検出してしまうと云う問題があった。

具体例で示すと、上記１文字漢字単語として、「核」を
考えると、該「核」を使った複合語である「核−兵器」
　「核−融合」「核−保有一国」等は、上記１文字漢字
単語である「核」との組み合わせであり、前述の従来方
式では、全て誤字として検出されてしまうと云う問題が
あった。

本発明は上記従来の欠点に鑑み、文章校正支援方式にお
いて、１文字漢字単語の組み合わせでも、複合語等とし
て使用される１文字漢字単語の組み合わせを誤字を含む
漢字列として検出しない方法を提供することを目的とす
るものである。

〔問題点を解決するための手段〕

第１図は本発明の文章校正支援方式の原理構成図である
。

日本語文章を入力し、その文章中の誤字を検出する文章
校正装置において、該入力された文字列に対して、少な（とも表記。

読み９文法を格納した単語辞書５を検索し、単語の同定
を行った結果、２文字以上の漢字列であって、１文字漢
字単語を含んだ漢字列を誤字として検出する文章校正支
援方式であって、該文章校正装置に、１文字漢字単語であっても正しい漢
字列を形成する単語を登録する非検出単語辞書９を設け
て、該非検出単語辞書９に登録されている１文字漢字単語を
含んだ漢字列は、誤字を含まないとするように構成する
。

〔作用〕

即ち、本発明によれば、日本語文章を入力し、その文章
中の誤字を検出する文章校正装置で、該入力された文字
列に対して、少なくとも表記、読み９文法を格納した単
語辞書を検索し、単語の同定を行った結果、２文字以上
の漢字列であって、１文字漢字単語を含んだ漢字列を誤
字として検出する文章校正支援方式において、該文章校
正装置に、１文字漢字単語であっても正しい漢字列を形
成する単語を登録する非検出単語辞書を設けることによ
り、該非検出単語辞書に登録されている１文字漢字単語
を含んだ漢字列は、誤字を含まないと判定するようにし
たものであるので、通常の目での確認漏れ、読み上げを
聞いている場合に区別が付かない誤字の検出が可能であ
り、更に非検出単語辞書に登録されている単語の複合語
９派生語は誤字とみなさなくなり、無駄な検出を防ぐこ
とができる効果がある。

〔実施例〕

以下本発明の実施例を図面によって詳述する。

前述の第１図が本発明の文章校正支援方式の原理構成図
であり、第２図は本発明の一実施例を模式的に示した図
であり、第３図は本発明の文章校正支援方式の処理の流
れ図であって、第１図、第２図における非検出単語辞書
９．と非検出単語辞書検索部７が本発明を実施するのに
必要な手段である。尚、企図を通して同じ符号は同じ対
象物を示している。

以下、第１図〜第３図によって、本発明の文章校正支援
方式を説明する。

本発明においては、１文字漢字単語であっても、正しい
漢字列を形成する単語については、該１文字漢字単語が
２文字以上の漢字列に含まれていても誤字としないよう
にする所に特徴かあ、る。

先ず、文章入力部１において一図示していないキーボー
ド等から文章示入カされ、文章解析部２に送出される。

文章解析部２においては、本願出願者が先願している特
開昭５９−９０１６７号公報「文章解析方式」に開示さ
れている文書解析方法により解析を行う。

概略的には、単語辞書検索部２１で、表記、読み９文法
等を格納した単語辞書５を検索して、一致するものを取
り出し、単語同定部２２で、文章として最も適切な単語
列に分割する。

該解析結果は、無意味漢字列検出部６において、判定条
件■〜■について判定され、更に、検出制限部６１で正
しい単語列を見つけ、残りの１文字漢字単語を含んだ漢
字列を検出する。

この無意味漢字列検出部６で検出された漢字列の中の１
文字漢字単語は、その次の非検出単語辞書検索部７にお
いて、非検出単語辞書９に登録されているか否かが検索
され、若し、該辞書９中に同じ単語があった場合には、
当該１文字漢字単語を含む漢字列は誤字を含んでないと
し、若し、該辞書９中に同じ単語がなかった場合には、
当該１文字漢字単語を含む漢字列中に誤字があったとし
て誤字検出部８で該当誤字を検出する。

上記の文章校正支援方式を、第２図の実施例によって、
第３図の流れ図を参照しながら具体例で説明する。

文字入力部１で入力された文章を「核兵器を池語に分割
される。

この単語列を、次の無意味漢字列検出部６におでいるの
で、誤字を含む漢字列として検出される。

とする。

更に、該誤字フラグが°オン°になっている１文字漢字
単語について、非検出単語辞書検索部７において、非検
出単語辞書９を検索し、一致する単語があった場合には
、上記付与した誤字フラグを゛オブにする。

この非検出単語辞書９には、予め、正しい漢字列を形成
する１文字漢字単語として、例えば、字検出部８におい
ては、誤字フラグが°オン”の単語を含む漢字列を誤字
とする。本例においては第３図は上記の文章校正支援方
式の処理を流れ図で示したもので、各処理ステップに付
与されている番号（６，７，８）は、第１図、第２図の
各処理部の番号に対応している。

このように、本発明は、日本語文章を入力し、その入力
された文字列に対して、表記、読み２文法等を格納した
単語辞書を検索して、単語の同定を行い、２文字以上の
漢字列であって、１文字漢字単語を含む漢字列を誤字と
する文章校正支援方式において、予め、上記１文字漢字
単語であっても、正しい漢字列を形成する単語を非検出
単語辞書に登録しておくことにより、該非検出単語辞書
に登録されている１文字漢字単語を含んだ漢字列は誤字
を含まないように判定する所に特徴があ−る。

〔発明の効果〕

以上、詳細に説明したように、本発明の文章校正支援方
式は、日本語文章を入力し、その文章中の誤字を検出す
る文章校正装置で、該入力された文字列に対して、少な
くとも表記、読み９文法を格納した単語辞書を検索し、
単語の同定を行った結果、２文字以上の漢字列であって
、１文字漢字単語を含んだ漢字列を誤字として検出する
文章校正支援方式において、該文章校正装置に、１文字
漢字単語であっても正しい漢字列を形成する単語を登録
する非検出単語辞書を設けることにより、該非検出単語
辞書に登録されている１文字漢字単語を含んだ漢字列は
、誤字を含まないと判定するようにしたものであるので
、通常の目での確認漏れ、読み上げを聞いている場合に
区別が付かない誤字の検出が可能であり、更に非検出単
語辞書に登録されている単語の複合語１派生語は誤字と
みなさなくなり、無駄な検出を防ぐことができる効果が
ある。

【図面の簡単な説明】

第１図は本発明の文章校正支援方式の原理構成図。第２図は本発明の一実施例を模式的に示した図。第３図は本発明の文章校正支援方式の処理の流れ図。第４図は従来の文章校正支援方式を説明する図。である。図面において、ｌは文章入力部、　　　２は文章解析部。２１は単語辞書検索部、２２は単語同定部。５は単語辞書。６は無意味漢字列検出部。６１は検出制限部。７は非検出単語辞書検索部。８は誤字検出部、　　　９は非検索単語辞書。 ■〜■は判定条件。する。

Claims

【特許請求の範囲】日本語文章を入力し、その文章中の誤字を検出する文章
校正装置において、該入力された文字列に対して、少なくとも表記、読み、
文法を格納した単語辞書（５）を検索し、単語の同定を
行った結果、２文字以上の漢字列であって、１文字漢字
単語を含んだ漢字列を誤字として検出する文章校正支援
方式であって、該文章校正装置に、１文字漢字単語であっても正しい漢
字列を形成する単語を登録する非検出単語辞書（９）を
設けて、該非検出単語辞書（９）に登録されている１文字漢字単
語を含んだ漢字列は、誤字を含まないとすることを特徴
とする文章校正支援方式。