JPS63249260A

JPS63249260A - 文章校正支援装置

Info

Publication number: JPS63249260A
Application number: JP62083324A
Authority: JP
Inventors: Fukami Kamiyama; 神山　ふかみ
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-04-03
Filing date: 1987-04-03
Publication date: 1988-10-17

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（ＩＩ要〕本発明は文章校正支援装置において、入力された文章の読上げを聴いているだけでは音が同じ
でも意味が全く通じない漢字ＩＦ　ＥＨの入力誤りを確
認しにくい従来の問題点を解決するため、２文字以上の
漢字列の分割が１文字漢字ｌｔＩ語を含んだ分割になっ
た場合で、その分割が数詞−数詞の組合せ、姓−名前の
組合せ等の例を除いたもののみ入力誤りとして検出する
ことにより、盲が同じでも意味が全く通じない漢字単品
を誤って入力してしまった場合、この人力誤りを確実に
検出し得、しかも誤入力を容易に確認できるようにした
ものである。

（産業上の利用分野）本発明は、入力された新聞記事のような通常の日本語文
章を正しく入力されたかどうか手書き原稿と照合し乍ら
校正するのを支援するため、入力文を合成音声で読上げ
る文章読上げ校正支援装置に関する。

この種の校正支援装置において、入力誤字を容易に確認
できれば便利であり、校正作業を高能率化し得る。

〔従来の技術〕

出版業界等では印刷工程に回る萌に、送り仮名の誤り、
誤字、脱字等の修正のため、校正作業を行なう。この作
業は精度を上げるため、一般に、−人が文章を読上げ、
他の一人がそれを聴き乍ら手古き原稿をチェックするシ
ステムをとっている。

ところが、文章データのＣＴＳ　（コンピュータライズ
ド・タイプ・セツティング（電子編集組版））システム
化に伴い、文章の読上げをコンピュータに行なわせたい
との要望があり、漢字、仮名混り文を各単語に分割して
読み情報を付与し、これを合成音声で読上げる文章読上
げ校正支援装置がある。

〔発明が解決しようとする問題点〕

従来の校正支援装置は、人間の読み手に比して読上げを
主眼にしているため、例えば１−国鉄」と「晶鉄」、「
相違」と「相異」等を夫々区別できずに夫々同一の音で
そのまま読み進み、オペレータがディスプレイに表示さ
れる単語の入力誤りを万一発見できなかった場合は誤入
力のまま処理されてしまう問題点があった。

そこで本出願人は上記問題点を解決すべく、同日付の特
許願（発明の名称「文章校正支援装置、１）で、［文章
解析で得られた各単語列で、２文字以上の漢字列の分割
が、１文字漢字単詔を含んだ分割となったとき、入力誤
りとして検出し、その旨を通知する無意味漢字列検出部
とを設けてなる１文章校正支援装置を提案した。この装
置によれば、例えば「討論」を誤って「投」　「論」と
入力した場合、文章解析部にて「投」　「論」の各単語
に分割され、無意味漢字列検出部において、２文字以上
の漢字列の分割が「投」　「論」のように１文字漢字単
語を含んだ分割を入力誤りとして検出し、これをオペレ
ータに通知する。これにより、音が同じで意味が全く異
なる（又は意味が通じない）漢字単語を誤って入力した
場合誤入力を容易に確認できる。

然るに、上記提案になる装置は、築１図の文章入力部１
で例えば「五人の〜」のように正しく入力した場合、文
章解析部２において「五」「人」「の」・・・と各単語
に分割され、無意味漢字列検出部５において、単語列の
中に１文字漢字甲語「五」「人」が存在するとしてこれ
を誤字として検出してしまう。つまり、正しく入力した
にも拘らず、無意味漢字列検出部５の判定■〜■にて１
文字漢字単語を誤入力として検出してしまう問題点があ
った。

〔問題点を解決するための手段〕

第１図は本発明装置の原理ブロック図を示す。

同図中、１は文章入力部、２は文章解析部、５は無意味
漢字列検出部、６は甲語辞占、８は検出制限部である。

本発明装置は、第１図に示す如く、文章入力部１で入力
された日本語文章を文章解析部２でＩＪｉ語辞占６を検
索することにより単語同定を行なって各単語の列に分割
し、各Ｉ＄１語毎に読上げて校正を行なう文章校正支援
装置において、１文字漢字！１語を含む漢字列の接続が
一般に行なわれる種々の例を各条件（イ〜ト）として設
定された検出ゐす眼部８と、文章解析部２で得られた各単語列で、２文字以上の漢字
列の分割が、１文字漢字単語を含んだ分割となる単語列
を選択し、該選択された単語列の中で検出制限部８に設
定された条件に該当する単語列を除いて残りの単語列を
人力誤りとして検出し、その旨を通知する無意味漢字列
検出部５とを設けてなる。

〔作用〕

例えば「五人の１童は健斥で〜」なる文章が入力された
場合、文章解析部２にて「五」　「人」「の」「自」「
童」「は」「健康」「で」・・・の各単語に分割される
。無意味漢字列検出部５において、２文字以上の漢字列
の分割が「五」　「人」「自」　「童」のように１文字
漢字単語を含んだ分割となるＩＩｉ語列を選択し、この
中で検出制限部８の条件に該当する単語列「五」　「人
」を除き、残りの［自Ｊ　　ｒｉＪを入力誤りとして検
出し、これをオペレータに通知する。

（実施例）第２図は本発明装置の一実施例のブロック図を示す。同
図中、１はキーボード及びディスプレイ等にて構成され
る文章入力部、２は文章解析部で、単語辞書６を検索す
る辞書検索部３及び単語同定部４にて構成されており、
入力された文章を各単語に分割する。５は無意味漢字列
検出部で、全文字漢字で構成されている単語が２以上連
続しており、その中に１文字単語が存在している場合は
誤字として検出する。７は表示制御部で、誤字検出され
た場合文章入力部１のディスプレイに表示されている誤
字を例えば反転表示する−り面信号を出力する。

８は検出制限部で、無意味漢字列検出部５にて１文字漢
字単語が検出されても条件イ〜トに該当するものはこれ
を誤字としないように制限を与える。上記条件とは、イ
、数詞−数詞（例えば、「百」　「二Ｊ　ＩＮ−Ｊ　ｒ
三」）、口、数詞−助数詞（例えば、「五」「人」）、
ハ、２甲語で姓−名前（例えば、「関」「宏」）、二、
３単語で姓−名前−人称名詞（例えば、「山水」　「正
」　「課長」）、ホ、２単語で姓−人称名詞（例えば、
「沢」「先生」）、へ、漢字列の終りが動詞で次が活用
語尾（例えば、「早」　「歩」　「き」）、ト、接辞（
例えば、「大」　「会社」）等である。

ところで、漢字で構成される固有名詞、普通名詞等の単
語の構成文字数の分布は２文字以下の単語が９０％で、
特に、２文字のみの単語が８０％を占める。文章解析に
用いられる単語辞書６も同様の分布で構成されているた
め、２文字以上の漢字列（例えば「討論」）が１文字単
語で分割される（例えば「投」　「論」）ということは
そこに誤りを含んでいる可能性が高い。然るに、新聞記
事の文字出現頻度をみると、上位２０位に「日」ｒ−Ｊ
　ｒ＋Ｊ　ｒ二」「人」「年」「三」「本」「五」　「
四」　「時」等が入っており、数詞、助数詞が約半分を
占めており、その伯に姓名等がある。

本発明は、数詞、助数詞、姓名等は単語分割すると１文
字漢字′＃＠語になる例が多いことに着目したものであ
る。

以下、第１図の文章入力部１に示すように、［五人の児
童は健康で〜］と入力するところを誤って「五人の目量
は健康で〜」と入力した場合について説明する。この文
章は文章解析部２に入力され、辞書検索部３にて単語辞
書６を検索し、単語同定部４にて単語Ｍ８４に登録され
ている単語のうち、その文章の単品となる可能性のある
ものが全て抽出される。

単語辞書６は、読上げるための「読み」、アクセント情
報等の他、その単語の使用頻度１文法属性等を持ってお
り、文章解析部によって文字数等の情報も使い乍ら総合
的に評価して最適な単語列、つまり、「五」　「人」「
の」　「自」「竜」「は」「健康」　「で」に分割され
る。この場合、「目量」なる単語は単２ｉ辞書６に登録
されていないため、「目量」とはならず１、「自」　「
童」に分割される。

また、「五」は数詞、「人」は助数詞等のように、各単
語は文法的属性を有しており、文章解析の際の最適判定
を行なう時に利用される。

この文章解析技術は本出願人が先に提案した「文章解析
方式」　（特願昭５７−１９９２７１号（特開昭５９−
９０１６７号））に開示されている。

分割単語列は無意味漢字列検出部５に供給され、ここで
無意味な漢字列が検出される。無意味漢字列検出部５に
は第１図に示すように、３段階の判定■〜■が設定され
ている。

文章解析部２から送られてきた分割単語列のうち、先ず
、判定■により、全文字漢字で構成されている単語「五
」　「人」　「自」　「竜」　［健康、１が選択される
。次に、判定■により、判定■で選択された単語のうち
、漢字単語が２以上続く漢字単語「五」　「人」　「自
」　「竜」が選択される。つまリ「健康」は次が平仮名
の「でＪであるので選択されず、「五」　「人」　「自
」　「竜１は漢字単語が２つ続くのでこれが選択される
。更に、判定■により、判定■で選択された漢字列の中
に１文字漢字単語「五」及び「人」、「自」及び「竜」
が存在するのでこれらが選択される。

無意味漢字列検出部５にて検出された「五」及び「人」
、「自」及び「童」は検出制限部８に供給され、ここに
設定されている前述の各条件イ〜トと比較される。この
場合、「五」及び「人」は条件口の数詞−助数詞に該当
し、「自ｊ及び「童Ｊは条件イ〜トのいずれにも該当し
ない。これにより、無意味漢字列検出部５において、検
出制限部８で該当のなかった「自」及び「童」が誤字と
して検出される。

「自」及び「童ｊが選択されると、表示制御部７から反
転表示制御信号が出力され、文章入力部１のディスプレ
イ上に「１童」なる単語が反転表示（白抜き表示）され
る。また、この時、合図音を出してオペレータに誤字を
知らせることができる。これにより、オペレータは「１
童、１なる単語の入力誤りを容易に確認し得る。

（発明の効果〕本発明によれば、音が同じでも意味が全く通じない漢字
単語を誤って入力した場合、この誤入力を確実に検出し
得、しかも誤入力を容易に確認でき、文章校正作業を高
能率化しくｑる。

【図面の簡単な説明】

第１図は本発明装置の原理ブロック図、第２図は本発明
装置の一実施例のブロック図である。図において、１は文章入力部、２は文章解析部、３は辞書検索部、４は単語同定部、５は無意味漢字列検出部、６は単語辞書、７は表示制御部、８は検出制限部である。木毛Ｂ月装置の原理７０７７図凛１図

Claims

【特許請求の範囲】文章入力部（１）で入力された日本語文章を文章解析部
（２）で単語辞書（６）を検索することにより単語同定
を行なって各単語の列に分割し、各単語毎に読上げて校
正を行なう文章校正支援装置において、１文字漢字単語を含む漢字列の接続が一般に行なわれる
種々の例を各条件（イ〜ト）として設定された検出制限
部（８）と、上記文章解析部（２）で得られた各単語列で、２文字以
上の漢字列の分割が、１文字漢字単語を含んだ分割とな
る単語列を選択し、該選択された単語列の中で上記検出
制限部（８）に設定された条件に該当する単語列を除い
て残りの単語列を入力誤りとして検出し、その旨を通知
する無意味漢字列検出部（５）とを設けてなることを特
徴とする文章校正支援装置。