JPS63249260A - 文章校正支援装置 - Google Patents
文章校正支援装置Info
- Publication number
- JPS63249260A JPS63249260A JP62083324A JP8332487A JPS63249260A JP S63249260 A JPS63249260 A JP S63249260A JP 62083324 A JP62083324 A JP 62083324A JP 8332487 A JP8332487 A JP 8332487A JP S63249260 A JPS63249260 A JP S63249260A
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- word
- words
- sentence
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001915 proofreading effect Effects 0.000 title abstract description 11
- 238000001514 detection method Methods 0.000 claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims description 17
- 230000000694 effects Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- UNPLRYRWJLTVAE-UHFFFAOYSA-N Cloperastine hydrochloride Chemical compound Cl.C1=CC(Cl)=CC=C1C(C=1C=CC=CC=1)OCCN1CCCCC1 UNPLRYRWJLTVAE-UHFFFAOYSA-N 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(II要〕
本発明は文章校正支援装置において、
入力された文章の読上げを聴いているだけでは音が同じ
でも意味が全く通じない漢字IF EHの入力誤りを確
認しにくい従来の問題点を解決するため、2文字以上の
漢字列の分割が1文字漢字ltI語を含んだ分割になっ
た場合で、その分割が数詞−数詞の組合せ、姓−名前の
組合せ等の例を除いたもののみ入力誤りとして検出する
ことにより、盲が同じでも意味が全く通じない漢字単品
を誤って入力してしまった場合、この人力誤りを確実に
検出し得、しかも誤入力を容易に確認できるようにした
ものである。
でも意味が全く通じない漢字IF EHの入力誤りを確
認しにくい従来の問題点を解決するため、2文字以上の
漢字列の分割が1文字漢字ltI語を含んだ分割になっ
た場合で、その分割が数詞−数詞の組合せ、姓−名前の
組合せ等の例を除いたもののみ入力誤りとして検出する
ことにより、盲が同じでも意味が全く通じない漢字単品
を誤って入力してしまった場合、この人力誤りを確実に
検出し得、しかも誤入力を容易に確認できるようにした
ものである。
(産業上の利用分野)
本発明は、入力された新聞記事のような通常の日本語文
章を正しく入力されたかどうか手書き原稿と照合し乍ら
校正するのを支援するため、入力文を合成音声で読上げ
る文章読上げ校正支援装置に関する。
章を正しく入力されたかどうか手書き原稿と照合し乍ら
校正するのを支援するため、入力文を合成音声で読上げ
る文章読上げ校正支援装置に関する。
この種の校正支援装置において、入力誤字を容易に確認
できれば便利であり、校正作業を高能率化し得る。
できれば便利であり、校正作業を高能率化し得る。
出版業界等では印刷工程に回る萌に、送り仮名の誤り、
誤字、脱字等の修正のため、校正作業を行なう。この作
業は精度を上げるため、一般に、−人が文章を読上げ、
他の一人がそれを聴き乍ら手古き原稿をチェックするシ
ステムをとっている。
誤字、脱字等の修正のため、校正作業を行なう。この作
業は精度を上げるため、一般に、−人が文章を読上げ、
他の一人がそれを聴き乍ら手古き原稿をチェックするシ
ステムをとっている。
ところが、文章データのCTS (コンピュータライズ
ド・タイプ・セツティング(電子編集組版))システム
化に伴い、文章の読上げをコンピュータに行なわせたい
との要望があり、漢字、仮名混り文を各単語に分割して
読み情報を付与し、これを合成音声で読上げる文章読上
げ校正支援装置がある。
ド・タイプ・セツティング(電子編集組版))システム
化に伴い、文章の読上げをコンピュータに行なわせたい
との要望があり、漢字、仮名混り文を各単語に分割して
読み情報を付与し、これを合成音声で読上げる文章読上
げ校正支援装置がある。
従来の校正支援装置は、人間の読み手に比して読上げを
主眼にしているため、例えば1−国鉄」と「晶鉄」、「
相違」と「相異」等を夫々区別できずに夫々同一の音で
そのまま読み進み、オペレータがディスプレイに表示さ
れる単語の入力誤りを万一発見できなかった場合は誤入
力のまま処理されてしまう問題点があった。
主眼にしているため、例えば1−国鉄」と「晶鉄」、「
相違」と「相異」等を夫々区別できずに夫々同一の音で
そのまま読み進み、オペレータがディスプレイに表示さ
れる単語の入力誤りを万一発見できなかった場合は誤入
力のまま処理されてしまう問題点があった。
そこで本出願人は上記問題点を解決すべく、同日付の特
許願(発明の名称「文章校正支援装置、1)で、[文章
解析で得られた各単語列で、2文字以上の漢字列の分割
が、1文字漢字単詔を含んだ分割となったとき、入力誤
りとして検出し、その旨を通知する無意味漢字列検出部
とを設けてなる1文章校正支援装置を提案した。この装
置によれば、例えば「討論」を誤って「投」 「論」と
入力した場合、文章解析部にて「投」 「論」の各単語
に分割され、無意味漢字列検出部において、2文字以上
の漢字列の分割が「投」 「論」のように1文字漢字単
語を含んだ分割を入力誤りとして検出し、これをオペレ
ータに通知する。これにより、音が同じで意味が全く異
なる(又は意味が通じない)漢字単語を誤って入力した
場合誤入力を容易に確認できる。
許願(発明の名称「文章校正支援装置、1)で、[文章
解析で得られた各単語列で、2文字以上の漢字列の分割
が、1文字漢字単詔を含んだ分割となったとき、入力誤
りとして検出し、その旨を通知する無意味漢字列検出部
とを設けてなる1文章校正支援装置を提案した。この装
置によれば、例えば「討論」を誤って「投」 「論」と
入力した場合、文章解析部にて「投」 「論」の各単語
に分割され、無意味漢字列検出部において、2文字以上
の漢字列の分割が「投」 「論」のように1文字漢字単
語を含んだ分割を入力誤りとして検出し、これをオペレ
ータに通知する。これにより、音が同じで意味が全く異
なる(又は意味が通じない)漢字単語を誤って入力した
場合誤入力を容易に確認できる。
然るに、上記提案になる装置は、築1図の文章入力部1
で例えば「五人の〜」のように正しく入力した場合、文
章解析部2において「五」「人」「の」・・・と各単語
に分割され、無意味漢字列検出部5において、単語列の
中に1文字漢字甲語「五」「人」が存在するとしてこれ
を誤字として検出してしまう。つまり、正しく入力した
にも拘らず、無意味漢字列検出部5の判定■〜■にて1
文字漢字単語を誤入力として検出してしまう問題点があ
った。
で例えば「五人の〜」のように正しく入力した場合、文
章解析部2において「五」「人」「の」・・・と各単語
に分割され、無意味漢字列検出部5において、単語列の
中に1文字漢字甲語「五」「人」が存在するとしてこれ
を誤字として検出してしまう。つまり、正しく入力した
にも拘らず、無意味漢字列検出部5の判定■〜■にて1
文字漢字単語を誤入力として検出してしまう問題点があ
った。
第1図は本発明装置の原理ブロック図を示す。
同図中、1は文章入力部、2は文章解析部、5は無意味
漢字列検出部、6は甲語辞占、8は検出制限部である。
漢字列検出部、6は甲語辞占、8は検出制限部である。
本発明装置は、第1図に示す如く、文章入力部1で入力
された日本語文章を文章解析部2でIJi語辞占6を検
索することにより単語同定を行なって各単語の列に分割
し、各I$1語毎に読上げて校正を行なう文章校正支援
装置において、1文字漢字!1語を含む漢字列の接続が
一般に行なわれる種々の例を各条件(イ〜ト)として設
定された検出ゐす眼部8と、 文章解析部2で得られた各単語列で、2文字以上の漢字
列の分割が、1文字漢字単語を含んだ分割となる単語列
を選択し、該選択された単語列の中で検出制限部8に設
定された条件に該当する単語列を除いて残りの単語列を
人力誤りとして検出し、その旨を通知する無意味漢字列
検出部5とを設けてなる。
された日本語文章を文章解析部2でIJi語辞占6を検
索することにより単語同定を行なって各単語の列に分割
し、各I$1語毎に読上げて校正を行なう文章校正支援
装置において、1文字漢字!1語を含む漢字列の接続が
一般に行なわれる種々の例を各条件(イ〜ト)として設
定された検出ゐす眼部8と、 文章解析部2で得られた各単語列で、2文字以上の漢字
列の分割が、1文字漢字単語を含んだ分割となる単語列
を選択し、該選択された単語列の中で検出制限部8に設
定された条件に該当する単語列を除いて残りの単語列を
人力誤りとして検出し、その旨を通知する無意味漢字列
検出部5とを設けてなる。
例えば「五人の1童は健斥で〜」なる文章が入力された
場合、文章解析部2にて「五」 「人」「の」「自」「
童」「は」「健康」「で」・・・の各単語に分割される
。無意味漢字列検出部5において、2文字以上の漢字列
の分割が「五」 「人」「自」 「童」のように1文字
漢字単語を含んだ分割となるIIi語列を選択し、この
中で検出制限部8の条件に該当する単語列「五」 「人
」を除き、残りの[自J riJを入力誤りとして検
出し、これをオペレータに通知する。
場合、文章解析部2にて「五」 「人」「の」「自」「
童」「は」「健康」「で」・・・の各単語に分割される
。無意味漢字列検出部5において、2文字以上の漢字列
の分割が「五」 「人」「自」 「童」のように1文字
漢字単語を含んだ分割となるIIi語列を選択し、この
中で検出制限部8の条件に該当する単語列「五」 「人
」を除き、残りの[自J riJを入力誤りとして検
出し、これをオペレータに通知する。
(実施例)
第2図は本発明装置の一実施例のブロック図を示す。同
図中、1はキーボード及びディスプレイ等にて構成され
る文章入力部、2は文章解析部で、単語辞書6を検索す
る辞書検索部3及び単語同定部4にて構成されており、
入力された文章を各単語に分割する。5は無意味漢字列
検出部で、全文字漢字で構成されている単語が2以上連
続しており、その中に1文字単語が存在している場合は
誤字として検出する。7は表示制御部で、誤字検出され
た場合文章入力部1のディスプレイに表示されている誤
字を例えば反転表示する−り面信号を出力する。
図中、1はキーボード及びディスプレイ等にて構成され
る文章入力部、2は文章解析部で、単語辞書6を検索す
る辞書検索部3及び単語同定部4にて構成されており、
入力された文章を各単語に分割する。5は無意味漢字列
検出部で、全文字漢字で構成されている単語が2以上連
続しており、その中に1文字単語が存在している場合は
誤字として検出する。7は表示制御部で、誤字検出され
た場合文章入力部1のディスプレイに表示されている誤
字を例えば反転表示する−り面信号を出力する。
8は検出制限部で、無意味漢字列検出部5にて1文字漢
字単語が検出されても条件イ〜トに該当するものはこれ
を誤字としないように制限を与える。上記条件とは、イ
、数詞−数詞(例えば、「百」 「二J IN−J r
三」)、口、数詞−助数詞(例えば、「五」「人」)、
ハ、2甲語で姓−名前(例えば、「関」「宏」)、二、
3単語で姓−名前−人称名詞(例えば、「山水」 「正
」 「課長」)、ホ、2単語で姓−人称名詞(例えば、
「沢」「先生」)、へ、漢字列の終りが動詞で次が活用
語尾(例えば、「早」 「歩」 「き」)、ト、接辞(
例えば、「大」 「会社」)等である。
字単語が検出されても条件イ〜トに該当するものはこれ
を誤字としないように制限を与える。上記条件とは、イ
、数詞−数詞(例えば、「百」 「二J IN−J r
三」)、口、数詞−助数詞(例えば、「五」「人」)、
ハ、2甲語で姓−名前(例えば、「関」「宏」)、二、
3単語で姓−名前−人称名詞(例えば、「山水」 「正
」 「課長」)、ホ、2単語で姓−人称名詞(例えば、
「沢」「先生」)、へ、漢字列の終りが動詞で次が活用
語尾(例えば、「早」 「歩」 「き」)、ト、接辞(
例えば、「大」 「会社」)等である。
ところで、漢字で構成される固有名詞、普通名詞等の単
語の構成文字数の分布は2文字以下の単語が90%で、
特に、2文字のみの単語が80%を占める。文章解析に
用いられる単語辞書6も同様の分布で構成されているた
め、2文字以上の漢字列(例えば「討論」)が1文字単
語で分割される(例えば「投」 「論」)ということは
そこに誤りを含んでいる可能性が高い。然るに、新聞記
事の文字出現頻度をみると、上位20位に「日」r−J
r+J r二」「人」「年」「三」「本」「五」 「
四」 「時」等が入っており、数詞、助数詞が約半分を
占めており、その伯に姓名等がある。
語の構成文字数の分布は2文字以下の単語が90%で、
特に、2文字のみの単語が80%を占める。文章解析に
用いられる単語辞書6も同様の分布で構成されているた
め、2文字以上の漢字列(例えば「討論」)が1文字単
語で分割される(例えば「投」 「論」)ということは
そこに誤りを含んでいる可能性が高い。然るに、新聞記
事の文字出現頻度をみると、上位20位に「日」r−J
r+J r二」「人」「年」「三」「本」「五」 「
四」 「時」等が入っており、数詞、助数詞が約半分を
占めており、その伯に姓名等がある。
本発明は、数詞、助数詞、姓名等は単語分割すると1文
字漢字′#@語になる例が多いことに着目したものであ
る。
字漢字′#@語になる例が多いことに着目したものであ
る。
以下、第1図の文章入力部1に示すように、[五人の児
童は健康で〜]と入力するところを誤って「五人の目量
は健康で〜」と入力した場合について説明する。この文
章は文章解析部2に入力され、辞書検索部3にて単語辞
書6を検索し、単語同定部4にて単語M84に登録され
ている単語のうち、その文章の単品となる可能性のある
ものが全て抽出される。
童は健康で〜]と入力するところを誤って「五人の目量
は健康で〜」と入力した場合について説明する。この文
章は文章解析部2に入力され、辞書検索部3にて単語辞
書6を検索し、単語同定部4にて単語M84に登録され
ている単語のうち、その文章の単品となる可能性のある
ものが全て抽出される。
単語辞書6は、読上げるための「読み」、アクセント情
報等の他、その単語の使用頻度1文法属性等を持ってお
り、文章解析部によって文字数等の情報も使い乍ら総合
的に評価して最適な単語列、つまり、「五」 「人」「
の」 「自」「竜」「は」「健康」 「で」に分割され
る。この場合、「目量」なる単語は単2i辞書6に登録
されていないため、「目量」とはならず1、「自」 「
童」に分割される。
報等の他、その単語の使用頻度1文法属性等を持ってお
り、文章解析部によって文字数等の情報も使い乍ら総合
的に評価して最適な単語列、つまり、「五」 「人」「
の」 「自」「竜」「は」「健康」 「で」に分割され
る。この場合、「目量」なる単語は単2i辞書6に登録
されていないため、「目量」とはならず1、「自」 「
童」に分割される。
また、「五」は数詞、「人」は助数詞等のように、各単
語は文法的属性を有しており、文章解析の際の最適判定
を行なう時に利用される。
語は文法的属性を有しており、文章解析の際の最適判定
を行なう時に利用される。
この文章解析技術は本出願人が先に提案した「文章解析
方式」 (特願昭57−199271号(特開昭59−
90167号))に開示されている。
方式」 (特願昭57−199271号(特開昭59−
90167号))に開示されている。
分割単語列は無意味漢字列検出部5に供給され、ここで
無意味な漢字列が検出される。無意味漢字列検出部5に
は第1図に示すように、3段階の判定■〜■が設定され
ている。
無意味な漢字列が検出される。無意味漢字列検出部5に
は第1図に示すように、3段階の判定■〜■が設定され
ている。
文章解析部2から送られてきた分割単語列のうち、先ず
、判定■により、全文字漢字で構成されている単語「五
」 「人」 「自」 「竜」 [健康、1が選択される
。次に、判定■により、判定■で選択された単語のうち
、漢字単語が2以上続く漢字単語「五」 「人」 「自
」 「竜」が選択される。つまリ「健康」は次が平仮名
の「でJであるので選択されず、「五」 「人」 「自
」 「竜1は漢字単語が2つ続くのでこれが選択される
。更に、判定■により、判定■で選択された漢字列の中
に1文字漢字単語「五」及び「人」、「自」及び「竜」
が存在するのでこれらが選択される。
、判定■により、全文字漢字で構成されている単語「五
」 「人」 「自」 「竜」 [健康、1が選択される
。次に、判定■により、判定■で選択された単語のうち
、漢字単語が2以上続く漢字単語「五」 「人」 「自
」 「竜」が選択される。つまリ「健康」は次が平仮名
の「でJであるので選択されず、「五」 「人」 「自
」 「竜1は漢字単語が2つ続くのでこれが選択される
。更に、判定■により、判定■で選択された漢字列の中
に1文字漢字単語「五」及び「人」、「自」及び「竜」
が存在するのでこれらが選択される。
無意味漢字列検出部5にて検出された「五」及び「人」
、「自」及び「童」は検出制限部8に供給され、ここに
設定されている前述の各条件イ〜トと比較される。この
場合、「五」及び「人」は条件口の数詞−助数詞に該当
し、「自j及び「童Jは条件イ〜トのいずれにも該当し
ない。これにより、無意味漢字列検出部5において、検
出制限部8で該当のなかった「自」及び「童」が誤字と
して検出される。
、「自」及び「童」は検出制限部8に供給され、ここに
設定されている前述の各条件イ〜トと比較される。この
場合、「五」及び「人」は条件口の数詞−助数詞に該当
し、「自j及び「童Jは条件イ〜トのいずれにも該当し
ない。これにより、無意味漢字列検出部5において、検
出制限部8で該当のなかった「自」及び「童」が誤字と
して検出される。
「自」及び「童jが選択されると、表示制御部7から反
転表示制御信号が出力され、文章入力部1のディスプレ
イ上に「1童」なる単語が反転表示(白抜き表示)され
る。また、この時、合図音を出してオペレータに誤字を
知らせることができる。これにより、オペレータは「1
童、1なる単語の入力誤りを容易に確認し得る。
転表示制御信号が出力され、文章入力部1のディスプレ
イ上に「1童」なる単語が反転表示(白抜き表示)され
る。また、この時、合図音を出してオペレータに誤字を
知らせることができる。これにより、オペレータは「1
童、1なる単語の入力誤りを容易に確認し得る。
(発明の効果〕
本発明によれば、音が同じでも意味が全く通じない漢字
単語を誤って入力した場合、この誤入力を確実に検出し
得、しかも誤入力を容易に確認でき、文章校正作業を高
能率化しくqる。
単語を誤って入力した場合、この誤入力を確実に検出し
得、しかも誤入力を容易に確認でき、文章校正作業を高
能率化しくqる。
第1図は本発明装置の原理ブロック図、第2図は本発明
装置の一実施例のブロック図である。 図において、 1は文章入力部、 2は文章解析部、 3は辞書検索部、 4は単語同定部、 5は無意味漢字列検出部、 6は単語辞書、 7は表示制御部、 8は検出制限部である。 木毛B月装置の原理7077図 凛1図
装置の一実施例のブロック図である。 図において、 1は文章入力部、 2は文章解析部、 3は辞書検索部、 4は単語同定部、 5は無意味漢字列検出部、 6は単語辞書、 7は表示制御部、 8は検出制限部である。 木毛B月装置の原理7077図 凛1図
Claims (1)
- 【特許請求の範囲】 文章入力部(1)で入力された日本語文章を文章解析部
(2)で単語辞書(6)を検索することにより単語同定
を行なって各単語の列に分割し、各単語毎に読上げて校
正を行なう文章校正支援装置において、 1文字漢字単語を含む漢字列の接続が一般に行なわれる
種々の例を各条件(イ〜ト)として設定された検出制限
部(8)と、 上記文章解析部(2)で得られた各単語列で、2文字以
上の漢字列の分割が、1文字漢字単語を含んだ分割とな
る単語列を選択し、該選択された単語列の中で上記検出
制限部(8)に設定された条件に該当する単語列を除い
て残りの単語列を入力誤りとして検出し、その旨を通知
する無意味漢字列検出部(5)とを設けてなることを特
徴とする文章校正支援装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62083324A JPS63249260A (ja) | 1987-04-03 | 1987-04-03 | 文章校正支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62083324A JPS63249260A (ja) | 1987-04-03 | 1987-04-03 | 文章校正支援装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63249260A true JPS63249260A (ja) | 1988-10-17 |
Family
ID=13799247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62083324A Pending JPS63249260A (ja) | 1987-04-03 | 1987-04-03 | 文章校正支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63249260A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002003240A1 (en) * | 2000-07-05 | 2002-01-10 | Palman System Ltd. | Proofreading system of chinese characters by means of one-to-one comparison |
-
1987
- 1987-04-03 JP JP62083324A patent/JPS63249260A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002003240A1 (en) * | 2000-07-05 | 2002-01-10 | Palman System Ltd. | Proofreading system of chinese characters by means of one-to-one comparison |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cook | The English writing system | |
JPH07325824A (ja) | 文法チェックシステム | |
JPH07325828A (ja) | 文法チェックシステム | |
JPH07121673A (ja) | 情報提供方法およびその装置 | |
JPS63249260A (ja) | 文章校正支援装置 | |
JPS63249259A (ja) | 文章校正支援装置 | |
JP3470927B2 (ja) | 自然語解析方法及び装置 | |
Furugori | Improving spelling checkers for Japanese users of English | |
JPS63234348A (ja) | 文章校正支援方式 | |
KR102604758B1 (ko) | 사용자 정보를 이용한 맞춤법 검사 시스템 및 방법 | |
JPS6288054A (ja) | 文章読み上げ装置 | |
KR101080880B1 (ko) | 외래어의 자동 음차 표기 방법 및 장치 | |
JPH0363767A (ja) | テキスト音声合成装置 | |
KR100564742B1 (ko) | 문자의 음성변환장치 및 방법 | |
Reed | Hosea: A Handbook on the Hebrew Text by Eric J. Tully | |
Allen et al. | Webster's third new international dictionary a symposium | |
JPS62212871A (ja) | 文章読み上げ校正装置 | |
Singh et al. | Content Improvisation by Spell Checking, Grammar Checking, Tone Checking and Scoring | |
JPS63189933A (ja) | 文章読み上げ装置 | |
JPS63301354A (ja) | 文章読み上げ校正装置 | |
JPS63231672A (ja) | 文章校正支援装置 | |
JPH05314114A (ja) | 誤字検出方法およびその装置 | |
Trushkina | Automatic error detection in second language learners' writing | |
JPH038053A (ja) | 仮名漢字変換システムの単語登録方法 | |
JPS63106040A (ja) | 文章読み上げ校正装置 |