JPH01114972A - 文書作成・校正支援装置 - Google Patents

文書作成・校正支援装置

Info

Publication number
JPH01114972A
JPH01114972A JP62274155A JP27415587A JPH01114972A JP H01114972 A JPH01114972 A JP H01114972A JP 62274155 A JP62274155 A JP 62274155A JP 27415587 A JP27415587 A JP 27415587A JP H01114972 A JPH01114972 A JP H01114972A
Authority
JP
Japan
Prior art keywords
evaluation
value
document
readability
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62274155A
Other languages
English (en)
Inventor
Shigeki Kuga
空閑 茂起
Taro Matsushita
太朗 松下
Masahiro Wada
和田 正寛
Hiroyuki Kanza
浩幸 勘座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP62274155A priority Critical patent/JPH01114972A/ja
Publication of JPH01114972A publication Critical patent/JPH01114972A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は、日本語文章の中から、誤りや不適当な表現の
部分を抽出したり、ガイダンスや修正情報を掲示したり
、文書作成時に必要な給量やその他の情報を提供するこ
とにより、文書を作成する文書作成・校正支援装置に関
し、特には該文書作成・校正支援装置における文書評価
値の表示方法の改良に関する。また、本装置はかな漢字
交じり文を言語解析し、かな文字列を得、その結果を利
用して音声合成を行う、音声読みあげ装置としての利用
も可能である。
〈従来の技術〉 現在、日本語ワードプロセッサ(以下、ワープロト略す
る)が実用化されており、それに関連した、日本語の入
出力、編集、かな漢字変換アルゴリズム、辞書の技術な
どの基本技術が確立している。
かな漢字変換方式のワープロは、変換用の辞書が必要で
あり、ユーザが独自に単語を追加できるユーザ辞書の技
術が確立している。
また、日本語処理技術では、形態素解析、構文解析、意
味解析などの基本的な技術が知られている。
欧米ではワープロが早くから普及したため関連技術が進
んでおり、スペルのチエツク、コレクトの機能を持った
装置が実用化されている。
また、現在のところ開発中あるいは試作の段階であるが
、形態素情報を用いることにより、文章の読みやすさを
装置が診断し、使用者に知らせることで分かりやすい文
章を書くことに対する支援を目指した装置も発表されて
いる。
欧米の言葉が単語単位に句切られて記述されるのに比べ
、日本語は句切りのない漢字仮名交り文で記述されるの
が通常であり、更に、正書法が徹底していないことも加
わって、解析が難しく校正を自動化する装置は実用化さ
れていない。
従来、正確な日本語を扱うことが要求される場合、複数
の人が対になり読み合わせをして問題のある部分を抽出
したり、あるいは校正の専門的な知識を持った人が逐次
照合を加え、校正する方法などが用いられている。
最近、このような校正作業を支援するための装置が開発
されつつある。
以上、言語処理を中心とした従来技術について述べたが
、該技術以外では、ワークステーションに関連した技術
が確立しており、作業の効率を上げるためのマルチウィ
ンドウを用いた装置が実用化されている。
近年日本語のワープロが普及し、該装置で作成した文書
が多くなっている。ワープロでは、入力の簡便な、かな
漢字変換方式(以下特に断りがない場合、ローマ字漢字
変換方式を含む)を採用した機種が多くなっている。
かな漢字変換のアルゴリズムは、かなを漢字に変換する
過程で単語辞書、文法などの言語的な情報、単語の出現
頻度などの確率的な情報を利用するのが一般的であり、
常に正しい変換結果が出力される訳ではない。
このため、ワープロなどの使用者が間違った変換結果に
気付かなかったり、間違いには気付いても修正の作業を
失念したり、あるいは単に入力の間違いを起こしたりす
ることにより、間違った文章を作成することが生じる場
合がある。
このような間違いの部分を抽出し、修正の情報を提示し
たり、自動的に修正するのが文書作成・校正支援装置で
ある。
該装置の一つの機能として、形態素の情報を用いて、数
値あるいは相対的な値で文章の読みやすさを表し、その
結果を装置の使用者に提示することにより、文章の改良
を行う方法が提案されている。現在、知られている方法
は、読みやすさのパラメータと評価文でのパラメータの
測定値と、全体的な読みやすさの指標を提示する方法で
ある。
く本発明が解決しようとする問題点〉 ところが従来の方法は、各パラメータの評価値を示す数
値が表示されるだけであり、その数値の持つ意味を理解
しにくく、更に、文書評価に関係する個々のパラメータ
に対する評価値と、該個々の評価値から求められた文書
全体の総合評価値とが、別々に表示されていたので相互
の関係が判りにくいという欠点があった。 また、評価
文章で、パラメータの値が超過しているのか、不足して
いるのか、適当であるかの判別がしにくいとういう欠点
があった。
また、文章全体に対し、どの項目に問題があるが鳥かん
しにくという欠点があった。
更に、問題点が明確に表示されないため、文章を評価し
てもどのような部分を修正していけば良いかの指針が得
られないという欠点を有していた。
本発明は、文章評価のパラメータの値を、グラフなどで
視覚化するとともに評価の程度に応じて区別して表示す
ると共に、個々の指標に対する評価値と文書全体の評価
値とを併せて表示することにより、上記問題を解決した
文書作成・校正支援装置の搗供を目的としている。
く問題点を解決するための手段〉 本発明は、日本語を入力・編集する手段と、該入力され
た日本語を記憶する手段と、辞書を記憶する手段と、文
法を記憶する手段と、該入力されたかな文字列を漢字交
じり文に変換したり、編集したりするマイクロプロセッ
サなどの制御手段と、文字・記号列などを表示する手段
と、校正すべき文字・記号列がある場合に該文字列を修
正する手段から構成される装 く作用〉 本発明は、評価対象文を文字コードや言語解析機能で分
析し、その結果を表示するときに、評価パラメータとそ
の実測値及び個々の評価値から求められた文書全体の評
価値をグラフとともに表示し、見易くするように作用す
る。
また、グラフを、評価パラメータの推奨値との比較によ
って区分することにより、文章中の問題点をユーザに分
かりやすく提示するように作用する。
〈実施例〉 以下図に基づいて本発明の詳細な説明する。第1図は本
発明に係わる文書作成・校正支援装置のブロック構成図
である。
図において1は日本語の文字列を入力・編集するキーボ
ードなどの手段である。この中には、現在では周知の事
実になっているかなを漢字に変えるかな漢字変換機能、
ある文字列を指定する機能も含まれる。
2は該入力手段により入力された日本語の文字列を記憶
する手段である。入力手段は通常キーボードが用いられ
るが逐次的に入力を行なわないで、たとえばフロッピー
ディスク、磁気テープなどのように入力した日本語の文
字列を記憶する外部記憶手段で代用することも可能であ
る。即ち、lの入力手段が省略された構成も存在しうる
3は上記2に蓄積された日本語の文字・記号列を解析す
るための辞書を記憶する手段であり、この中にはユーザ
が定義でき登録、消去の出来るユーザ辞書を記憶する手
段も含まれる。
4は文法、その他の文章を解析するための規則類を記憶
する手段である。
5は2に蓄えられた文字列の中の一部分を抽出したり、
途中結果を記憶したり、表示の司令などを行ったりする
制御手段である。該制御手段には制御によって得られる
結果を記憶する手段を含む。
6は入力された文字列、照合の途中結果、校正すべき文
字列、キーワードイン コンチクスト(以下KWIGと
略称する)などを表示するCRTなどの表示の手段であ
る。
7は6によって表示された校正すべき部分に対し修正を
加えた結果を原文中に正しく反映するための校正手段で
ある。
以下、具体的な説明を行うために、文章の読みやすさの
評価を行う場合について述べる。ただし、本発明は文章
の読みやすさの評価に止どまらず、広く、基準値が設定
された色々な評価を行うときに適用可能なものである。
第2図は該装置の表示手段に表示された校正の解析をし
た結果を表す図である。8は読みやすさの評価対象とな
る文であり、図中斜線を施している部分は該装置が誤り
の可能性のある場所として抽出したことを示している。
図では説明のために代表的な例を上げている。9は誤字
の例であり、かな漢字変換ソフトウェアの不備などによ
り起こる同音異義語の間違いの例である。10は同音の
かなの間違いの例であり、11は送り仮名の間違いの例
であり、12は脱字の例であり、13は不要文字の挿入
の例である。
第3図は読みやすさを表すパラメータを格納するバッフ
ァの構造の例を表した図である。14は文章の読みやす
さを表すパラメータ、!5は評価する文章の各パラメー
タの測定値、16には各パラメータの推奨値、17には
各パラメータの評価値が入る。
第3図(a)のパラメータの中で、18は形態素情報を
表し、19は校正情報を表している。18の例として、
第3図(a)では、含有漢字の割合、平均の文の長さ、
平均の句読点の頻度を上げ、また、19の例として校正
文節出現比を上げていも。
ここで、第3図(a)のパラメータの測定値15につい
て具体的に説明する。評価対象文章8の全文字数は句読
点を含めて45文字である。全文字数として、句読点を
除外して計算する方法もあるが、これから述べる方法と
おなじようなやりかたで値を求めることができる。8の
中の漢字は20文字であり、含有漢字の割合は少数第2
位まで出すと、20/45=0.444となり、44.
4%が値となる。文の長さの平均は45/2=22゜5
、同様に平均の句読点の頻度は、45/2=22.5と
なり、校正文節出現比=5/14=0゜36である。
次に推奨値について、説明する。推奨値は、個人によっ
て若干異なりはあるが、経験的に、民族の常識的な値と
して決定されることが多い。これは、−膜内にわれわれ
が用いている言葉は最初に文法、用語を決定してから実
際の言語の運用を行うのではなく、民族の意志のまとま
りとして言語の体系が順次できるのに似ている。
そのような値として、漢字比率、平均の文の長さ、平均
の句読点の頻度、校正抽出個数の各推奨・値R1,R2
、R3、R4とするとき15のように 25≦R1≦45、25≦R2≦45 7 ≦ R3≦ 15   R4≦ 0.1を得る。た
だし、本発明は、この値の絶対値そのものを云々するも
のではない。
次に、評価値は、推奨値と評価対象文の実測値との差を
何等かの評価関数で評価したものである。
説明を簡単にするため、ここでは、実測値が推奨値の値
であれば100、そうでなければ、0という極端な例を
上げる。第3(a)図の17はそのようにして出された
値である。
評価値の値の出しかたの別の例は、台形型の近似である
。これは指定された区域の間を評価値100とし、指定
された値か゛ら外れる処は線形近似をとるやり方である
。当然、外れた部分に対し、非線形の関数を割り当てる
方法もある。本発明は、近似する関数そのものを限定し
ていないので、各種の近似関数が適用できることのみの
言及に止どめておく。
次に本発明に係る読みやすさ評価値(又は読みやすさ指
標と言う。)の導出について説明する。
読みやすさ指標は下記のごとく第3図(a)で求めた各
パラメータの評価値の関数として定義される。
読みやすさ指標(Y)= f(xl、x2.x3.−=
 、xn)ここで、xnは各パラメータの評価値を示す
関数(f)の具体的な形については、種々のものが考え
られるが、本実施例では、 Y=(al−xl+a2− x2+a3− x3+a4
− x4)/(at+ a2+ a3+ R4)X 1
00という形を用いた。ここで、xl、x2.x3.x
4は、それぞれパラメータである含有漢字比率、平均丈
長、平均句読点頻度、校正文節出現比を、又a1〜a4
は各パラメータに対する重み付けを表している。
ここでは、過去の経験からal= a2= 5、a3=
 a4= 1とした。
上記計算式から第3図(a)のパラメータに対する総合
読みやすさ指標(Y)= 500/1200= 0.4
17となり、パーセント表示で41.7%となる。この
値も第3図(b)のごとくバッファに格納される。
第4図は本発明に係わる文章の読みやすさの評価結果を
表した図である。
縦軸は評価パラメータを、横軸はパラメータの相対的な
値を示している。20は具体的なパラメータの例を表し
、21はパラメータの値を示している。上記各パラメー
タ値に併せて総合読みやすさ指標が図示のごとく表示さ
れる。
22は21の値に対応する棒グラフとなっている。パラ
メータの値は、0から100までに各パラメータの推奨
値が来るように正規化されている。
実際の表示の際は、パラメータの値が100を越える場
合はlOOを指し、0以下の場合はOを指すように設計
されている。
第4図は棒グラフで読みやすさの評価結果を表したが、
棒グラフでなくても本発明には影響しない。たとえば、
他の表現の例は、レーダチャートである。又総合読みや
すさ指標も数字ではなく棒グラフ等で表示してもよい。
第5図は本発明の該略フロー図である。各パラメータの
表示方法として種々のものが同一発明者より別に提案さ
れているが本発明と関係ないので、省略は省略し、ここ
では区分表示処理として1個のブロックであられしてい
る。
まず、該装置の表示装置6へ手段2に記憶された評価文
章8を呼び出す。もし、文章がない場合は手段1により
入力する。この評価文章表示処理ブロックを41とする
次に、文章の読みやすさを表すためのベラメー夕になっ
ている言語情報を出すための言語解析処理を行う。この
言語情報作成のブロックを42とする。
次に、1.3.4.5の各手段を用いて、評価文章を解
析し、校正の可能性のある場所を抽出すこの校正解析処
理ブロックを43とする。
次に、形態素解析、校正解析の処理結果から、読みやす
さを表す各パラメータの実測値を求め、制御手段の中の
バッファに格納する。この処理ブロックを44とする。
次に、バッファの中の評価値を第4図の棒グラフで表現
するとともに6、評価値そのものを表示する。この処理
ブロックを45とする。
次に、評価パラメータの実測値と推奨値との比較を行い
(48)、その比較結果に応じて区分表示(47)を行
う。その後上述のごとく総合よみやすさ指標(Y)を計
算しく4g)、結果を表示(49)する。
50は終了処理のブロックである。この処理は、次文章
の評価の準備の処理も含めてあり、評価処理のモードか
ら抜は出すか、評価する文章が無くなるまで操り返され
た後に実行される。
上の、フローと異なるフローの例を以下に述べる。上で
は、文章の解析を42.43の順に行うようした。これ
は、校正の解析に言語解析の結果を使用する場合が多い
ことから決定したもので、パラメータの値が求まればい
ずれから行っても良い。
〈発明の効果〉 以上の説明で明らかなように、本発明においては各パラ
メータの評価値とそれらから算出した総合の評価値とを
同一画面に併せて表示するようにしたので、文章全体の
評価が容易に出来るという効果がある。その低木発明の
効果は、推奨できるパラメータの値を宵する文章の評価
を行うときに、評価値のみでなく、グラフ化して表示さ
れるので見易い点にある。 また、評価値と推奨値との
比較により、パラメータに対し、評価文章がどのような
質的な評価を受けているかが簡単に確認できる点でも効
果がある。
これらの評価結果を基に、文章のどのパラメータの問題
あるいは推奨の程度が簡単に判断でき、それに合わせて
文章の修正、追加などができる点でも効果がある。
【図面の簡単な説明】
第1図は本発明装置の構成ブロック図、第2図は評価文
章の例を示した図、第3図(a)はバラメーメータ用の
バッファの構造及び各項目の値を示した図、第3図(b
)は読みやすさ指標のバッファ構造を示す図、第4図は
文章の読みやすさを評価した結果の表示例を示す図、及
び第5図は本発明の概略フロー図である。

Claims (1)

    【特許請求の範囲】
  1. 日本語を入力・編集する手段と、該入力された日本語を
    記憶する手段と、辞書を記憶する手段と、文法を記憶す
    る手段と、該入力された日本語の中から校正すべき文字
    ・記号列を抽出する手段と、文章及び該候補文字・記号
    列などを表示する手段と、校正すべき文字・記号列があ
    る場合に該文字を修正する手段を有する文書処理システ
    ムにおいて、文書を評価するときに、複数のパラメータ
    に対する評価値と前記パラメータに対する評価値を基に
    求めた全体の総合評価値とを併せて表示することを特徴
    とする文書作成・校正支援装置。
JP62274155A 1987-10-28 1987-10-28 文書作成・校正支援装置 Pending JPH01114972A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62274155A JPH01114972A (ja) 1987-10-28 1987-10-28 文書作成・校正支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62274155A JPH01114972A (ja) 1987-10-28 1987-10-28 文書作成・校正支援装置

Publications (1)

Publication Number Publication Date
JPH01114972A true JPH01114972A (ja) 1989-05-08

Family

ID=17537797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62274155A Pending JPH01114972A (ja) 1987-10-28 1987-10-28 文書作成・校正支援装置

Country Status (1)

Country Link
JP (1) JPH01114972A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7591248B2 (en) 2004-03-02 2009-09-22 Mikuni Corporation Fuel injection system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254367A (ja) * 1984-05-31 1985-12-16 Fujitsu Ltd 文章分析装置
JPS6126137A (ja) * 1984-07-16 1986-02-05 Toshiro Kutsuwa 2の補数表示並列乗除算方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254367A (ja) * 1984-05-31 1985-12-16 Fujitsu Ltd 文章分析装置
JPS6126137A (ja) * 1984-07-16 1986-02-05 Toshiro Kutsuwa 2の補数表示並列乗除算方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7591248B2 (en) 2004-03-02 2009-09-22 Mikuni Corporation Fuel injection system

Similar Documents

Publication Publication Date Title
Anderson et al. A cross-linguistic database of phonetic transcription systems
US7110939B2 (en) Process of automatically generating translation-example dictionary, program product, computer-readable recording medium and apparatus for performing thereof
CN107679032A (zh) 语音转换纠错方法和装置
US6286014B1 (en) Method and apparatus for acquiring a file to be linked
JPH07325824A (ja) 文法チェックシステム
JP2018163660A (ja) 英語の音節計算法に基づいた可読性評価方法及びシステム
JPH08235182A (ja) 文章処理方法とその装置
CN116360794A (zh) 数据库语言解析方法、装置、计算机设备及存储介质
JPH01114972A (ja) 文書作成・校正支援装置
JP3553762B2 (ja) 文書処理装置
JPH01114971A (ja) 文書作成・校正支援装置
JPH0683812A (ja) 文書入力装置のかな漢字変換装置
JP4229457B2 (ja) データ表示装置及びデータ表示方法
JPH01114974A (ja) 文書作成・校正支援装置
CN117313754B (zh) 智能翻译方法、装置以及翻译机
JPS63118868A (ja) 日本語文章校正装置
JPH033064A (ja) 文字処理装置
JPH0531186B2 (ja)
JPS63229561A (ja) 文書作成・校正支援装置
CN115713075A (zh) 文本处理方法、装置、电子设备和可读存储介质
JPH01114973A (ja) 文書作成・校正支援装置
JPH01114977A (ja) 文書作成・校正支援装置
KR20110091294A (ko) 외래어의 자동 음차 표기 방법 및 장치
CN113553832A (zh) 文字处理方法和装置、电子设备以及计算机可读存储介质
Mallon eLingua Latina: Designing a classical-language e-learning resource