JPH01189762A - 文書分かりやすさ評価方式 - Google Patents

文書分かりやすさ評価方式

Info

Publication number
JPH01189762A
JPH01189762A JP63013974A JP1397488A JPH01189762A JP H01189762 A JPH01189762 A JP H01189762A JP 63013974 A JP63013974 A JP 63013974A JP 1397488 A JP1397488 A JP 1397488A JP H01189762 A JPH01189762 A JP H01189762A
Authority
JP
Japan
Prior art keywords
document
index
apprehensiveness
evaluation
understandability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63013974A
Other languages
English (en)
Inventor
Yoshifumi Takahashi
高橋 善文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63013974A priority Critical patent/JPH01189762A/ja
Publication of JPH01189762A publication Critical patent/JPH01189762A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 文書の分かりやすさを評価する文書分かりやすさ評価方
式に関し、 文書の分かりやすざを、理解しやすさと読みやすさとに
分け、これらに基づいて指数値を算出し、文書の分かり
やすさを定量的に評価することを目的とし、 人力された文書を解析し、文、単語、漢字、平板名など
の文書の分かりやすさを評価するために必要な情報を生
成する日本語解析部と、この生成された文書の分かりや
すさを評価するために必要な情報に基ついて、文書の分
かりやすざを、箇条書き頻度、見出し頻度、抽象語密度
などによって表される理解しやすさ、および一文の長さ
、一文に含まれる文節数、非平板名率などによって表さ
れる読みやすさに分けて評価し、これら両者の評価を総
合した指数値を算出する分かりやすさ評価部とを備え、
この分かりやすさ評価部によって算出された指数値およ
び必要に応じて評価に対応する文書の指針文を併せて記
載するように構成する。
〔産業上の利用分野〕
本発明は、文書の分かりやすさを評価する文書分かりや
すさ評価方式に関するものである。
〔従来の技術と発明が解決しようとする問題点〕文書、
特に技術文書の分かりやすさを評価する手法が望まれて
いる。
しかし、従来、例えば安木美典著「説得の文章技術」 
(講談社刊)に記載されているように、漢字の使用率に
よって“′平易さ”を評価したのでは、漢字以外の重要
な要素例えば係受げの複雑さなどの他の要因が考慮され
ず、特に、技術文書なとにおける経験的な文書の分かり
やすさの感覚と合致しないという問題点があった。
本発明は、文書の分かりやすざを、理解しやすさと読み
やすさとに分け、これらに基ついて評価点を算出し、文
書の分かりやすさを定量的に評価することを目的として
いる。
〔問題点を解決するための手段〕
第1図を参照して問題点を解決するだめの手段を説明す
る。
第1図において、日本語解析部4ば、入力された文書(
技術文書など)について、日本語辞書4−1および日本
語文法4−2を参照して解析し、文、単語、平仮名、漢
字などの文書の分かりやすさを評価するために必要な情
報を生成するものである。
分かりやすさ評価部7は、入力された文書について例え
ばページ単位に、箇条書き頻度、見出し頻度、抽象語密
度などによって表される理解しやすさ、および一文の長
さ、一文に含まれる文節数、非平板8率などによって表
される読みやすさを評価して指数値を算出し、必要に応
じて更に、技術度指数、抽象度指数、対象読者年齢指数
などを初出するものである。
〔作用〕
本発明は、第1図に示すように、日本語解析部4が入力
された文書を解析して文、単語、漢字、平仮名などの文
書の分かりやすさを評価するために必要な情報を生成し
、分かりやすさ評価部7がこの生成された文書の分かり
やすさを評価するために必要な情報に基づいて、理解し
やすさおよび読みやすさの評価を行って指数値を算出し
て出力すると共に、必要に応じて評価に対応した指針文
を付加して出力するようにしている。また、必要に応じ
て、更に、技術度指数、抽象度指数、対象読者年齢指数
などを算出して出力するようにしている。
従って、入力された文書特に技術文書について文書の分
かりやすさを理解しやすさおよび読みやすさに分LJで
評価して指数値を算出することにより、旧算機システム
を用いて文書の分かりやすさを定量的に評価することが
可能となる。
〔実施例〕
次に、第1図から第7図を用いて本発明の1実施例の構
成および動作を順次詳細に説明する。
第1図において、日本文作成デバイス1は、日本語ワー
ドプロセッサなどであって、日本文による文書特に技術
文書を作成するものである。
文書ライブラリ2は、日本文作成デバイス1を用いて作
成(日本語原稿執筆)した日本文を保管・管理するもの
である。
品質要因項目解析部5は、図中計測データ6の具体例と
して示すように、例えば“見出し情報”などのように、
文書の分かりやすさを評価する上で大きな影響を与える
情報を解析するものである。
分かりやすさ指数8は、分かりやすさ評価部7によって
評価された指数値を、例えば第6図難易度の括弧中に例
えば“84”として示すように、1文単位にリストとじ
て印刷されたものである。
尚、この際、指数値と併せて、指針文を、第6図中央に
示すようにメソセージとして印刷するようにしてもよい
次に、第2図フローチャートに記述した順序に従い、第
3図から第7図を用いて、第1図構成の動作を詳細に説
明する。
第2図において、図中■は、文書の入力を行・うことを
示す。これは、第1図文書ライブラリ2から読め出した
文書特に技術文書を、品質評価ツール3を構成する日本
語解析部4に入力することを表す。
図中■は、文の切り出しを行うことを示す。これば、文
書(技術文書など)の中から、一文づつ切り出すことを
表す。
図中■は、単語を抽出し、単語情報の収集を行うことを
示す。これは、図中■で切り出された文から単語を抽出
し、更に品詞を解析し、“抽象語゛、゛技術用語゛、“
略語”などを計測すると共に、゛ひらがな′、“カタカ
ナ”、“漢字パ、゛英字゛、“数字゛、“特殊記号゛な
どを計測することを表ず。
図中■は、文節解析を行い、文節情報の収集を行うこと
を示す。これは、例えば箇条書情報、見出し情報、係受
は情報、挿入句情報などを計測することを表す。そして
、図中■から■を繰り返し、例えばページ単位に実行す
る。
図中■ば、統計情報の収集を行うことを示す。
これは、文の形態、文の構文、用語の意味等の計測結果
から、例えば第3図に示すような統計情報を収集するこ
とを表す。これにより、例えば技術文書の1ページ中に
記載されているパラグラフの数、文の数、文字数などの
形態(形態素解析による形態)が計測されることとなり
、次のステップである図中■によって分かりやすさの品
質評価指数値を算出するための準備が整ったこととなる
図中■は、分かりやすさの品質評価指数値を算出するこ
とを示す。これは、図中■から■を繰り返して収集した
情報から、図中■で統計処理を施した第3図に示すよう
な統計情報に基づいて、文書特に技術文書の分かりやす
ざを、理解ししやすさおよび読みやすさに分けて評価し
て指数値を算出することを表す(後述する)。
図中■は、算出結果を編集し、帳票を作成することを示
す。これは、得られた結果を編集し、例えば後述する第
6図あるいは第7図に示すように印刷することを表す。
第6図は、文単位の帳票例を示す。右端の難易度の括弧
中に図中■で収集した統計情報から算出された指数値が
印刷され、中央に指針文がメソセージとして印刷されて
いる。
第7図は、文書全体の帳票例を示す。
以上の処理によって、入力された文書の日本語解析が行
われ、文の形態(文の平均長、文の数など)の計測結果
に暴ついて、文書の分かりやすさを理解しやすさおよび
読みやすさに分けて評価して指数値を算出することによ
り、文書の分かりやすさを定量的かつ客観的に評価する
ことが可能となる。
第3図は、総計情報の収集例を示す。これは、技術文書
であるTl)S/MΔP L IE説明書第3章前半に
ついて、第2図図中■ないし■の処理によって実際に収
集した具体例である。
第4図は文書の分かりやすさの品質評、価弐の種類を表
したものである。B、l (E、)は、文書全体(一文
)の分かりやすさ指数であって、文書全体の複数の文(
一文)に対する理解しやすさおよび読めやすさの総合評
価指数を表す。Rは、対象読者年齢指数であって、丈長
や漢字率との相関を表す。Tは、技術度指数であって、
文の技術レベルの高低を表す。Aは、抽象度指数であっ
て、文の抽象化の高低を衷ず。以下にこれらの指数値の
算出(評価)について順次詳細に説明する。
まず、文の分かりやすさを評価するために、分かりやす
さを理解しやすさと、読みやすさとに分ける。理解しや
すさは、抽象度の高低、技術レベルの高低、自用語・腹
用語とその係受け、箇条書の頻度、見出しの頻度などの
要因に強く影響される。また、読みやすさは、丈長、文
節数、漢字率、非平板8率、読者の読解力などのの要因
に強く影響される。以下これらに関するルールを導入す
る。
ルール1.理解しやすさと読みやすさとは、相乗的に作
用する。
ルール2:技術レベルの高さは、非平板8率に比例する
ルール3:箇条書又は、見出しの割合は、理解し易さに
それぞれ独立に比例する。
ルール4:丈長および文節数は、読みやすさに反比例す
る。
ルール5:漢字率および非平板8率は、読みやすさに反
比例する。
ルール6:自立語・付属語とその係受けの多さは、理解
しやすさと反比例する。
ルール7:読者の理解力は、年齢に比例する。
ルール8:読者の読解力は、自立語・付属語とその係受
は又は、非平板8率に比例する。
ルール9:就学層の場合、漢字率と非平板8率は、近似
する。
ルール10:抽象語密度は、理解しやすさに反比例する
以上のルール1ないし10を、計算機システムを用いて
演算するために、記号で表現すると下記のようになる。
ここで、OoないしC7は補正項を表し、C1ないしC
,□は次数を合せ、標準指数を100(または15)に
するための定数を表す。
尚、具体的な値は、文の対象を固定したときに既知の統
計値から決定する。
ルール1:E(φ、甲)−C+XΦ×甲・・・■E:分
かりやすさ総合指数 Φ:理解しやすさ 甲:読みやすさ ルール2:T−C2×λ・・・・・・・・・・■λ:非
平板名率(全体の文字数に対 する非平板8数の割合) ルール3:Φ−C8×ω+C4×ξ+θ、・・・■ω:
箇条書頻度(全体の文故に対す る箇条書き数の割合) ξ:見出し頻度(全体の文数に対す る見出し数の割合) ルール マ:1文当りの平均文字数 ルール5: 就学層の文書:甲−C6/にトθ3 ・・■”技術マニ
ュアル:′PーC6/T+θ3 ・■に:漢字率(全体
の文字数に対する 漢字の割合) ルール6:φ=co10+θ5 ・・・・・・・■i:
平均係受は評点(1文当りの平 均の自立語・副用語の係り受けの複雑さ)ルール7:R
=C9XY・・・・・・・・・・■R:対象読者年齢指
数 Y:年齢  、 ルール ルール9:  l’A文書:λ8#に1 ・・・・・■
理科系文書:λr#に,・・・・■。
ルール 次に、理解しやすさ(Φ)は、上記式■、弐〇、および
弐〇から下式[相]によって表される。
o=c3xg+c4x6+c810  (+C16 /
a)[D読みやすさ(’P)は、上記式■および式■が
ら下式■によって表される。
甲−Cs/ Z 十G,/ A ・ ・ ・ ・ ・ 
・ ・ ・ 自 ・0従って、式の、[相]、■から分
かりやすさEは、下式@によって表される。
E =C+ X ( C3X ω+CtX e +ca
/ 0)X(CS/χ十C7/λ)・・・・・・・・@
対象読者年齢指数Rは、下式[相]によって表される。
R −CH  X O +C11  X A ・ ・ 
・ ・ ・ ・ ・ ・ ・@技術度指数1゛は、下式
■によって表される。
T=C2Xλ・・・・・・・・・・・・・・・■理科学
度指数Sは、下式■によって表される。
S””C+□×λr/λ1 ・・・・・・・・・・■抽
象度指数Aは、下式[相]によって表される。
A=C,7Xa・・・・・・・・・・・・・[相]a=
C,. Xab+C,4 xad+C,5XaS  @
晶−Σab/Σμ(平均抽象語数) i2Σad/Σμ(平均対象省略形容 詞数) π=Σas/Σμ〔χ〕 (平均抽象的接尾語数) μ:文節数(1文当りの文節数) 次に、第5図を用いて1文当りの“分かりやすさ指@(
El)  ”を評言で表示した例を示す。これは、上記
式@を用いて算出した、1文当りの分かりやすさの値E
、が、145以上の場合にパ難しずきる”、115から
145までの範囲の場合に“難しい′などのように数値
を評言によって表し、利用者に理解しやすくしたもので
ある。
第6図は、具体例を示す。図示原文に対して、上記式@
を用いて算出した値E1が、図中難易度欄中に記載、例
えば最上段に“易しい(指数値84)゛として記載され
ている。また、指針文が図示のように記述されている。
これば、ルール1ないし10に記述した各ルールなどか
ら求めた値(指数値)の小さいものに対して、メッセー
ジ文として当該指針文を記述したものである。
第7図は、文書全体の分かりやすさ指数(E)などを記
述したものを示す。これは、既述した総合指数(E)、
対象読者年齢指数(R)、抽象度指数(A)、および技
術度指数(T)について夫々求めて記載したものである
。このように、分かりやすさ指数のみでなく、他の指数
(R,A、]゛)などを参照するごとにより、文書特に
技術文書の分かりやすさを総合的に評価することが可能
となる。
〔発明の効果〕
以上説明したように、本発明によれば、入力された文書
特に技術文書について文書の分かりやすさを理解しやす
さ、および読みやすさに分けて評価して指数値を算出す
ると共に、更に、必要に応じて対象読者年齢指数(R)
、抽象度指数(A>、技術度指数(T)などを算出する
構成を採用しているため、計算機システムを用いて文書
の分かりやすさを定量的かつ客観的に評価することがで
きる。これにより、文書の分かりやすざを、他の文書と
客観的に比較することが可能となると共に、文書の分か
りやすさに関する品質の均質化を図ることが可能となる
【図面の簡単な説明】
第1図は本発明の1実施例構成図、第2図は本発明の動
作説明フローチャート、第3図は統計情報の収集例、第
4図は分かりやすさの品質評価指数例、第5図は1文当
りの分かり易さ指数(E。 )例、第6図は本発明による指数値および指針文例、第
7図は文書全体の分かりやすさ指数例を示す。 図中、4は日本語解析部、5は品質要因項目解析部、6
は計測データ、7は分かりやすさ評価部、8は分かりや
すさ指数を表す。 本発明の動作説明フローチャート 第2図

Claims (1)

  1. 【特許請求の範囲】 文書の分かりやすさを評価する文書分かりやすさ評価方
    式において、 入力された文書を解析し、文、単語、漢字、平仮名など
    の文書の分かりやすさを評価するために必要な情報を生
    成する日本語解析部(4)と、この生成された文書の分
    かりやすさを評価するために必要な情報に基づいて、文
    書の分かりやすざを、箇条書き頻度、見出し頻度、抽象
    語密度などによって表される理解しやすさ、および一文
    の長さ、一文に含まれる文節数、非平板名率などによっ
    て表される読みやすさに分けて評価し、これら両者の評
    価を総合した指数値を算出する分かりやすさ評価部(7
    )とを備え、 この分かりやすさ評価部(7)によって算出された指数
    値および必要に応じて評価に対応する文書の指針文を併
    せて記載するように構成したことを特徴とする文書分か
    りやすさ評価方式。
JP63013974A 1988-01-25 1988-01-25 文書分かりやすさ評価方式 Pending JPH01189762A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63013974A JPH01189762A (ja) 1988-01-25 1988-01-25 文書分かりやすさ評価方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63013974A JPH01189762A (ja) 1988-01-25 1988-01-25 文書分かりやすさ評価方式

Publications (1)

Publication Number Publication Date
JPH01189762A true JPH01189762A (ja) 1989-07-28

Family

ID=11848196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63013974A Pending JPH01189762A (ja) 1988-01-25 1988-01-25 文書分かりやすさ評価方式

Country Status (1)

Country Link
JP (1) JPH01189762A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0486956U (ja) * 1990-11-30 1992-07-28
JP2005050357A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP2007122660A (ja) * 2005-10-31 2007-05-17 Toshiba Corp 文書データ処理装置および文書データ処理プログラム
JP2009064339A (ja) * 2007-09-07 2009-03-26 Hitachi High-Technologies Corp 仕様書内容検査方法および仕様書内容検査システム
JP2018045690A (ja) * 2016-09-09 2018-03-22 ファインディ株式会社 文書作成支援システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254367A (ja) * 1984-05-31 1985-12-16 Fujitsu Ltd 文章分析装置
JPS6126173A (ja) * 1984-07-17 1986-02-05 Nec Corp 文章評価装置
JPS61248155A (ja) * 1985-04-26 1986-11-05 Hitachi Ltd ワ−ドプロセツシング方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254367A (ja) * 1984-05-31 1985-12-16 Fujitsu Ltd 文章分析装置
JPS6126173A (ja) * 1984-07-17 1986-02-05 Nec Corp 文章評価装置
JPS61248155A (ja) * 1985-04-26 1986-11-05 Hitachi Ltd ワ−ドプロセツシング方式

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0486956U (ja) * 1990-11-30 1992-07-28
JP2005050357A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP2005050351A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP2007122660A (ja) * 2005-10-31 2007-05-17 Toshiba Corp 文書データ処理装置および文書データ処理プログラム
JP2009064339A (ja) * 2007-09-07 2009-03-26 Hitachi High-Technologies Corp 仕様書内容検査方法および仕様書内容検査システム
JP2018045690A (ja) * 2016-09-09 2018-03-22 ファインディ株式会社 文書作成支援システム

Similar Documents

Publication Publication Date Title
Keim et al. Literature fingerprinting: A new method for visual literary analysis
Kilgarriff et al. GDEX: Automatically finding good dictionary examples in a corpus
Jones Readability of annual reports: Western versus Asian evidence‐a comment to contexualize
JPH09190449A (ja) 索引自動生成方法とその利用方法
Suter et al. Rule-based automatic text simplification for German
WO2007105202A2 (en) Automatic reusable definitions identification (rdi) method
Chang A new approach for automatic Chinese spelling correction
JP6626917B2 (ja) 英語の音節計算法に基づいた可読性評価方法及びシステム
JPH06215049A (ja) 文書要約装置
JPH01189762A (ja) 文書分かりやすさ評価方式
JP2828692B2 (ja) 情報検索装置
JP2536633B2 (ja) 複合語抽出装置
JP2006119697A (ja) 質問応答システム、質疑応答方法および質疑応答プログラム
Nastase et al. Combining collocations, lexical and encyclopedic knowledge for metonymy resolution
Declerck et al. The Integration of a Part-of-Speech Tagger into the alep Platform
JP2004334699A (ja) テキスト評価装置、テキスト評価方法、プログラム及び記憶媒体
Casas et al. Sparsely factored neural machine translation
Zahroh et al. Comparison Results of Google Translate and Microsoft Translator on the Novel Mughamarah Zahrah Ma'a Ash-Syajarah by Yacoub Al-Sharouni
Nyandag et al. Improving Determine Lexical Meanings for Mongolian Cyrillic Script and Its Used to Keyword Extraction
JP2609650B2 (ja) 文書品質評価方式
Waldenberger et al. Towards a broad-coverage graphemic analysis of large historical corpora
JPH08153091A (ja) 文書作成装置及び注釈付加方法
Deksne et al. Towards the Development of Language Analysis Tools for the Written Latgalian Language
JP2003022266A (ja) 文章語文体変換システムおよび文章語文体変換処理プログラム
Thelen Translation and terminology. Theory and practice in Hungary