JPS6126173A - 文章評価装置 - Google Patents

文章評価装置

Info

Publication number
JPS6126173A
JPS6126173A JP14813184A JP14813184A JPS6126173A JP S6126173 A JPS6126173 A JP S6126173A JP 14813184 A JP14813184 A JP 14813184A JP 14813184 A JP14813184 A JP 14813184A JP S6126173 A JPS6126173 A JP S6126173A
Authority
JP
Japan
Prior art keywords
sentence
adjunct
information
document
morphological analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP14813184A
Other languages
English (en)
Inventor
Kazushi Muraki
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP14813184A priority Critical patent/JPS6126173A/ja
Publication of JPS6126173A publication Critical patent/JPS6126173A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文の可読性を評価する機能を有し、読み易く、
統一的な文書の作成を容易にする文章評価装置に関する
(従来技術とその問題点) ワードプロセッサーは最近その普及が急速度に進んだ。
しかし文書作成と印刷が同一システムの中で統合化され
ても、その文書中の文ないし2文章自身に誤字、脱字が
あったシ、文章ないし文の体栽が不統一であったり、複
雑すぎたシして作成された文書が読み難いなどの不都合
が起こる。これは1文書内体の可読性を評価するための
機能が文書作成用ワードプロセッサーに欠けているため
で69、文書作成者自身には理解できても、それが読め
るかどうかは文書を受けた人間による判断ないし1文書
読解能力にまかされてしまう状況がることかある。
(発明の目的) 本発明ではこうした不都合を減少するためK、文書中の
文の可読性を客観的に評価し、その評価結果にもとづい
て文書作成者が文のポリッシュア、プを行う指針と案を
提出できる文章評価装置を提供することを目的とする。
(発明の構成) 本発明は、各付属語について形態的、構文的。
意味的機能や、その単語の日常性度(難易度、使用頻度
)や、意味的類義語を記述した辞書を格納する付属語辞
書格納部と、入力された文を字種情報と前記付属語辞書
格納部内の辞書内容を用いて形態素解析し、未定義語発
見及び特殊シンボル。
字種、ス) IJング長、6語の機能、類義語、同類語
の日常性度などを収集する形態素解析部と、前記形態素
解析部よりの出力情報をもとの文の可読性(複雑度1文
の難易度2丈長)を評価し、一定の許容範囲を越えた場
合に書きかえの指針とその案を生成する評価部と前記評
価部からの指針と書きかえ案を表示するレポート表示部
を含んで構成されることを特徴とする。
(実施例) 第1図は本発明の第1の実施例を示すブロック図である
。キーボード6によυ文字入力されて文書作成部1によ
シ作成された文章が形態素解析部2にデータ線12を介
して出力される。形態素解析部2に於いては文書を特殊
シンボル「・」ピリオドによって文単位に分割しその各
々の文に対し以下の処理を行なう。まず1文中を字種情
報に従って同一字種ス) IJソング分割し、文の長さ
2個々の同一字種ストリングの個数、同一字種ストリン
グ各々の長さ、かな字種を含オず異字種にまたがるス)
IJソング各々の長さと個数、「、j等の数出力する。
評価部3は、各々の文に対し前記形態素解析部2よシ得
た丈長l、同−字種ス) IJソング個数SCと各々の
長さ8JIIi !ひらがなを含まないストリングの個
数icと各々の長さ11j+ひらがなストリングの個数
he、r、Jの数cc 、 r(1)Jの個数peを用
いて複雑度C8m、難易度Redを以下の原理で評価す
る。
まず入力漢字かな混9文に於いて、複雑度C8mを考え
る。
(1)助詞、助動詞ストリングの存在を示すひらがなス
) IJング数KCに比例し句数phcひいてはング数
SCに比例し全数phcの増大が推測できる。
(3)丈長lに比例し全数phc 、単文数sscの大
きさが推測できる。
(4)句数phc、単文教escが1文中で大きくなれ
ば文の複雑度C8mが増すと推定できる。
phc= f、hc(kc 、 l、 5C)ssc=
 f88o(kc 、 l) Com =fcom (Phc+ s8Q )但し、f
phc r j’ssc r fcomは単調増加関数
である。
一例としては1次式を用いることができる。
ここでl。、 ken 、 SCoは正規化定数である
次に難易度R8dについて考える。難易度は読解の容易
さ困難さを表現する指標であり、Redの増大は読解に
困難をきたす。
(1)句数phcと記号r、J数cc間で一定のバラン
スを保持し、句数phcが一定値以下の場合ccが大き
すぎると難易度Redは大きくなり−phcが一定値以
下でccが少なすぎると文の読解が困難となが単調増大
する( C,、C,:定数)(2)同一字種ストリング
に於いて、カタカナ。
漢字、アルファベット各々に対して定まる一定値KAN
A、KANJI 、ALPH以上の長さs4をもつもの
の数slcの増大は難易度Redを増大させる要因とな
る。
(3)一定以上のilj長をもつス) IJングの個数
iceもRed増大をもたらす。         ご
(4)一定数以上のr (、) J数pcは挿入句数の
r′1phcFi推測させ、Red増大につながる。
これらの関係によシ定義される単調増加関数’Redに
よってR8dが定義される。
Red =fRed (I C1正−C21181c、
ice、1phc)−例としては1次式音用いることが
できる。
Slc  ice  1phc Red−l C+ 、b、、−0t ’°slc、 ’
 ice、 ” 1phc。
当該評価部3による評価値C6m + Redは各々定
数COM、IDを越えた場合データ線34を介しレポー
ト表示部4に送られる。レポート表示部4は前記C8m
 + Redを表示する。同表示によシ利用者は文書を
書きかえることができる。
以上説明した実施例によれば文章が複雑な場合理解しに
くい場合には、警報が出されるので作成者は、文章を修
正する必要があることを知ることができる。しかし以上
の実施例では作成された文書の質的、構造的複雑度、難
易度が不明なばかりか、どの部位に注目して訂正すれば
よいのか明確でないため、利用者によシ良い文章を作ら
せることが困難な場合が生じることもある。
第2図はこの点を改良した本発明第2の実施例を示すブ
ロック図である。形態素解析部2は入力文章に対してピ
リオド「・」をキーに分割するなどの本発明の第1に於
ける形態素解析部2の機能を含む。当該形態素解析部は
各文に対し、ひらがなストリングとそのひらがなストリ
ングに左接。
右接するストリングを対象に最長マツチ法で付属語辞書
格納部510の内容である付属語を検索し。
その辞書内容を抽出する。同時に付属語辞書の内属語が
活用語尾をその左端に含む付属語なら、左に用言が予測
できる。格助詞をその左端に含めば体言が予測される。
第3図は付属語辞書格納部の内容を概念的に示す図であ
る。見出し語としては付属語の表記、その内容には形態
上の分類2品詞などの統語機能。
当該付属語が付く単語がどんな役割で他の単語を修飾す
るかを言う「初作者j、「対象」、「原因」。
「接続」、「並列」などの意味機能、当該付属語の使用
頻度、難易度、暖味度を含む。ここで付属語とは体言、
用言を除く全てのものを言う。評価部310は前記形態
素解析部2から得られた解析情報及び辞書情報により評
価を行なう。
文の複雑度C8mは、第1図を用いて説明した実施例で
規定したものと同一である。文の難易度Redは本発明
の第1で規定した関係以外に次の関係により計算する。
(1)−文中の並列句の数pphcは文中の係シ受けを
繁雑にしRed i増大させる。ここでpphcは付属
語辞書中の意味機能として記述にある゛並夕じマークを
持つ付属語個数1)ppeより推定でき、pphcキK
・pppc (K ;定数)。
(2)−文中の連用中止語尾数chucは文構造の論理
関係を不透明にしRedを増大させる。ここでchuc
は付属語辞書中の意味機能記述中の1連用中止”マーク
a chcによって推定でキ、chuc=m・chc 
(m :定数)。
(3)左に体言を受ける付属語数ftcと左に片言tc を受ける付属語数ytcO比、□が一定値すから離れる
に従かい動詞を修飾する句が多すぎて難解でtc あったりくい。〉b)、埋め込み構造が頻出するため難
解であったりしてRedが増大する。この因子はb′t
 f駐−−blと書く。
tc (4)  付属語を出現順に並べて、同一タイア′(連
体子「の」を含むとか、連用中止であるとか)の付属語
が連続する度合と、連続回数の種tci、(i:タイプ
)の和tcは難易度Redを増大させる。
第1の実施例において説明した難易度定義1〜4と本発
明第2の難易度尺度1〜4より、文単位の難易度Red
は以下のように定義する。
RedmfH6d(ICt−−Ctl+ slc、 i
ce、 1phc。
ftc pphc、 chuc、 b’1−−bl、 tc)t
c (Cw、Ct、 b’、 b :定数)文章の構造度(
パラグラフ単位)Scomは、ツクラグラフの構造を成
すかどうかを示し、Scomの増大は構造欠如を示す。
(1)助詞「は」を含む付属語のバラグラフ全体の個数
weは一定値Wを越えると、同一ノ(ラグラフ中で話題
が頻繁に変化することを示し、バラグラフの体を成式な
いことになり、7 (w’ 、〕(ラグラフ長に比例)
が増大するとS。omも増大する。
(2)バラグラフ長W1が一定限度を越えると複数話題
が同一パラグラフに入りこむ率が高くなりパングラフの
役割を失うため、l w” −w” l (w”;定数
)Scomが増大する。
(3)1パラグンフ中の接続詞数apeが一定値を越え
ると、Scomが増大する。つまりmが正の場合、その
増大とともに5coJ11増大これらによシS  は、
以下の増大関数fBcOmOm で定義される。
Scon1=f8com(ape 、 Cpe”、 w
’、 w”、 we 、 w )文章全体の統一度[J
niは1文体の統一度とリズムについての尺度であり、
増大は統一度の欠如を示す。
(1)全文中のパラグラフ各の長さp ral iが一
定値から離れている()W)はど文全体の統一度欠如度
Uniが増大し、 の値の増大は’[Jniの増大を招く。
(2)全文中の付属語の難易度d、が一定値dm(作成
文書を配布する対象人のレベルで決まる)から離れるd
wはど文全体の統一度[Jniが増大すUniはfun
iで以下の如く定義する。
[ni = funi (1w、 dw)   (fu
ni :増大関数)当該評価部310は、 Com 、
 :led 、 Scom 、 Uniが各々一定値C
OM、RED、SC0M、UNI を越えた場合当該文
、パラグラフ、文全体に各々のコメントを付けて出力す
るとともに、付属語を出現順に並べて、同一タイプ付属
語列が発見された場合にその付属語部位をブリンキング
させる指示情報を付けるとともに、付属語の難易度di
が一定値dmとの間でl d4− dml ) dma
x (dmax:定数)を越えた場合、その付属語の辞
書内容中の類義語を探し、類義語全再度辞書引きし、そ
の難易度ayがl dy−dm l <:dmaxなる
関係を満足するときには、前付属語を後付属語に強制的
に書き換え、同書き換え部位をブリンキングさせる指示
を付加する。
レポート表示部410は−cOm ’ R6d + U
ni 。
Scomに関する全てのレポートを表示する池、評価対
象文を表示し、入力指示にしたがいブリンキング等の画
面制御を行なう。
(発明の効果) 本発明は、形態、続語、意味、各種統計情報をもとに文
ないし文章の可読性全評価するために形態素解析機能、
評価機能、書き直しのためのレボ−ティング機能を備え
るが、この対象は全ての゛ぎ語に対して客観的文体評価
尺度を与える基本機能を提供する。本発明の第1で示し
た評価尺度以外の表層データからあるいは付属語辞書に
記述した前記各種情報によって評価される文体OTd性
尺度は本発明の権利に含まれる。
また本発明全ワードプロセッサに組み込むことも容易に
可能である。
【図面の簡単な説明】
81図は、本発明の第1によるワードプロセッサーを説
明するブロック図。 第2図は1本発明の第2によるワードプロセッサーを説
明するブロック図。 第3図は1本発明の第2に於ける辞書格納部510を説
明する概念図である。 図において 1・・・文書作成部、  2・・・形態素解析部。 3・・・評価部、    4・・・レポート表示部。 5 付属語辞書格納部。 6・・・キーボード。 をそれぞれ示す。 71 図

Claims (1)

  1. 【特許請求の範囲】 1、入力された文章を字種情報のみで形態分割し、少な
    くとも特殊シンボル、字種同一字種ストリング長を示す
    データを出力する形態素解析部と、前記形態素解析部の
    出力をもとに文の複雑度を計量する評価部と、前記評価
    部出力が一定値を越えた場合にはその結果を表示する表
    示部とを含んで構成されることを特徴とする文章評価装
    置。 2、付属語の形態的、構文的機能を示す情報を記述した
    付属語辞書格納部と、入力された文章を字種情報と前記
    付属語辞書格納部よりの付属語情報を用いて特殊シンボ
    ル、字種、ストリング長、助詞相当語数、助動詞相当語
    数を示すデータを出力する形態素解析部と、前記形態素
    解析部よりの情報を用いて文の複雑度を計量する評価部
    と、前記複雑度が一定値を越えた場合にはその計量結果
    を表示する表示部とを含んで構成されることを特徴とす
    る文章評価装置。
JP14813184A 1984-07-17 1984-07-17 文章評価装置 Pending JPS6126173A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14813184A JPS6126173A (ja) 1984-07-17 1984-07-17 文章評価装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14813184A JPS6126173A (ja) 1984-07-17 1984-07-17 文章評価装置

Publications (1)

Publication Number Publication Date
JPS6126173A true JPS6126173A (ja) 1986-02-05

Family

ID=15445953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14813184A Pending JPS6126173A (ja) 1984-07-17 1984-07-17 文章評価装置

Country Status (1)

Country Link
JP (1) JPS6126173A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61248155A (ja) * 1985-04-26 1986-11-05 Hitachi Ltd ワ−ドプロセツシング方式
JPS63219062A (ja) * 1986-10-17 1988-09-12 Sanyo Electric Co Ltd 文書作成装置
JPS641054A (en) * 1987-06-24 1989-01-05 Matsushita Electric Ind Co Ltd Japanese language processor
JPH01173161A (ja) * 1987-12-26 1989-07-07 Fujitsu Ltd 文書品質評価方式
JPH01189762A (ja) * 1988-01-25 1989-07-28 Fujitsu Ltd 文書分かりやすさ評価方式
JPH01220063A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 文書品質評価方式

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61248155A (ja) * 1985-04-26 1986-11-05 Hitachi Ltd ワ−ドプロセツシング方式
JPS63219062A (ja) * 1986-10-17 1988-09-12 Sanyo Electric Co Ltd 文書作成装置
JPS641054A (en) * 1987-06-24 1989-01-05 Matsushita Electric Ind Co Ltd Japanese language processor
JPH01173161A (ja) * 1987-12-26 1989-07-07 Fujitsu Ltd 文書品質評価方式
JPH01189762A (ja) * 1988-01-25 1989-07-28 Fujitsu Ltd 文書分かりやすさ評価方式
JPH01220063A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 文書品質評価方式

Similar Documents

Publication Publication Date Title
Sims et al. Literary event detection
Ait-Mokhtar et al. Incremental finite-state parsing
Teufel et al. Argumentative classification of extracted sentences as a first step towards flexible abstracting
Hengeveld et al. Transparent and non-transparent languages
Habash et al. MADA+ TOKAN: A toolkit for Arabic tokenization, diacritization, morphological disambiguation, POS tagging, stemming and lemmatization
Teufel Argumentative zoning: Information extraction from scientific text
Curry Foundations of mathematical logic
Tan Notion of subject in Chinese
Schneider et al. A corpus of preposition supersenses
Kuribayashi et al. Context limitations make neural language models more human-like
Almashraee et al. Emotion Level Sentiment Analysis: The Affective Opinion Evaluation.
Wang et al. Improving skip-gram embeddings using BERT
Jenks et al. Indexed definiteness
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
Gaeta Restrictions in word-formation
Cristea et al. How to find a shining needle in the haystack. Querying CoRoLa: solutions and perspectives
Ferreira et al. A new sentence similarity method based on a three-layer sentence representation
Megyesi Improving Brill’s POS tagger for an agglutinative language
JPS6126173A (ja) 文章評価装置
Cristea et al. Quo vadis: a corpus of entities and relations
Levin et al. Morphology in Austronesian languages
King Stochastic methods of mechanical translation
Onyshkevych et al. Lexicon, ontology, and text meaning
Mery et al. Computing the semantics of plurals and massive entities using many-sorted types
Lobzhanidze Computational model of the modern Georgian language and search patterns for an online dictionary of idioms