JPS60254367A - 文章分析装置 - Google Patents

文章分析装置

Info

Publication number
JPS60254367A
JPS60254367A JP59111794A JP11179484A JPS60254367A JP S60254367 A JPS60254367 A JP S60254367A JP 59111794 A JP59111794 A JP 59111794A JP 11179484 A JP11179484 A JP 11179484A JP S60254367 A JPS60254367 A JP S60254367A
Authority
JP
Japan
Prior art keywords
sentence
dictionary
indefinite
word
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59111794A
Other languages
English (en)
Inventor
Masato Obe
正人 小部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59111794A priority Critical patent/JPS60254367A/ja
Publication of JPS60254367A publication Critical patent/JPS60254367A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は、文書作成装置に組込まれて使用される文章分
析装置に関し、作成された文章の形態素を分析して不明
確な表現を指摘すると共に、各種の文体統計情報を提示
しようとするものである。
従来技術と問題点 日本語の文書作成装置(ワードプロセッサ)は一般に作
成したテキスト(原文)に対する分析機能は持たないた
め、キー人カデニタに忠実な文章を作成することはでき
るが、それ以上の処理は期待できない。例えば、現場用
語を指摘してそれに対する正規の表現を提示したり、略
語に対するフルネームを表示したりする処理はできない
。或いは、冗長な表現を指摘することも、第3者が読み
易い文書を作成する上で有用であるが、が\る機能はな
い。
このような、作成された文章が正しい、読み易い、適切
な形態となるように修正指示する機能は、従来のワード
プロセッサは備えていない。また、作成された文章の文
体上の特徴、例えば受動形が多い、否定文が多い、形容
詞、体言の発生頻度はどの程度か、文の長さはどの程度
か、平均的な文の長さは××であり本文は長過ぎる等の
文体に関する統計情報は全く得られない。しかし、これ
らの機能は判り易い、或いは質の良い文章を作成する上
で重要である。
発明の目的 本発明は、文書作成装置で作成された文章を分析してそ
の中に含まれる不明確表現を指摘すると共に、各種の文
体統計情報を表示して、平易で簡潔な文章が能率よく作
成できるようにガイダンスする機能を持たせようとする
ものである。
発明の構成 本発明は、文書作成装置で作成されたテキストを文の形
態素に分割する形態素解析装置と、該形態素に関する単
語情報を辞書から収集して文体の特徴を示す統計データ
を出力する統計情報収集装置と、慣用語、略語等の不明
確表現とそれに対する適切表現とを対語形式で格納して
なる不明確表現一覧辞書と、前記形態素解析装置で分割
された各形態素を該一覧辞書と比較して該当する不明確
表現を検索する不明確表現検索部とを備え、該検索部で
検索された不明確表現に対応する適切表現および前記収
集装置で得られた統δ1データを前記文書作成装置のデ
ィスプレイに表示するようにしてなることを特徴とする
が、以下図示の実施例を参照しながらこれを詳細に説明
する。
発明の実施例 図面は本発明の一実施例を示すブロック図で、■はキー
ボード等の入力部とディスプレイ等の出力部を備えた入
出力端末、2は該端末から入力された一連のテキストを
センテンス(文)単位に分割して記憶域7に格納し、ま
た逆に該記憶域から所望のセンテンスを検索する装置で
ある。端末からの入力はワードプロセッサの場合と同じ
であって、印刷文のようなスタイルにして単に入力して
行くだけであり、その文の切出しなどは装置2がピリオ
ドなどを参照しながら行なう。3は各々の文を日本語単
語辞書8を参照しながら単語単位に分割し、その段階で
辞書中に記述しである単語情報から文体の特徴を示すデ
ータを得る形態素解析装置である。端末1からの入力文
が、例えば、[従来この種の機能を持つものは日本語に
関してなかった。」であるとすると、形態素解析装置3
で分割して得られるデータは下表の様になる。
表 1 この表1の「単語」が形態素である。辞書を参照しなが
ら入力文を単語に分割すると、該単語の、副詞、指示側
などの品詞情報は辞書に出ているので容易に分る。また
入力文を単語で区切って各文節とし、各々に1,2.・
・・・・・nなる番月を付し、この文節から当該文は肯
定文か、過去形かなどの情報をめる。
不明確表現検索部4は、解析装置3で分割された単語を
不明確表現一覧辞書9で調べ、その中に該当するものが
あれば不明確表現と判断し、適切と思われる表現(これ
も辞書9中に対語形式で格納されている)を表示機構6
に示す。下表は不明確表現に対応する適切表現の例であ
る。
表 2 統計情報収集装置5は解析装置3で分割した単語リスト
に基づいて下表(al (blに示すような文体統計情
報を収集する。
表 3(a) 表 3(b) 表3(a)のバラグラフを構成する文数とは、1パラグ
ラフ中の、ピリオドで区切られた文の数で、3または5
などの数字で表わされる。頻出単語とはよく出て来た単
語で、各大別によく出て来た単語そのものが表示される
。表示する単語の数は3個などと予め指定しておく。第
1文および最後の文は、パラグラフ中の最初の文及び最
後の文で、咳文がそのま一表示される。最初の文には最
も大事なことを述べ、最後の文には結論的なことを述べ
るのが分り易い文としては好ましいが、本項目はこれに
対処するものである。
表3(b)の受け身文は、作成した文全体、一般には複
数のパラグラフ中に受け身文が何%あったかを示す。1
文中の補助動詞、助動詞の割合などは(で表示され、文
の長さは文字数で表わされる。
1列句とは××と00と・・・・・・といった文であり
、文字数で算出した全体に対する%で表示される。
」列句の%が高い客は分り易い文とは言えない。
埋め込みの深さとは連体修飾の段数を言い、[私つく落
したリンゴを拾った猿」なら埋め込み深さは2段である
。埋め込み深さの深い文は理解しにく測定できる。文頭
の語には名詞、代名詞が多いが、「従来」などの副詞や
「しかし」などの接続詞も用いられる。「しかし」など
の接続詞で始まる文 〜が多いのも品のある文章とは言
えない。連用中止とは[食事をし、散歩をし、・・・・
・・]という様に連用形で打切られてそれがつながって
行くものをいう。これも、余り長いのは品のある文とは
言えない。
表示機構6は不明確表現検索部4の出力および統計情報
収集装置5の出力を端末1のディスプレイに表示する。
このときディスプレイには入力文章が表示されているの
で、画面を分割して各種情報を一括して同時に又は分割
して逐次表示する様に制御する。
入出力端末1、テキスト格納・検索装置2、表示機構°
6、記憶域7および日本語単語辞書8は一般的なワード
プロセッサに含まれるので、本発明の実施には形態素解
析装置3、不明確表現検索部4、統計情報収集装置5お
よび不明確表現一覧辞書9を追加すればよい。このうち
装置3〜5はソフトウェアにより構成され、また辞書9
はメモリで構成される。
不明確表現検索部4の出力(表2)は直接的に文章の修
正を示唆するものであるが、統計情報収集装置5の出力
(表3)は間接的に文体の改善データを提供するもので
ある。これらの機能があると文章作成装置(ワードプロ
セッサ)は単なる文章作成にとどまらず、良質の文章を
作成する各種機能を備えることにより、各種工具を備え
る作業台になぞらえてライターズ・ワークベンチ(wr
iter’sworkbench )と呼ぶことができ
る。
発明の効果 以上述べたように本発明によれば、日本語文書作成装置
の機能を更に拡張して質の高い文章作成のガイダンスが
できる利点がある。
【図面の簡単な説明】
図面は本発明の一実施例を示すブロック図であ図中、1
は入出力端末、2はテキスト格納・検索装置、3は形態
素解析装置、4は不明確表現検索部、5は統計情報収集
装置、6は表示機構、7は記憶域、8は日本語単語辞書
、9は不明確表現一覧辞書である。 出願人 富士通株式会社 代理人弁理士 青 柳 稔

Claims (1)

    【特許請求の範囲】
  1. 文書作成装置で作成されたテキストを文の形態素に分割
    する形態素解析装置と、該形態素に関する単語情報を辞
    書から収集して文体の特徴を示す統計データを出力する
    統計情報収集装置と”、慣用語、略語等の不明確表現と
    それに対する適切表現とを対語形式で格納してなる不明
    確表現一覧辞書と、前記形態素解析装置で分割された各
    形態素を該一覧辞書と比較して該当する不明確表現を検
    索する不明確表現検索部とを備え、該検索部で検索され
    た不明確表現に対応する適切表現および前記収集装置で
    得られた統計データを前記文書作成装置のディスプレイ
    に表示するようにしてなることを特徴とする文章分析装
    置。
JP59111794A 1984-05-31 1984-05-31 文章分析装置 Pending JPS60254367A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59111794A JPS60254367A (ja) 1984-05-31 1984-05-31 文章分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59111794A JPS60254367A (ja) 1984-05-31 1984-05-31 文章分析装置

Publications (1)

Publication Number Publication Date
JPS60254367A true JPS60254367A (ja) 1985-12-16

Family

ID=14570316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59111794A Pending JPS60254367A (ja) 1984-05-31 1984-05-31 文章分析装置

Country Status (1)

Country Link
JP (1) JPS60254367A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61229155A (ja) * 1985-04-04 1986-10-13 Hitachi Ltd ワード・プロセッサ
JPS641054A (en) * 1987-06-24 1989-01-05 Matsushita Electric Ind Co Ltd Japanese language processor
JPH01114971A (ja) * 1987-10-28 1989-05-08 Sharp Corp 文書作成・校正支援装置
JPH01114974A (ja) * 1987-10-28 1989-05-08 Sharp Corp 文書作成・校正支援装置
JPH01114972A (ja) * 1987-10-28 1989-05-08 Sharp Corp 文書作成・校正支援装置
JPH01169661A (ja) * 1987-12-25 1989-07-04 Sharp Corp 文字処理装置
JPH01189762A (ja) * 1988-01-25 1989-07-28 Fujitsu Ltd 文書分かりやすさ評価方式

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61229155A (ja) * 1985-04-04 1986-10-13 Hitachi Ltd ワード・プロセッサ
JPS641054A (en) * 1987-06-24 1989-01-05 Matsushita Electric Ind Co Ltd Japanese language processor
JPH01114971A (ja) * 1987-10-28 1989-05-08 Sharp Corp 文書作成・校正支援装置
JPH01114974A (ja) * 1987-10-28 1989-05-08 Sharp Corp 文書作成・校正支援装置
JPH01114972A (ja) * 1987-10-28 1989-05-08 Sharp Corp 文書作成・校正支援装置
JPH01169661A (ja) * 1987-12-25 1989-07-04 Sharp Corp 文字処理装置
JPH01189762A (ja) * 1988-01-25 1989-07-28 Fujitsu Ltd 文書分かりやすさ評価方式

Similar Documents

Publication Publication Date Title
JP2783558B2 (ja) 要約生成方法および要約生成装置
US5873055A (en) Sentence translation system showing translated word and original word
JPH03172966A (ja) 類似文書検索装置
JPH10326275A (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JPS60254367A (ja) 文章分析装置
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2004213309A (ja) 情報表示制御装置及びプログラム
JP2003178087A (ja) 外国語電子辞書検索装置および方法
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JPH0412866B2 (ja)
JP2621999B2 (ja) 文書処理装置
JPH0612548B2 (ja) 文書処理装置
JP2915225B2 (ja) 文書作成装置
JPH07141381A (ja) 電子辞書表示装置
JP2819766B2 (ja) 外国語電子辞書検索方式
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP2802369B2 (ja) かな漢字変換装置
JPH11184854A (ja) 電子辞書
JPH0350668A (ja) 文字処理装置
JP2002358301A (ja) 電子辞書
JPH0687235B2 (ja) ユ−ザ辞書を備えた文字処理装置
JP2001167093A (ja) 外国語電子辞書の生成、検索のための方法および装置
JP2004355248A (ja) 電子辞書
JPH1110958A (ja) 点字文におけるアクセント表示方法および点字出力装置
JPH0468466A (ja) かな漢字変換装置