JPH08190560A - 構造テスト装置 - Google Patents

構造テスト装置

Info

Publication number
JPH08190560A
JPH08190560A JP7001950A JP195095A JPH08190560A JP H08190560 A JPH08190560 A JP H08190560A JP 7001950 A JP7001950 A JP 7001950A JP 195095 A JP195095 A JP 195095A JP H08190560 A JPH08190560 A JP H08190560A
Authority
JP
Japan
Prior art keywords
test
document
unit
error
introduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7001950A
Other languages
English (en)
Inventor
Yasuyo Atsumi
康代 渥美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP7001950A priority Critical patent/JPH08190560A/ja
Publication of JPH08190560A publication Critical patent/JPH08190560A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 本発明の目的は、構造化文書の構造的なテス
トを簡易で高速に処理することが可能な構造化文書にお
ける構造テスト装置を提供することである。 【構成】 構造化文書の構造を表示するためのテストデ
ータを生成するテストデータ生成手段10と、テストデ
ータ生成手段10より取得したテストデータを用いて、
構造化文書の構造のエラーを抽出してテスト結果として
出力するテスト手段50と、テスト手段50のテスト結
果に基づいて、エラー部分を修正する修正手段70とを
有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、構造テスト装置に係
り、特に、マニュアル等の文書を作成する際に、文書の
「部」、「章」、「節」、…等の構成要素の配列が正し
いかを判定し、構成要素の配列に誤りがある場合には、
必要に応じて修正するための構造テスト装置に関する。
【0002】詳しくは、部、章、節、項等の構成要素を
有する構造化文書や段落を含む一般の文書において、そ
の順序や階層構造が正しく配置されているか、または、
各構成の導入部は、それぞれの構成要素と合致した書き
方になっているか等をテストするための構造テスト装置
に関する。
【0003】
【従来の技術】従来、文書の構造をテストするための具
体的ツールは存在していないため、人間が目視により作
成された文書をチェックする方法が採られている。例え
ば、マニュアルをチェックする際には、最初のページか
ら最後のページまで通して読み、目についた点に対して
チェックを行うのが一般的である。
【0004】また、文書を格納している記憶部よりチェ
ック対象の文書を画面上に読出し、さらに、目次構成等
の構造的文章作成方法に合わせ、“部分と部分”及び
“全体と部分”の関係でテストを行う。例えば、マニュ
アルの作成技術に違反しているか否かをチェックする際
には、構造的なテストを以下の点においてチェックす
る。 ・情報が章、節及びパラグラフのレベルで書き方に一貫
性があるか。 ・標準的な説明形式に合わせて説明が標準化されている
か。
【0005】上記の“部分と部分”の関係のテストは、
説明の一貫性を保つためのテストであり、 ・目次の一貫性 ・導入部の一貫性 ・文章構成の一貫性 ・パラグラフ内の一貫性 ・用語一覧表の表記の一貫性 のうち、目次の一貫性については、以下のような手順で
チェックを行う。 1章の目次を読み、2章の目次を読み、…、n章の
目次を読む。 1. 1. 1. 1. 2 …節の目次を読み、2. 1. 2. 2…節
の目次を読み、n. 1. n.2…節の目次を読む。 1. 1. 1. 1. 1. 2…の目次を読み、1. 2. 1. 1. 2.
2…の目次を読む。
【0006】上記の手順に従って目次を読むことによ
り、同一の属性を持つ主題に対して同じ形式で書かれて
いるかをチェックする。この手順に従うことにより、目
次項目の一貫性をチェックすることが可能である。次
に、導入部の一貫性のテストは、以下のような手順でチ
ェックを行う。 1章の導入部の文を読み、2章の導入部の文章を読
み、…n章の導入部の文を読む。 1. 1. 1. 2…節の導入部の文を読み、2. 1. 2. 2…
節の導入部の文を読み、n, 1. n. 2…節の導入部の文を
読む。 1. 1. 1. 1. 1. 2…の本文の先頭を読み、1. 2. 1.
1. 2. 2. …の本文の先頭を読む。
【0007】上記のように目次レベルに対応した導入部
の文を読むことにより、目次レベルで並列の関係にある
導入部の書き方について一貫性をチェックする。次に、
文章の一貫性のテストは、同一形式を持つ文章表現、例
えば、コマンドの説明部分に、一貫性があるかをチェッ
クする。各説明の部分の形式は、全体的に統一されてい
なければならない。
【0008】パラグラフ内の一貫性のテストは、パラグ
ラフに対しては、パラグラフ技術に合わせて一貫性があ
るかをチェックする。説明のパターンが同種の情報に対
して一貫性があるかをチェックする。用語・図表の表記
の一貫性のテストは、用語や図表等の表記に関しては、
マニュアル上の記載を見て統一性があるかをチェックす
る。
【0009】
【発明が解決しようとする課題】しかしながら、上記の
従来の方法は、文書のテストを行う場合において、作業
を支援するような簡易なツールはなく、一貫性や統一性
を確認するには、人間が目視によりチェックしているた
め、テスト漏れが発生するという問題がある。
【0010】また、目次等を表示して、その目次と構成
要素の配列が一致しているかを見る方法において、足り
ない構成要素や、従属関係については目次等を参照する
ことにより、チェックできるが、各文書の構成要素毎の
チェックはできないという問題がある。例えば、見出し
部に続く第1段落の主語が正確に使用されているか、各
構成要素の文末が統一されているか等のチェックは、マ
ニュアル全体を用語や文の意味を意識しながら行われな
い限り不可能であり、多大の時間を要する。また、模範
的な構造的文章作成方法に合わせてチェックする際に、
チェックを行う者が全てのチェック項目を各々意識して
全文書を通してチェックできるとは限らない。
【0011】本発明は、上記の点に鑑みなされたもの
で、人手に依らず文書の構造的なテストを電子的に容易
で、しかも高速に処理することが可能な構造テスト装置
を提供することを目的とする。また、本発明の更なる目
的は、テストを行う際に、文書をテストできる状態のデ
ータを取得できる構造テスト装置を提供することであ
る。
【0012】また、本発明の更なる目的は、テスト結果
に基づいてエラーを自動的に修正することが可能な構造
化テスト装置を提供することである。
【0013】
【課題を解決するための手段】本発明は、文書作成の際
に構造的な関連により該文書のテストを行う構造テスト
装置において、文書の構造を解析するためのテストデー
タを生成するテストデータ生成手段と、テストデータ生
成手段より取得したテストデータ、または、入力された
文書を用いて、文書の確認すべきまたは、エラーである
構造表示データ及び導入部を抽出してテスト結果として
出力するテスト手段と、テスト手段のテスト結果に基づ
いて、エラー部分を修正する修正手段とを有する。
【0014】また、上記のテストデータ生成手段は、文
書を読み込む文書入力手段と、入力された文書の各構成
要素の各文書構成上の構成要素の内容を検出する構造検
出手段と、構造検出手段で検出された構成要素の内容毎
に入力された文書中の構成表示データ及び導入部分を抽
出する構造抽出手段と、構造抽出手段により抽出された
構成要素の内容毎に構成表示データ或いは、構成表示デ
ータ及び導入部分を表示する構造表示手段を有する。
【0015】また、上記の構造表示手段は、構成要素毎
の件数を表示し、構成表示データのみ、または、構成表
示データに導入部分を組合わせて表示されている構成要
素を選択させるための選択手段を含む。また、上記の構
造表示手段に表示した内容に加えて、文書の構造情報を
併せて保持する記憶手段を有する。
【0016】また、上記のテスト手段は、文書全体また
は、テストを希望する箇所が指定されると、構成表示デ
ータ間の構成要素間の関係をチェックする見出しチェッ
ク手段と、導入部の最初の一文の主語が同じ構成要素内
で同じ形態を有しているか、及び導入部の文末の表現が
統一されているかををチェックする導入部チェック手段
と、見出しチェック手段及び導入部チェック手段の結果
を出力するテスト結果出力手段を有する。
【0017】また、見出しチェック手段は、構成表示デ
ータの項番と内容をテストする項番・内容テスト手段
と、項番・内容テスト手段において、構成表示データの
内容とその内容が属する構成要素に対応する所定のルー
ルを照合し、構成表示データが所定のルールと一致する
場合には、確認する必要がある構成要素として、格納す
る第1の格納手段と、所定のルールと不一致の場合に
は、照合する所定のルールの構成要素を下位または上位
に変化させて照合し、どの構成要素も一致しない場合に
はエラーと見做す構成要素として格納する第2の格納手
段を有する。 また、項番・内容テスト手段は項番のチ
ェックを行う際に、各項番の構成要素がシーケンシャル
にインクリメントされているかをチェックする項番チェ
ック手段を含む。
【0018】また、導入部チェック手段は、文書内の全
ての導入部の文末の表現が常体である個数、敬体である
個数をカウントし、それを文書全体の導入部の文末の形
態を判断する材料とする。また、導入部チェック手段
は、導入部の先頭の一文の主語を取り出す主語取出手段
と、主語取出手段により取り出された主語を単語に分解
する単語分析手段と、分解された単語が2以上であれ
ば、先頭と最後の単語を取り出し、1であれば、当該単
語を取り出す単語抽出手段と、単語抽出手段において、
抽出された単語の形態を比較して少ない形態をエラーと
見做す主語チェック手段を有する。
【0019】また、上記のテスト手段は、テスト結果を
表示する手段と、テスト結果を保持する手段とを含む。
また、上記のテスト手段は、テスト結果が、文書内のエ
ラーの位置を含むように編集する手段を有する。
【0020】また、上記の修正手段は、テスト結果を表
示し、指定された文書内のテスト結果に示されるエラー
位置を検索する位置検索手段と、位置検索手段により検
索された位置の文書内における概念位置のエラー、導入
部の先頭の一文の主語の誤り及び導入部の文末のエラー
を修正する手段を含む。
【0021】
【作用】第1の発明は、テストデータ生成処理、テスト
処理及び修正処理を行う文書構造テスト装置の全体に関
する発明であり、文書を解析して個々の文書内の部、
章、節、…等の構成要素が文書の構造上の問題がないか
をチェックするためのデータを生成して、テスト手段に
渡し、テストが行なわれ、そのテスト結果に基づいて修
正処理まで行うため、生成されたテストデータをチェッ
クし、エラーがあれば自動的に修正を行うことが可能で
ある。
【0022】第2の発明は、テストデータを生成する際
に、入力された文書が構造化文書である場合には、構造
上の各構成要素の内容を抽出して、どのような構成要素
が文書内に位置しているかを構成要素毎に収集すると共
に、当該構成要素毎に構成表示データと導入部を抽出し
て表示することにより、エラーを判定するための構成要
素及びその構成要素毎の構成表示データ、導入部の内容
をテストデータとして表示することが可能である。ま
た、入力された文書が構造化文書以外であっても同様に
段落を見つけることにより、テストデータを生成するこ
とが可能である。
【0023】第3の発明は、上記の第2の発明で表示さ
れた複数の構成要素中から構成表示データまたは導入部
を含めて表示させたい構成要素を利用者に指定させ、さ
らに、構成表示データのみを表示するのか、導入部も合
わせて表示するのかを選択させることが可能である。従
って、文書のテストを行う場合に、テストデータとして
構成表示データのみのテストデータと、さらに、当該構
成表示データに対応する導入部も加えたテストデータと
を選択して生成することが可能である。
【0024】第4の発明は、上記の第3の発明におい
て、利用者が選択し、表示された構成要素毎の構成表示
データや導入部分等を文書の構造情報と共に外部記憶装
置等に記憶することが可能であるため、テストデータ生
成処理が終了して、以降のテスト処理や修正処理を行う
際に、そのまま移行しない場合、即ち、テストデータ生
成処理のみを1つの処理として、完了させ、生成された
テストデータを記憶することにより、テストデータ生成
処理をテスト処理や修正処理と切り離して行うことが可
能となる。テスト処理を行う場合には、テストデータ生
成処理において生成されたテストデータを記憶手段より
読み出して行うことが可能であると共に、随時用紙また
は、音声による読み上げも可能である。
【0025】第5の発明は、テスト処理に関する発明で
あり、入力されたあるいは、自動的に生成されるテスト
データに構成要素の構成表示データの情報が含まれてい
る場合には、構成要素間の階層関係をチェックする。ま
た、テストデータに導入部の情報も含まれている場合に
は、当該構成要素の導入部の文章の最初の一文の主語
が、同じ構成要素内で統一されているか、各導入部の文
末の表現が文書内で統一されているかを調べることが可
能となる。
【0026】第6の発明は、構成表示データの内容が所
定のルールと合致しない場合には、ルールを参照する構
成要素(階層)を上位または、下位に変化させることに
より、構成表示データがどの構成要素に位置しているか
の情報を取得することにより、単に所定のルールの構成
要素と合致していないというだけでエラーとして出力し
ないため、テスト結果を表示し、修正する際に、修正す
る構成要素を特定することが可能である。
【0027】第7の発明は、構成表示データの項番がシ
ーケンシャルに並んでいるかをチェックすることによ
り、順序通りに並んでいない場合には、エラーとして出
力する。第8及び第9の発明は、テスト処理において、
入力されたテストデータのすべての導入部の文末部分を
チェックして、常体であるか敬体であるかを判断し、常
体と敬体の個数を比較することにより、個数の多い方を
導入部での「文末の形態」と見做す。そして、導入部間
で「文末の形態」(常体か敬体か)を調べ、個数の少な
い方を誤りとみなし、その誤りのを有する導入部を指摘
する。また、全体の文書の導入部の文末形態から各々の
導入部の文末の形態の正しさを判定し、エラーを指摘し
ておくことで、修正処理において正しい文末の形態に修
正できる。
【0028】さらに、導入部内の文末に関しても、誤り
の指摘を行う手段を有する。第10の発明は、導入部の
最初の一文の主語を取り出して、単語に分解した結果、
単語の数が2個以上ある場合であっても、当該主語毎に
先頭の単語と最後の単語に細分化して、一致する単語の
カウントをとり、少ないものをエラーとする。
【0029】第11の発明は、テスト結果を出力する際
に、表示手段に表示する方法と、外部記憶媒体等に記憶
する方法がある。テスト処理に引き続いて修正処理を行
う場合には、表示手段に表示すればよく、また、修正処
理を後刻行う場合には、記憶媒体に格納されているテス
ト結果を使用すればよい。さらに、表示手段のみなら
ず、随時用紙による出力や音声による読み上げも可能で
ある。
【0030】第12の発明は、テスト結果に指摘すべき
エラーの位置情報を含むように編集することにより、修
正処理において、エラーの位置情報に基づいてエラーを
検索し、適宜修正が可能となる。第13の発明は、修正
処理に関するもので、テスト結果によりエラーとして指
摘されている箇所を検索して修正する。テスト結果に
は、エラーとなっている原因が記載されているため、そ
の原因に基づいてエラー箇所を修正することが可能であ
る。
【0031】
【実施例】以下に、図面と共に本発明の実施例を詳細に
説明する。図1は、本発明の一実施例の構造テスト装置
の構成を示す。同図に示す構造テスト装置100は、テ
ストデータ生成部10、文書格納部20、構造表示部3
0、抽出結果格納部40、構造テスト部50、テスト結
果格納部60、修正部70、修正結果反映文書格納部8
0及び表示部格納部90より構成される。
【0032】テストデータ生成部10は、文書読取部1
1、文書構造検出部12、文書構造抽出部13より構成
される。文書読取部11は、構造化文書や、段落で構成
される一般の文書を読み込む。文書構造検出部12は、
文書読取部11により入力された文書の文書構造を検出
し、表1に示すような文書構造表を生成する。
【0033】
【表1】 上記のような文書構造表を生成する方法は、特開平4−
286054に記載されている方法を使用するものとす
る。この方法は、文書の文書構造を電子化された原稿か
ら章、節、項、小項等の見出しや、図、表の見出しを抽
出するという既知の方法を使用し、見出しに該当するも
のを全部抽出する。なお、この方法は、項番自体及び項
番の情報を取り出すと共に、文書名、文書番号、文書種
別(手引書類、解説書類等)、見出しの開始位置、見出
しの全体の長さ、見出しの種別(部・章・節・項・小項
・小見出し、図・表・付録等)項番の開始位置、項番の
長さ、項番の情報、見出しの内容の開始位置、見出しの
内容の長さ、導入部データへのポインタを持つデータを
作成する。なお、見出しの内容の長さが零の場合には、
項番だけの見出しを意味する。
【0034】項番の情報には、記述されている項番の番
号(例、1.1.1.1であれば、1111とする。
(第1章の第1節の1項の1小項を表す))が入力され
る。また、図、表については、例えば、『第1図』であ
る場合には1を、『表2』の場合には2を設定する。
『第1章』の場合には1を入力する。
【0035】なお、上記の例は、構造化文書の例である
が、一般の文書の場合には、項番がなく、第1章、第1
節等の内容に基づいて文書構造表が生成される。文書構
造抽出部13は、文書構造表の各要素より見出しに該当
する部分と、導入部に当たる部分を抽出して構造表示部
30に転送する。
【0036】文書格納部20は、作成されたマニュアル
等の文書や、一般的な段落構成を有する文書を格納して
いる外部記憶媒体である。構造表示部30は、テストデ
ータ生成部10で生成された見出しデータ、導入部、及
び出力件数等を表示する。
【0037】抽出結果格納部40は、見出しデータ及び
導入部データを抽出結果として格納する。また、表示部
格納部90は、構造表示部30に表示されたデータ及び
文書構造表の内容、見出しデータ及び導入部データを格
納する。構造テスト部50は、テストデータ生成部10
で生成されたテストデータまたは、表示部格納部90に
格納されているデータを読み出す、または、構造表示部
30に表示されているデータに基づいて構造的テストを
行い、その結果をテスト結果格納部60に格納する。
【0038】修正部70は、構造テスト部50でのテス
ト結果に基づいて、必要であれば、修正を行い、修正し
た結果を修正結果反映文書格納部80に格納する。次
に、上記の構成の一連動作を説明する。本実施例では、
最初にテストデータ生成部10において、入力された文
書に基づいて、階層毎の構成要素、構成要素の内容、構
成要素の個数等のテストデータを生成し、次に構造テス
ト部50において、生成されたテストデータに基づいて
文書の構造的な矛盾や、見出しの用語の誤り、導入部の
統一性等のテストを行い、テストの結果、修正の必要が
ある場合には、修正部70において、自動的に修正を行
う。
【0039】以下に、上記の各処理を説明する。 [テストデータ生成処理]図2は、本発明の一実施例の
テストデータ生成部の動作の概要を説明するためのフロ
ーチャートである。
【0040】ステップ101) テストデータ生成部1
0の文書読取部11は、文書格納部20より、マニュア
ル等の文書を読み出して、文書構造検出部12に転送す
る。 ステップ102) 文書構造検出部12は、入力された
文書に基づいて文書構造を検出する。文書構造として
は、部、章、段落等の要素名と当該要素の内容等を検出
し、文書構造表を生成する。文書構造表は、前述の表1
に示すような内容により構成される。文書読取部11が
読み込む文書はマニュアル等の構造化文書及び小説等の
段落により構成される文書も含む。文書構造検出部12
は、前述の表1に示すような文書構造表を文書構造抽出
部13に転送する。
【0041】ステップ103) 文書構造抽出部13
は、上記の文書構造表の各要素を参照して、文書構成に
該当する部分(見出し部分:章、節、項等)と、導入部
に当たる部分を抽出して構造表示部30に転送すると共
に、抽出結果を抽出結果格納部40に格納する。
【0042】ステップ104) 上記で抽出された文書
構成部分及び導入部を用いて、構成要素名とその個数を
表示する。例えば、部の数が1、章の数が3、節の数が
33、…等が抽出されているので、これらのデータを構
造表示部30に表示する。また、同時に、各見出しや当
該見出しに対応する導入部を表示する。これらのデータ
は、上記の表1の要素名欄より見出しを取り出し、内容
欄より導入部の文を取り出して表示する。
【0043】ステップ105) 上記の構成要素及び個
数の表示において、個数が0の構成要素の場合には、ス
テップ110に移行し、個数が1以上であれば、ステッ
プ106に移行する。 ステップ106) 利用者が構造表示部30に表示され
ている構成要素からマウス等のポインティング装置を用
いて取得したい構成要素を選択する。
【0044】ステップ107) ステップ104におい
て、利用者が見出しのみを選択している場合には、ステ
ップ108に移行し、見出し及び導入部の表示を希望し
ている場合にはステップ109に移行する。 ステップ108) 構造表示部30は、構成要素と、当
該構成要素に関する見出しを表示し、ステップ111に
移行する。
【0045】ステップ109) 構造表示部30は、構
成要素、見出し及び導入部を表示し、ステップ111に
移行する。 ステップ110) 構造表示部30は、構成要素の個数
が0の構成要素を利用者が選択しないように制御する
か、または、選択した場合には、エラーメッセージ等を
表示するようにしてもよい。
【0046】ステップ111) 上記で表示された内容
を表示部格納部90に格納する。このとき、利用者によ
り格納したい構成要素のみを構造表示部30に表示され
ている中から選択して格納してもよいし、全構成要素を
格納してもよい。 次に、上記のテストデータ生成から構造表示までの具体
的な動作を説明する。
【0047】まず、図3は、本発明の一実施例のテスト
データ生成部の具体例を示す。同図の例において、図1
と同一構成部分には、同一符号を付し、その説明を省略
する。 (1) まず、文書読取部11が文書格納部20よりa
に示すに入力文書を読み出す。この文書の内容は、 『・・・第1章 ツールの概要は、・・・・・』 …a であるとする。読み込まれた文書の内容aは、文書構造
検出部12に転送される。
【0048】(2) 文書構造検出部12は、上記の文
書aの内容の構造を検出し、図3bに示すような文書構
造表を生成する。この文書構造表は、入力された文書に
は、要素ID2、要素ID3及び要素ID5を有する
(本来要素IDは、シーケンスに並ぶものであるが(第
1章、第2章、第3章、…)、少なくとも同図に示す例
では、第1章と第4章が欠けている)。このような状態
をテスト処理で指摘し、修正処理で修正される。さら
に、同図bの最初の段落の内容は、『ツールの概要は以
下のようになっています』であることを示す。
【0049】(3) 次に、文書構造表bを構造抽出部
13に転送する。 (4) 構造抽出部13は、転送された文書構造表に基
づいて、各構成要素を抽出する。ここで、抽出された構
成要素はそのまま、抽出結果格納部40に格納される。
抽出された構成要素を構造表示部30に転送する。
【0050】(5) 図4において、構造表示部30
は、上記の図3の文書構造表bの内容を表示する。構成
要素として、表示される要素は、「部」、「章」、
「節」、「項」、「小項」、「小見出し」、「図」、
「表」、「付録」等である。これらの各要素毎に上記の
(1)で入力された入力文書内に存在する各項の数を文
書構造表bより取得して表示する。同図の例において、
各構成要素の数は、部=1、章=3、節=33、項=5
0、小項=0、小見出し=0、図=15、表=0、付録
=8、…となっている。
【0051】(6) 構造表示部30が上記の内容を表
示すると、利用者はテストしたい構成要素を選択する。
但し、個数が0の構成要素が選択された場合、即ち、図
4の例において、“小見出し”が選択された場合には、
構造表示部30は、『この構成要素には該当がありませ
ん。』等のエラーメッセージを表示させ、当該項目の選
択を排他することも可能である。同図の例では、利用者
は、『部』、『章』、『図』の3つの項目を選択してい
る。さらに、見出しのみを表示するか、または、見出し
及び導入部を表示するかも併せて選択させる。同図で
は、見出しのみを表示するパターンを選択している。
【0052】(7) 本例では、(6)の選択により見
出しのみを選択しているため、同図dに示すような内容
が表示される。(6)において、選択されている構成要
素は、『部』、『章』、『図』であるので、『部』の要
素IDから“第1部”とそのタイトル“導入手引き”、
『章』の要素IDから“第1章”とそのタイトル“導入
に当たって”、『図』の要素IDから“図1.1”とそ
のタイトル“導入方法概略図”、『章』の要素IDから
“第2章”とそのタイトル“プロトコル”、…のように
表示される。
【0053】また、上記の(6)において、利用者によ
り図4に示す“見出し及び導入部”が選択された場合に
は、表示画面は、図5に示すように導入部も合わせて表
示する。同図において、点線で囲まれている部分は、導
入部の内容が表示されていることを示す。図5では、第
2章のタイトルと導入部までを表示しているが、図4に
示すように、部、章、図を選択した場合には、章は3番
目までの章及び導入部が表示され、また、図は15番目
の図の見出しまでが表示されることになる(図示せ
ず)。 (8) 次に、構造表示部30に表示された内容及び文
書構造、見出し、導入部等の情報を表示部格納部90に
格納する。格納時に、利用者は、構造表示部30に表示
されている構成要素を全て表示部格納部90に格納する
ようにしてもよいし、または、テストする必要があると
思われる箇所を選択して格納してもよい。また、上記の
(5)において、見出しのみが表示されている場合に、
表示部格納部90に格納される要素は、導入部を含まな
い状態の情報が格納され、見出し及び導入部が表示され
ている場合には、見出し及び導入部の情報も併せて格納
することができる。
【0054】つまり、見出しのみを格納する場合には、
図4のdに示す内容及び文書構造情報が格納され、導入
部も合わせて格納する場合には、図5に示される内容及
び文書構造情報が格納される。なお、上記の(6)の処
理において、図4及び図5の処理では、『部』や『章』
を行頭を揃えて表示しているが、この例に限定されず
に、階層構造がわかるように構成要素の種別毎に行頭を
インデントさせて表示してもよい。図6は、階層構造を
用いて表示した例を示している。『部』の行頭は左端か
ら表示し、『章』の行頭は、左端から4文字分右にシフ
トさせて表示する。さらに、『図』及び『節』は『章』
の行頭からさらに2文字分右にシフトさせて表示する。
このようにすることにより、各構成要素毎の階層関係が
明確になる。
【0055】[テスト処理]次に、構造テスト部50
は、構造表示部30に表示されているテストデータにつ
いてのテストを行うか、または、テストデータ生成部1
0により生成され、表示部格納部90に格納されている
データを読み出してテストするまたは、文書格納部20
から直接入力された文書をテストすることも可能であ
る。
【0056】構造テスト部50は、構成表示部30に表
示された情報、または、表示部格納部90から読み出し
た情報、入力された文書について、ある構成表示の下位
に位置すべき見出しが上位に表示されていないか、反対
に、上位に位置すべき見出しが下位に表示されていない
か等を調べる。また、導入部に関しては、導入部の書き
方が、同じ構成表示内で表現等が統一されているか否か
を調べる。
【0057】図7は、本発明の一実施例の構造テスト部
の動作を説明するための図である。構造テスト部50
は、構造表示部30(または、表示部格納部90)から
入力されたテストデータ、文書格納部20から直接入力
された文書に対して、主語検査ファイル55、用語ファ
イル52、見出し定義ルールファイル53及び確認ファ
イル54を用いてテストデータに対するテストを行い、
その結果をテスト結果表示部55に表示または、テスト
結果格納部60に格納する。
【0058】構造テスト部50は、構造的なテストを以
下の2点について行う。第1には、構造表示データ(見
出し)の上位になるべき見出しが下位に位置していない
か、上位部分になるべき見出しが下位に位置していない
か等の構成要素間の関係を検査する。
【0059】第2には、文書内の導入部の最初の一文の
書き出しの部分と、全ての導入部間の文末の部分の書き
方が統一されているかの検査を行う。例えば、第1章の
導入部の最初の一文が、 『フロッピーディスクの構成は、……』 … であり、第2章の次に導入部の最初の一文が 『ここでは、……』… である場合には、書き出しの単語として“フロッピーデ
ィスク”と“は”と、“ここでは”が取り出され
る。従って、及びの文の書き出し部分(主語)は、
統一されていないことが分かる。
【0060】次に、構造テスト部50は、導入部の文末
を検査する。導入部内及び導入部間で文末をチェック
し、「文末の形態」として敬体が正しいと判断された場
合、正しい「文末の形態」をもっている導入部内に、 『まず、この章では、2つの典型的な適用分野を紹介する。』 … と、いう文があった場合、の文末“紹介する”は、修
正の必要があるので、これらの結果をテスト結果として
出力する。また、当然のことであるが、正しくない「文
末の形態」をもっている導入部内の文末には、常体の文
末をテスト結果として出力する。
【0061】用語ファイル52は、見出し定義ルールフ
ァイル53の見出しの語尾になる用語に該当しない語尾
を持つ見出しを集めたもので、見出しのチェックの結
果、エラーと見做せる見出しが格納される。不一致であ
った単語は、同じ文字種別(分類)の当該見出しの構成
要素に対応する当該ファイル52内の部分(例えば、用
語分類ファイル等を用意する)に出力する(例えば、章
の「検査のための確認」という見出しに、定義ルールフ
ァイル53の同じ文書種別(分類)の内容に何も一致す
る用語がない場合には、用語ファイル52の“章”の構
成要素を指すポインタ箇所に『「検査のための確認」』
を追加する)。例えば、チェックした見出しの構成要素
(例えば、章)、チェックした見出しの構成要素上での
位置(章であれば、章中での位置…2番目の章であれば
2とする)、該当見出しが属している文書種別(例え
ば、解説書類等)、見出し数のカウント(調べた見出し
のうち用語ファイルに登録される見出しの数)が設定さ
れる。
【0062】見出し定義ルールファイル53は、各構成
要素毎の見出しを定義するためのルールを保持する。図
8は、本発明の一実施例の見出し定義ルールファイルの
構成例を示す。これにより、構造テスト部50は、見出
しの語尾が見出し定義ルールファイル53の「見出しの
語尾となる用語」と一致しているが否かを調べる。同図
(A)に示すように見出し定義ファイル53は、“手引
き書類”、“解説書類”等の文書の分類情報と、各構成
要素、及び各構成要素に該当する用語より構成される。
また、同図(B)に示すように、木構造は、用語ファイ
ル52に格納されている見出しから作成するもので、定
義ルールファイル53の充実を図るために追加処理の参
考にする場合や、オリジナルな定義ルールファイル53
の作成をする時の参考とするものである。
【0063】確認ファイル54は、見出しの上位・下位
が逆転されていないかを確認するためのファイルであ
り、見出し定義ルールファイル53に格納されている見
出しの語尾になる用語と照合した結果、見出しの構成要
素、見出しの定義ルールファイル53で構成要素の食い
違いがないかを調べて確認するために使用される。
【0064】確認ファイル54に格納されているデータ
より、以下のような見出しのチェックが可能となる。確
認ファイル54を参照して、見出しの構成要素cと見出
し定義ルールファイル53のどの構成要素の見出しの語
尾になる用語と一致したかdを比較して、cとdの構成
要素により、当該構成要素が上位か下位かを調べ、例え
ば、下位概念のものが、ある構成要素より上位に位置し
ている場合には、エラーと判定する。c=dの場合に
は、正しいと判定する。
【0065】上記ような比較をするために、以下のよう
なフラグを立てて、そのフラグにより上位であるか下位
であるかを判定する。見出しの構成要素(例えば、章な
ら、1のフラグをたてる)、見出し定義ルールファイル
53において、同じ文書種別(分類)のどの構成要素の
単語と一致したのか(例えば、当該見出しが節の単語で
あれば2のフラグをたてる)、調べた見出しの構成要素
上の位置(章なら章中での位置、2番目の章なら2とす
る)、例えば、解説書類と、該当見出しの属している文
書種別(分類)、見出し数のカウント(=1)等を設定
する。
【0066】主語検査ファイル55は、導入部のテスト
に用いられるファイルであり、各導入部の先頭の一文の
主語を取り出し、その中の主語を抽出する。この抽出さ
れた主語を単語に分解し、単語数が2以上であれば、先
頭と最後の単語を取り出して、検査する。単語数が1で
ある場合には、当該単語を取り出す。(例えば、ここで
は、”が主語の場合には、単語数が1であるので、『こ
こでは』を取り出す。また、“この事では”が主語の場
合には、『この』と『では』を取り出す。このように取
り出された単語が主語検査ファイル55に格納される。
また、検査時に当該ファイル55が読み出される。
【0067】常体・敬体検査ファイル56は、導入部の
文末を抽出したあとに当該文末が常体か敬体かを判定し
た判定結果が格納されるファイルである。次に、構造テ
スト部50の処理として、見出しのテストの動作を説明
する。図9は、本発明の一実施例の構造テスト部の見出
しのテストの概要の動作を示すフローチャートである。
【0068】ステップ201) 次のデータが存在する
場合には、ステップ202に移行し、最終のデータの処
理が終了したら、テスト処理を終了する。 ステップ202) 文書格納部20より直接文書が入力
される、または、構造表示部30から(または、表示部
格納部90からデータを読み出して)データが入力され
ると、構造テスト部50は、最も上位の見出しから順に
テストを行う。つまり、最も上位の構成要素が『部』で
あれば、『部』のテストが全て終了したら、次の『章』
のテストに移行する。
【0069】まず、入力された見出しを順に取り出す。 ステップ203) 取り出した見出しを項番と内容に分
ける。 ステップ204) 項番だけの場合には、ステップ21
3に移行する。 ステップ205) 見出しの用語について、見出し定義
ルールファイル53のデータを読み込み、照合を行う。
また、項番がシーケンシャルに並んでいるかをチェック
する。項番のチェック方法については、後述する。
【0070】ステップ206) 見出し定義ルールファ
イル53を読み出す際に、見出し定義ルールファイル5
3のどの分類を使用するかを決定する。なお、文書分類
が「その他」が検出された場合には、ステップ210に
移行する。次に、見出し定義ルールファイル53と見出
しの用語が一致するかを検査する。調べる見出しの構成
要素の内容の語尾が見出し定義ルールファイル53の見
出しの語尾になる用語に一致しているかを検査する。
【0071】ステップ207) 見出し内の用語の語尾
が見出し定義ルールファイル53の見出しの語尾になる
用語と一致している場合には、確認ファイル54に情報
を出力する。確認ファイル54には、調べた見出しの構
成要素名、一致した見出し定義ルールファイル52の構
成要素、文書種別、構成表示上の位置情報、見出し数の
カウント等を記録し、ステップ201に移行する。確認
ファイル54には以下のような内容が出力される。 調べた見出しの構成要素(例えば、“章”のとき=
1): 見出し定義ルールファイル53のどの構成要素の単語
と一致したか(例えば、“節”のとき=2): 調べた見出しの構成要素上の位置(章なら章中での位
置、2番目の章であれば=2): 該当見出しの属している文書種別(解説書類=1): 上記の〜によりデータを生成すると、“1221”
という1つのデータになる。
【0072】ステップ208) 見出し定義ルールファ
イル53の見出しの語尾になる用語と見出し内の語尾の
用語が一致しない場合には、構成要素の階層を変えて調
査する。詳細は、後述する。 ステップ209) 全構成要素についてチェックが終了
すればステップ210に移行し、まだ、他の構成要素の
チェックが終了していなければ、ステップ206に移行
する。
【0073】ステップ210) 用語ファイルに調べた
見出しの構成要素、調べた見出しの構成要素上の位置、
文書種別、見出しの用語、用語ファイルに出力した見出
しの数を出力し、ステップ201に移行する。 ステップ211) ステップ204において、見出しが
項番のみの場合には、当該項番の情報を見出しの構成要
素、調べた見出しの構成要素上の位置エラーファイル
(図示せず)に出力する等のエラー処理を行い、ステッ
プ201に移行する。
【0074】上記のステップ205における項番のチェ
ックについて説明する。 最初に項番の情報を取り出す。 前述の表1に示すような文書構造表を参照しなが
ら、“章”内であれば章内にある項番(節、項、小項
等、または、図表の項番等)の検査を行う。節なら節が
一つずつインクリメントされているか、項なら項がイン
クリメントされているか等を検査する。このとき、一番
上位の見出しが1から始まっているか、いない場合に
は、いくつから始まるかは利用者に指定させることも可
能である。このため、以下のような2つの検査が可能と
なる。 (1)最上位の構成要素の見出しを除いて構成要素が1
から始まっているか(最上位が“章”であれば、
“節”、“項”等がその章内で1から始まっている
か)。 (2)項番が順番通りになっているか(飛びや逆転現象
等になっていないか)。
【0075】具体的には以下のようにチェックする。例
えば、“1.1.1.1”なら“1111”の数値に置
き換える。また、“付録a.1”という場合には、
“a”を“1”等の数値に置き換え、“11”とする等
の方法が可能である。このような変換を行うことによ
り、数値化して前の項番の数値に1をインクリメントす
ると、次に項番の数値になるか否かによりチェックする
ことが可能である。但し、これは、同じ構成要素内で行
われるものとする。
【0076】例えば、 “1.1.1.l. 99” の次の項番が “1.1.1.1.100” で正しいことを検査するために、 “1.1.1. 99” を数値化すると、11199であり、 “1.1.1.100” を数値化すると、111100となる。
【0077】 (11199−99)×10+(99+1)=111100 (1) 上記のようにして等しければ、正しいと判定し、等しく
なければ誤りがあると判定する。上記の式(1)の“9
9”は、調べる項番により変化するが、この場合には、
“1.1.1.99”の場合二桁であるためであり、三
桁であれば、“999”となり、一桁であれば“9”と
なる。
【0078】図10は、本発明の一実施例の用語ファイ
ルに構成要素毎の用語を出力する動作のフローチャート
である。 ステップ2091) ステップ206において、現在の
構成要素が「節」である場合に、「節」より下の構成要
素「項」で見出していぎルールファイル53の見出しの
語尾になる用語と一致する用語がないか調べる。一致す
る場合には、ステップ207の処理に移行する。不一致
の場合には、ステップ2092に移行する。
【0079】ステップ2092) それでも全ての下位
方向の構成要素で一致しない場合には、「項」よりさら
に、下位の構成要素「小項」で一致する単語が見出し定
義ルールファイル53にないかを調べる。一致する場合
には、ステップ207の処理に移行し、不一致の場合に
は、ステップ2093に移行する。
【0080】ステップ2093) 上記のステップ20
92において、最下位の構成要素「小項」でも見出し定
義ルールファイル53と一致しない場合には、次に
「節」より上位の構成要素である「章」で一致する用語
が見出し定義ルールファイル53にないかを調べる。一
致する場合には、ステップ207に移行し、不一致の場
合には、ステップ2094に移行する。
【0081】ステップ2094) 上記のステップ20
93において、一つ上位の構成要素でも不一致の場合に
は、さらに上位の構成要素「部」で一致する用語が見出
し定義ルールファイル53に存在しないかを調べる。一
致する場合には、ステップ207に移行し、不一致の場
合には、ステップ2095に移行する。
【0082】ステップ2095) 上記のいずれの構成
要素であっても見出し定義ルールファイル53のデータ
と一致するデータがない場合には、用語ファイル52に
調べた見出しの構成要素、調べた見出しの構成要素上の
位置を文書種別、当該用語及び見出しカウント数をイン
クリメントして書き込む。
【0083】次に、具体例を説明する。 1. 『第1部』 (1−1) まず、最初に見出しの構成要素『部』が入
力される。 (1−2) 次に、上記の『第1部』については、項番
だけの見出しであるので、エラー情報(見出しの構成要
素、調べた見出しの構成要素上の位置)を出力する。
【0084】2.『第1章 画像処理の全体像』 (2−1) 次に構成要素『章』及び見出し“画像処理
の全体像”が入力される。(2−4) 構造テスト部5
0は、見出し定義ルールファイル53には、構成要素
“章”に関する見出しの語尾になる用語として、上記の
見出しの語尾「全体像」が一致するため、確認ファイル
54に見出しの構成要素、見出し定義ルールファイル5
3と一致した構成要素、見出しの構成要素上の位置、該
当見出しの属している文書種別、見出し数のカウント値
をインクリメントして書き込む。
【0085】3.『図2.1』 (3−1) 上記で『節』のチェックが終了したので、
第1章に含まれる次の構成要素『図』、及び項番“2.
1”が入力される。 (3−2) 構造テスト部50は、上記の見出しが項番
だけの見出しと判断し、エラー情報を出力する。
【0086】上記の処理により、用語ファイル52と確
認ファイル54に格納されているデータを以下のような
方法でチェックする。まず、確認ファイル54を参照し
て、誤りと見做す見出しについてエラーメッセージをテ
スト結果表示部57に出力する。なお、確認ファイル5
4になにもデータが格納されていない状態は、見出し定
義ルールファイル53に従っていないことになるため、
エラーとするが、全ての見出しがエラーであるという指
摘では、意味がないため、用語ファイル52の情報に基
づいて、図8(B)に示す木構造を作成し、エラーを含
む見出し誤り候補として出力することも可能である。ま
た、木構造にシソーラスファイルを適応して誤りをチェ
ックすることも可能である。
【0087】見出し定義ルールファイル53の見出しの
語尾になる用語と一致しない場合には一応エラー対象と
考え、用語ファイル52に格納された見出しをカウント
し、用語ファイル52に出力しているため、最終的に用
語ファイルの見出し数=0であれば、調べた見出しは、
見出し定義ルールファイル53の内容に従っていると考
えられる。また、用語ファイルの見出し数>0であれ
ば、用語ファイル52の見出しを誤り候補とし、エラー
メッセージとしてテスト結果表示部57に出力する。ま
た、項番だけの見出しのエラーと項番の誤りを検査する
ため、これらのエラーを出力する場合には、構成要素と
文書内の構成要素中の位置情報も併せて出力する。
【0088】このとき、確認ファイル54とデータ数が
1以上である場合には、確認ファイル内の見出しの構成
要素Cと見出し定義ルールファイル52のどの構成要素
が見出しの語尾になる用語と一致したかdを調べ、c=
dでない場合、誤りと見出し、エラー情報を出力する。
また、確認ファイルの構成要素上に位置と項番の誤り及
び項番だけの見出しのエラー情報に出した構成要素上の
位置から抜けている構成要素上の位置の番号が誤りと見
做せ、用語ファイル52に、その番号(抜けている構成
要素上の位置番号)は入っているので、用語ファイル5
2を参照して見出しの内容に関するエラー情報を出力す
る。
【0089】次に、構造テスト部50における導入部の
テストの動作を説明する。図11は、本発明の一実施例
の構造テスト部の導入部のテストの概要動作を示すフロ
ーチャートである。 ステップ310) まず、構造テスト部50は、導入部
のテストを行う際に、導入部の先頭の1文の主語を抽出
する。
【0090】ステップ320) 導入部の主語が統一さ
れているかを判定する。 ステップ330) 導入部の主語の処理が終了すると、
次に全導入部文末を抽出する。 ステップ340) 導入部毎に抽出された文末が常体で
あるか敬体であるかを判定し、各々の数をカウントし
て、数の少ない方がエラーの可能性があるとして、抽出
する。
【0091】図12は、本発明の一実施例の構造テスト
部の導入部のテストの詳細動作を示すフローチャートで
ある。 ステップ311) 構造テスト部50は、導入部の先頭
の一文の主語を抽出する。抽出する方法は、TDS/M
APLE等の既存の方法を使用するものとする。
【0092】ステップ312) 抽出した主語を分解す
る。 ステップ313) ここで、主語に該当する単語数が2
つ以上であれば、先頭と最後の単語を取り出す。もし単
語数が1であれば、当該単語を取り出す。以下に単語分
解の例を示す。
【0093】まず、区切り記号を含まず、かつ、同じ文
字種が続く一連の文字列を抽出する。但し、数値は、漢
字であっても区切り記号を見做す。区切り記号
は“[]”や“「」”及び“””、“,”、“.”等や
空白を含む。また、数値が出現した場合には、区切り記
号とみなし、数値は含めない。
【0094】また、本例では、どの構成要素に対応する
導入部の主語を取り出したのかの情報を記憶しておくも
のとする。 例1)『この章では、システムの概要につい述べま
す。』 主語の抽出:この章では 単語分解:「この」「章」「では」(単語数3) 主語検査ファイルに書き出す情報:導入部の構成要素/
章 単語数/3 調べる単語/先頭「この」 最後「では」 例2)『第3章においては、システムの体系について記
述しています。』 主語の抽出:第3章においては 単語分解:「第」「章」「においては」(単語数3) 主語検査ファイルに書き出す情報:導入部の構成要素/
章 単語数・3 調べる単語/先頭「第」 最後「においては」 例3)『6.10.8では、マウスの使い方について説
明します。』 主語の抽出:6.10.8では 単語分解:「では」(単語数1) 主語検査ファイルに書き出す情報:どの導入部か/項 単語数/1 調べる単語/先頭「では」 最後 なし 例4)『この9.12節では、システムのメリットにつ
いて説明します。』 主語の抽出:この9.12節では、 単語分解:「この」「節」「では」(単語数3) 主語検査ファイルに書き出す情報:どの導入部か/節 単語数/3 調べる単語/先頭「この」 最後「では」 例5)『ここでは、システムの概要について述べま
す。』 主語の抽出:ここでは 単語分解:「ここでは」(単語数1) 主語検査ファイルに書き出す情報:どの導入部か/部 単語数/1 調べる単語/先頭「ここでは」 最後 なし ステップ314) ステップ313で取り出された各単
語は主語検査ファイル55に出力する。
【0095】上記のステップ311から314の処理を
すべての導入部に対して行う。図13は、本発明の一実
施例の構造テスト部の導入部のテスト動作を示すフロー
チャートである。 ステップ321) 次に、構造テスト部50は、主語検
査ファイル55を読み出す。
【0096】ステップ322) 同じ構成要素の導入部
を取り出す。 ステップ323) 読み出した主語検査ファイル455
の単語数=1の主語と単語数=2以上の主語の数をカウ
ントし、同じ構成要素の導入部に関する調査が終了した
ら、ステップ322に移行する。
【0097】ステップ324) 単語数=1と単語数=
2以上の数が両方共に1以上であるとき、ステップ32
5に移行し、それ以外の場合には、ステップ330に移
行する。 ステップ325) 単語数=1の主語と単語2以上の主
語では明らかに相違があるので、まず数だけの比較をす
る。
【0098】ステップ326) 単語数=1の主語の数
>単語数=2以上の主語の数であれば、ステップ332
に移行する。 ステップ327) 単語数=1の主語の数<単語数=2
以上の主語の数であれば、ステップ328に移行し、そ
れ以外であれば、ステップ335に移行する。
【0099】ステップ328) 単語数=1の主語をも
つ導入部を誤りと見做す。 ステップ329) エラーを指摘する。 ステップ330) 単語数=1の主語の数が0である場
合には、ステップ331に移行し、それ以外である場合
単語数=2以上の主語の数が0である場合には、ステッ
プ334に移行する。
【0100】ステップ331) ステップ328におい
て、導入部を誤りと見做すと共に、単語数=2以上の主
語の検索を行う。詳細は後述する。 ステップ332) ステップ326において、単語数=
1の主語の数>単語数=2以上の主語の数であれば、単
語数=2以上の主語をもつ導入部を誤りとみなす。
【0101】ステップ333) エラーの指摘を行う。 ステップ334) さらに、単語数=1の主語の検査を
行う。また、ステップ330において、単語数=1の主
語の数≠0である場合にもこの検査を行う。 ステップ335、ステップ336) ステップ327に
おいて、単語数=1の主語の数=単語数=2以上の主語
の数となっている場合には、導入部の書き方がばらばら
であるとの指摘を出し、図17の書き出しの相違の部分
に、総ての導入部の主語の部分をページ、行番号も付与
して出力して、注意を促す。なお、この部分については
自動修正は不可能となる。
【0102】次に、上記のステップ334の単語数=1
の主語の検査について説明する。図14は、本発明の一
実施例の単語数=1の主語の検査方法を示すフローチャ
ートである。 ステップ3341) 主語検査ファイルに記憶されてい
る単語数=1で「調べる単語」の“先頭”の部分を有る
だけ取り出す。
【0103】ステップ3342) 同じ語があるかを検
査し、同じ語があったらカウントする。 ステップ3343) カウント数の多い順に並べる。 ステップ3344) カウント数の最も多いものを正し
い書き出し(導入部)とみなし、他のカウント数の少な
い語を持つ主語を誤り可能性ありと見做す。その結果、
図17に示すように出力する。
【0104】図15は、本発明の一実施例の単語数=2
以上の主語の検査のフローチャートである。 ステップ3311) 主語検査ファイルに格納されてい
る「単語数=2以上」の「調べる単語」の“先頭”、
“最後”の部分をあるだけ取り出す。
【0105】ステップ3312) 同じ形式の主語であ
るかを検査し、同じ形式の主語があったら、その形式を
カウントする。但し、単語数=2以上で構成される主語
の場合、調べる単語として、「先頭」と「最後」の2つ
があるので、以下の場合が考えられる。
【0106】「先頭」の単語にも一致し、「最後」の
単語にも一致する。 例)上記の例1と例4についえは同じ形式の主語とみな
し、この形式でカウントする。 「先頭」の単語が一致しないで、「最後」の単語に
は、一致する。この場合、「先頭」の単語の文字種がひ
らがなの場合には、同じ形式であると見做さない。他の
文字種(漢字または、カタカナ、アルファベット等)の
場合には、固有名詞の違いだけとも考えられるので、同
じ形式の主語の可能性があるものとし、可能性有りとい
う認識のできる形でこの形式をカウントする。
【0107】例) a.利用の気体の状態方程式とは 単語数 4, 「理想気体」「の」「状態方程式」「と
は」 先頭の単語「理想気体」 最後の単語「とは」 b.ポテンシャルとは 単語数 2 「ポテンシャル」「とは」 先頭の単語「ポテンシャル」 最後の単語「とは」 c.これらの電子雲とは 単語数3 「これらの」「電子雲」「とは」 先頭の単語 「これらの」 最後の単語 「とは」 aとbは同じ形式の主語の可能性ありと見做せる。ま
た、aとcは同じ形式の主語とは見做さない。
【0108】 「先頭」の単語が一致して「最後」の
単語が一致しない場合、この場合は、違う形式の主語で
あると見做す。 「先頭」と「最後」の単語両方が一致しない場合に
は、違う形式の単語であると見做す。
【0109】ステップ3313) カウントの多い順に
並べる。 ステップ3314) カウント数の一番多いものを正し
い書き出しと見做す。他のカウント数の少ない語を持つ
主語を誤り可能性ありと見做し、図17のような指摘を
出力する。
【0110】図16は、本発明の一実施例の導入部の文
末のテストの動作を示すフローチャートである。 ステップ401) 導入部の文末を抽出する。この文末
抽出方法は、特開昭62−78674及び特開平01−
106161等に記載されている方法を用いるものとす
る。
【0111】ステップ402) 次に、抽出された文末
が常体か敬体を判定する。この判定方法は、上記の特開
昭62−78674及び特開平01−106161等に
記載されている方法を用いるものとする。 ステップ403) 判定した結果を当該導入部の位置情
報と共に、常体・敬体検査ファイル56に格納する。
【0112】ステップ404) 次に、構造テスト部5
0は、常体・敬体検査ファイル56を読み出す。 ステップ405) 読みだされた常体・敬体検査ファイ
ル56の内容に敬体と常体が混在しているかを判定し、
混在していない場合には、ステップ407に移行し、混
在している場合には、ステップ406に移行する。
【0113】ステップ406) 文末の形態がそのまま
決まるため、ステップ408に移行し、導入部の値を追
加する。 ステップ407) 常体と敬体が混在している場合に
は、多い方をこの導入部での文末の形態とみなし、常体
を形態検査ファイルに値を追加する。
【0114】ステップ408) 導入部全ての検査が終
了したら、「文末の形態」の少ない方を誤りと見做す。 上記のようにして、構造テスト部50でテストされた結
果がテスト結果表示部57により、図17に示すよう見
出し部に関しては用語ファイル52、確認ファイル54
また項番のエラー情報を読み込み、導入部に関しては、
各結果の数が少ない要素をエラーとして表示する。
【0115】さらには、テスト結果表示部57に表示さ
れた内容を外部記憶装置のテスト結果格納部60に格納
することも可能である。テスト結果表示部57は、図1
7(A)に示すように、詳細に表示したい誤り箇所を利
用者に指定させる。利用者は見出しや、導入部の何れか
の内容をマウス等でクリックして指定する。図17
(A)の表示画面より、利用者が「見出し:ふさわしく
ない見出し」を選択すると、見出し定義ルールファイル
53を当該エラーの可能性があるとされる要素にて検索
し、図17(B)のaに示すように、当該見出しが存在
している位置とその理由を表示する。
【0116】また、図17(A)の表示画面より、利用
者が「導入部:書き出しの相違」を選択すると、図17
(B)のbに示すように当該第1の書き出し位置と第2
の書き出し位置と、それぞれの導入部の内容を表示す
る。また、図17(A)の表示画面より、利用者が「導
入部:文末の乱れ」を選択すると、図17(B)のcに
示すように、文末が常体・敬体の統一がとれていない文
の位置と内容を指摘する。
【0117】なお、図17において、「」内に検査した
結果を挿入するが、この内容は、検査の結果により可変
である。また、指摘箇所をマウス等のポインティング装
置でポイントすることにより、当該本文の該当箇所に位
置付けすることも可能である。このため、必要に応じて
該当箇所にテスト結果が設定され、表示された段階で、
利用者自身で修正することは勿論可能である。
【0118】[修正処理]次に、修正部70について説
明する。修正部70は上記の構造テスト部50により出
力されたテスト結果に基づいて自動的に修正を行う。
【0119】図18は、本発明の一実施例の修正部を説
明するための図である。修正部70は、テスト結果表示
部55に表示される図18(A)より修正したい箇所を
マウス等でクリックする等して指定する。これにより、
指定された箇所に対応するエラーの可能性を示す内容が
図18(B)に示すように表示される。つまり、見出し
に関しては、概念位置の乱れが3件あるので、図18
(B)のaには、3件分のエラーの可能性がある箇所が
表示される。また、図18の(B)のbには、導入部の
書き出しの相違が8件あるため、8件分のエラーの可能
性がある箇所がテスト結果表示部55に表示される。
【0120】修正部70は、図18(B)において、利
用者が修正したい部分をクリックすると図19に示すよ
うに修正候補が表示される。この中より修正に適するも
のを選択することにより修正される。例えば、図18
(B)aにより指摘されている492ページ、18行に
記載されているの文の位置をクリックすると、図19に
示すような修正候補が表示される。利用者は図19に表
示される3つの修正候補の中から置き換えたい候補の位
置にカーソルを移動させ、マウスでクリックすることに
より、自動的に修正される。
【0121】また、図18(B)cにより指摘されてい
る115ページ50行に記載されている文の位置をクリ
ックすると、図20に示すように自動的に常体から敬体
に修正されて出力される。また、文字の乱れに関して
は、複数の指定が可能であり、また、一括して自動修正
することもできる。
【0122】このように、導入部の書き出しの相違、文
末の乱れ等に関しては、修正指示として、所望の修正位
置にカーソルを移動させて、クリックして指示すること
により、図20に示すように、当該位置についてルール
に沿った修正を行う。また、構造テスト部50におい
て、テスト結果を書き込む確認ファイル54や用語ファ
イル52をファイルとして持たずにメモリ内に保持して
もよい。
【0123】なお、上記の構造表示部30やテスト結果
表示部55は、図面及び説明上分けて記載しているが、
物理的には、同一のディスプレイを用いるものとする。
なお、本発明は、上記の実施例に限定されることなく、
特許請求の範囲内で種々、変更、応用が可能である。
【0124】
【発明の効果】第1の発明によれば、文書により任意の
要素を簡単に取り出し、表示できるようになる。また、
文書の構造的なテスト及び修正を自動的に行うことが可
能となり、修正作業は、表示された内容の単に確認作業
を行えばよく、利用者の操作負担が軽減される。
【0125】第2の発明によれば、作成済または作成途
中の文書の文書構成上の階層や、見出し及び導入部分等
を抽出しテストデータを生成することにより、以降のテ
スト処理におけるデータ取得が容易になる。第3の発明
によれば、作成された構成要件の件数と表示させるデー
タが見出しのみか、導入部も含めて表示するかを利用者
に選択させる。これにより、利用者は、詳細に見たい構
成要件と見出し及び導入部の確認が可能である。また、
表示された内容がそのままテスト処理に移行されるの
で、利用者は、引き続いてテストを実行することができ
る。
【0126】第4の発明によれば、第3の発明により表
示されているテストデータを外部記憶装置等の記憶装置
に保持することが可能であるため、第3の発明によりテ
ストデータが生成され、表示された段階で生成処理が終
了しても、記憶しておくことにより、後日、テスト処理
を行う場合に、記憶装置に保持されているテストデータ
を用いて処理することも可能である。さらに、用紙等の
他の媒体にも出力することが可能となる。
【0127】第5の発明によれば、各構成要件と当該構
成要件の件数が表示されている画面よりテストを行ない
たい構成要件を利用者に選択させることが可能であり、
選択された構成要件の見出しの位置関係をチェックし、
さらに、導入部の文が統一された表現になっているか等
のテストを行うことが可能である。
【0128】第6の発明によれば、見出し部分の構成要
素が所定のルールと合致しない場合でも、構成要素を上
下させてルールと照合することにより、修正時にどの構
成要素に修正すればよいかを把握することが可能であ
る。第7の発明は、項番に関してもシーケンシャルに並
んでいるか否かを判定するため、重複、飛び等があって
もそれらのエラーを把握でき、修正時にも自動的に修正
することが可能である。
【0129】第8の発明は、導入部分のチェックを文書
全体の導入部の間で行うため、修正時には、一つの文書
を通して統一された導入部に修正することも可能であ
る。第9の発明によれば、主導入部の接尾語を敬体また
は常体かを判定し、導入部全体の文末形態を判断し、個
数の少ない方をエラーの可能性があるものとして指摘す
るため、統一すべき用語を修正時に選択することが可能
である。
【0130】第10の発明によれば、統一すべき主語を
正確に選択することが可能である。第11の発明によれ
ば、テスト結果を表示または、外部記憶手段に出力する
こことにより、そのまま、修正処理に移行することが可
能である。また、外部記憶手段に格納したデータを音声
情報に変換したり、用紙等に出力することも可能であ
る。
【0131】第12の発明によれば、テスト結果にエラ
ーとされた位置を明示しておくことにより、修正時には
当該エラー位置を特定することが可能である。第13の
発明によれば、テスト結果において、エラーと判断され
た箇所を自動的に修正することが可能である。
【図面の簡単な説明】
【図1】本発明の一実施例の構造テスト装置の構成図で
ある。
【図2】本発明の一実施例の動作の概要を示すフローチ
ャートである。
【図3】本発明の一実施例のテストデータ生成部の具体
例を示す図である。
【図4】本発明の一実施例の構造表示部の具体例を示す
図(その1)である。
【図5】本発明の一実施例の構造表示部の具体例を示す
図(その2)である。
【図6】本発明の一実施例の構造表示部の表示例を示す
図である。
【図7】本発明の一実施例の構造テスト部の動作を説明
するための図である。
【図8】本発明の一実施例の見出し定義ルールファイル
の構成例を示す図である。
【図9】本発明の一実施例の構造テスト部の見出しのテ
ストの概要の動作を示すフローチャートである。
【図10】本発明の一実施例の用語ファイルに構成要素
毎の単語を出力する動作のフローチャートである。
【図11】本発明の一実施例の構造テスト部の導入部の
概要動作を示すフローチャートである。
【図12】本発明の一実施例の構造テスト部の導入部の
詳細動作を示すフローチャートである。
【図13】本発明の一実施例の構造テスト部の導入部の
テストの動作を示すフローチャートである。
【図14】本発明の一実施例の単語数=1の主語の検査
方法を示すフローチャートである。
【図15】本発明の一実施例の単語数=2以上の主語の
検査方法を示すフローチャートである。
【図16】本発明の一実施例の導入部の文末のテストの
動作を示すフローチャートである。
【図17】本発明の一実施例のテスト結果を示す図であ
る。
【図18】本発明の一実施例の修正部の動作を説明する
ための図である。
【図19】本発明の一実施例の修正部における修正候補
表示の例を示す図である。
【図20】本発明の一実施例の文末の乱れの修正例を示
す図である。
【符号の説明】
10 テストデータ生成部 11 文書読取部 12 文書構造検出部 13 文書構造抽出部 20 文書格納部 30 構造表示部 40 抽出結果格納部 50 構造テスト部 52 用語ファイル 53 見出し定義ルールファイル 54 確認ファイル 55 主語検査ファイル 56 常体・形態検査ファイル 57 テスト結果表示部 60 テスト結果格納部 70 修正部 80 修正結果反映文書格納部 90 表示部格納部 100 構造テスト装置

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 文書作成の際に構造的な関連により該文
    書のテストを行う構造テスト装置において、 前記文書の構造を解析するためのテストデータを生成す
    るテストデータ生成手段と、 前記テストデータ生成手段より取得した前記テストデー
    タ、または、入力された文書を用いて、前記文書の確認
    すべきまたは、エラーである構造表示データ及び導入部
    を抽出してテスト結果として出力するテスト手段と、 前記テスト手段の前記テスト結果に基づいて、前記エラ
    ー部分を修正する修正手段とを有することを特徴とする
    構造テスト装置。
  2. 【請求項2】 前記テストデータ生成手段は、 前記文書を読み込む文書入力手段と、 入力された前記文書の各構成要素の各文書構成上の該構
    成要素の内容を検出する構造検出手段と、 前記構造検出手段で検出された前記構成要素の内容毎に
    前記入力された文書中の構成表示データ及び導入部分を
    抽出する構造抽出手段と、 前記構造抽出手段により抽出された前記構成要素の内容
    毎に構成表示データ或いは、該構成表示データ及び前記
    導入部分を表示する構造表示手段を有する請求項1記載
    の構造テスト装置。
  3. 【請求項3】 前記構造表示手段は、 前記構成要素の件数を表示し、構成表示データのみ、ま
    たは、該構成表示データに導入部分を組合せて表示され
    ている構成要素を選択させるための選択手段を含む請求
    項2記載の構造テスト装置。
  4. 【請求項4】 前記構造表示手段に表示した内容に加え
    て、文書の構造情報を併せて保持する記憶手段を有する
    請求項2記載の構造テスト装置。
  5. 【請求項5】 前記テスト手段は、 文書全体または、テストを希望する箇所が指定される
    と、構成表示データ間の構成要素の関係をチェックする
    見出しチェック手段と、 前記導入部の主語が同じ構成要素内で同じ形式を有して
    いるか、及び文末が統一されているかをチェックする導
    入部チェック手段と、 前記見出しチェック手段及び前記導入部チェック手段の
    結果を出力するテスト結果出力手段を有する請求項1記
    載の構造テスト装置。
  6. 【請求項6】 前記見出しチェック手段は、 上位の構成表示データの項番と内容をテストする項番・
    内容テスト手段と、 前記テスト手段において、前記構成表示データの内容と
    該内容が属する構成要素に対応する所定のルールを照合
    し、所定のルールと一致する場合には、確認する必要が
    ある構成要素として格納する第1の格納手段と、 前記所定のルールと不一致の場合には、照合する前記所
    定のルールの構成要素を下位または上位に変化させて照
    合し、どの構成要素も一致しない場合には、エラーと見
    做す構成要素として格納する第2の格納手段を有する請
    求項5記載の構造テスト装置。
  7. 【請求項7】 前記項番・内容テスト手段は、 各項番の構成要素がシーケンシャルにインクリメントさ
    れているかをチェックする項番チェック手段を含む請求
    項6記載の構造テスト装置。
  8. 【請求項8】 前記導入部チェック手段は、 前記導入部間においても行う請求項6記載の構造テスト
    装置。
  9. 【請求項9】 前記導入部チェック手段は、 文書内の全ての前記導入部の文末の表現が常体か敬体で
    あるかを個数から判定し、全体の文書の導入部の文末の
    形態を判定する手段と、 全体の文書の導入部の文末の形態から各々の導入部の文
    末の形態の正しさを判定し、エラーを指摘する手段とを
    有する請求項5記載の構造テスト装置。
  10. 【請求項10】 前記導入部チェック手段は、 導入部の先頭の一文の主語を取り出す主語取出手段と、 該主語取出手段より取り出された主語を単語に分解する
    単語分解手段と、 分解された単語が2つ以上であれば、先頭と最後の単語
    を取り出し、1つであれば、当該単語を取り出す単語抽
    出手段と、 前記単語抽出手段において、抽出された単語の形態を比
    較して少ない単語の形態をエラーと見做す主語チェック
    手段を有する請求項5記載の構造テスト装置。
  11. 【請求項11】 前記テスト結果出力手段は、 前記テスト結果を表示する手段と、 前記テスト結果を保持する手段とを含む請求項5記載の
    構造テスト装置。
  12. 【請求項12】 前記テスト結果出力手段は、 前記テスト結果に前記文書内のエラーの位置を含むよう
    編集する手段を有する請求項8記載の構造テスト装置。
  13. 【請求項13】 前記修正手段は、 前記テスト結果を表示し、指定された前記文書内の前記
    テスト結果に示されるエラー位置を検索する位置検索手
    段と、 前記位置検索手段により検索された位置の前記文書内に
    おける概念位置のエラー、前記導入部の先頭の一文の主
    語の誤り及び導入部の先頭の一文の主語を修正する手段
    及び前記導入部の文末を修正する手段を含む請求項1記
    載の構造テスト装置。
JP7001950A 1995-01-10 1995-01-10 構造テスト装置 Withdrawn JPH08190560A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7001950A JPH08190560A (ja) 1995-01-10 1995-01-10 構造テスト装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7001950A JPH08190560A (ja) 1995-01-10 1995-01-10 構造テスト装置

Publications (1)

Publication Number Publication Date
JPH08190560A true JPH08190560A (ja) 1996-07-23

Family

ID=11515892

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7001950A Withdrawn JPH08190560A (ja) 1995-01-10 1995-01-10 構造テスト装置

Country Status (1)

Country Link
JP (1) JPH08190560A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10214265A (ja) * 1997-01-30 1998-08-11 Mitsubishi Electric Corp 構造化文書処理装置
US7231591B2 (en) 2003-03-31 2007-06-12 Nec Corporation Computer system suitable for communications of structured documents

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10214265A (ja) * 1997-01-30 1998-08-11 Mitsubishi Electric Corp 構造化文書処理装置
US7231591B2 (en) 2003-03-31 2007-06-12 Nec Corporation Computer system suitable for communications of structured documents

Similar Documents

Publication Publication Date Title
US8380650B2 (en) Information extraction rule making support system, information extraction rule making support method, and information extraction rule making support program
KR100943151B1 (ko) 데이터베이스 작성 장치 및 데이터베이스 활용 지원 장치
JPH07325827A (ja) ハイパーテキスト自動生成装置
US20100316301A1 (en) Method for extracting referential keys from a document
JPS5985530A (ja) カード・イメージ処理機能を有するデータ処理装置
JP2013016036A (ja) 文書部品生成方法及び計算機システム
JP2008112363A (ja) 文書処理装置および文書処理プログラム
Monroy et al. Visualization of variants in textual collations to analyze the evolution of literary works in the Cervantes project
JPH08190560A (ja) 構造テスト装置
JP2000067056A (ja) 数値情報抽出装置および数値情報検索装置並びに数値情報抽出プログラムを記憶した記憶媒体、数値情報検索プログラムを記憶した記憶媒体
Tursunov Description of the management system programs of the national corpus of the uzbek language
US20090249197A1 (en) Document proofreading support method and document proofreading support apparatus
JPH1011443A (ja) 文書符号検査システム
JP5123350B2 (ja) テストケース作成システム、方法およびプログラム
JP4301879B2 (ja) 抄録作成支援システム及び特許文献検索システム
JP3958722B2 (ja) イメージデータ文書検索システム
JP2008210229A (ja) 知的財産情報検索装置、知的財産情報検索方法及び知的財産情報検索プログラム
JPH11232303A (ja) テキスト検索装置
JPH08115330A (ja) 類似文書検索方法および装置
JP2009181524A (ja) 文書検索システム及び文書検索方法
JP2795930B2 (ja) 文書作成支援装置
JP5315890B2 (ja) 評価システムおよび評価方法
JP4405604B2 (ja) 情報処理装置及び定義方法
McMahon The role of journals in maintaining data integrity: checking of crystal structure data in acta crystallographica
JPH1115826A (ja) 文書解析装置及び方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020402