WO2012073376A1

WO2012073376A1 - 電子文書処理装置、電子文書処理方法、及びコンピュータ読み取り可能な記録媒体

Info

Publication number: WO2012073376A1
Application number: PCT/JP2010/071671
Authority: WO
Inventors: 景厚文; 昌洋津村; 小川　祐一
Original assignee: 株式会社日立製作所
Priority date: 2010-12-03
Filing date: 2010-12-03
Publication date: 2012-06-07

Abstract

　電子文書処理装置は、電子文書を取り込み、当該電子文書に含まれている文字列オブジェクトのそれぞれに設定されている、当該電子文書の前記ビューを決定するための属性であるビュー属性と、各前記文字列オブジェクトの前記電子文書内における配置に関する情報である文字列オブジェクト配置情報とを取得する文書情報取得部と、取得した前記文字列オブジェクト配置情報を比較して前記文字列オブジェクト配置情報が相互に類似していると判定された複数の前記文字列オブジェクトを１のグループとして登録するグルーピング処理部と、各前記グループに属する前記文字列オブジェクトについて設定されている前記ビュー属性を相互に比較して、相対的に特異である前記ビュー属性が設定されている前記文字列オブジェクトがあるか判定し、特異な前記ビュー属性が設定されている前記文字列オブジェクトがあると判定した場合、当該文字列オブジェクトに設定されている前記ビュー属性が誤りである旨の情報を出力する誤り検知部とを備えている。

Description

電子文書処理装置、電子文書処理方法、及びコンピュータ読み取り可能な記録媒体

　本発明は、電子文書処理装置、電子文書処理方法、及びコンピュータ読み取り可能な記録媒体に関する。

　官公庁、民間企業等での各種電子手続、街中でのデジタルサイネージの普及等に伴って、ディスプレイ装置に表示させて使用する電子ポスター、電子帳票等の電子文書が広く利用されるようになってきている。この電子文書は、例えばＸＭＬ（eXtensible Mark-up Language）形式等の規定のフォーマットに従って作成されている電子ファイルである。以下本明細書中では、「文書（document）」の用語をこのような電子文書を意味する用語として使用する。文書を作成するときには、その文書を液晶ディスプレイ装置等に表示させたときに、表示された文書中のテキストが視覚的に統一感をもって整然と配置され、ユーザーに対して見栄えのする画面となるように画面構成が設計される。このようなテキストの配列を含む画面の見た目を、本明細書中では「ビュー（view）」と呼ぶこととし、あるビューを規定するテキストの構成に関するあらゆる属性を「ビューの属性」と呼ぶこととする。ビューの属性には、表示されるテキストを構成する文字に使用されるフォントの種類、サイズ、カラー、スタイル、テキストを構成する文字列の文字間隔、及び行間隔といった設定が含まれるが、これらに限定されるものではない。

　見栄えのするビューは、画面上に表示されるテキストについて、あるまとまった表示領域毎にビューの属性設定が揃えられている場合に得られることが多い。しかし、このようなビューの属性設定が揃っていないといけない箇所について、ケアレスミスによって適正な属性設定がなされていないこととなっていた場合、そのミスをディスプレイ画面上で目視によって発見することはなかなか困難であった。

　従来、ビューの属性設定上のケアレスミスを発見する方法として、該当文書を作成したワードプロセッサ、Ｗｅｂページ作成ソフトウェア等の文書作成ツールが提供するプレビュー画面上で各文字列オブジェクト（文書中に設定するテキストボックス等の文字列を含むオブジェクトの他、ワードプロセッサ等の文書作成ツールにより文書に入力されたすべての文字列を含む）に関するプロパティを開いて設定情報を確認する方法がある。しかし、文書に含まれる文字列オブジェクト数が多いと、それらのプロパティを１つ１つ開いて確認するのに非常に手間がかかる。そのため、１つ１つ文字列オブジェクトの設定を確認する事なく、ユーザーがケアレスミスを容易に発見して対応することを可能とする手法が必要とされた。

　この点、例えば特許文献１には、同一文書中で数字の表記が統一されていない単語を検出し警告を発することができるようにすることを目的として、入力装置１０１により入力された書式付き文書をレイアウト解析部１０２でレイアウト解析して、領域別にテキストデータを切り出すと共に、その領域の種別を識別し、その領域別に得られたテキストデータを形態素解析部１０４にて最も自然な単語の列に切り分け、その単語の列から数字抽出部１０８により抽出される数字の表記種別を数字抽出部１０８にて判別しておき、各領域種別を単位に、この判別された各数字の表記種別を数字評価部１０７が比較することで、当該領域種別の全ての領域中の全ての数字のうちで表記が統一されていない数字を検出し、その数字の表記誤りを特別な表示形態で出力装置１１３に表示出力する構成が記載されている。

特開平１０－１８７７１９号公報

　しかし、特許文献１はあくまでも文書中の数字表記の統一を目的としており、文書のビューの概念は全く開示も示唆もしていない。そのため、文書全体の数字表記を統一させる、あるいは題目、本文、図番といった固定的に規定される領域種別毎の数字表記を統一させるための構成は提案しているが、文書中のよりフレキシブルな文字列オブジェクト毎のビューを画面上で簡便にチェックする構成を提供することはできない。

　本発明は前記の及び他の課題に鑑みてなされたものであり、電子文書の統一感あるビューを構成すべく画面上の文書の書式に自在に対応しつつビューの属性設定を検査することができる電子文書処理装置、電子文書処理方法、及びコンピュータ読み取り可能な記録媒体を提供することを目的としている。

　上記の及び他の課題を解決するための本発明の１つの態様は、文字列を含むオブジェクトである文字列オブジェクトを複数含んでいる電子文書を表示させたときの、当該電子文書の視覚的外観であるビューを検査するための電子文書処理装置であって、前記電子文書を取り込み、当該電子文書に含まれている前記文字列オブジェクトのそれぞれに設定されている、当該電子文書の前記ビューを決定するための属性であるビュー属性と、各前記文字列オブジェクトの前記電子文書内における配置に関する情報である文字列オブジェクト配置情報とを取得する文書情報取得部と、取得した前記文字列オブジェクト配置情報を比較して前記文字列オブジェクト配置情報が相互に類似していると判定された複数の前記文字列オブジェクトを１のグループとして登録するグルーピング処理部と、各前記グループに属する前記文字列オブジェクトについて設定されている前記ビュー属性を相互に比較して、相対的に特異である前記ビュー属性が設定されている前記文字列オブジェクトがあるか判定し、特異な前記ビュー属性が設定されている前記文字列オブジェクトがあると判定した場合、当該文字列オブジェクトに設定されている前記ビュー属性が誤りである旨の情報を出力する誤り検知部とを備えている電子文書処理装置である。

　本発明によれば、電子文書の統一感あるビューを構成すべく画面上の文書の書式に自在に対応しつつビューの属性設定を検査することができる電子文書処理装置、電子文書処理方法、及びコンピュータ読み取り可能な記録媒体を提供することができる。

図１は本発明の実施例１による電子文書処理装置１００の構成図である。図２は実施例１のデータ処理手順を示したフローチャートである。図３は図２に示した実施例１のデータ処理手順における誤り検知部１１３の処理手順を示したフローチャートである。図４は実施例１において、補助記憶装置１６０に格納されている電子文書である帳票の書式の一例を示した図である。図５Ａは図４の帳票４００のソースデータをＸＭＬ形式で示した図である。図５Ｂは図４の帳票４００のソースデータをＸＭＬ形式で示した図である。図６は図４の帳票４００を構成している電子文書から文字情報取得部１１１によってビューの属性設定、及びメタ情報が取得された結果であるビュー属性情報テーブル６００の一例を示す図である。図７は実施例１におけるグルーピング処理部１１２によって図４の帳票４００をグルーピングした結果であるグループテーブル７００の一例を示す図である。図８は各グループにおけるビュー属性の出願頻度を示す属性値頻度テーブル８００の一例を示す図である。図９Ａは実施例１のメッセージ通知部１１４によって出力されるメッセージ表示画面の一例を示す図である。図９Ｂはメッセージ表示画面に、当該メッセージに対応する箇所を重畳させて出力した画面を示す図である。図１０は本発明の実施例２による電子文書処理装置１００の構成図である。図１１は実施例２のデータ処理手順を示したフローチャートである。図１２は図１１に示した実施例２のデータ処理手順におけるグルーピング処理部１１２の処理手順を示したフローチャートである。図１３は実施例２における文書情報取得部１１１、文字列解析部１１６によって取得された結果を示す図である。図１４は実施例２におけるグルーピング処理部１０３によってグルーピングされた結果であるグループテーブル７００の一例を示す図である。

　以下、本発明を実施するための形態につき、添付図面を参照しながら実施例に即して説明する。

［実施例１］
　まず、本発明の一実施例について説明する。図１に本実施例にかかる電子文書処理装置１００の構成例を示している。電子文書処理装置１００は例えば一般的なコンピュータの構成を有しており、図１の例では、主記憶装置１１０（メモリ）、中央処理装置１２０（プロセッサ）、表示装置１３０、キーボード１４０、マウス１５０、補助記憶装置１６０、及び通信インタフェース（以下「通信Ｉ／Ｆ」）１７０を備えて構成されている。

　主記憶装置１１０は例えばＲＡＭ（Random Access Memory）あるいはＲＯＭ（Read Only Memory）であり、後出の中央処理装置１２０が実行する各種コンピュータプログラム（以下「プログラム」）、及び処理対象である文書を格納する領域（ワークエリアＷ）に対する一時的な記憶領域を提供する。中央処理装置１２０は、例えばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro-Processing Unit）等で構成される（以下「ＣＰＵ」）。表示装置１３０は文書を表示するための、液晶ディスプレイ等の適宜の形式の出力装置である。表示装置１３０には、後出する本実施例のメッセージ表示画面も出力される。なお、プリンタ、音声出力装置等の他の形式の出力装置を設けてもよい。

　キーボード１４０、マウス１５０は、本電子文書処理装置１００を利用するユーザーがテキスト入力を行い、あるいは後述するプログラムが提供する機能に従ってデータ入出力操作を実行する際に用いる入力装置である。これ以外に、入力装置としてタッチパネル、ペンタブレット、音声入力装置等の他の形式のデバイスを設けてもよい。

　補助記憶装置１６０はハードディスクドライブ（Hard Disk Drive、ＨＤＤ）、半導体記憶ドライブ（Solid State Drive、ＳＳＤ）等の記憶装置であり、本実施例の電子文書処理装置１００の処理対象となる文書Ｄ、ＣＰＵ１２０によって主記憶装置１１０に読み出されて実行されるプログラムである文書情報取得部１１１、グルーピング処理部１１２、誤り検知部１１３、メッセージ通知部１１４、及び文書修正処理部１１５を格納している。また、補助記憶装置１６０には、ワードプロセッサ等の文書作成ツール、及び他のアプリケーションプログラムも併せて格納することができる。なお、文書Ｄは、電子帳票、電子ポスター等のどのような種類の文書であってもよく、またワードプロセッサファイル、Ｗｅｂファイル等のどのような種類のファイルであってもよく、テキストに関してビューの属性が設定されているいかなる文書も含むことができる。

　通信Ｉ／Ｆ１７０は、電子文書処理装置１００を図示しない通信ネットワークに接続する場合に使用するインタフェース回路であり、例えばＮＩＣ（Network Interface Card）等で構成される。主記憶装置１１０、中央処理装置１２０、表示装置１３０、キーボード１４０、マウス１５０、補助記憶装置１６０、及び通信Ｉ／Ｆ１７０の間は、適宜の通信規格を採用した内部バス１８０によって通信可能に接続されている。

　次に、電子文書処理装置１００としての機能を提供する各プログラムについて説明する。図１では、これらのプログラム、文書情報取得部１１１、グルーピング処理部１１２、誤り検知部１１３、メッセージ通知部１１４、及び文書修正処理部１１５が主記憶装置１１０に読み込まれた状態を示している。これらのプログラムは、図示を省略する周知のオペレーティングシステム（ＯＳ）上で動作し、各プログラム間あるいは表示装置１３０、キーボード１４０、補助記憶装置１６０等のデバイスとの間でのデータ入出力処理も前記ＯＳの周知の機能によって実行される。

　文書情報取得部１１１は、文書Ｄに設定されているビューに関する属性の情報であるビュー属性情報を処理対象の文書Ｄから取得する処理を行う。グルーピング処理部１１２は、文書Ｄに配置されている複数の文字列オブジェクトを一定の規則に従ってグループ分けする処理を行う。具体的にどのような規則に従ってグループ分けを行うかは、対応するデータ処理手順に関して後述する。

　誤り検知部１１３は、同一のグループに含まれる文字列オブジェクトに設定されているビュー属性を調べ、ビュー属性の設定が誤っていると考えられる部位を抽出する処理を行う。メッセージ通知部１１４は、誤り検知部１１３の処理結果に従って、ビュー属性の誤りとその誤りが発生している部位に関する情報をメッセージ画面として生成し、表示装置１３０等の出力装置に出力する処理を行う。文書修正処理部１１５は、ユーザーが、誤り検知部１１３が検知したビュー属性設定に関する誤りを本書式検知装置１００が判定した内容に従って自動的に修正することを選択した場合に、当該誤りの修正処理を行う。具体的な誤り修正処理の内容については、対応するデータ処理手順に関して後述する。

　ワークエリアＷは、前記のように、本電子文書処理装置１００によって文書Ｄを処理する際に文書Ｄのデータを読み込む作業記憶領域であり、処理に必要な記憶容量に対応した記憶領域を適宜に確保するようにすればよい。また、ワークエリアＷには、後述する電子文書処理装置１００のデータ処理に使用するテーブル６００、７００、８００が格納されている。

　なお、本実施例では、電子文書処理装置１００単体で本実施例の書式検査機能をすべて実行することができる構成を例示しているが、文書情報取得部１１１、グルーピング処理部１１２、誤り検知部１１３、メッセージ通知部１１４、及び文書修正処理部１１５をサーバコンピュータ上で動作させるようにし、サーバコンピュータと通信可能に接続されたクライアント装置からサーバコンピュータ上の前記機能を利用できるように構成してもよい。

　次に、以上の構成を有する電子文書処理装置１００によって実行されるデータ処理について説明する。図２に、本実施例の電子文書処理装置１００におけるデータ処理手順の一例を示している。

　電子文書処理装置１００の処理対象となる文書Ｄは、例えば本電子文書処理装置１００に実装されている文書作成ツールによってワークエリアＷで作成され、あらかじめ補助記憶装置１６０に格納される。あるいは、他のコンピュータで作成した文書Ｄを通信Ｉ／Ｆ１７０等を通じてあらかじめ補助記憶装置１６０に取り込んでおいてもよい。

　まず、ＣＰＵ１２０は、補助記憶装置１６０に格納しておいた文書ＤをワークエリアＷに読み込む（Ｓ２０１）。

　次に、文書情報取得部１１１が、文書Ｄに含まれている文字列オブジェクトを抽出し、各文字列オブジェクトに付与されたメタ情報とビューの属性設定情報とを取得し、後述するビュー属性情報テーブル６００としてワークエリアＷへ保持する（Ｓ２０２）。本実施例における「メタ情報」（文字列オブジェクト配置情報、配置階層情報）とは、文字列オブジェクトのビューを決定する書式について、文字列オブジェクトに含まれるテキストに対して設定される情報であり、例えばＸＭＬ形式文書の場合にはタグデータが該当する。また、文書Ｄに対して、メタ情報が階層的に付与されている場合は、「/node1/node2/node3」のようにパス形式で保持される。

　次に、グルーピング処理部１１２は、Ｓ２０２で取得した文字列オブジェクトのメタ情報から、メタ情報のパスが完全に一致している２つ以上の文字列オブジェクトの集合、または同一の親ノードを持つ２つ以上の文字列オブジェクトの集合を１つのグループとして、後述のグループテーブル７００としてワークエリアＷへ保持する（Ｓ２０３）。なお、グルーピング処理部１１２は、上記の規則に従って文書Ｄに含まれる文字列オブジェクトを自動的にグルーピングするグルーピング処理を実行するが、ユーザーが直接文字列オブジェクトを任意の規則に従って分類し、分類された各文字列オブジェクトの集合を１つのグループとしてもよい。

　次に、誤り検知部１１３は、Ｓ２０３で生成された全てのグループについて、同一グループ内に含まれる文字列オブジェクトに設定されているビューの属性において、他の文字列オブジェクトに比べて特異な属性情報が設定されている文字列オブジェクトを検索し、その検索結果をワークエリアＷに保持する（Ｓ２０４）。次いで、誤り検知部１１３は、前記検索結果に基づいて、特異な属性情報が設定されている文字列オブジェクトが存在するか否かを判定する（Ｓ２０５）。該当する文字列オブジェクトが存在しないと判定した場合、誤り検知部１１３はそのまま処理を終了する（Ｓ２０５、Ｎｏ）。なお、Ｓ２０４で実行される処理についてはより詳しく後述する。

　一方、該当する文字列オブジェクトが存在すると判定した場合（Ｓ２０５、Ｙｅｓ）、誤り検知部１１３はその旨の情報をメッセージ通知部１１４に送信し、当該情報を受けたメッセージ通知部１１４は、その旨のメッセージを含むメッセージ画面を生成し、警告メッセージとして例えば表示装置１３０に表示させることによりユーザーに通知する（Ｓ２０６）。なお、本ステップで生成されるメッセージ画面には、前記の特異な値を有する属性情報が設定されている旨のメッセージの他に、誤り検知部１１３が検出した現在の設定値、本来適正であると考えられる設定値等を通知してもよい。

　メッセージ通知部１１４は、Ｓ２０６の通知時に、ユーザーに対してビュー属性設定の誤りと考えられる個所を自動で修正するか否かの選択インタフェースを提示し、ユーザーから修正実行の指示があったかを判定する（Ｓ２０７）。ユーザーが修正指示をしたと判定した場合（Ｓ２０７、Ｙｅｓ）、文書修正処理部１１５は該当するビュー属性情報の設定値を修正する（Ｓ２０８）。ユーザーからの修正指示がないと判定した場合（Ｓ２０７、Ｎｏ）、文書修正処理部１１５は修正処理を行わずにそのまま処理を終了する。なお、本実施例では、ユーザーが修正の要否を選択することができるように構成したが、誤り検知部１１３が誤りを検知した場合には直ちにシステム側で修正を実行する構成としてもよい。

　次に、図２のＳ２０４で実行される誤り検知処理についてより詳細に説明する。図３は、Ｓ２０４で実行される誤り検知部１１３による処理手順を示している。誤り検知部１１３は、後述するＳ３０２～Ｓ３０５の処理を、図２のＳ２０３での処理によって生成された全てのグループについて繰り返す（Ｓ３０１～Ｓ３０７）。また、誤り検知部１１３は、Ｓ３０３～Ｓ３０５の処理を、各グループに属する文字列オブジェクトで設定されている全てのビューの属性について繰り返す（Ｓ３０２～Ｓ３０６）。

　まず、誤り検知部１１３は、各グループ内の各文字列オブジェクトについて、設定されているビューの属性の属性値毎の設定数を示す指標である属性値頻度をカウントし、各属性値に対応して設定されているオブジェクトＩＤをワークエリアＷに保持する（Ｓ３０３）。

　次に、誤り検知部１１３は、Ｓ３０３でカウントされた該ビューの属性の属性値頻度について、該グループに含まれる文字列オブジェクト全体に対する設定の割合が、γ％以上１００％未満である属性値が存在するか否かを判定する（Ｓ３０４）。

　誤り検知部１１３がＳ３０４に設定されている判定条件を満たす属性値があると判定した場合（Ｓ３０４、Ｙｅｓ）、該グループにおいて該ビューの属性の設定が誤っている文字列オブジェクトがあると判定して、該グループＩＤの該ビューの属性において、設定割合がγ％以上１００％未満の属性値を正しいと思われる設定、属性値頻度が１以上かつ設定割合がγ％未満の属性値を誤っていると思われる設定としてワークエリア１０７へ保持する（Ｓ３０５）。

　以上説明した本実施例の電子文書処理装置１００におけるデータ処理手順を、具体的な文書処理例に即してさらに説明する。ここでは、電子文書は電子帳票であるとする。図４に、本実施例の電子文書処理装置１００の処理対象である電子帳票４００の一例を示している。電子帳票４００は、電子文書処理装置１００または他のコンピュータ等によって作成され、補助記憶装置１６０に格納されている。電子帳票４００は、帳票の固有識別符号である帳票番号４０１、書類種別が帳票であることを表す書類名４０２、発行先の会社名を表す社名４０３、発行先住所の郵便番号を表す郵便番号４０４、発行先住所を表す住所４０５、発行先の電話番号を表す電話番号４０６、発行先のファックス番号を表すファックス番号４０７、帳票発行の日付を表す発行日付４０８の各項目に対応する文字列オブジェクト、及び表組み中に配置される文字列オブジェクトである項番４０９、取引日４１０、商品名４１１、商品コード４１２、数量４１３、単価４１４、金額４１５の各項目を備えている。なお、電子文書処理装置１００で処理する対象となる文書Ｄの種類、文書Ｄに記載されるテキストの内容、配置は本実施例により制約されるものではない。

　図５Ａ、図５Ｂに、図４に例示した帳票４００を内部データ形式５００、５０１で示している。本実施例では、帳票４００はＸＭＬ形式で記述されているものとしている。なお、図５Ｂに示すように、煩雑さを避けるために、図４の表組みの項番３、４に対応する部分の内部データ形式の記載は省略している。図５Ａを参照すると、例えば社名４０３の文字列オブジェクトについて、「<name objectId=”403” x=”40” y=”50” height=”xxx” width=”yyy” font="○○明朝" font-size="12" style="normal" align="left" >○○会社</name>」と定義されている。この定義から、社名４０３の文字列オブジェクトについては、メタ情報は「name」、ビューの属性の１つである「font」には属性値「○○明朝」が設定されていることがわかる。

　次に、ビュー属性情報テーブル６００について説明する。図６に、本実施例でワークエリアＷに生成され保持されているビュー属性情報テーブル６００の一例を示している。ビュー属性情報テーブル６００は、文書Ｄに含まれているすべての文字列オブジェクトについて、それぞれに設定されているビューに関する属性を対応付けて記録している。図６に示すように、ビュー属性情報テーブル６００には、オブジェクトＩＤ（objectID）６０１、フォント（font）６０２、フォントサイズ（font-size）６０３、スタイル（style）６０４、字揃え（align）６０５、及びパス（path）６０６の各項目が記録されている。

　オブジェクトＩＤ６０１は、文書Ｄ（この場合は帳票４００）に含まれているすべての文字列オブジェクトに対して相互に識別可能に付与された識別符号であり、図６の例では４０１からの連続番号が付与されている。オブジェクトＩＤ６０１は、図４で使用されている文字列オブジェクトの識別符号に対応する。フォント６０２、フォントサイズ６０３は、各文字列オブジェクトに使用されている文字フォントについて設定されているフォントの種類、フォントの大きさをそれぞれ示している。スタイル６０４は、各文字列オブジェクトに含まれる文字について設定されている文字スタイル（例えば下線、太字、斜字、網掛け等の修飾効果）を示している。字揃え６０５は、各文字列オブジェクトについて設定されている字揃え（左揃え、右揃え、中央揃え、両端揃え等）の種類を示している。パス６０６は、各文字列オブジェクトに付与されているメタ情報を表しており、図６の例ではメタ情報が階層的に付与されているため、パス形式で保持されている。

　図６のビュー属性情報テーブル６００は、図２のＳ２０２で文書情報取得部１１１が実行した処理の結果として得られる。図４の帳票４００から取得したビューの属性情報、及びメタ情報から、図６では、例えばオブジェクトＩＤ６０１が「４０３」で特定される文字列オブジェクトは、ビューの属性であるフォント６０２、フォントサイズ６０３、スタイル６０４、字揃え６０５の属性値にはそれぞれ「○○明朝」、「１２（pt）」、「normal」、「left」が設定されており、メタ情報であるパス６０６には「/root/coustomerinfo/name/」と設定されている。なお、「pt」の記号は、文字の大きさを示すのに用いられるポイント（point）を意味している。

　次に、グループテーブル７００について説明する。グループテーブル７００は、図２のＳ２０３での処理で、グルーピング処理部１１２によって生成され保持される。図７は、図６においてパス形式で保持されている各文字列オブジェクトのメタ情報６０６に対し、グルーピング処理部１１２によって、メタ情報のパスが完全に一致している２つ以上のオブジェクトの集合、または同一の親ノードを持つ２つ以上のオブジェクトの集合を１つのグループとしてグルーピングした結果を示すものである。図７の例では、グループテーブル７００には、生成されたグループ毎に付与される識別符号であるグループＩＤ７０１と、各グループに分類された文字列オブジェクトのオブジェクトＩＤ７０２とが対応付けて記録されている。

　図７のグループＩＤ７０１が「５」で特定されるグループの例では、オブジェクトＩＤ７０２が４１６、４２３、４３０、４３７、４４４で特定される文字列オブジェクトについて、図６のパス６０６に同一の値、「/root/products/product/item」が設定されているため、ビューの設定を揃えるべき箇所として１つのグループに分類されている。これは、同一のパス６０６を有する文字列オブジェクトであれば、それらは文書Ｄにおいて通常同一の項目を表示するものであり、従ってビューの設定も共通であると一般的に考えられるという知見に基づくグループ生成規則である。また、図７のグループＩＤ７０１が「３」で特定されるグループには、オブジェクトＩＤ７０２が「４０９」～「４１５」で特定される文字列オブジェクトが含まれている。これは、図６に示されているように、これらの文字列オブジェクトが「/root/table/table-column」という同一の親ノードを有するため、ビューの設定を揃えるべき箇所と考えられるためである。

　以下、誤り検知部１１３は図７に示す全てのグループに対して図３に示す誤り検知処理を実行する。ここでは、図７のグループＩＤ「３」で特定されるグループについて誤り検知部１１３が誤り検知処理を実行する場合の具体例を示す。

　図８に、本実施例における属性値頻度テーブル８００の一例を示している。属性値頻度テーブル８００は、図７に示すグループテーブル７００に記録されている文字列オブジェクトのグルーピング結果に基づき、各グループに属する文字列オブジェクトについて、各ビュー属性に関しどのような属性値が設定されているか、その属性値の出現頻度を記録している。言い換えれば、属性値頻度テーブル８００には、１つのグループに属している複数の文字列オブジェクトについて、１つのビュー属性（例えばフォントサイズ６０３）に注目したときに、そのビュー属性についてどのような属性値がどのような割合で設定されているかを解析した結果を記録している。

　図８の例では、図７のグループテーブル７００にグループＩＤ「３」で記録されている各文字列オブジェクト（オブジェクトＩＤ７０２が４０９、４１０、４１１、４１２、４１３、４１４、または４１５で特定されている。）に対する、ビューの属性８０１（図８では、フォント種類６０２及びフォントサイズ６０３）、ビューの属性８０１に関する属性値頻度８０２及び各属性値の設定に対応するオブジェクトＩＤ８０３を示している。図８では、ビュー属性「フォント」に関する属性値頻度と対応する文字列オブジェクト情報、ビュー属性「フォントサイズ」に関する属性値頻度と対応する文字列オブジェクト情報をそれぞれ示している。

　図３のＳ３０４で実行される処理において、誤り検知部１１３は、各ビューの属性に対し、グループ３内での設定割合がγ％以上１００％未満で設定されている属性値が存在するビューの属性があるか否かを判定する。図８の例では、γ=６０として判定した結果、フォントサイズに関して、属性値「１０（pt）」が約８６％（＝６／７）の設定割合であるため、フォントサイズは前記判定条件を満たす。これは、７つの文字列オブジェクト中で、６つの文字列オブジェクト（オブジェクトＩＤが４０９、４１０、４１１、４１２、４１３、４１５）のフォントサイズが「１０pt」で設定されているのに対し、オブジェクトＩＤ４１４の文字列オブジェクトのみが「９pt」で設定されているため、設定が誤っているおそれがあると判断したことを意味している。

　一方、フォント種類に関しては、全文字列オブジェクトについて属性値「○○明朝」が設定されている（１００％の設定割合である）ためフォント種類は前記判定条件を満たさない。これは、グループ３における全文字列オブジェクトのフォントが○○明朝で統一されているため、設定が誤っていないと判断されたことを意味している。

　以上のＳ３０４における処理の結果、誤り検知部１１３は、グループ３に含まれる文字列オブジェクトについては、フォントサイズの設定が誤っている文字列オブジェクトがあると考えられることを検出し、設定割合が６０％以上１００％未満の属性値「１０pt」を正しいと思われる設定、属性値頻度が１以上かつ設定割合が６０％未満の属性値「９pt」を誤っていると思われる設定としてワークエリアＷにその結果を保持する。なお、本実施例では、ビューの属性としてフォントとフォントサイズの設定誤りを検出しているが、設定されているすべてのビュー属性について誤り検知処理を実行してもよいし、一部のビュー属性について誤り検知するのみとしてもよい。

　以上の構成により、多数の文字列オブジェクトが含まれている文書Ｄについて、ビュー属性の設定に誤りがないかどうか簡単にチェックすることができる。

　次に、本実施例で表示装置１３０等に出力されるメッセージ画面例について説明する。図９Ａに、ワークエリアＷに保持された上記誤り検知部１１３の検出結果を基に、メッセージ通知部１１４によって生成された、ユーザーに通知する警告メッセージ画面９００の一例を示している。図９Ａの例では、警告メッセージ画面９００には、警告メッセージ表示部９０１、誤り内容情報を表示する誤り検知結果表示部９０２、９０３、修正ボタン９０４、及び無視ボタン９０５が設定されている。

　警告メッセージ表示部９０１は、設定が誤っているおそれがあるビューの属性と対応する文字列オブジェクトを示すメッセージを表示する。図９Ａの例では、設定が誤っている可能性があるビューの属性は「フォントサイズ」であり、設定が誤っているおそれがある文字列オブジェクトは、図８よりフォントサイズ９ptが設定されているオブジェクトＩＤ４１４（単価）であるため、警告メッセージ表示部９０１には「文字列オブジェクト（単価）のフォントサイズ設定が間違っている可能性があります。」と表示されている。

　誤り検知結果表示部９０２は、ビュー属性の設定が誤っている可能性のある文字列オブジェクトの現在の設定値を表示する。図９Ａの例では、誤っていると思われる属性値は、「９pt」であるため、誤り検知結果表示部９０２には「現在の設定値：９pt」のメッセージが表示されている。

　誤り検知結果表示部９０３は、ビュー属性の設定が正しいと判定された文字列オブジェクトの設定値を表示する。図９Ａの例では、正しいと判定された属性値は「１０pt」であるため、誤り検知結果表示部９０３には「正しいと思われる設定値：１０pt」のメッセージが表示されている。

　修正ボタン９０４は、誤り検知結果表示部９０２、９０３に表示されたメッセージに対応して、ユーザーがシステム側で正しいと判定されたビュー属性の設定値に現在の設定値を修正すると判断した場合に操作して、電子文書処理装置１００に修正許可情報を与えるためのボタンである。ユーザーが修正ボタン９０４を操作した場合、文書修正処理部１１５が、属性値頻度テーブル８００に記録されている、設定誤りと判定された文字列オブジェクトのオブジェクトＩＤ８０３（文字列オブジェクト特定情報）及び誤っていると判定された属性値８０１の設定内容（設定誤り情報）に基づいて、文書Ｄの対象文字列オブジェクトについて前記誤っていると判定された設定値を正しいと判定された設定値に修正する。ユーザーが無視ボタン９０５を操作した場合は、修正を行わずに警告メッセージ画面９００を閉じて処理を終了する。

　なお、本実施例では、誤り検知部１１３で検出された結果に対して、警告メッセージ画面９００を表示装置１３０等に出力するようにしているが、前記誤り検知結果に対してユーザーの変更が入らない限り以後警告メッセージ画面９００を出力しないようにする選択操作インタフェースを警告メッセージ画面９００に配置してもよい。

　本実施例では、誤り検知部１１３によって検出された結果を、メッセージ画面９００でユーザーに通知する構成としたが、メッセージ画面９００に加え、誤り検知結果のメッセージに対応する箇所を帳票４００上に示してもよい。図９Ｂに、図９Ａのメッセージ画面９００に対応する帳票４００上の該当箇所を示した画面構成例を示している。図９Ｂの例では、誤り検知部１１３によってビュー属性の設定が誤っている文字列オブジェクトがあると検出されたグループ３に関し、設定誤り検知対象範囲（オブジェクトＩＤ４０９～４１５）、前記対象範囲において設定が誤っていると検出された文字列オブジェクト４１４（単価）を太枠で囲んで表示している。なお、設定が誤っていると検出された文字列オブジェクト４１４（単価）をハイライトで示す等の他の強調形式により表示することもできる。

　以上説明した実施例１の構成によれば、ユーザーは文書Ｄに含まれている文字列オブジェクトにビュー属性設定上の誤りがないかを簡単にチェックすることができ、検出された誤りを自動的に修正させることができる。

［実施例２］
　次に、本発明を実施するための形態としての第２実施例（以下「実施例２」）について説明する。実施例１では、電子文書処理装置１００の処理対象となる文書Ｄにメタ情報が付与されている場合について説明した。しかし、実際には、メタ情報が付与されていない文書Ｄを対象として処理を実行する必要がある場合も多い。本実施例では、メタ情報が付与されていない文書Ｄを処理する場合の本発明の構成について説明する。図１０に、実施例２における電子文書処理装置１００の構成例を示している。実施例２の構成は実施例１の構成とほぼ同様であるが、実施例１の構成に文字列解析部１１６が追加されている点で異なる。以下、この構成上の差異点とそれに基づく作用効果の差異を中心に説明する。

　図１０において文字列解析部１１６は、実施例１のメタ情報に代えてグルーピング処理部１１２が文字列オブジェクトをグルーピングする際に利用することができる基準を提供するために、文書Ｄに含まれる文字列オブジェクトの文字列を解析する機能を有する。

　図１１に、実施例２による電子文書処理装置１００が実行するデータ処理手順の一例を示している。図１１に示しているデータ処理手順例は、図２に示した実施例１の電子文書処理装置１００によって実行されるデータ処理フローと同様であるが、実施例２における文書情報取得部１１１、文字列解析部１１６、及びグルーピング処理部１１２によって実行されるデータ処理ステップであるＳ１１０１、Ｓ１１０２、Ｓ１１０３の処理内容が図２の実施例１の場合と異なる。ここでは、簡単のために、実施例１と異なるＳ１１０１、Ｓ１１０２、Ｓ１１０３でのデータ処理内容について説明する。

　まず、Ｓ１１０１では、文書情報取得部１１１は、処理対象である文書Ｄに含まれる文字列オブジェクトを抽出し、文書Ｄに含まれる文字列オブジェクトに設定されている文字列、ビューの属性情報の設定、及び位置情報を取得する（Ｓ１１０１）。ここで「位置情報」（文字列オブジェクト配置情報）とは、各文字列オブジェクトについて、文書Ｄの表示画面の左上隅を原点として、画面下方に向かう座標軸上での縦位置（Ｙ）と、画面右方に向かう座標軸上の横位置（Ｘ）との組み合わせからなる座標上で、本実施例では各文字列オブジェクトが占める領域の左上頂点の位置を示すと規定している。文書情報取得部１１１は、この位置情報を取得してワークエリアＷに保持する。座標軸の単位としては、例えばミリメートル、ピクセルなどが採用されるが、これらには限られない。また、各文字列オブジェクトについての基準位置も適宜に定めればよい。

　次に、Ｓ１１０２において、文字列解析部１１６は、Ｓ１１０１で取得した各文字列オブジェクトに含まれる文字列に対し、その文字列を構成している文字の種類（以下「文字種別」）を解析し、その結果をワークエリアＷへ保持する。なお、ここでいう「文字種別」とは、全角日本語、半角日本語、数字、英語、記号などの文字列が分類される文字の種類を示す。また、文字種別だけではなく、電話番号形式、郵便番号形式、日付など文字列のフォーマットがどのような形式であるかを解析して取得してもよい。

　次に、グルーピング処理部１１２は、Ｓ１１０３において、Ｓ１１０１で取得した各文字列オブジェクトの位置情報と、Ｓ１１０２で解析した各文字列オブジェクトの文字種別とを用いてＳ１１０１で抽出した文字列オブジェクトについてのグルーピングを行い、その結果をワークエリアＷへ保持する。

　次に、本実施例においてグルーピング処理部１１２がＳ１１０３で実行するグルーピング処理について説明する。図１２に、本実施例のＳ１１０３で実行されるグルーピング処理部１１２のデータ処理フローの一例を詳細に示している。

　グルーピング処理部１１２は、図１２に示すＳ１２０２のデータ処理ステップを、Ｓ１２０１で取得されたすべての文字種別について反復して実行する（Ｓ１２０１～Ｓ１２０３）。

　Ｓ１２０２において、グルーピング処理部１１２は、図１１のＳ１１０１で取得した文字列オブジェクトに関し、同一の文字種別で構成されている文字列オブジェクトの集合について、縦位置（Ｙ）が一致している文字列オブジェクトの集合を、１つのグループとする。また同様に、横位置（Ｘ）が一致している文字列オブジェクトの集合を１つのグループとする（Ｓ１２０２）。文字列オブジェクトのグルーピング処理にこのような位置情報を指標として用いるのは、画面表示された文書Ｄ上で、縦方向あるいは横方向に位置を揃えて配置されている文字列オブジェクトは、そのビュー設定においても揃えられていることが多いと推測されることに基づいている。

　なお、本ステップでのデータ処理において、文字列オブジェクトの位置情報における縦位置（Ｙ）または横位置（Ｘ）が一致している文字列オブジェクトの集合を１つのグループとしているが、「縦位置（Ｙ）または横位置（Ｘ）が一致する」ことには、同じ縦位置（Ｙ）あるいは横位置（Ｘ）でグループ化された文字列オブジェクト集合の縦位置（Ｙ）あるいは横位置（Ｘ）を基準に、閾値μ以内の距離にあることを含めてもよい。

　また、縦位置（Ｙ）あるいは横位置（Ｘ）を基準にしてグルーピングされたグループに関して、隣接している文字列オブジェクト間の横位置（Ｘ）または縦位置（Ｙ）の距離が閾値μ以上離れている場合、その隣接している文字列オブジェクト間を境界としてグループを分けてもよい。

　また、本ステップでのデータ処理においては、文字種別と位置情報（縦位置（Ｙ）または横位置（Ｘ））とを用いて文書Ｄに含まれる文字列オブジェクトをグルーピングしているが、位置情報（縦位置（Ｙ）、横位置（Ｘ））のみを用いて、縦位置（Ｙ）または横位置（Ｘ）が一致する文字列オブジェクトの集合を１つのグループとしてもよい。

　次に、本実施例における文書情報取得処理（図１１のＳ１１０１）で得られるビュー属性情報テーブル６００について説明する。図１３に、文書情報取得部１１１によってワークエリアＷに生成され、保持されているビュー属性情報テーブル６００の一例を示している。

　実施例２のビュー属性情報テーブル６００の構成は基本的に図６に示した実施例１のテーブル６００の構成と同様であるが、各文字列オブジェクトの識別符号であるオブジェクトＩＤ（objectID）６０１に対して、文字列１３０１、文字種別１３０２、横位置１３０３、縦位置１３０４の各項目が設けられている点が異なる。文字列１３０１は、文書Ｄに含まれる各文字列オブジェクトからその文字列（テキスト）を抽出して記録している。文字種別１３０２は、文字列オブジェクトから抽出した文字列についてその文字列を構成する文字種別を解析した結果を記録する項目である。文字列の解析は、例えば各文字列を構成する文字を文字コード表（ＡＳＣＩＩコード表等）と対照することにより実行することができる。図１３の例では、オブジェクトＩＤ６０１が「４０３」で特定される文字列「○○会社」については、文字種別１３０２として「全角日本語」が、横位置１３０３として「３０（mm）」が、縦位置１３０４として「５０（mm）」が得られたことを示している。なお、図１３のビューの属性値であるフォント（font）６０２、フォントサイズ（font-size）６０３、スタイル（style）６０４、字揃え（align）６０５には、図６で示したのと同じ属性値が設定されているものとして記載を省略している。

　また、図１３の例で、オブジェクトＩＤ６０１が「４１９」で特定される文字列オブジェクトについては、文字列１３０１として「１１１１－１１１１」が記録されており、対応する文字種別１３０２には、この文字列が数字「１１１１」と記号「－（ハイフン）」から成り立っていることから「数字＋記号」が記録されている。なお、文字列オブジェクトの文字種別１３０２はより細分化して記録するようにしてもよい。例えばオブジェクトＩＤ６０１が「４１９」である文字列オブジェクトの文字種別１３０２は、「数字＋ハイフン」と記録するようにしてもよい。同様に、「〒」、「．」といった記号もそれぞれ例えば「郵便」、「ピリオド」といった文字種別として記録してもよい。

　図１４に、実施例２におけるグループテーブル７００の一例を示している。図１４のグループテーブル７００は、図１３のビュー属性情報テーブル６００として取得された各文字列オブジェクトに対し、グルーピング処理部１１２によってグルーピングされた結果を記録している。図１４のグループテーブル７００の構成は、図７に示した実施例１のグループテーブル７００の構成と同一であるが、図１２に例示したグルーピング処理によって作成されている点が異なる。例えば図１４のグループＩＤ７０１が「１５」で特定されるグループでは、このグループを構成している文字列オブジェクトに含まれる文字列が同じ文字種別「全角日本語」で構成されており、かつ縦位置（Ｙ）１３０４が同じ「１２０（mm）」であるため、ビューの属性設定を揃えるべき箇所としてオブジェクトＩＤ６０１が「４０９～４１５」で特定される文字列オブジェクトが１つのグループに分類されている。図４に例示するように、これらの文字列オブジェクトは文書Ｄ中の表組みの項目名を構成しており、同一のビュー設定を備えるべきとの推測がよく当てはまっている。

　以上説明したように、実施例２の電子文書処理装置１００によれば、メタ情報が設定されていない文字列オブジェクトからなる文書Ｄについて、ユーザーは文字列オブジェクトにビュー属性設定上の誤りがないかを簡単にチェックすることができ、検出された誤りを自動的に修正させることができる。

　以上のように、本発明によれば、電子文書の統一感あるビューを構成すべく画面上の文書の書式に自在に対応しつつビューの属性設定を検査することができる電子文書処理装置、電子文書処理方法、及びコンピュータ読み取り可能な記録媒体を提供することができる。

　なお、以上説明した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨を逸脱することなく、変更、改良することができると共に、本発明にはその等価物も含まれる。

Claims

　文字列を含むオブジェクトである文字列オブジェクトを複数含んでいる電子文書を表示させたときの、当該電子文書の視覚的外観であるビューを検査するための電子文書処理装置であって、
　前記電子文書を取り込み、当該電子文書に含まれている前記文字列オブジェクトのそれぞれに設定されている、当該電子文書の前記ビューを決定するための属性であるビュー属性と、各前記文字列オブジェクトの前記電子文書内における配置に関する情報である文字列オブジェクト配置情報とを取得する文書情報取得部と、
　取得した前記文字列オブジェクト配置情報を比較して前記文字列オブジェクト配置情報が相互に類似していると判定された複数の前記文字列オブジェクトを１のグループとして登録するグルーピング処理部と、
　各前記グループに属する前記文字列オブジェクトについて設定されている前記ビュー属性を相互に比較して、相対的に特異である前記ビュー属性が設定されている前記文字列オブジェクトがあるか判定し、特異な前記ビュー属性が設定されている前記文字列オブジェクトがあると判定した場合、当該文字列オブジェクトに設定されている前記ビュー属性が誤りである旨の情報を出力する誤り検知部と、
を備えている電子文書処理装置。
　請求項１に記載の電子文書処理装置であって、前記文字列オブジェクト配置情報は各前記文字列オブジェクトについて前記電子文書内での配置階層を示す配置階層情報であり、前記グルーピング処理部により実行される処理は、各前記文字列オブジェクトについて設定されている前記階層配置情報を比較し、前記階層配置情報が一致するか類似していると判定した場合に当該階層配置情報が一致するか類似している複数の前記文字列オブジェクトを１つのグループに分類して登録する処理である、電子文書処理装置。
　請求項１に記載の電子文書処理装置であって、前記文字列オブジェクト配置情報は各前記文字列オブジェクトに含まれる文字列を構成する文字の種別である文字種別と、各前記文字列オブジェクトが前記電子文書を表示させた画面上で配置される座標を示す位置情報とを含み、前記グルーピング処理部により実行される処理は、各前記文字列オブジェクトについて設定されている前記文字種別及び前記位置情報を比較し、前記文字種別が一致し、かつ前記位置情報が一致するか類似していると判定した場合に、当該位置情報が一致するか類似していると判定された複数の前記文字列オブジェクトを１つのグループに分類して登録する処理である、電子文書処理装置。
　請求項１に記載の電子文書処理装置であって、前記誤り検知部により実行される処理は、各前記グループに属する前記文字列オブジェクトに設定されている前記ビュー属性の属性値を取得して前記属性値毎の設定個数を表す属性値頻度を算出し、前記グループに含まれる前記文字列オブジェクトの数に対する特定の前記属性値頻度の割合があらかじめ設定した規定値以上であるか判定し、前記属性値頻度が当該グループに属するすべての前記文字列オブジェクトについて設定されておらず、かつ前記規定値以上であると判定した場合、前記判定された前記文字列オブジェクト以外の前記文字列オブジェクトについて前記特定のビュー属性について設定誤りがあると判定する処理を含む、電子文書処理装置。
　請求項１に記載の電子文書処理装置であって、前記誤り検知部が検知した前記文字列オブジェクトの前記ビュー設定における誤りの内容を含むメッセージ情報を生成して外部へ出力するメッセージ通知部を備えている、電子文書処理装置。
　請求項１に記載の電子文書処理装置であって、前記ビューの属性設定が誤っていると判定された前記文字列オブジェクトを特定する文字列オブジェクト特定情報と当該誤りの内容を示す情報である設定誤り情報とに基づいて、当該文字列オブジェクトに関する前記ビュー属性の設定誤りを修正する文書修正処理部を備える、電子文書処理装置。
　請求項５に記載の電子文書処理装置であって、前記メッセージ通知部は、前記特異な値が設定されていると判定された前記文字列オブジェクトについて、現在のビュー属性設定値、及び前記特異な値以外の属性が設定されている他の前記文字列オブジェクトにおけるビュー属性設定値を含む情報である誤り内容情報を生成して前記メッセージに含める、電子文書処理装置。
　請求項６に記載の電子文書処理装置であって、前記ビュー属性の設定誤りに対する修正許可情報を受け取った場合に当該文字列オブジェクトのビュー属性設定誤りを修正する、電子文書処理装置。
　文字列を含むオブジェクトである文字列オブジェクトを複数含んでいる電子文書を表示させたときの、当該電子文書の視覚的外観であるビューを検査するための電子文書処理方法であって、プロセッサ及びメモリを有するコンピュータに、
　前記電子文書を取り込み、当該電子文書に含まれている前記文字列オブジェクトのそれぞれに設定されている、当該電子文書の前記ビューを決定するための属性であるビュー属性と、各前記文字列オブジェクトの前記電子文書内における配置に関する情報である文字列オブジェクト配置情報とを取得するステップと、
　取得した前記文字列オブジェクト配置情報を比較して前記文字列オブジェクト配置情報が相互に類似していると判定された複数の前記文字列オブジェクトを１のグループとして登録するステップと、
　各前記グループに属する前記文字列オブジェクトについて設定されている前記ビュー属性を相互に比較して、相対的に特異である前記ビュー属性が設定されている前記文字列オブジェクトがあるか判定し、特異な前記ビュー属性が設定されている前記文字列オブジェクトがあると判定した場合、当該文字列オブジェクトに設定されている前記ビュー属性が誤りである旨の情報を出力するステップと、
を実行させる電子文書処理方法。
　請求項９に記載の電子文書処理方法であって、前記文字列オブジェクト配置情報は各前記文字列オブジェクトについて前記電子文書内での配置階層を示す配置階層情報であり、前記コンピュータに、前記グループを登録するステップとして、各前記文字列オブジェクトについて設定されている前記階層配置情報を比較し、前記階層配置情報が一致するか類似していると判定した場合に当該階層配置情報が一致するか類似している複数の前記文字列オブジェクトを１つのグループに分類して登録するステップを実行させる、電子文書処理方法。
　請求項９に記載の電子文書処理方法であって、前記文字列オブジェクト配置情報は各前記文字列オブジェクトに含まれる文字列を構成する文字の種別である文字種別と、各前記文字列オブジェクトが前記電子文書を表示させた画面上で配置される座標を示す位置情報とを含み、前記コンピュータに、前記グループを登録するステップとして、各前記文字列オブジェクトについて設定されている前記文字種別及び前記位置情報を比較し、前記文字種別が一致し、かつ前記位置情報が一致するか類似していると判定した場合に、当該位置情報が一致するか類似していると判定された複数の前記文字列オブジェクトを１つのグループに分類して登録するステップを実行させる、電子文書処理方法。
　請求項９に記載の電子文書処理方法であって、前記コンピュータに、各前記グループに属する前記文字列オブジェクトに設定されている前記ビュー属性の属性値を取得して前記属性値毎の設定個数を表す属性値頻度を算出し、前記グループに含まれる前記文字列オブジェクトの数に対する特定の前記属性値頻度の割合があらかじめ設定した規定値以上であるか判定し、前記属性値頻度が当該グループに属するすべての前記文字列オブジェクトについて設定されておらず、かつ前記規定値以上であると判定した場合、前記判定された前記文字列オブジェクト以外の前記文字列オブジェクトについて前記特定のビュー属性について設定誤りがあると判定するステップを実行させる、電子文書処理方法。
　請求項９に記載の電子文書処理方法であって、前記コンピュータに、検知された前記文字列オブジェクトの前記ビュー設定における誤りの内容を含むメッセージ情報を生成して外部へ出力するステップを実行させる、電子文書処理方法。
　請求項９に記載の電子文書処理方法であって、前記コンピュータに、前記ビューの属性設定が誤っていると判定された前記文字列オブジェクトを特定する文字列オブジェクト特定情報と当該誤りの内容を示す情報である設定誤り情報とに基づいて、当該文字列オブジェクトに関する前記ビュー属性の設定誤りを修正するステップを実行させる、電子文書処理方法。
　請求項１３に記載の電子文書処理方法であって、前記コンピュータに、前記特異な値が設定されていると判定された前記文字列オブジェクトについて、現在のビュー属性設定値、及び前記特異な値以外の属性が設定されている他の前記文字列オブジェクトにおけるビュー属性設定値を含む情報である誤り内容情報を生成して前記メッセージに含めるステップを実行させる、電子文書処理方法。
　請求項１４に記載の電子文書処理方法であって、前記コンピュータに、前記ビュー属性の設定誤りに対する修正許可情報を受け取った場合に当該文字列オブジェクトのビュー属性設定誤りを修正するステップを実行させる、電子文書処理方法。
　文字列を含むオブジェクトである文字列オブジェクトを複数含んでいる電子文書を表示させたときの、当該電子文書の視覚的外観であるビューを検査するために、プロセッサ及びメモリを有するコンピュータに、
　前記電子文書を取り込み、当該電子文書に含まれている前記文字列オブジェクトのそれぞれに設定されている、当該電子文書の前記ビューを決定するための属性であるビュー属性と、各前記文字列オブジェクトの前記電子文書内における配置に関する情報である文字列オブジェクト配置情報とを取得するステップと、
　取得した前記文字列オブジェクト配置情報を比較して前記文字列オブジェクト配置情報が相互に類似していると判定された複数の前記文字列オブジェクトを１のグループとして登録するステップと、
　各前記グループに属する前記文字列オブジェクトについて設定されている前記ビュー属性を相互に比較して、相対的に特異である前記ビュー属性が設定されている前記文字列オブジェクトがあるか判定し、特異な前記ビュー属性が設定されている前記文字列オブジェクトがあると判定した場合、当該文字列オブジェクトに設定されている前記ビュー属性が誤りである旨の情報を出力するステップと、
を実行させるコンピュータプログラムを格納するコンピュータ読み取り可能な記録媒体。
　請求項１７に記載のコンピュータ読み取り可能な記録媒体であって、前記文字列オブジェクト配置情報は各前記文字列オブジェクトについて前記電子文書内での配置階層を示す配置階層情報であり、前記コンピュータプログラムは、前記コンピュータに、前記グループを登録するステップとして、各前記文字列オブジェクトについて設定されている前記階層配置情報を比較し、前記階層配置情報が一致するか類似していると判定した場合に当該階層配置情報が一致するか類似している複数の前記文字列オブジェクトを１つのグループに分類して登録するステップを実行させる、コンピュータ読み取り可能な記録媒体。
　請求項１７に記載のコンピュータ読み取り可能な記録媒体であって、前記文字列オブジェクト配置情報は各前記文字列オブジェクトに含まれる文字列を構成する文字の種別である文字種別と、各前記文字列オブジェクトが前記電子文書を表示させた画面上で配置される座標を示す位置情報とを含み、前記コンピュータプログラムは、前記コンピュータに、前記グループを登録するステップとして、各前記文字列オブジェクトについて設定されている前記文字種別及び前記位置情報を比較し、前記文字種別が一致し、かつ前記位置情報が一致するか類似していると判定した場合に、当該位置情報が一致するか類似していると判定された複数の前記文字列オブジェクトを１つのグループに分類して登録するステップを実行させる、コンピュータ読み取り可能な記録媒体。
　請求項１７に記載のコンピュータ読み取り可能な記録媒体であって、前記コンピュータプログラムは、前記コンピュータに、検知された前記文字列オブジェクトの前記ビュー設定における誤りの内容を含むメッセージ情報を生成して外部へ出力するステップを実行させる、コンピュータ読み取り可能な記録媒体。