JP4868224B2

JP4868224B2 - 追記情報処理方法、追記情報処理装置、およびプログラム

Info

Publication number: JP4868224B2
Application number: JP2006169546A
Authority: JP
Inventors: 照花斎藤
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2006-06-20
Filing date: 2006-06-20
Publication date: 2012-02-01
Anticipated expiration: 2026-06-20
Also published as: JP2008003647A

Description

本発明は、追記情報処理方法、追記情報処理装置、およびプログラムに関する。より詳細には、文書に追加記入された付加情報（追記情報やアノテーションとも称する）を、文書本体から分離し、文書本体と関わりを持つ様々な情報処理に利用する仕組みに関する。

情報処理技術の進歩の著しい今日、文書に関する様々な処理を自動処理する仕組みがある。たとえば、予め所定の情報が記載されている文書原本にさらに別の付加情報を追記し、その付加情報の追記された追記済文書を処理対象として、追記された付加情報に基づいて所定のデータ処理を自動的に実行する仕組みがある。

たとえば、定型伝票（いわゆる帳票）に手書きで情報を記入して、その記入された情報を処理対象とする自動帳票処理の仕組み（たとえば特許文献１，２を参照）や、日付や予定記入欄が用意された主に手帳やメモなどに手書きで予定を記入し、その記入された予定を電子データ化する個人情報管理（特にスケジュール管理ともいう）の仕組み（特許文献３を参照）もある。

また、学校や学習塾などの教育現場においては、生徒や受験者による解答が記入された答案用紙に採点官が採点した結果の用紙（教育用教材）を処理対象として、自動採点集計処理を行なう仕組みも考えられている（特許文献４を参照）。

特開平５−３４２２３９号公報特開平６−２７４１５６号公報特開平５−２１６９３２号公報特開平１１−３１０４６号公報

たとえば、特許文献１には、表の種別および表中の各データの行方向の位置並びに列方向の位置を指定するための識別マークを付与して表データを識別マーク付きデータ表帳票として印刷するようにし、データ表帳票に付されている認識マークをマーク読取手段によって読み取らせることで、識別データから帳票を特定して該当する表データを表示手段に表示するようにし、かつ該当する箇所を修正可能な状態に表示することで、少ない作業量で効率よくデータ修正および照合を行なうことができるようにした仕組みが提案されている。

また、特許文献２には、出力原稿をイメージデータに変換し、変換されたイメージデータを表示し、表示されたイメージ上にフォーム規定位置座標を指示し、指示されたフォーム規定位置座標に基づいてフォーム図形データを導出し、導出されたフォーム図形データに基づいてフォームを表示部に表示されているイメージデータに重ね合わせ表示する構成とすることで、所望の出力原稿に対するフォームを容易に作成できるようにした仕組みが提案されている。

また、特許文献３には、個人情報管理用の仕組みとして、書き込みの施された手帳などの紙面をスキャナより入力し、既知の方法により文字や枠線を検出し、検出した文字や枠線の配置を予め記憶された手帳の書式の知識と照合し、各記載項目の属性を表すデータを生成する仕組みが提案されている。

手帳やメモなどに手書きで記入した情報（本例では手帳に手書きで入力した予定の記載内容）が自動的に電子データに変換され、各記載項目を生成された属性に対応付けて切り換えてデータベースに登録することができるので、利用者がある書式の出力を要求した場合には、予め記憶された出力の書式を参照することにより、データベースの内容を紙上の各内容に対応した場所に印刷するなどができ便利である。

また、特許文献４には、答案用紙の手書き記入欄をタブレット上の入力域として定義するととともに、集計対象の入力域を識別可能に定義する書式データを記憶装置に記憶しておき、タブレットに答案用紙が重ね合せられた状態で、手書き記入欄に記入された情報をタブレットの入力域に入力された筆記データとして取り込んで文字認識することにより、採点などの記入作業を行なった後のキー入力などによるデータ入力を省力化する仕組みが提案されている。

ここで、帳票やその他の文書に追記された付加情報に基づいて所定のデータ処理を効率的に実行するには、自動データ処理に供される付加情報と、その付加情報に関するデータ処理内容と関わりを持つ属性情報との対応を取っておくことが重要である。このためには、付加情報の記入位置および記入目的に応じたデータ処理を実行するべく、付加情報が何れの目的の記入位置に追記されたのかを特定することができるように、記入欄の位置情報を特定することが考えられる。

たとえば、教育用教材についての自動採点処理を例にすると、教育用教材上における解答欄の位置と、その解答欄に記入された解答に対する採点記号や採点に関するコメントなどの採点官が記入した追記情報の記入位置との対応を明確にする必要がある。

採点記号の記入は、教師などの採点官によって手書きでされるため、各解答欄に対する記入位置が必ずしも一義的に定まっている訳ではないのに対し、採点記号の採点集計は、各解答欄に対応する採点記号の記入内容（正解か不正解か）を明確にした上で、その採点記号の内容と各解答欄についての採点集計に関する属性情報（典型的には配点情報）とに基づいて行なわれるため、解答欄の位置と採点記号の記入位置との対応が明確でないと、各解答に対する正誤や配点などが正しく認識できずに、結果として採点集計が適切に実行することができない虞れが生ずるからである。

たとえば、「○」や「×」などの採点記号のパターン認識については、その採点記号が何れの解答欄に対してのものであるのかを判断して行なう必要があるために、採点記号の記入位置が解答欄からズレて記入されていたとき、如何様にして両者を対応付けるかが問題となる。

同様のことは、自動伝票処理においても言える。たとえば、１件ごとに、勘定科目や摘要や金額を対応付けて記入されるのが前提であるところ、本来の記入位置とズレることで、隣接する別件の記入欄のデータとの区別を如何様に行なうかが問題となる。

また、手帳を処理対象とした自動スケジューリング処理においては、日付ごとに用意されている記入欄に予定を書き込むことが前提であるところ、本来の記入位置とズレることで、隣接する別日付の記入欄の予定との区別を如何様に行なうかが問題となる。

しかしながら前述の特許文献１〜４に記載の仕組みでは、何れも、記入欄と追記情報の位置の対応を採る点については、考慮が不十分である。たとえば、特許文献１に記載の仕組みでは、データ修正や照合のために本体内の表データ記憶装置からデータ表帳票を読み出す際には埋め込んでおいた識別データを参照できるので表データの照合や修正を効率的に実行でき得るものの、記入欄と追記情報の位置の対応を如何様に取るかについては開示がない。

また、特許文献２に記載の仕組みでは、出力原稿を読み取ってイメージデータに変換し、変換されたイメージデータを表示してイメージ上にフォーム規定位置座標を指示してフォームを作成するので、記入位置の指定は容易になり得るが、表示されたイメージ上でフォーム規定位置座標を指示する作業が必要になるので、文書ごとのデータ処理時に必ずこの作業を必要とする難点がある。

また、特許文献３に記載の仕組みでは、手帳に手書きで入力した予定の記載内容を読み取った画像情報について既知の方法により文字や枠線を検出し、検出した文字や枠線の配置を予め記憶された手帳の書式と照合して自動的に電子データに変換するので、手帳の書式を事前に所定の記憶手段に記憶しておかなければならないが、如何様にして記憶させるかについては開示がない。また、記入欄と追記情報の位置の対応を如何様に取るかについては開示がない。

また、特許文献４に記載の仕組みでは、タブレット上で記入欄の位置を定義しておき、タブレット上に答案用紙が重ね合せられた状態で、手作業により、手書き記入欄に記入された情報をタブレットの入力域に入力された筆記データとして取り込んで文字認識するので、追記情報の記入位置にズレがあっても位置修正が可能で、記入欄と追記情報の位置の対応を採ることが比較的容易に可能であるが、事前に、タブレット上での記入欄の位置を定義しておく作業が必要になる。加えて、タブレットという特殊な装置が必要であり、汎用性に乏しいという難点もある。

本発明は、上記事情に鑑みてなされたものであり、自動データ処理に供される追記情報と、その追記情報に関するデータ処理内容と関わりを持つ属性情報との対応を簡易に取ることのできる仕組みを提供することを目的とする。

本発明に係る仕組みにおいては、追記済文書中の注目する付加情報の近傍に存在する文字列を文字認識し、この文字認識により得られる認識文字列に基づいて、注目する付加情報に対応する属性情報の順番付けを特定するようにした。そして、注目する付加情報の順番付けを、特定した属性情報の順番付けと対応させながらデータ処理を行なうのである。

注目する付加情報とこれに関連する属性情報とを対応付ける際に、文書上のそれぞれの絶対的な記入位置を特定することなく、専ら、両者の相対的な位置関係、つまり注目する付加情報近傍の文字情報についての文字認識結果に基づいて両者を対応付けるのである。

なお、本発明に係る仕組みは、電子計算機（コンピュータ）を用いてソフトウェアで実現することもでき、このためのプログラムやこのプログラムを格納した記録媒体を発明として抽出することも可能である。プログラムは、コンピュータ読取り可能な記憶媒体に格納されて提供されてもよいし、有線あるいは無線による通信手段を介した配信により提供されてもよい。

本発明によれば、注目する付加情報近傍の文字情報についての文字認識結果に基づいて、注目する付加情報とこれに関連する属性情報とを対応付けるようにしたので、記入欄についての位置情報のデータベースへの登録や、処理対象文書上におけるそれぞれの記入位置の座標解析などの煩雑な処理を不要とすることができ、自動データ処理に供される追記情報と、その追記情報に関するデータ処理内容と関わりを持つ属性情報との対応を簡易に取ることができる。

以下、図面を参照して本発明の実施形態について詳細に説明する。

＜処理対象文書の例＞
図１〜図３は、本発明に係る追記情報処理装置を備えてなる情報処理システムにおいて処理対象とする文書の一例を示す図である。何れも、文書原本８Ａを（Ａ）に、追記済文書８Ｂを（Ｂ）に示す。また、データベースへの登録情報の一例を（Ｃ）に示す。

先ず図１に示す第１例の文書は、特許文献１，２に記載の仕組みと同様に、自動帳票処理に供される定型伝票（いわゆる帳票）であって、図１（Ａ）はその文書原本８Ａを示し、図１（Ｂ）は、追記情報が記入された状態（追記済文書８Ｂ）を模式的に示している。

帳票７０は、自動帳票処理時の処理対象データを記入する勘定科目や摘要欄や金額欄などの記入欄７４と、帳票７０を識別特定するための情報を記入する識別情報欄７５と承認欄７６とを有している。

たとえば、伝票処理現場では、図１（Ａ）に示した文書原本８Ａの一例である帳票７０を処理対象として、勘定科目や摘要欄や金額欄などの記入欄７４に、所要の処理データ７７を追記していく。この際には、通常、帳票７０で使用されている文字画像色と、処理データ７７の記入に使用するペン色とは、異なるものが使用される。

なお、処理データ７７を対象とした自動帳票処理を実行するための帳票７０（原本画像）のデータベースへの登録に当たっては、通常であれば、処理データ７７についてのデータ処理時に必要となる記入欄７４の位置情報や項目などを示す記入順序対応付け情報３７を登録しておく。なお、帳票７０における文字部分（たとえば勘定科目、摘要、金額などの項目部分）をテキスト情報として参照され得るように、帳票７０そのものの情報は、テキストデータもしくはテキストデータ相応の文書ファイルデータで保存しておくことが好ましい。

たとえば、図１（Ｃ）に示すように、記入順序対応付け情報３７の一例である帳票欄位置領域情報を、帳票７０上に存在する勘定科目や摘要や金額などの項目と、各項目を記入する記入欄７４として扱われる領域の所定点（たとえば左上頂点）のｘｙ座標、並びに、その外接矩形の幅（Ｗ）および高さ（ｈ）とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。

なお、本実施形態では、記入欄７４の位置情報をデータベースに登録しておくことを必須としない。一方、記入済帳票７１を処理対象とする場合に、記入欄７４における記載位置に対応して個別のデータ処理（特殊処理）を必要とする場合には、記入欄７４の順序情報（番号）に対応付けて、第２の属性情報として個別の特殊処理内容をデータベースに登録しておくことができる。

記入済帳票７１に対応する元の帳票７０が文書管理サーバに登録されていないときには、無記入の帳票７０を文書入力装置で読み取り、記入欄７４の位置や項目などを特定することにより対処する。

また、図２に示す第２例の文書は、教育現場で紙媒体として使用される教育用教材８０であって、典型例として、問題文８２およびその解答欄８４（本例では括弧で示された部分）を有したものであり、図２（Ａ）はその文書原本８Ａを示し、図２（Ｂ）は、追記情報記入済の状態（追記済文書８Ｂ）を模式的に示している。

このような教育用教材８０は、具体的には教育機関で用いられるペーパーテストや練習問題シートなどが該当する。なお、教育用教材８０は、少なくとも解答欄８４を有していればよく、たとえば採点官が読み上げた問題について解答欄８４に解答を記入する場合などがあり、問題文８２については必ずしも記載されていなくともよい。

また、図２（Ａ）に示すように、教育用教材８０は、問題文８２および第１種の付加情報の一例である解答が記入される解答欄８４の他に、配点欄８３（問題別の項目点欄８３ａや部分点欄や合計点欄でなる集計欄８３ｂ）と、第１種の付加情報の一例である教育用教材８０を識別特定するための情報を記入する識別情報欄８５と、第１種の付加情報の一例である解答者情報であって解答欄８４への解答記入者に関する情報を記入する解答者情報欄８６とを有している。解答欄８４、識別情報欄８５、解答者情報欄８６は、何れも第１種の付加情報を記入する記入欄の一例である。

識別情報欄８５には、たとえば教育用教材８０の科目、タイトル、あるいは適用学年などが予め記載されるものとする。ただし、これらの記載に加えて、またはこれらの記載とは別に、教育用教材８０を識別するためのコード情報が埋め込まれていてもよい。

コード情報の埋込みは、公知技術を利用して実現すればよいが、その一つの具体例として、たとえば「ｉＴｏｎｅ（登録商標）」と呼ばれるもののように、階調表現としての万線スクリーンまたはドットスクリーンを構成する画素の形態（位置、形状など）を変化させることで、ハーフトーン画像の中にデジタル情報を埋め込むようにする、といった技術を用いることが考えられる。一方、解答者情報欄８６には、解答記入者の学級８６ａ、出席番号８６ｂ、あるいは氏名８６ｃなどが記入され得るようになっている。

配点欄８３（特に項目点欄８３ａ）には、各解答欄８４についての配点情報が記入される。配点情報とは、教育用教材８０における各解答欄８４について、各位置の解答欄８４への配点が何点であるかを特定するための情報である。なお、配点は、解答欄８４ごとに異なっていてもよいし、あるいは一律であってもよい。

このような教育用教材８０は、対応する原本（教材原本）の電子データに基づき印刷装置で印刷出力することで得ることができる。教材原本の電子データは、たとえばパーソナルコンピュータなどの電子計算装置を利用してワープロソフトなどのアプリケーションソフトウェアを用いて生成することができ、予め所定のデータベースなどに保存される。

なお、教材原本の電子データは、その教育用教材８０における解答欄８４や識別情報欄８５などのレイアウトを特定し得るものであり、かつ、所定のデータベースにて保持蓄積可能なものであれば、そのデータ形式を問わない。たとえば、文書作成ソフトウェアで作成したアプリケーション文書データに限らず、画像データであってもよい。

教育現場では、図２（Ａ）に示した文書原本８Ａの一例である教育用教材８０が生徒や受験者などに配布され、先ず、生徒などによって解答者情報欄８６への氏名や解答欄８４への解答などの第１種の付加情報が所定欄に記入された後に回収される。この後さらに、図２（Ｂ）に示す追記済文書８Ｂの一例である付加情報記入済教材８１のように、教師などの採点官によって各解答欄８４に記入された解答に対する採点記号（正誤判定図形）８７や採点記号８７と関連するその他の図形や文章で示されたコメント８８などの第２種の付加情報が記入される。なお、追記情報処理装置１０で自動採点処理を行なうので、この時点では、採点官による配点欄８３Ｃへの記入はない。

この際には、通常、生徒などによる第１種の付加情報の記入に使用されるペン色と、採点官などによる第２種の付加情報の記入に使用されるペン色とは、異なるものが使用されるし、教育用教材８０として予め記入されている色とも異なるものが使用される。

また、採点記号８７としては、たとえば、正解を示す「○」やその他の図形（たとえば楕円図形）、不正解を示す「×」やその他の図形（たとえば「レ点」などのチェックマーク）、あるいは一部正解を示す「△」やその他の図形がある。

コメント８８は、採点記号８７を元にした第１のデータ処理には直接的な関係を有しない情報であるが、第１のデータ処理の結果をサポート（補強）するあるいは全く関係のない第２のデータ処理に利用されるものである。

教材自動採点システムでは、この追記済文書８Ｂの一例である付加情報記入済教材８１を対象として所定のデータ処理を行なうことになる。この際、第２種の付加情報（本例では採点記号８７とコメント８８）の別に、それぞれに応じた個別のデータ処理を行なうようにする。この例では、第１のデータ処理として採点記号８７を元にした自動採点処理を行なう。この自動採点処理結果として、たとえば、配点欄８３Ｃへ記入する得点情報が取得されることになる。また、コメント８８の追記内容を元にした自動採点処理結果とは別の第２のデータ処理を行なう。

自動採点処理とは別の第２のデータ処理としては、たとえば、コメント８８の追記内容を所定の条件に基づいて分類する処理や、分類したコメント（全ての追記内容には限らず一部の追記内容でもよい）を対応する解答欄８４についての採点処理結果と関連付けて生徒指導用データベースに登録・蓄積しておく処理などを行なう。

こうすることで、自動採点処理とは別の第２のデータ処理の利用形態としては、生徒指導用データベースから情報を取り出して、後の生徒指導に利用することができるようになる。たとえば、全ての採点結果と対応するコメントを表示するようにすれば、優秀、優、並、劣、などの評価の細分類と合わせて採点結果を確認することができる。また、結果が不正解のコメントのみを表示するようにすれば、問題の読み間違えが多い、解答の書き間違えが多い、あるいは計算ミスが多いなどの生徒の能力分析に利用することもできる。あるいは、コメント８８で示されている注意文やミス修正に基づき生徒指導に利用することも考えられる。

なお、採点記号８７やコメント８８を対象としたデータ処理を実行するための教育用教材８０（原本画像）のデータベースへの登録に当たっては、通常であれば、採点記号８７についてのデータ処理時に必要となる解答欄８４の位置情報や問題番号や配点情報などを示す記入順序対応付け情報３７と、コメント８８についてのデータ処理時に必要となる分類基準情報とを登録しておく。なお、教育用教材８０における文字部分（たとえば問題番号を含む問題文や配点）をテキスト情報として参照され得るように、教育用教材８０そのものの情報は、テキストデータもしくはテキストデータ相応の文書ファイルデータで保存しておくことが好ましい。

たとえば、図２（Ｃ）に示すように、記入順序対応付け情報３７の一例である解答欄位置領域情報を、教育用教材８０上に存在する問題の番号（第１の属性情報の一例）と、その問題の解答に対する配点（第２の属性情報の一例）と、その問題の解答を記入する解答欄８４として扱われる領域の所定点（たとえば左上頂点）のｘｙ座標、並びに、その外接矩形の幅（Ｗ）および高さ（ｈ）とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。

なお、本実施形態では、解答欄８４の位置情報をデータベースに登録しておくことを必須としない。一方、付加情報記入済教材８１を処理対象とする場合に特有の情報として、各解答欄８４における記載位置に対応した配点付けと言った特殊な処理を必要とするので、解答欄８４の順序情報（番号）つまり問題番号に対応付けて、第２の属性情報として配点付けの内容をデータベースに登録しておく。

付加情報記入済教材８１に対応する元の教育用教材８０が文書管理サーバに登録されていないときには、無記入の教育用教材８０を文書入力装置で読み取り、問題文の位置や解答欄８４の位置や配点などを特定することにより対処する。

また、図３に示す第３例の文書は、ビジネスマンなどが使用するビジネス文書であって、典型例として、スケジュール管理用の手帳９０を示している。一般的な手帳９０では、日付（年月日）欄９２と、各日付における予定９７を記入する予定欄９４を有しており、図３（Ａ）はその文書原本８Ａを示し、図３（Ｂ）は、追記情報記入済の状態（追記済文書８Ｂ）を模式的に示している。なお、図３（Ａ）では、予定９７を記入するための予定欄９４が日付単位で区分けされた例で示しているが、さらに、各日付内の時間（時刻）単位で区分けしたものもある。予定欄９４は第１種の付加情報を記入する記入欄の一例であり、この予定欄９４には、たとえば、該当日時に実行すべき予定９７が記入され得るようになっている。

このような手帳９０は、市場で購入することができるし、あるいは対応する原本（手帳原本）の電子データに基づき印刷装置で印刷出力することで得ることもできる。手帳原本の電子データは、たとえばパーソナルコンピュータなどの電子計算装置を利用してワープロソフトなどのアプリケーションソフトウェアを用いて生成することができ、予め所定のデータベースなどに保存される。

なお、手帳原本の電子データは、その手帳９０における日付欄９２や予定欄９４などのレイアウトを特定し得るものであり、かつ、所定のデータベースにて保持蓄積可能なものであれば、そのデータ形式を問わない。たとえば、文書作成ソフトウェアで作成したアプリケーション文書データに限らず、画像データであってもよい。

ビジネス現場では、図３（Ａ）に示した文書原本８Ａの一例である手帳９０を身近におき、先ず、所有者によって予定欄９４への予定９７（第１種の付加情報）が該当日時の予定欄９４に記入される。このとき、さらに、図３（Ｂ）に示す追記済文書８Ｂの一例である付加情報記入済手帳９１のように、所有者自らによって各予定欄９４に記入された予定９７に対する分類記号９９（たとえば社用と私用の区別をするもの）や予定９７と関連するその他の図形や文章で示されたコメント９８などの第２種の付加情報が記入される。

この際には、通常、手帳９０で使用されている文字色と、予定９７やコメント９８の記入に使用するペン色とは、異なるものが使用される。

分類記号９９としては、たとえば、私用（Private use ）を示す「Ｐ」やその他の文字・図形（たとえば◇マークなど）がある。私用にのみ分類記号９９を付すことで、社用（Business use）については、特に分類記号９９を付さなくてもよい。

また、コメント９８は、予定９７を元にした第１のデータ処理には直接的な関係を有しない情報であるが、第１のデータ処理の結果をサポート（補強）するあるいは全く関係のない第２のデータ処理に利用されるものである。

分類記号９９を含むコメント９８は、一般的なビジネス文書における追記内容（付加情報記入済手帳９１の例では予定９７に相当）に対しての校正記号としての意味を持ち、このコメント９８を利用することで、予定９７を所定の条件に基づいて編集することができるようになる。

たとえば、個人情報管理システムでは、この追記済文書８Ｂの一例である付加情報記入済手帳９１を対象として所定のデータ処理を行なうことになる。この際、第２種の付加情報（本例ではコメント９８に基づく予定９７の種類）の別に、それぞれに応じた個別のデータ処理を行なうようにする。この例では、第１のデータ処理とし予定９７の内容を元にした自動スケジュール管理処理（予定９７の電子データ化）を行ない、またコメント９８の追記内容を元にした自動スケジュール管理処理そのものとは別の第２のデータ処理を行なう。

自動スケジュール管理処理そのものとは別の第２のデータ処理としては、たとえば、コメント９８（分類記号９９を含む）の追記内容に従って、第１のデータ処理としての自動スケジュール管理処理結果を社用と私用とに分類する処理や、分類した予定９７（全ての追記内容には限らず一部の追記内容でもよい）を対応する日付と関連付けてデータベースに個別に登録・蓄積しておく処理などを行なう。

こうすることで、社用スケジュールと私用スケジュールをと切り分けてデータベース上で管理することができるようになる。それぞれのデータベースの公開と非公開とを個別に設定することができるようになるので使い勝手がよくなる。

特開平５−２１６９３２号公報に記載の仕組みでは、予定欄９４に記入された内容の全てについて単一の処理がなされ、この例では、仕事の予定もプライベートの予定も、全て区別無く１つのデータベースとして登録されることになる。このため、たとえば、仕事のスケジュールを公開・共有しようとしたときには、公開したくないプライベートの予定までもが公開されてしまう不都合が生じるのと大きく異なる。

なお、予定９７やコメント９８を対象としたデータ処理を実行するための手帳９０（原本画像）のデータベースへの登録に当たっては、通常であれば、予定９７やコメント９８についてのデータ処理時に必要となる予定欄９４の位置情報などを示す記入順序対応付け情報３７と、コメント９８についてのデータ処理時に必要となる分類基準情報とを登録しておく。なお、手帳９０における文字部分（たとえば日付）をテキスト情報として参照され得るように、手帳９０そのものの情報は、テキストデータもしくはテキストデータ相応の文書ファイルデータで保存しておくことが好ましい。

たとえば、図３（Ｃ）に示すように、記入順序対応付け情報３７の一例である予定欄位置領域情報を、手帳９０上に存在する日付（年月日）と、各日付内の時間（時刻）と、予定９７を記入する予定欄９４として扱われる領域の所定点（たとえば左上頂点）のｘｙ座標、並びに、その外接矩形の幅（Ｗ）および高さ（ｈ）とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。

ただし、本実施形態では、予定欄９４の位置情報をデータベースに登録しておくことを必須としない。一方、付加情報記入済手帳９１を処理対象とする場合に、予定欄９４における記載位置に対応して個別のデータ処理（特殊処理）を必要とする場合には、予定欄９４の順序情報（本例では日付）に対応付けて、第２の属性情報として個別の特殊処理内容をデータベースに登録しておくことができる。

付加情報記入済手帳９１に対応する元の手帳９０が文書管理サーバに登録されていないときには、無記入の手帳９０を文書入力装置で読み取り、日付欄９２や予定欄９４の位置を特定することにより対処する。

なお、追記情報について自動データ処理を実行する際に、追記情報を複数種類のものに分類し、それぞれの分類ごとに個別のデータ処理を実行しようとする場合には、各追記情報を他方のものと分離して認識・特定することが必要となる。両者の分離認識が適正になされないと、それぞれのデータ処理を適正に実行することができなくなる。

たとえば、図２に示した付加情報記入済教材８１の場合には、採点記号８７に基づく自動採点処理と、コメント８８に基づく生徒指導用データベースの構築処理があり、このような個別処理を実現するには、採点記号８７とコメント８８とを区別して認識処理などを行なってから最終的なデータ処理を行なう必要がある。

一方、答案の採点においては、採点記号８７以外のコメント８８を、採点記号８７と同じペンで記載することがあり、たとえば差分抽出部１３２での抽出結果に対する色成分認識処理を通じて、ペン色と対応する所定色成分についてのものを抽出するだけでは、両者を適切に分離した認識と記載内容の特定ができない。採点記号８７とコメント８８とを適切に分離できず、自動採点処理に悪影響を及ぼす。また、追記情報としては、自動採点処理用の採点記号８７の他に、生徒指導などにも利用し得るコメント８８が存在するにも関わらず、付加情報記入済教材８１を生徒に返却した後には、生徒がその記載内容を確認する以外には活用できない事態となる。

また、図３に示した付加情報記入済手帳９１の場合には、予定９７に基づく自動スケジュール管理処理（予定９７の電子データ化）と、コメント９８（分類記号９９を含む）に基づく社用スケジュールと私用スケジュールの個別データベース構築処理があり、このような個別処理を実現するには、予定欄９４に記入された予定９７とコメント９８とを区別して抽出し、認識処理などを行なってから最終的なデータ処理を行なう必要がある。

一方、記入されたスケジュールの電子データ化とデータベースへの登録においては、予定９７以外のコメント９８を予定９７と同じペンで記載することがあるし、また、各予定９７を記入する時点が異なることも起こり得る、つまり、予定９７の記入に使用されるペン色は様々であり、かつ予定９７とコメント９８とを切り分けて別のペン色が使用されるとは限らない。この場合、たとえば差分抽出部１３２での抽出結果に対する色成分認識処理を通じて、ペン色と対応する所定色成分についてのものを抽出するだけでは、両者を適切に分離した抽出ができない。

このような事態を避けるには、たとえば、追記済文書８Ｂ中に存在する複数の付加情報を、記載位置、画像特徴量、あるいは認識処理時の信頼度などの付加情報が持つ様々な特徴に基づいて、複数の種類に分類（分離）するようにするのがよい。この際、付加情報が持つ単一の特徴に基づくだけでなく複数の特徴を参照することで、より正確な分離認識を行なうようにするのがよい。なお、これらについては詳細な説明を割愛する。

＜＜文書原本情報と追記情報の対応付け処理＞＞
図４〜図８は、文書原本８Ａの情報と追記情報とを対応付ける処理を説明する図である。ここで、図４および図５は、比較対象としての従来の文書原本情報登録処理を説明する図である。

文書に追記された付加情報について自動データ処理を効率的に実行するには、各追記情報がどのようなデータ処理に供されるものであるかを特定することが重要であり、このためには、従来は、文書原本だけでなく、記入欄の位置情報をデータベースに登録している。また、場合によって、位置情報だけでなく、どのような目的で追記されたものであるかを特定することも必要となり、この場合には、記入欄に対応するその他の属性情報などの自動処理用情報をデータベースに登録しておく。

そして、追記情報に基づく自動データ処理時には、文書上の各記入欄の位置情報を取得し、この位置情報と追記情報とを対応付けてデータ処理を実行することになる。

＜従来方法＞
たとえば、図４は、富士通(株)による帳票管理用のＯＣＲソフト「ＤｙｎａＥｙｅＶ４．０」における例を示す（たとえばユーザーズガイドのp8，p57 など参照）。図４に示すように、従来の文書原本作成登録処理においては、先ず文書原本８Ａを作成し、この文書原本８Ａにおけるデータ処理対象の追記情報を記入するための記入欄の位置の情報や記入項目などの属性情報を設定し、これらの情報を文書原本８Ａの電子データ（文書ファイルや画像データなどの原本画像）と対応付けて帳票情報データベースに登録する。

たとえば、付加情報記入済教材８１をデータ処理対象とする教材自動採点システムにおいては、出題者（教師など）はワードプロセッサなどを利用して文書原本８Ａとして問題用紙を作成する。

このとき、各問題文には問題番号を割り付け、その問題文に対する解答の記入欄（解答欄８４）や解答に対する配点を割り付ける問題別の項目点欄８３ａや部分点欄や合計点欄でなる集計欄８３ｂなどの配点欄８３を設定する。

自動採点処理時には、各採点記号８７が何れの解答欄８４に対するものであるかを特定し、またその採点記号８７に応じて配点を加算処理することで得点を集計するので、これらの対応付けのために、各解答欄８４の領域情報（教育用教材８０Ａ上の位置情報）と問題番号との対応をとってデータベースに登録しておくことが必要になる。

また、複数種類の文書原本８Ａに対応するには、各文書原本８Ａに対して識別情報を付与しておくことが必要になる。たとえば、教材自動採点システムにおいては、付加情報記入済教材８１（答案）の通し番号（答案特定コード）を識別情報として設定する。その他の一般的な帳票であれば帳票特定コードを設定する。

そして、追記情報処理装置における自動採点処理や自動帳票処理などの自動データ処理時には、文書原本８Ａに対して所定の付加情報が追記された追記済文書８Ｂの電子データを取得し、その追記済文書８Ｂに対応する文書原本８Ａを特定し追記済文書８Ｂとの差分を取って追記情報を抽出する。そして、この抽出した追記情報がどのような記入欄に追記されていたのかを特定しつつ、各追記情報に基づいて所要のデータ処理を実行する。

たとえば、自動採点処理であれば、付加情報記入済教材８１をスキャナで読み取り、その付加情報記入済教材８１に埋め込まれている答案特定コードを抽出することで対応する教育用教材８０を特定する。あるいは、識別情報欄８５に記入されている情報を文字認識などして対応する教育用教材８０を特定する。

同様に、自動伝票処理であれば、記入済帳票７１をスキャナで読み取り、その記入済帳票７１に埋め込まれている帳票特定コードを抽出することで対応する帳票７０を特定する。あるいは、識別情報欄７５に記入されている情報を文字認識などして対応する帳票７０を特定（帳票認識という）する。

ここで、文書原本８Ａと自動処理用情報をデータベースに登録しておくには、前述のように記入欄の位置情報やその他の様々な情報を設定して登録する必要があり、その作業を操作者が逐一実行するのは大変な労力を要する。

たとえば、教育用教材８０に関する自動処理用情報を登録する際には、数ある答案の１つ１つについて、図５に示すように、教育用教材８０の各問題について、問題番号と、配点と、その問題に対する解答欄８４の領域、たとえば解答欄８４として扱われるｘｙ座標上の範囲、たとえば左上頂点（ｘltα，ｙltα）と右下頂点（ｘrbα，ｙrbα）（αは問題番号を通し番号に変換した問題番号）の座標を、１つ１つ入力しなければならない。この入力結果を受けて、図２（Ｃ）に示したような形態で、解答欄８４の位置情報を含んで、記入順序対応付け情報３７がデータベースに登録される。

また、各解答欄８４に対応する問題文や配点などの属性情報の内、問題文に関しては自動採点処理時には直接には必要ないが、配点に関しては必要になるので、自動採点処理に必要となる第２の属性情報として、配点の情報についても登録しておくことが望まれる。

ワードプロセッサなどの電子的な文書作成手段を用いた場合には、ソフト（アプリケーションプログラム）によっては座標位置や配点を自動取得できる可能性があるので、これらの入力を手作業で行なうことを多少割愛できる可能性があるが、白紙用紙上にペンで記入して作ったいわゆる手作りの問題用紙の場合、全ての情報を手入力しなければならない。もちろん、座標位置や配点を自動取得できないソフトであれば、ワードプロセッサなどで作成した場合でも各種の情報を手入力することが必要になる。

このように、従来の仕組みでは、自動データ処理を効率的に実行するためには、事前に文書原本８Ａについて各記入欄の位置情報や対応する属性情報の内データ処理に必要となるものについて登録することが必要となり、その登録作業の負担が大きく、登録作業を効率的に実行することが困難である。

本実施形態では、この点を解消するべく、追記済文書８Ｂにおける追記情報を除いた部分、つまり追記済文書８Ｂに対応する文書原本８Ａ上の文字や画像と追記情報の各記入位置の相対関係に基づいて、処理対象の追記情報が何れの文字や画像に対応するものであるのかを自動的に判定することで、位置情報の登録作業を不要とすることや追記情報の記入位置のズレに対処する仕組みを採ることにした。

この際、注目する追記情報近傍に存在する文字部分についての文字認識結果を利用して、注目する追記情報とこの注目する付加情報に関連する問題や配点などの属性情報とを対応付ける仕組みを採ることにした。

さらに一例としては、文書原本８Ａに記載の文字について処理対象の文書画像を文字認識により特定し、さらに文字認識した文中の文字が持つ順番情報を参照し、注目する追記情報の順番付けを、特定した順番情報と対応させながらデータ処理を行なう仕組みを採ることにした。

以下、これらの点について詳細に説明する。

＜本実施形態の方法；第１例＞
図６は、文書原本８Ａ上の文字や画像と追記情報の各記入位置の関係に基づいて、処理対象の追記情報が何れの文字や画像に対応するものであるのかを自動的に判定する仕組み、つまりデータ処理対象追記情報とデータ処理用の属性情報とを対応付ける仕組みの第１例を説明する図である。

なお、実際のデータ処理時には、追記情報が何れの記入位置に対応するものであるかを特定するだけでは不十分な場合もある。本実施形態では、この点も考慮して、追記情報の処理順序や処理内容に関しても適切に対処できるようにする。

たとえば、手帳９０において、ある記入欄（予定欄９４）に記入されたもの（予定９７やコメント９８）が何れの日付欄９２に対応するものであるかを特定しないと、スケジューリングのデータベースを構築することができない。また教育用教材８０の場合には、ある記入欄（解答欄８４）に記入されたもの（採点記号８７やコメント８８）が何れの解答欄８４つまり問題文に対応するものであるかを特定しないと、配点付けや集計を適切に実行することができない。一方、帳票７０の場合には、勘定科目、摘要、および金額の対応さえ取れいればよいので、その限りにおいて、追記情報の処理順序や処理内容に特段の配慮を講じなくてもよい。

本実施形態の対応付け手法は、自動データ処理に供される注目のデータ処理対象追記情報と、その近傍の文字情報との相対的な位置関係に基づいて、データ処理対象追記情報と属性情報との対応を取る点に特徴を有する。また、特にこの第１例の対応付け手法は、文書原本８Ａ中の文字情報と追記情報との位置関係並びに追記情報に対応する属性情報の文字情報が持つ順番情報とに基づいて、自動データ処理に供される追記情報に順番情報を対応付ける点に特徴を有する。

たとえば、追記済文書８Ｂとして付加情報記入済教材８１を処理対象とする場合の事例を図６に示している。図２にて示したように、付加情報記入済教材８１（元の教育用教材８０）には、第１の属性情報の一例である問題文が記載され、それに対応して解答欄８４が設けられ、またその問題文や解答欄８４には第２の属性情報の一例である所定の配点が設定される。また、各問題文には、問題の順番（問題番号）を示す「１」，「２」，…や「問１」，「問２」…など第１および第２の属性情報についての順序情報が付与されることが多い。

そして、自動採点処理時には、図２（Ｃ）に示したように、順序情報を頼りにして各採点記号８７と第２の属性情報である配点（つまり第１の属性情報である問題）とを対応付けながら、各問題に対する配点と採点記号８７が示す正誤に基づいて採点集計を実行することになる。

そこで、この第１例の対応付け手法は、追記済文書８Ｂ（付加情報記入済教材８１）を文字認識することで問題および問題番号を取得し、また、採点記号８７やコメント８８が何れの問題に対応するのかを、各問題文や解答欄８４と採点記号８７やコメント８８との相対的な位置関係に基づいて特定する。

たとえば、生徒による解答記入と採点官による採点記号８７、コメント８８の記入が終わった付加情報記入済教材８１を文書入力装置で読み取り、読み取った画像情報について文字認識し、さらに文書原本８Ａ（教育用教材８０）の情報と突き合わせることで、問題番号を特定する。また、必要に応じて（具体的には配点情報がデータベースに登録されていないとき）、付加情報記入済教材８１上に記載の配点についても文字認識により特定する。

この際、自動データ処理（本例では自動採点処理）との関係で本当に必要な文字情報は、採点記号８７やコメント８８と対応する問題や配点であるので、付加情報記入済教材８１中の全ての文字情報について文字認識する必要はなく、採点記号８７やコメント８８に近傍の文字列から、注目する採点記号８７やコメント８８に対応する問題番号や配点を特定する。

具体的には、先ず、スキャナなどの文書入力装置により追記済文書８Ｂの一例である付加情報記入済教材８１を読み取って得た読取画像を追記情報処理装置に入力する（Ｓ１０）。追記情報処理装置では、先ず、付加情報記入済教材８１の読取画像を対応する元の文書原本８の一例である教育用教材８０と比較して差分情報９を抽出し、さらに、採点記号８７やコメント８８の記入時に使用された特定の色に注目した分離を行なうことで、採点記号８７やコメント８８などのデータ処理対象追記情報９ａのみからなる差分情報を抽出する（Ｓ１２）。

そして、抽出した各データ処理対象追記情報９ａについて、所定サイズの解析対象領域ATを設定し（Ｓ１４）、この解析対象領域ATごとに文字認識する（Ｓ１６，Ｓ１８）。つまり、データ処理対象追記情報９ａを中心とする文字ブロックごとに、文字認識処理を実行する。

この際には、先ず、文書入力装置から入力された読取画像（取得画像）について、所定サイズの解析対象領域ATで所定の領域取得方向決定方法に従ってデータ処理対象追記情報９ａを探索していく（Ｓ１４）。解析対象領域ATのサイズ決定手法や領域取得方向決定方法については後述する。

そして、該当した任意のデータ処理対象追記情報９ａに注目し、たとえば採点記号８７である「○」や「×」の追記図形などの注目したデータ処理対象追記情報９ａの周囲に解析対象領域ATを設定し、この解析対象領域ATの画像を取得する（Ｓ１６）。そして、一般的な文字認識処理手法を適用して、この解析対象領域AT中に存在する文字を行や列ごとに切り出して文字認識する（Ｓ１８）。このとき、解析対象領域を取得後、実際に画像を取り出すのは、位置合わせをした後の白紙答案原本からでもよい。そのほうが、追記図形が文字認識の邪魔にならなくてよい。

一例として、図では、ステップＳ１２にて抽出されたデータ処理対象追記情報９ａのみからなる差分情報９において、ある追記図形Z1に注目した場合に、文字認識処理（Ｓ１８）にて、右側に示す例では誤認識がない場合を、左側は「３」の部分に誤認識がある場合を示している。

このように、付加情報記入済教材８１について文字認識処理をしただけでは、その認識性能によっては、誤認識の発生が起こり得る。たとえば、問題文の本文中に誤認識があっても自動採点処理結果には影響がないが、記入欄（本例では解答欄８４）の順番と関わる順序情報（問１や問ａなど英数字によるものが典型例）に関しては配点付けなどのデータ処理時に参照される属性情報と関係を持つため、ステップＳ１６の左側に示すように、番号に関する部分に誤認識があると、データ処理（本例では自動採点処理）を適切に実行できなくなる。

そこで、この第１例では、先ず、文書原本８Ａ（教育用教材８０）における文字部分をテキスト情報として参照され得るように、文書原本８Ａ（教育用教材８０）そのものの情報を、テキストデータもしくはテキストデータ相応の文書ファイルデータで保存しておくようにする。つまり、データ処理内容と関わりを持つ問題や配点などの属性情報が記載されている文書原本８Ａについて、属性情報をテキストデータもしくは相応のデータ形式でデータベースに登録しておく。

そして、追記済文書８Ｂ中の注目するデータ処理対象追記情報９ａの近傍に存在する文字列を文字認識して得られる認識文字列と、データベースに登録されている元の文書原本８Ａ（教育用教材８０）のテキスト情報とを比較して、誤認識部分がデータ処理結果に悪影響を及ぼさないように対処する。具体的には、認識文字列を検索キーとして、処理対象の付加情報記入済教材８１に対応する教育用教材８０のテキスト情報を検索することで、注目するデータ処理対象追記情報９ａに対応する属性情報（各切出部分の元のテキスト情報）を特定する（Ｓ２０）。

この際には、各切出部分の全認識結果との完全一致の検索ではなく、大部分が一致している箇所を検索すると言った曖昧検索を実行する。こうすることで、認識結果に多少の誤認識があっても、その認識結果部分の元のテキスト情報を特定することで、文字認識結果に対して自動修正ができる（Ｓ２２）。このとき、検索結果として複数箇所見つかる可能性があるが、この際は、解析対象領域ATを広げて、再度、文字認識処理や検索処理をやり直すことで対処する（詳細は後述する）。

各切出部分の元のテキスト情報を特定できたら、テキスト情報に含まれる記入欄（本例では解答欄８４）の順番と関わる順序情報（問１や問ａなど英数字によるものが典型例）を、注目した追記図形Z1に対応付ける（Ｓ２４）。つまり、検索された原本文字の周囲にある問題番号などと追記図形Z1とを対応付ける。こうすることで、各データ処理対象追記情報９ａについての順序対応付け情報が生成される。

この際、追記図形Z1に設定した解析対象領域ATによっては、解析対象領域AT内に複数の順序情報が検索されることも起こり得る。この場合、注目している追記図形Z1に対して、何れの順序情報を対応付けるかに関しては、全体のレイアウトを考慮するのがよい。

たとえば、追記済文書８Ｂ（文書原本８Ａ）や対応する文書原本８Ａ（教育用教材８０）中に存在する文字、特に記入欄と関わりを持つ属性情報部分の文字のレイアウトを考慮して設定していく。具体的には、属性情報部分の文字が縦書きであるのか横書きであるのかを判断基準にすることが考えられる。

すなわち、記入欄（解答欄８４）に対応する問題文やアンケート文や日付などの属性情報中に設けられる、記入欄（解答欄８４）の順番と関わる順序情報は、その属性情報の先頭部分に配置されるのが一般的である。また、記入欄（解答欄８４）に対応する問題文やアンケート文などの属性情報は、縦書きの場合は記入欄の右側に配置されるのが一般的であるし、横書きの場合は記入欄の上側に配置されるのが一般的である。

よって、追記図形Z1は記入欄と対応して記入されるものであるから、縦書きの場合は、記入欄の右・上側に存在する順序情報を使用し、横書きの場合は、記入欄の左・上側に存在する順序情報を使用するようにすればよい。

図示した例では、注目している追記図形Z1について、「１．ＡＡＡ」と「２．ＢＢＢ」が検索されているが、「１．ＡＡＡ」と「２．ＢＢＢ」とは横書きであるため、左・上側の領域を優先し、注目している追記図形Z1には「１」を順序情報として対応付ける。

追記済文書８Ｂに追記されたデータ処理対象追記情報９ａについて所望のデータ処理を実行する際には、注目するデータ処理対象追記情報９ａの順番付けを、前述のようにして特定した属性情報（問題）の順番付けと対応させながらデータ処理を行なう。

なお、追記済文書８Ｂとして付加情報記入済教材８１を処理対象とする場合には、採点記号８７に関しては、第１の属性情報としての問題の順番付けの他に、第２の属性情報としての配点をも参照する必要がある。

この場合、注目するデータ処理対象追記情報９ａ（採点記号８７）についてのデータ処理（自動採点処理）時には、予め属性情報（問題）に含まれる順序情報と対応付けて第２の属性情報としての配点情報を文書原本情報データベースＤＢ２に登録してあるので、注目するデータ処理対象追記情報９ａについて、特定した属性情報（問題）に含まれる順序情報を検索キーとして文書原本情報データベースＤＢ２から検索することで、注目するデータ処理対象追記情報９ａに対応する配点情報を特定し、この特定した配点情報と対応するように、つまりこの配点情報を使って採点集計を行なう。

一方、追記済文書８Ｂとして記入済帳票７１を処理対象とする場合には、第１の属性情報としての勘定科目、摘要、あるいは金額の各項目に対応して、データ処理対象追記情報９ａとしての勘定科目、摘要、および金額の各項目に対応する各追記データでなる追記データ群が順次記入されるので、勘定科目、摘要、金額の各項目と記入された各項目の追記データとの相対的な位置関係、並びに、複数の追記データ群の記載順序の対応、換言すれば、複数の追記データ群の勘定科目、摘要、金額の各項目についての順番付けを特定できれば十分である。

すなわち、記入済帳票７１中の注目する追記データの近傍に存在する勘定科目、摘要、金額の各項目部分の文字列を文字認識し、この文字認識により得られる認識文字列に基づいて、注目する各追記データに対応する属性情報として、勘定科目、摘要、金額の各項目を特定し、注目する追記データ群の各項目の追記データについて、特定した勘定科目、摘要、金額の各項目と対応する自動伝票処理を、複数の追記データ群の記載順序に従って行なえばよい。

もちろん、記入済帳票７１を処理対象とする場合に、記入欄７４における記載位置に対応して個別のデータ処理（特殊処理）を必要とする場合には、記入欄７４の順序情報（番号）に対応付けて、第２の属性情報として個別の特殊処理内容をデータベースに登録しておき、注目する番号部分に記入された勘定科目、摘要、金額の各追記データについて、特定した記入欄７４の順序情報を検索キーとしてデータベースから検索することで、注目する番号部分に記入された勘定科目、摘要、金額の各追記データに対応する特殊処理の内容を特定し、特定した処理内容に従って自動伝票処理を行なうようにすることもできる。

たとえば、単に各項目に対して記入された追記データを表形式で整理するだけでなく、特定の番号欄に記入されたものについては、記入されたデータについて所定の演算式に従った演算を行なうなど、特殊な処理を実行することができる。

また、追記済文書８Ｂとして付加情報記入済手帳９１を処理対象とする場合には、第１の属性情報としての日付欄９２の記載（日付）に対応して、データ処理対象追記情報９ａとしての予定が対応する予定欄９４に記入されるので、記入された予定に関する自動スケジューリング処理としては、第１の属性情報としての日付と記入された予定との相対的な位置関係、並びに、複数の予定の記載順序の対応、換言すれば、複数の予定の日付についての順番付けを特定できれば十分である。

すなわち、付加情報記入済手帳９１中のある予定欄９４に記入された注目する予定の近傍に存在する日付欄９２の日付の文字列を文字認識し、この文字認識により得られる認識文字列に基づいて、注目する各予定に対応する属性情報としての日付を特定し、注目する予定について、特定した日付と対応させてスケジューリング処理を行なえばよい。

もちろん、付加情報記入済手帳９１を処理対象とする場合に、日付欄９２（つまり予定欄９４）における記載位置に対応して個別のデータ処理（特殊処理）を必要とする場合には、日付欄９２の順序情報（ここでは日付を使うことができる）に対応付けて、第２の属性情報として個別の特殊処理内容をデータベースに登録しておき、注目する日付欄９２に対応する予定欄９４に記入された予定について、特定した日付欄９２の日付を検索キーとしてデータベースから検索することで、注目する予定欄９４に記入された予定に対応する特殊処理の内容を特定し、特定した処理内容に従って自動スケジューリング処理を行なうようにすることもできる。

たとえば、単に各日付に対して記入された予定を表形式で整理するだけでなく、特定の日付の場合には、記入された予定を強調文字にするなどの文字装飾を付けるなど、特殊な処理を実行することができる。

このように、第１例の対応付け手法によれば、文書原本８Ａ（教育用教材８０）内に存在する文字をテキスト情報でデータベースに登録しておくことにより、予め各記入欄の位置情報をデータベースに登録しておかなくても、記入欄（解答欄８４など）に対応して記入される採点記号８７やコメント８８などのデータ処理対象追記情報９ａと、各記入欄に対応する問題などの属性情報との対応付けを、文字認識と検索によって実現することができる。

文字認識と検索によって、自動データ処理に供されるデータ処理対象追記情報９ａと属性情報との対応を簡易に取ることができる。一般的な文字認識処理を使って、原本情報を作成することができるので、汎用性が高く、実現も容易である。

たとえば、教育機関で用いられる教育用教材８０について、たとえばその教育用教材８０上に複数の問題およびその解答の記入欄（解答欄８４）が配されており、それぞれに対する配点が異なる場合であっても、採点記号８７の記入内容についての自動採点集計やコメント８８の記入内容についての自動分類処理を不都合なく実行することができる。しかも、そのために情報入力の手間や過大な処理負荷などを要してしまうこともなく、その採点処理や分類処理の省力化を実現することができる。したがって、教育機関で用いるのに当り、非常に利便性の高いものとなり、信頼性の高いデータ処理を円滑に行なえるようになる。

また、記入欄（記入欄７４、解答欄８４、予定欄９４）そのものの位置情報を特定する必要はないので、記入欄のデータベースへの位置情報登録や、追記済文書８Ｂ上における記入欄の位置を自動算出するなどの煩雑な処理を割愛できる利点がある。

加えて、採点記号８７やコメント８８などのデータ処理対象追記情報９ａに対応する属性情報を特定できればよいので、データ処理対象追記情報９ａの記入位置を特定する必要もなく、データ処理対象追記情報９ａそのものの記入位置の自由度が高まる利点もある。

また、自動データ処理に供される注目のデータ処理対象追記情報９ａ（追記図形Z1）と、その近傍の文字情報との相対的な位置関係に基づいて、データ処理対象追記情報９ａと属性情報との対応を取るようにしているので、データ処理対象追記情報９ａや属性情報の絶対的な位置を明確に特定することは不要であり、正確なレイアウト認識ができなくても、何ら不都合なく、適切なデータ処理を実現できる利点もある。

＜変形例＞
なお、上記の説明では、ステップＳ１８での文字認識結果を、データベースに登録されている文書原本８Ａ（教育用教材８０）のテキスト情報から検索することで、文字認識結果を修正するようにしていたが（Ｓ２０，Ｓ２２）、このような検索・修正処理を実行することは必須ではない。文字認識性能に起因する誤認識が起きなければ問題ないからである。

たとえば、記入欄（本例では解答欄８４）の順番と関わる順序情報は、一般的には、問１や問ａなどのように英数字や、「ア」，「イ」などのような仮名文字のように、比較的単純な文字によって記入されることが多く、また、これらの順序情報を含む属性情報は、手書きではなく予め文書原本８Ａ中にワープロなどによって電子的に記入されるのが一般的であるので、文字認識性能が比較的低い場合でも、順序情報について誤認識を起す度合いが少ないと考えてよいからである。

すなわち、原理的には、予め各記入欄の位置情報をデータベースに登録しておかなくても、文字認識処理（Ｓ１８）と順番情報の対応付け処理（Ｓ２４）とで、記入欄（解答欄８４）に対応して記入される採点記号８７やコメント８８などのデータ処理対象追記情報９ａと、各記入欄に対応する問題や問題番号や配点などの属性情報との対応付けを実現することができる。文字認識と検索によって、自動データ処理に供されるデータ処理対象追記情報９ａと属性情報との対応を簡易に取ることができる。検索処理（Ｓ２０）および修正処理（Ｓ２２）を必要としない分、単純な順番付け処理となる。

＜領域サイズ決定手法＞
図７は、解析対象領域ATの領域サイズを決定する第１の手法を説明する図である。また図８は、解析対象領域ATの領域サイズを決定する第２の手法を説明する図である。

先ず、第１の解析対象領域ATの決定手法としては、文書原本８Ａ（たとえば答案原本などの教育用教材８０）の種類ごとに、最小サイズ（最低サイズ）を求めておく方法が考えられる。この最小サイズは、たとえば、以下のようにして取得するのがよい。すなわち、原本画像のレイアウト解析結果から、空白領域を求め、その縦横サイズから最小サイズを決定する方法を採るのがよい。具体的には、各空白領域の中心から縦横に領域を広げ、全てが文字に接触するサイズを最小サイズとする。

たとえば、図７に示すように、白紙答案などの教育用教材８０を始めとする文書原本８Ａをデータベースから読み出して（Ｓ３０）、この文書原本８Ａについて文字認識処理を実行するものとして文字認識枠を設定する（Ｓ３２）。この際、文書原本８Ａそのものの情報を、テキストデータもしくはテキストデータ相応の文書ファイルデータで保存しておく場合でも、画像として取扱い、文字認識枠を設定する。

なお、文字認識枠の設定手法に関しては、一般的な文字認識処理において、文字認識枠を設定する手法を適宜採用することができる。通常は、文書原本８Ａ中には様々な文章が記載されているので、多数の文字ブロック部分が存在し、それぞれの文字ブロック部分に文字認識枠が設定されることになる。

次に、各文字認識枠を反転することで、各文字認識枠の間に形成される空白領域を取得する（Ｓ３４）。通常は、この空白領域も多数取得されることになる。

さらに、それぞれの空白領域を適当な間隔で膨張していき、その都度、その膨張空白領域内にて文字認識処理を実行して、文字が得られたら、膨張処理を終了する（Ｓ３６）。そして、得られた各膨張空白領域のうち、最大の膨張空白領域を解析対象領域ATの最小サイズとする（Ｓ３８）。

このような第１の解析対象領域ATの決定手法を採用すると、解析対象領域ATを設定した段階で領域内に文字が含まれることが保証されるため、領域内に認識すべき文字が無いために領域サイズを広げると入った再試行を追記図形ごとに繰り返す必要がなく、効率化が図れるという効果を享受できる。

あるいは、第２の解析対象領域ATの決定手法としては、図６におけるステップＳ１８での文字認識処理中の文字認識結果から解析対象領域ATを動的に決定する方法が考えられる。この際には、領域中に探すものが、特定のキーワードか（第１例）、それとも文字なら何でもよいのか（第２例）、によって２つの手法を採り得る。

たとえば、本実施形態の方法（第１例）で採用し得る「動的に決定する方法」として、図８（Ａ）に示すような第１例の手法を採ることが考えられる。すなわち、先ず、追記済文書８Ｂ（付加情報記入済教材８１）中の注目する追記図形を囲む初期領域を設定する（Ｓ４２）。つまり、追記図形の周囲に初期領域を設定する。そして、文字認識処理を実行して、この初期領域中に、記入欄（本例では解答欄８４）の順番と関わる順序情報を示すキーワード（たとえば図では「２」）が無ければ、この初期領域を適当な間隔で膨張していき（Ｓ４４）、その都度、その膨張領域内にて文字認識処理を実行して、キーワードが得られたら膨張処理を終了する（Ｓ４８）。すなわち、キーワード見つかるまで膨張処理を行なう手法を採ることが考えられる。

また、後述する本実施形態の方法（第２例）で採用し得る「動的に決定する方法」として、図８（Ｂ）に示すような第２例の手法を採ることが考えられる。すなわち、追記済文書８Ｂ（付加情報記入済教材８１）中の注目する追記図形を囲む初期領域を設定し（Ｓ４２）、文字認識処理を実行して、この初期領域中に、文字が無ければ、あるいは文字数が少なければ、この初期領域を適当な間隔で膨張していき（Ｓ４６）、その都度、その膨張領域内にて文字認識処理を実行して、文字が得られたら、あるいは認識できた文字数が所定数に達したら膨張処理を終了する（Ｓ４９）。

何れの動的に決定すな手法も、追記図形ごとに最小限の解析対象領域ATを設定するため、認識する文字が最小限に抑えられ、認識処理が高速になる。また、抽出される文字が最小限なので、対応付け候補が複数見つかる確率も抑えられ、結果的に候補選択処理の頻度が減り高速化が図れる。原本上の文字密度が高い場合に有利な手法である。

＜領域取得方向決定方法＞
図９は、領域取得方向を決定する手法を説明する図である。処理対象の追記済文書８Ｂについて解析対象領域ATを設定していく際には、追記済文書８Ｂ（文書原本８Ａ）のレイアウトを考慮して設定していく。具体的には、縦書きであるのか横書きであるのかを判断基準にすることが考えられる。

すなわち、追記済文書８Ｂが、縦書きの場合は採点記号８７やコメント８８などのデータ処理対象追記情報９ａの右・上側から領域取得を開始し（図９（Ａ）を参照）、横書きの場合はデータ処理対象追記情報９ａの左・上側から領域取得を開始する（図９（Ｂ）を参照）。

たとえば、実施形態の方法（第１例）の場合に、動的に領域を膨張させる場合を考える。「問１」などのキーワードは通常問題文の文頭に書かれるため、追記図形から見て縦書きの場合・横書きの場合の位置関係が決まってくる。すると、元々、可能性が高い方向に膨張すれば、速く「問１」などを発見でき、高速化が図れると考えられる。

＜複数検索候補の対処手法＞
図１０は、図６に示した文字認識結果の検索処理（Ｓ２０）において、複数の候補が見つかったときの対処方法を説明する図である。先にも述べたが、検索結果として複数の候補が見つかったときには、解析対象領域ATを広げて、再度、文字認識処理や検索処理をやり直すことで対処する。

具体的には、追記済文書８Ｂ（付加情報記入済教材８１）を読み取って得た読取画像を追記情報処理装置に入力する（Ｓ６０）。追記情報処理装置では、注目するデータ処理対象追記情報９ａについて、所定サイズの解析対象領域ATの画像を取得し（Ｓ６２_1）、この解析対象領域ATの画像について文字認識する（Ｓ６４_1）。

次に、文字認識した結果を、追記済文書８Ｂに対応する元の文書原本８Ａから検索する（Ｓ６６_1）。このとき、複数の該当文字が検索されたときには、検索文字数が増えるように解析対象領域ATを所定ピッチで膨張させて、その膨張させた後の画像を取得し（Ｓ６２_2）、この膨張させた後の解析対象領域ATの画像について文字認識する（Ｓ６４_2）。そして、文字認識した結果を、再度、追記済文書８Ｂに対応する元の文書原本８Ａから検索する（Ｓ６６_2）。

こすることで、最初の検索時には複数の検索候補が見つかった場合でも、検索文字数を増やすことで、該当する検索候補の数を低減させることができる。２回目の処理でも、なおも、複数の該当文字が検索されるときには、前述の処理（Ｓ６２_2〜Ｓ６６_2）をさらに繰り返す。その結果として、最終的には、複数の記入欄についてそれぞれ異なる属性情報（教育用教材８０の場合には問題文）が記入されていれば、該当する検索候補の数を１つにすることができる。

＜本実施形態の方法；第２例＞
図１１は、文書原本８Ａ上の文字や画像と追記情報の各記入位置の関係に基づいて、処理対象の追記情報が何れの文字や画像に対応するものであるのかを自動的に判定する仕組み、つまりデータ処理対象追記情報とデータ処理用の属性情報とを対応付ける仕組みの第２例を説明する図である。

この第２例の対応付け手法は、文書原本８Ａ中の文字情報と追記情報との位置関係に基づいて自動データ処理に供される追記情報に順番情報を対応付ける点では、第１例の対応付け手法と共通するが、順番情報を対応付ける際に、追記情報に対応する属性情報の文字情報が持つ順番情報を参照するのではなく、文書原本全体のレイアウト解析結果を参照する点に特徴を有する。

具体的には、レイアウト解析と文字認識によって文書原本８Ａ上の文字を順番付けしておくことで、追記情報に対応する属性情報の文字情報が持つ順番情報を明確に特定することを不要にするとともに、対応付け精度を向上させるのである。

処理手順としては、先ず、追記情報処理装置においては、白紙答案原本などの教育用教材８０を始めとする文書原本８Ａをデータベースから取得し、もしくは、用紙などに印刷された文書原本８Ａの画像を文書入力装置で読み取ることで取得する（Ｓ７０）。そして、文書原本８Ａについて文字認識を行なう。この後、文字部分（文字認識結果を含む）について順番付けを行なって（「文書原本の文字認識結果」中に示している点線矢印を参照）（Ｓ７２）、その順番付け情報を文字部分（文字認識結果を含む）と対応付けてデータベースに登録しておく（Ｓ７３）。

ここで、「順番付け」とは、文書原本８Ａ上の各記入欄に対応する問題文やアンケート文や日付などの属性情報中に存在する記入欄（本例では解答欄８４）の順番と関わる順序情報の順に、文字認識結果を順序付けることを意味する。この際、文字認識処理時に最初になされるレイアウト認識による順番付け結果を利用するとよい。つまり、予め、文書原本８Ａ上の文字をレイアウト認識に従って順番付けておくのである。

また、追記済文書８Ｂをスキャナなどの文書入力装置により読み取って得た読取画像を追記情報処理装置に入力する（Ｓ７４）。追記情報処理装置では、先ず、追記済文書８Ｂに対応する元の文書原本８と比較して差分情報９を抽出し、さらに、採点記号８７やコメント８８などのデータ処理対象追記情報９ａの記入時に使用された特定の色に注目した分離を行なうことで、データ処理対象追記情報９ａのみからなる差分情報を抽出する（Ｓ７６）。

そして、抽出した各データ処理対象追記情報９ａについて、形状認識するとともに、データ処理対象追記情報９ａの外接矩形領域AT2 を得、追記済文書８Ｂからデータ処理対象追記情報９ａの外接矩形領域AT2 の周囲の画像を取得し（Ｓ７８）、その周囲の画像中の文字を切り出して文字認識する（Ｓ７９）。
つまり、注目するデータ処理対象追記情報９ａに対して外接矩形領域AT2 を設定し、その設定した外接矩形領域AT2 外の画像について文字認識する。採点答案画像から追記図形の周囲の画像を取得して、画像中の文字を切り出し、文字認識するのである。

なお、外接矩形領域AT2を取得後、実際に画像を取得するのは、位置合わせをした後の白紙答案原本からでもよい。その方が、追記図形が文字認識の邪魔にならなくてよい。

外接矩形領域AT2 をデータ処理対象追記情報９ａに設定する手法（追記情報の位置決定手法）に関しては後述する。

このステップＳ７４〜Ｓ７９までの処理は、解析対象領域ATの設定手法と外接矩形領域AT2 の設定手法に若干の違いがあるものの、第１例の対応付け手法について図６で示したステップＳ１０〜Ｓ１８の処理と似通っている。

また、文書原本８Ａにおける文字部分をテキスト情報として参照され得るように、文書原本８Ａそのものの情報を、テキストデータもしくはテキストデータ相応の文書ファイルデータで保存しておくようにする。そして、注目するデータ処理対象追記情報９ａに設定した外接矩形領域AT2 内での文字認識処理により得た文字認識結果の文字列を、文書原本８Ａのテキスト情報から、より具体的には、文書原本８Ａの文字認識結果（順番付けされてデータベースに登録されているもの）から検索する（Ｓ８０）。

この際には、各切出部分の全認識結果との完全一致の検索ではなく、大部分が一致している箇所を検索すると言った曖昧検索を実行してもよい。認識結果に多少の誤認識があっても、その認識結果部分の元のテキスト情報を特定することができる。

そして、検索された文字が、データベースに登録されている順番付け情報の何れの順になるのかを特定し、その特定した順番に対応するように、処理対象のデータ処理対象追記情報９ａに順番付けすることで、各データ処理対象追記情報９ａについての順序対応付け情報を生成する（Ｓ８４）。

そして、その順序対応付け情報に基づく順番付け通りに、文書原本８Ａについての文書原本情報データベースＤＢ２の属性情報（問題や配点）とデータ処理対象追記情報９ａの認識結果とを対応付けて登録する（Ｓ８６）。たとえば、教育用教材８０についての記入順序対応付け情報３７の問題番号や配点と、採点記号８７の認識結果（「○」や「×」）やコメント８８とを、順番付け通りに対応付けて登録する。

このように、第２例の対応付け手法によれば、予め各記入欄と関わりを持つ属性情報について順番付けを行なって、その順番付け情報をデータベースに登録しておくようにしたので、予め各記入欄の位置情報をデータベースに登録しておかなくても、記入欄（解答欄８４）に対応して記入される採点記号８７やコメント８８などのデータ処理対象追記情報９ａと、各記入欄に対応する問題などの属性情報との対応付けを、文字認識と検索によって実現することができる。文字認識と検索によって、自動データ処理に供されるデータ処理対象追記情報９ａと属性情報との対応を簡易に取ることができる。

また、記入欄（解答欄８４）そのものの位置情報を特定する必要はないので、記入欄のデータベースへの位置情報登録や、追記済文書８Ｂ上における記入欄の位置を自動算出するなどの煩雑な処理を割愛できる利点がある。

加えて、採点記号８７やコメント８８などのデータ処理対象追記情報９ａに対応する属性情報を特定できればよく、データ処理対象追記情報９ａそのものの記入位置の自由度が高まる利点もある。

また、順番付け情報を利用しているので、データ処理対象追記情報９ａや属性情報の絶対的な位置を明確に特定することが不要である、つまり正確なレイアウト認識ができなくてもよく、さらに、第１例の対応付け手法とは異なり、より単純な順番付け法でありながら、対応付け精度を高くすることができ、何ら不都合なく、適切なデータ処理を実現できる利点もある。

たとえば、実施形態（第１例）では、段組されている原本で、追記位置が「段の右端」のように偏っていると、追記図形と「問１」などのキーワードまでの距離が遠くなり、却って段を超えた正しくないキーワードのほうが位置的に近い場合が出てくる。すると、領域の膨張をした場合に正しくないキーワードを先に発見し、結果正しくない順序づけが行われる恐れがある。これに対して、実施形態（第２例）はキーワードを用いないために、これを回避できる利点がある。

＜追記情報の位置決定手法＞
図１２は、第２例の対応付け手法において適用する、データ処理対象追記情報９ａの位置決定手法を説明する図である。なお、ここでの位置決定手法によって、最終的に、データ処理対象追記情報と属性情報との対応が取られる。

外接矩形領域AT2 をデータ処理対象追記情報９ａに設定する際には、データ処理対象追記情報９ａと属性情報の位置関係を利用する第１の手法が考えられる。具体的には、図１０（Ａ）に示すように、採点記号８７などのデータ処理対象追記情報９ａの中心から、最も近い位置にある文字ブロックを基準とする。

すなわち、追記済文書８Ｂをスキャナなどの文書入力装置により読み取って得た読取画像を追記情報処理装置に入力する（Ｓ９０）。追記情報処理装置では、データ処理対象追記情報９ａのみからなる差分情報について、データ処理対象追記情報９ａの中心から、より近い位置にある文字ブロックを含むように外接矩形領域AT2 を設定することで、データ処理対象追記情報９ａの周囲の画像を取得し（Ｓ９１）、外接矩形領域AT2 ごとに、画像中の文字を切り出して文字認識する（Ｓ９２）。

ここで、設定した外接矩形領域AT2 内の文字認識結果として、複数箇所に文字ブロックが認識されたときには、さらに、認識された文字について、データ処理対象追記情報９ａの中心からの距離を計算する（Ｓ９３）。そして、最もデータ処理対象追記情報９ａに近い文字ブロックを、つまり求められた各文字ブロックの距離の内、最短距離のものを、検索対象の基準文字列に設定する（Ｓ９４）。

このような、第１の手法を採れば、単純に領域に入っただけでなく、追記情報との距離によって基準文字を決定するため、精度が高まる効果が得られる。

また、外接矩形領域AT2 をデータ処理対象追記情報９ａに設定する際には、検索結果の位置を使う第２の手法が考えられる。具体的には、図１０（Ｂ）に示すように、設定した外接矩形領域AT2 内の文字認識結果として、複数箇所に文字ブロックが認識されたときには、さらに、各文字ブロックについて、文字認識した結果を文書原本８Ａのテキスト情報から検索する（Ｓ９６）。

そして、検索された各文字列が、データベースに登録されている順番付け情報の何れの順になるのかを特定し、その特定した順番上で、順番がより早いものを、検索対象の基準文字列に設定する（Ｓ９７）。つまり、検索結果の順番が前の文字ブロックを、基準文字列に設定する。

このような、第２の手法を採れば、文書原本中からの検索（Ｓ８０）の結果を利用することができるので、第１の手法に比べ、高速に処理できる効果が得られる。

＜システム構成＞
図１３は、本発明に係る追記情報処理装置を備えてなる情報処理システムの一実施形態の構成例を示す図である。なお、この情報処理システムは、答案用紙などの教育用教材８０を処理対象とする教材自動採点システムへの適用例で示す。

図示のように、教材自動採点システム１は、システムの中心をなす追記情報処理装置１０と、追記情報処理装置１０に処理対象文書である付加情報記入済教材８１を電子化して入力する文書入力装置２０と、処理対象文書である付加情報記入済教材８１に対応するテンプレート６や教育用教材８０（詳しくはその原本画像）の電子データを記憶する文書管理サーバ３０と、情報処理（本例では自動採点処理など）の結果を保存しておく処理結果保存サーバ４０とが、有線や無線を利用してネットワーク接続されて構成されている。

文書入力装置２０は、教育用教材８０における解答欄８４への解答記入、解答者情報欄８６への氏名などの記入および解答欄８４に記入された解答に対する採点官による採点記号８７（具体的には、たとえば「○」や「×」の図形）の記入がされた付加情報記入済教材８１に対して、公知の光学的画像読取技術を用いた画像読取りを行ない、その付加情報記入済教材８１から画像データを得るものである。

文書入力装置２０は、処理対象文書である付加情報記入済教材８１を電子データにする機能を備えたものであればよく、たとえば、画像読取装置としての機能を有した複写機、複合機、またはスキャナ装置を利用して実現することが考えられる。その場合に、自動原稿搬送装置（Automatic Document Feeder ；ＡＤＦ）が付設されていると、複数の教育用教材に対する画像読取りを連続的に行なうことができ便利である。

なお、教育用教材８０を利用した試験などは、紙媒体を用いることに限定されない。たとえばタブレット型のＰＣを利用して試験を行ない採点するケースでは、最初から付加情報記入済教材８１を電子データの形式で入手することができ、この場合には、システム構成上、文書入力装置２０が不要となる。

文書管理サーバ３０は、付加情報記入済教材８１に対応する教育用教材８０の原本画像と、この原本画像を特定するための、たとえば、科目、タイトル、適用学年などの識別情報や識別コードとを対応付けて、ハードディスク装置や光ディスク装置などの所定の記憶媒体に文書原本情報データベースＤＢ２として登録している。

また、文書管理サーバ３０は、付加情報記入済教材８１に対応する元の教育用教材８０（原本画像）を保存するとともに、採点記号８７やコメント８８についてのデータ処理時に必要となる問題番号や配点情報などを示す記入順序対応付け情報３７を、図２（Ｃ）に示したように、テーブル形式で、所定の格納領域に文書原本情報データベースＤＢ２として保持蓄積している。先にも述べたが、解答欄の位置情報に関しては登録が不要である。

処理結果保存サーバ４０としては、追記情報処理装置１０とネットワーク接続され、付加情報記入済教材８１についての自動採点集計結果を管理することができるものであればよく、たとえば、処理結果データベース装置や処理結果ファイルサーバ装置などが該当する。

教材自動採点システム１の中心部をなす追記情報処理装置１０は、文書入力装置２０から入力された付加情報記入済教材８１の画像データに基づき所定の信号処理を行なう読取画像処理部１１０と、読取画像処理部１１０による処理に基づいて文書入力装置２０から入力された読取画像の元となった文書原本８Ａを識別特定する文書原本特定部１２０とを備えている。教材自動採点システム１においては、文書原本特定部１２０は、文書原本８Ａの一例である教育用教材８０を特定する教材特定部１２２として機能する。

また、追記情報処理装置１０は、読取画像処理部１１０による処理が施された画像データから追記情報（アノテーション）を抽出する追記情報抽出部１３０と、追記情報抽出部１３０により抽出されたデータ処理対象の追記情報に基づき記載内容や記入位置を認識し特定するデータ処理対象追記情報特定処理部１５０と、データ処理対象追記情報特定処理部１５０により特定された追記情報の記載内容に基づいてデータ処理を行なうデータ処理部１７０とを備えている。

読取画像処理部１１０は、文書入力装置２０から入力された画像データについて、レイアウト解析、文字図形分離、文字認識、コード情報認識、図形処理、色成分認識などの公知の画像処理技術（それぞれの詳細説明は割愛する）を利用して解析処理を行なう画像データ解析部１１２と、文書入力装置２０から入力された画像データの傾きや主走査方向または副走査方向の拡縮率などの画像歪みを補正する歪み補正部１１４とを有している。なお、歪み補正部１１４は、文書入力装置２０から入力された画像データと、比較対象となる文書管理サーバ３０内の対応する原本画像とを比較照合し、その画像歪み（傾き、拡縮など）を補正してもよい。

教材特定部１２２は、たとえば、画像データ解析部１１２によるデータ解析結果に基づいて、識別情報欄８５に記入されている科目、タイトル、あるいは適用学年などの識別情報を解析する識別情報解析部１２３と、同じく識別情報欄８５に埋め込まれている教育用教材８０を特定するコード情報を解析するコード情報解析部１２４とを有している。

教材特定部１２２は、画像データ解析部１１２での解析結果に基づいて特定した、たとえば科目、タイトル、適用学年などの識別情報や識別コードと、文書管理サーバ３０に保持蓄積されている教育用教材８０の原本画像の情報（たとえば科目、タイトル、適用学年などの識別情報や識別コード）とを照らし合わせ、該当する原本画像が文書管理サーバ３０に保持蓄積されていなければ、文書入力装置２０で得られた画像データとの比較対象となる電子データを特定できないと判定して、識別特定エラー信号を出力するようになっている。

なお、教材特定部１２２は、文書入力装置２０から入力された画像データ（付加情報記入済教材８１に相当）と対応する元の教育用教材８０を識別特定できればよく、識別情報解析部１２３とコード情報解析部１２４とは、付加情報記入済教材８１の識別情報欄８５に記載もしくは埋め込まれている識別情報の形式に対応する適正な方を備えていればよく、必ずしも、両者を備えている必要はない。

追記情報抽出部１３０は、歪み補正部１１４にて画像歪みが補正された画像データと、教材特定部１２２により特定された、文書入力装置２０から入力された画像データ（付加情報記入済教材８１に相当）に対応する原本画像（教育用教材８０に相当）とを公知の画像処理技術を利用して比較しそれぞれの間の差分を抽出する差分抽出部１３２を有する。

また、追記情報抽出部１３０は、差分抽出部１３２による抽出結果に基づき文書入力装置２０で読取り対象となった付加情報記入済教材８１における解答者情報（第１種の付加情報の一例）を抽出する解答者抽出部１３４と、同じく差分抽出部１３２による抽出結果に基づき文書入力装置２０で読取り対象となった付加情報記入済教材８１における採点記号８７やコメント８８などのデータ処理に供される第２種の付加情報を抽出するデータ処理用追記情報抽出処理部１４０とを有する。

解答者抽出部１３４は、差分抽出部１３２による抽出結果に基づき、解答者情報欄８６の学級８８ａや出席番号８８ｂや氏名８８ｃの欄に記入された解答記入者の手書きによる番号や文字の画像をそのまま文字情報として切り出す手書き情報切出部１３６と、差分抽出部１３２による抽出結果に基づき（好ましくは、手書き情報切出部１３６により切り出された手書き情報について）、解答者情報欄８６の手書きによる記入情報を、追記情報処理装置１０上で加工編集が可能な文字データに変換する文字認識処理（ＯＣＲ；Optical Character Reader）部１３８とを有する。

なお、解答者抽出部１３４は、文書入力装置２０で読取り対象となった付加情報記入済教材８１における解答者情報欄８６に記入された解答者情報を抽出できればよく、手書き情報切出部１３６と文字認識処理部１３８の何れか一方を備えていればよい。また、文字認識処理部１３８を設けない場合や文字認識処理部１３８で文字認識できなかったコメント８８の部分に関しては、抽出された解答者情報をそのまま画像として取り扱うことにする。

データ処理用追記情報抽出処理部１４０は、注目する追記色の情報を参照して、差分抽出部１３２による抽出結果に基づき、追記情報抽出部１３０により抽出された追記情報の内、文書入力装置２０で読取り対象となった追記済文書８Ｂ（本例では付加情報記入済教材８１）におけるデータ処理対象追記情報９ａ（本例では採点記号８７やコメント８８）を抽出するデータ処理対象追記情報抽出部１４２と、データ処理対象追記情報抽出部１４２で抽出されたデータ処理対象の追記情報をデータ処理に耐え得るように整形する追記情報整形部１４６とを有する。本実施形態においては、データ処理対象追記情報抽出部１４２は、採点記号８７を抽出する採点記号抽出部およびコメント８８を抽出するコメント抽出部の機能を備える。

なお、データ処理対象追記情報抽出部１４２は、データ処理対象追記情報９ａを抽出できればよく、色を指標に追記情報をさらに分類するとよい。たとえば差分抽出部１３２での抽出結果に対する色成分認識処理を通じて、採点官が採点記号８７やコメント８８の記入に使用したペン色と対応する所定色成分についてのものを抽出することで行なえばよい。たとえば、付加情報記入済教材８１における採点記号８７やコメント８８の記入は、一般に赤色ペン（赤の筆記具）で行なわれることが多く、この場合には、赤色成分に注目した抽出を行なえばよい。

ただし、赤色ペンとはいってもピンク系からオレンジ系というように似通った色気のものがあるし、必ずしも採点記号８７やコメント８８の記入に赤色ペンを使用するとは限らないし、採点記号８７とコメント８８とを別のペン色で記入することもあるので、採点記号８７やコメント８８の記入に使用するペン色の情報を採点記号抽出部やコメント抽出部として機能するデータ処理対象追記情報抽出部１４２に設定可能に構成しておくことで、抽出性能を向上させるようにするとよい。

このため、実際に使用した追記色を特定し、その特定した追記色の情報を参照して、追記色に注目した抽出を行なう。実際に使用されたペン色が特定されていれば、データ処理対象追記情報抽出部１４２は、抽出許容範囲を狭くすることができる。これにより、採点記号８７やコメント８８をその他の追記情報と高精度に区別して抽出することができる。

追記情報整形部１４６としては、データ処理対象追記情報抽出部１４２で抽出されたデータ処理対象の追記情報について、線分同士を接続してその抽出線分間の途切れを解消するように補正処理を行なう抽出線分途切れ補正部１４８を有する構成とするのがよい。

一般に、追記済文書８Ｂ上での図形記入や「２重線」や「波線」や「花丸」や「矢印」などの図形記入やコメント文などは、記入済のものに対して重ねて行なわれることもある。たとえば、付加情報記入済教材８１の場合には、各問題文８２や各解答欄８４を特定する枠や各解答欄８４への解答記入内容などに重ねて「○」や「×」などの採点記号８７が記入され、あるいは図形や文字でコメント８８の追記が行なわれることもある。そのため、データ処理対象追記情報抽出部１４２による所定色成分の抽出結果は、その重なり部分が除かれる結果、図形や文字に途切れ部分が生じたものとなる虞れがある。

このことから、抽出線分途切れ補正部１４８は、「○」や「×」や「線」やその他の印（マーク）などの図形や文字であるはずの抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理（いわゆる連結処理）、あるいは線図形の直線近似などを適宜実行する。なお、このときに行なう細線化処理、端点抽出処理、あるいは端点間接続処理や線図形の直線近似などは、公知技術を利用して行なえばよいため、ここではその詳細な説明を割愛する（たとえば、「画像の処理と認識」，安居院猛著，昭晃堂発行などを参照）。

データ処理対象追記情報特定処理部１５０は、差分抽出部１３２による差分抽出結果に基づいて、具体的には、抽出線分途切れ補正部１４８で補正されたデータ処理対象追記情報９ａに基づいて、追記済文書８Ｂにおける第１のデータ処理用の追記情報の記入内容を第２のデータ処理用の追記情報と分離して認識する第１データ処理用追記情報認識部１５４と第２のデータ処理用の追記情報の記入内容を第１のデータ処理用の追記情報と分離して認識する第２データ処理用追記情報認識部１６４とを有している。

データ処理対象追記情報特定処理部１５０としては、第１データ処理用追記情報認識部１５４は、付加情報記入済教材８１における採点記号８７の記入内容をコメント８８と分離して認識し、また、第２データ処理用追記情報認識部１６４は、付加情報記入済教材８１におけるコメント８８の記入内容を採点記号８７と分離して認識する。

各データ処理用追記情報認識部１５４，１６４は、抽出線分途切れ補正部１４８で補正されたデータ処理対象追記情報９ａの記入内容に対して形状認識処理を行なうことでデータ処理対象追記情報９ａの記入内容を認識する図形形状認識部１５６，１６６と、抽出線分途切れ補正部１４８で補正されたデータ処理対象追記情報９ａの記入内容に対して文字認識処理を行なうことでデータ処理対象追記情報９ａの記入内容を認識するする文字認識部１５７，１６７と、図形形状認識部１５６，１６６や文字認識処理部１５７，１６７により認識された各データ処理対象追記情報９ａの記入内容の、文書原本８Ａ（追記済文書８Ｂ）上における記入順序を、解答欄８４の順序、つまりこの解答欄８４に対応する問題や配点などの属性情報の順序に適合するように対応付ける記入順序対応付処理部１５９，１６９とを有している。図形形状認識部１５６，１６６および文字認識処理部１５７，１６７により、採点記号８７とコメント８８とを分離して認識する分離認識処理部１５５が構成される。

記入順序対応付処理部１５９，１６９を設けない構成であれば、各データ処理用追記情報認識部１５４，１６４は、図形形状認識部１５６，１６６や文字認識処理部１５７，１６７の後段に、図形形状認識部１５６，１６６や文字認識処理部１５７，１６７により認識された各データ処理用追記情報の記入内容の、文書原本８Ａ（追記済文書８Ｂ）上における記入位置を認識する記入位置認識部を備えた構成とするが、本実施形態の構成では、この記入位置認識部を記入順序対応付処理部１５９，１６９に置き換えている点に特徴を有する。

記入順序対応付処理部１５９，１６９は、前述の第１例もしくは第２例の対応付け手法を適用して（特にステップＳ２０〜Ｓ２４，Ｓ８０〜Ｓ８４の処理）、自動データ処理に供される注目のデータ処理対象追記情報９ａ（本例では採点記号８７やコメント８８）と、その近傍の文字情報との相対的な位置関係に基づいて、データ処理対象追記情報９ａと属性情報との順番付けの対応を取る点に特徴を有する。

記入位置認識部を使用する場合には、付加情報記入済教材８１上の採点記号８７やコメント８８の記入内容の記入位置を座標解析によって認識する必要があるが、記入順序対応付処理部１５９，１６９に置き換えることで、そのような座標解析を行なう必要性を無くすことができる。

すなわち、記入順序対応付処理部１５９，１６９は、採点記号８７やコメント８８の記入位置の認識処理に当たって、その記入位置そのものを厳密に特定するのではなく、付加情報記入済教材８１上に複数の採点記号８７やコメント８８が記入されていることが一般的であるから、その複数の採点記号８７やコメント８８のそれぞれについて、記入順序を問題（問題文）や配点などの属性情報の処理順序に適合するように対応付けるのである。

自動採点処理やコメント分類処理時には、採点記号８７やコメント８８の付加情報記入済教材８１上における絶対的な記入位置を特定しなくても、採点記号８７やコメント８８が、何れの問題や配点付けに関わるものであるかを特定できれば、データ処理結果には、何ら不都合が生じないのである。

なお、各コメント８８は、ある位置の解答欄８４への採点記号８７と対応して、その近傍に記入されることが多いので、記入順序対応付処理部１５９による採点記号８７についての順序対応付けと協働して処理を行なうのがよい。こうすることで、双方の問題や配点との対応付け、結果としては、採点記号８７とコメント８８との関連付けが容易になる。

文字認識処理部１５７，１６７を設けない場合や文字認識処理部１５７，１６７で文字認識できなかったデータ処理対象追記情報９ａの部分に関しては、抽出されたデータ処理対象追記情報９ａをそのまま画像として取り扱うことにする。

なお、図示のように、図形形状認識部１５６，１６６、文字認識処理部１５７，１６７、並びに記入順序対応付処理部１５９，１６９とは、それぞれ１つの機能部が双方の機能を実現する構成としてもよいし、それぞれを個別の機能部として独立に設けてもよい。

たとえば、付加情報記入済教材８１を処理対象とする構成においては、第１データ処理用追記情報認識部１５４は、採点記号８７を第１のデータ処理用の追記情報とするものであり採点記号認識部として機能する。この場合、採点記号８７についての図形形状認識部１５６は、採点記号８７の記入内容が「正解（○）」または「不正解（×）」または「一部正解（△）」であるかなどを図形の側面から認識することができればよく、たとえば「○」，「×」，「△」の図形形状とのパターンマッチングによって形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から形状を認識してもよい。特徴量としては、たとえば、穴の個数や外接矩形に占める対象図形の面積率などを使用することができる。

また、採点記号８７について文字認識処理部１５７は、採点記号８７の記入内容が「正解（○）」または「不正解（×）」または「一部正解（△）」であるかなどを文字の側面から認識することができればよい。なお、採点記号８７は図形のみであるとする場合には、文字認識処理部１５７を割愛することもできる。

なお、図形形状認識部１５６は、採点記号８７に関する形状認識の際には、「○」や「×」などの採点記号８７を示す図形を構成する連続画素群を１つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入順序対応付処理部１５９による位置認識の際にも、そのラベリング処理の結果を利用して、「○」や「×」などの採点記号８７を示す図形を構成する連続画素群を１つの纏まりとして取り扱う。

一方、第２データ処理用追記情報認識部１６４は、コメント８８を第２のデータ処理用の追記情報とするコメント認識部として機能する。この場合、コメント８８についての図形形状認識部１６６は、コメント８８の追記内容を図形の側面から認識することができればよく、たとえば「１重線」や「２重線」や「（１重または２重の）波線」などの線を示す図形形状とのパターンマッチングによって線に関する形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から線の形状を認識してもよい。特徴量としては、たとえば、線数や外接矩形に対する画素密度などを使用することができる。

また、コメント８８について文字認識処理部１６７は、付加情報記入済教材８１におけるコメント８８の記入内容を文字の側面から認識することができればよい。

なお、図形形状認識部１６６は、コメント８８に関する形状認識の際には、「２重線」や「花丸」などのコメント８８を示す図形を構成する連続画素群を１つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入順序対応付処理部１６９による位置認識の際にも、そのラベリング処理の結果を利用して、「２重線」や「花丸」などのコメント８８を示す図形を構成する連続画素群を１つの纏まりとして取り扱う。

データ処理部１７０は、文書入力装置２０から入力された追記済文書８Ｂの画像データについて、その追記済文書８Ｂに記入された第１のデータ処理対象追記情報９ａに関する第１のデータ処理を実行する第１データ処理部１７０_1と、第２のデータ処理対象追記情報９ａに関する第２のデータ処理を実行する第２データ処理部１７０_2を有する。

各データ処理部１７０_1，１７０_2は、文書原本情報データベースＤＢ２として機能する文書管理サーバ３０にアクセスして記入順序対応付け情報３７を取得し、記入順序対応付け情報３７の問題や配点の順序情報と、記入順序対応付処理部１５９，１６９にて特定された順序対応付け情報とを突き合わせながら、採点記号８７やコメント８８についてのデータ処理（自動採点処理や自動コメント分類処理）を実行する。

なお、各データ処理部１７０_1，１７０_2は、追記済文書８Ｂとしての付加情報記入済教材８１に追記されたデータ処理対象追記情報９ａ（採点記号８７やコメント８８）について所望のデータ処理を実行する際には、注目するデータ処理対象追記情報９ａの順番付けを、記入順序対応付処理部１５９，１６９が特定した属性情報（問題）の順番付けと対応させながらデータ処理を行なう。

第１データ処理部１７０_1は、追記済文書８Ｂの一例である付加情報記入済教材８１の画像データについて、その付加情報記入済教材８１に記入された採点記号８７を元に採点集計を行なう採点集計部１７２と、採点集計部１７２による採点集計の結果を、解答者抽出部１３４が抽出した解答者情報と関連付けて出力する集計結果出力部１７４とを備えている。採点集計結果と解答者情報とが関連付けられた状態の処理結果を特に採点認識結果と称する。

採点集計部１７２は、図形形状認識部１５６による採点記号８７の追記内容の図形の側面からの認識結果や文字認識処理部１５７による採点記号８７の追記内容の文字情報の側面からの認識結果と、記入順序対応付処理部１５９による採点記号８７の記入順序の対応付け結果（順序対応付け情報）と、文書入力装置２０が保持蓄積している付加情報記入済教材８１に対応する教育用教材８０の電子データ（原本画像）に含まれる教育用教材８０（付加情報記入済教材８１）の各解答欄８４に対応する問題（属性情報の一例）で規定されている配点情報とに基づいて、文書入力装置２０が読み取った付加情報記入済教材８１について、付加情報記入済教材８１に記入された採点記号８７に関する採点処理および集計処理（纏めて採点集計という）を行なう。

ここで、採点記号８７の記入は、一般に教育用教材８０上の複数の解答欄８４のそれぞれに対応して行なわれ、かつ教師などの採点官によって手書きでされるため、各解答欄８４に対する記入位置が必ずしも一義的に定まっている訳ではない。その一方で、採点記号８７の採点集計に当たっては、各解答欄８４と採点記号８７の記入位置との対応、換言すれば各解答欄８４に対応する問題との位置関係を明確にする必要がある。

採点記号８７に関する採点集計は、各解答欄８４や問題に対応する採点記号８７の記入結果を明確にした上で、採点記号８７の内容（正解か不正解か一部正解かなど）を対応付けるからである。加えて、教育用教材８０では、さらに、各問題に対して個別の配点付けが設定されるのが一般的であるので、配点付けを考慮した採点も必要となるので、各解答欄８４（つまり問題）についての配点に基づいて行なわれるからである。

このことから、採点集計部１７２は、以下に述べるような手順で、採点記号８７の採点集計を行なう。すなわち、採点集計部１７２は、「○」や「×」などの採点記号８７について記入順序対応付処理部１５９によって特定された各データ処理対象追記情報９ａ（ここでは採点記号８７）についての順序対応付け情報と、文書原本情報データベースＤＢ２に登録されている教育用教材８０についての記入順序対応付け情報３７から特定される問題順序とを突き合わせて、各採点記号８７に対応する問題番号や配点を対応付けていく。

そして、順番の対応付けを行なった後は、採点記号８７が「○」であれば、これに対応する問題についての配点情報から特定される配点を加算し、また採点記号８７が「×」であれば、これに対応する問題についての配点加算を行なわず、このような採点集計を付加情報記入済教材８１上の全ての問題（つまり解答欄８４）について行なう。つまり、注目する採点記号８７の順番付けを、記入順序対応付処理部１５９が特定した対応する問題番号や配点の順番付けと対応させながら自動採点処理を行なうのである。

記入位置認識部ではなく、記入順序対応付処理部１５９，１６９を備える構成としたことで、採点記号８７やコメント８８の追記対象とされた各解答欄８４の位置を明確に特定しなくても、採点記号８７（ひいてはコメント８８も）と対応する問題や配点との対応付けを簡易かつ確実に実現することができる。

集計結果出力部１７４は、採点集計部１７２により集計された採点集計結果と解答者抽出部１３４が抽出した解答者情報と関連付けて、処理結果保存サーバ４０（処理結果データベース装置や処理結果ファイルサーバ装置など）に登録する。あるいは、採点結果の点数を付加情報記入済教材８１の集計欄８３ｂに記入し用紙上に返却答案８１ｂとして出力して生徒などに返却できるようにする。

また、第２データ処理部１７０_2は、追記済文書８Ｂの一例である付加情報記入済教材８１の画像データについて、その付加情報記入済教材８１に記入されたコメント８８を元に分類処理を行なうコメント分類処理部１７６と、コメント分類処理部１７６による分類結果を集計結果出力部１７４が出力した採点認識結果や各解答に関連付けて出力するコメント処理結果出力部１７８とを備えている。

コメント分類処理部１７６は、図形形状認識部１６６によるコメント８８の追記内容の図形の側面からの認識結果や文字認識処理部１６７によるコメント８８の追記内容の文字情報の側面からの認識結果と、記入順序対応付処理部１６９によるコメント８８の記入順序の対応付け結果（順序対応付け情報）と、コメント８８の追記内容と対応するように予め規定されている分類情報とに基づいて、文書入力装置２０が読み取った付加情報記入済教材８１について、その付加情報記入済教材８１に記入されたコメント８８の分類処理を行なう。

コメント処理結果出力部１７８は、コメント分類処理部１７６による分類結果を各解答欄や集計結果出力部１７４が出力した採点認識結果と関連付けて、処理結果保存サーバ４０（処理結果データベース装置や処理結果ファイルサーバ装置など）に登録する。

なお、採点集計部１７２での採点集計処理やコメント分類処理部１７６での分類処理に当たっては、完全なる自動処理にしてもよいが、ユーザ端末１７１のＣＲＴ（Cathode Ray Tube）やＬＣＤ（Liquid Crystal Display）などで構成された表示部に処理過程や処理結果を表示して、適宜、操作者が処理過程や処理結果をキーボードやマウスなどの指示入力部を介して訂正できるようにしてもよい。

＜全体の処理手順＞
図１４〜図１６は、情報処理システムの一実施形態である教材自動採点システム１における教材処理方法の処理動作の手順を説明する図である。ここで、図１４は、その全体概要をシステム構成図と対応付けて示している。また、図１５は、自動データ処理に供される注目のデータ処理対象追記情報（採点記号８７やコメント８８）と、その近傍の文字情報との相対的な位置関係に基づいてデータ処理対象追記情報と属性情報（問題や配点）との対応を取ってデータ処理を実行する点に着目したフローチャートである。また、図１６は、教材自動採点システムにおける全体の教材処理手順を示すフローチャートである。

先ず、文書原本８Ａとしての教育用教材８０について、その教育用教材８０における文字部分（たとえば問題番号を含む問題文や配点）をテキスト情報として参照され得るように、教育用教材８０そのものの情報については、テキストデータもしくはテキストデータ相応の文書ファイルデータで保存しておく（Ｓ１０４）。ワープロなどの電子的な文書作成ツールで教育用教材８０を作成していれば、概ね、作成された文書ファイルをそのまま保存すればよい。

一方、教育用教材８０が画像ベースで取得されるものである場合、たとえば手書きで作成されたものである場合は、教育用教材８０を読み取って文字抽出を行ない、文字認識処理を行なってから（Ｓ１０２）、テキストデータもしくはテキストデータ相応の文書ファイルデータで保存しておく（Ｓ１０４）。

また、前述の第２例の対応付け手法を適用する場合には、文字（文字認識結果を含む）について順番付けを行なって、その順番付け情報を文字部分（文字認識結果を含む）と対応付けてデータベースに登録しておく。

この後、試験を実施する際には、文書原本情報データベースＤＢ２から教育用教材８０を読み出して印刷し、あるいは手書きで作成した教育用教材８０を複写し、生徒や受験者に配布する。そして、試験終了後に、採点官は採点記号８７やコメント８８を生徒の解答に対して追記する（Ｓ１０８）。

追記情報処理装置１０（特に教材自動採点システム１においては教材処理装置に該当する）を利用する場合には、先ず、生徒などによって解答者情報欄８６への氏名などの記入および解答欄８４への解答記入、つまり生徒による第１種の付加情報の記入がされ、さらに教師などによって各解答欄８４に記入された解答に対する「○」や「×」などの採点記号８７やコメント８８などの第２種の付加情報の記入がされた付加情報記入済教材８１について、文書入力装置２０は、その付加情報記入済教材８１を読み取り、その付加情報記入済教材８１を表わす画像データを追記情報処理装置１０に入力する（Ｓ１１０）。文書入力装置２０は、この文書入力装置２０による画像読取りによって得られた画像データについて、一旦ワークエリアとして用いられるメモリなどに保持しておく。

なお、このとき、文書入力装置２０にてＡＤＦ装置を用いれば、たとえば同一学級のような１つのグループに纏めて処理すべき複数の付加情報記入済教材８１について、一括して読み取り（一括スキャン）、各付加情報記入済教材８１に対応する画像データを連続的に追記情報処理装置１０に入力することができる。

追記情報処理装置１０は、文書入力装置２０から取り込んだ各付加情報記入済教材８１の画像データに対して、順次、次のような付加情報抽出・分離処理、付加情報特定処理、および自動採点処理並びに自動コメント処理といった付加情報終末処理を実行する。

たとえば、データ処理部１７０における自動採点処理並びに自動コメント処理に先立って、ある１つの付加情報記入済教材８１から得られた画像データについて、読取画像処理部１１０の画像データ解析部１１２は解析処理を行ない（Ｓ１２２）、教材特定部１２２は、その解析処理の結果に基づいて付加情報記入済教材８１に対応する元の教育用教材８０の識別特定を行なう（Ｓ１２４）。

この識別特定（Ｓ１２４）は、たとえば「理科」「５年」「１．天気と気温の変化」といった識別情報解析部１２３によるタイトル解析または識別情報欄８５に埋め込まれたコード情報についてのコード情報解析部１２４によるコード解析を通じて行なえばよい。この識別特定を経ることで、教材特定部１２２では、文書入力装置２０により得られた付加情報記入済教材８１の画像データとの比較対象となる教育用教材８０の電子データ（原本画像）を特定することができる。

なお、この識別特定は、文書入力装置２０が画像読取りを行なった複数の付加情報記入済教材８１のそれぞれについて順次行なうことも考えられるが、一般に１つのグループに纏めて処理される付加情報記入済教材８１は全て同一のものであるため、その纏めて処理される中で最初に処理される付加情報記入済教材８１についてのみ行なえばよい。

教材特定部１２２により各付加情報記入済教材８１に対応する教育用教材８０の特定が完了すると、文書管理サーバ３０は、その特定結果に従いつつ、保持蓄積している中から該当する教育用教材８０の原本画像（電子データ）を取り出して、これを差分抽出部１３２へ受け渡す（Ｓ１２６）。

また、歪み補正部１１４は、ある１つの付加情報記入済教材８１から得られた画像データの歪みを補正する（Ｓ１２８）。この画像歪み補正は、文書入力装置２０での画像読取りの際に生じ得る画像歪みを補正するために行なうものであり、その後に差分抽出部１３２にて行なう原本画像との比較や差分抽出などの精度向上を図るためのものである。

差分抽出部１３２は、文書管理サーバ３０から受け渡された原本画像（教育用教材８０）と、文書入力装置２０から入力され、歪み補正部１１４により画像歪みが補正された後の画像データ（付加情報記入済教材８１）とを、それぞれ比較して、その差分を抽出する（Ｓ１３０）。差分抽出部１３２は、抽出した差分情報９を解答者抽出部１３４やデータ処理用追記情報抽出処理部１４０に渡す。

差分抽出部１３２による差分抽出によって、たとえば図１４中の中央部分に示すように、解答者情報欄８６および各解答欄８４への解答者による第１種の付加情報の記入内容、並びに各解答欄８４に対する採点記号８７やコメント８８などの採点官による第２種の付加情報の記入内容のみで表わされる差分情報９が抽出されることになる。

解答者抽出部１３４は、差分情報９に対する文字認識処理部１３８による文字認識処理などを通じて、文書入力装置２０で読取り対象となった付加情報記入済教材８１における解答者情報を抽出する（Ｓ１３２）。これにより、ある１つの付加情報記入済教材８１に解答を記入した解答記入者の学級、出席番号、氏名などを特定できる。

また、データ処理用追記情報抽出処理部１４０において、先ず追記部材特定部１４１は、データ処理の対象となる追記情報の記入に使用されたペン色である追記色を特定し（Ｓ１４１）、データ処理対象追記情報抽出部１４２は、追記部材特定部１４１にて特定された追記色に基づき、差分抽出部１３２による差分抽出結果から、さらにデータ処理対象追記情報９ａを抽出する（Ｓ１４２）。

本例の場合、各解答欄８４への採点記号８７やコメント８８の追記内容を抽出するために、その差分情報９からさらに所定色成分についてのもの、具体的にはたとえば赤色成分のものを抽出する。所定色成分の抽出は、たとえば差分抽出結果が画素データからなる場合であれば、その画素データを構成する色成分データに着目することで行なうことができる。

抽出線分途切れ補正部１４８は、データ処理対象追記情報抽出部１４２による抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理、あるいは線図形の直線近似などの追記情報整形処理を適宜実行する（Ｓ１４６）。抽出線分途切れ補正部１４８は、途切れ補正処理済の採点記号８７の抽出結果を採点記号認識部として機能する第１データ処理用追記情報認識部１５４に渡し、また途切れ補正処理済のコメント８８の抽出結果をコメント認識部として機能する第２データ処理用追記情報認識部１６４に渡す。

データ処理対象追記情報特定処理部１５０は、先ず、分離認識処理部１５５を構成する図形形状認識部１５６，１６６および文字認識処理部１５７，１６７が協働して、採点記号８７とコメント８８とを分離し（Ｓ１６２）、この後、分離した採点記号８７とコメント８８の別に記入内容の特定処理や記入順序の問題や配点との対応付け処理を実行する。

図形形状認識部１５６や文字認識処理部１５７は、コメント８８と分離した採点記号８７について（Ｓ１６２−採点記号）、採点記号８７の記入内容に対する形状認識あるいは文字認識により、その採点記号８７の記入内容が「正解」であるかあるいは「不正解」であるかなど、採点記号８７で示された採点官の採点結果を特定する（Ｓ１６４）。

また、記入順序対応付処理部１５９は、注目する採点記号８７について、その近傍の文字を抽出して（切り出して）文字認識を行ない（Ｓ１６５）、文字認識結果を文書原本情報データベースＤＢ２に登録されている原本情報のテキストから検索して、それぞれの採点記号８７の記入内容について、対応する問題や配点と適合させるための順序対応付け情報を生成する（Ｓ１６６）。つまり、各採点記号８７について、対応する問題や配点の順番付けと適合するように、順番を対応付ける。

このようにして、記入順序対応付処理部１５９が採点記号８７の順序対応付け情報を特定した後は、採点集計部１７２は、図形形状認識部１５６や文字認識処理部１５７による採点記号８７の記入内容の認識結果と、記入順序対応付処理部１５９による採点記号８７の記入順序の対応付け結果と、文書管理サーバ３０が保持蓄積している付加情報記入済教材８１に対応する原本画像（教育用教材８０）に含まれる教育用教材８０の各解答欄８４についての配点情報とに基づいて、採点および集計を行なう（Ｓ１６８）。

集計結果出力部１７４は、その採点・集計の結果を処理結果保存サーバ４０に保存する（Ｓ１６９）。あるいは採点結果の点数が付加情報記入済教材８１の集計欄８３ｂに記入されて返却答案８１ｂとして生徒などに返却される。

各付加情報記入済教材８１についての採点結果（問題別採点結果）のファイル形式としては、たとえば、図１４に示すように、付加情報記入済教材８１上に存在する問題の番号と、その問題の解答に対する正誤判定と、その正誤判定に基づく得点とからなる情報で、これらを互いに関連付けるテーブル形式である。また、集計結果のファイル形式としては、たとえば、図１４に示すように、出席番号および解答者情報と、得点情報（集計欄８３ｂに記入される項目点や合計点）とからなる情報で、これらを互いに関連付けるテーブル形式である。

各付加情報記入済教材８１上に記入される正誤判定の採点集計の結果が問題別採点結果としてファイル出力されるし、また、問題別の採点集計の結果がファイル出力されるので、処理結果保存サーバ４０では、付加情報記入済教材８１についての採点集計結果を、たとえば一覧形式で、管理または利用することが可能となる。

図形形状認識部１６６や文字認識処理部１６７は、採点記号８７と分離したコメント８８について（Ｓ１６２−コメント）、コメント８８の記入内容に対する形状認識あるいは文字認識により、採点官により追記されたコメント８８の記入内容を特定する（Ｓ１７０）。

続いて、記入順序対応付処理部１６９は、注目するコメント８８の記入内容について、その近傍の文字を抽出して（切り出して）文字認識を行ない（Ｓ１７１）、文字認識結果を文書原本情報データベースＤＢ２に登録されている原本情報のテキストから検索して、対応する問題や配点と適合させるための順序対応付け情報を生成する（Ｓ１７２）。つまり、各コメント８８について、対応する問題や配点の順番付けと適合するように、順番を対応付ける。

このようにして、記入順序対応付処理部１６９がコメント８８の順序対応付け情報を特定した後は、コメント分類処理部１７６は、図形形状認識部１６６や文字認識処理部１６７によるコメント８８の記入内容の認識結果と、記入順序対応付処理部１６９によるコメント８８の記入順序の対応付け結果と、文書管理サーバ３０が保持蓄積している分類基準情報３９とに基づいて、コメント８８を分類する（Ｓ１７４）。

コメント処理結果出力部１７８は、コメント分類処理部１７６で分類された各コメント８８を、位置が近い採点記号８７の採点結果と関連付けて処理結果保存サーバ４０に保存する（Ｓ１７９）。各コメント８８についての分類結果のファイル形式としては、たとえば、図１４に示すように、各コメントと近傍の採点記号８７とからなる情報で、これらを互いに関連付けるテーブル形式である。なお、実際にテーブル形式で保存することに限らず、各コメント８８と、このコメント８８と対応する採点集計結果の両者を関連付ける関連付け情報とを対応付けて保存してもよい。

各付加情報記入済教材８１上に記入される採点記号８７の採点集計結果とコメント８８とが対応するようにデータ保存されるので、処理結果保存サーバ４０では、付加情報記入済教材８１についての採点集計結果とコメント８８とを、たとえば一覧形式で、管理または利用することが可能となるし、生徒の能力分析や生徒指導にコメント８８を利用できるようになる。

このように、情報処理システムの一実施形態として示した教材自動採点システム１では、採点記号８７やコメント８８の記入がされた付加情報記入済教材８１から読み取った画像データと、その付加情報記入済教材８１についての元の教育用教材８０、すなわち解答欄８４への解答記入などの生徒などによる第１種の付加情報および解答に対する採点官による採点記号８７やコメント８８などの第２種の付加情報の記入がされていないものについてのデータとを比較し、互いの差分から採点記号８７やコメント８８の記入内容を分離してその記入内容を特定し、その採点記号８７についての採点集計とコメント８８についての分類処理を実行するようになっている。

したがって、採点記号８７に関するデータ処理については、差分抽出部１３２で抽出される差分結果から、コメント８８の記入内容を排除して採点記号８７のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、自動採点に悪影響を及ぼすことがない。

また、採点結果の自動集計を実行できるので、結果として付加情報記入済教材８１についての採点処理が省力化される。付加情報記入済教材８１を紙媒体で入手するケースでは、付加情報記入済教材８１を文書入力装置２０で読み取った画像データを基にすればよく、たとえば、複写機、複合機、またはスキャナ装置などによって実現されるスキャン機能と、パーソナルコンピュータ（ＰＣ）などのコンピュータ機器が有する情報記憶処理機能、画像処理機能および演算処理機能とがあれば、システム構成を簡単に実現することができ、専用の機器を必要とすることもない。

さらには、付加情報記入済教材８１の画像データを、文書管理サーバ３０が保持する電子データと比較するため、その文書管理サーバ３０に各種の教育用教材８０についての電子データを保持蓄積しておけば、対応可能な付加情報記入済教材８１についての汎用性を十分に確保し得る。さらには、文書管理サーバ３０に予め電子データを保持蓄積しておくことで、文書管理サーバ３０から取り込んだ画像データとの比較を行なう場合において、比較対象となる電子データの入力などを行なう手間を省くことができ、結果として迅速な採点処理を実現することができる。

また、コメント８８に関するデータ処理については、差分抽出部１３２で抽出される差分結果から、採点記号８７の記入内容を排除してコメント８８のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、コメント８８に関する分類処理に悪影響を及ぼすことがない。また、各採点記号８７と対応付けて処理結果保存サーバ４０に各コメント８８を保存するようにしたので、コメント８８を生徒などが確認する用途以外に、採点官自らが、能力分析や生徒指導に活用できるようになる。

また、データ処理対象の採点記号８７やコメント８８に対応する問題や配点との対応付けを、それらと解答欄８４の位置関係を特定するための煩雑な座標解析を行なうことなく、各採点記号８７やコメント８８の近傍の文字情報との相対的な位置関係に基づいて対応を取るようにしているので、煩雑な解答欄位置の登録を省くことができるし、順序の対応付けさえ取れればよいので、正確なレイアウト認識ができなくても不都合は生じない。これにより、先生の自作答案などを自動採点する際にも、容易に自動採点ができるようになる。

＜追記情報処理装置；計算機構成＞
図１７は、追記情報処理装置１０の他の構成例を示すブロック図である。ここでは、パーソナルコンピュータなどの電子計算機を利用して、追記情報処理をソフトウェアで実行するマイクロプロセッサなどから構築される、より現実的なハードウェア構成を示している。

すなわち、本実施形態において、追記情報に関するデータ処理を実行する仕組みは、ハードウェア処理回路により構成することに限らず、その機能を実現するプログラムコードに基づき電子計算機（コンピュータ）を用いてソフトウェア的に実現することも可能である。

よって、本発明に係る仕組みを、電子計算機（コンピュータ）を用いてソフトウェアで実現するために好適なプログラムあるいはこのプログラムを格納したコンピュータ読取可能な記憶媒体を発明として抽出することもできる。ソフトウェアにより実行させる仕組みとすることで、ハードウェアの変更を伴うことなく、処理手順などを容易に変更できる利点を享受できるようになる。

電子計算機に、追記情報に関するデータ処理機能をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ（組込マイコンなど）、あるいは、ＣＰＵ（Central Processing Unit ）、論理回路、記憶装置などの機能を１つのチップ上に搭載して所望のシステムを実現するＳＯＣ（System On a Chip：システムオンチップ）、または、各種のプログラムをインストールすることで各種の機能を実行することが可能な汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。

記録媒体は、コンピュータのハードウェア資源に備えられている読取装置に対して、プログラムの記述内容に応じて、磁気、光、電気などのエネルギの状態変化を引き起こして、それに対応する信号の形式で、読取装置にプログラムの記述内容を伝達できるものである。

たとえば、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク（フレキシブルディスクＦＤを含む）、光ディスク（ＣＤ−ＲＯＭ（Compact Disc-Read Only Memory ）、ＤＶＤ（Digital Versatile Disc）を含む）、光磁気ディスク（ＭＤ（Mini Disc ）を含む）、または半導体メモリなどよりなるパッケージメディア（可搬型の記憶媒体）により構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されているＲＯＭやハードディスクなどで構成されてもよい。

また、ソフトウェアを構成するプログラムは、記録媒体を用いずに、記録媒体を介して提供されることに限らず、有線あるいは無線などの通信網を介して提供されてもよい。

たとえば、追記情報に関するデータ処理機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ（またはＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、ハードウェア処理回路にて構成する場合と同様の効果は達成される。この場合、記憶媒体から読み出されたプログラムコード自体が追記情報に関するデータ処理機能を実現する。

また、コンピュータが読み出したプログラムコードを実行することで、追記情報に関するデータ処理機能が実現されるだけでなく、プログラムコードの指示に基づき、コンピュータ上で稼働しているＯＳ（Operating Systems ；基本ソフト）などが実際の処理の一部または全部を行ない、その処理により追記情報に関するデータ処理機能が実現される場合であってもよい。

さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行ない、その処理によって追記情報に関するデータ処理機能が実現される場合であってもよい。

なお、追記情報に関するデータ処理機能を実現するプログラムコードを記述したファイルとしてプログラムが提供されるが、この場合、一括のプログラムファイルとして提供されることに限らず、コンピュータで構成されるシステムのハードウェア構成に応じて、個別のプログラムモジュールとして提供されてもよい。

たとえば、コンピュータシステム９００は、コントローラ部９０１と、ハードディスク装置、フレキシブルディスク（ＦＤ）ドライブ、あるいはＣＤ−ＲＯＭ（Compact Disk ROM）ドライブ、半導体メモリコントローラなどの、所定の記憶媒体からデータを読み出したり記録したりするための記録・読取制御部９０２とを有する。

コントローラ部９０１は、ＣＰＵ（Central Processing Unit ）９１２、読出専用の記憶部であるＲＯＭ（Read Only Memory）９１３、随時書込みおよび読出しが可能であるとともに揮発性の記憶部の一例であるＲＡＭ（Random Access Memory）９１５、および不揮発性の記憶部の一例であるＲＡＭ（ＮＶＲＡＭと記述する）９１６を有している。

なお、上記において“揮発性の記憶部”とは、装置の電源がオフされた場合には、記憶内容を消滅してしまう形態の記憶部を意味する。一方、“不揮発性の記憶部”とは、装置のメイン電源がオフされた場合でも、記憶内容を保持し続ける形態の記憶部を意味する。記憶内容を保持し続けることができるものであればよく、半導体製のメモリ素子自体が不揮発性を有するものに限らず、バックアップ電源を備えることで、揮発性のメモリ素子を“不揮発性”を呈するように構成するものであってもよい。

また、半導体製のメモリ素子により構成することに限らず、磁気ディスクや光ディスクなどの媒体を利用して構成してもよい。たとえば、ハードディスク装置を不揮発性の記憶部として利用できる。また、ＣＤ−ＲＯＭなどの記録媒体から情報を読み出す構成を採ることでも不揮発性の記憶部として利用できる。

また、コンピュータシステム９００は、ユーザインタフェースをなす機能部としての指示入力部９０３と、操作時のガイダンス画面や処理結果などの所定の情報をユーザに提示する表示出力部９０４と、各機能部との間のインタフェース機能をなすインタフェース部（ＩＦ部）９０９とを有する。

なお、データ処理結果を印刷出力してユーザに提示する構成とするべく、処理結果を所定の出力媒体（たとえば印刷用紙）に出力する画像形成部９０６を設けることもできる。

指示入力部９０３としては、たとえば、ユーザインタフェース部９８５の操作キー部９８５ｂを利用することができる。あるいは、キーボードやマウスなどを利用することもできる。

表示出力部９０４は、表示制御部９１９と表示装置とを備える。表示装置としては、たとえば、ユーザインタフェース部９８５の操作パネル部９８５ａを利用することができる。あるいは、ＣＲＴ（Cathode Ray Tube；陰極線管）やＬＣＤ（Liquid Crystal Display；液晶）などでなるその他のディスプレイ部を利用することもできる。

たとえば、表示制御部９４２が、操作パネル部９８５ａやディスプレイ部上に、ガイダンス情報や文書入力装置２０が取り込んだ全体画像などを表示させる。また、各種の情報をユーザに通知する際の表示デバイスとしても利用される。なお、表示面上にタッチパネルを有するディスプレイ部とすることで、指先やペンなどで所定の情報を入力する指示入力部９０３を構成することもできる。

インタフェース部９０９としては、処理データ（画像データを含む）や制御データの転送経路であるシステムバス９９１の他、たとえば、画像形成部９０６や他のプリンタとのインタフェース機能をなすプリンタＩＦ部９９６、およびネットワークとの間の通信データの受け渡しを仲介する通信ＩＦ部９９９を有している。

このような構成において、ＣＰＵ９１２は、システムバス９９１を介してシステム全体の制御を行なう。ＲＯＭ９１３は、ＣＰＵ９１２の制御プログラムなどを格納する。ＲＡＭ９１５は、ＳＲＡＭ（Static Random Access Memory ）などで構成され、プログラム制御変数や各種処理のためのデータなどを格納する。また、ＲＡＭ９１５は、所定のアプリケーションプログラムに従って演算して得たデータや外部から取得したデータなどを一時的に格納する領域を含んでいる。

たとえば、追記情報に関するデータ処理機能をコンピュータに実行させるプログラムは、ＣＤ−ＲＯＭなどの記録媒体を通じて配布される。あるいは、このプログラムは、ＣＤ−ＲＯＭではなくＦＤに格納されてもよい。また、ＭＯドライブを設け、ＭＯに前記プログラムを格納してもよく、またフラッシュメモリなどの不揮発性の半導体メモリカードなど、その他の記録媒体にプログラムを格納してもよい。さらに、他のサーバなどからインターネットなどのネットワークを経由してプログラムをダウンロードして取得したり、あるいは更新したりしてもよい。

なおプログラムを提供するための記録媒体としては、ＦＤやＣＤ−ＲＯＭなどの他にも、ＤＶＤなどの光学記録媒体、ＭＤなどの磁気記録媒体、ＰＤなどの光磁気記録媒体、テープ媒体、磁気記録媒体、ＩＣカードやミニチュアカードなどの半導体メモリを用いることができる。記録媒体の一例としてのＦＤやＣＤ−ＲＯＭなどには、追記情報に関するデータ処理機能を実現する際の、一部または全ての機能を格納することができる。

また、ハードディスク装置は、制御プログラムによる各種処理のためのデータを格納したり、自装置で取得したデータや外部から取得したデータなどを大量に一時的に格納したりする領域を含んでいる。

このような構成により、操作キー部９８５ｂを介した操作者による指令にて、前述の追記情報処理方法を実行するプログラムが記憶されているＣＤ−ＲＯＭなどの読取可能な記録媒体からＲＡＭ９１５に追記情報処理プログラムがインストールされ、また操作キー部９８５ｂを介した操作者による指令や自動処理にて追記情報処理プログラムが起動される。たとえば、教材自動採点システム１を実現する場合であれば、教材処理プログラムでは、所定色成分、具体的にはたとえば赤色成分の差分抽出結果を、採点記号８７やコメント８８の記入内容として認識し、かつ両者を分離するようにする処理ステップなどが記述されたプログラムが起動される。

ＣＰＵ９１２は、この追記情報処理プログラムに従って前述の追記情報処理方法に伴う計算処理を施し、処理結果をＲＡＭ９１５やハードディスクなどの記憶装置に格納し、必要により操作パネル部９８５ａ、あるいはＣＲＴやＬＣＤなどの表示装置に出力する。追記情報処理方法を実行するプログラムが記録した記録媒体を用いることにより、既存のシステムを変えることなく、追記情報処理システムを汎用的に構築することができる。

なお、このようなコンピュータを用いた構成に限らず、図１３を用いて示した各機能部の処理をなす専用のハードウェアの組合せにより、追記情報に関するデータ処理機能を行なう追記情報処理装置１０を構成することもできる。

また、たとえば、追記情報に関するデータ処理機能のための各機能部分の全ての処理をソフトウェアで行なうのではなく、これら機能部分の一部を専用のハードウェアにて行なう処理回路９０８を設けてもよい。ソフトウェアで行なう仕組みは、並列処理や連続処理に柔軟に対処し得るものの、その処理が複雑になるに連れ、処理時間が長くなるため、処理速度の低下が問題となる。

これに対して、ハードウェア処理回路で行なうことで、高速化を図ったアクセラレータシステムを構築することができるようになる。アクセラレータシステムは、処理が複雑であっても、処理速度の低下を防ぐことができ、高いスループットを得ることができる。

たとえば、追記情報に関するデータ処理機能を実現する場合であれば、処理回路９０８としては、図１３に示した読取画像処理部１１０に相当する読取画像処理部９０８ａ、文書原本特定部１２０に相当する文書原本特定部９０８ｂ、追記情報抽出部１３０に相当する追記情報抽出部９０８ｃ、データ処理対象追記情報特定処理部１５０に相当するデータ処理対象追記情報特定処理部９０８ｄ、あるいはデータ処理部１７０に相当するデータ処理部９０８ｅなどをハードウェアで構成するとよい。

以上、本発明について実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、そのような変更または改良を加えた形態も本発明の技術的範囲に含まれる。

また、上記の実施形態は、クレーム（請求項）にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組合せの全てが発明の解決手段に必須であるとは限らない。前述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜の組合せにより種々の発明を抽出できる。実施形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られる限りにおいて、この幾つかの構成要件が削除された構成が発明として抽出され得る。

たとえば、歪み補正処理や途切れ補正処理などは、必ずしも必須ではない。また、処理対象の追記済文書８Ｂの一例として記入済帳票７１や付加情報記入済教材８１や付加情報記入済手帳９１を例に説明したが、これらは一例に過ぎず、データ処理対象となる追記情報が含まれているものであれば、その文書の種別は問わない。

また、先にも述べたが、処理対象の追記済文書８Ｂは、紙媒体を用いることに限定されず、最初から追記済文書８Ｂを電子データの形式で入手する態様の場合であっても、データ処理対象となる追記情報が含まれているものであれば、上述した仕組みを同様に適用することができる。

本発明に係る追記情報処理において処理対象とする文書の一例である帳票を示す図である。本発明に係る追記情報処理において処理対象とする文書の一例である教育用教材を示す図である。本発明に係る追記情報処理において処理対象とする文書の一例である手帳を示す図である。比較対象としての従来の文書原本情報登録処理を説明する図（その１）である。比較対象としての従来の文書原本情報登録処理を説明する図（その２）である。データ処理対象追記情報とデータ処理用の属性情報とを対応付ける仕組みの第１例を説明する図である。解析対象領域の領域サイズを決定する第１の手法を説明する図である。解析対象領域の領域サイズを決定する第２の手法を説明する図である。領域取得方向を決定する手法を説明する図である。文字認識結果の検索処理（Ｓ２０）において、複数の候補が見つかったときの対処方法を説明する図である。データ処理対象追記情報とデータ処理用の属性情報とを対応付ける仕組みの第２例を説明する図である。第２例の対応付け手法において適用する、データ処理対象追記情報の文書中の位置決定手法を説明する図である。本発明に係る追記情報処理装置を備えてなる情報処理システムの一実施形態の構成例を示す図である。教材自動採点システムにおける教材処理方法の全体概要をシステム構成図と対応付けて示した図である。データ処理対象追記情報と属性情報（問題や配点）との対応を取ってデータ処理を実行する点に着目したフローチャートである。教材自動採点システムにおける全体の処理手順を示すフローチャートである。文書作成装置や追記情報処理装置を、電子計算機を用いて構成する場合のハードウェア構成の一例を示した図である。

符号の説明

１…教材自動採点システム、８Ａ…文書原本、８Ｂ…追記済文書、９…差分情報、１０…追記情報処理装置、２０…文書入力装置、３０…文書管理サーバ、４０…処理結果保存サーバ、５０…文書原本作成装置、７０…帳票、７１…記入済帳票、８０…教育用教材、８１…付加情報記入済教材、８７…採点記号、８８…コメント、９０…手帳、９１…付加情報記入済手帳、９７…予定、９８…コメント、９９…分類記号、１１０…読取画像処理部、１１２…画像データ解析部、１１４…歪み補正部、１２０…文書原本特定部、１２２…教材特定部、１２３…識別情報解析部、１２４…コード情報解析部、１３０…追記情報抽出部、１３２…差分抽出部、１３４…解答者抽出部、１３６…手書き情報切出部、１３８…文字認識処理部、１４０…データ処理用追記情報抽出処理部、１５０…データ処理対象追記情報特定処理部、１５４…第１データ処理用追記情報認識部、１５５…分離認識処理部、１５６…図形形状認識部、１５７…文字認識処理部、１５９…記入順序対応付処理部、１６４…第２データ処理用追記情報認識部、１６６…図形形状認識部、１６７…文字認識処理部、１６９…記入順序対応付処理部、１７０…データ処理部、１７０_1…第１データ処理部、１７０_2…第２データ処理部、１７１…ユーザ端末、１７２…採点集計部、１７４…集計結果出力部、１７６…コメント分類処理部、１７８…コメント処理結果出力部

Claims

データ処理内容と関わりを持つ所定の属性情報が記載されている文書原本にさらに前記属性情報に対応して付加情報が追記された追記済文書を処理対象として、前記付加情報に基づいて前記属性情報と対応する所定のデータ処理を行なう追記情報処理装置であって、
前記追記済文書中の注目する前記付加情報の近傍に存在する文字列を文字認識し、この文字認識により得られる認識文字列のうち順番に関わる順序情報を、前記文書原本のレイアウトを考慮して、前記注目する付加情報に対応付けることにより、前記属性情報の順番付けを特定する順序対応付処理部と、
前記注目する付加情報の順番付けを、前記順序対応付処理部が特定した前記属性情報の順番付けと対応させながらデータ処理を行なうデータ処理部と
を備えたことを特徴とする追記情報処理装置。
前記順序対応付処理部は、前記文字認識により得られる認識文字列を検索キーとして、前記属性情報を登録してあるデータベースにアクセスして、データ処理内容と関わりを持つ所定の属性情報が記載されている前記文書原本のテキスト情報から、順番に関わる順序情報を検索することで、前記注目する付加情報に対応する前記属性情報の順番付けを特定する
ことを特徴とする請求項１に記載の追記情報処理装置。
前記データベースは、前記属性情報に含まれる前記順番付けを示す順序情報と対応付けて第２の属性情報が登録されており、
前記順序対応付処理部は、前記注目する付加情報について、前記特定した属性情報に含まれる順序情報を検索キーとして前記データベースから検索することで前記注目する付加情報に対応する前記第２の属性情報を特定し、この特定した第２の属性情報と対応するデータ処理を行なう
ことを特徴とする請求項２に記載の追記情報処理装置。
前記データベースは、前記属性情報を、当該属性情報に含まれる順序情報に従って順番付けて前記データベースに登録しており、
前記順序対応付処理部は、検索された前記認識文字列の前記データベース上の順番に基づいて、前記注目する付加情報の順番付けを特定する
ことを特徴とする請求項２に記載の追記情報処理装置。
データ処理内容と関わりを持つ所定の属性情報が記載されている文書原本にさらに前記属性情報に対応して付加情報が追記された追記済文書を処理対象として、前記付加情報に基づいて前記属性情報と対応する所定のデータ処理をコンピュータを用いて行なうためのプログラムであって、
前記コンピュータを、
前記追記済文書中の注目する前記付加情報の近傍に存在する文字列を文字認識し、この文字認識により得られる認識文字列のうち順番に関わる順序情報を、前記文書原本のレイアウトを考慮して、前記注目する付加情報に対応付けることにより、前記属性情報の順番付けを特定する順序対応付処理部と、
前記注目する付加情報の順番付けを、前記順序対応付処理部が特定した前記属性情報の順番付けと対応させながらデータ処理を行なうデータ処理部
として機能させることを特徴とするプログラム。