以下、図面を参照して本発明の実施形態について詳細に説明する。
<処理対象文書の例>
図1〜図3は、本発明に係る追記情報処理装置を備えてなる情報処理システムにおいて処理対象とする文書の一例を示す図である。何れも、文書原本8Aを(A)に、追記済文書8Bを(B)に示す。また、データベースへの登録情報の一例を(C)に示す。
先ず図1に示す第1例の文書は、特許文献1,2に記載の仕組みと同様に、自動帳票処理に供される定型伝票(いわゆる帳票)であって、図1(A)はその文書原本8Aを示し、図1(B)は、追記情報が記入された状態(追記済文書8B)を模式的に示している。
帳票70は、自動帳票処理時の処理対象データを記入する勘定科目や摘要欄や金額欄などの記入欄74と、帳票70を識別特定するための情報を記入する識別情報欄75と承認欄76とを有している。
たとえば、伝票処理現場では、図1(A)に示した文書原本8Aの一例である帳票70を処理対象として、勘定科目や摘要欄や金額欄などの記入欄74に、所要の処理データ77を追記していく。この際には、通常、帳票70で使用されている文字画像色と、処理データ77の記入に使用するペン色とは、異なるものが使用される。
なお、処理データ77を対象とした自動帳票処理を実行するための帳票70(原本画像)のデータベースへの登録に当たっては、処理データ77についてのデータ処理時に必要となる記入欄74の位置情報や項目などを示す記入欄位置領域情報38を登録しておく。
たとえば、図1(C)に示すように、記入欄位置領域情報38の一例である帳票欄位置領域情報を、帳票70上に存在する勘定科目や摘要や金額などの項目と、各項目を記入する記入欄74として扱われる領域の所定点(たとえば左上頂点)のxy座標(xltα,yltα)、並びに、対角側の所定点(たとえば右下頂点)のxy座標(xrbα,yrbα)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。あるいは、領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積してもよい。
なお、記入済帳票71に対応する元の帳票70が文書管理サーバに登録されていないときには、無記入の帳票70を文書入力装置で読み取り、記入欄74の位置や項目などを特定することにより対処してもよい。
また、図2に示す第2例の文書は、教育現場で紙媒体として使用される教育用教材80であって、典型例として、問題文82およびその解答欄84(本例では括弧で示された部分)を有したものであり、図2(A)はその文書原本8Aを示し、図2(B)は、追記情報記入済の状態(追記済文書8B)を模式的に示している。
このような教育用教材80は、具体的には教育機関で用いられるペーパーテストや練習問題シートなどが該当する。なお、教育用教材80は、少なくとも解答欄84を有していればよく、たとえば採点官が読み上げた問題について解答欄84に解答を記入する場合などがあり、問題文82については必ずしも記載されていなくともよい。
また、図2(A)に示すように、教育用教材80は、問題文82および第1種の付加情報の一例である解答が記入される解答欄84の他に、配点欄83(問題別の項目点欄83aや部分点欄や合計点欄でなる集計欄83b)と、第1種の付加情報の一例である教育用教材80を識別特定するための情報を記入する識別情報欄85と、第1種の付加情報の一例である解答者情報であって解答欄84への解答記入者に関する情報を記入する解答者情報欄86とを有している。解答欄84、識別情報欄85、解答者情報欄86は、何れも第1種の付加情報を記入する記入欄の一例である。
識別情報欄85には、たとえば教育用教材80の科目、タイトル、あるいは適用学年などが予め記載されるものとする。ただし、これらの記載に加えて、またはこれらの記載とは別に、教育用教材80を識別するためのコード情報が埋め込まれていてもよい。
コード情報の埋込みは、公知技術を利用して実現すればよいが、その一つの具体例として、たとえば「iTone(登録商標)」と呼ばれるもののように、階調表現としての万線スクリーンまたはドットスクリーンを構成する画素の形態(位置、形状など)を変化させることで、ハーフトーン画像の中にデジタル情報を埋め込むようにする、といった技術を用いることが考えられる。一方、解答者情報欄86には、解答記入者の学級86a、出席番号86b、あるいは氏名86cなどが記入され得るようになっている。
配点欄83(特に項目点欄83a)には、各解答欄84についての配点情報が記入される。配点情報とは、教育用教材80における各解答欄84について、各位置の解答欄84への配点が何点であるかを特定するための情報である。なお、配点は、解答欄84ごとに異なっていてもよいし、あるいは一律であってもよい。
このような教育用教材80は、対応する原本(教材原本)の電子データに基づき印刷装置で印刷出力することで得ることができる。教材原本の電子データは、たとえばパーソナルコンピュータなどの電子計算装置を利用してワープロソフトなどのアプリケーションソフトウェアを用いて生成することができ、予め所定のデータベースなどに保存される。
なお、教材原本の電子データは、その教育用教材80における解答欄84や識別情報欄85などのレイアウトを特定し得るものであり、かつ、所定のデータベースにて保持蓄積可能なものであれば、そのデータ形式を問わない。たとえば、文書作成ソフトウェアで作成したアプリケーション文書データに限らず、画像データであってもよい。
教育現場では、図2(A)に示した文書原本8Aの一例である教育用教材80が生徒や受験者などに配布され、先ず、生徒などによって解答者情報欄86への氏名や解答欄84への解答などの第1種の付加情報が所定欄に記入された後に回収される。この後さらに、図2(B)に示す追記済文書8Bの一例である付加情報記入済教材81のように、教師などの採点官によって各解答欄84に記入された解答に対する採点記号(正誤判定図形)87や採点記号87と関連するその他の図形や文章で示されたコメント88などの第2種の付加情報が記入される。なお、追記情報処理装置10で自動採点処理を行なうので、この時点では、採点官による配点欄83Cへの記入はない。
この際には、通常、生徒などによる第1種の付加情報の記入に使用されるペン色と、採点官などによる第2種の付加情報の記入に使用されるペン色とは、異なるものが使用されるし、教育用教材80として予め記入されている色とも異なるものが使用される。
また、採点記号87としては、たとえば、正解を示す「○」やその他の図形(たとえば楕円図形)、不正解を示す「×」やその他の図形(たとえば「レ点」などのチェックマーク)、あるいは一部正解を示す「△」やその他の図形がある。
コメント88は、採点記号87を元にした第1のデータ処理には直接的な関係を有しない情報であるが、第1のデータ処理の結果をサポート(補強)するあるいは全く関係のない第2のデータ処理に利用されるものである。
教材自動採点システムでは、この追記済文書8Bの一例である付加情報記入済教材81を対象として所定のデータ処理を行なうことになる。この際、第2種の付加情報(本例では採点記号87とコメント88)の別に、それぞれに応じた個別のデータ処理を行なうようにする。この例では、第1のデータ処理として採点記号87を元にした自動採点処理を行なう。この自動採点処理結果として、たとえば、配点欄83Cへ記入する得点情報が取得されることになる。また、コメント88の追記内容を元にした自動採点処理結果とは別の第2のデータ処理を行なう。
自動採点処理とは別の第2のデータ処理としては、たとえば、コメント88の追記内容を所定の条件に基づいて分類する処理や、分類したコメント(全ての追記内容には限らず一部の追記内容でもよい)を対応する解答欄84についての採点処理結果と関連付けて生徒指導用データベースに登録・蓄積しておく処理などを行なう。
こうすることで、自動採点処理とは別の第2のデータ処理の利用形態としては、生徒指導用データベースから情報を取り出して、後の生徒指導に利用することができるようになる。たとえば、全ての採点結果と対応するコメントを表示するようにすれば、優秀、優、並、劣、などの評価の細分類と合わせて採点結果を確認することができる。また、結果が不正解のコメントのみを表示するようにすれば、問題の読み間違えが多い、解答の書き間違えが多い、あるいは計算ミスが多いなどの生徒の能力分析に利用することもできる。あるいは、コメント88で示されている注意文やミス修正に基づき生徒指導に利用することも考えられる。
なお、採点記号87やコメント88を対象としたデータ処理を実行するための教育用教材80(原本画像)のデータベースへの登録に当たっては、採点記号87についてのデータ処理時に必要となる解答欄84の位置情報や問題番号や配点情報などを示す記入欄位置領域情報38と、コメント88についてのデータ処理時に必要となる分類基準情報とを登録しておく。
たとえば、図2(C)に示すように、記入欄位置領域情報38の一例である解答欄位置領域情報を、教育用教材80上に存在する問題の番号と、その問題の解答に対する配点と、その問題の解答を記入する解答欄84として扱われる領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。
なお、付加情報記入済教材81に対応する元の教育用教材80が文書管理サーバに登録されていないときには、無記入の教育用教材80を文書入力装置で読み取り、解答欄84の位置や配点などを特定することにより対処してもよい。
また、図3に示す第3例の文書は、ビジネスマンなどが使用するビジネス文書であって、典型例として、スケジュール管理用の手帳90を示している。一般的な手帳90では、日付(年月日)欄92と、各日付における予定97を記入する予定欄94を有しており、図3(A)はその文書原本8Aを示し、図3(B)は、追記情報記入済の状態(追記済文書8B)を模式的に示している。なお、図3(A)では、予定97を記入するための予定欄94が日付単位で区分けされた例で示しているが、さらに、各日付内の時間(時刻)単位で区分けしたものもある。予定欄94は第1種の付加情報を記入する記入欄の一例であり、この予定欄94には、たとえば、該当日時に実行すべき予定97が記入され得るようになっている。
このような手帳90は、市場で購入することができるし、あるいは対応する原本(手帳原本)の電子データに基づき印刷装置で印刷出力することで得ることもできる。手帳原本の電子データは、たとえばパーソナルコンピュータなどの電子計算装置を利用してワープロソフトなどのアプリケーションソフトウェアを用いて生成することができ、予め所定のデータベースなどに保存される。
なお、手帳原本の電子データは、その手帳90における日付欄92や予定欄94などのレイアウトを特定し得るものであり、かつ、所定のデータベースにて保持蓄積可能なものであれば、そのデータ形式を問わない。たとえば、文書作成ソフトウェアで作成したアプリケーション文書データに限らず、画像データであってもよい。
ビジネス現場では、図3(A)に示した文書原本8Aの一例である手帳90を身近におき、先ず、所有者によって予定欄94への予定97(第1種の付加情報)が該当日時の予定欄94に記入される。このとき、さらに、図3(B)に示す追記済文書8Bの一例である付加情報記入済手帳91のように、所有者自らによって各予定欄94に記入された予定97に対する分類記号99(たとえば社用と私用の区別をするもの)や予定97と関連するその他の図形や文章で示されたコメント98などの第2種の付加情報が記入される。
この際には、通常、手帳90で使用されている文字色と、予定97やコメント98の記入に使用するペン色とは、異なるものが使用される。
分類記号99としては、たとえば、私用(Private use )を示す「P」やその他の文字・図形(たとえば◇マークなど)がある。私用にのみ分類記号99を付すことで、社用(Business use)については、特に分類記号99を付さなくてもよい。
また、コメント98は、予定97を元にした第1のデータ処理には直接的な関係を有しない情報であるが、第1のデータ処理の結果をサポート(補強)するあるいは全く関係のない第2のデータ処理に利用されるものである。
分類記号99を含むコメント98は、一般的なビジネス文書における追記内容(付加情報記入済手帳91の例では予定97に相当)に対しての校正記号としての意味を持ち、このコメント98を利用することで、予定97を所定の条件に基づいて編集することができるようになる。
たとえば、個人情報管理システムでは、この追記済文書8Bの一例である付加情報記入済手帳91を対象として所定のデータ処理を行なうことになる。この際、第2種の付加情報(本例ではコメント98に基づく予定97の種類)の別に、それぞれに応じた個別のデータ処理を行なうようにする。この例では、第1のデータ処理とし予定97の内容を元にした自動スケジュール管理処理(予定97の電子データ化)を行ない、またコメント98の追記内容を元にした自動スケジュール管理処理そのものとは別の第2のデータ処理を行なう。
自動スケジュール管理処理そのものとは別の第2のデータ処理としては、たとえば、コメント98(分類記号99を含む)の追記内容に従って、第1のデータ処理としての自動スケジュール管理処理結果を社用と私用とに分類する処理や、分類した予定97(全ての追記内容には限らず一部の追記内容でもよい)を対応する日付と関連付けてデータベースに個別に登録・蓄積しておく処理などを行なう。
こうすることで、社用スケジュールと私用スケジュールをと切り分けてデータベース上で管理することができるようになる。それぞれのデータベースの公開と非公開とを個別に設定することができるようになるので使い勝手がよくなる。
特開平5−216932号公報に記載の仕組みでは、予定欄94に記入された内容の全てについて単一の処理がなされ、この例では、仕事の予定もプライベートの予定も、全て区別無く1つのデータベースとして登録されることになる。このため、たとえば、仕事のスケジュールを公開・共有しようとしたときには、公開したくないプライベートの予定までもが公開されてしまう不都合が生じるのと大きく異なる。
なお、予定97やコメント98を対象としたデータ処理を実行するための手帳90(原本画像)のデータベースへの登録に当たっては、予定97やコメント98についてのデータ処理時に必要となる予定欄94の位置情報などを示す記入欄位置領域情報38と、コメント98についてのデータ処理時に必要となる分類基準情報とを登録しておく。
たとえば、図3(C)に示すように、記入欄位置領域情報38の一例である予定欄位置領域情報を、手帳90上に存在する日付(年月日)と、各日付内の時間(時刻)と、予定97を記入する予定欄94として扱われる領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。
なお、追記情報について自動データ処理を実行する際に、追記情報を複数種類のものに分類し、それぞれの分類ごとに個別のデータ処理を実行しようとする場合には、各追記情報を他方のものと分離して認識・特定することが必要となる。両者の分離認識が適正になされないと、それぞれのデータ処理を適正に実行することができなくなる。
たとえば、図2に示した付加情報記入済教材81の場合には、採点記号87に基づく自動採点処理と、コメント88に基づく生徒指導用データベースの構築処理があり、このような個別処理を実現するには、採点記号87とコメント88とを区別して認識処理などを行なってから最終的なデータ処理を行なう必要がある。
一方、答案の採点においては、採点記号87以外のコメント88を、採点記号87と同じペンで記載することがあり、たとえば差分抽出部132での抽出結果に対する色成分認識処理を通じて、ペン色と対応する所定色成分についてのものを抽出するだけでは、両者を適切に分離した認識と記載内容の特定ができない。採点記号87とコメント88とを適切に分離できず、自動採点処理に悪影響を及ぼす。また、追記情報としては、自動採点処理用の採点記号87の他に、生徒指導などにも利用し得るコメント88が存在するにも関わらず、付加情報記入済教材81を生徒に返却した後には、生徒がその記載内容を確認する以外には活用できない事態となる。
また、図3に示した付加情報記入済手帳91の場合には、予定97に基づく自動スケジュール管理処理(予定97の電子データ化)と、コメント98(分類記号99を含む)に基づく社用スケジュールと私用スケジュールの個別データベース構築処理があり、このような個別処理を実現するには、予定欄94に記入された予定97とコメント98とを区別して抽出し、認識処理などを行なってから最終的なデータ処理を行なう必要がある。
一方、記入されたスケジュールの電子データ化とデータベースへの登録においては、予定97以外のコメント98を予定97と同じペンで記載することがあるし、また、各予定97を記入する時点が異なることも起こり得る、つまり、予定97の記入に使用されるペン色は様々であり、かつ予定97とコメント98とを切り分けて別のペン色が使用されるとは限らない。この場合、たとえば差分抽出部132での抽出結果に対する色成分認識処理を通じて、ペン色と対応する所定色成分についてのものを抽出するだけでは、両者を適切に分離した抽出ができない。
このような事態を避けるには、たとえば、追記済文書8B中に存在する複数の付加情報を、記載位置、画像特徴量、あるいは認識処理時の信頼度などの付加情報が持つ様々な特徴に基づいて、複数の種類に分類(分離)するようにするのがよい。この際、付加情報が持つ単一の特徴に基づくだけでなく複数の特徴を参照することで、より正確な分離認識を行なうようにするのがよい。なお、これらについては詳細な説明を割愛する。
<<文書原本作成登録処理方法>>
図4〜図8は、文書原本8Aを作成し、作成した文書原本8Aをデータベースに登録する手法を説明する図である。ここで、図4および図5は、比較対象としての従来の文書原本作成登録処理を説明する図である。また、図6〜図8は、本実施形態の文書原本作成登録処理を説明する図である。
文書に追記された付加情報について自動データ処理を効率的に実行するには、各追記情報がどのような位置に追記されたものであるかを特定することが重要であり、このためには、文書原本だけでなく、記入欄の位置情報をデータベースに登録しておく。また、場合によって、位置情報だけでなく、どのような目的で追記されたものであるかを特定することも必要となり、この場合には、記入欄に対応するその他の属性情報などの自動処理用情報をデータベースに登録しておく。
そして、追記情報に基づく自動データ処理時には、文書上の各記入欄の位置情報を取得し、この位置情報と追記情報とを対応付けてデータ処理を実行することになる。
<従来方法>
たとえば、図4は、富士通(株)による帳票管理用のOCRソフト「DynaEye V4.0」における例を示す(たとえばユーザーズガイドのp8,p57 など参照)。図4に示すように、従来の文書原本作成登録処理においては、先ず文書原本8Aを作成し、この文書原本8Aにおけるデータ処理対象の追記情報を記入するための記入欄の位置の情報や記入項目などの属性情報を設定し、これらの情報を文書原本8Aの電子データ(文書ファイルや画像データなどの原本画像)と対応付けて帳票情報データベースに登録する。
たとえば、付加情報記入済教材81をデータ処理対象とする教材自動採点システムにおいては、出題者(教師など)はワードプロセッサなどを利用して文書原本8Aとして問題用紙を作成する。
このとき、各問題文には設問番号を割り付け、その問題文に対する解答の記入欄(解答欄84)や解答に対する配点を割り付ける問題別の項目点欄83aや部分点欄や合計点欄でなる集計欄83bなどの配点欄83を設定する。
自動採点処理時には、各採点記号87が何れの解答欄84に対するものであるかを特定し、またその採点記号87に応じて配点を加算処理することで得点を集計するので、これらの対応付けのために、各解答欄84の領域情報(教育用教材808A上の位置情報)と設問番号との対応をとってデータベースに登録しておくことが必要になる。
また、複数種類の文書原本8Aに対応するには、各文書原本8Aに対して識別情報を付与しておくことが必要になる。たとえば、教材自動採点システムにおいては、付加情報記入済教材81(答案)の通し番号(答案特定コード)を識別情報として設定する。その他の一般的な帳票であれば帳票特定コードを設定する。
そして、追記情報処理装置における自動採点処理や自動帳票処理などの自動データ処理時には、文書原本8Aに対して所定の付加情報が追記された追記済文書8Bの電子データを取得し、その追記済文書8Bに対応する文書原本8Aを特定し追記済文書8Bとの差分を取って追記情報を抽出する。そして、この抽出した追記情報がどのような記入欄に追記されていたのかを特定しつつ、各追記情報に基づいて所要のデータ処理を実行する。
たとえば、自動採点処理であれば、付加情報記入済教材81をスキャナで読み取り、その付加情報記入済教材81に埋め込まれている答案特定コードを抽出することで対応する教育用教材80を特定する。あるいは、識別情報欄85に記入されている情報を文字認識などして対応する教育用教材80を特定する。
同様に、自動伝票処理であれば、記入済帳票71をスキャナで読み取り、その記入済帳票71に埋め込まれている帳票特定コードを抽出することで対応する帳票70を特定する。あるいは、識別情報欄75に記入されている情報を文字認識などして対応する帳票70を特定(帳票認識という)する。
ここで、文書原本8Aと自動処理用情報をデータベースに登録しておくには、前述のように記入欄の位置情報やその他の様々な情報を設定して登録する必要があり、その作業を操作者が逐一実行するのは大変な労力を要する。
たとえば、教育用教材80に関する自動処理用情報を登録する際には、数ある答案の1つ1つについて、図5に示すように、教育用教材80の各設問について、問題番号と、配点と、その設問に対する解答欄84の領域、たとえば解答欄84として扱われるxy座標上の範囲、たとえば左上頂点(xltα,yltα)と右下頂点(xrbα,yrbα)(αは設問番号を通し番号に変換した問題番号)の座標を、1つ1つ入力しなければならない。この入力結果を受けて、図2(C)に示したような形態で、記入欄位置領域情報38がデータベースに登録される。
また、各解答欄84に対応する問題文や配点などの属性情報の内、問題文に関しては自動採点処理時には直接には必要ないが配点に関しては必要になるので、自動採点処理に必要となる属性情報として配点の情報についても登録しておくことが望まれる。
ワードプロセッサなどの電子的な文書作成手段を用いた場合には、ソフト(アプリケーションプログラム)によっては座標位置や配点を自動取得できる可能性があるので、これらの入力を手作業で行なうことを多少割愛できる可能性があるが、白紙用紙上にペンで記入して作ったいわゆる手作りの問題用紙の場合、全ての情報を手入力しなければならない。もちろん、座標位置や配点を自動取得できないソフトであれば、ワードプロセッサなどで作成した場合でも各種の情報を手入力することが必要になる。
このように、従来の仕組みでは、自動データ処理を効率的に実行するためには、事前に文書原本8Aについて各記入欄の位置情報や対応する属性情報の内データ処理に必要となるものについて登録することが必要となり、その登録作業の負担が大きく、登録作業を効率的に実行することが困難である。
<本実施形態の方法>
本実施形態では、この点を解消するべく、記入欄を予め定義付けておいた定型文書としてのテンプレートを利用して文書原本8Aを作成することで、特に記入欄の位置情報の登録作業を効率的に実行できる仕組みを採ることにした。以下、この点について詳細に説明する。
先ず、図6は、テンプレートを利用して自動データ処理に供される文書原本8A(たとえば教育用教材80)を作成してから対応する追記済文書8B(たとえば付加情報記入済教材81)について自動データ処理を実行するまでの過程を示したフローチャートである。また、図7および図8は、本実施形態の文書原本作成登録処理において使用するテンプレートおよびデータベースへ登録する情報の一例を説明する図である。
<テンプレート登録>
先ず、白紙用紙上の任意位置に記入欄6aを設定する作業を繰り返すことで、図7(A)や図8(A)に示すように、多数の記入欄6aが所定位置に設けられたテンプレート(定型文書)6を作成する(S10)。そして、各テンプレート6を一意に特定するテンプレート特定コードを付与して、このテンプレート6の情報を記入欄位置領域情報68として、テンプレート6に関する情報を記憶保持するテンプレート情報データベースDB1に登録する(S16,S18)。
このとき、各記入欄6aの領域情報、たとえば記入欄6aとして扱われるxy座標上の範囲を特定する、たとえば左上頂点(xltβ,yltβ)と右下頂点(xrbβ,yrbβ)(βは記入欄の通し番号)の座標を1つ1つ入力する(S12)。
この入力結果を受けて、図7(B)や図8(B)に示すように、記入欄位置領域情報68が、テンプレート6上に存在する記入欄6aの番号と、記入欄6aとして扱われる領域の所定点(たとえば左上頂点)のxy座標(xltα,yltα)、並びに、対角側の所定点(たとえば右下頂点)のxy座標(xrbα,yrbα)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。あるいは、領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積してもよい。
たとえば、図7(A)に示すテンプレート6は、図2(A)に示した教育用教材80を作成するのに適したテンプレート6を示しており、24個の記入欄6aが設けられるとともに、テンプレート6を特定するテンプレート特定コードが左上に記載されている。なお、この識別コードは数字やバーコードを利用したものでもよいし、「iTone(登録商標)」などを利用した埋込コードとしてもよい。
ここで、図7(A)に示したテンプレート6では、少なくとも、図2(A)に示した教育用教材80における各解答欄84に対応する各位置に記入欄6aが設けられている。また、図2(A)に示した教育用教材80では解答欄84として使用されない記入欄6a(たとえば4,6,9,14,17,19,21,23番目のもの)も存在している。
なお、テンプレート6は1つに限らず、記入欄6aの数や位置がそれぞれ異なる多数のテンプレート6を用意しておくのがよい。このときには、たとえば教材自動採点システム用の文書原本8Aを考慮する場合であれば、教科や問題種類(計算、文章題、選択問題など)などを考慮して各記入欄6aの領域(位置やサイズ)が適応するようにレイアウトされたものを用意しておくのがよい。
また、テンプレート6は、少なくとも、記入欄6aを予め定義付けておくものであればよいが、実際に使用される文書原本8Aを考慮して、記入欄6a以外の情報(記入欄6aに対応する属性情報やその他の汎用追加情報)の内、データ処理に必要となる属性情報や汎用追加情報も予め定義付けておいてもよい。
たとえば、教育用教材80用のテンプレート6とする場合であれば、図8(A)に示すように、解答欄84として使用される記入欄6aの他に、部分点・合計点数などを記入するための集計欄83bとして使用される記入欄6a(17〜20番目)を用意したり、各記入欄6aに配点や部分点・合計点数など自動採点処理に必要な答案情報を予め定義付けておいたりしてもよい。
この場合、各記入欄6aの領域情報を1つ1つ入力したのと同様に、後に解答欄84として使用される位置の各記入欄6aについては配点を1つ1つ入力するとともに、後に集計欄83bとして使用される位置の記入欄6aについては部分点や合計点を入力するなど、自動採点処理に必要な答案情報を入力する(S14)。
この入力結果を受け、図8(B)に示すように、記入欄位置領域情報68が、テンプレート6上に存在する記入欄6aの番号と、記入欄6aとして扱われる領域の所定点(たとえば左上頂点)のxy座標(xltα,yltα)、並びに、対角側の所定点(たとえば右下頂点)のxy座標(xrbα,yrbα)と、解答欄84に対応する記入欄6aに対する配点と、集計欄83bに対応する記入欄6aに対する採点(部分点や合計点)などのからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積される。
<文書原本生成>
次に、データベースにアクセスして、データベースに登録したテンプレート6の中から所要のものを選択する(S20,S22)。そしてこの選択したテンプレート6を利用して、テンプレート6に所望の情報を追加することで文書原本8Aを生成する(S24)。たとえば、テンプレート6上の各記入欄6aについて、その記入欄6aに対応した所望の情報(特に属性情報という)を追加する。
たとえば、図7(A)に示したテンプレート6をデータベースから読み出して、文書原本8Aとして図2(A)に示した教育用教材80を生成する場合であれば、問題文や配点やその他の情報を各記入欄6aについて追記していく。
また、アンケート用紙を文書原本8Aとして生成する場合であれば、後にアンケート回答欄となる記入欄6aに対応付けて、アンケート文を追記する。また、必要に応じて、記入欄6aに括弧や枠などの飾り付けを行なう。
なお、全ての記入欄6aについて、属性情報を追加することは必須ではなく、必要なものについてのみ使用すればよい。たとえば、教育用教材80であれば、問題文や配点を対応付けて追記することで記入欄6aを解答欄84として使用するが、問題文や配点を対応付けない未使用の記入欄6aがあってもかまわない。この場合、事実上未使用の記入欄6aに括弧や枠などの飾り付けを行なわなければ、教育用教材80として、記入欄6aが邪魔になることはない。
また、完成された文書原本8Aとして必要なその他の汎用追加情報を追記する。たとえば、文書原本8Aを識別特定するためのタイトル文字や図形、あるいは記入者欄や、その他の欄を追加する。たとえば、図2(A)に示す教育用教材80を生成する場合であれば、タイトルなどを記入する識別情報欄85や解答者情報欄86や集計欄83bなどを設けるし、アンケート文を生成する場合であれば、アンケートのタイトル文字を追加する。
こうすることで、たとえば、図2(A)に示す教育用教材80を生成する場合であれば、各記入欄6a(解答欄84)に対して、配点を設定でき、また、部分点・合計点数など自動採点処理に必要な答案情報も設定でき、これらの情報(テンプレート関連付け情報69)を、文書原本8Aに関する情報を記憶保持する文書原本情報データベースDB2に登録しておくことができる(S26,S28)。なお、テンプレート6に関する情報を登録するテンプレート情報データベースDB1と文書原本8Aに関する情報を登録する文書原本情報データベースDB2とを兼用するデータベース構成としてもよい。
つまり、記入欄6aが予め定義されていて、その位置情報がテンプレート情報データベースDB1に登録されているテンプレート6を使用して、記入欄6aに対応する問題文や配点やその他の情報を追加設定して文書原本8Aを完成させ(S20〜S24)、文書原本8Aを一意に特定するための文書原本特定コードを付して、またベースとしたテンプレート6との対応付けを取るためのテンプレート関連付け情報69とともに文書原本情報データベースDB2に登録する(S26,S28)。
テンプレート関連付け情報69の文書原本情報データベースDB2への登録に当たっては、ワープロ機器やパソコンなどの電子的な文書作成ツールを使用する場合であれば、作成した文書原本8Aや記入欄6aに対応する属性情報をそのまま情報処理システム側に指示をすればよい。また、作成した文書原本8Aを印刷出力する場合でも、印刷された文書原本8Aを読み取ってテンプレート特定コードを特定することで、解答欄84の位置情報を特定し、また文字認識することで、解答欄84の配点情報などを特定して登録することもできる。
このように、予め記入欄6aが定義づけられたテンプレート6を用意しておき、所望のテンプレート6を使用して文書原本8Aを作成する際には、問題文や配点などの記入欄6aと対応する属性情報やタイトルなどのその他の汎用追加情報を追記すればよく、少なくとも記入欄6aの領域情報(位置情報)を逐一入力する必要がなく、記入欄6aについての位置情報指定の負担がない。
テンプレート情報データベースDB1には、テンプレート6上に存在する全ての記入欄6aの位置情報が事前に登録されているので、文書原本8Aの作成時にベースとしたテンプレート6を特定することができれば、作成した文書原本8A上に存在する全ての記入欄74や解答欄84や予定欄94など、ベースとしたテンプレート6における記入欄6aの位置を特定することができるので、記入欄6aに関して追記されたデータ処理対象の追記情報に基づいて適正なデータ処理を実行することができる。
たとえば、テンプレート6を利用して作成した文書原本8Aをデータベースに登録して利用する形態では、問題文や配点などの記入欄6aと対応する属性情報やタイトルなどのその他の汎用追加情報が追加された状態の文書原本8Aの電子データ(文書ファイルや画像データ)と、作成した文書原本8Aを特定する文書特定コードとともに、ベースとしたテンプレート6を特定するテンプレート特定コードを対応付けてデータベースに登録しておくだけで済む。
なお、このとき、文書原本8Aの種類によっては、さらにデータ処理時に必要となる記入欄6aと関連した属性情報やその他の汎用追加情報も登録しておくのがよい。たとえば、図2(A)に示した教育用教材80であれば、図7(C)に示すように、教育用教材80上に存在する問題の番号と、その問題の解答に対する配点と、各記入欄6aとを対応付ける情報で、これらを互いに関連付けるテーブル形式で、テンプレート関連付け情報69として、所定の格納領域に保持蓄積しておく。
このテンプレート関連付け情報69と図7(B)に示したテンプレート6の記入欄位置領域情報68とを合成すれば、図2(C)に示した記入欄位置領域情報38(の左側部分)が得られるようになるので、事実上、データベースに記入欄位置領域情報38を登録したことになる。
よって、記入欄6aを利用して作成した文書原本8Aを印刷出力し(S30)、所要の追記情報が記入された追記済文書8Bについて、データ処理対象の追記情報に基づいて記入欄6aの位置情報を特定しつつ適切なデータ処理を実行することができる(S32〜S52)。たとえば、解答欄84(テンプレート6上の記入欄6a)に対応して追記される採点記号87やコメント88に基づき自動採点処理を実現することができるようになる。
図7(C)にて設問部分に“−”が示されている記入欄6aは解答欄84として使用しないものである。この図7(C)からも分かるように、全ての記入欄6aを解答欄84として利用することは必須ではなく、必要なものについてのみ解答欄84を設定して、配点や問題文を追記してもよい。
このように、文書原本8Aを作成する際に、多数の記入欄6aが予め所定位置に記入されたテンプレート6を使用して、その内の所望の記入欄6aに対して、問題文や配点などの属性情報を設定(追記)し、またその他の汎用追加情報を任意の位置に設定(追記)していくことで、簡単に文書原本8Aを作成することができる。
全ての記入欄6aを実際の文書原本8Aに使用することは必須ではなく、たとえば、教育用教材80を作成する場合に、記入欄6aに対する配点付けを自由に設定できるなど、図8(A)に示すテンプレート6を使用して文書原本8Aを作成する場合よりも、自由度が高い。
テンプレート6さえあれば、特別なツールを使用することなく、簡単に文書原本8Aを作成できる利点がある。たとえば、ワードプロセッサ(ワープロ)を利用する場合や、パーソナルコンピュータ(パソコン)などの電子計算機でワープロソフトを利用する場合には、端末画面上にテンプレート6を表示させ、その画面上で、記入欄6aに対して、問題文や配点などの属性情報を設定(追記)し、またその他の汎用追加情報を任意の位置に設定(追記)して文書原本8Aを作成し、この作成した文書原本8Aやテンプレート関連付け情報69をデータベースに登録すればよい。
文書原本8Aには、この文書原本8Aを一意に特定する情報を文書特定コードなどの形態で、ベースとしたテンプレート6を一意に特定する情報(たとえばテンプレート特定コード)と対応付けて付与しておけば、同じテンプレート6を使用した他の文書原本8Aとの混同を防止することができる。
完成された文書原本8Aに対応する追記済文書8Bについてのデータ処理時には、追記済文書8Bを読み取った画像データから文書原本8Aを特定する文書特定コードを特定してから、ベースとしたテンプレート6のテンプレート特定コードを特定することで(S34,S40,S42)、使用されたテンプレート6の記入欄位置領域情報68をデータベースから読み出して記入欄6aの位置を特定しつつ、記入欄6aと関係した追記情報について何ら問題なくデータ処理を実行することができる(S52)。
なお、文書原本8Aやテンプレート関連付け情報69をデータベースに登録することは必須ではない。たとえば、ワープロやパソコンなどの電子的な手段を用いずに、テンプレート6を用紙に印刷し、そのテンプレート用紙上に、直接に手書きで、記入欄6aに対して、問題文や配点などの属性情報を設定(追記)し、またその他の汎用追加情報を任意の位置に設定(追記)して文書原本8Aを作成すればよい。
このとき、テンプレート6には、そのテンプレート6を一意に特定する情報をテンプレート特定コードなどの形態で付与しておけば、完成された文書原本8Aにも、そのテンプレート特定コードなどが付与されている。よって、追記済文書8Bについてのデータ処理時には、追記済文書8Bを読み取った画像データから文書原本8Aのベースとしたテンプレート6のテンプレート特定コードを特定し(S36,S42)、使用されたテンプレート6の記入欄位置領域情報68をデータベースから読み出して記入欄6aの位置を特定しつつ、記入欄6aと関係した追記情報について何ら問題なくデータ処理を実行することができる(S52)。なお、文書原本8Aと追記済文書8Bとの差分を取って追記情報を抽出するため(S50)、無記入の文書原本8Aも読み取る(S36)。
ここで、記入欄6aに追記された追記情報に基づいてデータ処理を実行する際には、記入欄6aの位置情報以外の属性情報や汎用追加情報などを必要とする場合もある。たとえば、付加情報記入済教材81について自動採点処理を実行する場合には、記入欄6a(解答欄84)の位置情報の他に、配点を特定することも必要になる。
ここで、データ処理時に必要となる記入欄6a(解答欄84)の位置情報を取得する際には、文書原本8Aの情報が文書原本情報データベースDB2に登録されているときには先ず文書原本情報データベースDB2にアクセスし、また、文書原本8Aの情報が文書原本情報データベースDB2に登録されていないときにはテンプレート情報データベースDB1にアクセスする。
たとえば、文書原本情報データベースDB2にテンプレート関連付け情報69が登録されている形態において、追記済文書8Bに対応する文書原本8Aを特定できたときには、先ず、文書原本情報データベースDB2にアクセスしてテンプレート関連付け情報69から、文書原本8Aの作成時に使用された元の(ベースとした)テンプレート6を特定する。この後、テンプレート情報データベースDB1にアクセスして、記入欄位置領域情報68から、特定されたテンプレート6の各記入欄6aの位置情報を取得する。
また、テンプレート関連付け情報69を文書原本情報データベースDB2に登録する代わりに、実際に、記入欄6aの位置情報を解答欄84の位置情報に置き換えて、図2(C)に示した記入欄位置領域情報38(の左側部分)として文書原本情報データベースDB2に登録するようにしてもよい。こうすることで、文書原本8Aを作成して登録した後には、自動データ処理時に、ベースとなったテンプレート6の情報(記入欄位置領域情報68)をテンプレート情報データベースDB1に参照する必要がなくなる。
すなわち、追記済文書8Bに対応する文書原本8Aを特定できたときには、文書原本情報データベースDB2にアクセスして記入欄位置領域情報38から、文書原本8Aの作成時に使用された元の(ベースとした)テンプレート6の各記入欄6aの位置情報を取得する。
また、文書原本8Aの情報が文書原本情報データベースDB2に登録されていないときには、追記済文書8B中に存在するテンプレート特定コードなどから、文書原本8Aの作成時に使用された元の(ベースとした)テンプレート6を特定する。この後、テンプレート情報データベースDB1にアクセスして、記入欄位置領域情報68から、特定されたテンプレート6の各記入欄6aの位置情報を取得する。
つまり、文書原本8Aを文書原本情報データベースDB2に登録しておく場合には、文書原本8Aを登録したテンプレート関連付け情報69から配点情報を取得できるし、文書原本8Aのベースとしたテンプレート6を登録したテンプレート情報データベースDB1にアクセスして記入欄位置領域情報68から記入欄6aの位置情報や配点情報を取得できる。
一方、文書原本8Aをデータベースに登録しておかない場合には、テンプレート6を登録した記入欄位置領域情報68から記入欄6a(解答欄84)の位置情報を取得できるが、配点情報はデータベースから取得することができない。この場合、無記入の教育用教材80を文書入力装置20で読み取り、付加情報記入済教材81の解答欄84(記入欄6a)の近傍に追記されている配点を文字認識して特定すればよい。
また、たとえば、図8(A)に示したテンプレート6をデータベースから読み出して、文書原本8Aとして図2(A)に示した教育用教材80を生成する場合であれば、配点や集計欄83bの情報も既にテンプレート6に設定されているので、タイトルや問題文を入力するだけでよく、記入欄6aの位置情報だけでなく配点や集計欄83bの情報を入力する手間をも省くことができる利点がある。
この場合、図8(C)に示すように、教育用教材80上に存在する問題の番号と、各記入欄6aとを対応付ける情報で、これらを互いに関連付けるテーブル形式で、テンプレート関連付け情報69として、所定の格納領域に保持蓄積しておく。なお、この場合、記入欄6aの通し番号を解答欄84の通し番号とすることができるので、テンプレート関連付け情報69においては、問題番号の登録を割愛することもできる。
このテンプレート関連付け情報69と図8(B)に示したテンプレート6の記入欄位置領域情報68とを合成すれば、図2(C)に示した記入欄位置領域情報38が得られるようになるので、事実上、データベースに記入欄位置領域情報38を登録したことになる。よって、解答欄84(テンプレート6上の記入欄6a)に対応して追記される採点記号87やコメント88に基づいて自動採点処理を実現することができるようになる。
ただし、全ての記入欄6aを実際の文書原本8Aに使用しないと不都合が生じる可能性がある。たとえば、教育用教材80を作成する場合に、全ての記入欄6aに対して配点付けがなされ、またそれとの関係で部分点や合計点の整合が採れるようにしているので、一部の記入欄6aを解答欄84として使用しないと整合が採れなくなる。よって、図7(A)に示すテンプレート6を使用して文書原本8Aを作成する場合よりも、自動採点処理用の答案情報の入力負担は小さいものの、問題構成の自由度が低い。
<システム構成>
図9は、本発明に係る文書作成装置および追記情報処理装置を備えてなる情報処理システムの一実施形態の構成例を示す図である。なお、この情報処理システムは、答案用紙などの教育用教材80を処理対象とする教材自動採点システムへの適用例で示す。
図示のように、教材自動採点システム1は、システムの中心をなす文書原本8Aを作成する文書作成装置5および追記情報処理装置10と、追記情報処理装置10に処理対象文書である付加情報記入済教材81を電子化して入力する文書入力装置20と、処理対象文書である付加情報記入済教材81に対応するテンプレート6や教育用教材80(詳しくはその原本画像)の電子データを記憶する文書管理サーバ30と、情報処理(本例では自動採点処理など)の結果を保存しておく処理結果保存サーバ40とが、有線や無線を利用してネットワーク接続されて構成されている。
図示のように、本実施形態の教材自動採点システム1の一方の中心部をなす文書作成装置5は、予め記入欄の位置が定義付けられている定型文書と各記入欄の位置情報とを記憶している記憶装置(本例ではテンプレート情報データベースDB1の機能を持つ文書管理サーバ30)から定型文書を取得し、この定型文書上の、記入欄のそれぞれに、対応する属性情報を記入する文書原本生成部520と、文書原本生成部520で生成された文書原本8Aを、記入欄の位置を特定し得るようにして出力する文書原本出力部540とを備えている。
また、本実施形態の文書作成装置5は、予め記入欄の位置が定義付けられている定型文書としてのテンプレート6を作成し、作成したテンプレート6と各記入欄の位置情報をテンプレート情報データベースDB1として機能する記憶装置(本実施形態では文書管理サーバ30)に出力する定型文書生成部510も備えている。
なお、文書作成装置5としては、テンプレート6を生成する定型文書生成部510を備えていることは必須ではなく、別の装置にて生成されテンプレート情報データベースDB1に保存されているテンプレート6を利用して文書原本8Aを生成する構成のものであってもよい。
定型文書生成部510は、白紙用紙上の所望位置に記入欄を設定する記入欄設定部512と、記入欄設定部512により生成された、多数の記入欄が所定位置に設定されているテンプレート6を出力するテンプレート出力部518とを有している。
テンプレート出力部518は、記入欄設定部512により多数の記入欄が所定位置に設定されたテンプレート6の電子データ(文書ファイルや画像データ)と、各記入欄6aとその領域情報を対応付けて、またテンプレート6を一意に特定するテンプレート特定コードを付して、データベースとして機能する文書管理サーバ30に登録する。
文書原本生成部520は、定型文書生成部510により生成された各種のテンプレート6の中から必要なテンプレート6の電子データを文書管理サーバ30から取り込むテンプレート選択部522と、テンプレート選択部522で選択されたテンプレート6に所望の情報を追加する情報追加部530とを有している。
情報追加部530は、テンプレート6上の各記入欄6aについて、その記入欄6aに対応した所望の情報(属性情報)を追加する記入欄対応情報追加部532と、記入欄6aに対応した属性情報以外の情報(汎用追加情報)を追加する汎用情報追加部534とを有している。
たとえば、文書原本8Aとして教育用教材80を生成する場合であれば、記入欄対応情報追加部532は、後に解答欄84となる記入欄6aに対応付けて、問題文や配点やその他の情報を追記していく。また、アンケート用紙を文書原本8Aとして生成する場合であれば、記入欄対応情報追加部532は、後にアンケート回答欄となる記入欄6aに対応付けて、アンケート文を追記する。また、記入欄対応情報追加部532は、必要に応じて、記入欄6aに括弧や枠などの飾り付けを行なう。
一方、汎用情報追加部534は、完成された文書原本8Aとして必要なその他の汎用追加情報を追記する。たとえば、文書原本8Aを識別特定するためのタイトル文字や図形、あるいは記入者欄や、その他の欄を追加する。たとえば、教育用教材80を生成する場合であれば、問題文などを記入する識別情報欄85や解答者情報欄86などを設けるし、アンケート文を生成する場合であれば、アンケートのタイトル文字を追加する。
文書原本出力部540は、文書原本生成部520によりテンプレート6を利用して生成された文書原本8Aを文書管理サーバ30(データベース)に登録する。この際には、文書原本8Aを、記入欄の位置やデータ処理に必要となる属性情報を特定し得るようにして出力する。
たとえば、ベースとなったテンプレート6のテンプレート特定コードと、生成した文書原本8Aを一意に特定する情報(たとえば文書特定コード)とを対応付けて登録する。あるいは、文書原本生成部520により作成された文書原本8Aを印刷出力する際に、文書原本8Aを一意に特定する情報(たとえば文書特定コード)も印刷出力する。出力された文書原本8Aの特定コードを識別しデータベースにアクセスすることで、そのデータベースに登録されている位置情報やデータ処理に必要となる属性情報を取得できるようにするのである。
なお、ここでは、文書原本生成部520にて、テンプレート6を利用して電子的に文書原本8Aを作成する形態で説明したが、このような態様は、ワードプロセッサ(ワープロ)を利用する場合や、パーソナルコンピュータ(パソコン)などの電子計算機でワープロソフトを利用する場合に容易に適用可能である。
ワープロやパソコンなどの電子的な手段を用いずに、定型文書生成部510で生成されたテンプレート6を用紙に印刷し、そのテンプレート用紙上に、直接に手書きで、問題文や配点やタイトルやその他の情報を追記することで、テンプレート6を利用した文書原本8Aを作成してもよい。
文書入力装置20は、教育用教材80における解答欄84への解答記入、解答者情報欄86への氏名などの記入および解答欄84に記入された解答に対する採点官による採点記号87(具体的には、たとえば「○」や「×」の図形)の記入がされた付加情報記入済教材81に対して、公知の光学的画像読取技術を用いた画像読取りを行ない、その付加情報記入済教材81から画像データを得るものである。
文書入力装置20は、処理対象文書である付加情報記入済教材81を電子データにする機能を備えたものであればよく、たとえば、画像読取装置としての機能を有した複写機、複合機、またはスキャナ装置を利用して実現することが考えられる。その場合に、自動原稿搬送装置(Automatic Document Feeder ;ADF)が付設されていると、複数の教育用教材に対する画像読取りを連続的に行なうことができ便利である。
なお、教育用教材80を利用した試験などは、紙媒体を用いることに限定されない。たとえばタブレット型のPCを利用して試験を行ない採点するケースでは、最初から付加情報記入済教材81を電子データの形式で入手することができ、この場合には、システム構成上、文書入力装置20が不要となる。
文書管理サーバ30は、文書原本8A(本例では教育用教材80)を生成するためのテンプレート6の情報、たとえばテンプレート6そのものの情報や記入欄位置領域情報68を、たとえば、図7(B)や図8(B)に示したように、テーブル形式で、所定の格納領域にテンプレート情報データベースDB1として保持蓄積している。
また、文書管理サーバ30は、付加情報記入済教材81に対応する教育用教材80の原本画像と、この原本画像を特定するための、たとえば、科目、タイトル、適用学年などの識別情報や識別コードとを対応付けて、ハードディスク装置や光ディスク装置などの所定の記憶媒体に文書原本情報データベースDB2として登録している。
また、文書管理サーバ30は、付加情報記入済教材81に対応する元の教育用教材80(原本画像)を保存するとともに、採点記号87やコメント88についてのデータ処理時に必要となる解答欄の位置情報や問題番号や配点情報などを示す記入欄位置領域情報38を、図2(C)に示したように、テーブル形式で、所定の格納領域に文書原本情報データベースDB2として保持蓄積している。なお、テンプレート6を利用して文書原本8Aを生成したときには、記入欄位置領域情報38に代えて、図7(C)や図8(C)に示したように、テンプレート関連付け情報69を登録することができる。
なお、本実施形態では、テンプレート6に関する情報を登録するテンプレート情報データベースDB1と文書原本8Aに関する情報を登録する文書原本情報データベースDB2とを一体的な文書管理サーバ30で実現しているが、それぞれを別の文書管理サーバで実現してもよい。
処理結果保存サーバ40としては、追記情報処理装置10とネットワーク接続され、付加情報記入済教材81についての自動採点集計結果を管理することができるものであればよく、たとえば、処理結果データベース装置や処理結果ファイルサーバ装置などが該当する。
教材自動採点システム1の他方の中心部をなす追記情報処理装置10は、文書入力装置20から入力された付加情報記入済教材81の画像データに基づき所定の信号処理を行なう読取画像処理部110と、読取画像処理部110による処理に基づいて文書入力装置20から入力された読取画像の元となった文書原本8Aを識別特定する文書原本特定部120とを備えている。教材自動採点システム1においては、文書原本特定部120は、文書原本8Aの一例である教育用教材80を特定する教材特定部122として機能する。
また、追記情報処理装置10は、読取画像処理部110による処理が施された画像データから追記情報(アノテーション)を抽出する追記情報抽出部130と、追記情報抽出部130により抽出されたデータ処理対象の追記情報に基づき記載内容や記入位置を認識し特定するデータ処理対象追記情報特定処理部150と、データ処理対象追記情報特定処理部150により特定された追記情報の記載内容に基づいてデータ処理を行なうデータ処理部170とを備えている。
読取画像処理部110は、図示を割愛するが、文書入力装置20から入力された画像データについて、レイアウト解析、文字図形分離、文字認識、コード情報認識、図形処理、色成分認識などの公知の画像処理技術(それぞれの詳細説明は割愛する)を利用して解析処理を行なう画像データ解析部と、文書入力装置20から入力された画像データの傾きや主走査方向または副走査方向の拡縮率などの画像歪みを補正する歪み補正部とを有している。なお、歪み補正部は、文書入力装置20から入力された画像データと、比較対象となる文書管理サーバ30内の対応する原本画像とを比較照合し、その画像歪み(傾き、拡縮など)を補正してもよい。
教材特定部122は、図示を割愛するが、たとえば、画像データ解析部によるデータ解析結果に基づいて、識別情報欄85に記入されている科目、タイトル、あるいは適用学年などの識別情報を解析する識別情報解析部と、同じく識別情報欄85に埋め込まれている教育用教材80を特定するコード情報を解析するコード情報解析部とを有している。
教材特定部122は、画像データ解析部での解析結果に基づいて特定した、たとえば科目、タイトル、適用学年などの識別情報や識別コードと、文書管理サーバ30に保持蓄積されている教育用教材80の原本画像の情報(たとえば科目、タイトル、適用学年などの識別情報や識別コード)とを照らし合わせ、該当する原本画像が文書管理サーバ30に保持蓄積されていなければ、文書入力装置20で得られた画像データとの比較対象となる電子データを特定できないと判定して、識別特定エラー信号を出力するようになっている。
なお、教材特定部122は、文書入力装置20から入力された画像データ(付加情報記入済教材81に相当)と対応する元の教育用教材80を識別特定できればよく、識別情報解析部とコード情報解析部とは、付加情報記入済教材81の識別情報欄85に記載もしくは埋め込まれている識別情報の形式に対応する適正な方を備えていればよく、必ずしも、両者を備えている必要はない。
追記情報抽出部130は、歪み補正部にて画像歪みが補正された画像データと、教材特定部122により特定された、文書入力装置20から入力された画像データ(付加情報記入済教材81に相当)に対応する原本画像(教育用教材80に相当)とを公知の画像処理技術を利用して比較しそれぞれの間の差分を抽出する差分抽出部132を有する。
また、追記情報抽出部130は、差分抽出部132による抽出結果に基づき文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報(第1種の付加情報の一例)を抽出する解答者抽出部134と、同じく差分抽出部132による抽出結果に基づき文書入力装置20で読取り対象となった付加情報記入済教材81における採点記号87やコメント88などのデータ処理に供される第2種の付加情報を抽出するデータ処理用追記情報抽出処理部140とを有する。
解答者抽出部134は、図示を割愛するが、差分抽出部132による抽出結果に基づき、解答者情報欄86の学級88aや出席番号88bや氏名88cの欄に記入された解答記入者の手書きによる番号や文字の画像をそのまま文字情報として切り出す手書き情報切出部と、差分抽出部132による抽出結果に基づき(好ましくは、手書き情報切出部により切り出された手書き情報について)、解答者情報欄86の手書きによる記入情報を、追記情報処理装置10上で加工編集が可能な文字データに変換する文字認識処理(OCR;Optical Character Reader)部とを有する。
なお、解答者抽出部134は、文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報欄86に記入された解答者情報を抽出できればよく、手書き情報切出部と文字認識処理部の何れか一方を備えていればよい。また、文字認識処理部を設けない場合や文字認識処理部で文字認識できなかったコメント88の部分に関しては、抽出された解答者情報をそのまま画像として取り扱うことにする。
データ処理用追記情報抽出処理部140は、図示を割愛するが、注目する追記色の情報を参照して、差分抽出部132による抽出結果に基づき、追記情報抽出部130により抽出された追記情報の内、文書入力装置20で読取り対象となった追記済文書8B(本例では付加情報記入済教材81)におけるデータ処理の対象となる追記情報(本例では採点記号87やコメント88)を抽出するデータ処理対象追記情報抽出部と、データ処理対象追記情報抽出部で抽出されたデータ処理対象の追記情報をデータ処理に耐え得るように整形する追記情報整形部とを有する。本実施形態においては、データ処理対象追記情報抽出部は、採点記号87を抽出する採点記号抽出部およびコメント88を抽出するコメント抽出部の機能を備える。
なお、データ処理対象追記情報抽出部は、データ処理対象の追記情報(本例では採点記号87やコメント88)を抽出できればよく、色を指標に追記情報をさらに分類するとよい。たとえば差分抽出部132での抽出結果に対する色成分認識処理を通じて、採点官が採点記号87やコメント88の記入に使用したペン色と対応する所定色成分についてのものを抽出することで行なえばよい。たとえば、付加情報記入済教材81における採点記号87やコメント88の記入は、一般に赤色ペン(赤の筆記具)で行なわれることが多く、この場合には、赤色成分に注目した抽出を行なえばよい。
ただし、赤色ペンとはいってもピンク系からオレンジ系というように似通った色気のものがあるし、必ずしも採点記号87やコメント88の記入に赤色ペンを使用するとは限らないし、採点記号87とコメント88とを別のペン色で記入することもあるので、採点記号87やコメント88の記入に使用するペン色の情報を採点記号抽出部やコメント抽出部として機能するデータ処理対象追記情報抽出部に設定可能に構成しておくことで、抽出性能を向上させるようにするとよい。
このため、実際に使用した追記色を特定し、その特定した追記色の情報を参照して、追記色に注目した抽出を行なう。実際に使用されたペン色が特定されていれば、データ処理対象追記情報抽出部は、抽出許容範囲を狭くすることができる。これにより、採点記号87やコメント88を、その他の追記情報と高精度に区別して抽出することができる。
図示を割愛するが、追記情報整形部としては、データ処理対象追記情報抽出部で抽出されたデータ処理対象の追記情報について、線分同士を接続してその抽出線分間の途切れを解消するように補正処理を行なう抽出線分途切れ補正部を有する構成とするのがよい。
一般に、追記済文書8B上での図形記入や「2重線」や「波線」や「花丸」や「矢印」などの図形記入やコメント文などは、記入済のものに対して重ねて行なわれることもある。たとえば、付加情報記入済教材81の場合には、各問題文82や各解答欄84を特定する枠や各解答欄84への解答記入内容などに重ねて「○」や「×」などの採点記号87が記入され、あるいは図形や文字でコメント88の追記が行なわれることもある。そのため、データ処理対象追記情報抽出部による所定色成分の抽出結果は、その重なり部分が除かれる結果、図形や文字に途切れ部分が生じたものとなる虞れがある。
このことから、抽出線分途切れ補正部は、「○」や「×」や「線」やその他の印(マーク)などの図形や文字であるはずの抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理(いわゆる連結処理)、あるいは線図形の直線近似などを適宜実行する。なお、このときに行なう細線化処理、端点抽出処理、あるいは端点間接続処理や線図形の直線近似などは、公知技術を利用して行なえばよいため、ここではその詳細な説明を割愛する(たとえば、「画像の処理と認識」,安居院猛著,昭晃堂発行などを参照)。
データ処理対象追記情報特定処理部150は、差分抽出部132による差分抽出結果に基づいて、具体的には、抽出線分途切れ補正部で補正されたデータ処理対象追記情報に基づいて、追記済文書8Bにおける第1のデータ処理用の追記情報の記入内容を第2のデータ処理用の追記情報と分離して認識する第1データ処理用追記情報認識部154と第2のデータ処理用の追記情報の記入内容を第1のデータ処理用の追記情報と分離して認識する第2データ処理用追記情報認識部164とを有している。
データ処理対象追記情報特定処理部150としては、第1データ処理用追記情報認識部154は、付加情報記入済教材81における採点記号87の記入内容をコメント88と分離して認識し、また、第2データ処理用追記情報認識部164は、付加情報記入済教材81におけるコメント88の記入内容を採点記号87と分離して認識する。
各データ処理用追記情報認識部154,164は、抽出線分途切れ補正部で補正されたデータ処理用追記情報の記入内容に対して形状認識処理を行なうことでデータ処理用追記情報の記入内容を認識する図形形状認識部156,166と、抽出線分途切れ補正部で補正されたデータ処理用追記情報の記入内容に対して文字認識処理を行なうことでデータ処理用追記情報の記入内容を認識するする文字認識部157,167と、図形形状認識部156,166や文字認識処理部157,167により認識された各データ処理用追記情報の記入内容の、文書原本8A(追記済文書8B)上における記入位置を認識する記入位置認識部158,168とを有している。図形形状認識部156,166および文字認識処理部157,167により、採点記号87とコメント88とを分離して認識する分離認識処理部155が構成される。
文字認識処理部157,167を設けない場合や文字認識処理部157,167で文字認識できなかったデータ処理用追記情報の部分に関しては、抽出されたデータ処理用追記情報をそのまま画像として取り扱うことにする。
なお、図示のように、図形形状認識部156,166、文字認識処理部157,167、並びに記入位置認識部158,168とは、それぞれ1つの機能部が双方の機能を実現する構成としてもよいし、それぞれを個別の機能部として独立に設けてもよい。
たとえば、付加情報記入済教材81を処理対象とする構成においては、第1データ処理用追記情報認識部154は、採点記号87を第1のデータ処理用の追記情報とするものであり採点記号認識部として機能する。この場合、採点記号87についての図形形状認識部156は、採点記号87の記入内容が「正解(○)」または「不正解(×)」または「一部正解(△)」であるかなどを図形の側面から認識することができればよく、たとえば「○」,「×」,「△」の図形形状とのパターンマッチングによって形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から形状を認識してもよい。特徴量としては、たとえば、穴の個数や外接矩形に占める対象図形の面積率などを使用することができる。
また、採点記号87について文字認識処理部157は、採点記号87の記入内容が「正解(○)」または「不正解(×)」または「一部正解(△)」であるかなどを文字の側面から認識することができればよい。なお、採点記号87は図形のみであるとする場合には、文字認識処理部157を割愛することもできる。
また、採点記号87についての記入位置認識部158は、たとえば、教育用教材80上における座標解析によって、付加情報記入済教材81上の採点記号87の記入内容の記入位置を認識すればよい。
なお、図形形状認識部156は、採点記号87に関する形状認識の際には、「○」や「×」などの採点記号87を示す図形を構成する連続画素群を1つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入位置認識部158による位置認識の際にも、そのラベリング処理の結果を利用して、「○」や「×」などの採点記号87を示す図形を構成する連続画素群を1つの纏まりとして取り扱う。
また、記入位置認識部158は、採点記号87の記入位置の認識処理に当たって、付加情報記入済教材81上に複数の採点記号87が記入されていることが一般的であるから、その複数の採点記号87のそれぞれについて順次予め定められた走査順で検出される採点記号87について、順にその位置を認識していく。
各採点記号87に関する位置認識は、たとえば「○」や「×」などの採点記号87を示す図形(あるいは文字)の外接矩形情報を算出し、さらにその外接矩形の中心座標を算出することによって行なうことが考えられる。具体的には、認識対象となる図形もしくは文字(連続画素群)に対して外接矩形を抽出するとともに、その外接矩形の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)を算出する。そして、これらの算出結果から、中心x座標=x+w/2、中心y座標=y+h/2を算出し、その算出結果を連続画素群の位置、すなわち採点記号87の記入位置の認識結果とする。
一方、第2データ処理用追記情報認識部164は、コメント88を第2のデータ処理用の追記情報とするコメント認識部として機能する。この場合、コメント88についての図形形状認識部166は、コメント88の追記内容を図形の側面から認識することができればよく、たとえば「1重線」や「2重線」や「(1重または2重の)波線」などの線を示す図形形状とのパターンマッチングによって線に関する形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から線の形状を認識してもよい。特徴量としては、たとえば、線数や幅方向や外接矩形内における画素の密度などを使用することができる。
また、コメント88について文字認識処理部167は、付加情報記入済教材81におけるコメント88の記入内容を文字の側面から認識することができればよい。また、コメント88についての記入位置認識部168は、たとえば、教育用教材80上における座標解析によって、付加情報記入済教材81上のコメント88の追記内容の記入位置を認識すればよい。
なお、図形形状認識部166は、コメント88に関する形状認識の際には、「2重線」や「花丸」などのコメント88を示す図形を構成する連続画素群を1つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入位置認識部168による位置認識の際にも、そのラベリング処理の結果を利用して、「2重線」や「花丸」などのコメント88を示す図形を構成する連続画素群を1つの纏まりとして取り扱う。
また、記入位置認識部168は、コメント88の記入位置の認識処理に当たって、付加情報記入済教材81上に複数のコメント88が記入されていることが一般的であるから、その複数のコメント88のそれぞれについて順次予め定められた走査順で検出されるコメント88について、順にその位置を認識していく。
各コメント88に関する位置認識は、たとえばコメント文や「2重線」や「花丸」などのコメント88の文字や図形の外接矩形情報を算出し、さらにその外接矩形の中心座標を算出することによって行なうことが考えられる。具体的には、認識対象となる文字や図形(連続画素群)に対して外接矩形を抽出するとともに、その外接矩形の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)を算出する。そして、これらの算出結果から、中心x座標=x+w/2、中心y座標=y+h/2を算出し、その算出結果を連続画素群の位置、すなわちコメント88の記入位置の認識結果とする。
また、この位置認識の際には、各コメント88は、ある位置の解答欄84への採点記号87と対応して、その近傍に記入されることが多いので、記入位置認識部158による採点記号87についての位置認識と協働して処理を行なうのがよい。こうすることで、双方の位置情報の各解答欄84との対応付け、結果としては、採点記号87とコメント88との関連付けが容易になる。
データ処理部170は、文書入力装置20から入力された追記済文書8Bの画像データについて、その追記済文書8Bに記入された第1のデータ処理対象追記情報に関する第1のデータ処理を実行する第1データ処理部170_1と、第2のデータ処理対象追記情報に関する第2のデータ処理を実行する第2データ処理部170_2を有する。
各データ処理部170_1,170_2は、データ処理対象の追記情報の記入位置を、当該記入欄の位置情報を保存している装置(テンプレート情報データベースDB1や文書原本情報データベースDB2として機能する文書管理サーバ30)にアクセスして、記入欄位置領域情報38、記入欄位置領域情報68、あるいはテンプレート関連付け情報69を参照して取得しつつ、追記情報の記入位置と追記情報とを対応付けながらデータ処理を実行する。
第1データ処理部170_1は、追記済文書8Bの一例である付加情報記入済教材81の画像データについて、その付加情報記入済教材81に記入された採点記号87を元に採点集計を行なう採点集計部172と、採点集計部172による採点集計の結果を、解答者抽出部134が抽出した解答者情報と関連付けて出力する集計結果出力部174とを備えている。採点集計結果と解答者情報とが関連付けられた状態の処理結果を特に採点認識結果と称する。
採点集計部172は、図形形状認識部156による採点記号87の追記内容の図形の側面からの認識結果や文字認識処理部157による採点記号87の追記内容の文字情報の側面からの認識結果と、記入位置認識部158による採点記号87の記入位置の認識結果と、文書入力装置20が保持蓄積している付加情報記入済教材81に対応する教育用教材80の電子データ(原本画像)に含まれる教育用教材80(付加情報記入済教材81)の各解答欄84についての配点欄83で規定されている配点情報とに基づいて、文書入力装置20が読み取った付加情報記入済教材81について、付加情報記入済教材81に記入された採点記号87に関する採点処理および集計処理(纏めて採点集計という)を行なう。
なお、採点記号87の記入は、一般に教育用教材80上の複数の解答欄84のそれぞれに対応して行なわれ、かつ教師などの採点官によって手書きでされるため、各解答欄84に対する記入位置が必ずしも一義的に定まっている訳ではない。その一方で、採点記号87の採点集計に当たっては、各解答欄84と採点記号87の記入位置との対応を明確にする必要がある。採点記号87に関する採点集計は、各解答欄84に対応する採点記号87の記入結果を明確にした上で、採点記号87の内容(正解か不正解か一部正解かなど)および各解答欄84についての配点に基づいて行なわれるからである。
このことから、採点集計部172は、以下に述べるような手順で、採点記号87の採点集計を行なう。すなわち、採点集計部172は、「○」や「×」などの採点記号87の外接矩形と、付加情報記入済教材81上で解答欄84となる領域との重なり面積を求め、その面積(外接矩形に対する面積比でも同様)が最も大きくなる採点記号87と解答欄84とを互いに対応付け、その採点記号87を解答欄84に対して記入された採点記号87の判定結果とする。ただし、重なり面積の外接矩形に対する比が所定閾値未満の場合には、重なる部分が小さいことから、対応付けについての判定が不能であると判断する。
そして、対応付けを行なった後は、採点記号87が「○」であれば、これに対応する解答欄84についての配点情報から特定される配点を加算し、また採点記号87が「×」であれば、これに対応する解答欄84についての配点加算を行なわず、このような採点集計を付加情報記入済教材81上の全ての解答欄84について行なう。
なお、付加情報記入済教材81上で解答欄84となる領域は、各解答欄84についての配点情報として、または当該配点情報と同様に、付加情報記入済教材81に対応する文書管理サーバ30に登録されている原本画像に含まれる記入欄位置領域情報38によって特定されるものとする。
集計結果出力部174は、採点集計部172により集計された採点集計結果と解答者抽出部134が抽出した解答者情報と関連付けて、処理結果保存サーバ40(処理結果データベース装置や処理結果ファイルサーバ装置など)に登録する。あるいは、採点結果の点数を付加情報記入済教材81の集計欄83bに記入し用紙上に返却答案81bとして出力して生徒などに返却できるようにする。
また、第2データ処理部170_2は、追記済文書8Bの一例である付加情報記入済教材81の画像データについて、その付加情報記入済教材81に記入されたコメント88を元に分類処理を行なうコメント分類処理部176と、コメント分類処理部176による分類結果を集計結果出力部174が出力した採点認識結果や各解答に関連付けて出力するコメント処理結果出力部178とを備えている。
コメント分類処理部176は、図形形状認識部166によるコメント88の追記内容の図形の側面からの認識結果や文字認識処理部167によるコメント88の追記内容の文字情報の側面からの認識結果と、記入位置認識部168によるコメント88の記入位置の認識結果と、コメント88の追記内容と対応するように予め規定されている分類情報とに基づいて、文書入力装置20が読み取った付加情報記入済教材81について、その付加情報記入済教材81に記入されたコメント88の分類処理を行なう。
コメント処理結果出力部178は、コメント分類処理部176による分類結果を各解答欄や集計結果出力部174が出力した採点認識結果と関連付けて、処理結果保存サーバ40(処理結果データベース装置や処理結果ファイルサーバ装置など)に登録する。
なお、採点集計部172での採点集計処理やコメント分類処理部176での分類処理に当たっては、完全なる自動処理にしてもよいが、ユーザ端末171のCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)などで構成された表示部に処理過程や処理結果を表示して、適宜、操作者が処理過程や処理結果をキーボードやマウスなどの指示入力部を介して訂正できるようにしてもよい。
<全体の処理手順>
図10および図11は、情報処理システムの一実施形態である教材自動採点システム1における教材処理方法の処理動作の手順を説明する図である。ここで、図10は、その全体概要をシステム構成図と対応付けて示しており、また図11は、教材処理手順を示すフローチャートである。
自動採点処理に供される文書原本8A(教育用教材80)を作成するに当り、そのベースとなるテンプレート6を文書作成装置5により作成し、テンプレート特定コードを付与してテンプレート情報データベースDB1に登録しておく(S102)。この後、所望のテンプレート6を読み出して、このテンプレート6に設定されている記入欄6aを解答欄84に割り当てるとともに、各解答欄84に対応する問題文やタイトルなどを追加して教育用教材80を完成させ文書原本情報データベースDB2に登録する(S104)。なお、各記入欄6aに配点が設定されていない形態のテンプレート6を使用する場合には、解答欄84として設定した記入欄6aに関しては配点の情報も設定する。
この後、試験を実施する際には、文書原本情報データベースDB2から教育用教材80を読み出して印刷し生徒や受験者に配布する(S106)。そして、試験終了後に、採点官は採点記号87やコメント88を生徒の解答に対して追記する(S108)。
追記情報処理装置10(特に教材自動採点システム1においては教材処理装置に該当する)を利用する場合には、先ず、生徒などによって解答者情報欄86への氏名などの記入および解答欄84への解答記入、つまり生徒による第1種の付加情報の記入がされ、さらに教師などによって各解答欄84に記入された解答に対する「○」や「×」などの採点記号87やコメント88などの第2種の付加情報の記入がされた付加情報記入済教材81について、文書入力装置20は、その付加情報記入済教材81を一括で読み取り(S110)、その付加情報記入済教材81を表わす画像データを追記情報処理装置10に入力する(S112)。文書入力装置20は、この文書入力装置20による画像読取りによって得られた画像データについて、一旦ワークエリアとして用いられるメモリなどに保持しておく。
なお、このとき、文書入力装置20にてADF装置を用いれば、たとえば同一学級のような1つのグループに纏めて処理すべき複数の付加情報記入済教材81について、一括して読み取り(一括スキャン)、各付加情報記入済教材81に対応する画像データを連続的に追記情報処理装置10に入力することができる。
追記情報処理装置10は、文書入力装置20から取り込んだ各付加情報記入済教材81の画像データに対して、順次、次のような付加情報抽出・分離処理、付加情報特定処理、および自動採点処理並びに自動コメント処理といった付加情報終末処理を実行する。
たとえば、データ処理部170における自動採点処理並びに自動コメント処理に先立って、ある1つの付加情報記入済教材81から得られた画像データについて、読取画像処理部110の画像データ解析部は解析処理を行ない(S122)、教材特定部122は、その解析処理の結果に基づいて付加情報記入済教材81に対応する元の教育用教材80の識別特定を行なう(S124)。
この識別特定(S124)は、たとえば「理科」「5年」「1.天気と気温の変化」といった識別情報解析部によるタイトル解析または識別情報欄85に埋め込まれたコード情報についてのコード情報解析部によるコード解析を通じて行なえばよい。この識別特定を経ることで、教材特定部122では、文書入力装置20により得られた付加情報記入済教材81の画像データとの比較対象となる教育用教材80の電子データ(原本画像)を特定することができる。
なお、この識別特定は、文書入力装置20が画像読取りを行なった複数の付加情報記入済教材81のそれぞれについて順次行なうことも考えられるが、一般に1つのグループに纏めて処理される付加情報記入済教材81は全て同一のものであるため、その纏めて処理される中で最初に処理される付加情報記入済教材81についてのみ行なえばよい。
教材特定部122により各付加情報記入済教材81に対応する教育用教材80の特定が完了すると、文書管理サーバ30は、その特定結果に従いつつ、保持蓄積している中から該当する教育用教材80の原本画像(電子データ)を取り出して、これを差分抽出部132へ受け渡す(S126)。
また、歪み補正部は、ある1つの付加情報記入済教材81から得られた画像データの歪みを補正する(S128)。この画像歪み補正は、文書入力装置20での画像読取りの際に生じ得る画像歪みを補正するために行なうものであり、その後に差分抽出部132にて行なう原本画像との比較や差分抽出などの精度向上を図るためのものである。
差分抽出部132は、文書管理サーバ30から受け渡された原本画像(教育用教材80)と、文書入力装置20から入力され、歪み補正部により画像歪みが補正された後の画像データ(付加情報記入済教材81)とを、それぞれ比較して、その差分を抽出する(S130)。差分抽出部132は、抽出した差分情報9を解答者抽出部134やデータ処理用追記情報抽出処理部140に渡す。
差分抽出部132による差分抽出によって、たとえば図10中の中央部分に示すように、解答者情報欄86および各解答欄84への解答者による第1種の付加情報の記入内容、並びに各解答欄84に対する採点記号87やコメント88などの採点官による第2種の付加情報の記入内容のみで表わされる差分情報9が抽出されることになる。
解答者抽出部134は、差分情報9に対する文字認識処理部による文字認識処理などを通じて、文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報を抽出する(S132)。これにより、ある1つの付加情報記入済教材81に解答を記入した解答記入者の学級、出席番号、氏名などを特定できる。
また、データ処理用追記情報抽出処理部140において、先ず追記部材特定部141は、データ処理の対象となる追記情報の記入に使用されたペン色である追記色を特定し(S141)、データ処理対象追記情報抽出部は、追記部材特定部141にて特定された追記色に基づき、差分抽出部132による差分抽出結果に対して、データ処理用の追記情報を抽出する(S142)。
本例の場合、各解答欄84への採点記号87やコメント88の追記内容を抽出するために、その差分情報9からさらに所定色成分についてのもの、具体的にはたとえば赤色成分のものを抽出する。所定色成分の抽出は、たとえば差分抽出結果が画素データからなる場合であれば、その画素データを構成する色成分データに着目することで行なうことができる。
抽出線分途切れ補正部は、データ処理対象追記情報抽出部による抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理、あるいは線図形の直線近似などの追記情報整形処理を適宜実行する(S146)。抽出線分途切れ補正部は、途切れ補正処理済の採点記号87の抽出結果を採点記号認識部として機能する第1データ処理用追記情報認識部154に渡し、また途切れ補正処理済のコメント88の抽出結果をコメント認識部として機能する第2データ処理用追記情報認識部164に渡す。
データ処理対象追記情報特定処理部150は、先ず、分離認識処理部155を構成する図形形状認識部156,166および文字認識処理部157,167が協働して、文書管理サーバ30に保存されている解答欄84の位置情報を参照して、採点記号87とコメント88とを分離し(S162)、この後、分離した採点記号87とコメント88の別に、記入内容の特定処理や記入位置の特定処理を実行する。
図形形状認識部156や文字認識処理部157は、コメント88と分離した採点記号87について(S163−採点記号)、採点記号87の記入内容に対する形状認識あるいは文字認識により、その採点記号87の記入内容が「正解」であるかあるいは「不正解」であるかなど、採点記号87で示された採点官の採点結果を特定する(S164)。続いて、記入位置認識部158は、採点記号87の記入内容について、その付加情報記入済教材81上における記入位置を認識する(S166)。
このようにして、記入位置認識部158が採点記号87の記入位置を認識した後は、採点集計部172は、図形形状認識部156や文字認識処理部157による採点記号87の記入内容の認識結果と、記入位置認識部158による採点記号87の記入位置の認識結果と、文書管理サーバ30が保持蓄積している付加情報記入済教材81に対応する原本画像(教育用教材80)に含まれる教育用教材80の各解答欄84についての配点情報とに基づいて、採点および集計を行なう(S168)。
集計結果出力部174は、その採点・集計の結果を処理結果保存サーバ40に保存する(S169)。あるいは採点結果の点数が付加情報記入済教材81の集計欄83bに記入されて返却答案81bとして生徒などに返却される。
各付加情報記入済教材81についての採点結果(問題別採点結果)のファイル形式としては、たとえば、図10に示すように、付加情報記入済教材81上に存在する問題の番号と、その問題の解答に対する正誤判定と、その正誤判定に基づく得点とからなる情報で、これらを互いに関連付けるテーブル形式である。また、集計結果のファイル形式としては、たとえば、図10に示すように、出席番号および解答者情報と、得点情報(集計欄83bに記入される項目点や合計点)とからなる情報で、これらを互いに関連付けるテーブル形式である。
各付加情報記入済教材81上に記入される正誤判定の採点集計の結果が問題別採点結果としてファイル出力されるし、また、問題別の採点集計の結果がファイル出力されるので、処理結果保存サーバ40では、付加情報記入済教材81についての採点集計結果を、たとえば一覧形式で、管理または利用することが可能となる。
図形形状認識部166や文字認識処理部167は、採点記号87と分離したコメント88について(S163−コメント)、コメント88の記入内容に対する形状認識あるいは文字認識により、採点官により追記されたコメント88の記入内容を特定する(S170)。続いて、記入位置認識部168は、コメント88の記入内容について、その付加情報記入済教材81上における記入位置を認識する(S172)。
このようにして、記入位置認識部168がコメント88の記入位置を認識した後は、コメント分類処理部176は、図形形状認識部166や文字認識処理部167によるコメント88の記入内容の認識結果と、記入位置認識部168によるコメント88の記入位置の認識結果と、文書管理サーバ30が保持蓄積している分類基準情報39とに基づいて、コメント88を分類する(S174)。
コメント処理結果出力部178は、コメント分類処理部176で分類された各コメント88を、位置が近い採点記号87の採点結果と関連付けて(S178)、処理結果保存サーバ40に保存する(S179)。各コメント88についての分類結果のファイル形式としては、たとえば、図10に示すように、各コメントと近傍の採点記号87とからなる情報で、これらを互いに関連付けるテーブル形式である。なお、実際にテーブル形式で保存することに限らず、各コメント88と、このコメント88と対応する採点集計結果の両者を関連付ける関連付け情報とを対応付けて保存してもよい。
各付加情報記入済教材81上に記入される採点記号87の採点集計結果とコメント88とが対応するようにデータ保存されるので、処理結果保存サーバ40では、付加情報記入済教材81についての採点集計結果とコメント88とを、たとえば一覧形式で、管理または利用することが可能となるし、生徒の能力分析や生徒指導にコメント88を利用できるようになる。
このように、情報処理システムの一実施形態として示した教材自動採点システム1では、採点記号87やコメント88の記入がされた付加情報記入済教材81から読み取った画像データと、その付加情報記入済教材81についての元の教育用教材80、すなわち解答欄84への解答記入などの生徒などによる第1種の付加情報および解答に対する採点官による採点記号87やコメント88などの第2種の付加情報の記入がされていないものについてのデータとを比較し、互いの差分から採点記号87やコメント88の記入内容を分離してその記入内容を特定し、その採点記号87についての採点集計とコメント88についての分類処理を実行するようになっている。
したがって、採点記号87に関するデータ処理については、差分抽出部132で抽出される差分結果から、コメント88の記入内容を排除して採点記号87のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、自動採点に悪影響を及ぼすことがない。
また、採点結果の自動集計を実行できるので、結果として付加情報記入済教材81についての採点処理が省力化される。付加情報記入済教材81を紙媒体で入手するケースでは、付加情報記入済教材81を文書入力装置20で読み取った画像データを基にすればよく、たとえば、複写機、複合機、またはスキャナ装置などによって実現されるスキャン機能と、パーソナルコンピュータ(PC)などのコンピュータ機器が有する情報記憶処理機能、画像処理機能および演算処理機能とがあれば、システム構成を簡単に実現することができ、専用の機器を必要とすることもない。
さらには、付加情報記入済教材81の画像データを、文書管理サーバ30が保持する電子データと比較するため、その文書管理サーバ30に各種の教育用教材80についての電子データを保持蓄積しておけば、対応可能な付加情報記入済教材81についての汎用性を十分に確保し得る。さらには、文書管理サーバ30に予め電子データを保持蓄積しておくことで、文書管理サーバ30から取り込んだ画像データとの比較を行なう場合において、比較対象となる電子データの入力などを行なう手間を省くことができ、結果として迅速な採点処理を実現することができる。
また、コメント88に関するデータ処理については、差分抽出部132で抽出される差分結果から、採点記号87の記入内容を排除してコメント88のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、コメント88に関する分類処理に悪影響を及ぼすことがない。また、各採点記号87と対応付けて処理結果保存サーバ40に各コメント88を保存するようにしたので、コメント88を生徒などが確認する用途以外に、採点官自らが、能力分析や生徒指導に活用できるようになる。
<文書原本作成と自動データ処理;具体例1>
図12は、文書原本8Aの一例である教育用教材80を処理対象とする具体的な第1の処理事例を示した図である。ここでは、教育用教材80としての答案を作成し、この答案を用いた試験後に、採点記号87に基づく自動採点処理やコメント88に基づくコメント分類処理を行なう例で示す。この具体例1の処理手順は、テンプレート6を利用して作成した教育用教材80の情報(特に答案情報とも称する)を文書原本情報データベースDB2に登録する点に特徴を有する。
前述のように、教育用教材80のベースとなるテンプレート6を文書作成装置5により作成し、テンプレート特定コードをハーフトーン画像中にデジタル情報として埋め込んで、テンプレート情報データベースDB1に登録する(S202)。
この後、たとえば、ワープロ機器やパソコンなどの電子的な文書作成ツールを使用して所望のテンプレート6を読み出して、このテンプレート6に設定されている記入欄6aを解答欄84に割り当てるとともに、各解答欄84に対応する問題文やタイトルなどを記入して教育用教材80を完成させ、作成した教育用教材80を一意に特定する文書原本特定コードをハーフトーン画像中にデジタル情報として埋め込んで、文書原本情報データベースDB2に登録する(S204,S205)。各記入欄6aに配点が設定されていない形態のテンプレート6を使用する場合には、解答欄84として設定した記入欄6aに関しては配点の情報も設定する。
答案情報データベースとして機能する文書原本情報データベースDB2へ作成した教育用教材80を登録するに当たっては、本例では、テンプレート関連付け情報69ではなく、テンプレート情報データベースDB1から取得される記入欄位置領域情報68を参照して記入欄6aの位置情報を解答欄84の位置情報に置き換えて、答案情報としての記入欄位置領域情報38として登録することにする。
ここで、ワープロ機器やパソコンなどの電子的な文書作成ツールを使用する場合であれば、テンプレート情報データベースDB1の記入欄位置領域情報68にアクセスして解答欄84に相当する記入欄6aの位置情報を特定するとともに、作成した文書原本8Aや記入欄6aに基づく解答欄84に対応する属性情報(問題文や配点)をそのまま文書原本情報データベースDB2に登録することで、答案情報としての記入欄位置領域情報38を登録する(S204)。
また、テンプレート6を印刷してから手書きで各解答欄84に対応する問題文やタイトルなどを記入して教育用教材80を完成させる場合には、先ず、作成した教育用教材80を読み取ってテンプレート特定コードを特定する。そして、テンプレート情報データベースDB1の記入欄位置領域情報68にアクセスして解答欄84に相当する記入欄6aの位置情報を特定するとともに、文字認識することで解答欄84の配点情報などを特定することで、答案情報としての記入欄位置領域情報38を登録する(S205)。
この後、試験を実施する際には、文書原本情報データベースDB2から教育用教材80を読み出してプリンタで印刷し生徒や受験者に配布する(S206)。そして、試験終了後、採点官は採点記号87やコメント88を生徒の解答に対して追記する(S208)。
自動データ処理時には、追記情報処理装置10(教材処理装置)は、付加情報記入済教材81の読取画像データを受け取り、ハーフトーン画像中に埋め込まれている文書原本特定コードを特定し、対応する教育用教材80の原本画像と記入欄位置領域情報38とを文書原本情報データベースDB2から入手する(S210,S214)。そして、自動データ処理として、採点記号87に関する自動採点集計処理やコメント88に関する自動コメント分類処理などを実行する(S220)。
この後、自動データ処理が完了すると、追記情報処理装置10は、採点・集計の結果やコメント分類結果を処理結果保存サーバ40に登録する(S222)。あるいは採点結果の点数を付加情報記入済教材81の集計欄83bに記入して返却答案81bとして印刷出力する(S224)。
この具体例1の処理手順によれば、電子的な文書作成ツールを用いるのか手書きによるのかを問わず、解答欄84に対応する記入欄6aの位置情報が予め定義付けられてテンプレート情報データベースDB1に登録されているテンプレート6を用いて教育用教材80を作成するので、作成した教育用教材80の情報を、記入欄位置領域情報38として文書原本情報データベースDB2に登録する際には、解答欄84の位置情報を手入力する必要がなく、文書原本8A(教育用教材80)の登録の負担が大幅に軽減される。もちろん、文書原本8A(教育用教材80)を手書きで作成する場合でも、不都合なく、登録が可能であり、手書き答案であっても、自動データ処理(自動採点やコメント分類)を実行できる。
また、作成した教育用教材80の情報を、記入欄位置領域情報38として文書原本情報データベースDB2に登録するので、後述の具体例2の処理手順とは異なり、文書原本8A(教育用教材80)を作成して文書原本情報データベースDB2に登録した後には、自動データ処理時に、ベースとなったテンプレート6の情報(記入欄位置領域情報68)をテンプレート情報データベースDB1に参照する必要がなくなる。
<文書原本作成と自動データ処理;具体例2>
図13は、文書原本8Aの一例である教育用教材80を処理対象とする具体的な第2の処理事例を示した図である。ここでも、具体例1と同様に、教育用教材80としての答案を作成し、この答案を用いた試験後に、採点記号87に基づく自動採点処理やコメント88に基づくコメント分類処理を行なう例で示す。この具体例2の処理手順は、テンプレート6を利用して作成した教育用教材80の情報(答案情報)を文書原本情報データベースDB2に登録しない、つまり原本登録を行なわない点に特徴を有する。
教育用教材80のベースとなるテンプレート6を文書作成装置5により作成し、テンプレート特定コードをハーフトーン画像中にデジタル情報として埋め込んで、テンプレート情報データベースDB1に登録する(S302)。
この後、たとえば、ワープロ機器やパソコンなどの電子的な文書作成ツールを使用して所望のテンプレート6を読み出して、このテンプレート6に設定されている記入欄6aを解答欄84に割り当てるとともに、各解答欄84に対応する問題文やタイトルなどを記入して教育用教材80を完成させる(S304,S305)。各記入欄6aに配点が設定されていない形態のテンプレート6を使用する場合には、解答欄84として設定した記入欄6aに関しては配点の情報も記入する。
ここで、ワープロ機器やパソコンなどの電子的な文書作成ツールを使用する場合であれば、テンプレート情報データベースDB1の記入欄位置領域情報68にアクセスして解答欄84に相当する記入欄6aの位置情報を特定するとともに、解答欄84に対応させて問題文や配点などを追記していく(S304)。この後、試験を実施する際には、作成した教育用教材80をプリンタで印刷し生徒や受験者に配布する(S306)。そして、試験終了後に、採点官は採点記号87やコメント88を生徒の解答に対して追記する(S308)。
また、手書きで教育用教材80を作成する場合には、文書作成装置5にて所要のテンプレート6をテンプレート情報データベースDB1から読み出してプリンタで印刷してから手書きで各解答欄84に対応する記入欄6aに対応させて問題文や配点などを追記していく(S305)。この後、試験を実施する際には、作成した教育用教材80を複写機でコピーし生徒や受験者に配布する(S307)。そして、試験終了後に、採点官は採点記号87やコメント88を生徒の解答に対して追記する(S308)。
自動データ処理時には、追記情報処理装置10(教材処理装置)は、先ず、無記入の教育用教材80(白紙答案)と、生徒による解答および採点官による採点記号87やコメント88の追記がされた付加情報記入済教材81(採点答案)の各読取画像データを受け取る(S310,S312)。そして、何れかのハーフトーン画像中に埋め込まれているテンプレート特定コードを特定し、対応する教育用教材80のベースとなったテンプレート6の記入欄位置領域情報68をテンプレート情報データベースDB1から入手する(S314)。そして、自動データ処理として、採点記号87に関する自動採点集計処理やコメント88に関する自動コメント分類処理などを実行する(S320)。
この後、自動データ処理が完了すると、追記情報処理装置10は、採点・集計の結果やコメント分類結果を処理結果保存サーバ40に登録する(S322)。あるいは採点結果の点数を付加情報記入済教材81の集計欄83bに記入して返却答案81bとして印刷出力する(S324)。
この具体例2の処理手順によれば、電子的な文書作成ツールを用いるのか手書きによるのかを問わず、解答欄84に対応する記入欄6aの位置情報が予め定義付けられてテンプレート情報データベースDB1に登録されているテンプレート6を用いて教育用教材80を作成するので、自動データ処理時に、解答欄84の位置情報を手入力する必要がなく、文書原本8A(教育用教材80)の登録の負担が大幅に軽減される。もちろん、文書原本8A(教育用教材80)を手書きで作成する場合でも、自動データ処理(自動採点やコメント分類)を不都合なく実行できる。
また、作成した教育用教材80の情報をデータベースDB2に登録する必要がなく、前述の具体例1の処理手順とは異なり、文書原本情報データベースDB2が不要であり、システム構成を簡易にすることができる。
このように、具体例1,2の何れの処理手順においても、先ず、解答欄84に対応する記入欄6aの位置情報が予め定義付けられてテンプレート情報データベースDB1に登録されているテンプレート6を用いて、解答欄84(記入欄6a)に対応させて問題文や配点などを追記して教育用教材80を作成する。
そして、さらにこの教育用教材80に採点記号87やコメント88が追記された付加情報記入済教材81について自動データ処理を実行する際には、付加情報記入済教材81に対応する教育用教材80もしくは元にしたテンプレート6を特定して、解答欄84(記入欄6a)の位置情報を記憶しているデータベースにアクセスして位置情報を呼び出して、データ処理対象の追記情報(採点記号87やコメント88)と原稿情報(解答欄84の位置情報や配点情報)を対応付けてからデータ処理を実行する。
これにより、自動データ処理に供される文書原本8A(教育用教材80)を作成しその情報をデータベースに登録する際に、解答欄84の位置情報を逐一入力する負担が無く、先生の自作答案などを自動採点する際に、容易に自動採点ができるようになる。
<文書作成装置および追記情報処理装置;計算機構成>
図14は、文書作成装置5や追記情報処理装置10の他の構成例を示すブロック図である。ここでは、パーソナルコンピュータなどの電子計算機を利用して、文書作成処理や追記情報処理を、ソフトウェアで実行するマイクロプロセッサなどから構築されるより現実的なハードウェア構成を示している。
すなわち、本実施形態において、テンプレート6や文書原本8Aを作成したり追記情報に関するデータ処理を実行したりする仕組みは、ハードウェア処理回路により構成することに限らず、その機能を実現するプログラムコードに基づき電子計算機(コンピュータ)を用いてソフトウェア的に実現することも可能である。
よって、本発明に係る仕組みを、電子計算機(コンピュータ)を用いてソフトウェアで実現するために好適なプログラムあるいはこのプログラムを格納したコンピュータ読取可能な記憶媒体を発明として抽出することもできる。ソフトウェアにより実行させる仕組みとすることで、ハードウェアの変更を伴うことなく、処理手順などを容易に変更できる利点を享受できるようになる。
電子計算機に、文書作成機能や追記情報に関するデータ処理機能をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ(組込マイコンなど)、あるいは、CPU(Central Processing Unit )、論理回路、記憶装置などの機能を1つのチップ上に搭載して所望のシステムを実現するSOC(System On a Chip:システムオンチップ)、または、各種のプログラムをインストールすることで各種の機能を実行することが可能な汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
記録媒体は、コンピュータのハードウェア資源に備えられている読取装置に対して、プログラムの記述内容に応じて、磁気、光、電気などのエネルギの状態変化を引き起こして、それに対応する信号の形式で、読取装置にプログラムの記述内容を伝達できるものである。
たとえば、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクFDを含む)、光ディスク(CD−ROM(Compact Disc-Read Only Memory )、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc )を含む)、または半導体メモリなどよりなるパッケージメディア(可搬型の記憶媒体)により構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されているROMやハードディスクなどで構成されてもよい。
また、ソフトウェアを構成するプログラムは、記録媒体を用いずに、記録媒体を介して提供されることに限らず、有線あるいは無線などの通信網を介して提供されてもよい。
たとえば、文書作成機能や追記情報に関するデータ処理機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、ハードウェア処理回路にて構成する場合と同様の効果は達成される。この場合、記憶媒体から読み出されたプログラムコード自体が文書作成機能や追記情報に関するデータ処理機能を実現する。
また、コンピュータが読み出したプログラムコードを実行することで、文書作成機能や追記情報に関するデータ処理機能が実現されるだけでなく、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(Operating Systems ;基本ソフト)などが実際の処理の一部または全部を行ない、その処理により文書作成機能や追記情報に関するデータ処理機能が実現される場合であってもよい。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によって文書作成機能や追記情報に関するデータ処理機能が実現される場合であってもよい。
なお、文書作成機能や追記情報に関するデータ処理機能を実現するプログラムコードを記述したファイルとしてプログラムが提供されるが、この場合、一括のプログラムファイルとして提供されることに限らず、コンピュータで構成されるシステムのハードウェア構成に応じて、個別のプログラムモジュールとして提供されてもよい。
たとえば、コンピュータシステム900は、コントローラ部901と、ハードディスク装置、フレキシブルディスク(FD)ドライブ、あるいはCD−ROM(Compact Disk ROM)ドライブ、半導体メモリコントローラなどの、所定の記憶媒体からデータを読み出したり記録したりするための記録・読取制御部902とを有する。
コントローラ部901は、CPU(Central Processing Unit )912、読出専用の記憶部であるROM(Read Only Memory)913、随時書込みおよび読出しが可能であるとともに揮発性の記憶部の一例であるRAM(Random Access Memory)915、および不揮発性の記憶部の一例であるRAM(NVRAMと記述する)916を有している。
なお、上記において“揮発性の記憶部”とは、装置の電源がオフされた場合には、記憶内容を消滅してしまう形態の記憶部を意味する。一方、“不揮発性の記憶部”とは、装置のメイン電源がオフされた場合でも、記憶内容を保持し続ける形態の記憶部を意味する。記憶内容を保持し続けることができるものであればよく、半導体製のメモリ素子自体が不揮発性を有するものに限らず、バックアップ電源を備えることで、揮発性のメモリ素子を“不揮発性”を呈するように構成するものであってもよい。
また、半導体製のメモリ素子により構成することに限らず、磁気ディスクや光ディスクなどの媒体を利用して構成してもよい。たとえば、ハードディスク装置を不揮発性の記憶部として利用できる。また、CD−ROMなどの記録媒体から情報を読み出す構成を採ることでも不揮発性の記憶部として利用できる。
また、コンピュータシステム900は、ユーザインタフェースをなす機能部としての指示入力部903と、操作時のガイダンス画面や処理結果などの所定の情報をユーザに提示する表示出力部904と、各機能部との間のインタフェース機能をなすインタフェース部(IF部)909とを有する。
なお、データ処理結果を印刷出力してユーザに提示する構成とするべく、処理結果を所定の出力媒体(たとえば印刷用紙)に出力する画像形成部906を設けることもできる。
指示入力部903としては、たとえば、ユーザインタフェース部985の操作キー部985bを利用することができる。あるいは、キーボードやマウスなどを利用することもできる。
表示出力部904は、表示制御部919と表示装置とを備える。表示装置としては、たとえば、ユーザインタフェース部985の操作パネル部985aを利用することができる。あるいは、CRT(Cathode Ray Tube;陰極線管)やLCD(Liquid Crystal Display;液晶)などでなるその他のディスプレイ部を利用することもできる。
たとえば、表示制御部919が、操作パネル部985aやディスプレイ部上に、ガイダンス情報や文書入力装置20が取り込んだ全体画像などを表示させる。また、各種の情報をユーザに通知する際の表示デバイスとしても利用される。なお、表示面上にタッチパネルを有するディスプレイ部とすることで、指先やペンなどで所定の情報を入力する指示入力部903を構成することもできる。
インタフェース部909としては、処理データ(画像データを含む)や制御データの転送経路であるシステムバス991の他、たとえば、画像形成部906や他のプリンタとのインタフェース機能をなすプリンタIF部996、およびネットワークとの間の通信データの受け渡しを仲介する通信IF部999を有している。
このような構成において、CPU912は、システムバス991を介してシステム全体の制御を行なう。ROM913は、CPU912の制御プログラムなどを格納する。RAM915は、SRAM(Static Random Access Memory )などで構成され、プログラム制御変数や各種処理のためのデータなどを格納する。また、RAM915は、所定のアプリケーションプログラムに従って演算して得たデータや外部から取得したデータなどを一時的に格納する領域を含んでいる。
たとえば、文書作成機能や追記情報に関するデータ処理機能をコンピュータに実行させるプログラムは、CD−ROMなどの記録媒体を通じて配布される。あるいは、このプログラムは、CD−ROMではなくFDに格納されてもよい。また、MOドライブを設け、MOに前記プログラムを格納してもよく、またフラッシュメモリなどの不揮発性の半導体メモリカードなど、その他の記録媒体にプログラムを格納してもよい。さらに、他のサーバなどからインターネットなどのネットワークを経由してプログラムをダウンロードして取得したり、あるいは更新したりしてもよい。
なおプログラムを提供するための記録媒体としては、FDやCD−ROMなどの他にも、DVDなどの光学記録媒体、MDなどの磁気記録媒体、PDなどの光磁気記録媒体、テープ媒体、磁気記録媒体、ICカードやミニチュアカードなどの半導体メモリを用いることができる。記録媒体の一例としてのFDやCD−ROMなどには、文書作成機能や追記情報に関するデータ処理機能を実現する際の、一部または全ての機能を格納することができる。
また、ハードディスク装置は、制御プログラムによる各種処理のためのデータを格納したり、自装置で取得したデータや外部から取得したデータなどを大量に一時的に格納したりする領域を含んでいる。
このような構成により、操作キー部985bを介した操作者による指令にて、前述の追記情報処理方法を実行するプログラムが記憶されているCD−ROMなどの読取可能な記録媒体からRAM915に追記情報処理プログラムがインストールされ、操作キー部985bを介した操作者による指令や自動処理にて追記情報処理プログラムが起動される。
たとえば、教材自動採点システム1を実現する場合であれば、文書作成装置5としてコンピュータシステム900を機能させるための文書作成プログラムでは、テンプレート6を作成する処理ステップや、テンプレート6を使用して文書原本8Aを完成させる処理ステップなどが記述されたプログラムが起動される。
CPU912は、この文書作成処理プログラムに従って前述のテンプレート作成処理方法や文書原本作成処理方法に伴う処理を施し、処理結果をRAM915やハードディスクなどの記憶装置に格納し、必要により操作パネル部985a、あるいはCRTやLCDなどの表示装置に出力する。これらを実行するプログラムが記録した記録媒体を用いることにより、既存のシステムを変えることなく、文書作成処理システムを汎用的に構築することができる。
また、追記情報処理装置10としてコンピュータシステム900を機能させるための教材処理プログラムでは、所定色成分、具体的にはたとえば赤色成分の差分抽出結果を、採点記号87やコメント88の記入内容として認識し、かつ両者を分離するようにする処理ステップなどが記述されたプログラムが起動される。
CPU912は、この追記情報処理プログラムに従って前述の追記情報処理方法に伴う計算処理を施し、処理結果をRAM915やハードディスクなどの記憶装置に格納し、必要により操作パネル部985a、あるいはCRTやLCDなどの表示装置に出力する。追記情報処理方法を実行するプログラムが記録した記録媒体を用いることにより、既存のシステムを変えることなく、追記情報処理システムを汎用的に構築することができる。
なお、このようなコンピュータを用いた構成に限らず、図9を用いて示した各機能部の処理をなす専用のハードウェアの組合せにより、文書作成機能や追記情報に関するデータ処理機能を行なう追記情報処理装置10を構成することもできる。
また、たとえば、文書作成機能や追記情報に関するデータ処理機能のための各機能部分の全ての処理をソフトウェアで行なうのではなく、これら機能部分の一部を専用のハードウェアにて行なう処理回路908を設けてもよい。ソフトウェアで行なう仕組みは、並列処理や連続処理に柔軟に対処し得るものの、その処理が複雑になるに連れ、処理時間が長くなるため、処理速度の低下が問題となる。
これに対して、ハードウェア処理回路で行なうことで、高速化を図ったアクセラレータシステムを構築することができるようになる。アクセラレータシステムは、処理が複雑であっても、処理速度の低下を防ぐことができ、高いスループットを得ることができる。
たとえば、追記情報に関するデータ処理機能を実現する場合であれば、処理回路908としては、図9に示した追記情報処理装置10における機能分を設ける。たとえば、読取画像処理部110に相当する読取画像処理部908a、文書原本特定部120に相当する文書原本特定部908b、追記情報抽出部130に相当する追記情報抽出部908c、データ処理対象追記情報特定処理部150に相当するデータ処理対象追記情報特定処理部908d、あるいはデータ処理部170に相当するデータ処理部908eなどをハードウェアで構成するとよい。
また、図示を割愛するが、文書作成機能を実現する場合であれば、処理回路908としては、図9に示した文書作成装置5における機能分を設ける。たとえば、定型文書生成部510や文書原本生成部520に相当する各機能部をハードウェアで構成するとよい。
1…教材自動採点システム、5…文書作成装置、6…テンプレート(定型文書)、6a…記入欄、8A…文書原本、8B…追記済文書、9…差分情報、10…追記情報処理装置、20…文書入力装置、30…文書管理サーバ、40…処理結果保存サーバ、50…文書原本作成装置、70…帳票、71…記入済帳票、80…教育用教材、81…付加情報記入済教材、87…採点記号、88…コメント、90…手帳、91…付加情報記入済手帳、97…予定、98…コメント、99…分類記号、110…読取画像処理部、120…文書原本特定部、122…教材特定部、130…追記情報抽出部、132…差分抽出部、134…解答者抽出部、140…データ処理用追記情報抽出処理部、150…データ処理対象追記情報特定処理部、154…第1データ処理用追記情報認識部、155…分離認識処理部、156…図形形状認識部、157…文字認識処理部、158…記入位置認識部、164…第2データ処理用追記情報認識部、166…図形形状認識部、167…文字認識処理部、168…記入位置認識部、170…データ処理部、170_1…第1データ処理部、170_2…第2データ処理部、171…ユーザ端末、172…採点集計部、174…集計結果出力部、176…コメント分類処理部、178…コメント処理結果出力部、510…定型文書生成部、512…記入欄設定部、518…テンプレート出力部、520…文書原本生成部、522…テンプレート選択部、530…情報追加部、532…記入欄対応情報追加部、534…汎用情報追加部、540…文書原本出力部