JP2007280241A - 追記情報処理方法、追記情報処理装置、およびプログラム - Google Patents
追記情報処理方法、追記情報処理装置、およびプログラム Download PDFInfo
- Publication number
- JP2007280241A JP2007280241A JP2006108324A JP2006108324A JP2007280241A JP 2007280241 A JP2007280241 A JP 2007280241A JP 2006108324 A JP2006108324 A JP 2006108324A JP 2006108324 A JP2006108324 A JP 2006108324A JP 2007280241 A JP2007280241 A JP 2007280241A
- Authority
- JP
- Japan
- Prior art keywords
- additional information
- information
- additional
- processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】教材自動採点システムにおいて、採点記号とコメントとを分離した適切なデータ処理ができるようにする。
【解決手段】付加情報記入済教材81に追記されている採点記号87とコメント88とを、記載位置、画像特徴量、あるいは認識処理時の信頼度などの付加情報が持つ様々な特徴に基づいて分離する。この際、付加情報が持つ単一の特徴に基づくだけでなく複数の特徴を参照することで、より正確な分離認識を行なうようにする。そして、この分類した採点記号87については自動採点処理を実行し、またコメント88については生徒指導用データベースの構築処理を行なう。
【選択図】図7
【解決手段】付加情報記入済教材81に追記されている採点記号87とコメント88とを、記載位置、画像特徴量、あるいは認識処理時の信頼度などの付加情報が持つ様々な特徴に基づいて分離する。この際、付加情報が持つ単一の特徴に基づくだけでなく複数の特徴を参照することで、より正確な分離認識を行なうようにする。そして、この分類した採点記号87については自動採点処理を実行し、またコメント88については生徒指導用データベースの構築処理を行なう。
【選択図】図7
Description
本発明は、追記情報処理方法、追記情報処理装置、およびプログラムに関する。より詳細には、文書に追加記入された付加情報(追記情報やアノテーションとも称する)を、文書本体から分離し、文書本体と関わりを持つ様々な情報処理に利用する仕組みに関する。
情報処理技術の進歩の著しい今日、文書に関する様々な処理を自動処理する仕組みがある。たとえば、予め所定の情報が記載されている文書原本にさらに別の付加情報を追記し、その付加情報の追記された追記済文書を処理対象として、追記された付加情報に基づいて所定のデータ処理を行なう仕組みがある。
たとえば、定型伝票に情報を記入して、その記入された情報を処理対象とする場合や、予め日付や予定記入欄が用意された主に手帳やメモなどに手書きで予定を記入し、その記入された予定を電子データ化する個人情報管理(特にスケジュール管理ともいう)の仕組みもある。
個人情報管理を例にすれば、たとえば特許文献1には、書き込みの施された手帳などの紙面をスキャナより入力し、既知の方法により文字や枠線を検出し、検出した文字や枠線の配置を予め記憶された手帳の書式の知識と照合し、各記載項目の属性を表すデータを生成する仕組みが提案されている。
手帳やメモなどに手書きで記入した情報(本例では手帳に手書きで入力した予定の記載内容)が自動的に電子データに変換され、各記載項目を生成された属性に対応付けて切り換えてデータベースに登録することができるので、利用者がある書式の出力を要求した場合には、予め記憶された出力の書式を参照することにより、データベースの内容を紙上の各内容に対応した場所に印刷するなどができ便利である。
たとえば、領域内に記入された文字の属性を認識し、その属性を文字と対応付けて保存する際、記入位置に着目して属性判別したり、文字の周辺に存在する記号によって関連付けられる他の文字属性に着目したりする仕組みが開示されている。なお、文字認識できなかった場合は、文字をイメージとして取り扱うようになっている。
また、各記載項目に属性を対応付けておくことで、手帳の記載内容を再現して清書印刷出力することができるのみならず、内容を特定の観点から整理し直し、所望の書式で出力することができる点も開示されている。
しかしながら、特許文献1に記載の仕組みでは、抽出した内容を複数種類に分離(区別)して処理する点については開示がない。たとえば、同一項目内に記入したものは、全て単一の処理を適用されるので、仕事の予定もプライベートの予定も全て区別無く登録される。これでは、仕事の予定データと私的な予定とを区別した取扱いができない。
本発明は、上記事情に鑑みてなされたものであり、文書に追記された内容を複数に分離(区別け)して処理することのできる仕組みを提供することを目的とする。
本発明に係る追記情報処理の仕組みにおいては、追記済文書中に存在する複数の付加情報を抽出し、この抽出した複数の付加情報の記載内容を認識するとともに、記載位置、画像特徴量、あるいは認識処理時の信頼度などの付加情報が持つ様々な特徴に基づいて、複数の付加情報を複数の種類に区分けする。そして、この分離した複数の付加情報のそれぞれに基づいて、それぞれの区分に対応した個別のデータ処理を行なうようにした。
なお、本発明に係る仕組みは、電子計算機(コンピュータ)を用いてソフトウェアで実現することもでき、このためのプログラムやこのプログラムを格納した記録媒体を発明として抽出することも可能である。プログラムは、コンピュータ読取り可能な記憶媒体に格納されて提供されてもよいし、有線あるいは無線による通信手段を介した配信により提供されてもよい。
本発明によれば、文書中に追記された各付加情報を、それぞれが持つ特徴に基づいて、複数の付加情報を複数の種類に分離し、この分離区分に応じた個別のデータ処理を行なうようにしたので、抽出したそれぞれの記載内容をそれぞれ適切に分離することができる。その結果、それぞれの記載内容に基づく各別のデータ処理においても、適切にデータ処理ができる。
以下、図面を参照して本発明の実施形態について詳細に説明する。
<処理対象文書の例>
図1および図2は、本発明に係る追記情報処理装置を備えてなる情報処理システムにおいて処理対象とする文書の一例を示す図である。何れも、文書原本8Aを(A)に、追記済文書8Bを(B)に示す。また、データベースへの登録情報の一例を(C)に示す。
図1および図2は、本発明に係る追記情報処理装置を備えてなる情報処理システムにおいて処理対象とする文書の一例を示す図である。何れも、文書原本8Aを(A)に、追記済文書8Bを(B)に示す。また、データベースへの登録情報の一例を(C)に示す。
図1に示す第1例の文書は、教育現場で紙媒体として使用される教育用教材80であって、典型例として、問題文82およびその解答欄84(本例では括弧で示された部分)を有したものであり、図1(A)はその文書原本8Aを示し、図1(B)は、追記情報記入済の状態(追記済文書8B)を模式的に示している。
このような教育用教材80は、具体的には教育機関で用いられるペーパーテストや練習問題シートなどが該当する。なお、教育用教材80は、少なくとも解答欄84を有していればよく、たとえば採点官が読み上げた問題について解答欄84に解答を記入する場合などがあり、問題文82については必ずしも記載されていなくともよい。
また、図1(A)に示すように、教育用教材80は、問題文82および第1種の付加情報の一例である解答が記入される解答欄84の他に、配点欄83(問題別の項目点欄83aや部分点欄や合計点欄でなる集計欄83b)と、第1種の付加情報の一例である教育用教材80を識別特定するための情報を記入する識別情報欄85と、第1種の付加情報の一例である解答者情報であって解答欄84への解答記入者に関する情報を記入する解答者情報欄86とを有している。解答欄84、識別情報欄85、解答者情報欄86は、何れも第1種の付加情報を記入する記入欄の一例である。
識別情報欄85には、たとえば教育用教材80の科目、タイトル、あるいは適用学年などが予め記載されるものとする。ただし、これらの記載に加えて、またはこれらの記載とは別に、教育用教材80を識別するためのコード情報が埋め込まれていてもよい。
コード情報の埋込みは、公知技術を利用して実現すればよいが、その一つの具体例として、たとえば「iTone(登録商標)」と呼ばれるもののように、階調表現としての万線スクリーンまたはドットスクリーンを構成する画素の形態(位置、形状など)を変化させることで、ハーフトーン画像の中にデジタル情報を埋め込むようにする、といった技術を用いることが考えられる。一方、解答者情報欄86には、解答記入者の学級86a、出席番号86b、あるいは氏名86cなどが記入され得るようになっている。
配点欄83(特に項目点欄83a)には、各解答欄84についての配点情報が記入される。配点情報とは、教育用教材80における各解答欄84について、各位置の解答欄84への配点が何点であるかを特定するための情報である。なお、配点は、解答欄84ごとに異なっていてもよいし、あるいは一律であってもよい。
このような教育用教材80は、対応する原本(教材原本)の電子データに基づき印刷装置で印刷出力することで得ることができる。教材原本の電子データは、たとえばパーソナルコンピュータなどの電子計算装置を利用してワープロソフトなどのアプリケーションソフトウェアを用いて生成することができ、予め所定のデータベースなどに保存される。
なお、教材原本の電子データは、その教育用教材80における解答欄84や識別情報欄85などのレイアウトを特定し得るものであり、かつ、所定のデータベースにて保持蓄積可能なものであれば、そのデータ形式を問わない。たとえば、文書作成ソフトウェアで作成したアプリケーション文書データに限らず、画像データであってもよい。
教育現場では、図1(A)に示した文書原本8Aの一例である教育用教材80が生徒や受験者などに配布され、先ず、生徒などによって解答者情報欄86への氏名や解答欄84への解答などの第1種の付加情報が所定欄に記入された後に回収される。この後さらに、図1(B)に示す追記済文書8Bの一例である付加情報記入済教材81のように、教師などの採点官によって各解答欄84に記入された解答に対する採点記号(正誤判定図形)87や採点記号87と関連するその他の図形や文章で示されたコメント88などの第2種の付加情報が記入される。なお、追記情報処理装置10で自動採点処理を行なうので、この時点では、採点官による配点欄83Cへの記入はない。
この際には、通常、生徒などによる第1種の付加情報の記入に使用されるペン色と、採点官などによる第2種の付加情報の記入に使用されるペン色とは、異なるものが使用される。
採点記号87としては、たとえば、正解を示す「○」やその他の図形(たとえば楕円図形)、不正解を示す「×」やその他の図形(たとえば「レ点」などのチェックマーク)、あるいは一部正解を示す「△」やその他の図形がある。
コメント88は、採点記号87を元にした第1のデータ処理には直接的な関係を有しない情報であるが、第1のデータ処理の結果をサポート(補強)するあるいは全く関係のない第2のデータ処理に利用されるものである。
教材自動採点システムでは、この追記済文書8Bの一例である付加情報記入済教材81を対象として所定のデータ処理を行なうことになる。この際、第2種の付加情報(本例では採点記号87とコメント88)の別に、それぞれに応じた個別のデータ処理を行なうようにする。この例では、第1のデータ処理として採点記号87を元にした自動採点処理を行なう。この自動採点処理結果として、たとえば、配点欄83Cへ記入する得点情報が取得されることになる。また、コメント88の追記内容を元にした自動採点処理結果とは別の第2のデータ処理を行なう。
自動採点処理とは別の第2のデータ処理としては、たとえば、コメント88の追記内容を所定の条件に基づいて分類する処理や、分類したコメント(全ての追記内容には限らず一部の追記内容でもよい)を対応する解答欄84についての採点処理結果と関連付けて生徒指導用データベースに登録・蓄積しておく処理などを行なう。
こうすることで、自動採点処理とは別の第2のデータ処理の利用形態としては、生徒指導用データベースから情報を取り出して、後の生徒指導に利用することができるようになる。たとえば、全ての採点結果と対応するコメントを表示するようにすれば、優秀、優、並、劣、などの評価の細分類と合わせて採点結果を確認することができる。また、結果が不正解のコメントのみを表示するようにすれば、問題の読み間違えが多い、解答の書き間違えが多い、あるいは計算ミスが多いなどの生徒の能力分析に利用することもできる。あるいは、コメント88で示されている注意文やミス修正に基づき生徒指導に利用することも考えられる。
なお、採点記号87やコメント88を対象としたデータ処理を実行するための教育用教材80(原本画像)のデータベースへの登録に当たっては、採点記号87についてのデータ処理時に必要となる解答欄84の位置情報や問題番号や配点情報などを示す記入欄位置領域情報38と、コメント88についてのデータ処理時に必要となる分類基準情報39とを登録しておく。
たとえば、図1(C)に示すように、記入欄位置領域情報38の一例である解答欄位置領域情報を、教育用教材80上に存在する問題の番号と、その問題の解答に対する配点と、その問題の解答を記入する解答欄84として扱われる領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。分類基準情報39については後述する。
なお、付加情報記入済教材81に対応する元の教育用教材80が文書管理サーバに登録されていないときには、無記入の教育用教材80を文書入力装置で読み取ることで対処してもよい。
一方、図2に示す第2例の文書は、ビジネスマンなどが使用するビジネス文書であって、典型例として、スケジュール管理用の手帳90を示している。一般的な手帳90では、日付(年月日)欄92と、各日付における予定97を記入する予定欄94を有しており、図2(A)はその文書原本8Aを示し、図2(B)は、追記情報記入済の状態(追記済文書8B)を模式的に示している。なお、図2(A)では、予定97を記入するための予定欄94が日付単位で区別けされた例で示しているが、さらに、各日付内の時間(時刻)単位で区別けしたものもある。予定欄94は第1種の付加情報を記入する記入欄の一例であり、この予定欄94には、たとえば、該当日時に実行すべき予定97が記入され得るようになっている。
このような手帳90は、市場で購入することができるし、あるいは対応する原本(手帳原本)の電子データに基づき印刷装置で印刷出力することで得ることもできる。手帳原本の電子データは、たとえばパーソナルコンピュータなどの電子計算装置を利用してワープロソフトなどのアプリケーションソフトウェアを用いて生成することができ、予め所定のデータベースなどに保存される。
なお、手帳原本の電子データは、その手帳90における日付欄92や予定欄94などのレイアウトを特定し得るものであり、かつ、所定のデータベースにて保持蓄積可能なものであれば、そのデータ形式を問わない。たとえば、文書作成ソフトウェアで作成したアプリケーション文書データに限らず、画像データであってもよい。
ビジネス現場では、図2(A)に示した文書原本8Aの一例である手帳90を身近におき、先ず、所有者によって予定欄94への予定97(第1種の付加情報)が該当日時の予定欄94に記入される。このとき、さらに、図2(B)に示す追記済文書8Bの一例である付加情報記入済手帳91のように、所有者自らによって各予定欄94に記入された予定97に対する分類記号99(たとえば社用と私用の区別をするもの)や予定97と関連するその他の図形や文章で示されたコメント98などの第2種の付加情報が記入される。
この際には、通常、手帳90で使用されている文字色と、予定97やコメント98の記入に使用するペン色とは、異なるものが使用される。
また、分類記号99としては、たとえば、私用(Private use )を示す「P」やその他の文字・図形(たとえば◇マークなど)がある。私用にのみ分類記号99を付すことで、社用(Business use)については、特に分類記号99を付さなくてもよい。
また、コメント98は、予定97を元にした第1のデータ処理には直接的な関係を有しない情報であるが、第1のデータ処理の結果をサポート(補強)するあるいは全く関係のない第2のデータ処理に利用されるものである。
分類記号99を含むコメント98は、一般的なビジネス文書における追記内容(付加情報記入済手帳91の例では予定97に相当)に対しての校正記号としての意味を持ち、このコメント98を利用することで、予定97を所定の条件に基づいて編集することができるようになる。
たとえば、個人情報管理システムでは、この追記済文書8Bの一例である付加情報記入済手帳91を対象として所定のデータ処理を行なうことになる。この際、第2種の付加情報(本例ではコメント98に基づく予定97の種類)の別に、それぞれに応じた個別のデータ処理を行なうようにする。この例では、第1のデータ処理とし予定97の内容を元にした自動スケジュール管理処理(予定97の電子データ化)を行ない、またコメント98の追記内容を元にした自動スケジュール管理処理そのものとは別の第2のデータ処理を行なう。
自動スケジュール管理処理そのものとは別の第2のデータ処理としては、たとえば、コメント98(分類記号99を含む)の追記内容に従って、第1のデータ処理としての自動スケジュール管理処理結果を社用と私用とに分類する処理や、分類した予定97(全ての追記内容には限らず一部の追記内容でもよい)を対応する日付と関連付けてデータベースに個別に登録・蓄積しておく処理などを行なう。
こうすることで、社用スケジュールと私用スケジュールをと切り分けてデータベース上で管理することができるようになる。それぞれのデータベースの公開と非公開とを個別に設定することができるようになるので使い勝手がよくなる。
特開平5−216932号公報に記載の仕組みでは、予定欄94に記入された内容の全てについて単一の処理がなされ、この例では、仕事の予定もプライベートの予定も、全て区別無く1つのデータベースとして登録されることになる。このため、たとえば、仕事のスケジュールを公開・共有しようとしたときには、公開したくないプライベートの予定までもが公開されてしまう不都合が生じるのと大きく異なる。
なお、予定97やコメント98を対象としたデータ処理を実行するための手帳90(原本画像)のデータベースへの登録に当たっては、予定97やコメント98についてのデータ処理時に必要となる予定欄94の位置情報などを示す記入欄位置領域情報38と、コメント98についてのデータ処理時に必要となる分類基準情報39とを登録しておく。
たとえば、図2(C)に示すように、記入欄位置領域情報38の一例である予定欄位置領域情報を、手帳90上に存在する日付(年月日)と、各日付内の時間(時刻)と、予定97を記入する予定欄94として扱われる領域の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)とからなる情報で、これらを互いに関連付けるテーブル形式で、所定の格納領域に保持蓄積しておく。分類基準情報39については後述する。
<コメント例と分類例>
図3〜図5は、付加情報記入済教材81におけるコメント88や付加情報記入済手帳91におけるコメント98の一例と、採点記号87や予定97と区別した「一方の付加情報」の一例である各コメント88,98をさらに複数に分類する際に使用される分類基準情報39の一例を説明する図である。
図3〜図5は、付加情報記入済教材81におけるコメント88や付加情報記入済手帳91におけるコメント98の一例と、採点記号87や予定97と区別した「一方の付加情報」の一例である各コメント88,98をさらに複数に分類する際に使用される分類基準情報39の一例を説明する図である。
文書原本8A(教育用教材80や手帳90)にコメント88,98を記入することで追記済文書8B(付加情報記入済教材81や付加情報記入済手帳91)となるが、それらは、文書中に記入済の文字や図形を対象として付加(追記)されるものであるし、これらコメント88,98には、種類の面では、文字で記入される場合もあれば図形(線を含む)で記入される場合もあるし、また、外形面から見れば、その大小や長さも様々なものがある。また、追記目的(文字の意味)の面から見れば、追記対象の採点記号87や分類記号97などとの関係で様々な目的が存在する。
したがって、各コメント88,98を分類する際には、種類(文字や図形)、外形(大小(量)や長さ)、追記目的、あるいは追記対象の各側面(個別に限らず任意の組合せに関しても)を考慮する必要がある。
たとえば、図3に示す第1例では、コメント88,98を種類の側面から文字に注目して、コメント88,98の一例とその分類方法を例示している。なお、追記済文書8B中からコメント88,98部分を抽出し、文字認識処理を実行することで、コメント88,98から文字を抽出することができる。
たとえば、付加情報記入済教材81の一例である採点答案(第1例)は、文字で追記されているコメント88は、その追記目的が重要な事例である。この場合、各コメント88を分類する際には、文字に長さには関わらず、追記目的の側面からクラス分けする。この際には、文字全体の意味でクラス分けすることもできるし、特定の文字(記号を含む)が含まれているか否かを考慮してクラス分けすることもできる。
たとえば、「よくできました」、「優」、「OK」、「good」、「excellent 」などの良好である意味を持つ文字を含むものは「よい評価」に分類し、「注意」、「注」、「よく読むこと」、「?」などの生徒指導を要する意味を持つものは「注意点」に分類し、文字(たとえば1,2字程度)や数字で誤解答に対しての訂正がなされているものについては「ミス修正」に分類することが考えられる。
また、付加情報記入済教材81の一例である採点答案(第2例)では、文字で追記されているコメント88は、その長さ(文量)が重要な事例である。この場合、各コメント88を分類する際には、意味内容には関わらず、長さの側面からクラス分けする。これは、一般的には、生徒指導のために追記する文字列は長くなるのに対して、「ミス修正」の際には文字(たとえば1,2字程度)や数字で誤解答に対しての訂正がなされることを考慮したものである。よって、「文字の量が多い」ものは「アドバイス」に分類し、文字の量が少ない(1,2字)」ものは「ミス修正」に分類することが考えられる。
採点答案の第1例および第2例の何れの分類方法であっても、コメント88の文字と追記対処の解答欄84に記入されている解答内容とに基づいて、生徒の能力分析や指導に利用することができるようになる。たとえば、「注意点」や「ミス修正」に分類したコメント88を参照することで、問題の読み間違えが多い、解答の書き間違えが多い、あるいは計算ミスが多いといった能力分析ができ、対応する指導もできるようになる。
また、付加情報記入済手帳91では、スケジュール管理のために予定を記入することが行なわれる。この際、記入する予定としては、仕事の予定もあれば私的(プライベート)な予定もある。これを分類するためにコメント98が利用される。よって、この場合、たとえば、会議、打ち合わせ、**社、部、課、係、B(会社用として登録した文字マーク)、**氏(登録した人名)、などのように、仕事に関わる予定のものについては「ビジネス」に分類し、食事、待ち合わせ、旅行、ドライブ、**会、P(私用として登録した文字マーク)、**氏(登録した人名)、などのように、個人に関わる予定のものについては「プライベート」に分類することが考えられる。
こうすることで、付加情報記入済手帳91の記入内容を電子スケジュールに反映する際に、仕事のスケジュールと個人のスケジュールとを区別して、個別のデータベースに登録しておくことができるようになる。あるいは、仕事関係のスケジュールのみを電子スケジュールに反映させることができる。
また、図4に示す第2例では、コメント88,98を種類の側面から図形に注目して、コメント88,98の一例とその分類方法を例示している。なお、追記済文書8B中からコメント88,98部分を抽出し、パターン認識処理を実行することで、コメント88,98から図形を抽出することができる。
ここで、図4は、コメント88,98の追記目的が重要であるときに、その追記目的を文字ではなく図形で示す事例を示している。この場合、図形で示された各コメント88,98を分類する際には、予め、たとえば、二重線は訂正、波線は良いところ、下線は注意点、仕事用を意味するものとして定義したマークや私的用を意味するものとして定義したマークなどのように、各図形に利用目的を定義付けておくことが必要となる。
こうすることで、図形の大きさには関わらず、追記目的の側面からクラス分けすることができる。またこの際には、図形の種類(形状や線種)でクラス分けすることもできるし、特定の図形(矢印や飾り図形など)が含まれているか否かを考慮してクラス分けすることもできる。
たとえば、付加情報記入済教材81の一例である採点答案では、波線や花丸などの良好である意味を持つ図形は「よい評価」に分類し、下線や矢印などの生徒指導を要する意味を持つ図形は「注意」に分類し、二重線で誤解答に対しての訂正がなされているものについては「ミス修正」に分類することが考えられる。
また、付加情報記入済手帳91では、スケジュール管理のために記入する予定としては、仕事の予定と私的な予定があり、これを分類するためにコメント98が利用される。この場合、たとえば、仕事の予定用に定義した規定の図形マークや登録した図形マーク(たとえば「★」)が付された予定については「ビジネス」に分類し、私的な予定用に定義した規定の図形マークや登録した図形マーク(たとえば「◇」)が付された予定については「プライベート」に分類することが考えられる。
また、図5に示す第3例では、コメント88,98の追記対象に注目して、コメント88,98の一例とその分類方法を例示している。追記対象の側面から分類する場合、各コメント88,98が追記されている部分や周囲の画像を参照して、たとえば、計算欄,解答欄,問題文章などの指摘箇所や、教科や、問題種類(計算、文章題、選択問題など)や、記入欄と分類目的との関係などを考慮して分類することが考えられる。
たとえば、付加情報記入済教材81の一例である採点答案では、国語、算数、理科、社会などの「教科ごと」にコメント88を分類することで、苦手な教科を特定し生徒指導に利用することがでる。また、計算問題、漢字書取り、文章題、選択問題などの「問題種類ごと」にコメント88を分類することで、苦手な問題形式を特定し生徒指導に利用することがでる。また、問題文に対しての問題の読み間違いの指摘、解答に対しての書き間違いや計算ミスの指摘または修正、あるいは「良くできました」などのコメントによるその他の指摘のように「追記場所ごと」にコメント88を分類することで、間違いの種類を特定し生徒指導に利用することがでる。
また、付加情報記入済手帳91では、スケジュール管理用の記入欄が、一般的には、曜日で区別けされているし、また各曜日はさらに時間帯で区別けされている場合もある。よって、コメント98が何処の箇所に記入されているのかに基づいて各コメント98を分類することができる。たとえば、平日と休日・祝日というように「曜日ごと」にコメント88を分類することで、予定として記入されているコメント98を仕事とプライベートとに分類することができる。一般的に、平日に勤務し、休日・祝日は休業であることに基づくものである。
また、時間帯まで記入できる手帳であれば、記入欄の上から下、右から左で時間帯が早い遅いを判断することができるので、コメント98の追記場所に基づいて、各コメント98を時間帯の別に分類することができる。また、場合によっては、何れの時間帯であるのかによって予定として記入されているコメント98を仕事とプライベートとに分類することができる。一般的に、日中〜夕方(たとえば午前8時〜午後8時)に勤務し、夜間は業務外であることに基づくものである。
<追記情報の分離認識処理>
図6は、複数種類の追記情報を分離して認識・特定する処理(以下分離認識処理ともいう)の手法を纏めた図表、およびその内の一部の処理手法を具体的に説明する図である。
図6は、複数種類の追記情報を分離して認識・特定する処理(以下分離認識処理ともいう)の手法を纏めた図表、およびその内の一部の処理手法を具体的に説明する図である。
追記情報について自動データ処理を実行する際に、追記情報を複数種類のものに分類し、それぞれの分類ごとに個別のデータ処理を実行しようとする場合には、各追記情報を他方のものと分離して認識・特定することが必要となる。両者の分離認識が適正になされないと、それぞれのデータ処理を適正に実行することができなくなる。
たとえば、図1に示した付加情報記入済教材81の場合には、採点記号87に基づく自動採点処理と、コメント88に基づく生徒指導用データベースの構築処理があり、このような個別処理を実現するには、採点記号87とコメント88とを区別して認識処理などを行なってから最終的なデータ処理を行なう必要がある。
一方、答案の採点においては、採点記号87以外のコメント88を、採点記号87と同じペンで記載することがあり、たとえば差分抽出結果に対する色成分認識処理を通じて、ペン色と対応する所定色成分についてのものを抽出するだけでは、両者を適切に分離した認識と記載内容の特定ができない。
たとえば、図6(A)に示すように、「50個のミカンを5人で分けたら、1人は何個のミカンを食べることができるか」との事例問題について、解答式の全体と答(解答式の右辺)の双方が解答記入として求められているときに、「50÷10=5」との解答式と「5」との答が対応する解答欄84に生徒によって記入されていたとき、解答式の左辺における誤解答部分である「10」へのライン付け(図中の矢指P)と「5」との誤解答訂正(図中の矢指Q)がなされることもある。
また、その他の部分について、たとえば、感想(good、良くできましたなど)(図中の矢指R)、問題文章へのライン付け(図中の矢指S)がされることがある。さらに、図示を割愛するが、その他、減点理由や部分集計点、あるいは一度付けた採点記号87に対する訂正など、図3や図4に示した各種のコメント88が記入される。
このとき、各種の追記情報が同じ色のペンで記入されると、採点記号87とコメント88とを分離できず、自動採点処理に悪影響を及ぼす。また、追記情報としては、自動採点処理用の採点記号87の他に、生徒指導などにも利用し得るコメント88が存在するにも関わらず、付加情報記入済教材81を生徒に返却した後には、生徒がその記載内容を確認する以外には活用できない事態となる。
また、図2に示した付加情報記入済手帳91の場合には、予定97に基づく自動スケジュール管理処理(予定97の電子データ化)と、コメント98(分類記号99を含む)に基づく社用スケジュールと私用スケジュールの個別データベース構築処理があり、このような個別処理を実現するには、予定欄94に記入された予定97とコメント98とを区別して抽出し、認識処理などを行なってから最終的なデータ処理を行なう必要がある。
一方、記入されたスケジュールの電子データ化とデータベースへの登録においては、予定97以外のコメント98を予定97と同じペンで記載することがあるし、また、各予定97を記入する時点が異なることも起こり得る、つまり、予定97の記入に使用されるペン色は様々であり、かつ予定97とコメント98とを切り分けて別のペン色が使用されるとは限らない。この場合、たとえば差分抽出結果に対する色成分認識処理を通じて、ペン色と対応する所定色成分についてのものを抽出するだけでは、両者を適切に分離した抽出ができない。
本実施形態では、この点を解消するべく、追記済文書8B中に存在する複数の付加情報を、記載位置、画像特徴量、あるいは認識処理時の信頼度などの付加情報が持つ様々な特徴に基づいて、複数の種類に分類(分離)する。この際、付加情報が持つ単一の特徴に基づくだけでなく複数の特徴を参照することで、より正確な分離認識を行なうようにするのがよい。
たとえば、図6(B)に示す各種の特徴量に着目した手法を利用して、採点記号87や予定97と、コメント88,98とを分離して認識・特定することにする。この際、単一の手法を用いることに限らず、各種の手法を組み合わせることで、より精度の高い分離認識ができるようにする。
たとえば、追記済文書8B中における付加情報の記載位置を分離基準とする方法が考えられる。記載位置に着目する場合、第1の手法としては、解答欄84などの記入欄を明示し、その内外で分離する、あるいは、記入枠に最も近いものとその他で分離するというように記入欄との相対距離により分離するなど、解答欄84や予定欄94のような記入欄とコメント88,89の位置関係を分離基準とする方法が考えられる。採点記号87は、解答欄84に記入された解答に対して追記されるものあり、一般的には、概ね解答欄84内もしくは一部が解答欄84に重なって記載されるという経験則に基づくものである。
また、記載位置に着目する場合の第2の手法としては、採点記号87とコメント88のそれぞれが追記される記入位置そのものを分離基準とする方法が考えられる。たとえば、記入欄としての解答欄84内もしくはその近傍において、採点記号87は生徒解答の最終部分(たとえば最下部)に追記されることが多いという経験則に基づくものである。この場合、解答の最終部分への追記は採点記号87でその他の追記はコメント88であるとすることができる。
この手法は、記載位置を分離基準とする第1の方法と併用すると効果的である。記入欄との位置関係に基づくだけでは、記入欄内もしくはその極近傍に追記されているコメント88を採点記号87として分離・抽出してしまうが、さらに追記位置をも併用することで、両者を適切に分離することができるからである。
あるいは、一定以上大きいか否かや全体の分布を調べて分離するといった記載領域サイズで分離する方法や、縦横比や線分の多さ(複雑さ)など形状で分離するなど、画像特徴量を分離基準とする方法が考えられる。たとえば、図3に示したように「よくできました」や「よく読むこと」などのようにコメント88は○×などの採点記号87に比べてサイズが大きく複雑なものがあるし、あるいは、二重線や波線は採点記号87に比べて横長なものがある、などという経験則に基づくものである。
あるいは、形状認識や文字認識などを実施し、信頼度が高い方に分類し、欲しい方を取り出すというように、認識の信頼度を分離基準とする方法が考えられる。たとえば、付加情報記入済教材81において、採点記号87は図形(たとえば○×形状)で記入すると定義しておけば、この採点記号87の形式とそれ以外の形式のものとに分けることで、採点記号87とコメント88とを分離認識することができる。
また、たとえば、付加情報記入済手帳91において、コメント98(分類記号99を含む)は図形(たとえば★や◇など)で記入すると定義しておけば、このコメント98の形式とそれ以外の形式のものとに分けることで、予定97とコメント98とを分離認識することができる。あるいは、付加情報記入済手帳91において、コメント98(分類記号99を含む)は所定の文字形式(たとえばビジネスや社用やプライベートや私用など)で記入すると定義しておけば、このコメント98の形式とそれ以外の形式のものとに分けることで、予定97とコメント98とを分離認識することができる。
この手法は、前述の記載位置を分離基準とする方法と併用すると効果的である。記入欄との位置関係に基づくだけでは、記入欄内もしくはその極近傍に追記されているコメント88,98を採点記号87や予定97として分離・抽出してしまうが、さらに認識処理の信頼度をも併用することで、両者を適切に分離することができるからである。
このように、図6(B)に示す各種の手法を利用すれば、採点記号87や予定97と、コメント88,98とを、適切に分離認識ができるようになる。たとえば、図6(A)における事例では、記入欄との位置関係に基づいて、解答欄84の周囲以外は採点記号87から除外してコメント88であるとすることができる。具体的には、図6(A)における解答式記入用の解答欄84の外の記載された誤解答訂正(図中の矢指Q)がコメント88であるとして分離認識できる。また、解答欄84から外れた位置に記載の感想(good)(図中の矢指R)や問題文章へのライン付け(図中の矢指S)がコメント88であるとして分離認識できる。また、解答式の右辺である答を記入する解答欄84に追記されているレ点状のマーク(図中の矢指T)は採点記号87であるとして分離認識できる。
ただし、記入欄との位置関係に基づくだけでは、記入欄内もしくはその極近傍に追記されているコメント88を採点記号87として分離・抽出してしまう。たとえば、図6(A)における誤解答部分へのライン付け(図中の矢指P)をも採点記号87であるとして分離認識することになる。しかしながら、さらに、形状認識や文字認識などを実施し、認識結果が採点記号87として定義されているもの(たとえば○×形状の図形)と一致するか否かで判断すれば、誤解答部分へのライン付け(図中の矢指P)を、コメント88であると判定できる。
また、図2に示した付加情報記入済手帳91の場合には、予定欄94に予定97とコメント98とが混在して記入されることが多いと考えられる。この場合、記入欄との位置関係に基づくだけでは、記入欄としての予定欄94内もしくはその極近傍に追記されているコメント98をも予定97として分離・抽出することになる。しかしながら、さらに、形状認識や文字認識などを実施し、たとえば★や◇などの図形、あるいはビジネスや社用やプライベートや私用など、認識結果がコメント98として定義されているものと一致するか否かで判断すれば、定義済の図形や文字を、コメント98であると判定できる。
<システム構成;第1実施形態>
図7は、本発明に係る追記情報処理装置を備えてなる情報処理システムの第1実施形態の構成例を示す図である。なお、この第1実施形態の情報処理システムは、答案用紙などの教育用教材80を処理対象とする教材自動採点システムへの適用例で示す。
図7は、本発明に係る追記情報処理装置を備えてなる情報処理システムの第1実施形態の構成例を示す図である。なお、この第1実施形態の情報処理システムは、答案用紙などの教育用教材80を処理対象とする教材自動採点システムへの適用例で示す。
図示のように、教材自動採点システム1は、システムの中心をなす追記情報処理装置10と、追記情報処理装置10に処理対象文書である付加情報記入済教材81を電子化して入力する文書入力装置20と、処理対象文書である付加情報記入済教材81に対応する教育用教材80(詳しくはその原本画像)の電子データを記憶する文書管理サーバ30と、情報処理(本例では自動採点処理など)の結果を保存しておく処理結果保存サーバ40とが、有線や無線を利用してネットワーク接続されて構成されている。
文書入力装置20は、教育用教材80における解答欄84への解答記入、解答者情報欄86への氏名などの記入および解答欄84に記入された解答に対する採点官による採点記号87(具体的には、たとえば「○」や「×」の図形)の記入がされた付加情報記入済教材81に対して、公知の光学的画像読取技術を用いた画像読取りを行ない、その付加情報記入済教材81から画像データを得るものである。
文書入力装置20は、処理対象文書である付加情報記入済教材81を電子データにする機能を備えたものであればよく、たとえば、画像読取装置としての機能を有した複写機、複合機、またはスキャナ装置を利用して実現することが考えられる。その場合に、自動原稿搬送装置(Automatic Document Feeder ;ADF)が付設されていると、複数の教育用教材に対する画像読取りを連続的に行なうことができ便利である。
なお、教育用教材80を利用した試験などは、紙媒体を用いることに限定されない。たとえばタブレット型のPCを利用して試験を行ない採点するケースでは、最初から付加情報記入済教材81を電子データの形式で入手することができ、この場合には、システム構成上、文書入力装置20が不要となる。
文書管理サーバ30は、付加情報記入済教材81に対応する教育用教材80の原本画像と、この原本画像を特定するための、たとえば、科目、タイトル、適用学年などの識別情報や識別コードとを対応付けて、ハードディスク装置や光ディスク装置などの所定の記憶媒体に登録している。
また、文書管理サーバ30は、付加情報記入済教材81に対応する元の教育用教材80(原本画像)を保存するとともに、採点記号87やコメント88についてのデータ処理時に必要となる解答欄の位置情報や問題番号や配点情報などを示す記入欄位置領域情報38を、図1(C)に示したように、テーブル形式で、所定の格納領域に保持蓄積している。
処理結果保存サーバ40としては、追記情報処理装置10とネットワーク接続され、付加情報記入済教材81についての自動採点集計結果を管理することができるものであればよく、たとえば、処理結果データベース装置や処理結果ファイルサーバ装置などが該当する。
教材自動採点システム1の中心部をなす追記情報処理装置10は、文書入力装置20から入力された付加情報記入済教材81の画像データに基づき所定の信号処理を行なう読取画像処理部110と、読取画像処理部110による処理に基づいて文書入力装置20から入力された読取画像の元となった文書原本8Aを識別特定する文書原本特定部120とを備えている。第1実施形態の教材自動採点システム1においては、文書原本特定部120は、文書原本8Aの一例である教育用教材80を特定する教材特定部122として機能する。
また、追記情報処理装置10は、読取画像処理部110による処理が施された画像データから追記情報(アノテーション)を抽出する追記情報抽出部130と、追記情報抽出部130により抽出されたデータ処理対象の追記情報に基づき記載内容や記入位置を認識し特定するデータ処理対象追記情報特定処理部150と、データ処理対象追記情報特定処理部150により特定された追記情報の記載内容に基づいてデータ処理を行なうデータ処理部170とを備えている。
読取画像処理部110は、文書入力装置20から入力された画像データについて、レイアウト解析、文字図形分離、文字認識、コード情報認識、図形処理、色成分認識などの公知の画像処理技術(それぞれの詳細説明は割愛する)を利用して解析処理を行なう画像データ解析部112と、文書入力装置20から入力された画像データの傾きや主走査方向または副走査方向の拡縮率などの画像歪みを補正する歪み補正部114とを有している。なお、歪み補正部114は、文書入力装置20から入力された画像データと、比較対象となる文書管理サーバ30内の対応する原本画像とを比較照合し、その画像歪み(傾き、拡縮など)を補正してもよい。
教材特定部122は、たとえば、画像データ解析部112によるデータ解析結果に基づいて、識別情報欄85に記入されている科目、タイトル、あるいは適用学年などの識別情報を解析する識別情報解析部123と、同じく識別情報欄85に埋め込まれている教育用教材80を特定するコード情報を解析するコード情報解析部124とを有している。
教材特定部122は、画像データ解析部112での解析結果に基づいて特定した、たとえば科目、タイトル、適用学年などの識別情報や識別コードと、文書管理サーバ30に保持蓄積されている教育用教材80の原本画像の情報(たとえば科目、タイトル、適用学年などの識別情報や識別コード)とを照らし合わせ、該当する原本画像が文書管理サーバ30に保持蓄積されていなければ、文書入力装置20で得られた画像データとの比較対象となる電子データを特定できないと判定して、識別特定エラー信号を出力するようになっている。
なお、教材特定部122は、文書入力装置20から入力された画像データ(付加情報記入済教材81に相当)と対応する元の教育用教材80を識別特定できればよく、識別情報解析部123とコード情報解析部124とは、付加情報記入済教材81の識別情報欄85に記載もしくは埋め込まれている識別情報の形式に対応する適正な方を備えていればよく、必ずしも、両者を備えている必要はない。
追記情報抽出部130は、歪み補正部114にて画像歪みが補正された画像データと、教材特定部122により特定された、文書入力装置20から入力された画像データ(付加情報記入済教材81に相当)に対応する原本画像(教育用教材80に相当)とを公知の画像処理技術を利用して比較しそれぞれの間の差分を抽出する差分抽出部132を有する。
また、追記情報抽出部130は、差分抽出部132による抽出結果に基づき文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報(第1種の付加情報の一例)を抽出する解答者抽出部134と、同じく差分抽出部132による抽出結果に基づき文書入力装置20で読取り対象となった付加情報記入済教材81における採点記号87やコメント88などのデータ処理に供される第2種の付加情報を抽出するデータ処理用追記情報抽出処理部140とを有する。
解答者抽出部134は、差分抽出部132による抽出結果に基づき、解答者情報欄86の学級88aや出席番号88bや氏名88cの欄に記入された解答記入者の手書きによる番号や文字の画像をそのまま文字情報として切り出す手書き情報切出部136と、差分抽出部132による抽出結果に基づき(好ましくは、手書き情報切出部136により切り出された手書き情報について)、解答者情報欄86の手書きによる記入情報を、追記情報処理装置10上で加工編集が可能な文字データに変換する文字認識処理(OCR;Optical Character Reader)部138とを有する。
なお、解答者抽出部134は、文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報欄86に記入された解答者情報を抽出できればよく、手書き情報切出部136と文字認識処理部138の何れか一方を備えていればよい。また、文字認識処理部138を設けない場合や文字認識処理部138で文字認識できなかったコメント88の部分に関しては、抽出された解答者情報をそのまま画像として取り扱うことにする。
データ処理用追記情報抽出処理部140は、差分抽出部132による抽出結果に基づき、追記情報抽出部130により抽出された追記情報の内、文書入力装置20で読取り対象となった追記済文書8B(本例では付加情報記入済教材81)におけるデータ処理の対象となる追記情報(本例では採点記号87やコメント88)を抽出するデータ処理対象追記情報抽出部142と、データ処理対象追記情報抽出部142で抽出されたデータ処理対象の追記情報をデータ処理に耐え得るように整形する追記情報整形部146とを有する。本実施形態においては、データ処理対象追記情報抽出部142は、採点記号87を抽出する採点記号抽出部およびコメント88を抽出するコメント抽出部の機能を備える。
なお、データ処理対象追記情報抽出部142は、データ処理対象の追記情報(本例では採点記号87やコメント88)を抽出できればよく、色を指標に追記情報をさらに分類するとよい。たとえば差分抽出部132での抽出結果に対する色成分認識処理を通じて、採点官が採点記号87やコメント88の記入に使用したペン色と対応する所定色成分についてのものを抽出することで行なえばよい。たとえば、付加情報記入済教材81における採点記号87やコメント88の記入は、一般に赤色ペン(赤の筆記具)で行なわれることが多く、この場合には、赤色成分に注目した抽出を行なえばよい。
ただし、赤色ペンとはいってもピンク系からオレンジ系というように似通った色気のものがあるし、必ずしも採点記号87やコメント88の記入に赤色ペンを使用するとは限らないし、採点記号87とコメント88とを別のペン色で記入することもあるので、採点記号87やコメント88の記入に使用するペン色の情報を採点記号抽出部やコメント抽出部として機能するデータ処理対象追記情報抽出部142に設定可能に構成しておくことで、抽出性能を向上させるようにするとよい。
追記情報整形部146は、データ処理対象追記情報抽出部142で抽出されたデータ処理対象の追記情報について、線分同士を接続してその抽出線分間の途切れを解消するように補正処理を行なう抽出線分途切れ補正部148を有する。
一般に、追記済文書8B上での図形記入や「2重線」や「波線」や「花丸」や「矢印」などの図形記入やコメント文などは、記入済のものに対して重ねて行なわれることもある。たとえば、付加情報記入済教材81の場合には、各問題文82や各解答欄84を特定する枠や各解答欄84への解答記入内容などに重ねて「○」や「×」などの採点記号87が記入され、あるいは図形や文字でコメント88の追記が行なわれることもある。そのため、データ処理対象追記情報抽出部142による所定色成分の抽出結果は、その重なり部分が除かれる結果、図形や文字に途切れ部分が生じたものとなる虞がある。
このことから、抽出線分途切れ補正部148は、「○」や「×」や「線」やその他の印(マーク)などの図形や文字であるはずの抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理(いわゆる連結処理)、あるいは線図形の直線近似などを適宜実行する。なお、このときに行なう細線化処理、端点抽出処理、あるいは端点間接続処理や線図形の直線近似などは、公知技術を利用して行なえばよいため、ここではその詳細な説明を割愛する(たとえば、「画像の処理と認識」,安居院猛著,昭晃堂発行などを参照)。
データ処理対象追記情報特定処理部150は、差分抽出部132による差分抽出結果に基づいて、具体的には、抽出線分途切れ補正部148で補正されたデータ処理対象追記情報に基づいて、追記済文書8Bにおける第1のデータ処理用の追記情報の記入内容を第2のデータ処理用の追記情報と分離して認識する第1データ処理用追記情報認識部154と第2のデータ処理用の追記情報の記入内容を第1のデータ処理用の追記情報と分離して認識する第2データ処理用追記情報認識部164とを有している。
第1実施形態のデータ処理対象追記情報特定処理部150としては、第1データ処理用追記情報認識部154は、付加情報記入済教材81における採点記号87の記入内容をコメント88と分離して認識し、また、第2データ処理用追記情報認識部164は、付加情報記入済教材81におけるコメント88の記入内容を採点記号87と分離して認識する。
各データ処理用追記情報認識部154,164は、抽出線分途切れ補正部148で補正されたデータ処理用追記情報の記入内容に対して形状認識処理を行なうことでデータ処理用追記情報の記入内容を認識する図形形状認識部156,166と、抽出線分途切れ補正部148で補正されたデータ処理用追記情報の記入内容に対して文字認識処理を行なうことでデータ処理用追記情報の記入内容を認識するする文字認識部157,167と、図形形状認識部156,166や文字認識処理部157,167により認識された各データ処理用追記情報の記入内容の、文書原本8A(追記済文書8B)上における記入位置を認識する記入位置認識部158,168とを有している。図形形状認識部156,166および文字認識処理部157,167により、採点記号87とコメント88とを分離して認識する分離認識処理部155が構成される。
文字認識処理部157,167を設けない場合や文字認識処理部157,167で文字認識できなかったデータ処理用追記情報の部分に関しては、抽出されたデータ処理用追記情報をそのまま画像として取り扱うことにする。
なお、図示のように、図形形状認識部156,166、文字認識処理部157,167、並びに記入位置認識部158,168とは、それぞれ1つの機能部が双方の機能を実現する構成としてもよいし、それぞれを個別の機能部として独立に設けてもよい。
たとえば、付加情報記入済教材81を処理対象とする第1実施形態の構成においては、第1データ処理用追記情報認識部154は、採点記号87を第1のデータ処理用の追記情報とするものであり採点記号認識部として機能する。この場合、採点記号87についての図形形状認識部156は、採点記号87の記入内容が「正解(○)」または「不正解(×)」または「一部正解(△)」であるかなどを図形の側面から認識することができればよく、たとえば「○」,「×」,「△」の図形形状とのパターンマッチングによって形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から形状を認識してもよい。特徴量としては、たとえば、穴の個数や外接矩形に占める対象図形の面積率などを使用することができる。
また、採点記号87について文字認識処理部157は、採点記号87の記入内容が「正解(○)」または「不正解(×)」または「一部正解(△)」であるかなどを文字の側面から認識することができればよい。なお、採点記号87は図形のみであるとする場合には、文字認識処理部157を割愛することもできる。
また、採点記号87についての記入位置認識部158は、たとえば、教育用教材80上における座標解析によって、付加情報記入済教材81上の採点記号87の記入内容の記入位置を認識すればよい。
なお、図形形状認識部156は、採点記号87に関する形状認識の際には、「○」や「×」などの採点記号87を示す図形を構成する連続画素群を1つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入位置認識部158による位置認識の際にも、そのラベリング処理の結果を利用して、「○」や「×」などの採点記号87を示す図形を構成する連続画素群を1つの纏まりとして取り扱う。
また、記入位置認識部158は、採点記号87の記入位置の認識処理に当たって、付加情報記入済教材81上に複数の採点記号87が記入されていることが一般的であるから、その複数の採点記号87のそれぞれについて順次予め定められた走査順で検出される採点記号87について、順にその位置を認識していく。
各採点記号87に関する位置認識は、たとえば「○」や「×」などの採点記号87を示す図形(あるいは文字)の外接矩形情報を算出し、さらにその外接矩形の中心座標を算出することによって行なうことが考えられる。具体的には、認識対象となる図形もしくは文字(連続画素群)に対して外接矩形を抽出するとともに、その外接矩形の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)を算出する。そして、これらの算出結果から、中心x座標=x+w/2、中心y座標=y+h/2を算出し、その算出結果を連続画素群の位置、すなわち採点記号87の記入位置の認識結果とする。
一方、第2データ処理用追記情報認識部164は、コメント88を第2のデータ処理用の追記情報とするコメント認識部として機能する。この場合、コメント88についての図形形状認識部166は、コメント88の追記内容を図形の側面から認識することができればよく、たとえば「1重線」や「2重線」や「(1重または2重の)波線」などの線を示す図形形状とのパターンマッチングによって線に関する形状認識を行なえばよい。あるいは、認識対象図形の特徴量を算出し、その特徴量から線の形状を認識してもよい。特徴量としては、たとえば、線数や外接矩形に対する画素密度などを使用することができる。
また、コメント88について文字認識処理部167は、付加情報記入済教材81におけるコメント88の記入内容を文字の側面から認識することができればよい。また、コメント88についての記入位置認識部168は、たとえば、教育用教材80上における座標解析によって、付加情報記入済教材81上のコメント88の追記内容の記入位置を認識すればよい。
なお、図形形状認識部166は、コメント88に関する形状認識の際には、「2重線」や「花丸」などのコメント88を示す図形を構成する連続画素群を1つに纏めて取り扱うために、その連続画素群に対して識別子を付与すべく、一般的な画像処理技術であるラベリング処理を行なう。このことから、記入位置認識部168による位置認識の際にも、そのラベリング処理の結果を利用して、「2重線」や「花丸」などのコメント88を示す図形を構成する連続画素群を1つの纏まりとして取り扱う。
また、記入位置認識部168は、コメント88の記入位置の認識処理に当たって、付加情報記入済教材81上に複数のコメント88が記入されていることが一般的であるから、その複数のコメント88のそれぞれについて順次予め定められた走査順で検出されるコメント88について、順にその位置を認識していく。
各コメント88に関する位置認識は、たとえばコメント文や「2重線」や「花丸」などのコメント88の文字や図形の外接矩形情報を算出し、さらにその外接矩形の中心座標を算出することによって行なうことが考えられる。具体的には、認識対象となる文字や図形(連続画素群)に対して外接矩形を抽出するとともに、その外接矩形の所定点(たとえば左上頂点)のxy座標、並びに、その外接矩形の幅(W)および高さ(h)を算出する。そして、これらの算出結果から、中心x座標=x+w/2、中心y座標=y+h/2を算出し、その算出結果を連続画素群の位置、すなわちコメント88の記入位置の認識結果とする。
また、この位置認識の際には、各コメント88は、ある位置の解答欄84への採点記号87と対応して、その近傍に記入されることが多いので、記入位置認識部158による採点記号87についての位置認識と協働して処理を行なうのがよい。こうすることで、双方の位置情報の各解答欄84との対応付け、結果としては、採点記号87とコメント88との関連付けが容易になる。
第1実施形態のデータ処理部170は、文書入力装置20から入力された追記済文書8Bの画像データについて、その追記済文書8Bに記入された第1のデータ処理対象追記情報に関する第1のデータ処理を実行する第1データ処理部170_1と、第2のデータ処理対象追記情報に関する第2のデータ処理を実行する第2データ処理部170_2を有する。
第1実施形態の第1データ処理部170_1は、追記済文書8Bの一例である付加情報記入済教材81の画像データについて、その付加情報記入済教材81に記入された採点記号87を元に採点集計を行なう採点集計部172と、採点集計部172による採点集計の結果を、解答者抽出部134が抽出した解答者情報と関連付けて出力する集計結果出力部174とを備えている。採点集計結果と解答者情報とが関連付けられた状態の処理結果を特に採点認識結果と称する。
採点集計部172は、図形形状認識部156による採点記号87の追記内容の図形の側面からの認識結果や文字認識処理部157による採点記号87の追記内容の文字情報の側面からの認識結果と、記入位置認識部158による採点記号87の記入位置の認識結果と、文書入力装置20が保持蓄積している付加情報記入済教材81に対応する教育用教材80の電子データ(原本画像)に含まれる教育用教材80(付加情報記入済教材81)の各解答欄84についての配点欄83で規定されている配点情報とに基づいて、文書入力装置20が読み取った付加情報記入済教材81について、付加情報記入済教材81に記入された採点記号87に関する採点処理および集計処理(纏めて採点集計という)を行なう。
なお、採点記号87の記入は、一般に教育用教材80上の複数の解答欄84のそれぞれに対応して行なわれ、かつ教師などの採点官によって手書きでされるため、各解答欄84に対する記入位置が必ずしも一義的に定まっている訳ではない。その一方で、採点記号87の採点集計に当たっては、各解答欄84と採点記号87の記入位置との対応を明確にする必要がある。採点記号87に関する採点集計は、各解答欄84に対応する採点記号87の記入結果を明確にした上で、採点記号87の内容(正解か不正解か一部正解かなど)および各解答欄84についての配点に基づいて行なわれるからである。
このことから、採点集計部172は、以下に述べるような手順で、採点記号87の採点集計を行なう。すなわち、採点集計部172は、「○」や「×」などの採点記号87の外接矩形と、付加情報記入済教材81上で解答欄84となる領域との重なり面積を求め、その面積(外接矩形に対する面積比でも同様)が最も大きくなる採点記号87と解答欄84とを互いに対応付け、その採点記号87を解答欄84に対して記入された採点記号87の判定結果とする。ただし、重なり面積の外接矩形に対する比が所定閾値未満の場合には、重なる部分が小さいことから、対応付けについての判定が不能であると判断する。
そして、対応付けを行なった後は、採点記号87が「○」であれば、これに対応する解答欄84についての配点情報から特定される配点を加算し、また採点記号87が「×」であれば、これに対応する解答欄84についての配点加算を行なわず、このような採点集計を付加情報記入済教材81上の全ての解答欄84について行なう。
なお、付加情報記入済教材81上で解答欄84となる領域は、各解答欄84についての配点情報として、または当該配点情報と同様に、付加情報記入済教材81に対応する文書管理サーバ30に登録されている原本画像に含まれる記入欄位置領域情報38によって特定されるものとする。
集計結果出力部174は、採点集計部172により集計された採点集計結果と解答者抽出部134が抽出した解答者情報と関連付けて、処理結果保存サーバ40(処理結果データベース装置や処理結果ファイルサーバ装置など)に登録する。あるいは、採点結果の点数を付加情報記入済教材81の集計欄83bに記入し用紙上に返却答案81bとして出力して生徒などに返却できるようにする。
また、第2データ処理部170_2は、追記済文書8Bの一例である付加情報記入済教材81の画像データについて、その付加情報記入済教材81に記入されたコメント88を元に分類処理を行なうコメント分類処理部176と、コメント分類処理部176による分類結果を集計結果出力部174が出力した採点認識結果や各解答に関連付けて出力するコメント処理結果出力部178とを備えている。
コメント分類処理部176は、図形形状認識部166によるコメント88の追記内容の図形の側面からの認識結果や文字認識処理部167によるコメント88の追記内容の文字情報の側面からの認識結果と、記入位置認識部168によるコメント88の記入位置の認識結果と、コメント88の追記内容と対応するように予め規定されている分類情報とに基づいて、文書入力装置20が読み取った付加情報記入済教材81について、図3〜図5に示した分類基準に基づき、その付加情報記入済教材81に記入されたコメント88の分類処理を行なう。
コメント処理結果出力部178は、コメント分類処理部176による分類結果を各解答欄や集計結果出力部174が出力した採点認識結果と関連付けて、処理結果保存サーバ40(処理結果データベース装置や処理結果ファイルサーバ装置など)に登録する。このコメント処理結果出力部178による処理内容の詳細については後述する。
なお、採点集計部172での採点集計処理やコメント分類処理部176での分類処理に当たっては、完全なる自動処理にしてもよいが、ユーザ端末171のCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)などで構成された表示部に処理過程や処理結果を表示して、適宜、操作者が処理過程や処理結果をキーボードやマウスなどの指示入力部を介して訂正できるようにしてもよい。
<全体の処理手順;第1実施形態>
図8および図9は、情報処理システムの第1実施形態である教材自動採点システム1における教材処理方法の処理動作の手順を説明する図である。ここで、図8は、その全体概要をシステム構成図と対応付けて示しており、また図9は、教材処理手順を示すフローチャートである。
図8および図9は、情報処理システムの第1実施形態である教材自動採点システム1における教材処理方法の処理動作の手順を説明する図である。ここで、図8は、その全体概要をシステム構成図と対応付けて示しており、また図9は、教材処理手順を示すフローチャートである。
追記情報処理装置10(特に教材自動採点システム1においては教材処理装置に該当する)を利用する場合には、先ず、生徒などによって解答者情報欄86への氏名などの記入および解答欄84への解答記入、つまり生徒による第1種の付加情報の記入がされ、さらに教師などによって各解答欄84に記入された解答に対する「○」や「×」などの採点記号87やコメント88などの第2種の付加情報の記入がされた付加情報記入済教材81について、文書入力装置20は、その付加情報記入済教材81を読み取り(S110)、その付加情報記入済教材81を表わす画像データを追記情報処理装置10に入力する(S112)。文書入力装置20は、この文書入力装置20による画像読取りによって得られた画像データについて、一旦ワークエリアとして用いられるメモリなどに保持しておく。
なお、このとき、文書入力装置20にてADF装置を用いれば、たとえば同一学級のような1つのグループに纏めて処理すべき複数の付加情報記入済教材81について、一括して読み取り(一括スキャン)、各付加情報記入済教材81に対応する画像データを連続的に追記情報処理装置10に入力することができる。
追記情報処理装置10は、文書入力装置20から取り込んだ各付加情報記入済教材81の画像データに対して、順次、次のような付加情報抽出・分離処理、付加情報特定処理、および自動採点処理並びに自動コメント処理といった付加情報終末処理を実行する。
たとえば、データ処理部170における自動採点処理並びに自動コメント処理に先立って、ある1つの付加情報記入済教材81から得られた画像データについて、読取画像処理部110の画像データ解析部112は解析処理を行ない(S122)、教材特定部122は、その解析処理の結果に基づいて付加情報記入済教材81に対応する元の教育用教材80の識別特定を行なう(S124)。
この識別特定(S124)は、たとえば「理科」「5年」「1.天気と気温の変化」といった識別情報解析部123によるタイトル解析または識別情報欄85に埋め込まれたコード情報についてのコード情報解析部124によるコード解析を通じて行なえばよい。この識別特定を経ることで、教材特定部122では、文書入力装置20により得られた付加情報記入済教材81の画像データとの比較対象となる教育用教材80の電子データ(原本画像)を特定することができる。
なお、この識別特定は、文書入力装置20が画像読取りを行なった複数の付加情報記入済教材81のそれぞれについて順次行なうことも考えられるが、一般に1つのグループに纏めて処理される付加情報記入済教材81は全て同一のものであるため、その纏めて処理される中で最初に処理される付加情報記入済教材81についてのみ行なえばよい。
教材特定部122により各付加情報記入済教材81に対応する教育用教材80の特定が完了すると、文書管理サーバ30は、その特定結果に従いつつ、保持蓄積している中から該当する教育用教材80の原本画像(電子データ)を取り出して、これを差分抽出部132へ受け渡す(S126)。
また、歪み補正部114は、ある1つの付加情報記入済教材81から得られた画像データの歪みを補正する(S128)。この画像歪み補正は、文書入力装置20での画像読取りの際に生じ得る画像歪みを補正するために行なうものであり、その後に差分抽出部132にて行なう原本画像との比較や差分抽出などの精度向上を図るためのものである。
差分抽出部132は、文書管理サーバ30から受け渡された原本画像(教育用教材80)と、文書入力装置20から入力され、歪み補正部114により画像歪みが補正された後の画像データ(付加情報記入済教材81)とを、それぞれ比較して、その差分を抽出する(S130)。差分抽出部132は、抽出した差分情報9を解答者抽出部134やデータ処理用追記情報抽出処理部140に渡す。
差分抽出部132による差分抽出によって、たとえば図8中の中央部分に示すように、解答者情報欄86および各解答欄84への解答者による第1種の付加情報の記入内容、並びに各解答欄84に対する採点記号87やコメント88などの採点官による第2種の付加情報の記入内容のみで表わされる差分情報9が抽出されることになる。
解答者抽出部134は、差分情報9に対する文字認識処理部138による文字認識処理などを通じて、文書入力装置20で読取り対象となった付加情報記入済教材81における解答者情報を抽出する(S132)。これにより、ある1つの付加情報記入済教材81に解答を記入した解答記入者の学級、出席番号、氏名などを特定できる。
また、データ処理用追記情報抽出処理部140は、差分抽出部132による差分抽出結果に対して、データ処理用の追記情報を抽出する(S142)。本例の場合、各解答欄84への採点記号87やコメント88の追記内容を抽出するために、その差分情報9からさらに所定色成分についてのもの、具体的にはたとえば赤色成分のものを抽出する。所定色成分の抽出は、たとえば差分抽出結果が画素データからなる場合であれば、その画素データを構成する色成分データに着目することで行なうことができる。
抽出線分途切れ補正部148は、データ処理対象追記情報抽出部142による抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理、あるいは線図形の直線近似などの追記情報整形処理を適宜実行する(S146)。抽出線分途切れ補正部148は、途切れ補正処理済の採点記号87の抽出結果を採点記号認識部として機能する第1データ処理用追記情報認識部154に渡し、また途切れ補正処理済のコメント88の抽出結果をコメント認識部として機能する第2データ処理用追記情報認識部164に渡す。
データ処理対象追記情報特定処理部150は、先ず、分離認識処理部155を構成する図形形状認識部156,166および文字認識処理部157,167が協働して、文書管理サーバ30に保存されている解答欄84の位置情報を参照して、採点記号87とコメント88とを分離し(S162)、この後、分離した採点記号87とコメント88の別に、記入内容の特定処理や記入位置の特定処理を実行する。
図形形状認識部156や文字認識処理部157は、コメント88と分離した採点記号87について(S163−採点記号)、採点記号87の記入内容に対する形状認識あるいは文字認識により、その採点記号87の記入内容が「正解」であるかあるいは「不正解」であるかなど、採点記号87で示された採点官の採点結果を特定する(S164)。続いて、記入位置認識部158は、採点記号87の記入内容について、その付加情報記入済教材81上における記入位置を認識する(S166)。
このようにして、記入位置認識部158が採点記号87の記入位置を認識した後は、採点集計部172は、図形形状認識部156や文字認識処理部157による採点記号87の記入内容の認識結果と、記入位置認識部158による採点記号87の記入位置の認識結果と、文書管理サーバ30が保持蓄積している付加情報記入済教材81に対応する原本画像(教育用教材80)に含まれる教育用教材80の各解答欄84についての配点情報とに基づいて、採点および集計を行なう(S168)。
集計結果出力部174は、その採点・集計の結果を処理結果保存サーバ40に保存する(S169)。あるいは採点結果の点数が付加情報記入済教材81の集計欄83bに記入されて返却答案81bとして生徒などに返却される。
各付加情報記入済教材81についての採点結果(問題別採点結果)のファイル形式としては、たとえば、図8に示すように、付加情報記入済教材81上に存在する問題の番号と、その問題の解答に対する正誤判定と、その正誤判定に基づく得点とからなる情報で、これらを互いに関連付けるテーブル形式である。また、集計結果のファイル形式としては、たとえば、図8に示すように、出席番号および解答者情報と、得点情報(集計欄83bに記入される項目点や合計点)とからなる情報で、これらを互いに関連付けるテーブル形式である。
各付加情報記入済教材81上に記入される正誤判定の採点集計の結果が問題別採点結果としてファイル出力されるし、また、問題別の採点集計の結果がファイル出力されるので、処理結果保存サーバ40では、付加情報記入済教材81についての採点集計結果を、たとえば一覧形式で、管理または利用することが可能となる。
図形形状認識部166や文字認識処理部167は、採点記号87と分離したコメント88について(S163−コメント)、コメント88の記入内容に対する形状認識あるいは文字認識により、採点官により追記されたコメント88の記入内容を特定する(S170)。続いて、記入位置認識部168は、コメント88の記入内容について、その付加情報記入済教材81上における記入位置を認識する(S172)。
このようにして、記入位置認識部168がコメント88の記入位置を認識した後は、コメント分類処理部176は、図形形状認識部166や文字認識処理部167によるコメント88の記入内容の認識結果と、記入位置認識部168によるコメント88の記入位置の認識結果と、文書管理サーバ30が保持蓄積している図3〜図5に示した分類基準情報39とに基づいて、コメント88を分類する(S174)。
コメント処理結果出力部178は、コメント分類処理部176で分類された各コメント88を、位置が近い採点記号87の採点結果と関連付けて(S178)、処理結果保存サーバ40に保存する(S179)。各コメント88についての分類結果のファイル形式としては、たとえば、図8に示すように、各コメントと近傍の採点記号87とからなる情報で、これらを互いに関連付けるテーブル形式である。なお、実際にテーブル形式で保存することに限らず、各コメント88と、このコメント88と対応する採点集計結果の両者を関連付ける関連付け情報とを対応付けて保存してもよい。
各付加情報記入済教材81上に記入される採点記号87の採点集計結果とコメント88とが対応するようにデータ保存されるので、処理結果保存サーバ40では、付加情報記入済教材81についての採点集計結果とコメント88とを、たとえば一覧形式で、管理または利用することが可能となるし、生徒の能力分析や生徒指導にコメント88を利用できるようになる。
このように、情報処理システムの第1実施形態として示した教材自動採点システム1では、採点記号87やコメント88の記入がされた付加情報記入済教材81から読み取った画像データと、その付加情報記入済教材81についての元の教育用教材80、すなわち解答欄84への解答記入などの生徒などによる第1種の付加情報および解答に対する採点官による採点記号87やコメント88などの第2種の付加情報の記入がされていないものについてのデータとを比較し、互いの差分から採点記号87やコメント88の記入内容を分離してその記入内容を特定し、その採点記号87についての採点集計とコメント88についての分類処理を実行するようになっている。
したがって、採点記号87に関するデータ処理については、差分抽出部132で抽出される差分結果から、コメント88の記入内容を排除して採点記号87のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、自動採点に悪影響を及ぼすことがない。
また、採点結果の自動集計を実行できるので、結果として付加情報記入済教材81についての採点処理が省力化される。付加情報記入済教材81を紙媒体で入手するケースでは、付加情報記入済教材81を文書入力装置20で読み取った画像データを基にすればよく、たとえば、複写機、複合機、またはスキャナ装置などによって実現されるスキャン機能と、パーソナルコンピュータ(PC)などのコンピュータ機器が有する情報記憶処理機能、画像処理機能および演算処理機能とがあれば、システム構成を簡単に実現することができ、専用の機器を必要とすることもない。
さらには、付加情報記入済教材81の画像データを、文書管理サーバ30が保持する電子データと比較するため、その文書管理サーバ30に各種の教育用教材80についての電子データを保持蓄積しておけば、対応可能な付加情報記入済教材81についての汎用性を十分に確保し得る。さらには、文書管理サーバ30に予め電子データを保持蓄積しておくことで、文書管理サーバ30から取り込んだ画像データとの比較を行なう場合において、比較対象となる電子データの入力などを行なう手間を省くことができ、結果として迅速な採点処理を実現することができる。
また、コメント88に関するデータ処理については、差分抽出部132で抽出される差分結果から、採点記号87の記入内容を排除してコメント88のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、コメント88に関する分類処理に悪影響を及ぼすことがない。また、各採点記号87と対応付けて処理結果保存サーバ40に各コメント88を保存するようにしたので、コメント88を生徒などが確認する用途以外に、採点官自らが、能力分析や生徒指導に活用できるようになる。
<システム構成;第2実施形態>
図10は、本発明に係る追記情報処理装置を備えてなる情報処理システムの第2実施形態の構成例を示す図である。なお、この第2実施形態の情報処理システムは、ビジネス手帳などの手帳90を処理対象とする個人情報管理システムへの適用例で示す。
図10は、本発明に係る追記情報処理装置を備えてなる情報処理システムの第2実施形態の構成例を示す図である。なお、この第2実施形態の情報処理システムは、ビジネス手帳などの手帳90を処理対象とする個人情報管理システムへの適用例で示す。
図示のように、個人情報管理システム2は、システムの中心をなす追記情報処理装置10と、追記情報処理装置10に処理対象文書である付加情報記入済手帳91を電子化して入力する文書入力装置20と、処理対象文書である付加情報記入済手帳91に対応する手帳90(詳しくはその原本画像)の電子データを記憶する文書管理サーバ30と、情報処理(本例では自動スケジューリング処理など)の結果を保存しておく処理結果保存サーバ40とが、有線や無線を利用してネットワーク接続されて構成されている。
文書入力装置20は、手帳90における予定欄94への予定97やコメント98の記入がされた付加情報記入済手帳91に対して、公知の光学的画像読取技術を用いた画像読取りを行ない、その付加情報記入済手帳91から画像データを得るものであり、基本的には、第1実施形態における文書入力装置20と同様の機能を持つものである。
なお、手帳90を利用したスケジュール管理は、紙媒体を用いることに限定されない。たとえばタブレット型のPCを利用して予定97やコメント98を記入するケースでは、最初から付加情報記入済手帳91を電子データの形式で入手することができ、この場合には、システム構成上、文書入力装置20が不要となる。
文書管理サーバ30は、付加情報記入済手帳91に対応する手帳90の原本画像と、この原本画像を特定するための識別情報や識別コードとを対応付けて、ハードディスク装置や光ディスク装置などの所定の記憶媒体に登録している。
また、文書管理サーバ30は、付加情報記入済手帳91に対応する元の手帳90(原本画像)を保存するとともに、予定97についてのデータ処理時に必要となる日付欄92や予定欄94などの位置情報などを示す記入欄位置領域情報38を、図2(C)に示したように、テーブル形式で、所定の格納領域に保持蓄積している。
処理結果保存サーバ40としては、追記情報処理装置10とネットワーク接続され、付加情報記入済手帳91についての自動スケジューリング処理結果を管理することができるものであればよく、たとえば、処理結果データベース装置や処理結果ファイルサーバ装置などが該当する。
個人情報管理システム2の中心部をなす追記情報処理装置10は、基本的には、第1実施形態の追記情報処理装置10と同様の機能部を備えている。ただし、処理対象が、付加情報記入済教材81ではなく付加情報記入済手帳91としていることに対応した若干の変更を加えている。
たとえば、文書原本特定部120は、付加情報記入済手帳91に対応する手帳90を特定する手帳特定部125として機能する。また解答者抽出部134を歪み補正部114からの画像情報に基づき日付欄92の記載内容を抽出する日付抽出部135に変更している。日付抽出部135は、歪み補正部114からの画像情報もしくは差分抽出部132による抽出結果に基づき文書入力装置20で読取り対象となった付加情報記入済手帳91における日付欄92の記載内容を抽出する。
この日付抽出部135は、文字認識処理部136により、日付欄92の記入情報を、追記情報処理装置10上で加工編集が可能な文字データに変換する。
なお、日付欄92の記載は、通常は、元の手帳90に印字されており、正しくは追記情報として扱うべきではないので、文字認識処理部138は差分抽出部132からの差分情報9ではなく歪み補正部114からの画像データを対象に文字認識処理を行なうが、本実施形態では、第1実施形態との対比のため、追記情報として扱うことにする。
また、日付欄92の記載は、個人が手書きすることは希であるので、手書き情報切出部136を割愛することができる。ただし、個人が手書きで日付欄92の記載を行なえば、その記載は、何ら問題なく追記情報となり、日付抽出部135は、差分抽出部132からの差分情報9を処理対象とすることができる。
また、データ処理対象追記情報特定処理部150において、第1データ処理用追記情報認識部154は、予定97を第1の処理対象データとする予定内容認識部として機能し、また、第2データ処理用追記情報認識部164は、データベース分類用のコメント98を第2の処理対象データとするコメント認識部として機能する。
また、データ処理部170において、第1データ処理部170_1は、付加情報記入済手帳91に記入されている予定97を電子データ化する自動スケジューリング部173と、自動スケジューリング部173により電子データ化された予定内容を処理結果保存サーバ40に保存する予定表出力部175とを備える。
また、第2データ処理部170_2は、コメント認識部として機能する第2データ処理用追記情報認識部164により特定されたコメント98に基づいて、自動スケジューリング部173により電子データ化された予定内容を社用と私用とに自動的に分類処理する予定分類処理部177と、予定分類処理部177により分類された予定内容を処理結果保存サーバ40に保存する予定表分類出力部179とを備える。
なお、これら各部の動作は、処理対象が付加情報記入済教材81、採点記号87、コメント88から、付加情報記入済手帳91、予定97、コメント98に代わったものであるが、基本的な仕組みは同じであるので、ここでは、その詳細説明を割愛する。
<全体の処理手順;第2実施形態>
図11および図12は、情報処理システムの第2実施形態である個人情報管理システム2における手帳処理方法の処理動作の手順を説明する図である。ここで、図11は、その画像入力から登録までの全体概要を示しており、また図12は、手帳処理手順を示すフローチャートである。
図11および図12は、情報処理システムの第2実施形態である個人情報管理システム2における手帳処理方法の処理動作の手順を説明する図である。ここで、図11は、その画像入力から登録までの全体概要を示しており、また図12は、手帳処理手順を示すフローチャートである。
追記情報処理装置10(特に個人情報管理システム2においては手帳処理装置に該当する)を利用する場合には、先ず、予定欄94に予定97の記入がされ、さらに各予定欄94に記入された予定97に対する私用と社用を区別する分類記号99を含むコメント98の記入がされた付加情報記入済手帳91について、文書入力装置20は、その付加情報記入済手帳91を読み取り(S210)、その付加情報記入済手帳91を表わす画像データを追記情報処理装置10に入力する(S212)。文書入力装置20は、この文書入力装置20による画像読取りによって得られた画像データについて、一旦ワークエリアとして用いられるメモリなどに保持しておく。
追記情報処理装置10は、文書入力装置20から取り込んだ各付加情報記入済手帳91の画像データに対して、順次、次のような付加情報抽出・分離処理、付加情報特定処理、および自動スケジューリング処理並びに自動分類処理といった付加情報終末処理を実行する。
たとえば、データ処理部170における自動スケジューリング処理並びに自動分類処理に先立って、ある1つの付加情報記入済手帳91から得られた画像データについて、読取画像処理部110の画像データ解析部112は解析処理を行ない(S222)、手帳特定部125の識別情報解析部123は、その解析処理の結果に基づいて付加情報記入済手帳91に対応する元の手帳90の識別特定を行なう(S224)。
手帳特定部125により各付加情報記入済手帳91に対応する手帳90の特定が完了すると、文書管理サーバ30は、その特定結果に従いつつ、保持蓄積している中から該当する手帳90の原本画像(電子データ)を取り出して、これを差分抽出部132へ受け渡す(S226)。また、歪み補正部114は、ある1つの付加情報記入済手帳91から得られた画像データの歪みを補正する(S228)。
差分抽出部132は、文書管理サーバ30から受け渡された原本画像(手帳90)と、文書入力装置20から入力され、歪み補正部114により画像歪みが補正された後の画像データ(付加情報記入済手帳91)とを、それぞれ比較して、その差分を抽出する(S230)。
差分抽出部132は、抽出した差分情報9をデータ処理用追記情報抽出処理部140に渡す。差分抽出部132による差分抽出によって、たとえば図11中の中央部分に示すように、各予定欄94への予定97の記入内容、並びに各予定97に対するコメント98の記入内容のみで表わされる差分情報9が抽出されることになる。
データ処理用追記情報抽出処理部140は、差分抽出部132による差分抽出結果に対して、データ処理用の追記情報を抽出する(S242)。本例の場合、各予定欄94への予定97やコメント98の追記内容を抽出するために、その差分情報9からさらに所定色成分についてのもの、具体的にはたとえば赤色成分のものを抽出する。
抽出線分途切れ補正部148は、データ処理対象追記情報抽出部142による抽出結果に対して、細線化処理、端点抽出処理、端点間接続処理、あるいは線図形の直線近似などの追記情報整形処理を適宜実行する(S246)。抽出線分途切れ補正部148は、途切れ補正処理済の予定97の抽出結果を予定内容認識部として機能する第1データ処理用追記情報認識部154に渡し、また途切れ補正処理済のコメント98の抽出結果をコメント認識部として機能する第2データ処理用追記情報認識部164に渡す。
データ処理対象追記情報特定処理部150は、先ず、分離認識処理部155を構成する図形形状認識部156,166および文字認識処理部157,167が協働して、文書管理サーバ30に保存されている予定欄94の位置情報を参照して、予定97とコメント98とを分離し(S262)、この後、分離した予定97とコメント98の別に、記入内容の特定処理や記入位置の特定処理を実行する。
図形形状認識部156や文字認識処理部157は、コメント98と分離した予定97について(S263−予定)、予定97の記入内容に対する形状認識あるいは文字認識により、その予定97の記入内容を特定する(S264)。続いて、記入位置認識部158は、予定97の記入内容について、その付加情報記入済手帳91上における記入位置を認識する(S266)。
このようにして、記入位置認識部158が予定97の記入位置を認識した後は、自動スケジューリング部173は、図形形状認識部156や文字認識処理部157による予定97の記入内容の認識結果と、記入位置認識部158による予定97の記入位置の認識結果と、文書管理サーバ30が保持蓄積している付加情報記入済手帳91に対応する原本画像(手帳90)に含まれる手帳90の各予定欄94についての位置情報とに基づいて、記載されている予定内容を電子データに変換する(S268)。予定表出力部175は、その予定内容の電子データを処理結果保存サーバ40に個人情報のデータベースとして保存する(S269)。この時点の電子データにされた予定表は、未だ、社用と私用とが混在した状態にある。
図形形状認識部166や文字認識処理部167は、予定97と分離したコメント98について(S263−コメント)、コメント98の記入内容に対する形状認識あるいは文字認識により、コメント98の記入内容を特定する(S270)。続いて、記入位置認識部168は、コメント98の記入内容について、その付加情報記入済手帳91上における記入位置を認識する(S272)。
このようにして、記入位置認識部168がコメント98の記入位置を認識した後は、予定分類処理部177は、図形形状認識部166や文字認識処理部167によるコメント98の記入内容の認識結果と、記入位置認識部168によるコメント98の記入位置の認識結果と、文書管理サーバ30が保持蓄積している図3〜図5に示した分類基準情報39とに基づいて、コメント98を分類する(S274)。そして、その分類結果に基づき、分類した各コメント98と予定97とを関連付けることで、自動スケジューリング部173により電子データ化された予定内容を社用と私用とに自動的に分類処理する(S278)。予定表分類出力部179は、予定分類処理部177で分類された私用と社用とに分類された各予定の電子データ、つまり社用と私用の各スケジュールデータベースを処理結果保存サーバ40に保存する(S279)。
各付加情報記入済手帳91上に記入される予定97を私用と社用の区別無くデータ保存することができるし、予定97を私用と社用の別に対応するように分類してデータ保存することもできるので、処理結果保存サーバ40では、仕事のスケジュールは公開・共有し、プライベートの予定は個人のスケジュール管理ソフトで利用することができるなど、使い勝手が広がる。
このように、情報処理システムの第2実施形態として示した個人情報管理システム2では、予定97やコメント98の記入がされた付加情報記入済手帳91から読み取った画像データと、その付加情報記入済手帳91についての元の手帳90、すなわち予定欄94への予定97やコメント98の記入がされていないものについてのデータとを比較し、互いの差分から予定97やコメント98の記入内容を分離してその記入内容を特定し、その予定97についてのスケジューリングの電子データ化と、コメント98に基づく分類処理(本例では私用と社用への分類処理)を実行するようになっている。
したがって、社用の予定97に関するデータ処理については、差分抽出部132で抽出される差分結果から、私用の記入内容を排除して社用の予定97のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、仕事のスケジュールデータベースに私用の予定97が混在するような悪影響を及ぼすことがない。逆に、私用の予定97に関するデータ処理については、差分抽出部132で抽出される差分結果から、社用の記入内容を排除して私用の予定97のみを分離してその記入内容を特定するようにしているので、同じペンで両者が追記されていても、個人のスケジュールデータベースに社用の予定97が混在するような悪影響を及ぼすこともない。
<追記情報処理装置;計算機構成>
図13は、追記情報処理装置10の他の構成例を示すブロック図である。ここでは、パーソナルコンピュータなどの電子計算機を利用して、追記情報処理をソフトウェアを実行するマイクロプロセッサなどから構築されるより現実的なハードウェア構成を示している。
図13は、追記情報処理装置10の他の構成例を示すブロック図である。ここでは、パーソナルコンピュータなどの電子計算機を利用して、追記情報処理をソフトウェアを実行するマイクロプロセッサなどから構築されるより現実的なハードウェア構成を示している。
すなわち、本実施形態において、追記情報に関するデータ処理を実行する仕組みは、ハードウェア処理回路により構成することに限らず、その機能を実現するプログラムコードに基づき電子計算機(コンピュータ)を用いてソフトウェア的に実現することも可能である。
よって、本発明に係る仕組みを、電子計算機(コンピュータ)を用いてソフトウェアで実現するために好適なプログラムあるいはこのプログラムを格納したコンピュータ読取可能な記憶媒体を発明として抽出することもできる。ソフトウェアにより実行させる仕組みとすることで、ハードウェアの変更を伴うことなく、処理手順などを容易に変更できる利点を享受できるようになる。
電子計算機に、追記情報に関するデータ処理機能をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ(組込マイコンなど)、あるいは、CPU(Central Processing Unit )、論理回路、記憶装置などの機能を1つのチップ上に搭載して所望のシステムを実現するSOC(System On a Chip:システムオンチップ)、または、各種のプログラムをインストールすることで各種の機能を実行することが可能な汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
記録媒体は、コンピュータのハードウェア資源に備えられている読取装置に対して、プログラムの記述内容に応じて、磁気、光、電気などのエネルギの状態変化を引き起こして、それに対応する信号の形式で、読取装置にプログラムの記述内容を伝達できるものである。
たとえば、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクFDを含む)、光ディスク(CD−ROM(Compact Disc-Read Only Memory )、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc )を含む)、または半導体メモリなどよりなるパッケージメディア(可搬型の記憶媒体)により構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されているROMやハードディスクなどで構成されてもよい。
また、ソフトウェアを構成するプログラムは、記録媒体を用いずに、記録媒体を介して提供されることに限らず、有線あるいは無線などの通信網を介して提供されてもよい。
たとえば、追記情報に関するデータ処理機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、ハードウェア処理回路にて構成する場合と同様の効果は達成される。この場合、記憶媒体から読み出されたプログラムコード自体が追記情報に関するデータ処理機能を実現する。
また、コンピュータが読み出したプログラムコードを実行することで、追記情報に関するデータ処理機能が実現されるだけでなく、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(Operating Systems ;基本ソフト)などが実際の処理の一部または全部を行ない、その処理により追記情報に関するデータ処理機能が実現される場合であってもよい。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によって追記情報に関するデータ処理機能が実現される場合であってもよい。
なお、追記情報に関するデータ処理機能を実現するプログラムコードを記述したファイルとしてプログラムが提供されるが、この場合、一括のプログラムファイルとして提供されることに限らず、コンピュータで構成されるシステムのハードウェア構成に応じて、個別のプログラムモジュールとして提供されてもよい。
たとえば、コンピュータシステム900は、コントローラ部901と、ハードディスク装置、フレキシブルディスク(FD)ドライブ、あるいはCD−ROM(Compact Disk ROM)ドライブ、半導体メモリコントローラなどの、所定の記憶媒体からデータを読み出したり記録したりするための記録・読取制御部902とを有する。
コントローラ部901は、CPU(Central Processing Unit )912、読出専用の記憶部であるROM(Read Only Memory)913、随時書込みおよび読出しが可能であるとともに揮発性の記憶部の一例であるRAM(Random Access Memory)915、および不揮発性の記憶部の一例であるRAM(NVRAMと記述する)916を有している。
なお、上記において“揮発性の記憶部”とは、装置の電源がオフされた場合には、記憶内容を消滅してしまう形態の記憶部を意味する。一方、“不揮発性の記憶部”とは、装置のメイン電源がオフされた場合でも、記憶内容を保持し続ける形態の記憶部を意味する。記憶内容を保持し続けることができるものであればよく、半導体製のメモリ素子自体が不揮発性を有するものに限らず、バックアップ電源を備えることで、揮発性のメモリ素子を“不揮発性”を呈するように構成するものであってもよい。
また、半導体製のメモリ素子により構成することに限らず、磁気ディスクや光ディスクなどの媒体を利用して構成してもよい。たとえば、ハードディスク装置を不揮発性の記憶部として利用できる。また、CD−ROMなどの記録媒体から情報を読み出す構成を採ることでも不揮発性の記憶部として利用できる。
また、コンピュータシステム900は、ユーザインタフェースをなす機能部としての指示入力部903と、操作時のガイダンス画面や処理結果などの所定の情報をユーザに提示する表示出力部904と、各機能部との間のインタフェース機能をなすインタフェース部(IF部)909とを有する。
なお、データ処理結果を印刷出力してユーザに提示する構成とするべく、処理結果を所定の出力媒体(たとえば印刷用紙)に出力する画像形成部906を設けることもできる。
指示入力部903としては、たとえば、ユーザインタフェース部985の操作キー部985bを利用することができる。あるいは、キーボードやマウスなどを利用することもできる。
表示出力部904は、表示制御部919と表示装置とを備える。表示装置としては、たとえば、ユーザインタフェース部985の操作パネル部985aを利用することができる。あるいは、CRT(Cathode Ray Tube;陰極線管)やLCD(Liquid Crystal Display;液晶)などでなるその他のディスプレイ部を利用することもできる。
たとえば、表示制御部919が、操作パネル部985aやディスプレイ部上に、ガイダンス情報や文書入力装置20が取り込んだ全体画像などを表示させる。また、各種の情報をユーザに通知する際の表示デバイスとしても利用される。なお、表示面上にタッチパネルを有するディスプレイ部とすることで、指先やペンなどで所定の情報を入力する指示入力部903を構成することもできる。
インタフェース部909としては、処理データ(画像データを含む)や制御データの転送経路であるシステムバス991の他、たとえば、画像形成部906や他のプリンタとのインタフェース機能をなすプリンタIF部996、およびネットワークとの間の通信データの受け渡しを仲介する通信IF部999を有している。
このような構成において、CPU912は、システムバス991を介してシステム全体の制御を行なう。ROM913は、CPU912の制御プログラムなどを格納する。RAM915は、SRAM(Static Random Access Memory )などで構成され、プログラム制御変数や各種処理のためのデータなどを格納する。また、RAM915は、所定のアプリケーションプログラムに従って演算して得たデータや外部から取得したデータなどを一時的に格納する領域を含んでいる。
たとえば、追記情報に関するデータ処理機能をコンピュータに実行させるプログラムは、CD−ROMなどの記録媒体を通じて配布される。あるいは、このプログラムは、CD−ROMではなくFDに格納されてもよい。また、MOドライブを設け、MOに前記プログラムを格納してもよく、またフラッシュメモリなどの不揮発性の半導体メモリカードなど、その他の記録媒体にプログラムを格納してもよい。さらに、他のサーバなどからインターネットなどのネットワークを経由してプログラムをダウンロードして取得したり、あるいは更新したりしてもよい。
なおプログラムを提供するための記録媒体としては、FDやCD−ROMなどの他にも、DVDなどの光学記録媒体、MDなどの磁気記録媒体、PDなどの光磁気記録媒体、テープ媒体、磁気記録媒体、ICカードやミニチュアカードなどの半導体メモリを用いることができる。記録媒体の一例としてのFDやCD−ROMなどには、追記情報に関するデータ処理機能を実現する際の、一部または全ての機能を格納することができる。
また、ハードディスク装置は、制御プログラムによる各種処理のためのデータを格納したり、自装置で取得したデータや外部から取得したデータなどを大量に一時的に格納したりする領域を含んでいる。
このような構成により、操作キー部985bを介した操作者による指令にて、前述の追記情報処理方法を実行するプログラムが記憶されているCD−ROMなどの読取可能な記録媒体からRAM915に追記情報処理プログラムがインストールされ、また操作キー部985bを介した操作者による指令や自動処理にて追記情報処理プログラムが起動される。たとえば、教材自動採点システム1を実現する場合であれば、教材処理プログラムでは、所定色成分、具体的にはたとえば赤色成分の差分抽出結果を、採点記号87やコメント88の記入内容として認識し、かつ両者を分離するようにする処理ステップなどが記述されたプログラムが起動される。
CPU912は、この追記情報処理プログラムに従って前述の追記情報処理方法に伴う計算処理を施し、処理結果をRAM915やハードディスクなどの記憶装置に格納し、必要により操作パネル部985a、あるいはCRTやLCDなどの表示装置に出力する。追記情報処理方法を実行するプログラムが記録した記録媒体を用いることにより、既存のシステムを変えることなく、追記情報処理システムを汎用的に構築することができる。
なお、このようなコンピュータを用いた構成に限らず、図7や図10を用いて示した各機能部の処理をなす専用のハードウェアの組合せにより、追記情報に関するデータ処理機能を行なう追記情報処理装置10を構成することもできる。
また、たとえば、追記情報に関するデータ処理機能のための各機能部分の全ての処理をソフトウェアで行なうのではなく、これら機能部分の一部を専用のハードウェアにて行なう処理回路908を設けてもよい。ソフトウェアで行なう仕組みは、並列処理や連続処理に柔軟に対処し得るものの、その処理が複雑になるに連れ、処理時間が長くなるため、処理速度の低下が問題となる。
これに対して、ハードウェア処理回路で行なうことで、高速化を図ったアクセラレータシステムを構築することができるようになる。アクセラレータシステムは、処理が複雑であっても、処理速度の低下を防ぐことができ、高いスループットを得ることができる。
たとえば、追記情報に関するデータ処理機能を実現する場合であれば、処理回路908としては、図7や図10に示した読取画像処理部110に相当する読取画像処理部908a、文書原本特定部120に相当する文書原本特定部908b、追記情報抽出部130に相当する追記情報抽出部908c、データ処理対象追記情報特定処理部150に相当するデータ処理対象追記情報特定処理部908d、あるいはデータ処理部170に相当するデータ処理部908eなどをハードウェアで構成するとよい。
以上、本発明について実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、そのような変更または改良を加えた形態も本発明の技術的範囲に含まれる。
また、上記の実施形態は、クレーム(請求項)にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組合せの全てが発明の解決手段に必須であるとは限らない。前述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜の組合せにより種々の発明を抽出できる。実施形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られる限りにおいて、この幾つかの構成要件が削除された構成が発明として抽出され得る。
たとえば、歪み補正処理や途切れ補正処理などは、必ずしも必須ではない。また、採点記号87の採点集計に当たって、各解答欄84と採点記号87の記入位置とを対応付ける場合に、本実施形態で説明したような採点記号87の外接矩形と解答欄84の領域との重なり面積を求めるのではなく、たとえばそれぞれの中心座標の距離から対応付けを行なったり、あるいは単にそれぞれの間で重なる部分があるか否かによって対応付けを行なったりすることも考えられる。
また、処理対象の追記済文書8Bの一例として付加情報記入済教材81や付加情報記入済手帳91を例に説明したが、これらは一例に過ぎず、複数種類のデータ処理対象となる追記情報が含まれているものであれば、その文書の種別は問わない。
また、先にも述べたが、処理対象の追記済文書8Bは、紙媒体を用いることに限定されず、最初から追記済文書8Bを電子データの形式で入手する態様の場合であっても、複数種類のデータ処理対象となる追記情報が含まれているものであれば、上述した仕組みを同様に適用することができる。
1…教材自動採点システム、2…個人情報管理システム、8A…文書原本、8B…追記済文書、9…差分情報、10…追記情報処理装置、20…文書入力装置、30…文書管理サーバ、40…処理結果保存サーバ、80…教育用教材、81…付加情報記入済教材、87…採点記号、88…コメント、90…手帳、91…付加情報記入済手帳、97…予定、98…コメント、99…分類記号、110…読取画像処理部、112…画像データ解析部、114…歪み補正部、120…文書原本特定部、122…教材特定部、123…識別情報解析部、124…コード情報解析部、125…手帳特定部、130…追記情報抽出部、132…差分抽出部、134…解答者抽出部、135…日付抽出部、136…手書き情報切出部、138…文字認識処理部、140…データ処理用追記情報抽出処理部、142…データ処理対象追記情報抽出部、146…追記情報整形部、148…抽出線分途切れ補正部、150…データ処理対象追記情報特定処理部、154…第1データ処理用追記情報認識部、155…分離認識処理部、156…図形形状認識部、157…文字認識処理部、158…記入位置認識部、164…第2データ処理用追記情報認識部、166…図形形状認識部、167…文字認識処理部、168…記入位置認識部、170…データ処理部、170_1…第1データ処理部、170_2…第2データ処理部、171…ユーザ端末、172…採点集計部、173…自動スケジューリング部、174…集計結果出力部、175…予定表出力部、176…コメント分類処理部、177…予定分類処理部、178…コメント処理結果出力部、179…予定表分類出力部
Claims (9)
- 所定の情報が記載されている文書原本にさらに別の付加情報が追記された追記済文書を処理対象として、前記付加情報に基づいて所定のデータ処理を行なう追記情報処理方法であって、
前記追記済文書中に存在する複数の前記付加情報について、その記載内容を認識するとともに、当該付加情報の特徴に基づいて複数の種類に区別し、この区別した前記複数の付加情報のそれぞれに基づいて、それぞれの区別に対応した個別のデータ処理を行なう
ことを特徴とする追記情報処理方法。 - 所定の情報が記載されている文書原本にさらに別の付加情報が追記された追記済文書を処理対象として、前記付加情報に基づいて所定のデータ処理を行なう追記情報処理装置であって、
前記追記済文書中に存在する複数の前記付加情報を抽出する追記情報抽出部と、
前記追記情報抽出部が抽出した前記追記済文書中に存在する複数の前記付加情報について、その記載内容を認識するとともに、当該付加情報の特徴に基づいて複数の種類に区別する分離認識処理部と、
前記分離認識処理部が区別した前記複数の付加情報のそれぞれに基づいて、それぞれの区別に対応した個別のデータ処理を行なうデータ処理部と
を備えたことを特徴とする追記情報処理装置。 - 前記分離認識処理部は、前記付加情報の特徴としての、前記追記済文書中における前記付加情報の記載位置に基づいて、前記複数の種類に区別する
ことを特徴とする請求項2に記載の追記情報処理装置。 - 前記分離認識処理部は、前記付加情報の特徴としての、前記追記済文書中における前記付加情報の画像特徴量に基づいて、前記複数の種類に区別する
ことを特徴とする請求項2または3のうちの何れか1項に記載の追記情報処理装置。 - 前記分離認識処理部は、前記画像特徴量としての、前記追記済文書中における前記付加情報の記載領域サイズに基づいて、前記複数の種類に区別する
ことを特徴とする請求項4に記載の追記情報処理装置。 - 前記分離認識処理部は、前記画像特徴量としての、前記追記済文書中における前記付加情報の形状に基づいて、前記複数の種類に区別する
ことを特徴とする請求項4または5に記載の追記情報処理装置。 - 前記分離認識処理部は、前記付加情報の特徴としての、前記付加情報の記載内容を認識した際の信頼度に基づいて、前記複数の種類に区別する
ことを特徴とする請求項2〜6のうちの何れか1項に記載の追記情報処理装置。 - 前記データ処理部は、区別した一方の付加情報を、さらに所定の条件に基づいて複数に分類し、この分類した結果を出力する
ことを特徴とする請求項2〜7のうちの何れか1項に記載の追記情報処理装置。 - 所定の情報が記載されている文書原本にさらに別の付加情報が追記された追記済文書を処理対象として、前記付加情報に基づいて所定のデータ処理をコンピュータを用いて行なうためのプログラムであって、
前記コンピュータを、
前記追記済文書中に存在する複数の前記付加情報を抽出する追記情報抽出部と、
前記追記情報抽出部が抽出した前記追記済文書中に存在する複数の前記付加情報について、その記載内容を認識するとともに、当該付加情報の特徴に基づいて複数の種類に区別する分離認識処理部と、
前記分離認識処理部が区別した前記複数の付加情報のそれぞれに基づいて、それぞれの区別に対応した個別のデータ処理を行なうデータ処理部
として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006108324A JP2007280241A (ja) | 2006-04-11 | 2006-04-11 | 追記情報処理方法、追記情報処理装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006108324A JP2007280241A (ja) | 2006-04-11 | 2006-04-11 | 追記情報処理方法、追記情報処理装置、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007280241A true JP2007280241A (ja) | 2007-10-25 |
Family
ID=38681600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006108324A Pending JP2007280241A (ja) | 2006-04-11 | 2006-04-11 | 追記情報処理方法、追記情報処理装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007280241A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009217140A (ja) * | 2008-03-12 | 2009-09-24 | Yamaha Corp | 教材編集装置 |
JP2009277006A (ja) * | 2008-05-14 | 2009-11-26 | Fuji Xerox Co Ltd | 情報処理装置、文書管理システム、情報処理システム、及びプログラム |
JP2016194801A (ja) * | 2015-03-31 | 2016-11-17 | 富士通株式会社 | 傍線問題採点方法、傍線問題採点プログラム及び傍線問題採点装置 |
-
2006
- 2006-04-11 JP JP2006108324A patent/JP2007280241A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009217140A (ja) * | 2008-03-12 | 2009-09-24 | Yamaha Corp | 教材編集装置 |
JP2009277006A (ja) * | 2008-05-14 | 2009-11-26 | Fuji Xerox Co Ltd | 情報処理装置、文書管理システム、情報処理システム、及びプログラム |
JP2016194801A (ja) * | 2015-03-31 | 2016-11-17 | 富士通株式会社 | 傍線問題採点方法、傍線問題採点プログラム及び傍線問題採点装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4873138B2 (ja) | 情報処理装置及びプログラム | |
US8794978B2 (en) | Educational material processing apparatus, educational material processing method, educational material processing program and computer-readable recording medium | |
US9754500B2 (en) | Curriculum assessment | |
US10325511B2 (en) | Method and system to attribute metadata to preexisting documents | |
US20150199598A1 (en) | Apparatus and Method for Grading Unstructured Documents Using Automated Field Recognition | |
US8768241B2 (en) | System and method for representing digital assessments | |
JP4868224B2 (ja) | 追記情報処理方法、追記情報処理装置、およびプログラム | |
JP4807489B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
JP4655824B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラム | |
CN113360608A (zh) | 人机结合的中文作文批改系统和方法 | |
JP2008003739A (ja) | 入力修正方法、追記情報処理方法、追記情報処理装置、およびプログラム | |
JP2014182789A (ja) | ドキュメントを編集する装置、方法及びプログラム | |
JP4756447B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
JP2007280241A (ja) | 追記情報処理方法、追記情報処理装置、およびプログラム | |
CN115620332B (zh) | 一种基于纸质作业的自动批阅方法及设备 | |
JP4710707B2 (ja) | 追記情報処理方法、追記情報処理装置、およびプログラム | |
JP4807487B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
JPH08297704A (ja) | 健康保険証自動認識方法および装置、並びに老人医療保険証自動認識方法および装置 | |
JP7074170B2 (ja) | 採点支援装置、採点支援システム、採点支援方法および採点支援プログラム | |
JP4756456B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
US20060188863A1 (en) | Material processing apparatus, material processing method, and material processing program product | |
JP4894184B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
CN113378822A (zh) | 一种在试卷中使用特殊标记框标注手写答案区域的系统 | |
JP2007304670A (ja) | 追記情報処理方法、追記情報処理装置、文書作成装置、およびプログラム | |
JP4894195B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム |