JP2018063600A

JP2018063600A - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: JP2018063600A
Application number: JP2016202008A
Authority: JP
Inventors: 聡一郎小野; Soichiro Ono; 思萌馮; Simeng Feng; 彰夫古畑; Akio Furuhata; 博之水谷; Hiroyuki Mizutani; 由明黒沢; Yoshiaki Kurosawa
Original assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Current assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Priority date: 2016-10-13
Filing date: 2016-10-13
Publication date: 2018-04-19

Abstract

【課題】設問に対する回答の確認作業の効率化を実現できる情報処理装置、情報処理方法およびプログラムを提供する。【解決手段】実施形態の情報処理装置は、分類部と、特徴抽出部と、並び順決定部と、出力部と、を備える。分類部は、同じ設問に対する個別の回答を示す文字列画像の集合を、前記文字列画像に対する文字認識の結果と前記設問の属性に応じた規則とに基づいて、１以上のカテゴリに分類する。特徴抽出部は、前記設問の属性に応じた前記文字列画像の特徴を抽出する。並び順決定部は、抽出した前記特徴に基づいて、同じカテゴリに属する複数の文字列画像の並び順を決定する。出力制御部は、前記文字列画像の集合を、カテゴリごとに、前記並び順に従って出力するように制御する。【選択図】図４

Description

本発明の実施形態は、情報処理装置、情報処理方法およびプログラムに関する。

記述式試験の答案の採点やアンケート結果の集計といった手書き文字を扱う煩雑な作業を、文字認識技術を利用して効率化する試みがある。例えば、記述式試験の設問に対する回答を文字認識の結果に基づいて分類すれば、回答が正しいか否かの判断が容易になる。しかし、文字認識の結果には誤りが含まれる場合があり、また、文字認識の結果が同じであっても設問のタイプ（属性）によっては回答を区別すべき場合があることなどを考慮すると、実際の採点・集計作業においては、文字認識の結果に基づいて分類された回答を作業者が確認しながら採点や集計を行うことが求められる。そして、上述のような文字認識の結果に基づいた分類だけでは、こうした確認作業を効率化する観点からは十分でなく、改善が求められる。

特開２０１２−１８１６５３号公報

本発明が解決しようとする課題は、設問に対する回答の確認作業の効率化を実現できる情報処理装置、情報処理方法およびプログラムを提供することである。

実施形態の情報処理装置は、分類部と、特徴抽出部と、並び順決定部と、出力部と、を備える。分類部は、同じ設問に対する個別の回答を示す文字列画像の集合を、前記文字列画像に対する文字認識の結果と前記設問の属性に応じた規則とに基づいて、１以上のカテゴリに分類する。特徴抽出部は、前記設問の属性に応じた前記文字列画像の特徴を抽出する。並び順決定部は、抽出した前記特徴に基づいて、同じカテゴリに属する複数の文字列画像の並び順を決定する。出力制御部は、前記文字列画像の集合を、カテゴリごとに、前記並び順に従って出力するように制御する。

図１は、実施形態の概要を説明する模式図である。図２は、一覧画像の一例を示す図である。図３は、答案採点支援システムの概略構成を示すブロック図である。図４は、第１実施形態の情報処理装置の機能的な構成例を示すブロック図である。図５は、文字列画像管理テーブルのデータ構造の一例を示す図である。図６は、第１実施形態の情報処理装置による処理手順の一例を説明するフローチャートである。図７は、文字列画像の一例を示す図である。図８は、文字認識の結果から構築される木構造を説明する図である。図９は、文字列画像の一例を示す図である。図１０は、文字列画像の一例を示す図である。図１１は、キーワード同義語リストの一例を示す図である。図１２は、第２実施形態の情報処理装置の機能的な構成例を示すブロック図である。図１３は、文字列画像に対する加工の一例を説明する図である。図１４は、文字列画像に対する加工の一例を説明する図である。図１５は、文字列画像に対する加工の一例を説明する図である。図１６は、実施形態の情報処理装置のハードウェア構成の一例を示すブロック図である。

以下、実施形態の情報処理装置、情報処理方法およびプログラムを、図面を参照しながら説明する。

［実施形態の概要］
以下で示す実施形態は、例えば記述式試験の答案やアンケート結果などといった設問に対する回答、特に、手書き文字で記入された回答の確認作業の効率化を実現するためのものである。手書き文字は、用紙に記入されたものに限らず、例えばタッチスクリーンに電子ペンなどを用いて記入された電子的な手書き文字も含む。

図１は、実施形態の概要を説明する模式図である。図１に示すように、本実施形態では、まず、文字認識技術を利用して、同じ設問に対する個別の回答を示す文字列画像の集合Ｘを１以上のカテゴリに分類する。例えば、文字列画像の集合Ｘに含まれる各文字列画像に対する文字認識の結果と、各文字列画像に共通の設問の属性に応じた分類規則とに基づいて、文字列画像の集合Ｘを１以上のカテゴリに分類する。文字列画像は、例えば、答案用紙やアンケート用紙の回答記入欄に記入された手書き文字を光学的に読み取ることで得られる。電子的な手書き文字の場合は、その手書き文字の筆跡データ（ストローク）を文字列画像とみなす。なお、本実施形態では、複数の文字を含む文字列として記入された回答だけでなく、単一の文字のみからなる回答を示す画像も文字列画像と呼ぶ。

設問の属性とは、その設問がどのような回答を求めているかといった設問のタイプを示す。例えば、化学式や数式の記述を回答として求めるタイプ、漢字の記述を回答として求めるタイプ、文章の記述を回答として求めるタイプなどが、設問の属性の一例として挙げられる。分類規則は、文字認識の結果を用いて文字列画像の集合Ｘをどのように１以上のカテゴリに分類するかの規則を表す。

本実施形態では、次に、設問の属性に応じた文字列画像の特徴に基づいて、同じカテゴリに属する複数の文字列画像の並び順を決定する。設問の属性に応じた文字列画像の特徴としては、例えば、設問の属性が化学式や数式の記述を回答として求めるものであれば、添え字と推定される文字の大きさや位置などが挙げられる。また、設問の属性が数式の記述を回答として求めるものであれば、数式における演算子と認識された文字の形状などが挙げられる。また、設問の属性が漢字の記述を回答として求めるものであれば、漢字の止め、はね、はらい、はみ出しなどの検査結果などが挙げられる。また、設問の属性が文章の記述を回答として求めるものであれば、文章に含まれるキーワードの表現（キーワードの同義語として登録された単語のうち、いずれの単語を用いているか）などが挙げられる。

本実施形態では、以上のように、設問の属性に応じた文字列画像の特徴に基づいてカテゴリごとに並び順を決定した文字列画像の集合Ｘを、カテゴリごとに、決定した並び順に従って出力するように制御する。例えば、同じカテゴリに属する複数の文字列画像を、決定した並び順に従って配置した一覧画像を表示装置に表示させる。また、このような一覧画像を印刷装置に印刷出力させるようにしてもよい。本実施形態により表示あるいは印刷出力される一覧画像の一例を図２に示す。この図２の例は、水の化学式の記述を求める設問に対する回答を示す文字列画像の集合Ｘにおいて、文字認識結果が「Ｈ２Ｏ」であるカテゴリに含まれる複数の文字列画像が、下付き文字と推定された「２」の上端位置に応じた並び順に従って配置された一覧画像の一部を抜き出したものを示している。この図２の例では、予め用意した添え字の基準位置を示すライン（図中の一点鎖線で示すライン）が、一覧画像に含まれるそれぞれの文字列画像に重畳されている。なお、図２の例において、文字列画像の並び順は、「２」の大きさや下端位置などに応じた並び順でもよい。記述式試験の答案やアンケート結果などの採点・集計作業を行う作業者は、このように表示または印刷出力された一覧画像を参照することで、設問に対する回答の確認作業を効率よく行うことができる。

なお、本実施形態では、文字列画像の集合Ｘの出力形態として上述のような一覧画像の表示あるいは印刷出力を想定するが、文字列画像の集合Ｘは、カテゴリごとに、決定した並び順に従って出力されればよく、上述の例に限らない。例えば、一定時間ごと、あるいはキーボードの所定のキーを押すなどの明示的な操作に応じて、文字列画像を順次表示装置に表示させるように制御してもよい。以下では、記述式試験の答案の採点を支援する答案採点支援システムに本実施形態を適用した例を挙げて、実施形態の情報処理装置、情報処理方法およびプログラムの具体例を詳しく説明する。

［第１実施形態］
図３は、答案採点支援システムの概略構成を示すブロック図である。答案採点システムは、図３に示すように、本実施形態の情報処理装置１０に対して、スキャナ装置２０と、表示装置３０と、印刷装置４０とが接続された構成である。スキャナ装置２０は、設問に対する回答が手書き文字で回答記入欄に記入された答案用紙を光学的に読み取って、読み取り画像を情報処理装置１０に入力する。表示装置３０は、情報処理装置１０による出力制御に従って上述の一覧画像を表示する。印刷装置４０は、情報処理装置１０による出力制御に従って上述の一覧画像を印刷出力する。なお、表示装置３０と印刷装置４０は、少なくとも一方が情報処理装置１０に接続されていればよい。

図４は、第１実施形態の情報処理装置１０の機能的な構成例を示すブロック図である。本実施形態の情報処理装置１０は、図４に示すように、入力受付部１１と、画像切り出し部１２と、文字認識部１３と、分類部１４と、特徴抽出部１５と、並び順決定部１６と、記憶制御部１７と、出力制御部１８と、記憶部５０とを備える。

記憶部５０は、答案用紙レイアウト情報５１と、設問属性・特徴対応情報５２と、設問属性・分類規則対応情報５３と、文字列画像管理テーブル５４とを記憶している。また記憶部５０には、文字列画像を格納する文字列画像データベース５５が構築される。

答案用紙レイアウト情報５１は、本実施形態で扱う答案用紙のレイアウトに関する情報である。答案用紙レイアウト情報５１は、少なくとも、答案用紙における各回答記入欄の位置情報（例えば回答記入欄の四隅の座標）と、その回答記入欄に対応する設問の属性情報（以下、「設問属性」という）とを含む。設問属性は、例えば、設問が化学式の記述を回答として求めることを示す「化学式」、数式の記述を回答として求めることを示す「数式」、漢字の記述を回答として求めることを示す「漢字」、文章の記述を回答として求めることを示す「文章」などである。答案用紙レイアウト情報５１は、本実施形態で扱う答案用紙の各々について事前に作成され、情報処理装置１０に登録されているものとする。

設問属性・特徴対応情報５２は、設問属性と、抽出すべき文字列画像の特徴との対応関係を示す情報である。例えば、設問属性が「化学式」や「数式」であれば、抽出すべき文字列画像の特徴は、添え字と推定される文字の大きさや位置などであることが、この設問属性・特徴対応情報５２によって示される。また、設問属性が「数式」であれば、抽出すべき文字列画像の特徴は、数式における演算子と認識された文字の形状などであることが、この設問属性・特徴対応情報５２によって示される。また、設問属性が「漢字」であれば、抽出すべき文字列画像の特徴は、漢字の止め、はね、はらい、はみ出しなどの検査結果などであることが、この設問属性・特徴対応情報５２によって示される。また、設問属性が「文章」であれば、抽出すべき文字列画像の特徴は、文章に含まれるキーワードの表現などであることが、この設問属性・特徴対応情報５２によって示される。これらの設問属性に応じて抽出すべき文字列画像の特徴は、例えば、文字列画像に対する幾何学的な計測、もしくは、文字認識の結果に対して意図理解などの知識処理を行うことにより抽出することができる。このような設問属性・特徴対応情報５２は、事前に作成されて情報処理装置１０に登録されているものとする。

設問属性・分類規則対応情報５３は、設問属性と、文字列画像の集合Ｘを１以上のカテゴリに分類する際の分類規則との対応関係を示す情報である。例えば、設問属性が「化学式」であれば、分類規則は、文字認識の結果が同じ文字列画像同士、つまり、個別文字の認識結果としてスコアが最も高い第１候補の文字が共通し、かつ、文字の並びが共通する文字列画像同士を１つのカテゴリに分類するといった規則であることが、この設問属性・分類規則対応情報５３によって示される。また、設問属性が「数式」であれば、分類規則は、文字認識の結果が同じ文字列画像同士に加えて、これら文字列画像とは文字の並びが異なるが意味的には等価の文字列画像も１つのカテゴリに分類するといった規則であることが、この設問属性・分類規則対応情報５３によって示される。また、設問属性が「漢字」であれば、分類規則は、文字認識の結果が同じ文字列画像同士を１つのカテゴリに分類するといった規則であることが、この設問属性・分類規則対応情報５３によって示される。また、設問属性が「文章」であれば、所定のキーワード（同義語も含む）が出現する文字列画像と出現しない文字列画像とを異なるカテゴリに分類するといった規則であることが、この設問属性・分類規則対応情報５３によって示される。このような設問属性・分類規則対応情報５３は、事前に作成されて情報処理装置１０に登録されているものとする。

文字列画像管理テーブル５４は、文字列画像データベース５５に格納された文字列画像を管理するためのテーブルである。文字列画像管理テーブル５４のデータ構造の一例を図５に示す。この図５に例示する文字列画像管理テーブル５４は、「画像ＩＤ」カラムと、「答案ＩＤ」カラムと、「回答欄ＩＤ」カラムと、「設問属性」カラムと、「格納先アドレス」カラムと、「文字認識結果」カラムと、「カテゴリ番号」カラムと、「特徴」カラムと、「並び順」カラムとを有する。

「画像ＩＤ」カラムには、文字列画像データベース５５に格納された文字列画像の各々に対して一意に割り当てられた識別情報である画像ＩＤが格納される。「答案ＩＤ」カラムには、当該文字列画像に対応する回答が記入された答案用紙に対して一意に割り当てられた識別情報である答案ＩＤが格納される。「回答欄ＩＤ」カラムには、当該文字列画像に対応する回答が記入された回答記入欄に対して一意に割り当てられた識別情報である回答欄ＩＤが格納される。これら画像ＩＤ、答案ＩＤ、および回答欄ＩＤにより、文字列画像データベース５５に格納された文字列画像の各々が、どの答案用紙のどの回答記入欄に記入された回答を示すものであるかが分かる。

「設問属性」カラムには、文字列画像に対応する設問属性が格納される。文字列画像に対応する設問属性は、上述の答案用紙レイアウト情報５１を参照して取得することができる。「格納先アドレス」カラムには、文字列画像データベース５５における文字列画像の格納場所を示すアドレス情報が格納される。

「文字認識結果」カラムには、後述の文字認識部１３による文字列画像に対する文字認識の結果が格納される。文字認識の結果には、文字列画像を構成する各文字について、少なくとも第１候補となる文字の文字コードおよびスコアと、その文字の位置情報（上端位置、下端位置、左端位置、および右端位置の座標）とが含まれる。なお、文字認識の結果に、第２候補以降の下位の候補の情報も含まれていてもよい。この場合、文字認識の結果は、例えばラティス形式の情報であってもよい。

「カテゴリ番号」カラムには、後述の分類部１４により分類された文字列画像の分類先となるカテゴリの番号が格納される。「特徴」カラムには、後述の特徴抽出部１５により抽出された文字列画像の特徴を示す情報が格納される。「並び順」カラムには、後述の並び順決定部１６により決定されたカテゴリ内における文字列画像の並び順を示す情報が格納される。

上述の答案用紙レイアウト情報５１、設問属性・特徴対応情報５２、設問属性・分類規則対応情報５３の参照や、文字列画像管理テーブル５４の参照および各カラムへの情報の格納、文字列画像データベース５５への文字列画像の格納および読み出しは、記憶制御部１７を介して実施される。すなわち、記憶制御部１７は、画像切り出し部１２、文字認識部１３、分類部１４、特徴抽出部１５、並び順決定部１６、および出力制御部１８からの依頼に応じて、記憶部５０から必要な情報を読み出したり、記憶部５０に情報を格納したりする。

入力受付部１１は、スキャナ装置２０から入力される読み取り画像、つまり回答が記入された答案用紙を光学的に読み取ることで得られる読み取り画像を取得して、この読み取り画像を画像切り出し部１２に渡す。

画像切り出し部１２は、記憶制御部１７を介して答案用紙レイアウト情報５１を参照することで、読み取り画像における回答記入欄の位置を特定して文字列画像の切り出しを行うとともに、切り出した文字列画像に対応する設問属性を取得する。画像切り出し部１２により読み取り画像から切り出された文字列画像は、記憶制御部１７を介して文字列画像データベース５５に格納される。また、文字列画像の切り出しおよび格納に伴い、その文字列画像に対応する画像ＩＤ、答案ＩＤ、回答欄ＩＤ、設問属性、および格納先アドレスが、それぞれ文字列画像管理テーブル５４の対応するカラムに格納される。

文字認識部１３は、文字列画像データベース５５に格納された各文字列画像に対して文字認識を行う。文字認識部１３による文字列画像に対する文字認識の結果は、記憶制御部１７を介して、文字列画像管理テーブル５４の「文字認識結果」カラムに格納される。

分類部１４は、同じ設問に対する個別の回答を示す文字列画像の集合Ｘを、それぞれの文字列画像に対する文字認識の結果と、設問属性に応じた分類規則とに基づいて、１以上のカテゴリに分類する。具体的には、分類部１４は、記憶制御部１７を介して文字列画像管理テーブル５４を参照し、回答欄ＩＤが共通する文字列画像それぞれの文字認識結果と、これら文字列画像に共通の設問属性とを取得する。また、分類部１４は、記憶制御部１７を介して設問属性・分類規則対応情報５３を参照することで、文字列画像管理テーブル５４から取得した設問属性に対応する分類規則を特定する。そして、分類部１４は、文字列画像管理テーブル５４から取得した文字認識の結果と、設問属性・分類規則対応情報５３を参照して特定した分類規則とに基づいて、回答欄ＩＤが共通する文字列画像の集合Ｘを１以上のカテゴリに分類する。分類部１４による分類結果（各文字列画像の分類先となるカテゴリの番号）は、記憶制御部１７を介して、文字列画像管理テーブル５４の「カテゴリ番号」カラムに格納される。

特徴抽出部１５は、分類部１４により１以上のカテゴリに分類された集合Ｘに含まれる各文字列画像それぞれの設問属性に応じた特徴を抽出する。具体的には、特徴抽出部１５は、記憶制御部１７を介して文字列画像管理テーブル５４を参照し、集合Ｘに含まれる各文字列画像に共通の設問属性を取得する。また、特徴抽出部１５は、記憶制御部１７を介して設問属性・特徴対応情報５２を参照することで、文字列画像管理テーブル５４から取得した設問属性に対応して抽出すべき各文字列画像の特徴を特定する。そして、特徴抽出部１５は、集合Ｘに含まれる各文字列画像それぞれについて、設問属性・特徴対応情報５２を参照して特定した特徴を抽出する。例えば、設問属性・特徴対応情報５２を参照して特定した特徴が、文字の大きさや位置、形状などに関するものであれば、特徴抽出部１５は、例えば各文字列画像に対して幾何学的な計測を行って得られた結果を、文字列画像の特徴として抽出する。また、設問属性・特徴対応情報５２を参照して特定した特徴が、キーワードの表現などといった文字認識の結果に依存するものであれば、特徴抽出部１５は、文字認識部１３による文字認識の結果に対して意図理解などの知識処理を行って得られた結果を、文字列画像の特徴として抽出する。特徴抽出部１５によって抽出された各文字列画像の特徴は、記憶制御部１７を介して、文字列画像管理テーブル５４の「特徴」カラムに格納される。

並び順決定部１６は、特徴抽出部１５により抽出された特徴に基づいて、同じカテゴリに属する複数の文字列画像の並び順を決定する。具体的には、並び順決定部１６は、記憶制御部１７を介して文字列画像管理テーブル５４を参照し、カテゴリの番号が共通する文字列画像それぞれの特徴を取得する。そして、並び順決定部１６は、文字列画像管理テーブル５４から取得した各文字列画像の特徴に基づいて、同じカテゴリに属する複数の文字列画像の並び順を決定する。例えば、文字列画像の特徴が１次元の連続値で表される場合、その特徴の値に応じた昇順または降順で、各文字列画像の並び順を決定することができる。また、文字列画像の特徴が複数次元の連続値で表される場合、各次元の値を用いた所定の算術演算によって得られた値に応じた昇順または降順で、各文字列画像の並び順を決定することができる。また、文字列画像の特徴が離散値で表される場合、例えば、文字列画像の特徴に基づいてカテゴリ内でクラスタリングを行い、同じクラスタにクラスタリングされた文字列画像同士が隣り合うように、各文字列画像の並び順を決定することができる。この場合、同じクラスタ内の文字列画像の並び順は、例えば、画像ＩＤをもとに決定してもよいし、ランダムに決定してもよい。また、例えば筆跡が近い順など、他の指標に基づいてクラスタ内の文字列画像の並び順を決定してもよい。

出力制御部１８は、同じ設問に対する個別の回答を示す文字列画像の集合Ｘを、分類部１４により分類されたカテゴリごとに、並び順決定部１６により決定された並び順に従って出力するように制御する。例えば、出力制御部１８は、同じカテゴリに属する複数の文字列画像を、並び順決定部１６により決定された並び順に従って配置した図２のような一覧画像を生成し、この一覧画像を表示装置３０に表示させたり、印刷装置４０に印刷出力させたりする。また、出力制御部１８は、例えば、一定時間ごと、あるいは明示的な操作に応じて、同じカテゴリに属する複数の文字列画像を、並び順決定部１６により決定された並び順に従って順次表示装置３０に表示させるようにしてもよい。

なお、以上説明した情報処理装置１０の機能的な構成例は一例であり、これに限らない。例えば、答案用紙の読み取り画像から文字列画像を切り出す処理を情報処理装置１０の外部で行い、情報処理装置１０の入力受付部１１が、答案用紙の読み取り画像ではなく文字列画像の入力を受け付ける構成としてもよい。この構成の場合、図４に示した画像切り出し部１２は不要となる。

また、文字列画像の切り出しだけでなく、文字列画像に対する文字認識の処理も情報処理装置１０の外部で行い、情報処理装置１０の入力受付部１１が、文字列画像および文字認識の結果の入力を受け付ける構成としてもよい。この構成の場合、図４に示した画像切り出し部１２および文字認識部１３は不要となる。

次に、以上のように構成される第１実施形態の情報処理装置１０の動作の概要を、図６を参照して説明する。図６は、第１実施形態の情報処理装置１０による処理手順の一例を説明するフローチャートであり、文字列画像が文字列画像データベース５５に格納済みの状態で開始され、個々の設問ごとに繰り返される一連の処理の流れを示している。

図６のフローチャートで示す処理が開始されると、まず、文字認識部１３が、同じ設問に対する個別の回答を示す文字列画像の集合Ｘを処理対象として取得する（ステップＳ１０１）。そして、文字認識部１３は、ステップＳ１０１で取得した文字列画像の集合Ｘの中から文字列画像を１つ取り出す（ステップＳ１０２）。

次に、文字認識部１３は、ステップＳ１０２で取り出した文字列画像に対して文字認識を行う（ステップＳ１０３）。その後、文字認識部１３は、ステップＳ１０１で取得した文字列画像の集合Ｘに含まれる全ての文字列画像に対して文字認識を行ったか否かを判定し（ステップＳ１０４）、文字認識を行っていない文字列画像があれば（ステップＳ１０４：Ｎｏ）、ステップＳ１０２に戻って以降の処理を繰り返す。なお、ここでは処理対象となる文字列画像の集合Ｘを取得して順次文字認識を行う例を説明するが、文字列画像に対する文字認識は、文字列画像の集合Ｘを取得する前に（例えば、答案用紙の読み取り画像から文字列画像を切り出して文字列画像データベース５５に格納するときなどに）、予め行っておくようにしてもよい。

一方、文字列画像の集合Ｘに含まれる全ての文字列画像に対して文字認識が行われた場合は（ステップＳ１０４：Ｙｅｓ）、次に、分類部１４が、ステップＳ１０４で各文字列画像に対して行われた文字認識の結果と、各文字列画像に共通の設問属性に応じた分類規則とに基づいて、ステップＳ１０１で取得した文字列画像の集合Ｘを１以上のカテゴリに分類する（ステップＳ１０５）。

次に、特徴抽出部１５が、ステップＳ１０５での分類先となるカテゴリの１つを選択し（ステップＳ１０６）、ステップＳ１０６で選択したカテゴリに分類された文字列画像を１つ取り出す（ステップＳ１０７）。そして、特徴抽出部１５は、ステップＳ１０７で取り出した文字列画像に対し、設問属性に応じた特徴を抽出する処理を行う（ステップＳ１０８）。その後、文字認識部１３は、ステップＳ１０６で選択したカテゴリに分類された全ての文字列画像に対して特徴を抽出する処理を行ったか否かを判定し（ステップＳ１０９）、特徴抽出を行っていない文字列画像があれば（ステップＳ１０９：Ｎｏ）、ステップＳ１０７に戻って以降の処理を繰り返す。

一方、ステップＳ１０６で選択したカテゴリに分類された全ての文字列画像に対して特徴を抽出する処理が行われた場合は（ステップＳ１０９：Ｙｅｓ）、次に、並び順決定部１６が、ステップＳ１０６で選択したカテゴリに分類された各文字列画像の並び順を、ステップＳ１０８で抽出された特徴に基づいて決定する（ステップＳ１１０）。その後、並び順決定部１６は、全てのカテゴリに対して文字列画像の並び順を決定する処理を行ったか否かを判定し（ステップＳ１１１）、文字列画像の並び順を決定していないカテゴリがあれば（ステップＳ１１１：Ｎｏ）、ステップＳ１０６に戻って以降の処理を繰り返す。

一方、全てのカテゴリに対して文字列画像の並び順を決定する処理が行われた場合は（ステップＳ１１１：Ｙｅｓ）、次に、出力制御部１８が、ステップＳ１０１で取得した文字列画像の集合Ｘを、カテゴリごとに、ステップＳ１１０で決定された並び順に従って出力するように制御し（ステップＳ１１２）、図６のフローチャートで示す一連の処理が終了する。

以上説明したように、本実施形態の情報処理装置１０は、同じ設問に対する個別の回答を示す文字列画像の集合Ｘを、各文字列画像に対する文字認識の結果と設問属性に応じた分類規則とに基づいて１以上のカテゴリに分類するとともに、設問属性に応じた文字列画像の特徴を抽出する。そして、抽出した文字列画像の特徴に基づいて、同じカテゴリに属する複数の文字列画像の並び順を決定し、文字列画像の集合Ｘを、カテゴリごとに、決定した並び順に従って出力するように制御する。したがって、本実施形態の情報処理装置１０によれば、記述式試験の設問に対する回答の確認作業の効率化を実現することができる。すなわち、本実施形態によれば、文字認識の結果に基づくカテゴリごとに文字列画像が出力されるため、文字認識の誤りを発見し易くなるとともに、同じカテゴリに属する文字列画像が、設問属性に応じた特徴に基づいて決定された並び順に従って出力されるため、設問属性に応じた着目すべき差異の一覧性が向上し、回答の確認作業を効率よく行うことができる。

以下、いくつかの設問属性を例示しながら、本実施形態により実施される文字列画像の集合Ｘの分類および各文字列画像に対する特徴抽出の処理の具体例について、さらに詳しく説明する。

＜第１実施例＞
本実施例は、設問属性が「化学式」の場合の例である。設問属性が「化学式」の場合、文字列画像の集合Ｘを１以上のカテゴリに分類する際の分類規則としては、例えば、文字認識の結果が同じ文字列画像同士を１つのカテゴリに分類するといった規則が適用される。ここで文字認識の結果が同じとは、個別文字の認識結果としてスコアが最も高い第１候補の文字が共通し、かつ、文字の並びが共通することを意味し、個別文字の大きさや位置は問わないものとする。また、設問属性が「化学式」の場合、抽出すべき文字列画像の特徴としては、添え字と推定される文字の大きさと位置との少なくとも一方、具体的には、例えば添え字と推定される文字の上端位置と下端位置との組み合わせなどが適用される。

図７は、水の化学式の記述を求める設問に対する回答を示す文字列画像の一例を示す図である。この図７に示す文字列画像の特徴を抽出する場合、まず、文字列画像全体の上端位置Ｈと、文字列画像全体の下端位置Ｌとを求め、これらの間の距離を行幅とする。また、文字列画像を構成する個々の文字の上端位置ｔと下端位置ｂとの間の距離を、その文字の大きさとする。そして、文字列画像を構成する文字のうち、行幅に対する文字の大きさの割合が基準値以下のものを添え字と推定し、この添え字と推定された文字の上端位置ｔと下端位置ｂとの組み合わせを、当該文字列画像の特徴として抽出する。

図７に示す例では、「Ｈ２Ｏ」の文字列画像を構成する個々の文字のうち、「２」の文字が添え字と推定され、この「２」の文字の上端位置ｔと下端位置ｂとの組み合わせが、図７に例示する文字列画像の特徴として抽出される。そして、このように抽出された特徴に基づいて、文字認識の結果が「Ｈ２Ｏ」の文字列画像の並び順が決定される。例えば、「２」の文字の上端位置ｔまたは下端位置ｂ、あるいはそれらの重み付き和や二乗和などにより得られた値でカテゴリ内の文字列画像を昇順または降順にソートすることにより、同じカテゴリに属する複数の文字列画像の並び順が決定される。

化学式の記述を求める設問の回答では、正しい文字が正しい並びで記述されているかに加えて、添え字が正しく記述されているか否かが採点を行う上で重要な基準となり得る。したがって、設問属性が「化学式」の場合の回答を示す文字列画像を添え字の大きさや位置に応じた順番で並べることにより、設問属性に応じた着目すべき差異の一覧性が向上し、回答の確認作業を効率よく行うことができる。また、上述した一覧画像を表示または印刷出力する際に、例えば図２に例示したように、予め用意した添え字の基準位置を示すラインなどを一覧画像に重畳してもよい。これにより、回答の確認作業をさらに効率よく行うことができる。

なお、添え字と推定された文字の大きさや位置といった特徴は、設問属性が「化学式」の文字列画像に限らず、設問属性が「数式」の文字列画像の並び順を決定するための特徴としても有効に利用できる。また、添え字に限らず、文字の大きさや位置といった特徴は、例えば国語や外国語の文字書き取り問題のように試験教科特有の記法に含まれる文字や記号類が正しく記述できているかを採点の基準とする場合において、文字列画像の並び順を決定するための特徴として有効に利用できる。

＜第２実施例＞
本実施例は、設問属性が「数式」の場合の例である。設問属性が「数式」の場合、文字列画像の集合Ｘを１以上のカテゴリに分類する際の分類規則としては、例えば、文字認識の結果が同じ文字列画像同士に加えて、これら文字列画像とは文字の並びが異なるが意味的には等価の文字列画像も１つのカテゴリに分類するといった規則が適用される。意味的に等価か否かは、例えば、文字列画像に対する文字認識の結果から構築される木構造に基づいて判断することができるようになる。

図８は、文字認識の結果から構築される木構造を説明する図であり、（ａ）は文字認識の結果が「ａ／ｂ＝ｃ」の場合の木構造、（ｂ）は文字認識の結果が「ｃ＝ａ／ｂ」の場合の木構造、（ｃ）は文字認識の結果が「ｂ／ａ＝ｃ」の場合の木構造をそれぞれ示している。文字列画像に対する文字認識の結果から木構造を構築する場合、まず、文字認識の結果の中から演算子を全て抽出し、抽出された各演算子について、演算子前後の項が交換可能であるか否か判定して分類する。なお、演算子以外が連続した部分それぞれを項とする。次に、演算子と項の情報を元に、木構造を構築する。このとき、演算子である木構造の接点に対し、前後の順番が交換可能であるか否かの情報を付与する。図８の例では、まず「／」と「＝」を抽出する。「／」は前後の項の交換が不可能、「＝」は前後の項の交換が可能であるのでこれらを付加する。次に、演算子を親、演算子前後の項を演算子の持つ子とするような木構造を構築する。

本実施例では、以上のように文字認識の結果から構築された木構造に基づいて意味的に等価と判断される文字列画像同士を同じカテゴリに分類する。図８の例では、（ａ）の木構造が構築された文字列画像と、（ｂ）の木構造が構築された文字列画像とが同じカテゴリに分類され、（ｃ）の木構造が構築された文字列画像は別のカテゴリに分類される。

また、設問属性が「数式」の場合、抽出すべき文字列画像の特徴としては、数式における演算子と認識された文字の形状などが適用される。図９は、演算子「／」を含む数式を記述した回答を示す文字列画像の一例を示す図である。この図９に示す文字列画像の特徴を抽出する場合、まず、演算子と認識された２文字目の「／」について、上端位置ｔと下端位置ｂとの差分を求めるとともに、左端位置ｌと右端位置ｒとの差分を求める。そして、これらの差分の割合から求まる演算子「／」の傾きが、図９に示す文字列画像の特徴として抽出される。そして、このように抽出された特徴に基づいて、文字認識の結果が「ａ／ｂ＝ｃ」の文字列画像、および、これと意味的に等価な、文字認識の結果が「ｃ＝ａ／ｂ」の文字列画像の並び順が決定される。例えば、「／」の傾きの値でカテゴリ内の文字列画像を昇順または降順にソートすることにより、同じカテゴリに属する複数の文字列画像の並び順が決定される。

数式の記述を求める設問の回答では、演算子が正しく記述されているか否かが採点を行う上で重要な基準となり得る。例えば、文字認識の結果が「／」であっても「−」とも受け取れるような回答は減点の対象となることが考えられる。したがって、設問属性が「数式」の場合の回答を示す文字列画像を演算子の形状に応じた順番で並べることにより、設問属性に応じた着目すべき差異の一覧性が向上し、回答の確認作業を効率よく行うことができるようになる。

なお、添え字を含む数式が記述される回答に対しては、演算子の形状に加えて、第１実施例で説明した添え字の大きさや位置を文字列画像の特徴として抽出し、演算子の形状に基く文字列画像の並び順と、添え字の大きさや位置に基く文字列画像の並び準とを、所定の操作などに応じて切り換えられるように構成してもよい。

＜第３実施例＞
本実施例は、設問属性が「漢字」の場合の例である。設問属性が「漢字」の場合、文字列画像の集合Ｘを１以上のカテゴリに分類する際の分類規則としては、例えば、文字認識の結果が同じ文字列画像同士を１つのカテゴリに分類するといった規則が適用される。また、設問属性が「漢字」の場合、抽出すべき文字列画像の特徴としては、漢字の止め、はね、はらい、はみ出しなどの検査結果などが適用される。

図１０は、「触」という漢字の記述を求める設問に対する回答を示す文字列画像の一例を示す図である。この図１０に示す文字列画像の特徴を抽出する場合、事前に定義された特徴点の位置（図中の○の位置）において輪郭追跡を行い、止め、はね、はらいが正しく行われているか、はみ出しがないか、などを検査する。そして、各特徴点に対して検査の結果がＯＫ（１）かＮＧ（０）かを割り振り、検査結果ベクトルを構築してこれを当該文字列画像の特徴として抽出する。

本実施例では、このように抽出された特徴に基づいて、文字認識の結果が「触」の文字列画像のカテゴリ内でクラスタリングを行い、同じクラスタにクラスタリングされた文字列画像同士が隣り合うように、各文字列画像の並び順を決定する。同じクラスタ内の文字列画像の並び順は、例えば、画像ＩＤをもとに決定してもよいし、ランダムに決定してもよい。また、例えば筆跡が近い順など、他の指標に基づいてクラスタ内の文字列画像の並び順を決定してもよい。

漢字の記述を求める設問の回答では、漢字の大まかな字形だけでなく、止め、はね、はらいが正しく行われているか、はみ出しがないかなどの局所的な記述の正確性が採点を行う上で重要な基準となり得る。したがって、設問属性が「漢字」の場合の回答を示す文字列画像を上述の検査結果ベクトルに基づいてクラスタリングし、同じクラスタにクラスタリングされた文字列画像同士が隣り合うように各文字列画像を並べることにより、設問属性に応じた着目すべき差異の一覧性が向上し、回答の確認作業を効率よく行うことができるようになる。

＜第４実施例＞
本実施例は、設問属性が「文章」の場合の例である。設問属性が「文章」の場合、文字列画像の集合Ｘを１以上のカテゴリに分類する際の分類規則としては、例えば、所定のキーワード（同義語も含む）が出現する文字列画像と出現しない文字列画像とを異なるカテゴリに分類するといった規則が適用される。キーワードの出現有無は、文字列画像に対する文字認識の結果を、設問に応じて事前に準備されたキーワード同義語リストと照合することによって判断できる。

図１１は、例えば「温室効果について説明せよ」といった設問に対して事前に準備されたキーワード同義語リストの一例を示す図である。このキーワード同義語リストは、キーワードとして「二酸化炭素」、「ＣＯ_２」、および「炭酸ガス」の３つの同義語が登録された例を示している。温室効果を説明する文章は、例えば、その原因となる「二酸化炭素」という単語が出現しているか否かにより分類できるが、「二酸化炭素」の同義語である「ＣＯ_２」や「炭酸ガス」という単語が出現する文章も、同じカテゴリに分類すべきである。そこで、このような設問に対する回答を示す文字列画像の集合Ｘを分類する場合は、図１１のようなキーワード同義語リストを参照し、文字認識の結果に「二酸化炭素」、「ＣＯ_２」、「炭酸ガス」のいずれかが出現する文字列画像を同じカテゴリに分類し、いずれも出現しない文字列画像を別のカテゴリに分類する。なお、複数のキーワードを扱う場合は、それぞれのキーワードの出現有無の組み合わせごとに、異なるカテゴリに分類すればよい。

また、設問属性が「文章」の場合、抽出すべき文字列画像の特徴としては、文章に含まれるキーワードの表現（キーワード同義語リストに登録された単語のうち、いずれの単語を用いているか）などが適用される。例えば図１１に示すキーワード同義語リストに登録された単語が出現する文字列画像のカテゴリでは、「二酸化炭素」が出現する文字列画像か、「ＣＯ_２」が出現する文字列画像か、あるいは「炭酸ガス」が出現する文字列画像かを、それぞれの文字列画像の特徴として抽出する。そして、「二酸化炭素」が出現する文字列画像と、「ＣＯ_２」が出現する文字列画像と、「炭酸ガス」が出現する文字列画像とをそれぞれ別々のクラスタにクラスタリングし、同じクラスタにクラスタリングされた文字列画像同士が隣り合うように、各文字列画像の並び順を決定する。同じクラスタ内の文字列画像の並び順は、上述の第３実施例と同様に決定すればよい。

文章の記述を求める設問の回答では、キーワードを正しく記述しているか否かが採点の基準となるが、同じ事象を示すが表記が異なる上述のような同義語のキーワードが存在する場合、これらのいずれかが出現する文字列画像がばらばらに配置されていると、キーワードの記述部分を見落としてしまう場合がある。これに対し、同義語のキーワードを含む回答を示す文字列画像をそのキーワードの表現に基づいてクラスタリングし、同じクラスタにクラスタリングされた文字列画像同士が隣り合うように各文字列画像を並べることにより、キーワードの記述部分の見落としなどを有効に抑制することができ、回答の確認作業を効率よく行うことができるようになる。

なお、以上の各実施例では、文字列画像の集合Ｘに含まれる全ての文字列画像について、特徴の抽出やカテゴリ内での並び順の決定を行うことを想定したが、設問に対する回答が不正解の文字列画像は、採点を行う上で上述した詳細な判断が不要な場合が多い。そこで、文字列画像に対する上述の特徴抽出やカテゴリ内での並び順の決定は、設問に対する回答が正解となるカテゴリのみを対象として行う構成としてもよい。

［第２実施形態］
次に、第２実施形態について説明する。本実施形態は、集合Ｘに含まれる一部の文字列画像を加工した上で出力するように構成したものである。なお、本実施形態における基本的な構成および動作は上述の第１実施形態と同様であるため、以下では第１実施形態と同様の構成要素に対しては同一の符号を付して重複した説明を省略し、本実施形態に特徴的な部分についてのみ説明する。

図１２は、第２実施形態の情報処理装置１０’の機能的な構成例を示すブロック図である。本実施形態の情報処理装置１０’は、図１２に示すように、図４に示した第１実施形態の情報処理装置１０の構成に対して、画像加工部１９が追加された構成である。

画像加工部１９は、例えば、同じカテゴリに属する複数の文字列画像のうち、基準となる文字列画像と意味的に等価であるが文字の並びが異なる他の文字列画像を、基準となる文字列画像と文字の並びが同じになるように加工する。例えば設問属性が「数式」の場合、上述のように、文字の並びが異なる文字列画像同士であっても意味的に等価であれば同じカテゴリに分類される。このとき、画像加工部１９は、例えば当該カテゴリに最初に分類された文字列画像を基準となる文字列画像とし、その後、同じカテゴリに分類される文字列画像の文字の並びが基準となる文字列画像と異なっていれば、その文字列画像の文字の並びが基準となる文字列画像と同じになるように加工する。

図１３は、この場合の文字列画像に対する加工の一例を示す図である。基準となる文字列画像の文字の並びが「ｃ＝ａ／ｂ」である場合、画像加工部１９は、文字の並びが「ａ／ｂ＝ｃ」の文字列画像に対し、演算子「＝」の前後の項を入れ替えて、文字の並びが基準となる文字列画像と同じく「ｃ＝ａ／ｂ」となるように加工する。

また、画像加工部１９は、例えば、同じカテゴリに属する複数の文字列画像のうち、基準となる文字列画像と大きさが異なる他の文字列画像を、基準となる文字列画像と同等の大きさとなるように加工してもよい。図１４は、この場合の文字列画像に対する加工の一例を示す図であり、基準となる文字列画像に対して大きさが小さい文字列画像を、基準となる文字列画像と同等の大きさとなるように加工した例を示している。なお、基準となる文字列画像としては、上述の例と同様に、当該カテゴリに最初に分類された文字列画像を選択してもよいし、当該カテゴリに分類された文字列画像の中で平均的な大きさの文字列画像を選択してもよい。

また、画像加工部１９は、同じカテゴリに属する複数の文字列画像のうち、基準となる文字列画像と文字間の間隔が異なる他の文字列画像を、基準となる文字列画像と文字間の間隔が同等となるように加工してもよい。図１５は、この場合の文字列画像に対する加工の一例を示す図であり、基準となる文字列画像に対して文字間の間隔が狭い文字列画像を、基準となる文字列画像と文字間隔となるように加工した例を示している。なお、基準となる文字列画像としては、上述の例と同様に、当該カテゴリに最初に分類された文字列画像を選択してもよいし、当該カテゴリに分類された文字列画像の中で平均的な文字間隔の文字列画像を選択してもよい。

本実施形態の情報処理装置１０’では、集合Ｘに含まれる一部の文字列画像に対して画像加工部１９による加工が行われた場合、出力制御部１８は、加工した文字列画像を含む文字列画像の集合Ｘを、分類部１４により分類されたカテゴリごとに、並び順決定部１６により決定された並び順に従って出力するように制御する。これにより、上述の第１実施形態よりも文字列画像同士の比較がしやすくなり、回答の確認作業をさらに効率よく行うことが可能となる。

［補足説明］
以上説明した情報処理装置１０（１０’）の機能は、例えば、一般的なコンピュータのハードウェアとソフトウェア（プログラム）との協働により実現することができる。この場合の情報処理装置１０（１０’）のハードウェア構成の一例を図１６に示す。

実施形態の情報処理装置１０（１０’）は、例えば図１６に示すように、情報処理を行うＣＰＵ（Central Processing Unit）１０１、ＢＩＯＳなどを記憶した読み出し専用メモリであるＲＯＭ（Read Only Memory）１０２、各種データを書き換え可能に記憶するＲＡＭ（Random Access Memory）１０３、各種データベースとして機能するとともに各種のプログラムを格納するＨＤＤ（Hard Disk Drive）１０４、記憶媒体１１０を用いて情報を保管したり外部に情報を配布したり外部から情報を入手するための媒体駆動装置１０５、ユーザがＣＰＵ１０１に命令や情報などを入力するためのキーボードやマウスなどの入力装置１０６、および、スキャナ装置２０、表示装置３０、印刷装置４０などの外部機器を接続するための機器Ｉ／Ｆ１０７などを備え、これら各部間で送受信されるデータをバスコントローラ１０８が調停して動作する。

このような情報処理装置１０（１０’）では、ユーザが電源を投入するとＣＰＵ１０１がＲＯＭ１０２内のローダーというプログラムを起動させ、ＨＤＤ１０４よりＯＳ（Operating System）というコンピュータのハードウェアとソフトウェアとを管理するプログラムをＲＡＭ１０３に読み込み、このＯＳを起動させる。このようなＯＳは、ユーザの操作に応じてプログラムを起動したり、データを読み込んだり、保存を行ったりする。ＯＳのうち代表的なものとしては、Ｗｉｎｄｏｗｓ（登録商標）、ＵＮＩＸ（登録商標）などが知られている。これらのＯＳ上で動作するプログラムをアプリケーションプログラムと呼んでいる。なお、アプリケーションプログラムは、所定のＯＳ上で動作するものに限らず、後述の各種処理の一部の実行をＯＳに肩代わりさせるものであってもよいし、所定のアプリケーションソフトやＯＳなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。

情報処理装置１０（１０’）は、上記アプリケーションプログラムとして、図４や図１２に示した記憶部５０を除く機能的な構成要素をそれぞれプロセスとして生成するためのプログラムをＨＤＤ１０４に記憶している。情報処理装置１０（１０’）のＨＤＤ１０４にインストールされるアプリケーションプログラムは、一般的には、ＣＤ−ＲＯＭやＤＶＤなどの各種の光ディスク、各種光磁気ディスク、フレキシブルディスクなどの各種磁気ディスク、半導体メモリなどの各種方式のメディアなどの記憶媒体１１０に記録されて提供される。また、このプログラムは、例えばネットワークを利用した通信により外部から取り込まれ、ＨＤＤ１０４にインストールされてもよい。図４や図１２に示した記憶部５０は、例えばＨＤＤ１０４を用いて実現される。

以上のようなハードウェア構成を採用する場合、ＣＰＵ１０１がＯＳ上で動作する上記プログラムに従って各種の演算処理を実行することにより、例えばＲＡＭ１０３上に図４や図１２に示した機能的な構成要素が生成され、コンピュータを情報処理装置１０（１０’）として機能させることができる。なお、図４や図１２に示した機能的な構成要素の一部あるいは全部を、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field-programmable Gate Array）などの専用のハードウェアを用いて実現することもできる。

なお、上述の実施形態では、情報処理装置１０（１０’）が単体の装置として構成されていることを想定するが、情報処理装置１０（１０’）は単体の装置として構成されている必要はなく、物理的に分離されてネットワークを介して接続された複数の装置により構成されていてもよい。また、情報処理装置１０（１０’）は、クラウドシステム上で動作する仮想マシンとして実現されていてもよい。

以上、本発明の実施形態を説明したが、ここで説明した実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。ここで説明した新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。ここで説明した実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。

１０情報処理装置
１３文字認識部
１４分類部
１５特徴抽出部
１６並び順決定部
１８出力制御部
１９画像加工部
３０表示装置
４０印刷装置

Claims

同じ設問に対する個別の回答を示す文字列画像の集合を、前記文字列画像に対する文字認識の結果と前記設問の属性に応じた規則とに基づいて、１以上のカテゴリに分類する分類部と、
前記設問の属性に応じた前記文字列画像の特徴を抽出する特徴抽出部と、
抽出した前記特徴に基づいて、同じカテゴリに属する複数の文字列画像の並び順を決定する並び順決定部と、
前記文字列画像の集合を、カテゴリごとに、前記並び順に従って出力するように制御する出力制御部と、
を備える情報処理装置。
前記特徴抽出部は、前記設問の属性が化学式または数式の記述を回答として求めるものである場合、前記文字列画像に含まれる、添え字と推定される文字の大きさと位置との少なくとも一方を前記特徴として抽出する、
請求項１に記載の情報処理装置。
前記特徴抽出部は、前記設問の属性が数式の記述を回答として求めるものである場合、前記文字列画像に含まれる、数式における演算子と認識された文字の形状を前記特徴として抽出する、
請求項１に記載の情報処理装置。
前記特徴抽出部は、前記設問の属性が漢字の記述を回答として求めるものである場合、前記文字列画像に含まれる漢字の止め、はね、はらい、はみ出しの少なくとも１つの検査結果を前記特徴として抽出する、
請求項１に記載の情報処理装置。
前記特徴抽出部は、前記設問の属性が文章の記述を回答として求めるものである場合、文章に含まれるキーワードの表現を前記特徴として抽出する、
請求項１に記載の情報処理装置。
一部の前記文字列画像を加工する画像加工部をさらに備え、
前記出力制御部は、加工した前記文字列画像を含む前記文字列画像の集合を、カテゴリごとに、前記並び順に従って出力するように制御する、
請求項１乃至５のいずれか一項に記載の情報処理装置。
前記画像加工部は、同じカテゴリに属する複数の文字列画像のうち、基準となる文字列画像と意味的に等価であるが文字の並びが異なる他の文字列画像を、基準となる文字列画像と文字の並びが同じになるように加工する、
請求項６に記載の情報処理装置。
前記画像加工部は、同じカテゴリに属する複数の文字列画像のうち、基準となる文字列画像と大きさが異なる他の文字列画像を、基準となる文字列画像と同等の大きさとなるように加工する、
請求項６に記載の情報処理装置。
前記画像加工部は、同じカテゴリに属する複数の文字列画像のうち、基準となる文字列画像と文字間の間隔が異なる他の文字列画像を、基準となる文字列画像と文字間の間隔が同等となるように加工する、
請求項６に記載の情報処理装置。
前記出力制御部は、同じカテゴリに属する複数の文字列画像を前記並び順に従って配置した一覧画像を表示装置に表示させる、
請求項１乃至９のいずれか一項に記載の情報処理装置。
前記出力制御部は、同じカテゴリに属する複数の文字列画像を前記並び順に従って配置した一覧画像を印刷装置に印刷出力させる、
請求項１乃至９のいずれか一項に記載の情報処理装置。
前記出力制御部は、同じカテゴリに属する複数の文字列画像を前記並び順に従って順次表示装置に表示させる、
請求項１乃至９のいずれか一項に記載の情報処理装置。
前記文字列画像に対する文字認識を行う文字認識部をさらに備える、
請求項１乃至１２のいずれか一項に記載の情報処理装置。
同じ設問に対する個別の回答を示す文字列画像の集合を、前記文字列画像に対する文字認識の結果と前記設問の属性に応じた規則とに基づいて、１以上のカテゴリに分類するステップと、
前記設問の属性に応じた前記文字列画像の特徴を抽出するステップと、
抽出した前記特徴に基づいて、同じカテゴリに属する複数の文字列画像の並び順を決定するステップと、
前記文字列画像の集合を、カテゴリごとに、前記並び順に従って出力するように制御するステップと、
を含む情報処理方法。
コンピュータに、
同じ設問に対する個別の回答を示す文字列画像の集合を、前記文字列画像に対する文字認識の結果と前記設問の属性に応じた規則とに基づいて、１以上のカテゴリに分類する機能と、
前記設問の属性に応じた前記文字列画像の特徴を抽出する機能と、
抽出した前記特徴に基づいて、同じカテゴリに属する複数の文字列画像の並び順を決定する機能と、
前記文字列画像の集合を、カテゴリごとに、前記並び順に従って出力するように制御する機能と、
を実現させるためのプログラム。