JP2020166770A - 文字認識装置、文字認識方法およびプログラム - Google Patents

文字認識装置、文字認識方法およびプログラム Download PDF

Info

Publication number
JP2020166770A
JP2020166770A JP2019069024A JP2019069024A JP2020166770A JP 2020166770 A JP2020166770 A JP 2020166770A JP 2019069024 A JP2019069024 A JP 2019069024A JP 2019069024 A JP2019069024 A JP 2019069024A JP 2020166770 A JP2020166770 A JP 2020166770A
Authority
JP
Japan
Prior art keywords
answer
character recognition
question
answers
existing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019069024A
Other languages
English (en)
Other versions
JP7167821B2 (ja
Inventor
勇輔 竹中
Yusuke Takenaka
勇輔 竹中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2019069024A priority Critical patent/JP7167821B2/ja
Publication of JP2020166770A publication Critical patent/JP2020166770A/ja
Application granted granted Critical
Publication of JP7167821B2 publication Critical patent/JP7167821B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】記述式の問題の解答を文字認識する場合に、正答である解答だけでなく誤答である解答についても正しく文字認識できるようにする。【解決手段】文字認識装置が、既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかと、それから抽出されたキーワードとが対応付けられた答案セットを生成し、文字認識対象の答案である1つ以上の対象答案、対象答案の元となった問題である対象問題、および、対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、答案セットのうち1つ以上の答案セットを選択し、選択された答案セットに含まれる既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、対象答案の文字認識を行う。【選択図】図2

Description

本発明は、文字認識装置、文字認識方法およびプログラムに関する。
特許文献1には、記述式の問題の解答を自動採点するための自動採点システムが記載されている。この自動採点システムでは、被試験者が記述式の問題の解答を入力すると、入力された解答を形態素解析および構文解析して構文解析木モデルを生成する。この自動採点システムは、生成したモデルと、予め生成された模範解答のモデルとを比較して正解の有無を判定し、予め定められた各問題の配点に基づいて採点を行う。
特開2001−056634号公報
採点の前段階として記述式の問題の解答を文字認識する場合、記述式の問題に対しては、既存の類似問題が存在する場合がある。特に、学校など教育の分野では、同様の内容の授業が毎年繰り返され、試験問題に関しても類似問題が蓄積されていると期待される。記述式の問題の解答を高精度に文字認識するために、蓄積された既存問題に関する情報を有効活用できることが好ましい。
本発明は、上述の課題を解決することのできる文字認識装置、文字認識方法およびプログラムを提供することを目的としている。
本発明の第1の態様によれば、文字認識装置は、既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出するキーワード抽出部と、1つ以上の前記検索キーワードと、前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットを生成する対応付け処理部と、文字認識対象の答案である1つ以上の対象答案、前記対象答案の元となった問題である対象問題、および、前記対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、前記答案セットのうち1つ以上の答案セットを選択する選択処理部と、選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、前記対象答案の文字認識を行う文字認識処理部と、を備える。
本発明の第2の態様によれば、文字認識装置は、既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかから抽出された1つ以上の検索キーワードと、前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットのうち1つ以上の答案セットを、文字認識対象の答案である1つ以上の対象答案、前記対象答案の元となった問題である対象問題、および、前記対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて選択する選択処理部と、選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、前記対象答案の文字認識を行う文字認識処理部と、を備える。
本発明の第3の態様によれば、文字認識方法は、既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出する工程と、1つ以上の前記検索キーワードと、前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットを生成する工程と、文字認識対象の答案である1つ以上の対象答案、前記対象答案の元となった問題である対象問題、および、前記対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、前記答案セットのうち1つ以上の答案セットを選択する工程と、選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、前記対象答案の文字認識を行う工程と、を含む。
本発明の第4の態様によれば、プログラムは、コンピュータに、既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出する工程と、1つ以上の前記検索キーワードと、前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットを生成する工程と、文字認識対象の答案である1つ以上の対象答案、前記対象答案の元となった問題である対象問題、および、前記対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、前記答案セットのうち1つ以上の答案セットを選択する工程と、選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、前記対象答案の文字認識を行う工程と、を実行させるためのプログラムである。
この発明によれば、記述式の問題の解答を文字認識する場合に、蓄積された既存問題に関する情報を有効活用できる。
実施形態に係る文字認識システムの機能構成の例を示す概略ブロック図である。 実施形態に係る文字認識装置の機能構成の例を示す概略ブロック図である。 実施形態に係る文字認識装置が行う処理とデータとの関係の例を示す図である。 実施形態に係る文字認識装置が教科書単語データを登録する処理手順の例を示すフローチャートである。 実施形態に係る文字認識装置が関連性単語データを登録する処理手順の例を示すフローチャートである。 実施形態に係る文字認識装置が類似単語データを登録する処理手順の例を示すフローチャートである。 実施形態に係る文字認識装置が誤読単語データを登録する処理手順の例を示すフローチャートである。 実施形態に係る文字認識装置が誤読文字データを登録する処理手順の例を示すフローチャートである。 実施形態に係る文字認識装置が類似文字データを登録する処理手順の例を示すフローチャートである。 実施形態に係る文字認識装置が関連性単語データを更新する処理手順の例を示すフローチャートである。 実施形態に係る文字認識装置が前処理を行う手順の例を示すフローチャートである。 実施形態に係る文字認識装置が対象答案の文字認識を行う処理手順の例を示すフローチャートである。 実施形態に係る文字認識装置が文字認識結果をオペレータに提示して修正操作を受け付ける処理手順の例を示すフローチャートである。 実施形態に係る文字認識装置が行う処理とデータとの関係の、もう1つの例を示す図である。 実施形態に係る文字認識装置の構成の例を示す図である。 実施形態に係る文字認識装置の、もう1つの構成の例を示す図である。 実施形態に係る文字認識方法における処理手順の例を示すフローチャートである。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
以下、本発明の実施形態を説明するが、以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、実施形態に係る文字認識システムの機能構成の例を示す概略ブロック図である。図1に示す構成で、文字認識システム1は、文字認識装置100と、スキャナ装置200とを備える。
文字認識システム1は、筆記式の答案の文字認識を行う。文字認識システム1が文字認識を行う対象は、紙面の答案をスキャンした画像に限定されない。例えば、文字認識システム1が、タブレット等に手書き入力された文字列を対象として文字認識を行うようにしてもよい。
ここで、文字認識処理では一般に、文字認識対象の文字列の情報(それが何であるか、文字列の長さ、文字の種類など)が事前に分かっている方が、文字認識精度が良くなる。この場合、文字認識対象が何であるかという情報を「知識」として活用しながら文字認識処理を行えるからである。
例えば、認識対象が数字であると分かっている場合(言い換えれば、数字しか記入されないという知識がある場合)、文字認識装置は、文字認識結果の候補を数字に絞ることができる。さらには、文字認識装置が、数字に特化した文字認識エンジンを使用するなどの対応を行うことができる。
また、果物の名前が記入されると分かっていれば、文字認識装置は、文字認識結果の候補を果物の名前に絞ることができ、さらには、果物の名前に特化した文字認識エンジンを使用するなどの対応を行うことができる。
一方、文字認識の対象の文字列の情報が事前に得られない場合、例えば、百科事典に載っている言葉を全て登録しておくなど、「知識」を大量に用意しておけば、入力に対応する知識を予め保持している可能性が高まる。しかしながら、この場合、文字認識結果の候補の数が多くなり過ぎて、却って文字認識の精度が低下してしまい、また、文字認識処理に時間を要する可能性がある。
一方、予め用意する「知識」が少なすぎると、文字認識装置が、入力に対応する知識を有しておらず文字認識の精度が低下する原因となる。
このように、文字認識を精度よく行うために、どのような「知識」を用意するかが重要である。
そこで、文字認識システム1は、文字認識の対象を学校での試験等の問題に対する答案、あるいはアンケートの項目など、設問と回答との関係があるものに限定する。例えば、学校での試験等の問題に対する答案を対象とする場合、文字認識システム1は、既に出題された問題(既存の問題)、既存の問題に対する1つ以上の正答、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分(例えば、答案に含まれる単語等)を知識として用いて文字認識を行う。例えば、文字認識システム1は、文字認識対象の答案に対応する正答と、既存の問題に対する答案とを用いて、正答のバリエーションだけでなく誤答についても想定答案を予め生成しておく。
ここで、答案(問題に対する解答)には、正答および誤答のいずれにも幾つかのパターンがあると考えられる。既存の問題に対する答案を用いて文字認識対象の答案に対する予想答案を生成しておくことで、既存の問題で現れた答案のパターンを、今回の問題(文字認識対象の答案の元になった問題)に適用して予想答案を生成することができる。
例えば、既存の問題、今回の問題共に徳川家の将軍の名前を答える問題である場合を考える。既存の問題の正答が徳川吉宗である場合に、吉宗が浮かばずに徳川家康と答えた答案があり、文字認識システム1がこの答案に基づいて徳川家康と想定答案を生成したとする。今回の問題の正答が徳川綱吉である場合に、綱吉が浮かばすに徳川家康と答えた答案があれば、予想答案を参照して正しく文字認識できると期待される。
文字認識システム1は、答案の文字認識を行う場合に、既存の問題の答案を文字認識のための知識として用いることができ、これによって文字認識の精度の向上を図ることができる。
文字認識システム1が行う文字認識について、より詳細に説明する。
まず、説明に用いる言葉を以下のように定義する。
既存の問題(過去の問題):過去の問題文
既存の正答(過去の正答):過去の問題文の正答文
既存の解答(過去の解答):過去の問題文に対する解答文
新しい問題:新しい問題文(与えられた問題文)
新しい正答:新しい問題文の正答文
新しい解答:新しい問題文に対する解答文
文字認識システム1は、準備処理、前処理、認識処理の3段階で文字認識を行う。
準備処理では、文字認識システム1は、文字認識に使用するための知識の整備を行う。特に、文字認識システム1は、既存の問題に関する情報を新しい問題に応じて検索できるように整備する。具体的には、文字認識システム1は、既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出する。そして、文字認識システム1は、抽出した検索キーワードと、検索キーワードの抽出元である、既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とを対応付ける。この、検索キーワードと、既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられたものを、答案セットと称する。
例えば文字認識システム1は、過去の問題文と過去の正答文からそれぞれ単語を抽出し、検索キーワードとする。検索キーワードは、具体的には、問題文の検索キーワードと、正答文の検索キーワードの組である。例えば、過去の問題文の数だけ、検索キーワードがある。
前処理では、文字認識システム1は、新しい問題文と新しい正答文からそれぞれ単語を抽出し、検索キーワードとする。検索キーワードは、具体的には、問題文の検索キーワードと、正答文の検索キーワードの組である。
ここで、過去の検索キーワードの、問題文の検索キーワードと、新しい検索キーワードの、問題文の検索キーワードが一致し、かつ、過去の検索キーワードの、正答文の検索キーワードと、新しい検索キーワードの、正答文の検索キーワードが一致する場合を考える。この場合、当該過去の検索キーワードの由来となった問題文は、当該新しい検索キーワードの由来となった問題文と、類似性があることが期待される。
このとき、それぞれの解答文にも類似性があることが期待される。そこで、文字認識システム1は、当該過去の検索キーワードの由来となった問題文に対する正答文と解答文を、想定解答文として「知識」という形で保持し、新しい解答文の認識に役立てる。
認識処理では、文字認識システム1は、想定解答文を知識として活用することで、認識精度を向上させる。
文字認識システム1が行う文字認識の具体例について説明する。
例1:
以下のような場合を想定する。
過去の問題文:「鎌倉幕府を開いたのは誰か」
過去の正答文:源頼朝
過去の解答文:源頼朝、源義経、足利尊氏、足利義満
過去の問題文の検索キーワード:鎌倉幕府、誰
過去の正答文の検索キーワード:源頼朝
過去の解答文の検索キーワード:源頼朝、源義経、足利尊氏、足利義満
新しい問題文:「誰が鎌倉幕府を開いたか」
新しい正答文:源頼朝
新しい解答文:源頼朝、源義経、足利尊氏、足利義満
新しい問題文の検索キーワード:鎌倉幕府、誰
新しい正答文の検索キーワード:源頼朝
新しい問題に対する想定解答文:源頼朝、源義経、足利尊氏、足利義満
このとき、「過去の問題文の検索キーワード」と「新しい問題文の検索キーワード」が一致し、さらに、「過去の正答文の検索キーワード:源頼朝」と「新しい正答文の検索キーワード:源頼朝」が一致するため、「過去の問題文」と「新しい問題文」に類似性があることが期待され、「新しい問題に対する想定解答文」として、「過去の解答文の検索キーワード」、あるいは、さらに、「過去の解答文」を登録する。
この場合、過去の問題文と新しい問題文に類似性がありそうなので、過去の問題文に対する解答文は、新しい問題に対する解答文と似たようなものになりそうである。よって、想定解答文が有効に働くと考えられる。
この類似性は、「問題あっての解答」という関係性を利用している。したがって、問題と解答の両方で一致が見られれば、一致する確度は高いと考えられる。
そこで、文字認識システム1は、上記のように事前処理、前処理、認識処理の3段階で処理を行い、想定解答文を知識として活用することで、認識精度を向上させる。
例2:
文字認識システム1が行う文字認識の、もう1つの例について説明する。
もし、上記の具体例で、新しい問題文が「鎌倉幕府を開いた人物名を答えよ」であった場合、検索キーワードが「鎌倉幕府、人物名」などとなり、「鎌倉幕府、誰」と一致しないため、想定解答文は作成できない。
そこで、文字認識システム1が、新しい問題文の検索キーワードが過去の問題文の検索キーワードと部分的に一致していれば一致しているとみなすようにしてもよい。例えば、「鎌倉幕府、人物名」と「鎌倉幕府、誰」は、「鎌倉幕府」という点で部分的に一致するため、一致するとみなすと、想定解答文が作成できる。
また、「誰か」と「人物名を答えよ」が意味的に同じであるといった辞書を予め作成しておき、文字認識システム1が、「鎌倉幕府、人物名」と「鎌倉幕府、誰」とは一致していると判定するようにしてもよい。
同様に、正答文の検索キーワードの比較でも、部分的に一致するものを、一致するとみなすようにしてもよいし、意味的に同じものを一致すると判定するようにしてもよい。
例3:
文字認識システム1が行う文字認識の、さらにもう1つの例について説明する。
以上の例では、文字認識システム1が問題文と正答文の両方を用いて比較を行う例について説明した。これに対し、文字認識システム1が、問題文由来の検索キーワードのみで比較するようにしてもよいし、正答文由来の検索キーワードのみで比較するようにしてもよい。
例えば、問題文のみで一致する場合を考えてみる。状況としては、問題文のみから想定解答文を予測したい場合などである。うまくいけば、良い結果が得られることが予想される。例えば、新しい問題文が「鎌倉幕府を開いた人物名を答えよ」であった場合、例えば、検索キーワードが「鎌倉幕府」と「人物名」となれば、問題文由来の検索キーワードのみに対する比較において、部分的な一致を確認することで、良好な想定解答文が作成できる。
しかし、部分的な一致を確認するのみではうまくいかない場合もある。例えば、新しい問題文が「鎌倉幕府の次の幕府は何か」であった場合、検索キーワードが「鎌倉幕府、次の幕府、何」となり、「鎌倉幕府」が部分的に一致するため、「源頼朝、源義経、足利尊氏、足利義満」を想定解答文として作成してしまう。これは、新しい問題文の正答文である「室町幕府」とは関係なく、しかも、解答者も記入しないような人物名であるため、本来は想定することは避けたい文字列である。こういったことが多重に起こることで、問題文に適切でない想定解答文がたくさん登録されることが考えられ、知識として登録される単語が増えるにつれて、認識精度が低減することも考えられる。
そこで、文字認識システム1が、部分一致については、2つ以上の単語が一致する場合に一致と判定するようにしてもよい。あるいは文字認識システム1が、検索キーワードの個数に対して何割以上が一致するといった条件で一致を判定するようにしてもよい。
正答文由来の検索キーワードのみで処理する場合も同様である。
文字認識システム1による検索キーワードの類似度評価のバリエーションについて説明する。
(1) 「過去の問題文由来の検索キーワードと、その正答文由来の検索キーワード」と、
「新しい問題文由来の検索キーワードと、その正答文由来の検索キーワード」の、
それぞれの完全一致による評価。
(2) 「過去の問題文由来の検索キーワードと、その正答文由来の検索キーワード」と、
「新しい問題文由来の検索キーワードと、その正答文由来の検索キーワード」の、
問題文由来の検索キーワードの部分一致と、正答文由来の検索キーワードの完全一致による評価。
(3) 「過去の問題文由来の検索キーワードと、その正答文由来の検索キーワード」と、
「新しい問題文由来の検索キーワードと、その正答文由来の検索キーワード」の、
問題文由来の検索キーワードの完全一致と、正答文由来の検索キーワードの部分一致による評価。
(4) 「過去の問題文由来の検索キーワードと、その正答文由来の検索キーワード」と、
「新しい問題文由来の検索キーワードと、その正答文由来の検索キーワード」の、
それぞれの部分一致による評価。
なお、ここでは部分一致を、完全一致する(例えば、単語識別子が一致する)単語と一致しない単語が両立する場合と定義している。これに限らず、単語識別子は一致しないが、単語の文字列自体が部分的に一致する(「鎌倉幕府」と「鎌倉の幕府」、「鎌倉」など)ことを部分一致と評価するようにしてもよい。あるいは、意味的に近い(「鎌倉幕府」と「鎌倉に開かれた幕府」、「室町幕府の前の幕府」など)ことを部分一致と評価するようにしてもよい。
(5) 「過去の問題文由来の検索キーワード」と、
「新しい問題文由来の検索キーワード」の、
完全一致による評価。
(6) 「過去の問題文由来の検索キーワード」と、
「新しい問題文由来の検索キーワード」の、
部分一致による評価。
(7) 「過去の問題文に対する正答文由来の検索キーワード」と、
「新しい問題文に対する正答文由来の検索キーワード」の、
完全一致による評価。
(8) 「過去の問題文に対する正答文由来の検索キーワード」と、
「新しい問題文に対する正答文由来の検索キーワード」の、
部分一致による評価。
なお、類似の過去の問題文が複数検出された場合、文字認識システム1が、全ての解答文をまとめて想定解答文とするようにしてもよい。あるいはこの場合、文字認識システム1が、当該解答文を問題文の類似度でソートすることで、上位のみ採用するとするようにしてもよい。あるいはこの場合、文字認識システム1が、上位のものから順に採用して実際に認識処理してみた結果を比較して、認識処理の内容の比較結果に基づいて問題文の採否を決定するようにしてもよい。
ここでいう比較は、想定解答文ごとに認識できた単語数が最も多かったものを採用することであってもよい。あるいは、ここでいう比較は、複数のセットで認識した結果を集計し、多くの想定解答文で認識できているものを採用することであってもよい。
また、文字認識システム1が、過去の問題文に対する解答文も比較対象として活用するようにしてもよい。つまり、過去の問題文に対する解答文のうち少なくとも1つ以上を由来とする検索キーワードを比較対象としてもよい。これにより、文字認識システム1による検索キーワードの類似度評価のバリエーションがさらに広がる。また、新しい問題文に対する解答(新しい解答文)から検索キーワードを取り出し、得られた検索キーワードを、新しい正答文の検索キーワードの代わりに使用してもよい。これにより、文字認識システム1による検索キーワードの類似度評価のバリエーションがさらに広がる。
スキャナ装置200は、答案等をスキャンして撮像し、画像データを生成する。スキャナ装置200は、生成した画像データを文字認識装置100へ送信する。
文字認識装置100は、文字認識対象の答案を文字認識する。具体的には、文字認識装置100は、スキャナ装置200が答案をスキャンして生成する画像データを文字認識する。
例えば、文字認識装置100は、既存の問題、その問題の正答および答案をテキスト化したテキストから単語のリストを生成しておく。そして文字認識装置100は、生成しておいたリストを用いて、文字認識対象の答案の元となった問題、または、その正答、または、それに対する答案に対する想定答案を生成し、生成した想定答案を用いて文字認識対象の答案の文字認識を行う。
また、文字認識装置100は、既存の問題に対する答案の文字認識で誤読(誤認識)した文字または単語等を、文字認識不能と判定する処理(棄却処理)に反映させる。例えば、文字認識装置100は、誤読した文字または単語等を認識結果として確定させる判定しきい値を、他の文字または単語等よりも高く設定する。
文字認識装置100は、文字認識処理にて文字認識結果の候補毎に確度(確からしさを示す数値)を算出し、確度がしきい値以上の場合にその候補を文字認識結果として採用する。確度がしきい値以上の候補が無い場合、文字認識装置100は、文字認識不能と判定し、文字認識不能を示す特定のキャラクタ(を示す文字コード)を文字認識結果とする。文字認識不能を示す特定のキャラクタを棄却文字と称する。棄却文字として、例えば「?」を用いるようにしてもよい。
あるいは、文字認識装置100が、単語認識結果の候補毎に確度を算出するようにしてもよい。この場合、確度がしきい値以上の候補が無いときは、文字認識装置100は、単語認識不能と判定し、単語認識不能を示す特定のキャラクタを単語認識結果とする。
過去に誤読した文字または単語等については、しきい値が高く設定されていることで、文字認識装置100がその文字または単語等を文字認識結果として採用する可能性が低くなり、文字認識不能と判定する可能性が高まる。これにより、文字認識装置100が同じ文字認識誤りを繰り返す可能性を低減させることができる。
文字認識装置100によれば、問題毎にカスタマイズされた辞書を生成することで、辞書への単語等の登録数および登録される単語等の内容が実用的なものとなる。文字認識装置100によればこの点で、処理速度の向上および文字認識精度の向上を図ることができる。
また、文字認識装置100によれば、問題に対する想定解答を生成するための人的作業が不要になる、または、低減される。また、文字認識装置100によれば、人的作業が不要になる、または、低減されることで、作業者の経験やスキルに依存せず、問題文に対する想定解答文を一定の品質で網羅的に生成できる。文字認識装置100によれば、作業者の経験やスキルに依存せず問題文に対する想定解答文を一定の品質で網羅的に生成できる点で、文字認識精度の向上が期待される。
以下では、問題に対して想定される正しい答えを正答と称する。正答は、例えば問題の生成者によって生成される。ここでいう問題は、問題文に限定されず、問題に付された注釈、問題を解くために参照される資料、および、文章読解問題における文章など、問題を解くために参照されるいろいろな情報を含んでいてもよい。
また、解答者(模試等の試験であれば受験者)が生成する解答を答案と称する。答案は正しいとは限らない。すなわち、答案は正答ばかりとは限らず、誤答などを含んでいる場合がある。
また、文字認識対象の答案を対象答案と称する。対象答案の元となった問題を対象問題と称する。対象問題に対する正答を対象正答と称する。対象問題における配点を対象配点と称する。
また、既存の問題を既存問題とも称する。既存問題に対する正答を、既存の正答または既存正答とも称する。既存問題に対する答案を、既存の答案または既存答案とも称する。
また、問題、正答または答案等の画像を文字コード等のテキストデータに変換することをテキスト化と称する。人手によるテキスト化をキーパンチ(する)と称し、文字認識装置100によるテキスト化を文字認識(する)またはOCR(する)と称する。キーパンチでは正しくテキスト化されているものとする。ただし、人が判読困難であると判断した文字は、判読不可能を意味する文字に置き換えられることもある。一方、文字認識では誤読(誤認識)が生じる場合があるものとする。
また、文字認識装置100は、文字認識できない文字(変換先の文字を特定できない文字)を「?」など特定のキャラクタ(上述した棄却文字)に置き換える。文字認識できない文字を棄却文字に置き換えることを棄却または棄却処理と称する。棄却処理は、例えば、文字の確からしさの度合いに対するしきい値処理などである。文字認識できない文字を認識不能文字と称する。したがって、文字認識装置100は、認識不能文字を棄却文字に置き換える棄却処理を行う。
また、文字認識結果(文字認識で得られたテキスト)を人手により修正したものを修正済みの文字認識結果と称する。修正済みの文字認識結果では、判読困難な文字は例えば「▲」など特定のキャラクタに置き換えられ、それ以外は正しく変換されているものとする。文字認識結果を修正する人をオペレータと称する。
文字認識装置100による棄却文字を「?」で示し、オペレータによる判読困難な文字を「▲」で示すなど、両者を区別するようにしてもよい。
また、以下では文字認識の単位を文字および単語とする。単語には、単語を識別するための重複がない番号である単語識別子が付されるものとする。
但し、文字認識装置100における文字認識の単位は単語および文字に限定されない。例えば、文字認識装置100が単語単位および文字単位に加えて、あるいは代えて、文節単位または文単位あるいはこれらの両方で文字認識を行うようにしてもよい。あるいは、文字認識装置100が、文字列または部分文字列を単位として文字認識を行うようにしてもよい。
さらには、文字認識装置100が、文字認識に限らず、各種データの生成処理について、文字単位および単語単位に限らず、文節、文字列、および、部分文字列の何れか、あるいはこれらの組み合わせを単位として処理を行うようにしてもよい。
図2は、文字認識装置100の機能構成の例を示す概略ブロック図である。図2に示す構成で、文字認識装置100は、通信部110と、表示部120と、操作入力部130と、記憶部160と、制御部180とを備える。記憶部160は、既存問題データ記憶部161と、対象問題データ記憶部162と、教科書単語データ記憶部163と、関連性単語データ記憶部164と、類似単語データ記憶部165と、類似文字データ記憶部166と、誤読単語データ記憶部167と、誤読文字データ記憶部168と、想定答案データ記憶部169とを備える。制御部180は、分析処理部181と、データベース機能部186と、文字認識処理部187と、オペレータ修正対応部188とを備える。分析処理部181は、キーワード抽出部182と、対応付け処理部183と、選択処理部184と、想定答案生成部185とを備える。
通信部110は、他の装置と通信を行う。特に、通信部110は、スキャナ装置200が答案等をスキャンして生成した画像データを受信する。
表示部120は、例えば液晶パネルまたはLED(Light Emitting Diode、発光ダイオード)パネル等の表示画面を備え、各種画像を表示する。特に、表示部120は、文字認識対象の答案の文字認識結果を、人手(オペレータ)による修正のために表示する。
操作入力部130は、例えばキーボードおよびマイク等の入力デバイスを備え、ユーザ操作を受け付ける。特に、操作入力部130は、文字認識対象の答案の文字認識結果を修正するユーザ操作を受け付ける。
記憶部160は、各種情報を記憶する。記憶部160は、文字認識装置100が備える記憶デバイスを用いて構成される。
例えば、記憶部160は、以下の各部にて記憶する情報に加えて、棄却用の調整値を記憶する。ここでいう棄却用の調整値は、棄却処理に用いられるしきい値である。このしきい値は必ずしも特定の値に固定される必要はなく、文字認識装置100が棄却処理の度合いを厳しくする(棄却され易いように、しきい値を大きくする)、または、緩和する(棄却されにくいように、しきい値を小さくする)といった調整を行うようにしてもよいことから、調整値と称している。
例えば、文字認識装置100が、文字列単位での棄却処理を行う際に、その文字列を構成する各文字の文字認識の確からしさの平均値に基づいてしきい値を算出し、算出したしきい値を用いて文字列単位での棄却処理を行うようにしてもよい。
既存問題データ記憶部161は、既存問題データを記憶する。既存問題データは既存問題に関するデータである。例えば、既存問題データは、既存問題のテキスト、既存問題に対する正答のテキスト、既存問題に対する答案を文字認識したテキスト、および、既存問題に対する答案の、修正済みの文字認識結果のテキストを含む。
対象問題データ記憶部162は、対象問題データを記憶する。対象問題データは対象問題に関するデータである。例えば、対象問題データは、対象問題のテキスト、対象正答のテキスト、対象答案を文字認識したテキスト、および、対象答案の、修正済みの文字認識結果のテキストを含む。
教科書単語データ記憶部163は、教科書単語データを記憶する。教科書単語データは、教科書の文章中に出現する単語をリスト化したテキストデータである。
関連性単語データ記憶部164は、関連性単語データを記憶する。関連性単語データは、例えば既存問題から抽出されたキーワードと、既存答案から抽出された単語とを組み合わせたデータなど、文字認識対象の答案と関連性のある単語として選択される単語を集めたデータである。あるいは、関連性単語データは、例えば既存問題から抽出されたキーワードと、既存正答から抽出されたキーワードと、既存正答及び既存答案から抽出された単語とを組み合わせたデータなど、文字認識対象の問題や正答と関連性があり、つまり、文字認識対象の答案と関連性のある単語として選択される単語を集めたデータである。
文字認識システム1の文字認識の例で上述したように、関連性単語データ記憶部164が、既存問題から抽出されたキーワードと、既存答案から抽出された単語との組み合わせに、既存問題の正答から抽出された単語も組み合わせるようにしてもよい。
類似単語データ記憶部165は、類似単語データを記憶する。類似単語データは、例えば関連性単語データに含まれる複数の単語のうち互いに類似性のある単語など、類似性のある単語を集めたデータである。ただし、類似単語データの対象は、関連性単語データに限定されない。例えば、文字認識装置100が、既存答案から抽出した全ての単語を対象として関連性単語データを生成し、類似単語データ記憶部165が、得られた類似単語データを記憶するようにしてもよい。
類似文字データ記憶部166は、類似文字データを記憶する。類似文字データは、類似する文字と、誤読を低減させるための棄却処理の調整用のしきい値とを組み合わせたデータである。
誤読単語データ記憶部167は、誤読単語データを記憶する。誤読単語データは、文字認識結果と修正後の文字認識結果とで異なる単語の組み合わせなど、文字認識で誤読された単語を示すデータである。
類似単語データおよび類似文字データにおける類似性は、特定のものに限定されない。例えば、類似単語データに含まれる単語の類似性として、5文字中1文字のみ異なるといった文字の共通性を用いるようにしてもよいし、徳川将軍の名前のような意味的な共通性を用いるようにしてもよい。
類似文字データに含まれる文字の類似性として、文字認識エンジン内部での類似性や、文字の形(見た目)の類似性を用いるようにしてもよいが、これに限定されない。
誤読文字データ記憶部168は、誤読文字データを記憶する。誤読文字データは、文字認識結果と修正後の文字認識結果とで異なる文字の組み合わせなど、文字認識で誤読された文字を示すデータである。
想定答案データ記憶部169は、想定答案データを記憶する。想定答案データは、対象問題に対して想定される答案を示すデータである。想定答案データは、例えば対象正答と既存答案とを用いて生成される。あるいは、想定答案データは、例えば、対象正答と、既存正答と、既存答案を用いて生成される。
制御部180は、文字認識装置100の各部を制御して、各種処理を実行する。文字認識装置100が備えるCPU(Central Processing Unit、中央処理装置)が記憶部160からプログラムを読み出して実行することで、制御部180の機能を実行する。
分析処理部181は、既存問題およびその答案など各種データを解析する。特に、分析処理部181は、記憶部160の各部が記憶するデータを生成する。
キーワード抽出部182は、既存問題、既存問題に対する1つ以上の正答(既存正答)、および、既存問題に対する1つ以上の答案(既存答案)のうち少なくとも何れかから検索キーワードを抽出する。
対応付け処理部183は、キーワード抽出部182が抽出した1つ以上の検索キーワードと、検索キーワード抽出元(既存問題、既存問題に対する1つ以上の正答、および、既存問題に対する1つ以上の答案のうち少なくとも何れか)の少なくとも一部分とが対応付けられた答案セットを生成する。
選択処理部184は、対象答案、対象問題、および、対象正答のうち少なくとも何れかに含まれるキーワードに基づいて、1つ以上の答案セットを選択する。
想定答案生成部185は、対象正答と、選択された答案セットに含まれる、既存問題、既存問題に対する1つ以上の正答、および、既存問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とに基づいて、対象答案に対する1つ以上の想定答案を生成する。
データベース機能部186は、記憶部160の各部が記憶するデータを管理する。特に、データベース機能部186は、記憶部160の各部が記憶するデータの検索、読出および書込を行う。
文字認識処理部187は、選択処理部184が選択した答案セットに含まれる、既存問題、既存問題に対する1つ以上の正答、および、既存問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分に基づいて、対象答案の文字認識を行う。より具体的には、文字認識処理部187は、想定答案生成部185が生成する想定答案に基づいて対象答案の文字認識を行う。
制御部180(例えば文字認識処理部187)が、認識対象が正答と判定され、かつ、文字候補の確からしさがしきい値と近い場合を検出するようにしてもよい。
例えば、文字認識処理部187が、文字認識で得られる文字候補の確からしさを評価するための判定しきい値として第1しきい値と第2しきい値とを記憶しておく。第1しきい値は、文字認識結果を棄却するか否か(すなわち、文字認識結果を棄却文字とするか否か)の判定しきい値である。第2しきい値は、第1しきい値よりもやや高い(例えば5%高い)しきい値である。
文字認識処理部187で文字認識結果が棄却されず、対象答案の認識結果の文字列を得られた場合、制御部180は、得られた文字列が正答か否かを判定する。制御部180が得られた文字列を正答と判定した場合、文字認識処理部187は、対象答案の認識結果の文字列に、確からしさが第2しきい値未満の文字が含まれるか否かを判定する。確からしさが第2しきい値未満の文字が検出された場合、制御部180は、検出された文字を表示部120に強調表示させるなどにより、採点者であるユーザに注意喚起する。
ここで、漢字で答えなければ点数がもらえない設問に対して、解答者である学生が、「答えは『みなもとのよりとも』だ」と思ったが、「源頼朝」の「頼」の漢字の「束」偏が思い出せないときに、先生など採点者の見間違え等を期待して、存在するか否かに関わらずそれらしい字を記入するといったケースが考えられる。このような場合、一般的な文字認識処理では、知識処理によって「頼」だと類推する傾向があり、誤答と判定すべきところを正答と判定してしまう可能性がある。
そこで、文字認識装置100が、文字認識結果の確からしさが比較的低い文字について上記のように採点者に注意喚起することで、上記のケースのような場合に誤答と判定すべきところを正答と判定する採点誤りを防止または低減できる。また、配点が高い設問に対する解答の文字認識処理に限り、棄却処理を厳しくする、あるいは、注意喚起をより行うといったことも有効である。
これとは別に、正答を誤答として採点された学生からはクレームが多いことを理由に、認識結果が正答になるときに限り、棄却処理を緩和し、棄却が行われないようにすることも場合によっては有効である。
オペレータ修正対応部188は、文字認識結果のオペレータによる修正のための処理を行う。具体的には、オペレータ修正対応部188は、表示部120を制御して文字認識結果を表示させ、操作入力部130が受け付ける文字認識結果の修正操作を示す情報を取得し、文字認識結果に修正を反映させる。
文字認識装置100が、複数の装置として構成されていてもよい。例えば、記憶部160の各部のうち1つ以上が、文字認識装置100とは別のデータサーバ装置に格納されていてもよい。
また、文字認識装置100が、文字認識装置100とは別の装置として構成される端末装置を備え、表示部120および操作入力部130が端末装置に設けられていてもよい。
図3は、文字認識装置100が行う処理とデータとの関係の例を示す図である。図3に示す今回の問題の問題、正答、答案、配点が、それぞれ対象問題、対象正答、対象答案、対象配点に該当する。
図3に示す例で、文字認識装置100は、準備処理、前処理、および、文字認識処理の3段階で処理を行う。なお、文字認識装置100が行う、準備処理、前処理、文字認識処理は、それぞれ、文字認識システム1の文字認識の例で上述した準備処理、前処理、認識処理と同じである。
準備処理および前処理は、文字認識のためのデータを整備する処理である。このうち準備処理は、対象問題、対象正答、対象答案の何れも不要な処理である。準備処理では、分析処理部181は、前処理で使用するためのデータを生成または更新する。
図3の例で「教科書」は、テキスト化された教科書のデータを示す。分析処理部181は、教科書のデータから単語を抽出してリスト化し、教科書単語データまたはその一部として教科書単語データ記憶部163に記憶させる。分析処理部181が、教科書の索引から単語を抽出するようにしてもよい。また、分析処理部181が、索引から抽出した単語をその他の単語と区別できるようなフラグを付与するようにしてもよい。そして、文字認識装置100が、より重要と考えられる索引由来の単語を優先して処理するようにしてもよい。
また、分析処理部181のキーワード抽出部182は、既存問題、既存問題に対する1つ以上の正答、および、既存問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出する。そして、分析処理部181の対応付け処理部183は、抽出された検索キーワードと、抽出元(既存問題、既存問題に対する1つ以上の正答、および、既存問題に対する1つ以上の答案のうち少なくとも何れか)の少なくとも一部分とを対応付けて答案セットを生成する。
例えば、分析処理部181は、既存問題から検索キーワードを抽出し、また、1つ以上の既存答案から単語を抽出する。そして、分析処理部181は、1つ以上の検索キーワードと、答案に用いられる1つ以上の単語との組み合わせを生成し、関連性単語データまたはその一部として関連性単語データ記憶部164に記憶させる。ここでの答案として、例えば、既存答案の、修正済みの文字認識結果を用いる。
検索キーワードは、文字認識対象の答案に出現すると思われる単語を検索するためのキーワードである。したがって、既存答案から抽出される単語と共起性の高い検索キーワードが用いられることが好ましい。例えば、分析処理部181が、複数の既存問題およびそれら複数の既存問題の既存答案を統計的に処理して、既存答案から抽出した単語と共起性の高い検索キーワードを既存問題から抽出して、検索キーワードと単語とを組み合わせるようにしてもよい。あるいは人手で、既存問題毎にその既存問題の特徴を示すキーワードを抽出し、その既存問題に対する既存答案から抽出した単語と組み合わせるようにしてもよい。または、形態素解析等により、単語を抽出するようにしてもよい。
分析処理部181が答案から抽出する単語は、答案の少なくとも一部の例に該当する。また、分析処理部181が生成する、1つ以上の検索キーワードと、答案に用いられる1つ以上の単語との組み合わせは、答案セットの例に該当する。
但し、分析処理部181が検索キーワードを抽出する元は、既存問題に限定されない。分析処理部181が、既存問題、既存正答、および、既存答案(例えば、既存答案の、修正済みの文字認識結果)のうち1つ以上から、検索キーワードを抽出するようにしてもよい。
また、分析処理部181が答案セットに用いる答案の少なくとも一部は、単語に限定されない。例えば、分析処理部181が、答案全体、または、答案に含まれる文節を答案の少なくとも一部として用いて、これを検索キーワードと組み合わせて答案セットを生成するようにしてもよい。
また、分析処理部181は、教科書単語データ、および、関連性単語データの何れか一方または両方から、類似する文字の組み合わせを抽出し、類似文字データまたはその一部として類似文字データ記憶部166に記憶させる。
また、分析処理部181は、教科書単語データ、および、関連性単語データの何れか一方または両方から、類似する単語の組み合わせを抽出し、類似単語データまたはその一部として類似単語データ記憶部165に記憶させる。
また、分析処理部181は、既存答案の文字認識結果と、その既存答案の修正済みの文字認識結果とで異なる文字を抽出し、修正後の文字を修正前の文字と誤読した旨の情報を、誤読文字データまたはその一部として誤読単語データ記憶部167に記憶させる。ただし、このとき、文字認識結果が棄却文字となっているものについては、誤読したとは見なさず、破棄する。また、修正済みの文字認識結果が判読不可能文字となっているものについては、誤読したとは見なさず、破棄する。
また、分析処理部181は、既存答案の文字認識結果と、その既存答案の修正済みの文字認識結果とで異なる単語を抽出し、修正後の単語を修正前の単語と誤読した旨の情報を、誤読単語データまたはその一部として誤読単語データ記憶部167に記憶させる。
前処理は、文字認識処理に対する前処理である。分析処理部181は、例えば対象問題および対象正答を用いて前処理を行う。一方、対象答案は前処理には不要である。
分析処理部181は、前処理で、対象正答に基づいて想定答案データを生成する。あるいは、分析処理部181が、対象問題に基づいて想定答案データを生成するようにしてもよいし、対象問題と対象正答とに基づいて想定答案データを生成するようにしてもよい。想定答案データは、対象問題に対する答案を分析処理部181が予測したものであり、正解の答案だけでなく誤答の答案も含まれる。対象問題に対して予測される個々の答案を想定答案と称する。
分析処理部181の選択処理部183は、文字認識対象の答案である1つ以上の対象答案、対象答案の元となった問題である対象問題、および、対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、答案セットのうち1つ以上の答案セットを選択する。
例えば、分析処理部181は、対象問題からキーワードを抽出し、抽出したキーワードと答案セットに含まれるキーワードとを比較して、キーワードが一致または類似する答案セットを選択する。そして、分析処理部181は、対象答案に含まれる単語を選択した答案セットに含まれる単語で置き換えることで想定答案を生成する。分析処理部181は、1つ以上の想定答案を生成し、想定答案データとして想定答案データ記憶部169に記憶させる。
上記のように答案セットに含まれる情報は単語に限定されない。従って、分析処理部181が対象正答を置き換える単位も単語に限定されない。例えば、答案そのものが答案セットに含まれている場合、分析処理部181は、答案セットから答案を抽出して想定答案として扱う。
分析処理部181がさらに、想定答案中の単語に類似する単語を、教科書単語データおよび類似単語データのうち何れか一方または両方から抽出し、想定答案中の単語を類似する単語で置き換えて新たな想定答案を生成するようにしてもよい。
また、分析処理部181がさらに、想定答案中の文字に類似する文字を、類似文字データから抽出し、想定答案中の文字を類似する文字で置き換えて新たな想定答案を生成するようにしてもよい。
あるいは、文字認識処理部187が、文字認識処理の際に教科書単語データ、類似単語データ、および、類似文字データのうち何れか1つ以上を参照して、上記と同様の処理を行うようにしてもよい。
文字認識処理は、対象答案に対する文字認識を行なう処理である。文字認識処理部187は、想定答案データを用いて文字認識処理を行う。文字認識対象である対象答案の予測が得られる点で、文字認識処理部187は、文字認識を高精度に行うことができる。
オペレータ修正対応部188は、対象答案の文字認識結果をオペレータ(修正作業者)に提示して修正を受ける。具体的には、表示部120がオペレータ修正対応部188の制御に従って対象答案の文字認識結果を表示し、操作入力部130が、対象答案の文字認識結果に対する修正操作を受け付け、オペレータ修正対応部188が修正を反映させる。
分析処理部181が、対象問題、対象正答、対象答案の文字認識結果、および、対象答案の修正済みの文字認識結果を、新たな既存問題、既存正答、既存答案の文字認識結果、および、既存答案の修正済みの文字認識結果として関連性単語データ、類似文字データ、類似単語データ、誤読文字データおよび誤読単語データのう1つ以上に反映させるようにしてもよい。
次に、図4〜図12を参照して文字認識装置100の動作について説明する。
図4は、文字認識装置100が教科書単語データを登録する処理手順の例を示すフローチャートである。文字認識装置100は、準備処理で図4の処理を行う。
図4の処理で、分析処理部181は、教科書の文章をテキストデータで取得する(ステップS111)。教科書の文章が人手でテキスト化されていてもよいし機械によって機械化されていてもよい。例えば、データベース装置が教科書の文章をテキストデータで記憶しておき、通信部110が、データベース装置から教科書の文章を受信する。あるいは、スキャナ装置200が教科書をスキャンして文字認識処理部187がテキスト化し、オペレータ修正対応部188がオペレータによる修正作業を受けるようにしてもよい。
次に、分析処理部181は、教科書の文章から単語を抽出し、抽出した単語の単語リストを生成する(ステップS112)。分析処理部181が教科書の文章から単語を抽出する方法は、特定の方法に限定されない。例えば、教科書に索引がある場合、分析処理部181が、索引にあがっている単語を抽出するようにしてもよい。あるいは、分析処理部181が、教科書の索引に載っている単語にポイントを付与するなど、単語に優先度を設定するようにしてもよい。
そして、分析処理部181は、生成した単語リストを、教科書単語データまたはその一部として教科書単語データ記憶部163に記憶させる(ステップS113)。教科書単語データ記憶部163がまだ教科書単語データを記憶していない場合、分析処理部181は、生成した単語リストを教科書単語データ記憶部163に新規登録する。教科書単語データ記憶部163が既に教科書単語データを記憶している場合、分析処理部181は、生成した単語リストを、教科書単語データ記憶部163が記憶している教科書単語データに追加する。
ステップS113の後、文字認識装置100は図4の処理を終了する。
図5は、文字認識装置100が関連性単語データを登録する処理手順の例を示すフローチャートである。文字認識装置100は、準備処理で既存問題毎に図5の処理を行う。
図5の処理で、分析処理部181は、既存問題、既存答案の文字認識結果、および、既存答案の修正済みの文字認識結果をテキストデータで取得する(ステップS121)。例えば、既存問題データ記憶部161がこれらのデータを記憶しておき、分析処理部181が既存問題データ記憶部161からこれらのデータを既存問題データ記憶部161から読み出すようにしてもよい。
なお、ここでの既存問題、既存答案の文字認識結果、および、既存答案の修正済みの文字認識結果のテキストデータには、棄却文字および読解不能文字の何れも含まれていないものとする。
次に、分析処理部181のキーワード抽出部182が、既存問題から検索キーワードを抽出する(ステップS122)。分析処理部181が検索キーワードを抽出する方法は、特定の方法に限定されない。例えば、分析処理部181が、既存問題に登場する単語のうち、教科書単語データに登録されている単語を検索キーワードとして抽出するようにしてもよい。あるいは、形態素解析等により単語を抽出してもよい。
次に、分析処理部181は、答案から単語を抽出する(ステップS123)。1つの既存問題に対する答案が複数ある場合、分析処理部181は、それら複数の答案から単語を抽出する。また、上述したように、分析処理部181が答案からの抽出を行う単位は単語単位に限定されない。
次に、分析処理部181の対応付け処理部183は、ステップS122で得られた検索キーワードと、ステップS123得られた単語との組み合わせ(答案セット)を評価する(ステップS124)。分析処理部181が、既存問題毎に、複数の検索キーワードと複数の単語とを1組として組み合わせるようにしてもよい。
対応付け処理部183が答案セットを評価する方法は、特定の方法に限定されない。たとえば、対応付け処理部183が、検索キーワードと単語との共起性を評価して共起行列を生成するようにしてもよい。あるいは、対応付け処理部183が、検索キーワードおよび単語の出現頻度を評価するようにしてもよい。
そして分析処理部181は、ステップS124で所定のしきい値以上の評価となった答案セットを、関連性単語データ記憶部164に記憶させる(ステップS125)。関連性単語データ記憶部164がまだ関連性単語データを記憶していない場合、分析処理部181は、生成した答案セットを関連性単語データとして新規登録する。関連性単語データ記憶部164が既に関連性単語データを記憶している場合、分析処理部181は、生成した答案セットを、関連性単語データ記憶部164が記憶している関連性単語データに追加する。
ステップS125の後、文字認識装置100は図5の処理を終了する。
なお、分析処理部181が関連性単語データ用のデータ(検索キーワード、および、単語のうち何れか一方または両方)の抽出対象は、既存問題および既存答案に限定されない。分析処理部181が、既存問題に加えて、あるいは代えて、既存正答から検索キーワードを抽出するようにしてもよい。また、分析処理部181が、既存答案に加えて、あるいは代えて、既存正答から単語を抽出するようにしてもよい。
図6は、文字認識装置100が類似単語データを登録する処理手順の例を示すフローチャートである。文字認識装置100は、準備処理で図6の処理を行う。
図6の処理で、分析処理部181は、関連性単語データ記憶部164が記憶する関連性単語データに含まれる単語同士を比較する(ステップS131)。そして分析処理部181は、関連性単語データに含まれる単語のうち互いに類似する単語の集合を、類似単語データまたはその一部として類似単語データ記憶部165に記憶させる(ステップS132)。
次に、分析処理部181は、教科書単語データ記憶部163が記憶する教科書単語データに含まれる単語同士を比較する(ステップS133)。そして分析処理部181は、教科書単語データに含まれる単語のうち互いに類似する単語の集合を、類似単語データまたはその一部として類似単語データ記憶部165に記憶させる(ステップS134)。
また、分析処理部181は、関連性単語データに含まれる単語と教科書単語データに含まれる単語とを比較する(ステップS135)。そして分析処理部181は、これらの単語のうち互いに類似する単語の集合を、類似単語データまたはその一部として類似単語データ記憶部165に記憶させる(ステップS136)。
ステップS136の後、文字認識装置100は図6の処理を終了する。
図7は、文字認識装置100が誤読単語データを登録する処理手順の例を示すフローチャートである。文字認識装置100は、準備処理で図6の処理を行う。
図7の処理で、分析処理部181は、既存答案の文字認識結果の修正前および修正後を取得する(ステップS141)すなわち、分析処理部181は、既存答案の文字認識結果と、既存答案の修正後の文字認識結果とを取得する。
次に、分析処理部181は、ステップS141で得られた既存答案の文字認識結果の修正前と修正後とを比較する(ステップS142)。
そして、分析処理部181は、既存答案の文字認識結果の修正前と修正後とで異なる単語を、修正後の単語を修正前の単語に誤読したものとして検出する(ステップS143)。分析処理部181は、修正前後の単語の組を、誤読単語データまたはその一部として誤読単語データ記憶部167に記憶させる(ステップS144)。
ステップS144の後、文字認識装置100は図7の処理を終了する。
図8は、文字認識装置100が誤読文字データを登録する処理手順の例を示すフローチャートである。文字認識装置100は、準備処理で図8の処理を行う。
図8の処理で、分析処理部181は、既存答案の文字認識結果の修正前および修正後を取得する(ステップS151)。ステップS151は、図7のステップS141と同様である。
次に、分析処理部181は、ステップS151で得られた既存答案の文字認識結果の修正前と修正後とを比較する(ステップS152)。
そして、分析処理部181は、既存答案の文字認識結果の修正前と修正後とで異なる文字を、修正後の文字を修正前の文字に誤読したものとして検出する(ステップS153)。分析処理部181は、誤読した文字の確度のしきい値を調整する(ステップS154)。例えば上述したように、分析処理部181は、誤読した文字の確度のしきい値を高く設定することで、文字認識処理部187がその文字を文字認識不能と判定し易くなるようにする。
分析処理部181は、誤読した文字(既存答案の文字認識結果(修正前))と、調整したしきい値とを、誤読文字データまたはその一部として誤読文字データ記憶部168に記憶させる(ステップS155)。
ステップS155の後、文字認識装置100は図8の処理を終了する。
図9は、文字認識装置100が類似文字データを登録する処理手順の例を示すフローチャートである。文字認識装置100は、準備処理で図9の処理を行う。
図9の処理で、分析処理部181は、類似単語データの中の類似している単語の組について、同じ位置の文字毎に文字の類似度を評価する(ステップS161)。上記のように、文字の類似性として、文字の形(見た目)の類似性を用いるようにしてもよいが、これに限定されない。文字の類似度の評価方法として、認識エンジン内部の類似度を用いること、および、公知の方法を用いることができる。
そして、分析処理部181は、所定のしきい値よりも類似度が高いと評価した文字の組について、それらの文字の確度のしきい値を調整する(ステップS162)。例えば、分析処理部181は、他の文字の場合よりも確度のしきい値を高く設定する。これにより文字認識処理部187は、文字認識を行う際にその文字が文字認識結果の候補として出現したときに、確度が比較的低ければ棄却処理する(認識不能文字と判定する)。この点で、文字認識処理部187が誤読する可能性を低減させることができる。また、この棄却処理では、文字単位で棄却してもよいし、当該文字が構成要素となっている単語単位で棄却してもよい。
分析処理部181は、類似している単語の組、類似している文字の位置(何番目の文字か)、および、調整したしきい値の組み合わせを、類似文字データまたはその一部として類似文字データ記憶部166に記憶させる(ステップS163)。
ステップS163の後、文字認識装置100は図9の処理を終了する。
図10は、文字認識装置100が関連性単語データを更新する処理手順の例を示すフローチャートである。文字認識装置100は、準備処理で図4〜図9の各処理を完了した後、図10の処理を行う。
図10の処理で、分析処理部181は、関連性単語データ中の単語に類似する単語を関連性単語データに追加する(ステップS171)。
例えば、分析処理部181は、関連性単語データ記憶部164が記憶する関連性単語データ中の答案セット(例えば、検索キーワードと単語との組み合わせ)を、その答案セット中の単語に類似する単語を追加した答案セットに更新する。その際、分析処理部181が類似単語データを参照して、答案セット中の単語と同じ組に含まれている単語を、答案セット中の単語に類似する単語として取得するようにしてもよい。
類似する単語として類似単語データから取得した単語が、既にその答案セットに含まれている場合、分析処理部181は、その類似する単語を破棄する(答案セットに追加しない)。
あるいは、分析処理部181が、答案セット中の単語を類似する単語で置き換えた答案セットを生成し、関連性単語データ記憶部164が記憶する関連性単語データに追加するようにしてもよい。
生成した答案セットが、関連性単語データ記憶部164が記憶する関連性データに既に含まれている場合、分析処理部181は、生成した答案セットを破棄する(関連性単語データに追加しない)。
また、分析処理部181は、関連性単語データ記憶部164が記憶する関連性単語データ中の答案セット中の単語の文字(1文字以上)を類似する文字で置き換えた単語を、関連性単語データに追加する(ステップS172)。
例えば、分析処理部181は、関連性単語データ記憶部164が記憶する関連性単語データ中の答案セットを、その答案セット中の単語の文字を類似する文字に置き換えた単語を追加した答案セットに更新する。その際、分析処理部181が類似文字データを参照して、答案セット中の単語の文字と同じ組に含まれている文字を、答案セット中の単語の文字に類似する文字として取得するようにしてもよい。
単語の文字を類似する文字に置き換えた単語が、既にその答案セットに含まれている場合、分析処理部181は、文字を類似する文字に置き換えた単語を破棄する(答案セットに追加しない)。
あるいは、分析処理部181が、答案セット中の単語の文字を類似する文字で置き換えた答案セットを生成し、関連性単語データ記憶部164が記憶する関連性単語データに追加するようにしてもよい。
生成した答案セットが、関連性単語データ記憶部164が記憶する関連性データに既に含まれている場合、分析処理部181は、生成した答案セットを破棄する(関連性単語データに追加しない)。
また、分析処理部181は、答案セット中の単語の漢字とひらがなとカタカナとを置き換えた単語を、関連性単語データに追加する(ステップS173)。
例えば、分析処理部181は、関連性単語データ記憶部164が記憶する関連性単語データ中の答案セットを、その答案セット中の単語の漢字とひらがなとカタカナとを置き換えた単語を追加した答案セットに更新する。
答案セット中の単語に漢字が含まれる場合、分析処理部181は、その漢字をひらがなに置き換えた単語、および、その漢字をカタカナに置き換えた単語を答案セットに追加する。答案セット中の単語にひらがなが含まれる場合、分析処理部181は、そのひらがなをカタカナに置き換えた単語を答案セットに追加する。答案セット中の単語にカタカナが含まれる場合、分析処理部181は、そのカタカナをひらがなに置き換えた単語を答案セットに追加する。
単語の漢字とひらがなとカタカナとを置き換えた単語が、既にその答案セットに含まれている場合、分析処理部181は、漢字とひらがなとカタカナとを置き換えた単語を破棄する(答案セットに追加しない)。
あるいは、分析処理部181が、答案セット中の単語の漢字とひらがなとカタカナとを置き換えた答案セットを生成し、関連性単語データ記憶部164が記憶する関連性単語データに追加するようにしてもよい。
生成した答案セットが、関連性単語データ記憶部164が記憶する関連性データに既に含まれている場合、分析処理部181は、生成した答案セットを破棄する(関連性単語データに追加しない)。
分析処理部181は、新たな単語の追加が無くなるまで、図10の処理、または、図10の処理のうち何れか1つ以上のステップの処理を繰り返す。
図11は、文字認識装置100が前処理を行う手順の例を示すフローチャートである。従って、文字認識装置100は、前処理にて図11の処理を行う。
図11の処理で、分析処理部181は、対象問題を解析してキーワードを抽出する(ステップS211)。そして、分析処理部181は、対象問題から抽出したキーワードを用いて、関連性単語データ中の答案セットを選択し、選択した答案セットから単語を取得する(ステップS212)。例えば、分析処理部181は、対象問題から抽出したキーワードを検索キーワードとして含む単語セットを1つ以上選択し、選択した答案セットに含まれる単語(既存の答案から抽出された単語)を全て取得する。
そして、分析処理部181は、ステップS212で取得した単語を想定答案データとして想定答案データ記憶部169に記憶させる(ステップS213)。この単語は、文字認識処理部187が文字認識を行う際に想定答案として用いられる。
また、分析処理部181は、想定答案データに含まれる単語に類似する単語を想定答案データに追加する(ステップS214)。その際、分析処理部181が、類似単語データを参照し、想定答案データに含まれる単語と同じ組に含まれる単語を類似する単語として取得するようにしてもよい。
類似する単語として類似単語データから取得した単語が、既に想定答案データに含まれている場合、分析処理部181は、その類似する単語を破棄する(想定答案データに追加しない)。
図10での関連性単語データの更新が十分に行われている場合、分析処理部181が、ステップS214の処理を省略する(ステップS214の処理を行わない)ようにしてもよい。
また、分析処理部181は、想定答案データに誤読単語データの情報を反映させる(ステップS215)。例えば、分析処理部181は、想定答案データに含まれる単語が誤読単語データに含まれるか否かを判定する。含まれると判定した場合、分析処理部181は、想定答案データに含まれる単語に対して、誤読単語データで示される確度しきい値を設定する。
また、分析処理部181は、想定答案データに含まれる単語の文字を類似する文字で置き換えた単語を想定答案データに追加する(ステップS216)。その際、分析処理部181が、類似文字データを参照し、想定答案データに含まれる単語と同じ組に含まれる単語を類似する単語として取得するようにしてもよい。
類似する文字を置き換えた単語が、既に想定答案データに含まれている場合、分析処理部181は、その類似する文字を置き換えた単語を破棄する(想定答案データに追加しない)。
図10での関連性単語データの更新が十分に行われている場合、分析処理部181が、ステップS216の処理を省略する(ステップS216の処理を行わない)ようにしてもよい。
また、分析処理部181は、想定答案データに誤読文字データの情報を反映させる(ステップS217)。例えば、分析処理部181は、想定答案データに含まれる単語の文字が誤読文字データに含まれるか否かを判定する。含まれると判定した場合、分析処理部181は、想定文字データに含まれる単語の文字に対して、誤読文字データで示される確度しきい値を設定する。
ステップS217の後、文字認識装置100は図11の処理を終了する。
図12は、文字認識装置100が対象答案の文字認識を行う処理手順の例を示すフローチャートである。従って、文字認識装置100は、文字認識処理で図12の処理を行う。
図12の処理で、文字認識処理部187は、スキャナ装置200が対象答案をスキャンした画像データを取得する(ステップS311)。
そして文字認識処理部187は、対象答案を文字認識処理する(ステップS312)。
文字認識処理の際、文字認識処理部187は、想定答案データを知識辞書として用いる。問題、正答、および答案のうち少なくとも何れか1つと関連性のある文字列が想定答案データにて示されることで、文字認識処理部187が文字認識処理を高精度に行えることが期待される。また、文字認識処理部187が想定答案データにて設定される確度のしきい値を用いることで、誤読(誤認識)の可能性がある単語および文字が棄却処理され易くなる。この点で、文字認識処理部187の誤読を低減させることができる。
文字認識装置100が、類似単語データまたは誤読単語データを用いて単語候補のスコアを操作するようにしてもよい。例えば、分析処理部181が、既存答案、あるいは、対象答案で頻出の単語に比較的高いスコアを付与しておくことで、文字認識処理部187が、対象答案で頻出の単語を文字認識結果の候補として選びやすくしてもよい。
また、文字認識装置100が、対象問題の配点情報(対象配点)を用いて棄却処理のしきい値を操作するようにしてもよい。例えば、配点が高い問題は誤読のインパクトが大きいことから、分析処理部181が、配点の高い問題では棄却処理が行われ易くなるように、棄却処理のしきい値を比較的高い値に設定してもよい。
文字認識処理の後、文字認識装置100は、文字認識結果を出力する(ステップS313)。例えば、オペレータ修正対応部188が表示部120を制御して文字認識結果を表示させ、次の図13で説明すするようにオペレータによる修正を受けるようにしてもよい。表示部120が、文字認識結果の表示の際、棄却文字を「?」等のキャラクタで示すようにしてもよい。あるいは、表示部120が、棄却文字を示すキャラクタに加えて、あるいは代えて、文字認識候補と、その候補の確度と、その候補に設定された棄却処理のためのしきい値とのうち何れか1つ以上を表示するようにしてもよい。
ステップS13の後、文字認識装置100は図12の処理を終了する。
図13は、文字認識装置100が文字認識結果をオペレータに提示して修正操作を受け付ける処理手順の例を示すフローチャートである。文字認識装置100は、図12での文字認識処理の後、ステップS313の処理によって表示部120が文字認識結果を表示している状態で図13の処理を行う。
図13の処理で、オペレータ修正対応部188は、オペレータによる修正結果を取得する(ステップS321)。具体的には、操作入力部130が文字認識結果を修正するユーザ操作を受け付ける。オペレータ修正対応部188は、ユーザ操作が示す修正を文字認識結果に反映させる。
また、オペレータ修正対応部188は、修正後の文字認識結果の答案のうち、正答として登録すべきものがあれば登録する(ステップS322)。問題作成者が問題と共に正答を作成しておくのに対し、答案を採点する中で問題作成者が用意した正答以外にも正答とすべき答案が見つかる場合がある。その場合に、問題作成者またはオペレータなどの人手で答案を評価し、正答とすべき答案について正答とする旨のユーザ操作を行う。ユーザ操作を受けた文字認識装置100(例えば、オペレータ修正対応部188)が、正答に指定された答案を正答のバリエーションとして登録するようにしてもよい。
但し、文字認識装置100が答案の文字認識までを行い採点は行わない場合、正答の登録は不要であるとしてもよい。
分析処理部181がさらに、必要に応じて文字認識結果を各種データに反映させるようにしてもよい。
ステップS322の後、文字認識装置100は図13の処理を終了する。
分析処理部181が、教科書単語データ、関連性単語データ、類似単語データ、誤読単語データ、および、想定答案データのうち少なくとも一部について、重複する単語を削除するようにしてもよい。例えば、分析処理部181が、単語毎に固有の単語番号を付して同一データ中で重複する単語を検出し、重複する単語のうち1つのみを残して他を削除するようにしてもよい。
あるいは、オペレータ等の人手で重複する単語を検出して削除するようにしてもよい。
図14は、文字認識装置100が行う処理とデータとの関係の、もう1つの例を示す図である。
図14を図3と比較すると、図14では、既存問題および対象問題が示されていない。それ以外の点では、図14は図3と同様である。
上述したように、分析処理部181が、答案セットに用いる検索キーワードを問題からでなく答案または正答から取得するようにしてもよい。この場合、分析処理部181は、対象問題についても問題からでなく答案または正答からキーワードを取得する。従って、この場合、既存問題および対象問題の何れにおいても問題は不要である。図14はこのことを示している。
なお、分析処理部181が対象答案からキーワードを取得して答案セットを選択する場合、文字認識処理で文字認識処理部187が幾つかの答案を文字認識した段階で、分析処理部181が対象答案からキーワードを取得するようにしてもよい。
ここで、答案のバリエーションの例について説明する。
例えば、「井伊直弼」が正答の問題で、以下の答案は、問題によっては正答のバリエーションとして登録される可能性がある。
・旧字体の記載:例えば「弼」を旧字体で記載した答案
・同一人物の別名などを記載した答案:「井伊鉄三郎」、「井伊の赤鬼」など
・ひらがなまたはカタカナの記載:「いいなおすけ」、「イイナオスケ」など
これらが正答のバリエーションとして登録されることで、文字認識装置100は、これらを正答と判定して処理することができる。
一方、誤答となる答案の例として、以下のような例が挙げられる。
・同音異字の漢字誤り:「伊井直弼」、「井伊直輔」など
・形が似た漢字の誤り:「丼伊直弼」、「井伊真弼」など
・存在しない漢字を記載した答案:「弼」を「弓耳弓」と記載した答案など
・別人の名前を記載した答案:「水野忠邦」など
・判読不可能な文字を記載した答案:「井伊直▲」(「▲」には、実際には判読困難な文字が記入されている)
・無関係なことを記載した答案:「あいうえお」など
文字認識結果の文字列として、以下のような例が挙げられる。
・正答を正しく文字認識した場合:「井伊直弼」など
・誤答を正しく文字認識した場合:「井伊直輔」など
・誤答を誤って正答と文字認識した場合:「井伊直弼」など
・正答を誤って誤答と文字認識した場合:「丼伊直弼」など
・文字認識不能と判定した場合:「井伊直?」など
また、オペレータによる修正後の文字認識結果として、以下の例が挙げられる。
正しい文字認識結果(正読100%)の文字列:「井伊直弼」など
判読困難な文字:「井伊直▲」など
以上のように、キーワード抽出部182は、既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出する。対応付け処理部183は、1つ以上の検索キーワードと、既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットを生成する。選択処理部184は、文字認識対象の答案である1つ以上の対象答案、対象答案の元となった問題である対象問題、および、対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、答案セットのうち1つ以上の答案セットを選択する。文字認識処理部187は、選択された答案セットに含まれる既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、対象答案の文字認識を行う。
これにより、文字認識装置100では、記述式の問題の解答を文字認識する場合に、蓄積された既存問題に関する情報を有効活用できる。
例えば、文字認識装置100が、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて対象答案の文字認識を行う場合、既存の問題に対する正答の答案から抽出した単語だけでなく誤答の答案から抽出した単語も辞書として用いて、文字認識対象の答案を文字認識することができる。
ここで、採点の前段階として記述式の問題の解答を文字認識する場合、全ての解答を採点の対象とするために、解答が正答であるか誤答であるかにかかわらず全ての解答を正しく文字認識できることが望ましい。また、設問に対する解答の傾向を分析する場合など、正答だけでなく、誤答についても正しく文字認識できることは意義がある。従って、正答である解答だけでなく誤答である解答についても正しく文字認識できることが望ましい。
文字認識装置100によれば、既存の問題の正答だけでなく誤答も利用することができ、正答である解答だけでなく誤答である解答についても正しく文字認識できることが期待される。
いわば、文字認識装置100では、過去の試験における問題文に対する実際の解答文(さらに、正答文も用いてもよい)を略統計的に処理することで、新規の試験における問題文に対する解答文を予測することができる。文字認識装置100は、予測された解答文を用いることで、新規の試験における実際の解答文を、より高精度に文字認識することができる。
また、文字認識装置100によれば対象問題の分野を特定するといった処理を行う必要がない。この点で文字認識装置100の負荷が軽くて済む。あるいは、対象分野を特定する処理を人手で行うことを想定した場合、この処理を行う作業者の負荷が軽くて済む。また、文字認識装置100は、複数の分野にまたがる対象問題を扱うことができる。
また、想定答案生成部185は、対象問題に対する正答と、選択された答案セットに含まれる既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とを用いて、対象答案に対する1つ以上の想定答案を生成する。文字認識処理部187は、想定答案に基づいて対象答案の文字認識を行う。
文字認識装置100によれば、文字認識対象の答案を予想した想定答案を辞書として用いて文字認識を行うことができる。文字認識装置100によればこの点で、高精度に文字認識を行うことができる。
また、制御部180は、対象答案に対する文字認識結果の文字列に、確からしさが所定のしきい値よりも低い文字が含まれる場合、その文字に対する注意喚起を促す処理を行う。
これにより、文字認識装置100では、解答者が正答の漢字を思い出せずに存在するか否かに関わらずそれらしい字を記入したような場合に、誤答と判定すべきところを正答と判定する採点誤りを防止または低減できる。
なお、文字認識処理部187が、文字認識結果について想定答案データへの登録の有無を示すようにしてもよい。例えば、オペレータ等の人手で、あるいは自動的に、文字認識結果の想定答案データへの登録状況を参照し、登録すべきと思われる単語等を想定答案データに登録するようにしてもよい。
なお、文字認識装置100が、教科書単語データ、関連性単語データ、類似単語データ、類似文字データ、誤読単語データおよび誤読文字データを用いるタイミングは、準備処理または前処理のタイミングに限定されない。例えば、文字認識処理部187が、文字認識処理の際に、類似単語データ等を参照して、想定答案データに登録さている単語(想定答案)を拡張するようにしてもよい。
文字認識装置100は、上述したように正答がある問題に用いることができるが、これに限定されない。例えば、文字認識100を小論文などの自由記述文章問題に用いてもよい。この場合、例えば小論文のテーマによってよく用いられる単語等に辞書データを用意することができ、文字認識を比較的高精度に行えることが期待される。
次に、図15〜17を参照して、本発明の実施形態の構成について説明する。
図15は、実施形態に係る文字認識装置の構成の例を示す図である。図15に示す文字認識装置10は、キーワード抽出部11と、対応付け処理部12と、選択処理部13と、文字認識処理部14とを備える。
かかる構成で、キーワード抽出部11は、既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出する。対応付け処理部12は、1つ以上の検索キーワードと、既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットを生成する。選択処理部13は、文字認識対象の答案である1つ以上の対象答案、対象答案の元となった問題である対象問題、および、対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、答案セットのうち1つ以上の答案セットを選択する。文字認識処理部14は、選択された答案セットに含まれる既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れか1つ以上の答案の少なくとも一部分を用いて、対象答案の文字認識を行う。
これにより、文字認識装置10では、記述式の問題の解答を文字認識する場合に、蓄積された既存問題に関する情報を有効活用できる。
例えば、文字認識装置10が、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて対象答案の文字認識を行う場合、既存の問題に対する正答の答案から抽出した単語だけでなく誤答の答案から抽出した単語も辞書として用いて、文字認識対象の答案を文字認識することができる。
ここで、採点の前段階として記述式の問題の解答を文字認識する場合、全ての解答を採点の対象とするために、解答が正答であるか誤答であるかにかかわらず全ての解答を正しく文字認識できることが望ましい。また、設問に対する解答の傾向を分析する場合など、正答だけでなく、誤答についても正しく文字認識できることは意義がある。従って、正答である解答だけでなく誤答である解答についても正しく文字認識できることが望ましい。
文字認識装置10によれば、既存の問題の正答だけでなく誤答も利用することができ、正答である解答だけでなく誤答である解答についても正しく文字認識できることが期待される。
いわば、文字認識装置10では、過去の試験における問題文に対する実際の解答文(さらに、正答文も用いてもよい)を略統計的に処理することで、新規の試験における問題文に対する解答文を予測することができる。文字認識装置10は、予測された解答文を用いることで、新規の試験における実際の解答文を、より高精度に文字認識することができる。
また、文字認識装置10によれば対象問題の分野を特定するといった処理を行う必要がない。この点で文字認識装置10の負荷が軽くて済む。また、文字認識装置10は、複数の分野にまたがる対象問題を扱うことができる。
図16は、実施形態に係る文字認識装置の、もう1つの構成の例を示す図である。図16に示す文字認識装置20は、選択処理部21と、文字認識処理部22とを備える。
かかる構成で、選択処理部21は、既存の問題、前記既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかから抽出された1つ以上の検索キーワードと、既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットのうち1つ以上の答案セットを、文字認識対象の答案である1つ以上の対象答案、対象答案の元となった問題である対象問題、および、対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて選択する。文字認識処理部22は、選択された答案セットに含まれる既存の問題、既存の問題に対する1つ以上の正答、および、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、対象答案の文字認識を行う。
これにより、文字認識装置20では、記述式の問題の解答を文字認識する場合に、蓄積された既存問題に関する情報を有効活用できる。
例えば、文字認識装置20が、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて対象答案の文字認識を行う場合、既存の問題に対する正答の答案から抽出した単語だけでなく誤答の答案から抽出した単語も辞書として用いて、文字認識対象の答案を文字認識することができる。
ここで、採点の前段階として記述式の問題の解答を文字認識する場合、全ての解答を採点の対象とするために、解答が正答であるか誤答であるかにかかわらず全ての解答を正しく文字認識できることが望ましい。また、設問に対する解答の傾向を分析する場合など、正答だけでなく、誤答についても正しく文字認識できることは意義がある。従って、正答である解答だけでなく誤答である解答についても正しく文字認識できることが望ましい。
文字認識装置20によれば、既存の問題の正答だけでなく誤答も利用することができ、正答である解答だけでなく誤答である解答についても正しく文字認識できることが期待される。
いわば、文字認識装置20では、過去の試験における問題文に対する実際の解答文(さらに、正答文も用いてもよい)を略統計的に処理することで、新規の試験における問題文に対する解答文を予測することができる。文字認識装置20は、予測された解答文を用いることで、新規の試験における実際の解答文を、より高精度に文字認識することができる。
また、文字認識装置20によれば対象問題の分野を特定するといった処理を行う必要がない。この点で文字認識装置20の負荷が軽くて済む。また、文字認識装置20は、複数の分野にまたがる対象問題を扱うことができる。
図17は、実施形態に係る文字認識方法における処理手順の例を示すフローチャートである。
図17の処理は、既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出する工程(ステップS11)と、1つ以上の前記検索キーワードと、前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットを生成する工程(ステップS12)と、文字認識対象の答案である1つ以上の対象答案、前記対象答案の元となった問題である対象問題、および、前記対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、前記答案セットのうち1つ以上の答案セットを選択する工程(ステップS13)と、選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、前記対象答案の文字認識を行う工程(ステップS14)と、を含む。
この文字認識方法では、記述式の問題の解答を文字認識する場合に、蓄積された既存問題に関する情報を有効活用できる。
例えば、この文字認識方法で、既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて対象答案の文字認識を行う場合、既存の問題に対する正答の答案から抽出した単語だけでなく誤答の答案から抽出した単語も辞書として用いて、文字認識対象の答案を文字認識することができる。
ここで、採点の前段階として記述式の問題の解答を文字認識する場合、全ての解答を採点の対象とするために、解答が正答であるか誤答であるかにかかわらず全ての解答を正しく文字認識できることが望ましい。また、設問に対する解答の傾向を分析する場合など、正答だけでなく、誤答についても正しく文字認識できることは意義がある。従って、正答である解答だけでなく誤答である解答についても正しく文字認識できることが望ましい。
この文字認識方法によれば、既存の問題の正答だけでなく誤答も利用することができ、正答である解答だけでなく誤答である解答についても正しく文字認識できることが期待される。
いわば、この文字認識方法では、過去の試験における問題文に対する実際の解答文(さらに、正答文も用いてもよい)を略統計的に処理することで、新規の試験における問題文に対する解答文を予測することができる。この文字認識方法では、予測された解答文を用いることで、新規の試験における実際の解答文を、より高精度に文字認識することができる。
また、この文字認識方法によれば対象問題の分野を特定するといった処理を行う必要がない。この点で文字認識方法を実行する装置の負荷が軽くて済む。また、この文字認識方法によれば、複数の分野にまたがる対象問題を扱うことができる。
図18は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
図18に示す構成で、コンピュータ700は、CPU(Central Processing Unit)710と、主記憶装置720と、補助記憶装置730と、インタフェース740とを備える。
上記の文字認識装置10および100のうち何れか1つ以上が、コンピュータ700に実装されてもよい。その場合、上述した各処理部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。また、CPU710は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置720に確保する。文字認識装置10または100と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。文字認識装置10または100のユーザインタフェースは、インタフェース740が表示デバイスを備えてデータ表示し、また、入力デバイスを備えてデータの入力を受け付けることで実行される。
文字認識装置10がコンピュータ700に実装される場合、キーワード抽出部11と、対応付け処理部12と、選択処理部13と、文字認識処理部14との動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
文字認識装置100がコンピュータ700に実装される場合、制御部180およびその各部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
また、CPU710は、プログラムに従って、記憶部160およびその各部に対応する記憶領域を主記憶装置720に確保する。通信部110が行う通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。表示部120の機能は、インタフェース740が表示デバイスを備えて各種画像を表示することで実行される。操作入力部130の機能は、インタフェース740が入力デバイスを備えてデータの入力を受け付けることで実行される。
なお、制御部180が行う処理の全部または一部を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
1 文字認識システム
10、20、100 文字認識装置
11、182 キーワード抽出部
12、183 対応付け処理部
13、21、184 選択処理部
14、22、187 文字認識処理部
110 通信部
120 表示部
130 操作入力部
160 記憶部
161 既存問題データ記憶部
162 対象問題データ記憶部
163 教科書単語データ記憶部
164 関連性単語データ記憶部
165 類似単語データ記憶部
166 類似文字データ記憶部
167 誤読単語データ記憶部
168 誤読文字データ記憶部
169 想定答案データ記憶部
180 制御部
181 分析処理部
185 想定答案生成部
186 データベース機能部
188 オペレータ修正対応部
200 スキャナ装置

Claims (6)

  1. 既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出するキーワード抽出部と、
    1つ以上の前記検索キーワードと、前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットを生成する対応付け処理部と、
    文字認識対象の答案である1つ以上の対象答案、前記対象答案の元となった問題である対象問題、および、前記対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、前記答案セットのうち1つ以上の答案セットを選択する選択処理部と、
    選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、前記対象答案の文字認識を行う文字認識処理部と、
    を備える文字認識装置。
  2. 前記対象問題に対する正答と、選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とに基づいて、前記対象答案に対する1つ以上の想定答案を生成する想定答案生成部
    を備え、
    前記文字認識処理部は、前記想定答案を用いて前記対象答案の文字認識を行う、
    請求項1に記載の文字認識装置。
  3. 前記対象答案に対する文字認識結果の文字列に、確からしさが所定のしきい値よりも低い文字が含まれる場合、その文字に対する注意喚起を促す処理を行う制御部
    を備える、請求項1または請求項2に記載の文字認識装置。
  4. 既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかから抽出された1つ以上の検索キーワードと、前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットのうち1つ以上の答案セットを、文字認識対象の答案である1つ以上の対象答案、前記対象答案の元となった問題である対象問題、および、前記対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて選択する選択処理部と、
    選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、前記対象答案の文字認識を行う文字認識処理部と、
    を備える文字認識装置。
  5. 既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出する工程と、
    1つ以上の前記検索キーワードと、前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットを生成する工程と、
    文字認識対象の答案である1つ以上の対象答案、前記対象答案の元となった問題である対象問題、および、前記対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、前記答案セットのうち1つ以上の答案セットを選択する工程と、
    選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、前記対象答案の文字認識を行う工程と、
    を含む文字認識方法。
  6. コンピュータに、
    既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかから検索キーワードを抽出する工程と、
    1つ以上の前記検索キーワードと、前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分とが対応付けられた答案セットを生成する工程と、
    文字認識対象の答案である1つ以上の対象答案、前記対象答案の元となった問題である対象問題、および、前記対象問題に対する正答のうち少なくとも何れかに含まれるキーワードに基づいて、前記答案セットのうち1つ以上の答案セットを選択する工程と、
    選択された答案セットに含まれる前記既存の問題、前記既存の問題に対する1つ以上の正答、および、前記既存の問題に対する1つ以上の答案のうち少なくとも何れかの少なくとも一部分を用いて、前記対象答案の文字認識を行う工程と、
    を実行させるためのプログラム。
JP2019069024A 2019-03-29 2019-03-29 文字認識装置、文字認識方法およびプログラム Active JP7167821B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019069024A JP7167821B2 (ja) 2019-03-29 2019-03-29 文字認識装置、文字認識方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019069024A JP7167821B2 (ja) 2019-03-29 2019-03-29 文字認識装置、文字認識方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2020166770A true JP2020166770A (ja) 2020-10-08
JP7167821B2 JP7167821B2 (ja) 2022-11-09

Family

ID=72717514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019069024A Active JP7167821B2 (ja) 2019-03-29 2019-03-29 文字認識装置、文字認識方法およびプログラム

Country Status (1)

Country Link
JP (1) JP7167821B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023086037A (ja) * 2021-12-09 2023-06-21 株式会社ナスピア 文章解答問題自動採点システム及びその方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0757059A (ja) * 1993-08-16 1995-03-03 Matsushita Electric Ind Co Ltd 文字認識装置
JP2008090117A (ja) * 2006-10-04 2008-04-17 Nec Corp 学習システム、類似問題検索方法、プログラム
JP2013101501A (ja) * 2011-11-08 2013-05-23 Sharp Corp 照合装置、照合装置の制御方法、入力装置、試験システム、制御プログラム、および記録媒体
US20150302243A1 (en) * 2014-04-18 2015-10-22 Xerox Corporation Distance based binary classifier of handwritten words
JP2017068635A (ja) * 2015-09-30 2017-04-06 京セラドキュメントソリューションズ株式会社 選択肢問題作成装置
JP2018063600A (ja) * 2016-10-13 2018-04-19 株式会社東芝 情報処理装置、情報処理方法およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0757059A (ja) * 1993-08-16 1995-03-03 Matsushita Electric Ind Co Ltd 文字認識装置
JP2008090117A (ja) * 2006-10-04 2008-04-17 Nec Corp 学習システム、類似問題検索方法、プログラム
JP2013101501A (ja) * 2011-11-08 2013-05-23 Sharp Corp 照合装置、照合装置の制御方法、入力装置、試験システム、制御プログラム、および記録媒体
US20150302243A1 (en) * 2014-04-18 2015-10-22 Xerox Corporation Distance based binary classifier of handwritten words
JP2017068635A (ja) * 2015-09-30 2017-04-06 京セラドキュメントソリューションズ株式会社 選択肢問題作成装置
JP2018063600A (ja) * 2016-10-13 2018-04-19 株式会社東芝 情報処理装置、情報処理方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023086037A (ja) * 2021-12-09 2023-06-21 株式会社ナスピア 文章解答問題自動採点システム及びその方法
JP7387101B2 (ja) 2021-12-09 2023-11-28 株式会社ナスピア 文章解答問題自動採点システム及びその方法

Also Published As

Publication number Publication date
JP7167821B2 (ja) 2022-11-09

Similar Documents

Publication Publication Date Title
Kissos et al. OCR error correction using character correction and feature-based word classification
US6917709B2 (en) Automated search on cursive records not having an ASCII index
CN109582972B (zh) 一种基于自然语言识别的光学字符识别纠错方法
US6219453B1 (en) Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm
CN109800414B (zh) 语病修正推荐方法及系统
RU2251737C2 (ru) Способ автоматического определения языка распознаваемого текста при многоязычном распознавании
JP2973944B2 (ja) 文書処理装置および文書処理方法
US9575937B2 (en) Document analysis system, document analysis method, document analysis program and recording medium
JP5356197B2 (ja) 単語意味関係抽出装置
US6154579A (en) Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
CN111488466B (zh) 中文带标记错误语料生成方法、计算装置和存储介质
CN113435186B (zh) 中文文本纠错系统、方法、装置及计算机可读存储介质
CN111597908A (zh) 试卷批改方法和试卷批改装置
CN113168498A (zh) 语言校正系统及其方法以及系统中的语言校正模型学习方法
KR20160026892A (ko) 논팩토이드형 질의 응답 시스템 및 방법
CN109902223B (zh) 一种基于多模态信息特征的不良内容过滤方法
CN111737968A (zh) 一种作文自动批改及评分的方法及终端
CN109858626B (zh) 一种知识库构建方法及装置
CN110147546B (zh) 一种英语口语的语法校正方法及装置
Hong Degraded text recognition using visual and linguistic context
Sultan et al. A joint model for answer sentence ranking and answer extraction
CN116127015A (zh) 基于人工智能自适应的nlp大模型分析系统
JP7167821B2 (ja) 文字認識装置、文字認識方法およびプログラム
Das et al. A cost efficient approach to correct OCR errors in large document collections
CN116521837A (zh) 基于上下文语义检索的图谱问答方法、系统与计算机可读介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211018

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220705

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220705

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20220713

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221010

R151 Written notification of patent or utility model registration

Ref document number: 7167821

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151