JP7338203B2

JP7338203B2 - 文字認識装置及びプログラム

Info

Publication number: JP7338203B2
Application number: JP2019068277A
Authority: JP
Inventors: 裕介鈴木
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2019-03-29
Filing date: 2019-03-29
Publication date: 2023-09-05
Anticipated expiration: 2039-03-29
Also published as: JP2020166722A; US20200311493A1; US11568659B2

Description

本発明は、文字認識装置及びプログラムに関する。

記入媒体に記入された、記入者の識別情報を含む文字が読み取られた画像データを取得する取得手段と、取得された画像データに基づいて、文字を文字認識する認識手段と、文字認識された文字に含まれる記入者の識別情報に誤りがあるか否かを判定する判定手段と、文字認識された記入者の識別情報に誤りがない場合は、文字認識された文字を認識結果リストに登録する一方、文字認識された記入者の識別情報に誤りがある場合は、記入媒体に記入する複数の記入者の識別情報を含む複数の記入者情報が予め登録された記入者リストにおいて、取得された画像データにおける文字に類似する記入者情報に基づいて、文字認識された文字を変更して認識結果リストに登録する情報処理手段とを含み、判定手段は、文字認識された記入者の識別情報が、予め設定された範囲に含まれているか否かを判定し、識別情報が範囲に含まれていない場合に、記入者の識別情報に誤りがあると判定する情報処理システムは、知られている（例えば、特許文献１参照）。

特開２０１５－１３８４５８号公報

文字列画像の文字認識を行う際に、予め文字列画像の文字列体系を設定し、設定された範囲内で文字認識を行う技術がある。ところで、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像の文字認識を行うことが必要となる場合がある。そのような場合においては、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておくことが考えられるが、範囲が広範となるため高精度で文字認識を行うことができない。

本発明の目的は、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておく構成よりも、高精度で文字認識を行うことにある。

請求項１に記載の発明は、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、前記文字列画像の第１の文字認識を行い、当該第１の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第２の文字認識を行う文字認識手段とを備えたことを特徴とする文字認識装置である。
請求項２に記載の発明は、前記複数の文字列体系の各文字列体系の特徴及び当該各文字列体系に設定された前記文字認識の結果の範囲は、当該各文字列体系に従って記述される文字列が表す対象の属性に関連付けられており、前記文字認識手段は、前記第１の文字認識の結果が前記特定の文字列体系の特徴を満たす場合に、当該特徴が関連付けられた属性を特定し、当該属性に関連付けられた前記文字認識の結果の範囲を、当該特定の文字列体系に設定された前記文字認識の結果の範囲として特定することを特徴とする請求項１に記載の文字認識装置である。
請求項３に記載の発明は、前記属性は、前記複数の文字列体系の各文字列体系に従って記述される文字列が表す対象が所属する分類であることを特徴とする請求項２に記載の文字認識装置である。
請求項４に記載の発明は、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、前記文字列画像の第１の文字認識を行い、当該第１の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系の特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第２の文字認識を行う文字認識手段とを備え、前記特定の文字列体系の特徴は、当該特定の文字列体系に従って記述される文字列に関する規則であることを特徴とする文字認識装置である。
請求項５に記載の発明は、前記文字列に関する規則は、当該文字列の予め定められた位置における文字が予め定められた文字の何れかであるという規則であることを特徴とする請求項４に記載の文字認識装置である。
請求項６に記載の発明は、前記文字列に関する規則は、当該文字列が予め定められた個数の文字を含むという規則であることを特徴とする請求項４に記載の文字認識装置である。
請求項７に記載の発明は、前記文字列に関する規則は、当該文字列が予め定められた文字の何れかを含む又は含まないという規則であることを特徴とする請求項４に記載の文字認識装置である。
請求項８に記載の発明は、コンピュータに、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する機能と、前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する機能と、前記文字列画像の第１の文字認識を行い、当該第１の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第２の文字認識を行う機能とを実現させるためのプログラムである。

請求項１の発明によれば、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておく構成よりも、高精度で文字認識を行うことができる。
請求項２の発明によれば、各文字列体系の特徴及び各文字列体系に設定された文字認識の結果の範囲を、各文字列体系に従って記述される文字列が表す対象の属性ごとに管理することができる。
請求項３の発明によれば、各文字列体系の特徴及び各文字列体系に設定された文字認識の結果の範囲を、各文字列体系に従って記述される文字列が表す対象が所属する分類ごとに管理することができる。
請求項４の発明によれば、文字列画像の文字認識の結果が文字列に関する規則を満たすことにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項５の発明によれば、文字列画像の文字認識の結果の予め定められた位置における文字が予め定められた文字の何れかであることにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項６の発明によれば、文字列画像の文字認識の結果が予め定められた個数の文字を含むことにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項７の発明によれば、文字列画像の文字認識の結果が予め定められた文字の何れかを含むこと又は含まないことにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項８の発明によれば、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておく構成よりも、高精度で文字認識を行うことができる。

本発明の実施の形態における授業支援システムの全体構成例を示した図である。本発明の実施の形態における画像読取装置のハードウェア構成例を示した図である。本発明の実施の形態における授業支援装置のハードウェア構成例を示した図である。本発明の実施の形態における授業支援システムで用いられる答案用紙の例を示した図である。本発明の実施の形態における授業支援装置の第１の実施例を示した模式図である。本発明の実施の形態における授業支援装置の第２の実施例を示した模式図である。本発明の実施の形態における授業支援装置の第３の実施例を示した模式図である。本発明の実施の形態における授業支援装置の第４の実施例を示した模式図である。本発明の実施の形態における授業支援装置の機能構成例を示したブロック図である。本発明の実施の形態における授業支援装置に記憶される設定情報の具体例を示した図である。本発明の実施の形態における授業支援装置の動作例を示したフローチャートである。

以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。

［本実施の形態の背景及び概要］
文字列画像の文字認識を行う際に、予め文字列画像の文字列体系に応じて範囲を設定し、設定された範囲内で文字認識を行う技術がある。ここで文字列体系とは、文字列が記述されている規則のことである。これに限られるものではないが、例えば、文字列の文字数や、文字列のどの位置にどのような文字が入るか、といった規則を含む。

ところで、複数の文字列体系の何れかに従って記述された文字列画像の文字認識を行うことが必要となる場合がある。そのような場合においては、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておく方法が考えられる。ここで、文字列体系の範囲とは、文字列を構成する文字として使用され得る文字の候補であり、文字列を構成する各文字について設定される。複数の文字列体系の範囲を足し合わせた範囲とは、複数の文字列体系の範囲の和集合のことである。例えば、文字列の先頭の文字について、第１の文字列体系の範囲が「６」～「８」であり、第２の文字列体系の範囲が「０」、「８」、「９」であるとすると、これらの文字列体系の範囲を足し合わせた範囲は、「０」、「６」～「９」となる。また、第１の文字列体系の範囲が「０」～「９」であり、第２の文字列体系の範囲が「ａ」～「ｚ」であるとすると、これらの文字列体系の範囲を足し合わせた範囲は、「０」～「９」、「ａ」～「ｚ」となる。

しかしながら、このように複数の文字列体系の範囲を足し合わせた範囲を設定しておく方法では、文字列体系の範囲が広範となるため、高精度で文字認識を行うことができない。

そこで、本実施の形態は、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像の第１の文字認識を行い、第１の文字認識の結果が特定の文字列体系の特徴を満たす場合に、その特定の文字列体系に設定された文字認識の結果の範囲内で文字列画像の第２の文字認識を行う。つまり文字認識の結果の範囲とは、特定の文字列体系に設定された文字列体系の範囲と同義である。

また、本実施の形態は、各文字列体系の特徴及び各文字列体系に設定された文字認識の結果の範囲を、各文字列体系に従って記述される文字列が表す対象の属性に関連付けておく。そして、第１の文字認識の結果が特定の文字列体系の特徴を満たす場合に、その特徴が関連付けられた属性を特定し、その属性に関連付けられた文字認識の結果の範囲を、その特定の文字列体系に設定された文字認識の結果の範囲として特定するとよい。その場合、属性は、各文字列体系に従って記述される文字列が表す対象の性質であれば如何なるものでもよいが、例えば、各文字列体系に従って記述される文字列が表す対象が所属する分類が考えられる。

また、本実施の形態では、特定の文字列体系の特徴を、その特定の文字列体系に従って記述される文字列に関する規則の一部とするとよい。その場合、文字列に関する規則の一部としては、これに限られるものではないが、文字列の予め定められた位置における文字が予め定められた文字の何れかであるという第１の規則、文字列が予め定められた個数の文字を含むという第２の規則、文字列が予め定められた文字の何れかを含む又は含まないという第３の規則等が考えられる。

以下では、本実施の形態を学籍番号の文字認識に適用した場合について説明する。即ち、文字列体系として「学籍番号体系」を、文字列体系に従って記述される文字列として「学籍番号」を、文字列が表す対象として「学生」を、対象が所属する分類として「大学」を、それぞれ例にとって説明する。

［授業支援システムの全体構成］
図１は、本実施の形態が適用される授業支援システム１の全体構成例を示した図である。図示するように、この授業支援システム１は、画像読取装置１０と、授業支援装置３０と、授業管理サーバ５０ａ～５０ｄとが通信回線８０に接続されることにより構成されている。尚、図では、授業管理サーバ５０ａ～５０ｄを示したが、これらを区別する必要がない場合は、授業管理サーバ５０と称することもある。また、図には、４つの授業管理サーバ５０しか示していないが、２つ、３つ又は５つ以上の授業管理サーバ５０を設けてもよい。

画像読取装置１０は、紙等の記録媒体からの画像読取りを行う装置である。画像読取装置１０は、これに加えて、紙等の記録媒体への画像形成、公衆回線を介した画像送信及び画像受信等を行う装置であってもよい。画像読取りのみを行う観点からはスキャナであり、画像印刷のみを行う観点からはプリンタであり、画像読取り及び画像印刷を行う観点からはコピー機であり、画像読取り及び画像送信又は画像受信及び画像印刷を行う観点からはファクシミリである。本実施の形態において、画像読取装置１０は、特に、大学の学生に対して行ったテストの答案用紙を読み取る。

授業支援装置３０は、画像読取装置１０で読み取られた読取画像を用いて、大学における授業の支援を行うコンピュータ装置である。本実施の形態において、授業支援装置３０は、大学における授業の支援として、特に、答案用紙を読み取って得られた読取画像の文字認識を行い、その文字認識に基づく情報と読取画像とを大学に返却する処理を行う。本実施の形態では、文字認識装置の一例として、授業支援装置３０を設けている。

授業管理サーバ５０は、大学における授業の管理を行うサーバコンピュータである。本実施の形態では、特に、授業支援装置３０から返却された文字認識に基づく情報と読取画像とを受け付け、その処理を行う。ここで、授業管理サーバ５０ａはＡ大学に設置され、授業管理サーバ５０ｂはＢ大学に設置され、授業管理サーバ５０ｃはＣ大学に設置され、授業管理サーバ５０ｄはＤ大学に設置されていることを想定している。

通信回線８０は、画像読取装置１０と授業支援装置３０との間、及び、授業支援装置３０と授業管理サーバ５０との間の情報通信に用いられる通信手段である。通信回線８０としては、例えばＬＡＮ（Local Area Network）やインターネットを用いるとよい。

［画像読取装置のハードウェア構成］
図２は、本実施の形態における画像読取装置１０のハードウェア構成例を示した図である。図示するように、画像読取装置１０は、ＣＰＵ（Central Processing Unit）１１と、ＲＡＭ（Random Access Memory）１２と、ＲＯＭ（Read Only Memory）１３と、ＨＤＤ（Hard Disk Drive）１４と、操作パネル１５と、画像読取部１６と、画像形成部１７と、通信インターフェース（以下、「通信Ｉ／Ｆ」と表記する）１８とを備える。

ＣＰＵ１１は、ＲＯＭ１３等に記憶された各種プログラムをＲＡＭ１２にロードして実行することにより、後述する各機能を実現する。

ＲＡＭ１２は、ＣＰＵ１１の作業用メモリ等として用いられるメモリである。ＲＯＭ１３は、ＣＰＵ１１が実行する各種プログラム等を記憶するメモリである。ＨＤＤ１４は、画像読取部１６が読み取った画像データや画像形成部１７における画像形成にて用いる画像データ等を記憶する例えば磁気ディスク装置である。

操作パネル１５は、各種情報の表示やユーザからの操作入力の受付を行う例えばタッチパネルである。ここで、操作パネル１５は、各種情報が表示されるディスプレイと、指やスタイラスペン等の指示手段で指示された位置を検出する位置検出シートとからなる。或いは、タッチパネルに代えて、ディスプレイ及びキーボードを用いてもよい。

画像読取部１６は、紙等の記録媒体に記録された画像を読み取る。ここで、画像読取部１６は、例えばスキャナであり、光源から原稿に照射した光に対する反射光をレンズで縮小してＣＣＤ（Charge Coupled Devices）で受光するＣＣＤ方式や、ＬＥＤ光源から原稿に順に照射した光に対する反射光をＣＩＳ（Contact Image Sensor）で受光するＣＩＳ方式のものを用いるとよい。

画像形成部１７は、紙等の記録媒体に画像を形成する。ここで、画像形成部１７は、例えばプリンタであり、感光体に付着させたトナーを記録媒体に転写して像を形成する電子写真方式や、インクを記録媒体上に吐出して像を形成するインクジェット方式のものを用いるとよい。

通信Ｉ／Ｆ１８は、通信回線８０を介して他の装置、例えば授業支援装置３０との間で各種情報の送受信を行う。

［授業支援装置及び授業管理サーバのハードウェア構成］
図３は、本実施の形態における授業支援装置３０のハードウェア構成例を示した図である。図示するように、授業支援装置３０は、演算手段であるＣＰＵ３１と、記憶手段であるメインメモリ３２及びＨＤＤ（Hard Disk Drive）３３とを備える。ここで、ＣＰＵ３１は、ＯＳ（Operating System）やアプリケーション等の各種ソフトウェアを実行し、後述する各機能を実現する。また、メインメモリ３２は、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域であり、ＨＤＤ３３は、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。更に、授業支援装置３０は、外部との通信を行うための通信Ｉ／Ｆ３４と、ディスプレイ等の表示デバイス３５と、キーボードやマウス等の入力デバイス３６とを備える。

また、図３に示したハードウェア構成は、授業管理サーバ５０のハードウェア構成としても捉えられる。但し、授業管理サーバ５０について述べるときは、図３のＣＰＵ３１、メインメモリ３２、ＨＤＤ３３、通信Ｉ／Ｆ３４、表示デバイス３５、入力デバイス３６をそれぞれ、ＣＰＵ５１、メインメモリ５２、ＨＤＤ５３、通信Ｉ／Ｆ５４、表示デバイス５５、入力デバイス５６と表記するものとする。

［授業支援システムの背景及び概要］
例えば、近年では、複数の大学の学生が参加する合同セミナーという形態の講義が行われるようになっている。複数の大学は異なる学籍番号体系を持つため、このような講義で答案用紙に記入された学籍番号の文字認識を行う場合、予め複数の学籍番号体系の範囲を足し合わせた範囲を設定しておくことが考えられる。しかしながら、複数の学籍番号体系の範囲を足し合わせた範囲を設定することには多大な労力を要する。また、複数の学籍番号体系の範囲を足し合わせた範囲を設定したとしても、その範囲は広範となるので、高精度で文字認識を行うことができない。従って、答案用紙を人手により大学ごとに振り分けて、大学ごとにその大学の学籍番号体系で文字認識を行った方が効率的という結論になってしまう。

そこで、本実施の形態では、複数の学籍番号体系の何れかに従って記述された学籍番号の画像の第１の文字認識を行い、第１の文字認識の結果が特定の学籍番号体系の特徴を満たす場合に、その特定の学籍番号体系に設定された文字認識の結果の範囲内で学籍番号の画像の第２の文字認識を行う。

以下、異なる学籍番号体系を持つ複数の大学に所属する学生が同一の講義に参加した場面を想定して、授業支援システム１の概要を説明する。

図４は、このような講義のテストで用いられる答案用紙２０の例を示した図である。図示するように、答案用紙２０には、学籍番号を手書き入力するための学籍番号記入欄２１と、得点を手書き入力するための得点記入欄２２と、問題文及び解答欄を含む問題解答領域２３とが設けられている。この答案用紙２０が配布されると、この講義に参加した複数の大学の学生は、自身の大学における学籍番号を学籍番号記入欄２１に手書き入力し、問題に対する解答を問題解答領域２３の解答欄に手書き入力する。

次に、例えば講師は、この講義に参加した複数の大学の学生から答案用紙２０を回収して持ち帰り、問題解答領域２３の解答欄に手書き入力された解答に従って採点を行う。そして、採点結果である得点を得点記入欄２２に手書き入力する。

その後、例えば講師は、採点済みの答案用紙２０を画像読取装置１０で読み取る。すると、画像読取装置１０が、読取画像を授業支援装置３０へ転送する。

これにより、授業支援装置３０は、学籍番号記入欄２１から学籍番号の画像（以下、「学籍番号画像」という）を取得し、その一部の文字認識を行う。そして、その文字認識の結果と学籍番号体系の特徴との合致度に基づいて、学籍番号画像を、その学籍番号画像に対応する大学に振り分け、大学に事前に設定された範囲で学籍番号画像を文字認識する。一方で、授業支援装置３０は、得点記入欄２２から得点の画像（以下、「得点画像」という）を取得して文字認識し、得点の集計結果を各大学に伝える。

ここで、学籍番号体系の特徴は、学籍番号体系に従って記述される学籍番号に関する規則の一部とする。学籍番号に関する規則の一部としては、これに限られるものではないが、例えば、学籍番号の予め定められた位置における文字が予め定められた文字の何れかであるという規則、学籍番号が予め定められた個数の文字を含むという規則、学籍番号が予め定められた文字の何れかを含むという規則等が考えられる。

以下、学籍番号に関する規則の一部として1つ目の規則を採用した場合の例を第１の実施例として、学籍番号に関する規則の一部として２つ目の規則を採用した場合の例を第２の実施例として、学籍番号に関する規則の一部として３つ目の規則を採用した場合の２つの例を第３及び第４の実施例として説明する。尚、１つ目の規則は、前述した第１の規則の一例であり、２つ目の規則は、前述した第２の規則の一例であり、３つ目の規則は、前述した第３の規則の一例である。

（第１の実施例）
図５は、第１の実施例を示した模式図である。図では、授業支援装置３０が、表３１１に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表３１１には補足的に大学名も示している。

第１の実施例では、学籍番号体系の特徴として、学籍番号における特定の項目の文字位置を用いる。特定の項目は入学年度とし、入学年度は西暦の末尾２桁、具体的には「２０１６」の「１６」、「２０１７」の「１７」、「２０１８」の「１８」の何れかであるとする。そして、下線で示すように、Ａ大学の学籍番号における入学年度の文字位置は、先頭から４文字目及び５文字目とし、Ｂ大学の学籍番号における入学年度の文字位置は、先頭から２文字目及び３文字目とする。

すると、授業支援装置３０は、表３１２に示すように、先頭から４文字目及び５文字目の文字列が「１６」、「１７」、「１８」の何れかに類似すると判断された学籍番号画像をＡ大学に振り分ける。また、表３１３に示すように、先頭から４文字目及び５文字目の文字列が「１６」、「１７」、「１８」の何れにも類似しないと判断された学籍番号画像をＢ大学に振り分ける。

そして、授業支援装置３０は、表３１２に示した学籍番号画像を、Ａ大学に事前に設定された範囲で文字認識する。また、表３１３に示した学籍番号画像を、Ｂ大学に事前に設定された範囲で文字認識する。

その後、授業支援装置３０は、得点画像を文字認識し、Ａ大学について得点を集計した結果をＡ大学に、Ｂ大学について得点を集計した結果をＢ大学にそれぞれ伝える。

（第２の実施例）
図６は、第２の実施例を示した模式図である。図では、授業支援装置３０が、表３２１に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表３２１には補足的に大学名も示している。

第２の実施例では、学籍番号体系の特徴として、学籍番号の桁数を用いる。縦の破線及び下線で示すように、Ｃ大学の学籍番号の桁数は９桁とし、Ｂ大学の学籍番号の桁数は８桁とする。

すると、授業支援装置３０は、表３２２に示すように、桁数が９桁と判断された学籍番号画像をＣ大学に振り分ける。また、表３２３に示すように、桁数が９桁でないと判断された学籍番号画像をＢ大学に振り分ける。

そして、授業支援装置３０は、表３２２に示した学籍番号画像を、Ｃ大学に事前に設定された範囲で文字認識する。また、表３２３に示した学籍番号画像を、Ｂ大学に事前に設定された範囲で文字認識する。

その後、授業支援装置３０は、得点画像を文字認識し、Ｃ大学について得点を集計した結果をＣ大学に、Ｂ大学について得点を集計した結果をＢ大学にそれぞれ伝える。

（第３の実施例）
図７は、第３の実施例を示した模式図である。図では、授業支援装置３０が、表３３１に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表３３１には補足的に大学名も示している。

第３の実施例では、学籍番号体系の特徴として、学籍番号における特定の文字種の有無を用いる。特定の文字種としては、英小文字、英大文字、数字等が考えられるが、ここでは、英大文字とする。また、学籍番号の何れかの文字位置における特定の文字種の有無を特徴として用いてもよいが、ここでは、学籍番号の特定の文字位置における特定の文字種の有無を特徴として用いる。下線で示すように、Ａ大学の学籍番号は２文字目及び３文字目に英大文字を含むものとし、Ｂ大学の学籍番号は英大文字を含まないものとする。

すると、授業支援装置３０は、表３３２に示すように、２文字目及び３文字目に英大文字を含むと判断された学籍番号画像をＡ大学に振り分ける。また、表３３３に示すように、２文字目及び３文字目に英大文字を含まないと判断された学籍番号画像をＢ大学に振り分けている。

そして、授業支援装置３０は、表３３２に示した学籍番号画像を、Ａ大学に事前に設定された範囲で文字認識する。また、表３３３に示した学籍番号画像を、Ｂ大学に事前に設定された範囲で文字認識する。

（第４の実施例）
図８は、第４の実施例を示した模式図である。図では、授業支援装置３０が、表３４１に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表３４１には補足的に大学名も示している。

第４の実施例では、学籍番号体系の特徴として、学籍番号における特殊文字の有無を用いる。特殊文字としては、ハイフン（－）、アスタリスク（＊）等が考えられるが、ここでは、ハイフン（－）とする。また、学籍番号の何れかの文字位置における特殊文字の有無を特徴として用いてもよいが、ここでは、学籍番号の特定の文字位置における特殊文字の有無を特徴として用いる。下線で示すように、Ｄ大学の学籍番号は６文字目にハイフン（－）を含むものとし、Ｃ大学の学籍番号はハイフン（－）を含まないものとする。

すると、授業支援装置３０は、表３４２に示すように、６文字目にハイフン（－）を含むと判断された学籍番号画像をＤ大学に振り分ける。また、表３４３に示すように、６文字目にハイフン（－）を含まないと判断された学籍番号画像をＣ大学に振り分ける。

そして、授業支援装置３０は、表３４２に示した学籍番号画像を、Ｄ大学に事前に設定された範囲で文字認識する。また、表３４３に示した学籍番号画像を、Ｃ大学に事前に設定された範囲で文字認識する。

その後、授業支援装置３０は、得点画像を文字認識し、Ｄ大学について得点を集計した結果をＤ大学に、Ｃ大学について得点を集計した結果をＣ大学にそれぞれ伝える。

［授業支援装置の機能構成］
図９は、本実施の形態における授業支援装置３０の機能構成例を示したブロック図である。図示するように、本実施の形態における授業支援装置３０は、受信部４１と、画像抽出部４２と、設定情報記憶部４３と、設定情報取得部４４と、文字認識部４５と、集計処理部４６と、送信部４７とを備えている。

受信部４１は、画像読取装置１０から答案用紙２０を読み取ることにより得られた読取画像を受信し、その読取画像を画像抽出部４２に出力する。

画像抽出部４２は、受信部４１から受け取った読取画像上で、学籍番号記入欄２１に相当する領域及び得点記入欄２２に相当する領域を特定する。ここで、学籍番号記入欄２１に相当する領域の位置及び得点記入欄２２に相当する領域の位置を示す情報は、例えば、答案用紙２０の予め決められた箇所にコード化して印刷しておくとよい。そして、画像抽出部４２は、特定した学籍番号記入欄２１に相当する領域及び得点記入欄２２に相当する領域からそれぞれ学籍番号画像及び得点画像を切り出し、学籍番号画像及び得点画像を読取画像と共に文字認識部４５に出力する。本実施の形態では、文字列画像の一例として、学籍番号画像を用いており、文字列画像を取得する取得手段の一例として、画像抽出部４２を設けている。

設定情報記憶部４３は、大学ごとに、学籍番号における各文字位置の文字が割り当てられた項目を示す項目情報と、学籍番号における各文字位置の文字の範囲を示す範囲情報とからなる設定情報を記憶する。ここで、設定情報は、学籍番号における各文字の範囲、学籍番号の桁数、学籍番号における各文字の文字種、学籍番号における各文字が特殊文字である場合の特殊文字の種類等の特徴情報を含んでいると言うことができる。この設定情報の具体例については後述する。

設定情報取得部４４は、学籍番号画像及び得点画像を受け取った旨が文字認識部４５から通知されると、１回目の文字認識の対象とすべき学籍番号画像の文字位置と、設定情報記憶部４３に記憶された特徴情報とを文字認識部４５に出力する。ここで、第１の実施例では、文字位置は、特定の項目に割り当てられた文字位置であり、特徴情報は、その文字位置における文字の範囲の指定である。第２の実施例では、文字位置は、学籍番号の桁数を区別可能な文字位置であり、特徴情報は、その文字位置における文字の有無である。第３の実施例では、文字位置は、特定の文字種が存在する可能性がある文字位置であり、特徴情報は、その特定の文字種の種類である。第４の実施例では、特殊文字が存在する可能性がある文字位置であり、特徴情報は、その特殊文字の種類である。

これにより、設定情報取得部４４は、文字認識部４５から、学籍番号画像の指定した文字位置の画像と指定した特徴情報との合致度を取得する。ここで、第１の実施例では、合致度は、学籍番号画像の指定した文字位置の画像の文字認識結果と、指定した範囲内の文字との類似度である。指定した範囲内の文字が複数あれば、最も類似する文字との類似度を採用すればよい。指定した文字位置が複数の桁に渡っていれば、各桁における類似度から何らかの計算で求めた類似度を採用すればよい。第２の実施例では、合致度は、学籍番号画像の指定した文字位置に文字の画像が存在すると判定した際の信頼度である。例えば、桁数が８桁の学籍番号と桁数が９桁の学籍番号とを切り分ける場合であれば、学籍番号画像の９桁目が存在する確率である。第３の実施例では、合致度は、学籍番号の指定した文字位置の画像の文字認識結果と、指定した文字種の文字との類似度である。第４の実施例では、合致度は、学籍番号の指定した文字位置の画像の文字認識結果と、指定した種類の特殊文字との類似度である。

設定情報取得部４４は、文字認識部４５から取得した合致度が予め定めた閾値以上であるかどうかに基づいて、学籍番号画像に対応する大学を特定する。そして、その大学の大学名を文字認識部４５に出力する。尚、ここでは、大学名を出力するものとするが、大学を識別する情報であれば如何なる情報を出力してもよい。また、設定情報取得部４４は、その大学に対して設定された範囲情報を、２回目の文字認識で用いる文字の範囲を示す情報として、文字認識部４５に出力する。本実施の形態では、文字認識の結果の範囲の一例として、範囲情報が表す範囲を用いており、文字認識の結果の範囲を特定する特定手段の一例として、設定情報取得部４４を設けている。

文字認識部４５は、画像抽出部４２から学籍番号画像及び得点画像を受け取ると、その旨を設定情報取得部４４に通知する。これにより設定情報取得部４４から文字位置及び特徴情報を受け取ると、文字認識部４５は、学籍番号画像のその文字位置の画像を認識する第１の文字認識を行い、第１の文字認識の結果と受け取った特徴情報との合致度を算出する。そして、合致度を設定情報取得部４４に出力する。本実施の形態では、文字列画像の第１の文字認識を行う文字認識手段の一例として、文字認識部４５を設けている。

これにより設定情報取得部４４から大学名を受け取ると、画像抽出部４２から受け取った読取画像にその大学名を付加する。つまり、読取画像を大学ごとに振り分ける。また、設定情報取得部４４から範囲情報を受け取ると、画像抽出部４２から受け取った学籍番号画像をその範囲情報が示す範囲で認識する第２の文字認識を行う。本実施の形態では、特定の文字列体系に設定された文字認識の結果の範囲内で文字列画像の第２の文字認識を行う文字認識手段の一例として、文字認識部４５を設けている。

更に、文字認識部４５は、画像抽出部４２から受け取った得点画像を文字認識して学籍番号ごとの得点を取得する。そして、学籍番号ごとの得点と読取画像とを、大学ごとに集計処理部４６に出力する。

集計処理部４６は、学籍番号ごとの得点と読取画像とを、大学ごとに文字認識部４５から受け取ると、大学ごとに得点を集計する。そして、大学ごとに、得点の集計結果と読取画像とを送信部４７に出力する。

送信部４７は、大学ごとに、得点の集計結果と読取画像とを、その大学の授業管理サーバ５０へ送信する。

図１０は、設定情報記憶部４３に記憶された設定情報の具体例を示した図である。図示するように、設定情報は、大学ごとに、その大学の大学名に対して、その大学の学籍番号体系の情報を設定したものとなっている。

学籍番号は、入学年度、学生種別、学科種別、個人番号等の情報をコード化したものであることが多い。従って、学籍番号体系の情報は、学籍番号の文字位置ごとにその文字位置における文字が割り当てられた入学年度、学生種別、学科種別、個人番号等の項目を示す項目情報を含んでいる。

入学年度としては、Ａ大学、Ｂ大学、Ｄ大学のように、西暦の末尾２桁で表したものや、Ｃ大学のように、元号を表すアルファベット１文字と年を表す数字２桁とで表したものが考えられる。学生種別としては、学部、大学院等をコード化したもので、Ａ大学、Ｂ大学のように数字で表したものや、Ｃ大学、Ｄ大学のように英文字で表したものが考えられる。学科種別としては、○○学科、○○専攻等をコード化したもので、Ｂ大学、Ｄ大学のように数字で表したものや、Ａ大学、Ｃ大学のように英文字で表したものが考えられる。個人番号としては、個人ごとに設定される通し番号が考えられる。従って、学籍番号体系の情報は、学籍番号の文字位置ごとにその文字位置における文字の範囲を示す項目情報を含んでいる。

ここで、図１０の設定情報は、第１の実施例では、特定の項目に割り当てられた文字位置における文字の範囲を特徴情報として含んでいると言うことができる。第２の実施例では、学籍番号の桁数を区別可能な文字位置における文字の有無を特徴情報として含んでいると言うことができる。第３の実施例では、特定の文字種が存在する可能性がある文字位置におけるその特定の文字種の種類を特徴情報として含んでいると言うことができる。第４の実施例では、特殊文字が存在する可能性がある文字位置におけるその特殊文字の種類を特徴情報として含んでいると言うことができる。

尚、ここでは、大学名と項目情報と範囲情報とを１つのテーブルで関連付けているが、大学名と項目情報とを関連付けるテーブルと、大学名と範囲情報とを関連付けるテーブルとを分けてもよい。また、大学を識別する情報として大学名を用いたが、大学コード等の情報であってもよい。

［授業支援装置の動作］
図１１は、本実施の形態における授業支援装置３０の動作例を示したフローチャートである。図１０では、４つの大学に対する設定情報を示したが、ここでは、２つの大学（「第１の大学」、「第２の大学」と称する）の学籍番号を区別する動作例を示す。この動作例に先立ち、設定情報取得部４４が、設定情報記憶部４３から第１の大学の学籍番号の特徴を示す特徴情報を取得し、文字認識部４５にこの特徴情報を与えておくものとする。例えば、第１の実施例では、第１の大学をＡ大学とし、特徴情報を、先頭から４文字目が「１」で、先頭から５文字目が「６」、「７」、「８」の何れかであるという情報とする。第２の実施例では、第１の大学をＣ大学とし、特徴情報を、先頭から９文字目が存在するという情報とする。第３の実施例では、第１の大学をＡ大学とし、特徴情報を、先頭から２文字目及び３文字目が英文字であるという情報とする。第４の実施例では、第１の大学をＤ大学とし、特徴情報を、先頭から６文字目がハイフン（－）であるという情報とする。

この状態で、まず、受信部４１は、画像読取装置１０から読取画像を受信する（ステップ４０１）。

次に、画像抽出部４２は、ステップ４０１で受信された読取画像から、学籍番号画像及び得点画像を切り出す（ステップ４０２）。

次いで、文字認識部４５は、ステップ４０２で切り出された学籍番号画像のうち設定情報取得部４４により事前に指定された文字位置の画像と、設定情報取得部４４により事前に指定された特徴情報との合致度を算出する（ステップ４０３）。例えば、第１の実施例では、合致度は、先頭から４文字目及び５文字目の画像と「１６」、「１７」、「１８」のうち最も類似するものとの類似度である。この類似度は、先頭から４文字目の画像と「１」との類似度と、先頭から５文字目の画像と「６」、「７」、「８」のうち最も類似するものとの類似度とから計算によって算出すればよい。第２の実施例では、合致度は、先頭から９文字目の画像が存在するという判定の信頼度である。第３の実施例では、合致度は、先頭から２文字目及び３文字目の画像と英文字との類似度である。この類似度は、先頭から２文字目の画像と全ての英文字のうち最も類似するものとの類似度と、先頭から３文字目の画像と全ての英文字のうち最も類似するものとの類似度とから計算によって算出すればよい。第４の実施例では、合致度は、先頭から６文字目の画像とハイフン（－）との類似度である。

これにより、設定情報取得部４４は、ステップ４０３で算出された合致度が、予め定められた閾値以上であるかどうかを判定する（ステップ４０４）。

ステップ４０４で合致度が閾値以上であると判定した場合、設定情報取得部４４は、ステップ４０１で受信された読取画像に第１の大学の大学名を付与する（ステップ４０５）。尚、ここでは大学名を付与するが、大学を識別するための情報であれば、如何なる情報を付与してもよい。そして、設定情報取得部４４は、設定情報記憶部４３から第１の大学に設定された範囲情報を取得する（ステップ４０６）。

一方、ステップ４０４で合致度が閾値未満であると判定した場合、設定情報取得部４４は、ステップ４０１で受信された読取画像に第２の大学の大学名を付与する（ステップ４０７）。尚、ここでは大学名を付与するが、大学を識別するための情報であれば、如何なる情報を付与してもよい。そして、設定情報取得部４４は、設定情報記憶部４３から第２の大学に設定された範囲情報を取得する（ステップ４０８）。

これにより、文字認識部４５は、ステップ４０６又はステップ４０８で取得された範囲情報が示す範囲で、ステップ４０２で切り出された学籍番号画像を文字認識する（ステップ４０９）。

また、文字認識部４５は、ステップ４０２で切り出された得点画像を文字認識する（ステップ４１０）。

その後、文字認識部４５は、画像読取装置１０で読み取られた読取画像がまだあるかどうかを判定する（ステップ４１１）。例えば、画像読取装置１０で全ての学生の答案用紙２０が読み取られた場合に、その旨の情報が受信部４１、画像抽出部４２を介して文字認識部４５に伝わるようにし、文字認識部４５はこの情報に基づいて読取画像がまだあるかどうかを判定すればよい。

ステップ４１１で読取画像がまだあると判定されれば、処理はステップ４０１へ戻り、ステップ４１１で読取画像がまだあると判定されなければ、集計処理部４６が、ステップ４０５又はステップ４０７で付与された大学名に基づいて、大学ごとに、ステップ４１０の文字認識で得られた得点を集計する（ステップ４１２）。

そして、ステップ４０５又はステップ４０７で付与された大学名に基づいて、大学ごとに、ステップ４０１で受信された読取画像と、ステップ４１２での得点の集計結果とを、その大学の授業管理サーバ５０へ送信する（ステップ４１３）。

尚、この動作例では、２つの大学の学籍番号を区別することとしたが、これには限らない。一般的には、複数の大学の学籍番号を区別することが必要となる場合がある。そのような場合は、この動作例を、複数の大学の学籍番号から１つの大学の学籍番号を区別する動作例として、複数回繰り返せばよい。

例えば、図１０に示したＡ大学～Ｄ大学の設定情報が記憶されている場合には、次のような動作を行えばよい。即ち、まず、第３の実施例の動作を行って、Ａ大学～Ｄ大学からＡ大学を区別する。次に、第２の実施例の動作を行って、残ったＢ大学～Ｄ大学からＢ大学を区別する。そして最後に、第４の実施例の動作を行って、残ったＣ大学及びＤ大学をＣ大学とＤ大学とに区別する。

また、上記では、本実施の形態を学籍番号の文字認識に適用した場合を例にとったが、本実施の形態は、複数の文字列体系が考えられる他の文字列の文字認識に適用してもよい。そのような例としては、複数のメーカで製造された製品の製造番号の体系がメーカごとに異なる場合に、メーカごとの製造番号を区別して文字認識する場合等がある。

［プログラム］
本実施の形態における授業支援装置３０が行う処理は、例えば、アプリケーションソフトウェア等のプログラムとして用意される。

即ち、本実施の形態を実現するプログラムは、コンピュータに、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する機能と、複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する機能と、文字列画像の第１の文字認識を行い、第１の文字認識の結果が複数の文字列体系のうち、特定の文字列体系の特徴を満たす場合に、特定の文字列体系に設定された文字認識の結果の範囲内で文字列画像の第２の文字認識を行う機能とを実現させるためのプログラムとして捉えられる。

尚、本実施の形態を実現するプログラムは、通信手段により提供することはもちろん、ＣＤ－ＲＯＭ等の記録媒体に格納して提供することも可能である。

１…授業支援システム、１０…画像読取装置、３０…授業支援装置、４１…受信部、４２…画像抽出部、４３…設定情報記憶部、４４…設定情報取得部、４５…文字認識部、４６…集計処理部、４７…送信部、５０ａ，５０ｂ，５０ｃ，５０ｄ…授業管理サーバ

Claims

複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、
前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、
前記文字列画像の第１の文字認識を行い、当該第１の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第２の文字認識を行う文字認識手段と
を備えたことを特徴とする文字認識装置。
前記複数の文字列体系の各文字列体系の特徴及び当該各文字列体系に設定された前記文字認識の結果の範囲は、当該各文字列体系に従って記述される文字列が表す対象の属性に関連付けられており、
前記文字認識手段は、前記第１の文字認識の結果が前記特定の文字列体系の特徴を満たす場合に、当該特徴が関連付けられた属性を特定し、当該属性に関連付けられた前記文字認識の結果の範囲を、当該特定の文字列体系に設定された前記文字認識の結果の範囲として特定することを特徴とする請求項１に記載の文字認識装置。
前記属性は、前記複数の文字列体系の各文字列体系に従って記述される文字列が表す対象が所属する分類であることを特徴とする請求項２に記載の文字認識装置。
複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、
前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、
前記文字列画像の第１の文字認識を行い、当該第１の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系の特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第２の文字認識を行う文字認識手段と
を備え、
前記特定の文字列体系の特徴は、当該特定の文字列体系に従って記述される文字列に関する規則であることを特徴とする文字認識装置。
前記文字列に関する規則は、当該文字列の予め定められた位置における文字が予め定められた文字の何れかであるという規則であることを特徴とする請求項４に記載の文字認識装置。
前記文字列に関する規則は、当該文字列が予め定められた個数の文字を含むという規則であることを特徴とする請求項４に記載の文字認識装置。
前記文字列に関する規則は、当該文字列が予め定められた文字の何れかを含む又は含まないという規則であることを特徴とする請求項４に記載の文字認識装置。
コンピュータに、
複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する機能と、
前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する機能と、
前記文字列画像の第１の文字認識を行い、当該第１の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第２の文字認識を行う機能と
を実現させるためのプログラム。