JP7338203B2 - 文字認識装置及びプログラム - Google Patents
文字認識装置及びプログラム Download PDFInfo
- Publication number
- JP7338203B2 JP7338203B2 JP2019068277A JP2019068277A JP7338203B2 JP 7338203 B2 JP7338203 B2 JP 7338203B2 JP 2019068277 A JP2019068277 A JP 2019068277A JP 2019068277 A JP2019068277 A JP 2019068277A JP 7338203 B2 JP7338203 B2 JP 7338203B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- image
- character recognition
- student
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/24765—Rule-based classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/196—Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
- G06V30/1983—Syntactic or structural pattern recognition, e.g. symbolic string recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
Description
請求項2に記載の発明は、前記複数の文字列体系の各文字列体系の特徴及び当該各文字列体系に設定された前記文字認識の結果の範囲は、当該各文字列体系に従って記述される文字列が表す対象の属性に関連付けられており、前記文字認識手段は、前記第1の文字認識の結果が前記特定の文字列体系の特徴を満たす場合に、当該特徴が関連付けられた属性を特定し、当該属性に関連付けられた前記文字認識の結果の範囲を、当該特定の文字列体系に設定された前記文字認識の結果の範囲として特定することを特徴とする請求項1に記載の文字認識装置である。
請求項3に記載の発明は、前記属性は、前記複数の文字列体系の各文字列体系に従って記述される文字列が表す対象が所属する分類であることを特徴とする請求項2に記載の文字認識装置である。
請求項4に記載の発明は、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系の特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う文字認識手段とを備え、前記特定の文字列体系の特徴は、当該特定の文字列体系に従って記述される文字列に関する規則であることを特徴とする文字認識装置である。
請求項5に記載の発明は、前記文字列に関する規則は、当該文字列の予め定められた位置における文字が予め定められた文字の何れかであるという規則であることを特徴とする請求項4に記載の文字認識装置である。
請求項6に記載の発明は、前記文字列に関する規則は、当該文字列が予め定められた個数の文字を含むという規則であることを特徴とする請求項4に記載の文字認識装置である。
請求項7に記載の発明は、前記文字列に関する規則は、当該文字列が予め定められた文字の何れかを含む又は含まないという規則であることを特徴とする請求項4に記載の文字認識装置である。
請求項8に記載の発明は、コンピュータに、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する機能と、前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する機能と、前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う機能とを実現させるためのプログラムである。
請求項2の発明によれば、各文字列体系の特徴及び各文字列体系に設定された文字認識の結果の範囲を、各文字列体系に従って記述される文字列が表す対象の属性ごとに管理することができる。
請求項3の発明によれば、各文字列体系の特徴及び各文字列体系に設定された文字認識の結果の範囲を、各文字列体系に従って記述される文字列が表す対象が所属する分類ごとに管理することができる。
請求項4の発明によれば、文字列画像の文字認識の結果が文字列に関する規則を満たすことにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項5の発明によれば、文字列画像の文字認識の結果の予め定められた位置における文字が予め定められた文字の何れかであることにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項6の発明によれば、文字列画像の文字認識の結果が予め定められた個数の文字を含むことにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項7の発明によれば、文字列画像の文字認識の結果が予め定められた文字の何れかを含むこと又は含まないことにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項8の発明によれば、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておく構成よりも、高精度で文字認識を行うことができる。
文字列画像の文字認識を行う際に、予め文字列画像の文字列体系に応じて範囲を設定し、設定された範囲内で文字認識を行う技術がある。ここで文字列体系とは、文字列が記述されている規則のことである。これに限られるものではないが、例えば、文字列の文字数や、文字列のどの位置にどのような文字が入るか、といった規則を含む。
図1は、本実施の形態が適用される授業支援システム1の全体構成例を示した図である。図示するように、この授業支援システム1は、画像読取装置10と、授業支援装置30と、授業管理サーバ50a~50dとが通信回線80に接続されることにより構成されている。尚、図では、授業管理サーバ50a~50dを示したが、これらを区別する必要がない場合は、授業管理サーバ50と称することもある。また、図には、4つの授業管理サーバ50しか示していないが、2つ、3つ又は5つ以上の授業管理サーバ50を設けてもよい。
図2は、本実施の形態における画像読取装置10のハードウェア構成例を示した図である。図示するように、画像読取装置10は、CPU(Central Processing Unit)11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、HDD(Hard Disk Drive)14と、操作パネル15と、画像読取部16と、画像形成部17と、通信インターフェース(以下、「通信I/F」と表記する)18とを備える。
図3は、本実施の形態における授業支援装置30のハードウェア構成例を示した図である。図示するように、授業支援装置30は、演算手段であるCPU31と、記憶手段であるメインメモリ32及びHDD(Hard Disk Drive)33とを備える。ここで、CPU31は、OS(Operating System)やアプリケーション等の各種ソフトウェアを実行し、後述する各機能を実現する。また、メインメモリ32は、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域であり、HDD33は、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。更に、授業支援装置30は、外部との通信を行うための通信I/F34と、ディスプレイ等の表示デバイス35と、キーボードやマウス等の入力デバイス36とを備える。
例えば、近年では、複数の大学の学生が参加する合同セミナーという形態の講義が行われるようになっている。複数の大学は異なる学籍番号体系を持つため、このような講義で答案用紙に記入された学籍番号の文字認識を行う場合、予め複数の学籍番号体系の範囲を足し合わせた範囲を設定しておくことが考えられる。しかしながら、複数の学籍番号体系の範囲を足し合わせた範囲を設定することには多大な労力を要する。また、複数の学籍番号体系の範囲を足し合わせた範囲を設定したとしても、その範囲は広範となるので、高精度で文字認識を行うことができない。従って、答案用紙を人手により大学ごとに振り分けて、大学ごとにその大学の学籍番号体系で文字認識を行った方が効率的という結論になってしまう。
図5は、第1の実施例を示した模式図である。図では、授業支援装置30が、表311に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表311には補足的に大学名も示している。
図6は、第2の実施例を示した模式図である。図では、授業支援装置30が、表321に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表321には補足的に大学名も示している。
図7は、第3の実施例を示した模式図である。図では、授業支援装置30が、表331に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表331には補足的に大学名も示している。
図8は、第4の実施例を示した模式図である。図では、授業支援装置30が、表341に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表341には補足的に大学名も示している。
図9は、本実施の形態における授業支援装置30の機能構成例を示したブロック図である。図示するように、本実施の形態における授業支援装置30は、受信部41と、画像抽出部42と、設定情報記憶部43と、設定情報取得部44と、文字認識部45と、集計処理部46と、送信部47とを備えている。
図11は、本実施の形態における授業支援装置30の動作例を示したフローチャートである。図10では、4つの大学に対する設定情報を示したが、ここでは、2つの大学(「第1の大学」、「第2の大学」と称する)の学籍番号を区別する動作例を示す。この動作例に先立ち、設定情報取得部44が、設定情報記憶部43から第1の大学の学籍番号の特徴を示す特徴情報を取得し、文字認識部45にこの特徴情報を与えておくものとする。例えば、第1の実施例では、第1の大学をA大学とし、特徴情報を、先頭から4文字目が「1」で、先頭から5文字目が「6」、「7」、「8」の何れかであるという情報とする。第2の実施例では、第1の大学をC大学とし、特徴情報を、先頭から9文字目が存在するという情報とする。第3の実施例では、第1の大学をA大学とし、特徴情報を、先頭から2文字目及び3文字目が英文字であるという情報とする。第4の実施例では、第1の大学をD大学とし、特徴情報を、先頭から6文字目がハイフン(-)であるという情報とする。
本実施の形態における授業支援装置30が行う処理は、例えば、アプリケーションソフトウェア等のプログラムとして用意される。
Claims (8)
- 複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、
前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、
前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う文字認識手段と
を備えたことを特徴とする文字認識装置。 - 前記複数の文字列体系の各文字列体系の特徴及び当該各文字列体系に設定された前記文字認識の結果の範囲は、当該各文字列体系に従って記述される文字列が表す対象の属性に関連付けられており、
前記文字認識手段は、前記第1の文字認識の結果が前記特定の文字列体系の特徴を満たす場合に、当該特徴が関連付けられた属性を特定し、当該属性に関連付けられた前記文字認識の結果の範囲を、当該特定の文字列体系に設定された前記文字認識の結果の範囲として特定することを特徴とする請求項1に記載の文字認識装置。 - 前記属性は、前記複数の文字列体系の各文字列体系に従って記述される文字列が表す対象が所属する分類であることを特徴とする請求項2に記載の文字認識装置。
- 複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、
前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、
前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系の特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う文字認識手段と
を備え、
前記特定の文字列体系の特徴は、当該特定の文字列体系に従って記述される文字列に関する規則であることを特徴とする文字認識装置。 - 前記文字列に関する規則は、当該文字列の予め定められた位置における文字が予め定められた文字の何れかであるという規則であることを特徴とする請求項4に記載の文字認識装置。
- 前記文字列に関する規則は、当該文字列が予め定められた個数の文字を含むという規則であることを特徴とする請求項4に記載の文字認識装置。
- 前記文字列に関する規則は、当該文字列が予め定められた文字の何れかを含む又は含まないという規則であることを特徴とする請求項4に記載の文字認識装置。
- コンピュータに、
複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する機能と、
前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する機能と、
前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う機能と
を実現させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019068277A JP7338203B2 (ja) | 2019-03-29 | 2019-03-29 | 文字認識装置及びプログラム |
US16/557,208 US11568659B2 (en) | 2019-03-29 | 2019-08-30 | Character recognizing apparatus and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019068277A JP7338203B2 (ja) | 2019-03-29 | 2019-03-29 | 文字認識装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020166722A JP2020166722A (ja) | 2020-10-08 |
JP7338203B2 true JP7338203B2 (ja) | 2023-09-05 |
Family
ID=72603827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019068277A Active JP7338203B2 (ja) | 2019-03-29 | 2019-03-29 | 文字認識装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11568659B2 (ja) |
JP (1) | JP7338203B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015138458A (ja) | 2014-01-23 | 2015-07-30 | 富士ゼロックス株式会社 | 情報処理システム、情報処理装置及びプログラム |
US20150356365A1 (en) | 2014-06-09 | 2015-12-10 | I.R.I.S. | Optical character recognition method |
US20180349693A1 (en) | 2017-05-31 | 2018-12-06 | Hitachi, Ltd. | Computer, document identification method, and system |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH076212A (ja) * | 1993-06-21 | 1995-01-10 | Nec Corp | 光学文字読取装置の知識処理装置 |
WO2015136692A1 (ja) * | 2014-03-14 | 2015-09-17 | 株式会社日立製作所 | 電子イメージ文書編集システム |
-
2019
- 2019-03-29 JP JP2019068277A patent/JP7338203B2/ja active Active
- 2019-08-30 US US16/557,208 patent/US11568659B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015138458A (ja) | 2014-01-23 | 2015-07-30 | 富士ゼロックス株式会社 | 情報処理システム、情報処理装置及びプログラム |
US20150356365A1 (en) | 2014-06-09 | 2015-12-10 | I.R.I.S. | Optical character recognition method |
US20180349693A1 (en) | 2017-05-31 | 2018-12-06 | Hitachi, Ltd. | Computer, document identification method, and system |
Also Published As
Publication number | Publication date |
---|---|
JP2020166722A (ja) | 2020-10-08 |
US20200311493A1 (en) | 2020-10-01 |
US11568659B2 (en) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101622620B (zh) | 控制访问计算机系统和注释媒体文件的方法和装置 | |
Srihari et al. | Individuality of handwriting | |
US7580551B1 (en) | Method and apparatus for analyzing and/or comparing handwritten and/or biometric samples | |
CN110555403A (zh) | 一种手写字评价方法与系统 | |
CN107798321A (zh) | 一种试卷分析方法和计算设备 | |
CN101326518B (zh) | 用于墨水笔记的手写体识别的方法和装置 | |
US8768241B2 (en) | System and method for representing digital assessments | |
EP3142041B1 (en) | Information processing apparatus, information processing method and program | |
US9558400B2 (en) | Search by stroke | |
KR20130021684A (ko) | 답안지 관리 시스템 및 그 방법 | |
Bhattacharya et al. | Understanding contents of filled-in Bangla form images | |
US9665786B2 (en) | Confirming automatically recognized handwritten answers | |
JP4756447B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
JP2014182789A (ja) | ドキュメントを編集する装置、方法及びプログラム | |
JP7338203B2 (ja) | 文字認識装置及びプログラム | |
JP7021496B2 (ja) | 情報処理装置及びプログラム | |
KR100795951B1 (ko) | 채점 시스템 및 그 제어방법 | |
JP2020115175A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP7074170B2 (ja) | 採点支援装置、採点支援システム、採点支援方法および採点支援プログラム | |
JP4807486B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
US20210209354A1 (en) | Information processing device, information processing method, and information processing program | |
JP2021125040A (ja) | 帳票仕分システム、帳票仕分方法、及びプログラム | |
JP2023157274A (ja) | 機械学習データ収集システム、機械学習データ収集方法、およびプログラム | |
US20230222936A1 (en) | Information processing apparatus, non-transitory computer readable medium storing information processing program, and information processing method | |
JP4736595B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230725 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230807 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7338203 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |