JP2010217996A - 文字認識装置、文字認識プログラム、および文字認識方法 - Google Patents
文字認識装置、文字認識プログラム、および文字認識方法 Download PDFInfo
- Publication number
- JP2010217996A JP2010217996A JP2009061148A JP2009061148A JP2010217996A JP 2010217996 A JP2010217996 A JP 2010217996A JP 2009061148 A JP2009061148 A JP 2009061148A JP 2009061148 A JP2009061148 A JP 2009061148A JP 2010217996 A JP2010217996 A JP 2010217996A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- character
- characters
- category
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
【解決手段】携帯端末1により、主に英数文字からなる第1認識用英数文字部24aおよびカテゴリ用文字からなる第1認識用カテゴリ文字部24bと、これ以外の文字を含みこれらの文字よりも文字数が多い第2認識用文字についての第2認識用文字部24cとを区別可能に記憶しておき、第1認識用英数文字部24aおよび第1認識用カテゴリ文字部24bによる第1文字認識処理を実行し(ステップS4)、該処理でのマッチング信頼度が低い場合に(ステップS5〜S6)、少なくとも第2認識用文字部24cにより文字認識を実行する第2文字認識処理(ステップS7)を実行する。
【選択図】図4
Description
前記画像データは、カラー画像やグレースケール画像やモノクロ2階調画像など、適宜の画像のデータとすることができる。
前記第2認識用文字は、例えばひらがな、カタカナ、漢字、またはこれらの複数など、予め定めた適宜の文字とすることができる。
この態様により、第1文字認識処理の際にカテゴリ判別も実行することが可能となる。
これにより、マッチングデータによる再度の文字認識を実行せずに正しい文字に補正することができ、高速かつ高精度に文字認識を完了することができる。
この発明により、コンピュータに文字認識プログラムをインストールすれば、画像データに対して手軽な操作で高速の文字認識を実現することができる。
これにより、画像データに対して手軽な操作で高速の文字認識を実行することができる。
カテゴリ判別処理部35は、カテゴリ判別用辞書データ25を用いて文字列がどのカテゴリに属するかを判別する処理を実行する。
認識結果補正処理部36は、文字列の中にそのカテゴリで用いられない文字があれば、この文字をカテゴリ内で用いられる文字に補正する処理を実行する。
マッチング用辞書データ24は、図3(A)に示すように、文字コード、マッチング情報、および対象カテゴリによって構成されている。
マッチング情報は、文字の特徴データを文字別に記憶している。
CPU11は、文字列抽出処理部31による文字列抽出処理を実行し、文字画像から文字列を抽出する(ステップS2)。このとき、会社名表示部分の文字列、氏名表示部分の文字列、住所表示部分の文字列など、複数の文字列を取得する。
マッチング信頼度の判定がNGであれば(ステップS6:No)、CPU11は、i番目の抽出文字列について、文字認識処理部33により第2文字認識処理を実行する(ステップS7)。この第2文字認識処理では、マッチング用辞書データ24の全てのデータを用いて文字認識を実行する。
まず、文字列抽出処理(ステップS2)により、図5(B)に示すように、(1)〜(9)の各文字列が認識される。
この発明の文字認識装置およびコンピュータは、実施形態の携帯端末1に対応し、
以下同様に、
画像データ取得手段は、画像入力部3に対応し、
文字認識手段は、CPU11に対応し、
記憶手段は、ROM12に対応し、
マッチングデータは、マッチング用辞書データ24に対応し、
第1認識用マッチングデータは、第1認識用英数文字部24aおよび第1認識用カテゴリ文字部24bに対応し、
第2認識用マッチングデータは、第1認識用英数文字部24a、第1認識用カテゴリ文字部24b、および第2認識用文字部24cに対応し、
カテゴリ判別用文字は、第1認識用カテゴリ文字部24bに対応し、
画像データ取得ステップは、ステップS1に対応し、
第1文字認識処理および第1文字認識ステップは、ステップS4に対応し、
再認識要否判別処理および再認識要否判別ステップは、ステップS5〜S6に対応し、
第2文字認識処理および第2文字認識ステップは、ステップS7に対応し、
カテゴリ判別処理は、ステップS11に対応し、
補正処理は、ステップS12に対応し、
第1認識用文字は、英語、数字、記号、カテゴリ用文字に対応し、
第2認識用文字は、全文字に対応するが、
この発明は、上述の実施形態の構成のみに限定されるものではなく、多くの実施の形態を得ることができる。
Claims (8)
- 文字認識用のマッチングデータを記憶する記憶手段と、
画像データを取得する画像データ取得手段と、
前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段とを備えた文字認識装置であって、
前記マッチングデータは、
予め定められた第1認識用文字についての第1認識用マッチングデータと、
前記第1認識用文字以外の文字を含み該第1認識用文字よりも文字数が多い第2認識用文字についての第2認識用マッチングデータとを区別可能に構成され、
前記文字認識手段は、
前記第1認識用マッチングデータにより前記画像データについて文字認識を実行する第1文字認識処理と、
該第1文字認識処理の結果が再認識条件に該当するか否か判別する再認識要否判別処理と、
該再認識要否判別処理により再認識を要すると判別した再認識対象に対して、前記第2認識用マッチングデータにより文字認識を実行する第2文字認識処理とを実行する構成である
文字認識装置。 - 前記文字認識手段は、前記画像データ内の文字群のカテゴリを判別するカテゴリ判別処理を実行する構成であり、
前記第1認識用マッチングデータは、前記カテゴリ判別に用いられるカテゴリ判別用文字が含まれた構成である
請求項1記載の文字認識装置。 - 前記第1認識用マッチングデータは、前記カテゴリ判別用文字のうち2以上の部品に分かれる結合文字については該結合を要素別に分離した部品文字が含まれた構成である
請求項2記載の文字認識装置。 - 前記文字認識手段は、
前記カテゴリ判別処理にてカテゴリが判別された文字群内に該カテゴリで使用されないはずの誤認文字が含まれているか否か判別し、含まれている場合に該誤認文字をカテゴリで使用される文字に補正する補正処理とを実行する構成とした
請求項2または3記載の文字認識装置。 - 前記補正処理は、
前記誤認文字が含まれている場合に、カテゴリで使用される文字のみを認識対象として再度文字認識を実行することにより補正する構成である
請求項4記載の文字認識装置。 - 前記第1文字認識処理は、マッチング信頼度の高いものから複数の文字候補を求めておいて最もマッチング信頼度の高い文字を採用する構成であり、
前記補正処理は、
前記誤認文字が含まれている場合に、該誤認文字の文字候補のうち、該カテゴリに使用される文字の中で最もマッチング信頼度の高い文字に補正する構成である
請求項4記載の文字認識装置。 - 予め定められた第1認識用文字についての第1認識用マッチングデータと、前記第1認識用文字以外の文字を含み該第1認識用文字よりも文字数が多い第2認識用文字についての第2認識用マッチングデータとを区別可能に構成されたマッチングデータを記憶手段に記憶しておき、
画像データ取得手段により画像データを取得する画像データ取得ステップと、
前記第1認識用マッチングデータにより前記画像データについて文字認識手段で文字認識を実行する第1文字認識ステップと、
該第1文字認識処理の結果が再認識条件に該当するか否か前記文字認識手段で判別する再認識要否判別ステップと、
該再認識要否判別処理により再認識を要すると判別した再認識対象に対して、前記第2認識用マッチングデータにより前記文字認識手段で文字認識を実行する第2文字認識ステップとをコンピュータに実行させる
文字認識プログラム。 - 予め定められた第1認識用文字についての第1認識用マッチングデータと、前記第1認識用文字以外の文字を含み該第1認識用文字よりも文字数が多い第2認識用文字についての第2認識用マッチングデータとを区別可能に構成されたマッチングデータを記憶手段に記憶しておき、
画像データ取得手段により画像データを取得する画像データ取得ステップと、
前記第1認識用マッチングデータにより前記画像データについて文字認識手段で文字認識を実行する第1文字認識ステップと、
該第1文字認識処理の結果が再認識条件に該当するか否か前記文字認識手段で判別する再認識要否判別ステップと、
該再認識要否判別処理により再認識を要すると判別した再認識対象に対して、前記第2認識用マッチングデータにより前記文字認識手段で文字認識を実行する第2文字認識ステップとを実行する
文字認識方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009061148A JP2010217996A (ja) | 2009-03-13 | 2009-03-13 | 文字認識装置、文字認識プログラム、および文字認識方法 |
KR1020100010816A KR101078086B1 (ko) | 2009-03-13 | 2010-02-05 | 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 |
CN201010123535A CN101833661A (zh) | 2009-03-13 | 2010-03-02 | 字符识别装置、字符识别程序及字符识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009061148A JP2010217996A (ja) | 2009-03-13 | 2009-03-13 | 文字認識装置、文字認識プログラム、および文字認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010217996A true JP2010217996A (ja) | 2010-09-30 |
Family
ID=42717725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009061148A Pending JP2010217996A (ja) | 2009-03-13 | 2009-03-13 | 文字認識装置、文字認識プログラム、および文字認識方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2010217996A (ja) |
KR (1) | KR101078086B1 (ja) |
CN (1) | CN101833661A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5143291B2 (ja) * | 2011-04-20 | 2013-02-13 | 株式会社東芝 | 画像処理装置、方法、および立体画像表示装置 |
JP2020160609A (ja) * | 2019-03-25 | 2020-10-01 | 東芝テック株式会社 | プログラム及び文字認識方法 |
KR20200128089A (ko) * | 2018-02-28 | 2020-11-11 | 캐논 유로파 엔.브이. | 영상 처리 방법 및 영상 처리 시스템 |
US10885325B2 (en) | 2017-02-10 | 2021-01-05 | Canon Kabushiki Kaisha | Information processing apparatus, control method, and storage medium |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6472218B2 (ja) * | 2014-11-17 | 2019-02-20 | 株式会社日立情報通信エンジニアリング | 文字認識システム及び文字認識方法 |
CN106372634A (zh) * | 2015-07-21 | 2017-02-01 | 无锡天脉聚源传媒科技有限公司 | 一种繁体字的识别方法及装置 |
CN110135425B (zh) * | 2018-02-09 | 2021-02-26 | 北京世纪好未来教育科技有限公司 | 样本标注方法及计算机存储介质 |
CN108564079B (zh) * | 2018-05-08 | 2022-07-19 | 东华大学 | 一种便携式字符识别装置及方法 |
JP7338158B2 (ja) * | 2019-01-24 | 2023-09-05 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005182772A (ja) * | 2003-11-28 | 2005-07-07 | Sharp Corp | 文字認識装置、プログラムおよび記録媒体 |
JP2006092138A (ja) * | 2004-09-22 | 2006-04-06 | Oki Electric Ind Co Ltd | 複数の認識辞書を利用した文字認識装置 |
JP2008040910A (ja) * | 2006-08-08 | 2008-02-21 | Sharp Corp | 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1055413A (ja) | 1996-08-09 | 1998-02-24 | Matsushita Electric Ind Co Ltd | 名刺認識装置 |
JP3452774B2 (ja) * | 1997-10-16 | 2003-09-29 | 富士通株式会社 | 文字認識方法 |
JP2001202475A (ja) | 2000-01-19 | 2001-07-27 | Sharp Corp | 文字認識装置及び文字認識装置の制御方法 |
JP4704601B2 (ja) * | 2000-11-01 | 2011-06-15 | 富士通株式会社 | 文字認識方法,プログラム及び記録媒体 |
JP2006065477A (ja) * | 2004-08-25 | 2006-03-09 | Fuji Xerox Co Ltd | 文字認識装置 |
-
2009
- 2009-03-13 JP JP2009061148A patent/JP2010217996A/ja active Pending
-
2010
- 2010-02-05 KR KR1020100010816A patent/KR101078086B1/ko active IP Right Grant
- 2010-03-02 CN CN201010123535A patent/CN101833661A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005182772A (ja) * | 2003-11-28 | 2005-07-07 | Sharp Corp | 文字認識装置、プログラムおよび記録媒体 |
JP2006092138A (ja) * | 2004-09-22 | 2006-04-06 | Oki Electric Ind Co Ltd | 複数の認識辞書を利用した文字認識装置 |
JP2008040910A (ja) * | 2006-08-08 | 2008-02-21 | Sharp Corp | 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5143291B2 (ja) * | 2011-04-20 | 2013-02-13 | 株式会社東芝 | 画像処理装置、方法、および立体画像表示装置 |
US10885325B2 (en) | 2017-02-10 | 2021-01-05 | Canon Kabushiki Kaisha | Information processing apparatus, control method, and storage medium |
KR20200128089A (ko) * | 2018-02-28 | 2020-11-11 | 캐논 유로파 엔.브이. | 영상 처리 방법 및 영상 처리 시스템 |
JP2021502628A (ja) * | 2018-02-28 | 2021-01-28 | キヤノン オイローパ エヌ.ヴェー. | 画像処理方法及び画像処理システム |
US11170265B2 (en) | 2018-02-28 | 2021-11-09 | I.R.I.S. | Image processing method and an image processing system |
JP7038988B2 (ja) | 2018-02-28 | 2022-03-22 | キヤノン オイローパ エヌ.ヴェー. | 画像処理方法及び画像処理システム |
KR102504635B1 (ko) * | 2018-02-28 | 2023-02-27 | 캐논 유로파 엔.브이. | 영상 처리 방법 및 영상 처리 시스템 |
JP2020160609A (ja) * | 2019-03-25 | 2020-10-01 | 東芝テック株式会社 | プログラム及び文字認識方法 |
JP7274322B2 (ja) | 2019-03-25 | 2023-05-16 | 東芝テック株式会社 | プログラム及び文字認識方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20100103351A (ko) | 2010-09-27 |
KR101078086B1 (ko) | 2011-10-28 |
CN101833661A (zh) | 2010-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010217996A (ja) | 文字認識装置、文字認識プログラム、および文字認識方法 | |
US10073859B2 (en) | System and methods for creation and use of a mixed media environment | |
JP4995554B2 (ja) | 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法 | |
US8600989B2 (en) | Method and system for image matching in a mixed media environment | |
US9357098B2 (en) | System and methods for use of voice mail and email in a mixed media environment | |
US8521737B2 (en) | Method and system for multi-tier image matching in a mixed media environment | |
US9405751B2 (en) | Database for mixed media document system | |
US9171202B2 (en) | Data organization and access for mixed media document system | |
US7885955B2 (en) | Shared document annotation | |
US8949287B2 (en) | Embedding hot spots in imaged documents | |
US8335789B2 (en) | Method and system for document fingerprint matching in a mixed media environment | |
US8838591B2 (en) | Embedding hot spots in electronic documents | |
US8195659B2 (en) | Integration and use of mixed media documents | |
EP1917636B1 (en) | Method and system for image matching in a mixed media environment | |
US9772989B2 (en) | Template management apparatus, non-transitory computer readable medium, and template management method | |
KR102373884B1 (ko) | 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법 | |
US20170099403A1 (en) | Document distribution system, document distribution apparatus, information processing method, and storage medium | |
US8773733B2 (en) | Image capture device for extracting textual information | |
US8768058B2 (en) | System for extracting text from a plurality of captured images of a document | |
US8908970B2 (en) | Textual information extraction method using multiple images | |
JP4597644B2 (ja) | 文字認識装置、プログラムおよび記録媒体 | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
US20210182477A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JP4116852B2 (ja) | 抽出文字列辞書検索装置及び方法並びにプログラム | |
JP2010218043A (ja) | 文字情報取得装置、文字情報取得プログラム、および文字情報取得方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130710 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130723 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130920 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131126 |