JP2006277149A - 文字画像切出装置、文字画像切出方法およびプログラム - Google Patents
文字画像切出装置、文字画像切出方法およびプログラム Download PDFInfo
- Publication number
- JP2006277149A JP2006277149A JP2005093260A JP2005093260A JP2006277149A JP 2006277149 A JP2006277149 A JP 2006277149A JP 2005093260 A JP2005093260 A JP 2005093260A JP 2005093260 A JP2005093260 A JP 2005093260A JP 2006277149 A JP2006277149 A JP 2006277149A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- character image
- shape characteristic
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】 形状特性特定部1014は、升目に書かれた文字の各々を示す文字画像の形状特性を特定し、形状特性データ1023として記憶部102に記憶する。第2文字画像認識部1016は、自由記入欄に書かれた文字列を示す画像から、1文字を示す文字画像の候補をセグメントとして取り出す。第2文字画像認識部1016は、取り出したセグメントの形状特性を、形状特性データ1023により示される形状特性と比較し、当該セグメントを文字画像として切り出すか否かを判定する。
【選択図】 図1
Description
図1は本発明の第1実施形態にかかる文字認識システム1の構成を示したブロック図である。文字認識システム1は、複数の文字を示す画像データから各々の文字を示す画像データを切り出して送信する文字画像切出装置10と、紙面に書かれた図形や文字を光学的に読み取ってそれらの図形や文字を白黒で示す画像データを文字画像切出装置10に送信するスキャナ11と、文字画像切出装置10から送信される画像データに対し文字認識処理を行い認識した文字を示すテキストデータを生成する文字認識装置12を備えている。
図7は本発明の第2実施形態にかかる文字認識システム2の構成を示したブロック図である。文字認識システム2においては、文字画像の切り出しの精度を高めるために、文字を構成する構成部の配置による種別に応じた形状特性が用いられる。文字認識システム2の構成および動作は多くの点で文字認識システム1のそれらと共通しているため、図7において、文字認識システム1の構成部に対応する構成部には図1において用いられたものと同じ符号が付されている。
図12は本発明の第3実施形態にかかる文字認識システム3の構成を示したブロック図である。文字認識システム3においては、文字画像の切り出しの精度を高めるために、予め記憶された標準的な文字もしくは文字の構成部に関する形状特性と、切り出された画像の形状特性との比較が行われる。その際、標準的な文字等の形状特性には、升目領域に書かれた文字の形状特性に応じた補正が加えられるため、高い精度の文字画像の切り出しが実現される。
Claims (7)
- 各々画像を示す第1画像データと第2の画像を示す第2画像データとを取得する画像データ取得手段と、
前記第1画像データにより示される画像のうち所定の領域に配置されている部分を1文字を示す文字画像として認識する第1文字画像認識手段と、
前記第1文字画像認識手段により認識された文字画像の形状特性を特定する形状特性特定手段と、
前記形状特性特定手段により特定された形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する第2文字画像認識手段と、
前記第2文字画像認識手段により認識された文字画像を示す画像データを出力する出力手段と
を備えることを特徴とする文字画像切出装置。 - 前記第1文字画像認識手段により認識された文字画像を構成する画素のうち所定の条件を満たす属性を備える画素の配置に基づき、当該文字画像を複数の種別のいずれかに分類する第1分類手段と、
前記第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、当該文字画像の候補を構成する画素のうち所定の条件を満たす属性を備える画素の配置に基づき、当該文字画像の候補を前記複数の種別のいずれかに分類する第2分類手段と
をさらに備え、
前記第2文字画像認識手段は、前記第2分類手段により取り出された文字画像の候補の形状特性と、前記第2分類手段により当該文字画像の候補が分類された種別と同じ種別に前記第1分類手段により分類された文字画像の形状特性とを比較することにより、当該文字画像の候補を1文字を示す文字画像として認識するか否かを決定する
ことを特徴とする請求項1に記載の文字画像切出装置。 - 前記形状特性特定手段は、前記第1文字画像認識手段により認識された文字画像の縦横比もしくは当該文字画像を構成する複数の部分の各々の縦横比を前記形状特性として特定する
ことを特徴とする請求項1に記載の文字画像切出装置。 - 前記形状特性特定手段は、前記第1文字画像認識手段により認識された文字画像の傾斜度もしくは当該文字画像を構成する複数の部分の各々の傾斜度を前記形状特性として特定する
ことを特徴とする請求項1に記載の文字画像切出装置。 - 標準的な文字の形状特性もしくは標準的な文字の構成部の形状特性を示す標準形状特性データを記憶する記憶手段と、
画像により示される文字を認識する文字認識手段と
を備え、
前記第2文字画像認識手段は、第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、
前記文字認識手段は、前記第2文字画像認識手段により取り出された文字画像により示されると推定される文字を認識し、
前記第2文字画像認識手段は、前記記憶手段に記憶されている標準形状特性データのうち、前記文字認識手段により認識された文字、前記文字認識手段により認識された文字と類似した形状を有する文字および文字の構成部であって前記文字認識手段により認識された文字と類似した形状を有する構成部の少なくとも1に関する標準形状特性データにより示される形状特性に対し、前記形状特性特定手段により特定された形状特性に応じた補正を加えたものと、前記文字画像の候補の形状特性とを比較することにより、前記文字画像の候補を1文字を示す文字画像として認識するか否かを決定する
ことを特徴とする請求項1に記載の文字画像切出装置。 - 各々画像を示す第1画像データと第2の画像を示す第2画像データとを取得する画像データ取得過程と、
前記第1画像データにより示される画像のうち所定の領域に配置されている部分を1文字を示す文字画像として認識する第1文字画像認識過程と、
前記第1文字画像認識過程において認識された文字画像の形状特性を特定する形状特性特定過程と、
前記形状特性特定過程において特定された形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する第2文字画像認識過程と、
前記第2文字画像認識過程において認識された文字画像を示す画像データを出力する出力過程と
を備えることを特徴とする文字画像切出方法。 - 各々画像を示す第1画像データと第2の画像を示す第2画像データとを取得する処理と、
前記第1画像データにより示される画像のうち所定の領域に配置されている部分を1文字を示す文字画像として認識する処理と、
認識した文字画像の形状特性を特定する処理と、
特定した形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する処理と、
文字画像として認識した前記第2画像データにより示される画像の一部を示す画像データを出力する処理と
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005093260A JP4810853B2 (ja) | 2005-03-28 | 2005-03-28 | 文字画像切出装置、文字画像切出方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005093260A JP4810853B2 (ja) | 2005-03-28 | 2005-03-28 | 文字画像切出装置、文字画像切出方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006277149A true JP2006277149A (ja) | 2006-10-12 |
JP4810853B2 JP4810853B2 (ja) | 2011-11-09 |
Family
ID=37211873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005093260A Expired - Fee Related JP4810853B2 (ja) | 2005-03-28 | 2005-03-28 | 文字画像切出装置、文字画像切出方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4810853B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186781A (zh) * | 2011-12-31 | 2013-07-03 | 北京新媒传信科技有限公司 | 文本识别方法 |
JP2015225094A (ja) * | 2014-05-26 | 2015-12-14 | 大日本印刷株式会社 | 解説動画配信システム |
CN107609560A (zh) * | 2017-09-27 | 2018-01-19 | 北京小米移动软件有限公司 | 文字识别方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03225578A (ja) * | 1990-01-31 | 1991-10-04 | Toshiba Corp | 文字の検切り方法 |
JPH04299485A (ja) * | 1991-03-28 | 1992-10-22 | Nec Corp | 文字列認識方法及びその装置 |
JPH05147187A (ja) * | 1991-11-28 | 1993-06-15 | Gunze Ltd | スクリーン版検査装置 |
JP2000090200A (ja) * | 1998-09-10 | 2000-03-31 | Ricoh Co Ltd | 文字認識方法、装置および記録媒体 |
JP2004078531A (ja) * | 2002-08-16 | 2004-03-11 | Ricoh Co Ltd | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラム |
-
2005
- 2005-03-28 JP JP2005093260A patent/JP4810853B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03225578A (ja) * | 1990-01-31 | 1991-10-04 | Toshiba Corp | 文字の検切り方法 |
JPH04299485A (ja) * | 1991-03-28 | 1992-10-22 | Nec Corp | 文字列認識方法及びその装置 |
JPH05147187A (ja) * | 1991-11-28 | 1993-06-15 | Gunze Ltd | スクリーン版検査装置 |
JP2000090200A (ja) * | 1998-09-10 | 2000-03-31 | Ricoh Co Ltd | 文字認識方法、装置および記録媒体 |
JP2004078531A (ja) * | 2002-08-16 | 2004-03-11 | Ricoh Co Ltd | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186781A (zh) * | 2011-12-31 | 2013-07-03 | 北京新媒传信科技有限公司 | 文本识别方法 |
JP2015225094A (ja) * | 2014-05-26 | 2015-12-14 | 大日本印刷株式会社 | 解説動画配信システム |
CN107609560A (zh) * | 2017-09-27 | 2018-01-19 | 北京小米移动软件有限公司 | 文字识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4810853B2 (ja) | 2011-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7519226B2 (en) | Form search apparatus and method | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
US6687401B2 (en) | Pattern recognizing apparatus and method | |
EP2569930B1 (en) | Segmentation of a word bitmap into individual characters or glyphs during an ocr process | |
JP3294995B2 (ja) | 帳票読取装置 | |
JP3452774B2 (ja) | 文字認識方法 | |
US20110280481A1 (en) | User correction of errors arising in a textual document undergoing optical character recognition (ocr) process | |
US20010016069A1 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
JPH0713995A (ja) | 自動テキスト特徴決定装置 | |
JP3485020B2 (ja) | 文字認識方法及び装置ならびに記憶媒体 | |
JP5906788B2 (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
US7146047B2 (en) | Image processing apparatus and method generating binary image from a multilevel image | |
US20020051574A1 (en) | Character recognition method, program and recording medium | |
JP2007058882A (ja) | パターン認識装置 | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP3216800B2 (ja) | 手書き文字認識方法 | |
JP2002063548A (ja) | 手書き文字認識方法 | |
JP4117648B2 (ja) | 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置 | |
JPH10154204A (ja) | パターン認識装置及びパターン認識方法 | |
CN115131806B (zh) | 一种基于深度学习的各类证件ocr图像信息识别方法、系统 | |
JP5830996B2 (ja) | 画像処理装置及びプログラム | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
JP2007026470A (ja) | パターン認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4810853 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140902 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |