JP5857634B2 - 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム - Google Patents
単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム Download PDFInfo
- Publication number
- JP5857634B2 JP5857634B2 JP2011239536A JP2011239536A JP5857634B2 JP 5857634 B2 JP5857634 B2 JP 5857634B2 JP 2011239536 A JP2011239536 A JP 2011239536A JP 2011239536 A JP2011239536 A JP 2011239536A JP 5857634 B2 JP5857634 B2 JP 5857634B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- font
- character string
- distribution
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を制限するものではないことを理解されたい。
あるいは画像取得部11は、イーサネット(登録商標)などの通信規格に従った通信ネットワークに接続するための通信インターフェース及びその制御回路を有してもよい。
この場合には、画像取得部11は、画像入力装置または通信ネットワークに接続された他の機器から、文字列を撮影することにより、あるいは文字列が表された画面をキャプチャすることにより得られた画像を取得し、その画像を処理部15へ渡す。
出力部12は、画像に写った文字列を処理部15が認識することにより生成された、電子データ化された文字列を処理部15から受け取り、その電子データ化された文字列を他の機器へ出力する。
2値化画像において、文字画素の輝度値は、例えば、'0'に設定され、一方、背景画素の輝度値は、例えば、'255'に設定される。
文字領域検出部21は、行画像ごとに、連結している文字画素を一つの集合とするラベリング処理を行うことにより、個々の文字に相当する文字画素の集合を求める。また、例えば、文字'i'または'j'のように、一つの文字が、行画像の垂直方向に分離した複数の文字画素の集合を含むことがある。そこで文字領域検出部21は、個々の文字画素の集合ごとに、水平方向についてその集合の両端及び長さを求める。そして文字領域検出部21は、注目する二つの集合の水平方向の位置が、何れか一方の集合の長さの所定割合以上にわたって他方の集合と重なっている場合、その二つの集合を一つの文字を表すものとして統合する。所定割合は、例えば、40%〜60%とすることができる。
文字領域検出部21は、線成分の方向を求めるために、例えば、小領域ごとに、文字画素について細線化処理を行うことで、文字の線成分を細線化する。その後、文字領域検出部21は、線成分の分岐点を含まない小領域について、細線化された線成分の二つの端点の座標を比較することで線成分の方向を求めればよい。
文字領域検出部21は、距離が最小となる基準特徴量ベクトルに対応する文字を、一文字領域に含まれる文字として認識する。そして文字領域検出部21は、例えば、その認識した文字に対応する文字コードを、予め記憶部13に記憶された、基準特徴量ベクトルと文字コードとの関係を表す参照テーブルを参照することによって特定する。
また、ヒストグラム生成部22は、水平方向に隣接する二つの文字の組ごとに、一文字領域の重心間の距離をそれぞれ求めて、文字列の先頭から順にその重心間隔を記憶部13に記憶する。そしてヒストグラム生成部22は、重心間隔ごとの頻度分布を表すヒストグラムを生成する。なお、以下では、上記の二つのヒストグラムを区別するために、文字領域間隔のヒストグラムを領域間隔ヒストグラムと呼び、重心間隔のヒストグラムを重心間隔ヒストグラムと呼ぶ。
ヒストグラム生成部22は、領域間隔ヒストグラムと重心間隔ヒストグラムとを、フォント判定部23に渡す。
このように、単語間空白検出装置1は、文字列が等ピッチフォントで表記されていれば、隣接する二つの一文字領域の重心間隔に基づいて、その二つの一文字領域間に空白が有るか否かを正確に判定できる。
このように、単語間空白検出装置1は、文字列がプロポーショナルフォントで表記されていれば、隣接する二つの文字の文字領域間隔に基づいて、その二つの一文字領域間に空白が有るか否かを正確に判定できる。
一方、フォント判定部23は、文字列の表記に用いられているフォントを等ピッチフォントと判定した場合、分離度Sgに対応する、重心間隔ヒストグラム中で小さい方から順に(m1+1)番目の重心間隔を閾値決定部24に通知する。なお、(m1+1)番目の重心間隔は、相関比γm1が最大となるときの二つのサブ分布間の境界の重心間隔に相当する。
本実施形態では、文字列の表記に用いられているフォントがプロポーショナルフォントと判定された場合、閾値決定部24は、分離度Sdに対応する、領域間隔ヒストグラム中で小さい方から順に(n1+1)番目の文字領域間隔を空白閾値とする。そして閾値決定部24は文字領域間隔を選択する。あるいは、閾値決定部24は、相関比ηn1が最大となるときの、サブ分布D1及びD2の平均値及び分散をそれぞれ求めてもよい。そして閾値決定部24は、サブ分布D1の平均値から空白閾値までのマハラノビス距離と、サブ分布D2の平均値から空白閾値までのマハラノビス距離とが等しくなるように、空白閾値を決定してもよい。
空白検出部25は、文字列の最後まで、単語間の空白の検出を終えると、単語間の空白に対応する文字コードが挿入された電子データ化された文字列を記憶部13に記憶し、またはその電子データ化された文字列を出力部12を介して他の機器へ出力する。
処理部15は、媒体に表された文字列を撮影した画像を画像取得部11から取得する(ステップS101)。
処理部15の文字領域検出部21は、その画像に写っている文字列に含まれる各文字の外接矩形をそれぞれ一文字領域として検出する(ステップS102)。さらに文字領域検出部21は、一文字領域のそれぞれに含まれる文字を認識する(ステップS103)。そして文字領域検出部21は、認識した文字に対応する文字コードを特定して、文字列の先頭から順にその文字コードを並べることで電子データ化された文字列を生成する(ステップS104)。
その後、処理部15は、単語間空白検出処理を終了する。
単語間の空白の検出に重心間隔が用いられる場合には、閾値決定部は、文字列の表記にプロポーショナルフォントが用いられていると判定されると、二つの文字についての重心間隔にその二つの文字の組に対応する補正係数を乗じて、重心間隔を補正すればよい。
そして処理部は、単語間の空白が検出された後に、その空白で区切られた一文字領域の集合ごとに、文字の候補を組み合わせた単語候補を求める。そして処理部は、単語候補のそれぞれについて、記憶部に予め記憶された単語辞書に登録された複数の単語のそれぞれとの一致度を求め、一致度が最大となる単語候補を、一文字領域の集合に含まれる単語として選択する。一致度は、例えば、単語候補に含まれる文字の総数に対する、単語候補に含まれる文字と単語辞書に登録された単語に含まれる文字とが一致した数の比とすることができる。
11 画像取得部
12 出力部
13 記憶部
14 記憶媒体アクセス装置
15 処理部
16 記憶媒体
21 文字領域検出部
22 ヒストグラム生成部
23 フォント判定部
24 閾値決定部
25 空白検出部
Claims (8)
- 媒体上に表された複数の単語を含む文字列を画像として取得する画像取得部と、
前記画像から、前記文字列に含まれる文字ごとに、当該文字に外接する文字領域を検出する文字領域検出部と、
前記文字列に含まれる、互いに隣接する二つの文字の組ごとに、当該二つの文字についての前記文字領域間の間隔及び当該二つの文字についての前記文字領域の重心間の距離をそれぞれ求めることにより、前記文字領域間の間隔についての第1の分布と、前記重心間の距離についての第2の分布とを求める間隔分布算出部と、
前記文字領域間の間隔に基づく判別分析により前記第1の分布を二つのサブ分布に分割したときの第1の分離度と、前記重心間の距離に基づく判別分析により前記第2の分布を二つのサブ分布に分割したときの第2の分離度とを求め、前記第1の分離度が前記第2の分離度より大きい場合に前記文字列の表記に用いられているフォントをプロポーショナルフォントと判定し、一方、前記第1の分離度が前記第2の分離度以下である場合に前記文字列の表記に用いられているフォントを等ピッチフォントと判定するフォント判定部と、
前記判定されたフォントに従って、単語間の空白を検出するための閾値を設定する閾値決定部と、
前記組のうち、前記文字領域間の間隔または前記重心間の距離が前記閾値以上である組に含まれる二つの文字間に単語間の空白を検出する空白検出部と、
を有する単語間空白検出装置。 - 前記閾値決定部は、前記文字列の表記に用いられているフォントがプロポーショナルフォントであると判定された場合、前記閾値を前記第1の分布に従って決定し、一方、前記文字列の表記に用いられているフォントが等ピッチフォントであると判定された場合、前記閾値を前記第2の分布に従って決定し、
前記空白検出部は、前記文字列の表記に用いられているフォントがプロポーショナルフォントであると判定された場合、前記組のうち、前記文字領域間の間隔が前記閾値以上である組に含まれる二つの文字間に単語間の空白を検出し、一方、前記文字列の表記に用いられているフォントが等ピッチフォントであると判定された場合、前記組のうち、前記重心間の距離が前記閾値以上である組に含まれる二つの文字間に単語間の空白を検出する、請求項1に記載の単語間空白検出装置。 - 前記閾値決定部は、前記文字列の表記に用いられているフォントがプロポーショナルフォントであると判定された場合、前記第1の分布についての前記第1の分離度に対応する二つのサブ分布間の境界に相当する前記文字領域間の間隔を前記閾値とする、請求項2に記載の単語間空白検出装置。
- 前記閾値決定部は、前記文字列の表記に用いられているフォントが等ピッチフォントであると判定された場合、前記第2の分布についての前記第2の分離度に対応する二つのサブ分布間の境界に相当する前記重心間の距離を前記閾値とする、請求項2または3に記載の単語間空白検出装置。
- 前記閾値決定部は、前記文字列の表記に用いられているフォントが等ピッチフォントであると判定された場合、前記組ごとに、当該組に含まれる二つの文字の組み合せに応じた補正係数を当該二つの文字の文字領域間の間隔に乗じて補正間隔を求めることにより当該補正間隔の分布を求め、当該補正間隔の分布を判別分析によって二つのサブ分布に分割したときの該二つのサブ分布間の境界に相当する補正間隔を前記閾値として設定し、
前記空白検出部は、前記組のうち、前記補正間隔が前記閾値以上である組に含まれる二つの文字間に単語間の空白を検出する、請求項1に記載の単語間空白検出装置。 - 前記フォント判定部は、前記第1の分布を二つのサブ分布に分割したときの当該二つのサブ分布間の相関比の最大値を前記第1の分離度として算出し、かつ、前記第2の分布を二つのサブ分布に分割したときの当該二つのサブ分布間の相関比の最大値を前記第2の分離度として算出する、請求項1〜5の何れか一項に記載の単語間空白検出装置。
- 媒体上に表された複数の単語を含む文字列を画像として取得し、
前記画像から、前記文字列に含まれる文字ごとに、当該文字に外接する文字領域を検出し、
前記文字列に含まれる、互いに隣接する二つの文字の組ごとに、当該二つの文字についての前記文字領域間の間隔及び当該二つの文字についての前記文字領域の重心間の距離をそれぞれ求めることにより、前記文字領域間の間隔についての第1の分布と、前記重心間の距離についての第2の分布とを求め、
前記文字領域間の間隔に基づく判別分析により前記第1の分布を二つのサブ分布に分割したときの第1の分離度と、前記重心間の距離に基づく判別分析により前記第2の分布を二つのサブ分布に分割したときの第2の分離度とを求め、
前記第1の分離度が前記第2の分離度より大きい場合に前記文字列の表記に用いられているフォントをプロポーショナルフォントと判定し、一方、前記第1の分離度が前記第2の分離度以下である場合に前記文字列の表記に用いられているフォントを等ピッチフォントと判定し、
前記判定されたフォントに従って、単語間の空白を検出するための閾値を設定し、
前記組のうち、前記文字領域間の間隔または前記重心間の距離が前記閾値以上である組に含まれる二つの文字間に単語間の空白を検出する、
ことを含む単語間空白検出方法。 - 媒体上に表された複数の単語を含む文字列を表す画像から、前記文字列に含まれる文字ごとに、当該文字に外接する文字領域を検出し、
前記文字列に含まれる、互いに隣接する二つの文字の組ごとに、当該二つの文字についての前記文字領域間の間隔及び当該二つの文字についての前記文字領域の重心間の距離をそれぞれ求めることにより、前記文字領域間の間隔についての第1の分布と、前記重心間の距離についての第2の分布とを求め、
前記文字領域間の間隔に基づく判別分析により前記第1の分布を二つのサブ分布に分割したときの第1の分離度と、前記重心間の距離に基づく判別分析により前記第2の分布を二つのサブ分布に分割したときの第2の分離度とを求め、
前記第1の分離度が前記第2の分離度より大きい場合に前記文字列の表記に用いられているフォントをプロポーショナルフォントと判定し、一方、前記第1の分離度が前記第2の分離度以下である場合に前記文字列の表記に用いられているフォントを等ピッチフォントと判定し、
前記判定されたフォントに従って、単語間の空白を検出するための閾値を設定し、
前記組のうち、前記文字領域間の間隔または前記重心間の距離が前記閾値以上である組に含まれる二つの文字間に単語間の空白を検出する、
ことをコンピュータに実行させる単語間空白検出用コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011239536A JP5857634B2 (ja) | 2011-10-31 | 2011-10-31 | 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011239536A JP5857634B2 (ja) | 2011-10-31 | 2011-10-31 | 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013097561A JP2013097561A (ja) | 2013-05-20 |
JP5857634B2 true JP5857634B2 (ja) | 2016-02-10 |
Family
ID=48619444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011239536A Active JP5857634B2 (ja) | 2011-10-31 | 2011-10-31 | 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5857634B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015087379A1 (ja) * | 2013-12-09 | 2015-06-18 | 株式会社 東芝 | 手書き文書情報を処理するための電子機器および方法 |
JP6944127B2 (ja) * | 2017-12-22 | 2021-10-06 | ブラザー工業株式会社 | 画像処理装置、コンピュータプログラム、および、画像処理方法 |
CN113780265B (zh) * | 2021-09-16 | 2023-12-15 | 平安科技(深圳)有限公司 | 英文单词的空格识别方法、装置、存储介质及计算机设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2963465B2 (ja) * | 1989-06-23 | 1999-10-18 | 株式会社リコー | スペース検出方法 |
JPH04139594A (ja) * | 1990-10-01 | 1992-05-13 | Fuji Facom Corp | 単語間スペース検出方法 |
JP2915175B2 (ja) * | 1990-10-01 | 1999-07-05 | 株式会社エフ・エフ・シー | 単語間スペース検出方法 |
-
2011
- 2011-10-31 JP JP2011239536A patent/JP5857634B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013097561A (ja) | 2013-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9430704B2 (en) | Image processing system with layout analysis and method of operation thereof | |
US9607237B2 (en) | Image processing apparatus and image processing method | |
US9189694B2 (en) | Image processing device and image processing method | |
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
US10885325B2 (en) | Information processing apparatus, control method, and storage medium | |
CN105303156B (zh) | 字符检测装置、方法及程序 | |
WO2011142977A2 (en) | Segmentation of a word bitmap into individual characters or glyphs during an ocr process | |
US9171224B2 (en) | Method of improving contrast for text extraction and recognition applications | |
US9934429B2 (en) | Storage medium, recognition method, and recognition apparatus | |
WO2015031702A1 (en) | Multiple hypothesis testing for word detection | |
JP2015032087A (ja) | ナンバープレート認識装置およびナンバープレート認識方法 | |
US10380416B2 (en) | Date identifying apparatus, date identifying method, and computer-readable recording medium | |
JP5857634B2 (ja) | 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム | |
CN107368830B (zh) | 文本检测方法和装置以及文本识别系统 | |
US20190057276A1 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
US10217020B1 (en) | Method and system for identifying multiple strings in an image based upon positions of model strings relative to one another | |
Jindal et al. | A new method for segmentation of pre-detected Devanagari words from the scene images: Pihu method | |
JP5347793B2 (ja) | 文字認識装置、文字認識プログラムおよび文字認識方法 | |
Chang et al. | Caption analysis and recognition for building video indexing systems | |
KR20160053544A (ko) | 후보 문자의 추출 방법 | |
CN114882511A (zh) | 基于amnn和汉字结构字典的手写汉字识别方法、系统、设备和存储介质 | |
US11611678B2 (en) | Image processing apparatus and non-transitory computer readable medium | |
KR20140112869A (ko) | 문자 인식 장치 및 방법 | |
JP6310155B2 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
Pan et al. | Effectively leveraging visual context to detect texts in natural scenes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140704 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150414 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5857634 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |