JP6754120B2 - プログラム、情報記憶媒体及び文字分割装置 - Google Patents
プログラム、情報記憶媒体及び文字分割装置 Download PDFInfo
- Publication number
- JP6754120B2 JP6754120B2 JP2016197893A JP2016197893A JP6754120B2 JP 6754120 B2 JP6754120 B2 JP 6754120B2 JP 2016197893 A JP2016197893 A JP 2016197893A JP 2016197893 A JP2016197893 A JP 2016197893A JP 6754120 B2 JP6754120 B2 JP 6754120B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- segment
- division
- line
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000010586 diagram Methods 0.000 claims description 7
- 238000000638 solvent extraction Methods 0.000 claims description 4
- 238000003384 imaging method Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 50
- 238000000034 method Methods 0.000 description 42
- 230000006870 function Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Description
グラムに基づき前記行画像を分割してセグメント画像を生成する第1分割部と、前記第1分割部で分割されたセグメント画像のうち、前記並び方向の幅が所与の閾値よりも大きなセグメント画像を分割する第2分割部としてコンピュータを機能させ、前記第2分割部は、前記セグメント画像を細線化して細線化画像を生成し、前記セグメント画像の前記射影ヒストグラムにおいて、前記セグメント画像の前記並び方向の幅から推定される文字数分の局所ピークを検出し、前記細線化画像における前記局所ピークの位置に、前記並び方向に垂直な線分を描画し、前記線分が描画された前記細線化画像において、隣接する前記線分間を連結する経路を探索し、探索した経路上に存在する分岐点を削除し、前記分岐点が削除された前記細線化画像を領域分割し、領域分割により得られた境界に基づき前記セグメント画像を分割するプログラムに関する。また、本発明は、コンピュータ読み取り可能な情報記憶媒体であって、上記各部としてコンピュータを機能させるためのプログラムを記憶した情報記憶媒体に関係する。また、本発明は、上記各部を含む文字分割装置に関係する。
れる構成の全てが、本発明の必須構成要件であるとは限らない。
図1に本実施形態の文字分割装置の機能ブロック図の一例を示す。なお本実施形態の文字分割装置は図1の構成要素(各部)の一部を省略した構成としてもよい。
次に本実施形態の手法について図面を用いて説明する。
あることを前提とする。多値画像の場合は、多値画像を2値化して以降の処理を行うか、あるいは、以降の処理の途中で、白(画素値は0)以外の多値画素(画素値は1以上)を黒(画素値1)と変換して扱う。カラー画像の場合は、2値化、あるいは、グレースケールの多値画像に変換してから適用すればよい。
図3は、第1分割部112による粗分割処理の流れを示すフローチャートである。第1分割部112は、以降の処理を、文書画像を分割して得られた全ての行画像LIに対して行う。
の射影プロファイルを示す。次に、生成した射影ヒストグラムにおいて射影値Proj(x)が0となるx軸(水平軸)上の位置で、行画像LIを分割する(ステップS25)。この処理により、水平方向に間隔の空いた文字の組み合わせを分割することができる。なお、多値画像の場合は、射影値Proj(x)の計算において、画素(x,y)における画素値が白以外ならば1、白画素であれば0とするのは、先と同じである。
図6は、第2分割部114による細分割処理の流れを示すフローチャートである。第2分割部114は、以降の処理を、全ての行画像LIに含まれる全ての過大セグメント画像SI’に対して行う。
る(ステップS33)。図5の(c)に示すセグメント画像SI2では、文字数WCが4個と推定されたため、図5の(b)に示す射影プロファイルにおいて4個の局所ピークLPが検出されている。次に、細線化画像TIにおける局所ピークLPの位置に垂直線分VLを描画する(ステップS34)。なお、縦書き文字を処理対象とする場合には、局所ピークLPの位置に水平線分を描画する
図7に、図5の(c)に示すセグメント画像SI2を細線化した細線化画像TIと、細線化画像TIに描画された垂直線分VLを示す。この例では、細線化画像TIに対して、4個の局所ピークLPの位置(文字の凡そ中心位置)に4本の垂直線分VL1、VL2、VL3、VL4が描画されている。
る。
図2のステップS40では、認識部116は、行画像LI(及び過大セグメント画像SI’)を粗分割して得られたセグメント画像SIと、過大セグメント画像SI’を細分割して得られたセグメント画像SI(削除する分岐点BPの組み合わせ毎に分割して得られたセグメント画像を含む)、及び、セグメント画像SIを所与の制限幅になるまでの範囲で結合した画像に対して文字認識を行って、複数の認識候補列を生成する。制限幅は、例えば、平均文字幅AveSizeに、予め学習した1以上の係数を掛けた値とする。そして、認識部116は、複数の認識候補列について複数項目の確からしさを評価し、評価結果に基づき文字列を認識する。行画像LIがn個のセグメント画像(SI1、SI2,...SIn)に分割されたとすると、それぞれのセグメント画像と、制限幅になるまでの範囲で結合したセグメント画像とを文字認識すると、ある認識候補列Cは、C=c1、c2,...cm(m≦n)で表される。
本実施形態の手法を評価する実験を行った。まず、手書き日本語文書パターンを収集するために、25人(うち、2人が左利き、1人が女性)の日本人に青空文庫の文章を筆記してもらった。得られた45ページ(426行、11,550文字)の手書き文書をスキャナーで読み込み、文字同士が接触している箇所ごとに、接触した文字のコード、正確な接触位置、許容できる接触位置の情報を付加した。図14に、正確な接触位置をグレーで示し、許容できる接触位置を白抜き線で示す。図14に示すように、許容できる接触位置は、この範囲で分割が行われれば両側の文字を問題なく認識できる領域を示している。この結果、合計で1,871個の接触ペア(接触した一対の文字)を収集した。このうち、1,552個の接触ペアは1箇所で接触しており、319個の接触ペアは2箇所以上で接触している。この標本パターンの集合を「OffTouchDB」と呼ぶ。
認識部、120 表示制御部、160 入力部、170 記憶部、190 表示部
Claims (10)
- 手書き文書を撮像して得られた文書画像を行ごとに分割して行画像を取得し、前記行画像を文字ごとに分割するためのプログラムであって、
前記行画像について文字列の並び方向に垂直な方向の射影ヒストグラムを生成し、生成した前記射影ヒストグラムに基づき前記行画像を分割してセグメント画像を生成する第1分割部と、
前記第1分割部で分割して得られたセグメント画像のうち、前記並び方向の幅が所与の閾値よりも大きなセグメント画像である過大セグメント画像を分割してセグメント画像を生成する第2分割部としてコンピュータを機能させ、
前記第2分割部は、
前記過大セグメント画像を細線化して細線化画像を生成し、
前記過大セグメント画像の前記射影ヒストグラムにおいて、前記過大セグメント画像の前記並び方向の幅から推定される文字数分の局所ピークを検出し、前記細線化画像における前記局所ピークの位置に、前記並び方向に垂直な線分を描画し、
前記線分が描画された前記細線化画像において、隣接する前記線分間を連結する経路を探索し、探索した経路上に存在する分岐点を削除し、
前記分岐点が削除された前記細線化画像を領域分割し、領域分割により得られた境界に基づき前記過大セグメント画像を分割することを特徴とするプログラム。 - 請求項1において、
前記第1分割部で分割して得られた前記セグメント画像、前記第2分割部で分割して得られた前記セグメント画像、及び前記並び方向の幅が所与の幅になるまでの範囲で前記セグメント画像を結合した画像に対して文字認識を行って複数の認識候補列を生成し、各認識候補列の確からしさを示すスコアに基づき複数の認識候補列から1つの認識候補列を選択する認識部として更にコンピュータを機能させることを特徴とするプログラム。 - 請求項1又は2において、
前記第1分割部は、
前記行画像を、当該行画像の前記射影ヒストグラムにおいて射影値が0となる位置で分
割してセグメント画像を生成し、前記行画像の高さに基づき平均文字幅を推定し、前記文書画像から平均筆画幅を推定し、前記並び方向の幅が前記平均文字幅に基づく閾値よりも大きな前記セグメント画像である過大セグメント画像を、当該過大セグメント画像の前記射影ヒストグラムにおいて射影値が前記平均筆画幅に基づく値未満となる位置で分割することを特徴とするプログラム。 - 請求項1乃至3のいずれか1項において、
前記第2分割部は、
前記細線化画像において、隣接する前記線分間を連結する最短経路を探索して経路上に存在する分岐点を削除し、次の最短経路を探索して次の分岐点を削除することを繰り返すことを特徴とするプログラム。 - 請求項4において、
前記第2分割部は、
前記細線化画像において、隣接する前記線分間を連結する最短経路ごとに複数の分岐点を探索し、最短経路ごとに一つずつの分岐点を組み合わせて、当該分岐点の組み合わせを用いて最短経路を切断した前記細線化画像を領域分割することを特徴とするプログラム。 - 請求項1乃至5のいずれか1項において、
前記第2分割部は、
前記分岐点が削除された前記細線化画像をボロノイ分割し、ボロノイ分割により得られたボロノイ境界に基づき前記過大セグメント画像を分割することを特徴とするプログラム。 - 請求項6において、
前記第2分割部は、
前記ボロノイ分割により生成されたボロノイ境界のうち、領域を上部と下部に分断するボロノイ境界を除くボロノイ境界に基づいて、前記過大セグメント画像を分割することを特徴とするプログラム。 - 請求項6又は7において、
前記第2分割部は、
前記ボロノイ分割により生成されたボロノイ境界のうち、第1の閾値T1よりも小さい領域と第2の閾値T2(T2>T1)よりも大きい領域に分断するボロノイ境界を除くボロノイ境界に基づいて、前記過大セグメント画像を分割することを特徴とするプログラム。 - コンピュータ読み取り可能な情報記憶媒体であって、請求項1乃至8のいずれか1項のプログラムを記憶したことを特徴とする情報記憶媒体。
- 手書き文書を撮像して得られた文書画像を行ごとに分割して行画像を取得し、前記行画像を文字ごとに分割する文字分割装置であって、
前記行画像について文字列の並び方向に垂直な方向の射影ヒストグラムを生成し、生成した前記射影ヒストグラムに基づき前記行画像を分割してセグメント画像を生成する第1分割部と、
前記第1分割部で分割して得られたセグメント画像のうち、前記並び方向の幅が所与の閾値よりも大きなセグメント画像である過大セグメント画像を分割してセグメント画像を生成する第2分割部とを含み、
前記第2分割部は、
前記過大セグメント画像を細線化して細線化画像を生成し、
前記過大セグメント画像の前記射影ヒストグラムにおいて、前記過大セグメント画像の前記並び方向の幅から推定される文字数分の局所ピークを検出し、前記細線化画像における前記局所ピークの位置に、前記並び方向に垂直な線分を描画し、
前記線分が描画された前記細線化画像において、隣接する前記線分間を連結する経路を探索し、探索した経路上に存在する分岐点を削除し、
前記分岐点が削除された前記細線化画像を領域分割し、領域分割により得られた境界に基づき前記過大セグメント画像を分割することを特徴とする文字分割装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016197893A JP6754120B2 (ja) | 2016-10-06 | 2016-10-06 | プログラム、情報記憶媒体及び文字分割装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016197893A JP6754120B2 (ja) | 2016-10-06 | 2016-10-06 | プログラム、情報記憶媒体及び文字分割装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018060389A JP2018060389A (ja) | 2018-04-12 |
JP6754120B2 true JP6754120B2 (ja) | 2020-09-09 |
Family
ID=61908569
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016197893A Expired - Fee Related JP6754120B2 (ja) | 2016-10-06 | 2016-10-06 | プログラム、情報記憶媒体及び文字分割装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6754120B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7052476B2 (ja) | 2018-03-27 | 2022-04-12 | 三菱電機株式会社 | 半導体装置 |
CN109359529B (zh) * | 2018-09-11 | 2021-11-30 | 北京语言大学 | 长笔段的处理方法和装置 |
US11367296B2 (en) | 2020-07-13 | 2022-06-21 | NextVPU (Shanghai) Co., Ltd. | Layout analysis |
CN116057582A (zh) * | 2020-08-31 | 2023-05-02 | 富士通先端科技株式会社 | 序列号识别参数确定装置、序列号识别参数确定程序及纸张处理系统 |
CN112257715A (zh) * | 2020-11-18 | 2021-01-22 | 西南交通大学 | 一种粘连字符识别方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3260843B2 (ja) * | 1992-08-25 | 2002-02-25 | 株式会社リコー | 文字認識方法 |
JP3798179B2 (ja) * | 1999-05-14 | 2006-07-19 | 富士通株式会社 | パターン抽出装置及び文字切り出し装置 |
JP2009199102A (ja) * | 2008-02-19 | 2009-09-03 | Fujitsu Ltd | 文字認識プログラム、文字認識装置及び文字認識方法 |
-
2016
- 2016-10-06 JP JP2016197893A patent/JP6754120B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2018060389A (ja) | 2018-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
JP6754120B2 (ja) | プログラム、情報記憶媒体及び文字分割装置 | |
US7437001B2 (en) | Method and device for recognition of a handwritten pattern | |
JP6951905B2 (ja) | 手書きテキスト画像に対する行及び単語切り出し方法 | |
RU2621601C1 (ru) | Устранение искривлений изображения документа | |
KR100587540B1 (ko) | 디지털 잉크 질의 검색 장치 및 방법 | |
JPH0676114A (ja) | 文字認識方法 | |
US20010033694A1 (en) | Handwriting recognition by word separation into sillouette bar codes and other feature extraction | |
Abdalkafor | Designing offline Arabic handwritten isolated character recognition system using artificial neural network approach | |
Yadav et al. | A robust approach for offline English character recognition | |
CN102782705B (zh) | 包括经历ocr处理的文本的图像的分辨率调整 | |
JP5623574B2 (ja) | 帳票識別装置および帳票識別方法 | |
Fan et al. | A run-length-coding-based approach to stroke extraction of Chinese characters | |
Verma et al. | Removal of obstacles in Devanagari script for efficient optical character recognition | |
KR20010015025A (ko) | 문자인식장치의 문자추출방법 및 장치 | |
Thungamani | A survey of methods and strategies in handwritten kannada character segmentation | |
Madhavaraj et al. | Improved recognition of aged Kannada documents by effective segmentation of merged characters | |
Nguyen et al. | An effective method for text line segmentation in historical document images | |
JP6310155B2 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
JP5414631B2 (ja) | 文字列探索方法、文字列探索装置、記録媒体 | |
Amrouch et al. | A novel feature set for recognition of printed amazigh text using maximum deviation and hmm | |
JP3798179B2 (ja) | パターン抽出装置及び文字切り出し装置 | |
JP5729260B2 (ja) | 文字認識用コンピュータプログラム、文字認識装置及び文字認識方法 | |
Ye et al. | Document image matching and annotation lifting | |
JP2006235817A (ja) | 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20161018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20161018 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190527 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200817 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6754120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |