JP2014085841A - 文字切出装置及び文字切出方法並びに文字認識装置 - Google Patents
文字切出装置及び文字切出方法並びに文字認識装置 Download PDFInfo
- Publication number
- JP2014085841A JP2014085841A JP2012234336A JP2012234336A JP2014085841A JP 2014085841 A JP2014085841 A JP 2014085841A JP 2012234336 A JP2012234336 A JP 2012234336A JP 2012234336 A JP2012234336 A JP 2012234336A JP 2014085841 A JP2014085841 A JP 2014085841A
- Authority
- JP
- Japan
- Prior art keywords
- character
- frame
- virtual individual
- candidate segment
- individual frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】文字切出装置を、文字のみが含まれる入力画像を取得する入力画像取得部と、入力画像上で文字枠を再現した仮想個別枠を走査して仮想個別枠の位置を決定する仮想個別枠位置決定部と、入力画像上で文字を形成する画素情報に基づいて行分割位置を検出すると共に、決定された仮想個別枠の位置から取得した各行の位置情報に基づいて検出した行分割位置を検証して決定する行分割位置決定部と、決定された行分割位置で分割された各行の画像から一文字である可能性がある部分画像を基本セグメントとして抽出して、基本セグメント及び複数の基本セグメントを結合したセグメントを候補セグメントとすると共に、候補セグメントのうち一文字である可能性が低い候補セグメントを除外して処理対象とする候補セグメントを決定する候補セグメント決定部とによって構成する。
【選択図】 図1
Description
2 通信部
3 入力画像取得部
10 文字切出部
11 行分割位置決定部
12 仮想個別枠位置決定部
13 候補セグメント決定部
20 メモリ
21 入力画像データ
22 仮想個別枠情報
23 文字認識用テンプレート
30 文字認識部
40 文字認識結果評価部
100 帳票
101 文字枠
102 入力画像
103、103a〜103g 仮想個別枠
200〜204 候補セグメント
Claims (11)
- 文字枠を利用して文字が記入された紙葉類の画像から各文字を含む文字画像を切り出す文字切出装置であって、
紙葉類に記入された文字のみが含まれる入力画像を取得する入力画像取得部と、
前記入力画像上で前記紙葉類の文字枠を再現した仮想個別枠を走査して、各枠内に、対応する各文字が含まれる前記仮想個別枠の位置を決定する仮想個別枠位置決定部と、
画素情報に基づいて前記入力画像を各行の画像に分割する行分割位置を検出すると共に、前記仮想個別枠位置決定部によって決定された前記仮想個別枠の位置から取得した各行の位置情報に基づいて、検出した前記行分割位置を検証して行分割位置を決定する行分割位置決定部と、
前記行分割位置決定部によって決定された行分割位置で行分割された一行の画像から、画素情報に基づいて一文字である可能性がある部分画像を基本セグメントとして抽出して、前記基本セグメント及び複数の基本セグメントを結合したものを候補セグメントとし、前記候補セグメントのうち一文字である可能性が低い候補セグメントを除外して処理対象とする候補セグメントを決定する候補セグメント決定部と
を備えたことを特徴とする文字切出装置。 - 前記仮想個別枠位置決定部は、
前記入力画像上で全ての仮想個別枠の位置関係を維持した状態で走査を行い、
各走査位置で、各仮想個別枠に含まれる文字の画素位置に対応して得られた評価値を全ての仮想個別枠について合計した値を仮想個別枠評価値として算出して、
前記仮想個別枠評価値に基づいて前記仮想個別枠の位置を決定する
ことを特徴とする請求項1に記載の文字切出装置。 - 各仮想個別枠で画素単位で配分される評価値は、枠内中心の画素位置で最大値、枠の外周に接する画素位置で最小値となるように配分されて、前記最小値が前記最大値の略半分以下の所定値に設定されることを特徴とする請求項2に記載の文字切出装置。
- 複数の仮想個別枠で枠の大きさが異なる場合も評価値の最大値は同じ値に設定されることを特徴とする請求項2又は3に記載の文字切出装置。
- 前記候補セグメント決定部は、
前記候補セグメントの中心から各仮想個別枠の中心までの距離に基づいて各候補セグメントに対応する仮想個別枠を選択して、
前記仮想個別枠と対応する前記候補セグメントとの位置関係、及び前記仮想個別枠の枠幅と対応する前記候補セグメントの枠幅との差から候補セグメント評価値を算出して、
前記候補セグメント評価値に基づいて処理対象とする候補セグメントを決定する
ことを特徴とする請求項1に記載の文字切出装置。 - 前記候補セグメント決定部は、
前記仮想個別枠の枠幅、及び前記仮想個別枠に対応する各候補セグメントで算出された前記候補セグメント評価値の値からしきい値を算出して、
各候補セグメントで算出された前記候補セグメント評価値と前記しきい値とを比較して処理対象とする候補セグメントを決定する
ことを特徴とする請求項5に記載の文字切出装置。 - 前記行分割位置決定部は、
前記仮想個別枠の位置に基づいて文字の高さ方向の各行中心位置を検出して、
隣接する行の中心位置の間に検出された前記行分割位置が複数ある場合には、前記行分割位置が1つとなるように余計な行分割位置を削除して、
隣接する行の中心位置の間に前記行分割位置が検出されていない場合には、新たに行分割位置を追加して、
一行目の中心位置の上側及び最終行の中心位置の下側に検出された前記行分割位置がある場合には、前記行分割位置を削除する
ことを特徴とする請求項1〜4のいずれか1項に記載の文字切出装置。 - 文字枠を利用して文字が記入された紙葉類の画像から各文字を含む文字画像を切り出す文字切出方法であって、
紙葉類に記入された文字のみが含まれる入力画像を取得する入力画像取得工程と、
前記入力画像上で前記紙葉類の文字枠を再現した仮想個別枠を走査して、各枠内に、対応する各文字が含まれる前記仮想個別枠の位置を決定する仮想個別枠位置決定工程と、
画素情報に基づいて前記入力画像を各行の画像に分割する行分割工程と、
前記仮想個別枠位置決定工程で決定された前記仮想個別枠の位置から取得した各行の位置情報に基づいて、前記行分割工程で検出した行分割位置を検証して行分割位置を決定する行分割位置決定工程と、
前記行分割位置決定工程で決定された行分割位置により行分割された一行の画像から、画素情報に基づいて一文字である可能性がある部分画像を基本セグメントとして抽出する基本セグメント抽出工程と、
前記基本セグメント抽出工程で抽出された基本セグメントを候補セグメントとすると共に、複数の基本セグメントを結合して候補セグメントを作成する候補セグメント作成工程と、
前記候補セグメント作成工程で作成された候補セグメントのうち一文字である可能性が低い候補セグメントを除外して処理対象とする候補セグメントを決定する候補セグメント決定工程と
を含んだことを特徴とする文字切出方法。 - 前記候補セグメント決定工程では、
前記候補セグメントの中心から各仮想個別枠の中心までの距離に基づいて各候補セグメントに対応する仮想個別枠を選択して、
前記仮想個別枠と対応する前記候補セグメントとの位置関係、及び前記仮想個別枠の枠幅と対応する前記候補セグメントの枠幅との差から候補セグメント評価値を算出して、
前記候補セグメント評価値に基づいて処理対象とする候補セグメントを決定する
ことを特徴とする請求項8に記載の文字切出方法。 - 請求項1〜7のいずれか1項に記載の文字切出装置で処理対象として決定された候補セグメントから、該候補セグメントに含まれる文字を文字認識する文字認識部を備えることを特徴とする文字認識装置。
- 前記候補セグメントと前記仮想個別枠との対応関係に基づいて、一つの仮想個別枠に対応する文字認識結果が複数得られた場合に、文字認識結果に誤りがあると評価する文字認識結果評価部をさらに備えることを特徴とする請求項10に記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012234336A JP6030917B2 (ja) | 2012-10-24 | 2012-10-24 | 文字切出装置及び文字切出方法並びに文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012234336A JP6030917B2 (ja) | 2012-10-24 | 2012-10-24 | 文字切出装置及び文字切出方法並びに文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014085841A true JP2014085841A (ja) | 2014-05-12 |
JP6030917B2 JP6030917B2 (ja) | 2016-11-24 |
Family
ID=50788845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012234336A Active JP6030917B2 (ja) | 2012-10-24 | 2012-10-24 | 文字切出装置及び文字切出方法並びに文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6030917B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991422A (zh) * | 2017-05-02 | 2017-07-28 | 北京京东金融科技控股有限公司 | 字符切割方法、装置及计算机可读存储介质和电子设备 |
KR101937398B1 (ko) | 2017-10-20 | 2019-01-10 | 김학선 | 고문서의 이미지 데이터에서의 문자 추출 시스템 및 이를 이용한 문자 추출 방법 |
KR101985612B1 (ko) * | 2018-01-16 | 2019-06-03 | 김학선 | 종이문서의 디지털화 방법 |
CN111178363A (zh) * | 2019-12-18 | 2020-05-19 | 北京旷视科技有限公司 | 文字识别方法、装置、电子设备以及可读存储介质 |
CN112101386A (zh) * | 2020-09-25 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 文本检测方法、装置、计算机设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06325216A (ja) * | 1993-03-15 | 1994-11-25 | Toshiba Corp | 光学的文字読取装置 |
JPH08243506A (ja) * | 1995-03-14 | 1996-09-24 | Hitachi Ltd | 住所読取り装置及び方法 |
JP2006146741A (ja) * | 2004-11-24 | 2006-06-08 | Hitachi Computer Peripherals Co Ltd | 印字データ読取り方法 |
JP2008107946A (ja) * | 2006-10-24 | 2008-05-08 | Kobe Steel Ltd | 画像の文字列領域決定方法,画像の文字列領域決定装置 |
JP2009069951A (ja) * | 2007-09-11 | 2009-04-02 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識装置における文字認識方法 |
-
2012
- 2012-10-24 JP JP2012234336A patent/JP6030917B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06325216A (ja) * | 1993-03-15 | 1994-11-25 | Toshiba Corp | 光学的文字読取装置 |
JPH08243506A (ja) * | 1995-03-14 | 1996-09-24 | Hitachi Ltd | 住所読取り装置及び方法 |
JP2006146741A (ja) * | 2004-11-24 | 2006-06-08 | Hitachi Computer Peripherals Co Ltd | 印字データ読取り方法 |
JP2008107946A (ja) * | 2006-10-24 | 2008-05-08 | Kobe Steel Ltd | 画像の文字列領域決定方法,画像の文字列領域決定装置 |
JP2009069951A (ja) * | 2007-09-11 | 2009-04-02 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識装置における文字認識方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991422A (zh) * | 2017-05-02 | 2017-07-28 | 北京京东金融科技控股有限公司 | 字符切割方法、装置及计算机可读存储介质和电子设备 |
KR101937398B1 (ko) | 2017-10-20 | 2019-01-10 | 김학선 | 고문서의 이미지 데이터에서의 문자 추출 시스템 및 이를 이용한 문자 추출 방법 |
KR101985612B1 (ko) * | 2018-01-16 | 2019-06-03 | 김학선 | 종이문서의 디지털화 방법 |
CN111178363A (zh) * | 2019-12-18 | 2020-05-19 | 北京旷视科技有限公司 | 文字识别方法、装置、电子设备以及可读存储介质 |
CN111178363B (zh) * | 2019-12-18 | 2024-02-20 | 北京旷视科技有限公司 | 文字识别方法、装置、电子设备以及可读存储介质 |
CN112101386A (zh) * | 2020-09-25 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 文本检测方法、装置、计算机设备和存储介质 |
CN112101386B (zh) * | 2020-09-25 | 2024-04-23 | 腾讯科技(深圳)有限公司 | 文本检测方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6030917B2 (ja) | 2016-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5624671B2 (ja) | 文字列切出方法及び文字列切出装置 | |
JP4694613B2 (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
JP6030917B2 (ja) | 文字切出装置及び文字切出方法並びに文字認識装置 | |
JP3278471B2 (ja) | 領域分割方法 | |
JP4801551B2 (ja) | 画像領域検出方法、該プログラム、及び該装置 | |
US10007846B2 (en) | Image processing method | |
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
JP6220770B2 (ja) | 帳票定義装置、帳票定義方法、及び帳票定義プログラム | |
CN112446262A (zh) | 文本分析方法、装置、终端和计算机可读存储介质 | |
JP5906788B2 (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
US20070041643A1 (en) | Character recognition apparatus and character recognition method | |
CN113378839A (zh) | 信息处理装置、信息处理方法及计算机可读介质 | |
US8989485B2 (en) | Detecting a junction in a text line of CJK characters | |
KR101793184B1 (ko) | 촬영된 음악 악보 영상의 자동연주를 위한 가사 영역 추출장치 및 방법 | |
US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
JP5672059B2 (ja) | 文字認識処理装置および方法並びに文字認識処理プログラム | |
CN113159035A (zh) | 图像处理方法、装置、设备及存储介质 | |
JP4696239B2 (ja) | 文字列の傾斜補正方法及び装置 | |
JP7243981B2 (ja) | 紙面領域分類装置及びそのプログラム | |
US20100238470A1 (en) | Document image processing system and document image processing method | |
JP4803001B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5109548B2 (ja) | 画像処理装置及びプログラム | |
JP2008269131A (ja) | 画像処理装置及び画像処理プログラム | |
JP2000357287A (ja) | ナンバープレート認識方法および認識装置 | |
JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150914 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160927 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161021 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6030917 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |