JP5812702B2 - 文字の読み順を決定するための読み順決定装置、方法及びプログラム - Google Patents
文字の読み順を決定するための読み順決定装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5812702B2 JP5812702B2 JP2011128213A JP2011128213A JP5812702B2 JP 5812702 B2 JP5812702 B2 JP 5812702B2 JP 2011128213 A JP2011128213 A JP 2011128213A JP 2011128213 A JP2011128213 A JP 2011128213A JP 5812702 B2 JP5812702 B2 JP 5812702B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- information
- line
- list
- line frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
calss Symbol {
char character;
int x, y, width, height;
}
class Page{
Symbol[] symbols;
}
calss Line {
int x, y, width, height;
int dx, dy
}
class Order{
Line[] lines;
}
Claims (12)
- 文字の読み順を決定するための読み順決定装置であって、
画像データから文字認識処理により抽出された各文字のテキスト・データ及び文字領域データからなる文字情報が文字の読み順に並んだリストである文字情報のリストを格納する文字情報格納部と、
前記画像データにおいて同一方向に連続して並んでいる文字の集合を囲む行枠及び該行枠内における文字の並び方向からなる行情報が行の並び順にリストされた行情報のリストを格納する行情報格納部と、
前記文字情報のリストに対する文字情報の追加要求に応答して、前記行情報のリストから、追加された前記文字情報の文字領域データが示す領域を包含する行枠を有する行情報を検出する検出手段と、
前記検出手段より検出された前記行情報の前記行枠に包含される領域を示す文字領域データの部分集合を、前記文字情報のリストから求める部分集合決定手段と、
前記部分集合内の各文字領域データを、検出された前記行情報の前記文字の並び方向に対する位置に従って並び替える並び替え手段と、
前記部分集合内の文字領域データの並び順に基づいて前記文字情報のリストを更新することにより、前記文字情報のリストにおける文字の読み順を決定する順序決定手段と、
を含む読み順決定装置。 - 前記文字情報のリストの先頭から順に文字領域データを読み出して現在の文字領域とし、最初の文字領域データで行枠候補を初期化すると共に最初の2つの文字領域データによって前記行枠候補における文字の並び方向を決定し、該文字の並び方向に前記現在の文字領域が存在しなくなるまで、前記行枠候補を前記現在の文字領域を更に包含する最小の行枠に拡張する行枠候補生成手段と、前記文字の並び方向に前記現在の文字領域が存在しなくなったことに応答して、現在の前記行枠候補を対応する前記文字の並び方向と共に行情報として前記行情報のリストに登録する行情報登録手段とを更に含み、前記行枠候補生成手段は、前記文字の並び方向に前記現在の文字領域が存在しなくなったことに応答して、前記現在の文字領域を前記文字情報のリストの先頭として一連の処理を繰り返す、請求項1に記載の読み順決定装置。
- 現在の前記行枠候補又は前記行情報のリストに登録された過去の前記行枠候補のいずれかに前記現在の文字領域が包含されることを条件に、前記行枠候補生成手段により現在の前記行枠候補を拡張する代わりに前記現在の文字領域を包含する前記行枠候補を、対応する文字の並び方向に対して垂直かつ前記現在の文字領域の中心点を基準に分割し、分割した行枠候補を該行枠候補に包含される文字領域データに基づいて修正し、分割により包含されなくなった各文字領域に対し該文字領域を行枠とする行情報を生成する行枠候補修正手段を更に含む、請求項2に記載の読み順決定装置。
- 前記文字情報のリストの先頭から順に文字領域データを読み出して現在の文字領域とし、最初の文字領域データで行枠候補を初期化すると共に最初の2つの文字領域データによって前記行枠候補における文字の並び方向を決定し、前記行枠候補を前記現在の文字領域を更に含む最小の行枠に拡張する拡張処理を一定の条件の下に実行する行枠候補生成手段と、前記行枠候補生成手段による前記拡張処理の実行前に、拡張によって生成されることになる行枠候補と前記文字の並び方向とを基に文字の読み順が正しく決定されることを確認する確認部と、前記確認部による確認の失敗に応答して、現在の前記行枠候補を対応する前記文字の並び方向と共に行情報として前記行情報のリストに登録する行情報登録手段とを更に含み、前記行枠候補生成手段は、前記確認部による確認の成功を条件として前記拡張処理を実行し、前記確認が失敗した場合は、前記現在の文字領域を前記文字情報のリストの先頭として処理を繰り返す、請求項1に記載の読み順決定装置。
- 前記画像データは、文書の1頁分の画像データ又は文書の1頁内のまとまりある領域の画像データである、請求項1に記載の読み順決定装置。
- ユーザから、前記文字情報のリストへの文字情報の追加指示と共に、テキスト・データ及び対応する文字領域データを文字情報として受け取り、該文字情報を前記文字情報のリストの先頭又は最後尾に追加する修正手段を更に含む、請求項1に記載の読み順決定装置。
- 文字の読み順を決定するための読み順決定装置であって、
画像データから文字認識処理により抽出された各文字のテキスト・データ及び文字領域データからなる文字情報のリストである文字情報のリストを格納する文字情報格納部と、 前記画像データにおいて同一方向に連続して並んでいる文字の集合を囲む行枠及び該行枠内における文字の並び方向からなる行情報が行の並び順にリストされた行情報のリストを格納する行情報格納部と、
前記行情報のリストから行情報を読み出して、読み出した前記行情報の行枠に包含される領域を示す文字領域データの部分集合を、前記文字情報のリストから求める部分集合決定手段と、
前記部分集合内の各文字領域データを、対応する前記行情報の前記文字の並び方向に対する位置に従って並び替える並び替え手段と、
行情報ごとの並び替えられた前記文字領域データの部分集合を前記行の並びに順に繋ぎ合わせることにより、前記文字情報のリストにおける文字の読み順を決定する順序決定手段と、
を含む読み順決定装置。 - コンピュータの演算処理により、文字の読み順を決定する読み順決定方法であって、前記コンピュータは、画像データから文字認識処理により抽出された各文字のテキスト・データ及び文字領域データからなる文字情報が文字の読み順に並んだリストである文字情報のリストを格納する文字情報格納部と、前記画像データにおいて同一方向に連続して並んでいる文字の集合を囲む行枠及び該行枠内における文字の並び方向からなる行情報が行の並び順にリストされた行情報のリストを格納する行情報格納部にアクセス可能であり、
(a)前記コンピュータが、前記文字情報のリストに対する文字情報の追加要求に応答して、前記行情報のリストから、追加された前記文字情報の文字領域データが示す領域を包含する行枠を有する行情報を検出するステップと、
(b)前記コンピュータが、前記検出するステップにおいて検出された前記行情報の前記行枠に包含される領域を示す文字領域データの部分集合を、前記文字情報のリストから求めるステップと、
(c)前記コンピュータが、前記部分集合内の各文字領域データを、検出された前記行情報の前記文字の並び方向に対する位置に従って並び替えるステップと、
(d)前記コンピュータが、前記部分集合内の文字領域データの並び順に基づいて前記文字情報のリストを更新することにより、前記文字情報のリストにおける文字の読み順を決定するステップと、
を含む読み順決定方法。 - ステップ(a)乃至(d)の処理の前に、前記文字情報のリストに基づいて前記行情報のリストを作成するために、(e)前記コンピュータが、前記文字情報のリストの先頭から順に文字領域データを読み出して現在の文字領域とし、最初の文字領域データで行枠候補を初期化すると共に最初の2つの文字領域データによって前記行枠候補における文字の並び方向を決定し、該文字の並び方向に前記現在の文字領域が存在しなくなるまで、前記行枠候補を前記現在の文字領域を更に包含する最小の行枠に拡張するステップと、(f)前記コンピュータが、前記文字の並び方向に前記現在の文字領域が存在しなくなったことに応答して、現在の前記行枠候補を対応する前記文字の並び方向と共に行情報として前記行情報のリストに登録するとともに、前記現在の文字領域を前記文字情報のリストの先頭としてステップ(e)及び(f)の処理を繰り返すステップとをさらに含む、請求項8に記載の読み順決定方法。
- ステップ(e)は、前記コンピュータが、現在の前記行枠候補又は前記行情報のリストに登録された既存の前記行枠候補のいずれかに前記現在の文字領域が含まれることを条件に、現在の前記行枠候補を拡張する代わりに前記現在の文字領域を包含する前記行枠候補を、対応する文字の並び方向に対して垂直かつ前記現在の文字領域の中心点を基準に分割し、分割した行枠候補を該行枠候補に包含される文字領域データに基づいて修正し、分割により包含されなくなった各文字領域に対し該文字領域を行枠とする行情報を生成するステップを含む、請求項9に記載の読み順決定方法。
- ステップ(a)乃至(d)の処理の前に、前記文字情報のリストに基づいて前記行情報のリストを作成するために、(e)前記コンピュータが、前記文字情報のリストの先頭から順に文字領域データを読み出して現在の文字領域とし、最初の文字領域データで行枠候補を初期化すると共に最初の2つの文字領域データによって前記行枠候補における文字の並び方向を決定し、前記行枠候補を前記現在の文字領域を更に包含する最小の行枠に拡張する拡張処理を、拡張によって生成される行枠候補と前記文字の並び方向とを基に文字の読み順が正しく決定されることを条件に実行するステップと、(f)前記コンピュータが、前記拡張処理の不実行に応答して、現在の前記行枠候補を対応する前記文字の並び方向と共に行情報として前記行情報のリストに登録するとともに、前記現在の文字領域を前記文字情報のリストの先頭としてステップ(e)の処理を繰り返すステップとをさらに含む、請求項8に記載の読み順決定方法。
- 請求項8乃至11のいずれか一項に記載の読み順決定方法をコンピュータに実行させる、文字の読み順を決定する読み順決定プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011128213A JP5812702B2 (ja) | 2011-06-08 | 2011-06-08 | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
US13/488,645 US8989494B2 (en) | 2011-06-08 | 2012-06-05 | Reading order determination apparatus, method, and program for determining reading order of characters |
US13/599,242 US9014478B2 (en) | 2011-06-08 | 2012-08-30 | Reading order determination apparatus, method, and program for determining reading order of characters |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011128213A JP5812702B2 (ja) | 2011-06-08 | 2011-06-08 | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012256160A JP2012256160A (ja) | 2012-12-27 |
JP5812702B2 true JP5812702B2 (ja) | 2015-11-17 |
Family
ID=47293897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011128213A Expired - Fee Related JP5812702B2 (ja) | 2011-06-08 | 2011-06-08 | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US8989494B2 (ja) |
JP (1) | JP5812702B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5812702B2 (ja) | 2011-06-08 | 2015-11-17 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
JP2014197341A (ja) * | 2013-03-29 | 2014-10-16 | 富士フイルム株式会社 | 電子書籍制作装置、電子書籍システム、電子書籍制作方法及びプログラム |
US10713519B2 (en) * | 2017-06-22 | 2020-07-14 | Adobe Inc. | Automated workflows for identification of reading order from text segments using probabilistic language models |
CN111832497B (zh) * | 2020-07-17 | 2022-06-28 | 西南大学 | 一种基于几何特征的文本检测后处理方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0797390B2 (ja) * | 1985-08-20 | 1995-10-18 | 松下電器産業株式会社 | 文字認識装置 |
US5553217A (en) * | 1993-09-23 | 1996-09-03 | Ricoh Company, Ltd. | Document layout using tiling |
JP3548234B2 (ja) * | 1994-06-29 | 2004-07-28 | キヤノン株式会社 | 文字認識方法及び装置 |
JPH08329191A (ja) * | 1995-05-31 | 1996-12-13 | Toshiba Corp | 文字列切り出し方法 |
JP2000181989A (ja) * | 1998-12-18 | 2000-06-30 | Matsushita Electric Ind Co Ltd | 文字認識装置及びその方法並びにその方法をプログラムとして記録したコンピュータ読み取り可能な記録媒体 |
US20040205568A1 (en) * | 2002-03-01 | 2004-10-14 | Breuel Thomas M. | Method and system for document image layout deconstruction and redisplay system |
JP2005043990A (ja) * | 2003-07-23 | 2005-02-17 | Toshiba Corp | 文書処理装置および文書処理方法 |
JP4213558B2 (ja) * | 2003-10-17 | 2009-01-21 | 富士通株式会社 | 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 |
US8948511B2 (en) * | 2005-06-02 | 2015-02-03 | Hewlett-Packard Development Company, L.P. | Automated document processing system |
US7697757B2 (en) * | 2005-06-15 | 2010-04-13 | Hewlett-Packard Development Company, L.P. | Computer assisted document modification |
EP1907946B1 (en) * | 2005-07-27 | 2011-10-26 | Hewlett-Packard Development Company, L.P. | A method for finding text reading order in a document |
JP4856925B2 (ja) * | 2005-10-07 | 2012-01-18 | 株式会社リコー | 画像処理装置、画像処理方法及び画像処理プログラム |
JP4756650B2 (ja) | 2007-03-14 | 2011-08-24 | 株式会社リコー | 画像処理装置、読み順設定方法及びプログラム |
JP4549400B2 (ja) * | 2008-03-04 | 2010-09-22 | 富士通株式会社 | 文書認識プログラム、文書認識装置、および文書認識方法 |
JP5044579B2 (ja) | 2009-01-27 | 2012-10-10 | 東京エレクトロン株式会社 | 薄膜形成装置の洗浄方法、薄膜形成方法、薄膜形成装置及びプログラム |
JP5321109B2 (ja) * | 2009-02-13 | 2013-10-23 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP5005005B2 (ja) * | 2009-07-30 | 2012-08-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | コンテンツ読み上げ順序を視覚化するための視覚化プログラム、視覚化方法、及び視覚化装置 |
US8594422B2 (en) * | 2010-03-11 | 2013-11-26 | Microsoft Corporation | Page layout determination of an image undergoing optical character recognition |
JP5812702B2 (ja) | 2011-06-08 | 2015-11-17 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 文字の読み順を決定するための読み順決定装置、方法及びプログラム |
-
2011
- 2011-06-08 JP JP2011128213A patent/JP5812702B2/ja not_active Expired - Fee Related
-
2012
- 2012-06-05 US US13/488,645 patent/US8989494B2/en not_active Expired - Fee Related
- 2012-08-30 US US13/599,242 patent/US9014478B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8989494B2 (en) | 2015-03-24 |
US9014478B2 (en) | 2015-04-21 |
US20120321191A1 (en) | 2012-12-20 |
US20120316864A1 (en) | 2012-12-13 |
JP2012256160A (ja) | 2012-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102289667B (zh) | 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正 | |
JP4973063B2 (ja) | 表データ処理方法及び装置 | |
JP5812702B2 (ja) | 文字の読み順を決定するための読み順決定装置、方法及びプログラム | |
US20090226090A1 (en) | Information processing system, information processing apparatus, information processing method, and storage medium | |
US20090208107A1 (en) | Character recognition apparatus and character recognition method | |
JP4834351B2 (ja) | 文字認識装置及び文字認識方法 | |
CN107533652B (zh) | 识别装置、识别方法及记录介质 | |
JP6931168B2 (ja) | 情報処理装置、制御方法、プログラム | |
KR102300464B1 (ko) | 교정부호가 삽입된 텍스트를 기반으로 구축된 교정 데이터베이스를 활용한 문장 자동 교정 장치 및 그 동작 방법 | |
JP2007241428A (ja) | 画像処理装置及びプログラム | |
KR101790544B1 (ko) | 정보 처리 장치, 정보 처리 방법, 및 기억 매체 | |
JP2018163426A (ja) | 情報提示装置、情報提示方法及びプログラム | |
JP4357226B2 (ja) | 帳票定義装置、帳票定義方法及び帳票定義プログラム | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPH0981689A (ja) | 文字認識方法とその装置 | |
CN107533651B (zh) | 识别装置、识别方法及计算机可读取的记录介质 | |
JP6950436B2 (ja) | 画像キャプチャ用コンピュータプログラム、画像キャプチャ装置及び画像キャプチャ方法 | |
JP4153850B2 (ja) | 画像処理装置、画像処理プログラム | |
JP2005043995A (ja) | 情報処理装置、文字認識プログラム及び記録媒体 | |
JP4633773B2 (ja) | 文書画像処理装置および方法 | |
CN115410206A (zh) | 信息处理装置、记录介质及信息处理方法 | |
JP4781163B2 (ja) | 設計検証装置、設計検証プログラム、および設計検証プログラムを記録する記録媒体 | |
JP6334209B2 (ja) | 認識装置、認識方法およびプログラム | |
JP2007221293A (ja) | 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム | |
JP2008312063A (ja) | 情報処理装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150806 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150825 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5812702 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |