JP2010102709A - 文字列認識方法、文字列認識システム及び文字列認識プログラム用記録媒体 - Google Patents
文字列認識方法、文字列認識システム及び文字列認識プログラム用記録媒体 Download PDFInfo
- Publication number
- JP2010102709A JP2010102709A JP2009241530A JP2009241530A JP2010102709A JP 2010102709 A JP2010102709 A JP 2010102709A JP 2009241530 A JP2009241530 A JP 2009241530A JP 2009241530 A JP2009241530 A JP 2009241530A JP 2010102709 A JP2010102709 A JP 2010102709A
- Authority
- JP
- Japan
- Prior art keywords
- ocr
- character string
- area
- image
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
【解決手段】(a)文書の文書構造を分析し、テキスト領域とイメージ/ノイズ領域に分類するステップと、(b)第1のOCRを用いて、テキスト領域内に含まれている文字列を認識するステップと、(c)言語モデルによって、テキスト領域のうち、テキスト領域に誤分類された特定領域に含まれている文字列を見出し、第1のOCRから得られた特定領域に対する位置情報を参照し、特定領域をイメージ/ノイズ領域に再分類するステップと、(d)ステップ(a)乃至ステップ(c)で分類されたイメージ/ノイズ領域に対して、第2のOCRを用いて、イメージ/ノイズ領域に含まれている文字列を認識するステップと、を含む方法。
【選択図】図3
Description
図1は、本発明の一実施形態による光学式文字認識システム100の構成を例示的に示す図である。
また、本発明の一実施形態による制御部150は、文書情報入力部110、文書構造分析部120、テキストOCR部130、イメージOCR部140、及び通信部160間のデータの流れを制御する。
図3は、本発明の一実施形態によって、テキスト領域及びイメージ領域からなる文書に含まれている文字列を認識する過程を具体的に示す図である。
ステップS120において、上記したステップにより分類されたテキスト領域を分析し、テキスト領域内に含まれている文字列に関する情報を認識する。
テキスト領域と判断された領域のうち、特定領域をテキスト領域から除外するステップS130が行われる。
文書構造分析部120とテキストOCR部130によって、テキスト領域から除外された特定領域をイメージ/ノイズ領域に併合するステップS140が行われる。
ステップS150において、上記併合されたイメージ/ノイズ領域を、イメージに特化した光学式文字読取装置を備えるイメージOCR部140によって分析し、イメージ/ノイズ領域内に存在する文字列を認識する。
」や「
」は、ノイズと判断され、OCR結果から除去され得る。
ステップS160において、テキスト領域において認識された文字列と、前記イメージ/ノイズ領域において認識された文字列とを併合する。
110 文書情報入力部
120 文書構造分析部
130 テキストOCR部
131 セグメンテーション部
132 文字正規化部
133 文字認識部
140 イメージOCR部
150 制御部
160 通信部
Claims (12)
- 文書に含まれている文字列を認識する方法であって、
(a)前記文書の文書構造を分析し、テキスト領域とイメージ/ノイズ領域とに分類するステップと、
(b)第1のOCRを用いて、前記テキスト領域内に含まれている文字列を認識するステップと、
(c)言語モデルによって、前記テキスト領域のうち、前記テキスト領域に誤分類された特定領域に含まれている文字列を見出し、前記第1のOCRから得られた前記特定領域の位置情報を参照し、前記特定領域を前記イメージ/ノイズ領域に再分類するステップと、
(d)前記ステップ(a)及び前記ステップ(c)で分類されたイメージ/ノイズ領域に対して、第2のOCRを用いて、前記イメージ/ノイズ領域に含まれている文字列を認識するステップと、
を含むことを特徴とする文字列認識方法。 - 前記第1のOCRは、一般テキストに特化したOCRであり、前記第2のOCRは、イメージに特化したOCRであることを特徴とする請求項1に記載の文字列認識方法。
- 前記ステップ(b)及び前記ステップ(d)で認識された結果を併合して提供するステップ(e)をさらに含むことを特徴とする請求項1または請求項2に記載の文字列認識方法。
- 前記特定領域は、
前記テキスト領域中の文字を認識した結果に対して距離値を求めた場合に距離値が特定の閾値を超える文字を含む領域であることを特徴とする請求項1から請求項3のいずれかに記載の文字列認識方法。 - 前記ステップ(d)は、
ワード単位でノイズを判断し、前記認識された文字列からノイズを除去するステップを含むことを特徴とする請求項1から請求項4のいずれかに記載の文字列認識方法。 - 請求項1から請求項5のいずれかに記載の方法を実行するためのコンピュータプログラムを記録したことを特徴とするコンピュータで読み取り可能な文字列認識プログラム用記録媒体。
- テキスト領域及びイメージ/ノイズ領域からなる文書に含まれている文字列を認識するシステムにおいて、
第1のOCRを用いて、前記テキスト領域内に含まれている文字列を認識する第1のOCR部と、
第2のOCRを用いて、前記イメージ/ノイズ領域内に含まれている文字列を認識する第2のOCR部と、
前記文書の文書構造を分析し、テキスト領域とイメージ/ノイズ領域とに暫定的に分類した後、言語モデルによって、前記テキスト領域のうち、テキスト領域に誤分類された特定領域に含まれている文字列を見出し、前記第1のOCRから得られた前記特定領域に対する位置情報を参照して、前記特定領域を前記イメージ/ノイズ領域に再分類する文書構造分析部と、
を備えることを特徴とする文字列認識システム。 - 前記第1のOCRは、一般テキストに特化したOCRであり、前記第2のOCRは、イメージに特化したOCRであることを特徴とする請求項7に記載の文字列認識システム。
- 前記第1のOCR部によって認識された結果と、前記第2のOCR部によって認識された結果とを併合して提供する制御部をさらに備えることを特徴とする請求項7または請求項8に記載の文字列認識システム。
- 前記特定領域は、
前記テキスト領域に含まれている文字を認識した結果に対して距離値を求める場合、距離値が特定の閾値を超える文字を含む領域に該当されることを特徴とする請求項7から請求項9のいずれかに記載の文字列認識システム。 - 前記第2のOCR部は、
前記第2のOCRを用いて認識された結果からノイズを除去することを特徴とする請求項7から請求項10のいずれかに記載の文字列認識システム。 - 前記第2のOCR部は、
前記ノイズを除去するために、ワード単位でノイズを判断することを特徴とする請求項11に記載の文字列認識システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080103890A KR101028670B1 (ko) | 2008-10-22 | 2008-10-22 | 언어모델과 ocr을 이용하여 문서에 포함된 문자열을 인식하는 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010102709A true JP2010102709A (ja) | 2010-05-06 |
Family
ID=42219336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009241530A Pending JP2010102709A (ja) | 2008-10-22 | 2009-10-20 | 文字列認識方法、文字列認識システム及び文字列認識プログラム用記録媒体 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2010102709A (ja) |
KR (1) | KR101028670B1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014223422A (ja) * | 2014-07-10 | 2014-12-04 | 株式会社三洋物産 | 遊技機 |
CN110533020A (zh) * | 2018-05-25 | 2019-12-03 | 腾讯科技(深圳)有限公司 | 一种文字信息的识别方法、装置及存储介质 |
WO2020060632A1 (en) * | 2018-09-21 | 2020-03-26 | Microsoft Technology Licensing, Llc | Converting an image into a structured table |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220648B (zh) * | 2017-04-11 | 2018-06-22 | 平安科技(深圳)有限公司 | 理赔单据的字符识别方法及服务器 |
KR102129485B1 (ko) * | 2018-11-30 | 2020-07-03 | 동국대학교 산학협력단 | 태그 클라우드 생성 장치 및 방법 |
KR102480235B1 (ko) | 2020-11-16 | 2022-12-22 | 엔에이치엔클라우드 주식회사 | 딥러닝 기반 광학문자인식 장치 및 그 시스템 |
KR102324221B1 (ko) * | 2021-03-31 | 2021-11-10 | 주식회사 매직핑거 | 이미지 문서의 비정형 레이아웃 인식 방법 |
KR20230079938A (ko) | 2021-11-29 | 2023-06-07 | (주)아이씨엔아이티 | Ocr을 이용하여 문서이미지에 포함된 객체를 추출하는 시스템 및 그 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06180771A (ja) * | 1992-12-11 | 1994-06-28 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
JPH07160818A (ja) * | 1993-12-02 | 1995-06-23 | Fujitsu Ltd | 集中文字認識システム及び文字認識装置 |
JPH09218959A (ja) * | 1996-02-13 | 1997-08-19 | Ricoh Co Ltd | 画像処理装置 |
JP2001243425A (ja) * | 2000-02-29 | 2001-09-07 | Mitsubishi Electric Corp | オンライン文字認識装置およびオンライン文字認識方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11328304A (ja) | 1998-05-13 | 1999-11-30 | Oki Electric Ind Co Ltd | 文字読取システム |
JP2001069299A (ja) | 1999-08-27 | 2001-03-16 | Ricoh Co Ltd | ファクシミリ装置 |
US7480403B2 (en) | 2004-11-16 | 2009-01-20 | International Business Machines Corporation | Apparatus, system, and method for fraud detection using multiple scan technologies |
-
2008
- 2008-10-22 KR KR1020080103890A patent/KR101028670B1/ko active IP Right Grant
-
2009
- 2009-10-20 JP JP2009241530A patent/JP2010102709A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06180771A (ja) * | 1992-12-11 | 1994-06-28 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
JPH07160818A (ja) * | 1993-12-02 | 1995-06-23 | Fujitsu Ltd | 集中文字認識システム及び文字認識装置 |
JPH09218959A (ja) * | 1996-02-13 | 1997-08-19 | Ricoh Co Ltd | 画像処理装置 |
JP2001243425A (ja) * | 2000-02-29 | 2001-09-07 | Mitsubishi Electric Corp | オンライン文字認識装置およびオンライン文字認識方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014223422A (ja) * | 2014-07-10 | 2014-12-04 | 株式会社三洋物産 | 遊技機 |
CN110533020A (zh) * | 2018-05-25 | 2019-12-03 | 腾讯科技(深圳)有限公司 | 一种文字信息的识别方法、装置及存储介质 |
WO2020060632A1 (en) * | 2018-09-21 | 2020-03-26 | Microsoft Technology Licensing, Llc | Converting an image into a structured table |
US10990814B2 (en) | 2018-09-21 | 2021-04-27 | Microsoft Technology Licensing, Llc | Converting an image into a structured table |
Also Published As
Publication number | Publication date |
---|---|
KR20100044668A (ko) | 2010-04-30 |
KR101028670B1 (ko) | 2011-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA3027038C (en) | Document field detection and parsing | |
JP2010102709A (ja) | 文字列認識方法、文字列認識システム及び文字列認識プログラム用記録媒体 | |
Namboodiri et al. | Document structure and layout analysis | |
US8494273B2 (en) | Adaptive optical character recognition on a document with distorted characters | |
Sain et al. | Multi-oriented text detection and verification in video frames and scene images | |
JP4516778B2 (ja) | データ処理システム | |
JP6188976B2 (ja) | 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 | |
US20160307067A1 (en) | Method and apparatus for determining a document type of a digital document | |
US8345978B2 (en) | Detecting position of word breaks in a textual line image | |
US20190019052A1 (en) | Text Region Detection in Digital Images using Image Tag Filtering | |
JP4598466B2 (ja) | インク入力内のリストを検出するシステムおよび方法 | |
US20150055866A1 (en) | Optical character recognition by iterative re-segmentation of text images using high-level cues | |
JP5539488B2 (ja) | 参照背景色に基づく透明化塗りつぶしの判定 | |
CN115082942A (zh) | 一种基于YOLO v5的文档图像流程图识别方法、设备及介质 | |
Wang et al. | A study on the document zone content classification problem | |
US9811726B2 (en) | Chinese, Japanese, or Korean language detection | |
KR20220001958A (ko) | 다중 클래스 객체 인식 장치 및 방법 | |
Feild | Improving text recognition in images of natural scenes | |
Liu et al. | Detection and segmentation text from natural scene images based on graph model | |
US10977527B2 (en) | Method and apparatus for detecting door image by using machine learning algorithm | |
CN111488870A (zh) | 文字识别方法和文字识别装置 | |
KR20140112869A (ko) | 문자 인식 장치 및 방법 | |
JP2002245404A (ja) | 領域切り出しプログラムおよび装置 | |
CN115082919B (zh) | 一种地址识别方法、电子设备及存储介质 | |
KR102303848B1 (ko) | 이미지 분석을 통한 위치 탐색 방법 및 그 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20131118 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140520 |