JP4713107B2 - 景観中文字列認識方式および装置 - Google Patents
景観中文字列認識方式および装置 Download PDFInfo
- Publication number
- JP4713107B2 JP4713107B2 JP2004240244A JP2004240244A JP4713107B2 JP 4713107 B2 JP4713107 B2 JP 4713107B2 JP 2004240244 A JP2004240244 A JP 2004240244A JP 2004240244 A JP2004240244 A JP 2004240244A JP 4713107 B2 JP4713107 B2 JP 4713107B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- character string
- cut
- pattern candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
Description
特に、本発明は、異なる二値化手段で得られた文字パタンの仮説の集合を、一つのネットワークで表現することに新規性がある。これにより、従来困難であった、個々の文字パタンの妥当性を文字列として検証することが可能となった。
図6は、プレセグメンテーションの結果得られた文字パタンの候補をネットワークの形式で表現したものである。ここでは、文字パタンの候補が頂点(四角で囲まれたイメージ)、文字パタンの候補同士の隣接関係が辺(線)で表されている。このようなネットワークを切出し仮説ネットワークと呼ぶ。
図1の実施例では、二値化手段101、102、103として、閾値処理を用いるとする。閾値処理とは、各画素の明るさが閾値以上なら、新たな画素値を1に、さもなければ0と変換する処理であ。画素の明るさとしては、入力が多値画像ならば画素値を、カラーなら例えばY値を用いるものとする。このようにした場合、閾値によって様々な二値化結果が得られる。二値化手段101、102、103では、異なる閾値を用いることとする。
Claims (5)
- 入力画像から互いに異なる複数の二値画像を得る複数の二値化手段と、
上記得られた各々の二値画像から、文字と仮定される画素の集合(文字パタン候補)を検出し、文字パタンの候補同士の隣接関係が関連づけられた切り出し仮説ネットワークを各二値化手段毎に検出するプレセグメンテーション手段と、
上記プレセグメンテーション手段で得られた個々の文字パタンの候補同士の位置関係を解析し、隣接する文字パタン候補同士をさらに関連づけて前記切り出し仮説ネットワークを1つの切り出し仮説ネットワークに統合するネットワーク統合手段と、
上記1つの切り出し仮説ネットワークの個々の文字パタン候補と、保持した文字辞書とのパターンマッチングを行って文字として尤もらしいものを選択し、前記選択した文字を仮説ネットワーク上で繋げて文字列として取り出す文字列認識手段とを有する景観中文字列認識方式。 - 上記文字列として複数が取り出された場合、入力の多値もしくはカラー画像から文字の書かれている平面の縁の情報を用いて前記取り出された複数の文字列から所定の文字列を抽出する手段と、を有することを特徴とする請求項1の景観中文字列認識方式。
- 入力の多値もしくはカラー画像から複数の異なる手段で複数の二値画像を得る手段と、
上記得られた各々の二値画像から、文字と仮定される画素の集合(文字パタン候補)を検出し、文字パタンの候補同士の隣接関係が関連づけられた切り出し仮説ネットワークを各二値化手段毎に検出するプレセグメンテーション手段と、
上記プレセグメンテーション手段で得られた個々の文字パタンの候補同士の位置関係を解析し、隣接する文字パタン候補同士をさらに関連づけて前記切り出し仮説ネットワークを1つの切り出し仮説ネットワークに統合するネットワーク統合手段と、
上記1つの切り出し仮説ネットワークの個々の文字パタン候補と、文字辞書とのパターンマッチングを行って文字として尤もらしいものを選択し、前記選択した文字を仮説ネットワーク上で繋げて文字列として取り出す文字列認識手段と、を計算機に実行させるための景観中文字列認識プログラム。 - 入力画像から複数の異なる手段で複数の異なる二値画像を得る複数の二値化手段と、
上記得られた各々の二値画像から、文字と仮定される画素の集合(文字パタン候補)を検出し、文字パタンの候補同士の隣接関係が関連づけられた切り出し仮説ネットワークを各二値化手段毎に検出するプレセグメンテーション手段と、
上記プレセグメンテーション手段で得られた個々の文字パタンの候補同士の位置関係を解析し、隣接する文字パタン候補同士をさらに関連づけて前記切り出し仮説ネットワークを1つの切り出し仮説ネットワークに統合するネットワーク統合手段と、
上記1つの切り出し仮説ネットワークの個々の文字パタン候補と、保持した文字辞書とのパターンマッチングを行って文字として尤もらしいものを選択し、前記選択した文字を仮説ネットワーク上で繋げて文字列として取り出す文字列認識手段と、を有する文字列認識装置。 - 上記文字列として複数が取り出された場合、前記文字が書かれている平面の縁の情報を用いて前記取り出された複数の文字列から所定の文字列を抽出する候補文字列選択手段を有する請求項4記載の文字列認識装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004240244A JP4713107B2 (ja) | 2004-08-20 | 2004-08-20 | 景観中文字列認識方式および装置 |
US11/048,650 US7403656B2 (en) | 2004-08-20 | 2005-02-04 | Method and apparatus for recognition of character string in scene image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004240244A JP4713107B2 (ja) | 2004-08-20 | 2004-08-20 | 景観中文字列認識方式および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006059124A JP2006059124A (ja) | 2006-03-02 |
JP4713107B2 true JP4713107B2 (ja) | 2011-06-29 |
Family
ID=35909685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004240244A Expired - Fee Related JP4713107B2 (ja) | 2004-08-20 | 2004-08-20 | 景観中文字列認識方式および装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7403656B2 (ja) |
JP (1) | JP4713107B2 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7734092B2 (en) * | 2006-03-07 | 2010-06-08 | Ancestry.Com Operations Inc. | Multiple image input for optical character recognition processing systems and methods |
JP2008118232A (ja) | 2006-11-01 | 2008-05-22 | Hitachi Ltd | 映像再生装置 |
DE102006059659B4 (de) * | 2006-12-18 | 2009-12-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung, Verfahren und Computerprogramm zur Erkennung von Schriftzeichen in einem Bild |
US20110044554A1 (en) * | 2009-08-21 | 2011-02-24 | Konica Minolta Systems Laboratory, Inc. | Adaptive deblurring for camera-based document image processing |
TWI478074B (zh) * | 2010-12-01 | 2015-03-21 | Inst Information Industry | 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體 |
US8959082B2 (en) | 2011-10-31 | 2015-02-17 | Elwha Llc | Context-sensitive query enrichment |
US10528913B2 (en) | 2011-12-30 | 2020-01-07 | Elwha Llc | Evidence-based healthcare information management protocols |
US10475142B2 (en) | 2011-12-30 | 2019-11-12 | Elwha Llc | Evidence-based healthcare information management protocols |
US10559380B2 (en) | 2011-12-30 | 2020-02-11 | Elwha Llc | Evidence-based healthcare information management protocols |
US10679309B2 (en) | 2011-12-30 | 2020-06-09 | Elwha Llc | Evidence-based healthcare information management protocols |
US10552581B2 (en) | 2011-12-30 | 2020-02-04 | Elwha Llc | Evidence-based healthcare information management protocols |
US10402927B2 (en) | 2011-12-30 | 2019-09-03 | Elwha Llc | Evidence-based healthcare information management protocols |
US10340034B2 (en) | 2011-12-30 | 2019-07-02 | Elwha Llc | Evidence-based healthcare information management protocols |
US9064191B2 (en) | 2012-01-26 | 2015-06-23 | Qualcomm Incorporated | Lower modifier detection and extraction from devanagari text images to improve OCR performance |
US8831381B2 (en) | 2012-01-26 | 2014-09-09 | Qualcomm Incorporated | Detecting and correcting skew in regions of text in natural images |
US9262699B2 (en) | 2012-07-19 | 2016-02-16 | Qualcomm Incorporated | Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR |
US9183458B2 (en) | 2012-07-19 | 2015-11-10 | Qualcomm Incorporated | Parameter selection and coarse localization of interest regions for MSER processing |
US9141874B2 (en) | 2012-07-19 | 2015-09-22 | Qualcomm Incorporated | Feature extraction and use with a probability density function (PDF) divergence metric |
US9076242B2 (en) | 2012-07-19 | 2015-07-07 | Qualcomm Incorporated | Automatic correction of skew in natural images and video |
US9047540B2 (en) | 2012-07-19 | 2015-06-02 | Qualcomm Incorporated | Trellis based word decoder with reverse pass |
US20140023275A1 (en) * | 2012-07-19 | 2014-01-23 | Qualcomm Incorporated | Redundant aspect ratio decoding of devanagari characters |
JP6037791B2 (ja) * | 2012-11-16 | 2016-12-07 | 三菱重工メカトロシステムズ株式会社 | 画像認識装置、画像認識方法、プログラム、及び記録媒体 |
JP6128683B2 (ja) * | 2013-07-26 | 2017-05-17 | 富士通株式会社 | 文字認識装置および文字認識方法並びに文字認識プログラム |
US9852348B2 (en) * | 2015-04-17 | 2017-12-26 | Google Llc | Document scanner |
US10949660B2 (en) | 2017-04-10 | 2021-03-16 | Pearson Education, Inc. | Electronic handwriting processor with convolutional neural networks |
CN107945200B (zh) * | 2017-12-14 | 2021-08-03 | 中南大学 | 图像二值化分割方法 |
CN111105418B (zh) * | 2019-03-27 | 2023-07-11 | 上海洪朴信息科技有限公司 | 一种针对图像中矩形目标的高精度图像分割方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63316288A (ja) * | 1987-06-19 | 1988-12-23 | Nec Corp | 文字認識装置 |
JPH11353414A (ja) * | 1998-06-10 | 1999-12-24 | Nec Corp | 文字画像認識装置 |
JP2000207491A (ja) * | 1999-01-12 | 2000-07-28 | Hitachi Ltd | 文字列読取方法及び装置 |
JP2000268131A (ja) * | 1999-03-19 | 2000-09-29 | Oki Electric Ind Co Ltd | 文字認識装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5367578A (en) * | 1991-09-18 | 1994-11-22 | Ncr Corporation | System and method for optical recognition of bar-coded characters using template matching |
DE69427677T2 (de) * | 1993-12-02 | 2002-05-16 | Nippon Telegraph & Telephone | Bildmusteridentifikations/Erkennungsverfahren |
JPH0927028A (ja) * | 1995-07-07 | 1997-01-28 | Dainippon Screen Mfg Co Ltd | 多階調画像の修正装置 |
US6226094B1 (en) * | 1996-01-05 | 2001-05-01 | King Jim Co., Ltd. | Apparatus and method for processing character information |
JP4077919B2 (ja) * | 1998-01-30 | 2008-04-23 | キヤノン株式会社 | 画像処理方法及び装置及びその記憶媒体 |
JP3904840B2 (ja) * | 2000-08-15 | 2007-04-11 | 富士通株式会社 | 多値画像から罫線を抽出する罫線抽出装置 |
US7738706B2 (en) * | 2000-09-22 | 2010-06-15 | Sri International | Method and apparatus for recognition of symbols in images of three-dimensional scenes |
JP4366011B2 (ja) * | 2000-12-21 | 2009-11-18 | キヤノン株式会社 | 文書処理装置及び方法 |
JP4100885B2 (ja) * | 2001-07-11 | 2008-06-11 | キヤノン株式会社 | 帳票認識装置、方法、プログラムおよび記憶媒体 |
US20040146200A1 (en) * | 2003-01-29 | 2004-07-29 | Lockheed Martin Corporation | Segmenting touching characters in an optical character recognition system to provide multiple segmentations |
US7734092B2 (en) * | 2006-03-07 | 2010-06-08 | Ancestry.Com Operations Inc. | Multiple image input for optical character recognition processing systems and methods |
US20080008383A1 (en) * | 2006-07-07 | 2008-01-10 | Lockheed Martin Corporation | Detection and identification of postal metermarks |
-
2004
- 2004-08-20 JP JP2004240244A patent/JP4713107B2/ja not_active Expired - Fee Related
-
2005
- 2005-02-04 US US11/048,650 patent/US7403656B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63316288A (ja) * | 1987-06-19 | 1988-12-23 | Nec Corp | 文字認識装置 |
JPH11353414A (ja) * | 1998-06-10 | 1999-12-24 | Nec Corp | 文字画像認識装置 |
JP2000207491A (ja) * | 1999-01-12 | 2000-07-28 | Hitachi Ltd | 文字列読取方法及び装置 |
JP2000268131A (ja) * | 1999-03-19 | 2000-09-29 | Oki Electric Ind Co Ltd | 文字認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006059124A (ja) | 2006-03-02 |
US20060039605A1 (en) | 2006-02-23 |
US7403656B2 (en) | 2008-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4713107B2 (ja) | 景観中文字列認識方式および装置 | |
CN108364010B (zh) | 一种车牌识别方法、装置、设备及计算机可读存储介质 | |
KR100339691B1 (ko) | 코드인식을 위한 장치 및 그 방법 | |
US8175380B2 (en) | Apparatus and method for improving text recognition capability | |
KR101617681B1 (ko) | 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출 | |
KR101907414B1 (ko) | 촬영 이미지 기반의 문자 인식 장치 및 방법 | |
CN108564079B (zh) | 一种便携式字符识别装置及方法 | |
KR20130105952A (ko) | 차량 번호판 인식 방법과 그 장치 | |
KR101549495B1 (ko) | 문자 추출 장치 및 그 방법 | |
US20150010233A1 (en) | Method Of Improving Contrast For Text Extraction And Recognition Applications | |
JP6115388B2 (ja) | ナンバープレート認識装置およびナンバープレート認識方法 | |
KR100691651B1 (ko) | 배경 모델과 문자 모델의 결합에 의해 구조화된 배경 상의 문자를 자동 인식하는 방법 | |
CN111915509B (zh) | 基于图像处理去阴影优化的保护压板状态辨识方法 | |
JP2010211498A (ja) | 画像処理プログラム及び画像処理システム | |
Anis et al. | Digital electric meter reading recognition based on horizontal and vertical binary pattern | |
KR101044652B1 (ko) | 터치스크린을 통한 카메라 영상의 문자열 인식 시스템 및 그 방법 | |
CN109919164B (zh) | 用户界面对象的识别方法及装置 | |
KR100619715B1 (ko) | 이동 통신 단말기를 이용한 문서 영상 촬영 방법 및 그문서 영상에서의 단어 추출방법 | |
WO2019097690A1 (ja) | 画像処理装置、制御方法及び制御プログラム | |
KR20100011187A (ko) | 문자 인식 방법 | |
KR101412953B1 (ko) | 악보 영상의 오선제거 방법 | |
KR100713335B1 (ko) | 이미지 인식방법 | |
KR20100048436A (ko) | 마커를 이용한 문자열 추출 시스템 및 그 방법 | |
CN112801096B (zh) | 一种车牌自动检测算法 | |
Jiang et al. | Automated image quality assessment for certificates and bills |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060509 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070312 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20070312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100406 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101019 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110324 |
|
LAPS | Cancellation because of no payment of annual fees |