KR101686363B1 - 문서에 사용된 언어를 식별하고, 식별된 언어에 기초하여 ocr 인식을 수행하는 방법 및 장치 - Google Patents
문서에 사용된 언어를 식별하고, 식별된 언어에 기초하여 ocr 인식을 수행하는 방법 및 장치 Download PDFInfo
- Publication number
- KR101686363B1 KR101686363B1 KR1020157008956A KR20157008956A KR101686363B1 KR 101686363 B1 KR101686363 B1 KR 101686363B1 KR 1020157008956 A KR1020157008956 A KR 1020157008956A KR 20157008956 A KR20157008956 A KR 20157008956A KR 101686363 B1 KR101686363 B1 KR 101686363B1
- Authority
- KR
- South Korea
- Prior art keywords
- language
- character
- recognition
- characters
- recognition engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012015 optical character recognition Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G06K9/18—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
-
- G06K9/3283—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/246—Division of the character sequences into groups prior to recognition; Selection of dictionaries using linguistic properties, e.g. specific for English or German language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
Description
도 1은 문자의 각각의 획(stroke)이 분리된 문자를 도시한다.
도 2는 서로 교차되는 획들을 가진 문자를 도시한다.
도 3은 특정 문자에 대한 획들의 결정을 도시한다.
도 4는 광학 문자 인식(optical character recognition)(OCR) 장치를 도시하는 블록도이다.
도 5는 도 4의 OCR 장치의 동작을 도시하는 흐름도이다.
도 6은 문자의 식별을 돕기 위한 선들의 씨닝(thinning)을 도시한다.
통상의 기술자들은 도면들에 있는 요소들이 간단함 및 명료함을 위하여 도시되었고 반드시 일정한 비율로 그려진 것이 아니라는 것을 인식할 것이다. 본 발명의 다양한 실시예들의 이해를 개선하도록 돕기 위해, 예를 들어 도면들에 있는 요소들의 일부의 크기 및/또는 상대적 위치가 다른 요소들보다 상대적으로 과장되었을 수 있다. 또한, 상업적으로 실현 가능한 실시예들에서 유용하거나 필요한 흔하고 잘 알려진 요소들은, 본 발명의 다양한 실시예들을 보는 것을 덜 방해하도록 하기 위하여 도시되지 않을 수 있다. 어떠한 액션들 및/또는 단계들이 특정한 발생 순서로 설명되거나 도시될 수 있지만 당해 분야에서 통상의 지식을 가진 자들은 순서에 관한 그러한 특이성(specificity)이 실제로 요구되지는 않음을 더 이해할 것이다.
Claims (9)
- 광학 문자 인식(optical character recognition)(OCR) 장치에서, 복수의 문자를 포함하는 텍스트를 수신하는 단계;
상기 OCR에 의해, 상기 텍스트 내의 복수의 문자에 대한 문자당 평균 획수(average number of strokes per character)를 결정하는 단계; 및
상기 OCR에 의해, 상기 결정된 문자당 평균 획수에 기초하여 상기 텍스트에 사용된 언어를 식별하는 단계를 포함하는, 방법. - 제1항에 있어서,
상기 텍스트에 대해 문자 인식을 수행하기 위해 인식 엔진(recognition engine)을 선택하는 단계 - 상기 인식 엔진은 식별된 언어에 특별하게 맞춰져 있음(specifically tailored) -; 및
상기 선택된 인식 엔진을 사용하여 상기 텍스트에 대해 문자 인식을 수행하는 단계
를 더 포함하는 방법. - 제2항에 있어서,
상기 선택된 인식 엔진은 상기 식별된 언어의 문자들만을 포함하는, 방법. - 제2항에 있어서,
상기 인식 엔진을 선택하는 단계는 서로 다른 복수의 인식 엔진 중에서 상기 인식 엔진을 선택하는 단계를 포함하고, 상기 복수의 인식 엔진 내의 각각의 인식 엔진은 특정 언어에 특별하게 맞춰져 있는, 방법. - 제1항에 있어서,
상기 식별된 언어는 중국어 또는 영어인, 방법. - 장치로서,
프로세서; 및
상기 프로세서에 의해 실행되는 경우, 상기 장치로 하여금 기능들의 세트를 수행하게 하는 명령어들을 저장하는 메모리
를 포함하고,
상기 기능들의 세트는,
복수의 문자를 포함하는 텍스트를 수신하는 기능;
상기 텍스트 내의 복수의 문자에 대한 문자당 평균 획수를 결정하는 기능;
상기 결정된 문자당 평균 획수에 기초하여 상기 텍스트에 사용된 언어를 식별하는 기능
을 포함하는, 장치. - 제6항에 있어서,
상기 메모리 내에 저장된 복수의 인식 엔진을 더 포함하고,
상기 프로세서가 상기 텍스트에 대해 문자 인식을 수행하기 위해 상기 복수의 인식 엔진 중에서 하나의 인식 엔진을 선택하며, 상기 선택된 인식 엔진은 식별된 언어에 대해 특별하게 맞춰져 있는, 장치. - 제7항에 있어서,
상기 선택된 인식 엔진은 상기 식별된 언어의 문자들만을 포함하는, 장치. - 제7항에 있어서,
상기 식별된 언어는 중국어 또는 영어인, 장치.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2012/082727 WO2014056165A1 (en) | 2012-10-10 | 2012-10-10 | Method and apparatus for identifying a language used in a document and performing ocr recognition based on the language identified |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150053968A KR20150053968A (ko) | 2015-05-19 |
KR101686363B1 true KR101686363B1 (ko) | 2016-12-13 |
Family
ID=50476876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157008956A Active KR101686363B1 (ko) | 2012-10-10 | 2012-10-10 | 문서에 사용된 언어를 식별하고, 식별된 언어에 기초하여 ocr 인식을 수행하는 방법 및 장치 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9330086B2 (ko) |
KR (1) | KR101686363B1 (ko) |
CN (1) | CN104704510B (ko) |
WO (1) | WO2014056165A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220013187A (ko) | 2020-07-24 | 2022-02-04 | 엄춘호 | 문서 인식 시스템 및 방법 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104966084A (zh) * | 2015-07-07 | 2015-10-07 | 北京奥美达科技有限公司 | 一种基于ocr和tts的低视力阅读助视系统 |
CN106971638B (zh) * | 2016-01-14 | 2020-09-29 | 北京新唐思创教育科技有限公司 | 交互式无线教学方法 |
CN108509955B (zh) * | 2017-02-28 | 2022-04-15 | 柯尼卡美能达美国研究所有限公司 | 用于字符识别的方法、系统和非瞬时计算机可读介质 |
US10275646B2 (en) | 2017-08-03 | 2019-04-30 | Gyrfalcon Technology Inc. | Motion recognition via a two-dimensional symbol having multiple ideograms contained therein |
WO2022173239A1 (en) | 2021-02-10 | 2022-08-18 | Samsung Electronics Co., Ltd. | Methods and systems for performing on-device image to text conversion |
US11995400B2 (en) | 2021-09-07 | 2024-05-28 | International Business Machines Corporation | Rapid language detection for characters in images of documents |
US12314661B2 (en) | 2022-12-16 | 2025-05-27 | Abbyy Development Inc. | Natural language detection |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220437A (ja) | 2003-01-16 | 2004-08-05 | Renesas Technology Corp | 情報認識装置 |
US20050152601A1 (en) | 2004-01-14 | 2005-07-14 | International Business Machines Corporation | Method and apparatus for reducing reference character dictionary comparisons during handwriting recognition |
JP2011180687A (ja) * | 2010-02-26 | 2011-09-15 | Mitsubishi Electric Corp | 多言語文書解析装置 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3588822A (en) | 1967-03-06 | 1971-06-28 | Hitachi Ltd | Character recognition apparatus for identifying characters by detecting stroke features of the characters |
EP0204536A3 (en) * | 1985-06-03 | 1987-11-19 | James C. Monroe | Ideographic character processing method |
US5313527A (en) * | 1991-06-07 | 1994-05-17 | Paragraph International | Method and apparatus for recognizing cursive writing from sequential input information |
JP2734386B2 (ja) * | 1994-12-20 | 1998-03-30 | 日本電気株式会社 | 文字列読み取り装置 |
JPH09319829A (ja) | 1996-06-03 | 1997-12-12 | Nec Corp | オンライン文字認識装置 |
JPH10124505A (ja) * | 1996-10-25 | 1998-05-15 | Hitachi Ltd | 文字入力装置 |
US6047251A (en) | 1997-09-15 | 2000-04-04 | Caere Corporation | Automatic language identification system for multilingual optical character recognition |
US6567547B1 (en) | 1999-03-05 | 2003-05-20 | Hewlett-Packard Company | System and method for dynamically switching OCR packages |
KR100315428B1 (ko) | 1999-12-24 | 2001-11-26 | 오길록 | 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및그 방법 |
RU2251737C2 (ru) | 2002-10-18 | 2005-05-10 | Аби Софтвер Лтд. | Способ автоматического определения языка распознаваемого текста при многоязычном распознавании |
US7865355B2 (en) | 2004-07-30 | 2011-01-04 | Sap Aktiengesellschaft | Fast text character set recognition |
US20060055669A1 (en) * | 2004-09-13 | 2006-03-16 | Mita Das | Fluent user interface for text entry on touch-sensitive display |
CN100533466C (zh) * | 2006-06-29 | 2009-08-26 | 北大方正集团有限公司 | 一种字体识别方法及系统 |
US7885807B2 (en) | 2006-10-18 | 2011-02-08 | Hierodiction Software Gmbh | Text analysis, transliteration and translation method and apparatus for hieroglypic, hieratic, and demotic texts from ancient Egyptian |
US7656315B2 (en) | 2006-10-24 | 2010-02-02 | Yonggang Zhu | Computer chinese character input method and its keyboard based on simplified strokes |
US8316295B2 (en) * | 2007-03-01 | 2012-11-20 | Microsoft Corporation | Shared language model |
US8009915B2 (en) | 2007-04-19 | 2011-08-30 | Microsoft Corporation | Recognition of mathematical expressions |
CN101796573B (zh) * | 2007-08-30 | 2014-08-06 | 日本电气株式会社 | 显示装置、字符序列的显示方法、多个字符序列的排序方法 |
US8224641B2 (en) | 2008-11-19 | 2012-07-17 | Stratify, Inc. | Language identification for documents containing multiple languages |
CN102156889A (zh) * | 2011-03-31 | 2011-08-17 | 汉王科技股份有限公司 | 一种识别手写文本行语言类别的方法及装置 |
CN102208039B (zh) * | 2011-06-01 | 2013-02-20 | 汉王科技股份有限公司 | 一种多语言混合手写文本行的识别方法及装置 |
-
2012
- 2012-10-10 KR KR1020157008956A patent/KR101686363B1/ko active Active
- 2012-10-10 WO PCT/CN2012/082727 patent/WO2014056165A1/en active Application Filing
- 2012-10-10 US US14/427,668 patent/US9330086B2/en active Active
- 2012-10-10 CN CN201280076305.XA patent/CN104704510B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004220437A (ja) | 2003-01-16 | 2004-08-05 | Renesas Technology Corp | 情報認識装置 |
US20050152601A1 (en) | 2004-01-14 | 2005-07-14 | International Business Machines Corporation | Method and apparatus for reducing reference character dictionary comparisons during handwriting recognition |
JP2011180687A (ja) * | 2010-02-26 | 2011-09-15 | Mitsubishi Electric Corp | 多言語文書解析装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220013187A (ko) | 2020-07-24 | 2022-02-04 | 엄춘호 | 문서 인식 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
CN104704510A (zh) | 2015-06-10 |
US20150242388A1 (en) | 2015-08-27 |
US9330086B2 (en) | 2016-05-03 |
KR20150053968A (ko) | 2015-05-19 |
WO2014056165A1 (en) | 2014-04-17 |
CN104704510B (zh) | 2018-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101686363B1 (ko) | 문서에 사용된 언어를 식별하고, 식별된 언어에 기초하여 ocr 인식을 수행하는 방법 및 장치 | |
TWI726422B (zh) | 二維碼識別方法、裝置及設備 | |
US8942484B2 (en) | Text detection using image regions | |
US9519838B2 (en) | Character recognition method | |
NO20161728A1 (en) | Written text transformer | |
KR20140031742A (ko) | 이미지 특징 추출 장치 및 이미지 특징 추출 방법, 그를 이용한 영상 처리 시스템 | |
US10803339B2 (en) | Data processing method and device for electronic book, and mobile terminal | |
US12026456B2 (en) | Systems and methods for using optical character recognition with voice recognition commands | |
EP3327613A1 (en) | Fingerprint entry method, apparatus, and terminal device | |
US11086977B2 (en) | Certificate verification | |
KR102558736B1 (ko) | 지문 인식 방법 및 장치 | |
CN111931672A (zh) | 字迹识别方法、装置、计算机设备及存储介质 | |
RU2595557C2 (ru) | Выявление снимков экрана на изображениях документов | |
CN114399796A (zh) | 一种指纹识别的方法、装置、终端及存储介质 | |
CN116778507A (zh) | 表格识别方法、装置及计算机可读存储介质 | |
US20160292174A1 (en) | File scanning method and device | |
US9684844B1 (en) | Method and apparatus for normalizing character included in an image | |
CN112070092A (zh) | 一种验证码参数的获取方法及装置 | |
US9152876B1 (en) | Methods and systems for efficient handwritten character segmentation | |
US20140289619A1 (en) | Information display device | |
KR20160053544A (ko) | 후보 문자의 추출 방법 | |
CN109101973A (zh) | 文字识别方法、电子设备、存储介质 | |
CN110992299A (zh) | 一种检测浏览器兼容性的方法及装置 | |
JP5908825B2 (ja) | 文字認識装置及び文字認識プログラムを記録したコンピュータ読取り可能な記録媒体 | |
JP5169648B2 (ja) | 原画像探索装置及び原画像探索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20150407 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20160608 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20161102 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20161207 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20161207 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20201119 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20211119 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20231128 Start annual number: 8 End annual number: 8 |