KR20060046128A - 카메라 입력된 문서들을 위한 저해상 ocr - Google Patents
카메라 입력된 문서들을 위한 저해상 ocr Download PDFInfo
- Publication number
- KR20060046128A KR20060046128A KR1020050042600A KR20050042600A KR20060046128A KR 20060046128 A KR20060046128 A KR 20060046128A KR 1020050042600 A KR1020050042600 A KR 1020050042600A KR 20050042600 A KR20050042600 A KR 20050042600A KR 20060046128 A KR20060046128 A KR 20060046128A
- Authority
- KR
- South Korea
- Prior art keywords
- character recognition
- word
- optical character
- symbols
- recognition system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 84
- 238000012015 optical character recognition Methods 0.000 claims abstract description 57
- 230000008569 process Effects 0.000 claims abstract description 41
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 claims abstract description 16
- 238000005457 optimization Methods 0.000 claims abstract description 15
- 238000010801 machine learning Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 230000011218 segmentation Effects 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 28
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 16
- 230000002093 peripheral effect Effects 0.000 claims description 8
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000007935 neutral effect Effects 0.000 claims description 2
- 238000007635 classification algorithm Methods 0.000 claims 5
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 23
- 210000004027 cell Anatomy 0.000 description 17
- 238000010586 diagram Methods 0.000 description 17
- 238000003860 storage Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 235000014510 cooky Nutrition 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 230000008450 motivation Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 229920001690 polydopamine Polymers 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
- G06V30/18029—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering filtering with Haar-like subimages, e.g. computation thereof with the integral image technique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
- G06V30/18038—Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters
- G06V30/18048—Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters with interaction between the responses of different filters, e.g. cortical complex cells
- G06V30/18057—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Computational Linguistics (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
Claims (40)
- 저해상 심볼들의 광학 문자 인식(optical character recognition; OCR)을 용이하게 하는 시스템으로서,이미지에서 심볼의 분절(segmentation)을 용이하게 하는 분절 컴포넌트; 및상기 심볼의 분절과 실질적으로 동시에 상기 심볼을 인식하는 인식 컴포넌트를 포함하는 광학 문자 인식 시스템.
- 제1항에 있어서, 그레이 레벨(grey-level) 입력을 프로세스하고 심볼 위치에서 분류 함수(classification function)를 계산하여 상기 심볼의 인식을 용이하게 하는 기계 학습 분류 알고리즘(machine learning classification algorithm)을 더 포함하는 광학 문자 인식 시스템.
- 제1항에 있어서, 그레이 레벨 입력을 프로세스하고 복수의 심볼 위치에서 분류 함수를 계산하는 컨볼루션 신경망(convolutional neural network)인 기계 학습 분류 알고리즘을 더 포함하는 광학 문자 인식 시스템.
- 제1항에 있어서, 상기 심볼들의 그레이 레벨 이미지로부터 텍스트의 라인들의 탐지를 용이하게 하는 라인 탐지(line detection) 컴포넌트를 더 포함하는 광학 문자 인식 시스템.
- 제1항에 있어서, 상기 심볼을 단어나 그것의 일부로서 해석하는 것을 용이하게 하는 언어 모델과 프로그래밍 모델 중 적어도 하나를 더 포함하는 광학 문자 인식 시스템.
- 제1항에 있어서, 상기 인식 컴포넌트는 심볼과 일련의 심볼들을 모두 인식하고, 상기 심볼 또는 일련의 심볼들은 한 단어를 나타내는 광학 문자 인식 시스템.
- 제1항에 있어서, 상기 인식 컴포넌트는 컨볼루션 신경망, 언어 모델, 및 동적 프로그래밍 알고리즘(dynamic programming algorithm) 중 적어도 하나를 사용하는 광학 문자 인식 시스템.
- 제1항에 있어서, 상기 인식 컴포넌트는 다른 조명 조건, 폰트, 심볼 크기, 카메라 유형, 각도, 및 촛점 중 적어도 하나에 대해 불변적인 분류기(classifier)를 구성하는 광학 문자 인식 시스템.
- 제1항에 있어서, 상기 인식 컴포넌트는 상기 이미지의 주어진 위치에 있는 상기 심볼에 의해 어떤 문자가 표현되는지를 예측하는 광학 문자 인식 시스템.
- 제1항에 있어서, 주변 심볼들 간의 간격(gap) 및 주변 심볼 라인들 간의 간 격 중 적어도 하나를 탐지하는 필터를 더 포함하는 광학 문자 인식 시스템.
- 제10항에 있어서, 상기 필터는, 임계치가 실험적으로 또는 자동적으로 계산되는, 탐지시에 사용되는 미리 결정된 임계치를 포함하는 광학 문자 인식 시스템.
- 제1항에 있어서, 상기 인식기는 보다 높은 해상도에서 단순한 특징들을 추출하고, 상기 단순한 특징을 보다 낮은 해상도에서 보다 복잡한 특징으로 변환하는 광학 문자 인식 시스템.
- 저해상 카메라-입력된 문서들의 광학 문자 인식을 용이하게 하는 시스템으로서,이미지의 심볼의 분절을 용이하게 하는 분절 컴포넌트;문자열 내의 문자의 프로세싱을 용이하게 하는 언어 모델; 및상기 문자열을 단어로서 인식하는 것을 용이하게 하는 동적 프로그래밍 컴포넌트를 포함하는 광학 문자 인식 시스템.
- 제13항에 있어서, 상기 동적 프로그래밍 컴포넌트는 주어진 단어 바운딩 박스(bounding rectangle)에 어떤 단어가 위치되어 있는지를 판정하는 광학 문자 인식 시스템.
- 제13항에 있어서, 상기 언어 모델은 전체 어휘집(lexicon)을 스캔하고, 상기 어휘집의 각 단어에 대한 확률을 추정하고, 가장 유망한 단어를 출력하는 사전 모델인 광학 문자 인식 시스템.
- 제13항에 있어서, 상기 언어 모델은 문자 인식기 관찰들(observations)의 시퀀스의 가장 유망한 해석을 산출하는 언어 중립적인 것인 광학 문자 인식 시스템.
- 제13항에 있어서, 상기 언어 모델은 가장 유망한 단어를 계산하기 위해 어휘집을 트래버스함으로써 동적 프로그래밍 최적화를 인터리브(interleave)하는 광학 문자 인식 시스템.
- 제13항의 시스템을 실현하기 위한 컴퓨터-실행가능 명령어들을 저장한 컴퓨터 판독가능 매체.
- 제13항의 시스템을 채용한 컴퓨터.
- 제13항에 있어서, 상기 문자 및 상기 단어 중 적어도 하나의 인식과 연관된 한 개 이상의 관찰들에 기초하여 자동으로 추론하는 분류기를 더 포함하는 광학 문자 인식 시스템.
- 카메라-입력된 문서의 저해상 광학 문자 인식을 수행하는 방법을 위한 컴퓨터 실행가능 명령어들을 갖는 컴퓨터 판독가능 매체로서, 상기 방법은,복수의 이미지화된 심볼을 갖는 촬영된 문서를 수신하는 단계;상기 문서의 상기 이미지화된 심볼들의 연관된 배치를 탐지하는 레이아웃 분석(layout analysis)을 수행하는 단계;상기 이미지화된 심볼들 간의 공간(space)들을 탐지하여, 상기 연관된 배치를 상기 이미지화된 심볼들의 한 개 이상의 세트들로 분해하는 단계;상기 이미지화된 심볼들의 세트들을 개별 이미지화된 심볼들로 분절하는 단계;보다 높은 수평 해상도에서 수평 위치에서의 각 이미지화된 심볼에 대한 스코어를 계산하는 단계;상기 수평 위치에서의 상기 이미지화된 심볼들 각각에 대한 스코어를 단어를 판정하는데 사용되는 총 스코어에 결합하는 단계; 및상기 이미지화된 심볼들의 세트들 중 하나를 나타내는 단어를 출력하는 단계를 포함하는 컴퓨터 판독가능 매체.
- 제21항에 있어서,고해상도에서 상기 개별 심볼들의 단순한 특징들을 추출하는 단계; 및상기 단순한 특징들을 보다 낮은 해상도에서 보다 복잡한 특징들로 변환하는 단계의 동작들을 더 포함하고,상기 추출 단계와 변환 단계의 동작들 중 적어도 하나가 컨볼루션 신경망에 의해 수행되는 컴퓨터 판독가능 매체.
- 제21항에 있어서, 동적 프로그래밍을 사용하여 상기 연관된 배치에서 상기 심볼들의 세트의 위치를 파악하는 단계 -상기 연관된 배치는 라인임- 를 더 포함하는 컴퓨터 판독가능 매체.
- 제21항에 있어서, 상기 분절 단계, 추출 단계 및 변환 단계의 동작들은 실질적으로 동시에 수행되는 컴퓨터 판독가능 매체.
- 제21항에 있어서, 주어진 수평 위치들에서 상기 이미지화된 심볼들로부터 인식된 심볼들을 생성하는 기계 학습 알고리즘을 훈련하는 단계를 더 포함하는 컴퓨터 판독가능 매체.
- 제25항에 있어서, 상기 기계 학습 알고리즘에 대한 훈련 세트를 생성하는 단계를 더 포함하고, 상기 생성 단계 동작은,문서들의 집합을 종이 매체 및 전자 매체 양방에 인쇄하는 단계; 및레이블화된 문자 이미지들의 데이타베이스를 생성하기 위해, 상기 종이 매체 의 각 문자의 위치와 대응하는 이미지화된 심볼의 위치를 매칭시키는 단계의 동작들 중 적어도 하나를 더 포함하는 컴퓨터 판독가능 매체.
- 제21항에 있어서,간격 필터로 상기 심볼들 간의 간격을 탐지하는 단계;라인 필터를 사용하여 심볼들의 라인들을 탐지하는 단계; 및상기 간격 필터와 상기 라인 필터 양방의 결과에 기초하여 텍스트 영역을 정의하는 단계를 더 포함하는 컴퓨터 판독가능 매체.
- 제21항에 있어서, 상기 심볼들 간의 간격과 연관된 픽셀들에의 CC(connected components) 분석을 수행하는 단계를 더 포함하는 컴퓨터 판독가능 매체.
- 촬영된 문서의 저해상 광학 문자 인식을 수행하는 방법으로서,상기 촬영된 문서에 발생한 결함(imperfections)들을 조정하기 위해 상기 촬영된 문서를 전처리하는 단계;텍스트 라인들을 결정하기 위해 상기 문서의 레이아웃을 분석하는 단계;상기 텍스트 라인들을 개별 단어들로 분해하는 단계;상기 개별 단어들 각각에 대해 바운드들(bounds)을 지정하는 단계;기계 학습 분류 알고리즘을 사용하여 상기 개별 단어들 각각을 인식하는 단 계; 및주어진 위치에 어떤 개별 단어가 있는지를 판정하기 위한 동적 프로그래밍 알고리즘으로 상기 개별 단어들을 인식하는 단계를 포함하는 광학 문자 인식 방법.
- 제29항에 있어서, 구두점(punctuation)을 인식하는 단계를 더 포함하는 광학 문자 인식 방법.
- 제29항에 있어서, 상기 문서의 영역들에서 대비(contrast)를 최대화하기 위해 화이트밸런싱 알고리즘(whitebalancing algorithm)으로 상기 촬영된 문서를 전처리하는 단계를 더 포함하는 광학 문자 인식 방법.
- 제29항에 있어서, 상기 기계 학습 분류 알고리즘은 컨볼루션 신경망과 SVM(support vector machine) 중 하나인 광학 문자 인식 방법.
- 제29항에 있어서,재사용되는 계산의 양을 최대화하는 구조로 사전을 정렬하는 단계; 및상기 구조가 트래버스(traverse)되면서 상기 개별 단어의 문자의 관찰에 대한 최적의 지정을 결정하도록 동적 프로그래밍 표를 생성하는 단계의 동작들 중 적어도 하나를 더 포함하는 광학 문자 인식 방법.
- 제33항에 있어서, 상기 구조는 트리(trie) 구조인 광학 문자 인식 방법.
- 제29항에 있어서, 제1 단어를 인식하기 위해 상기 제1 단어와 제2 단어를 쌍으로서 분석하는 단계를 더 포함하는 광학 문자 인식 방법.
- 제29항에 있어서, 제1 언어 모델을 사용하여 출력 단어를 생성하는데 실패하면 제2 언어 모델이 자동으로 채용되도록, 상기 제1 및 제2 언어 모델들을 채용하는 단계를 더 포함하는 광학 문자 인식 방법.
- 제29항에 있어서, 부스팅(boosting)을 사용하여 자동으로 계산되는 임계치에 따라 단어의 문자들 간의 간격을 탐지하는 단계를 더 포함하는 광학 문자 인식 방법.
- 제29항에 있어서, 연결된 컴포넌트들의 상대적 기하학적 관계들을 테스트하여 상기 텍스트 라인들을 탐지하는 단계를 더 포함하는 광학 문자 인식 방법.
- 제38항에 있어서, 상기 연결된 컴포넌트 세트의 크기를 증가시켜 각 세트에 대한 통계들을 생성하는 단계를 더 포함하는 광학 문자 인식 방법.
- 제29항에 있어서, 훈련 이미지들로 상기 기계 학습 분류 알고리즘을 훈련하는 단계를 더 포함하고, 상기 훈련 단계는,입력 윈도우에서 상기 훈련 이미지들을 랜덤하게 지터(jitter)하는 단계; 및상기 입력 윈도우에 상기 훈련 이미지들의 밝기 및 대비를 랜덤하게 변경시키는 단계중 적어도 하나를 포함하는 광학 문자 인식 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/850,335 | 2004-05-20 | ||
US10/850,335 US7499588B2 (en) | 2004-05-20 | 2004-05-20 | Low resolution OCR for camera acquired documents |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060046128A true KR20060046128A (ko) | 2006-05-17 |
KR101114135B1 KR101114135B1 (ko) | 2012-02-20 |
Family
ID=34939897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050042600A Expired - Lifetime KR101114135B1 (ko) | 2004-05-20 | 2005-05-20 | 카메라 입력된 문서들을 위한 저해상 ocr |
Country Status (6)
Country | Link |
---|---|
US (1) | US7499588B2 (ko) |
EP (1) | EP1598770B1 (ko) |
JP (2) | JP4698289B2 (ko) |
KR (1) | KR101114135B1 (ko) |
CN (1) | CN100446027C (ko) |
ES (1) | ES2610467T3 (ko) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8340426B2 (en) | 2007-11-22 | 2012-12-25 | Samsung Electronics Co., Ltd. | Apparatus and method for recognizing characters |
KR20140059834A (ko) * | 2011-08-29 | 2014-05-16 | 퀄컴 인코포레이티드 | 콘텍스트 정보를 이용한 모바일 디바이스 상에서의 광학적 문자 인식 |
KR20170021176A (ko) * | 2015-08-17 | 2017-02-27 | 한국과학기술원 | 해파리 퇴치용 군집 로봇 시스템을 효율적으로 운용하기 위한 해파리 분포 인식 방법 및 시스템 |
KR20190142286A (ko) * | 2017-05-04 | 2019-12-26 | 주식회사 매스프레소 | 가중치 기반의 유사 문제 필터링 방법 |
KR102104605B1 (ko) * | 2019-04-24 | 2020-04-27 | 도프텍(주) | 인공지능 기반 플랜트 도면 내 심볼 자동인식 방법 및 장치 |
KR20200076088A (ko) * | 2018-12-19 | 2020-06-29 | (주)린치핀 | 온라인 파츠북 서비스 제공 방법 및 시스템 |
KR102142238B1 (ko) * | 2020-02-25 | 2020-08-07 | 주식회사 엔디소프트 | 소정 이미지에 포함된 축약어, 손글씨, 비정형 단어 및 문장과 같은 텍스트 정보를 추출한 후 그 추출 결과를 소정 언어로 자동 번역하는 방법 |
KR20200106472A (ko) * | 2020-08-31 | 2020-09-14 | (주)린치핀 | 클라우드 기반 온라인 파츠북 서비스 제공 방법 및 시스템 |
KR20200106471A (ko) * | 2020-08-31 | 2020-09-14 | (주)린치핀 | 온라인 파츠북 뷰어 시스템 |
KR20200108808A (ko) * | 2020-08-31 | 2020-09-21 | (주)린치핀 | 온라인 파츠북을 이용한 파츠 주문 배송 시스템 |
WO2021081562A3 (en) * | 2021-01-20 | 2021-12-09 | Innopeak Technology, Inc. | Multi-head text recognition model for multi-lingual optical character recognition |
Families Citing this family (168)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6823084B2 (en) * | 2000-09-22 | 2004-11-23 | Sri International | Method and apparatus for portably recognizing text in an image sequence of scene imagery |
US7245765B2 (en) | 2003-11-11 | 2007-07-17 | Sri International | Method and apparatus for capturing paper-based information on a mobile computing device |
US20100092095A1 (en) * | 2008-10-14 | 2010-04-15 | Exbiblio B.V. | Data gathering in digital and rendered document environments |
US20060095504A1 (en) * | 2004-08-24 | 2006-05-04 | Gelsey Jonathan I | System and method for optical character information retrieval (OCR) via a thin-client user interface |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US9495385B2 (en) | 2004-10-01 | 2016-11-15 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US7812986B2 (en) | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US10192279B1 (en) | 2007-07-11 | 2019-01-29 | Ricoh Co., Ltd. | Indexed document modification sharing with mixed media reality |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US7702673B2 (en) * | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US20060245654A1 (en) * | 2005-04-29 | 2006-11-02 | Microsoft Corporation | Utilizing grammatical parsing for structured layout analysis |
US20070077987A1 (en) * | 2005-05-03 | 2007-04-05 | Tangam Gaming Technology Inc. | Gaming object recognition |
US7640037B2 (en) * | 2005-05-18 | 2009-12-29 | scanR, Inc, | System and method for capturing and processing business data |
US8249344B2 (en) * | 2005-07-01 | 2012-08-21 | Microsoft Corporation | Grammatical parsing of document visual structures |
TWI265715B (en) * | 2005-07-21 | 2006-11-01 | Inventec Appliances Corp | Method for collecting business card data in mobile communication apparatus |
US7454063B1 (en) * | 2005-09-22 | 2008-11-18 | The United States Of America As Represented By The Director National Security Agency | Method of optical character recognition using feature recognition and baseline estimation |
WO2007064879A2 (en) | 2005-12-01 | 2007-06-07 | Firestar Software, Inc. | System and method for exchanging information among exchange applications |
US8509563B2 (en) | 2006-02-02 | 2013-08-13 | Microsoft Corporation | Generation of documents from images |
US20070288254A1 (en) * | 2006-05-08 | 2007-12-13 | Firestar Software, Inc. | System and method for exchanging transaction information using images |
US7787697B2 (en) * | 2006-06-09 | 2010-08-31 | Sony Ericsson Mobile Communications Ab | Identification of an object in media and of related media objects |
US8098934B2 (en) | 2006-06-29 | 2012-01-17 | Google Inc. | Using extracted image text |
US7953295B2 (en) * | 2006-06-29 | 2011-05-31 | Google Inc. | Enhancing text in images |
US8031940B2 (en) * | 2006-06-29 | 2011-10-04 | Google Inc. | Recognizing text in images using ranging data |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US7986843B2 (en) * | 2006-11-29 | 2011-07-26 | Google Inc. | Digital image archiving and retrieval in a mobile device system |
US8238624B2 (en) * | 2007-01-30 | 2012-08-07 | International Business Machines Corporation | Hybrid medical image processing |
US8326092B2 (en) * | 2007-04-23 | 2012-12-04 | International Business Machines Corporation | Heterogeneous image processing system |
US8462369B2 (en) * | 2007-04-23 | 2013-06-11 | International Business Machines Corporation | Hybrid image processing system for a single field of view having a plurality of inspection threads |
US8331737B2 (en) * | 2007-04-23 | 2012-12-11 | International Business Machines Corporation | Heterogeneous image processing system |
US9277090B2 (en) | 2007-10-01 | 2016-03-01 | Hewlett-Packard Development Company, L.P. | System and method of document reproduction |
US8675219B2 (en) * | 2007-10-24 | 2014-03-18 | International Business Machines Corporation | High bandwidth image processing with run time library function offload via task distribution to special purpose engines |
US20090132582A1 (en) * | 2007-11-15 | 2009-05-21 | Kim Moon J | Processor-server hybrid system for processing data |
US9135073B2 (en) * | 2007-11-15 | 2015-09-15 | International Business Machines Corporation | Server-processor hybrid system for processing data |
WO2009070142A1 (en) * | 2007-11-30 | 2009-06-04 | Hewlett-Packard Development Company, L.P. | Method and system for measuring text-rendering quality |
US9332074B2 (en) * | 2007-12-06 | 2016-05-03 | International Business Machines Corporation | Memory to memory communication and storage for hybrid systems |
US20090150556A1 (en) * | 2007-12-06 | 2009-06-11 | Kim Moon J | Memory to storage communication for hybrid systems |
US8229251B2 (en) * | 2008-02-08 | 2012-07-24 | International Business Machines Corporation | Pre-processing optimization of an image processing system |
US8379963B2 (en) * | 2008-03-28 | 2013-02-19 | International Business Machines Corporation | Visual inspection system |
KR100942257B1 (ko) | 2008-04-11 | 2010-02-16 | 엔에이치엔(주) | 이미지 전처리를 위한 방법, 장치 및 컴퓨터 판독 가능한기록 매체 |
US8131009B2 (en) * | 2008-11-11 | 2012-03-06 | Xerox Corporation | Automatic spine creation from book covers without spines |
US9460063B2 (en) * | 2009-01-02 | 2016-10-04 | Apple Inc. | Identification, selection, and display of a region of interest in a document |
US8290273B2 (en) * | 2009-03-27 | 2012-10-16 | Raytheon Bbn Technologies Corp. | Multi-frame videotext recognition |
US8331610B2 (en) * | 2009-05-26 | 2012-12-11 | Xerox Corporation | Method for measurement of reflectance profiles of image surfaces |
US8345106B2 (en) | 2009-09-23 | 2013-01-01 | Microsoft Corporation | Camera-based scanning |
EP2320390A1 (en) * | 2009-11-10 | 2011-05-11 | Icar Vision Systems, SL | Method and system for reading and validation of identity documents |
TWI420403B (zh) * | 2009-11-13 | 2013-12-21 | Primax Electronics Ltd | 影像處理方法及影像處理裝置 |
CN102078186B (zh) * | 2009-12-01 | 2013-02-13 | 深圳先进技术研究院 | 生理参数收集方法、手机及系统 |
US8560466B2 (en) * | 2010-02-26 | 2013-10-15 | Trend Micro Incorporated | Method and arrangement for automatic charset detection |
US8509534B2 (en) * | 2010-03-10 | 2013-08-13 | Microsoft Corporation | Document page segmentation in optical character recognition |
US8401293B2 (en) | 2010-05-03 | 2013-03-19 | Microsoft Corporation | Word recognition of text undergoing an OCR process |
US8218875B2 (en) | 2010-06-12 | 2012-07-10 | Hussein Khalid Al-Omari | Method and system for preprocessing an image for optical character recognition |
US8655071B2 (en) | 2011-02-24 | 2014-02-18 | Sharp Laboratories Of America, Inc. | Methods and systems for determining a document region-of-interest in an image |
US8606010B2 (en) * | 2011-03-18 | 2013-12-10 | Seiko Epson Corporation | Identifying text pixels in scanned images |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
US9576284B2 (en) | 2011-09-29 | 2017-02-21 | Paypal, Inc. | Social proximity payments |
US8996350B1 (en) | 2011-11-02 | 2015-03-31 | Dub Software Group, Inc. | System and method for automatic document management |
WO2013136295A1 (en) * | 2012-03-15 | 2013-09-19 | Northstar Telemetrics, S. L. | Method for automatically reading a utility meter, retrofittable meter reader and automatic meter reading system using the same |
US8983211B2 (en) * | 2012-05-14 | 2015-03-17 | Xerox Corporation | Method for processing optical character recognizer output |
US9519641B2 (en) * | 2012-09-18 | 2016-12-13 | Abbyy Development Llc | Photography recognition translation |
US9058536B1 (en) * | 2012-09-26 | 2015-06-16 | Amazon Technologies, Inc. | Image-based character recognition |
JP5840104B2 (ja) * | 2012-10-19 | 2016-01-06 | 日立建機株式会社 | 作業車両の走行制御装置 |
KR20150028627A (ko) * | 2013-09-06 | 2015-03-16 | 삼성전자주식회사 | 사용자 필기를 텍스트 정보로 변환하는 방법 및 이를 수행하기 위한 전자 기기 |
US9292739B1 (en) * | 2013-12-12 | 2016-03-22 | A9.Com, Inc. | Automated recognition of text utilizing multiple images |
KR102208893B1 (ko) | 2013-12-30 | 2021-01-28 | 삼성전자주식회사 | 디스플레이 장치 및 디스플레이 장치의 채널 맵 관리 방법 |
US9189708B2 (en) | 2013-12-31 | 2015-11-17 | Google Inc. | Pruning and label selection in hidden markov model-based OCR |
US9992443B2 (en) | 2014-05-30 | 2018-06-05 | Apple Inc. | System and methods for time lapse video acquisition and compression |
US9277123B2 (en) | 2014-05-30 | 2016-03-01 | Apple Inc. | Systems and methods for exposure metering for timelapse video |
US9565370B2 (en) | 2014-05-30 | 2017-02-07 | Apple Inc. | System and method for assisting in computer interpretation of surfaces carrying symbols or characters |
US9449239B2 (en) | 2014-05-30 | 2016-09-20 | Apple Inc. | Credit card auto-fill |
US9251431B2 (en) | 2014-05-30 | 2016-02-02 | Apple Inc. | Object-of-interest detection and recognition with split, full-resolution image processing pipeline |
US9361531B2 (en) | 2014-07-21 | 2016-06-07 | Optum, Inc. | Targeted optical character recognition (OCR) for medical terminology |
US9953425B2 (en) * | 2014-07-30 | 2018-04-24 | Adobe Systems Incorporated | Learning image categorization using related attributes |
US9239961B1 (en) * | 2014-09-24 | 2016-01-19 | Amazon Technologies, Inc. | Text recognition near an edge |
US9426409B2 (en) | 2014-09-30 | 2016-08-23 | Apple Inc. | Time-lapse video capture with optimal image stabilization |
US9324376B2 (en) | 2014-09-30 | 2016-04-26 | Apple Inc. | Time-lapse video capture with temporal points of interest |
US10409909B2 (en) * | 2014-12-12 | 2019-09-10 | Omni Ai, Inc. | Lexical analyzer for a neuro-linguistic behavior recognition system |
CN104537347A (zh) * | 2014-12-25 | 2015-04-22 | 安徽寰智信息科技股份有限公司 | 一种基于云端分析和模型匹配的唇形识别文字输入方法 |
DE102015102369A1 (de) * | 2015-02-19 | 2016-08-25 | Bundesdruckerei Gmbh | Mobilgerät zum Erfassen eines Textbereiches auf einem Identifikationsdokument |
US9984287B2 (en) | 2015-03-05 | 2018-05-29 | Wipro Limited | Method and image processing apparatus for performing optical character recognition (OCR) of an article |
US10105051B2 (en) | 2015-03-22 | 2018-10-23 | Spect Inc. | System and method for a portable eye examination camera |
WO2017032427A1 (en) * | 2015-08-27 | 2017-03-02 | Longsand Limited | Identifying augmented features based on a bayesian analysis of a text document |
CN105512682B (zh) * | 2015-12-07 | 2018-11-23 | 南京信息工程大学 | 一种基于Krawtchouk矩和KNN-SMO分类器的密级标识识别方法 |
US9799106B2 (en) * | 2015-12-16 | 2017-10-24 | Dropbox, Inc. | Enhancing a digital image |
US9785855B2 (en) * | 2015-12-17 | 2017-10-10 | Conduent Business Services, Llc | Coarse-to-fine cascade adaptations for license plate recognition with convolutional neural networks |
JP6739937B2 (ja) | 2015-12-28 | 2020-08-12 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法、及びプログラム |
CN107180220B (zh) * | 2016-03-11 | 2023-10-31 | 松下电器(美国)知识产权公司 | 危险预测方法 |
US9984471B2 (en) * | 2016-07-26 | 2018-05-29 | Intuit Inc. | Label and field identification without optical character recognition (OCR) |
US10311330B2 (en) | 2016-08-17 | 2019-06-04 | International Business Machines Corporation | Proactive input selection for improved image analysis and/or processing workflows |
US10579741B2 (en) | 2016-08-17 | 2020-03-03 | International Business Machines Corporation | Proactive input selection for improved machine translation |
CN106446899A (zh) * | 2016-09-22 | 2017-02-22 | 北京市商汤科技开发有限公司 | 文字检测方法和装置、及文字检测训练方法和装置 |
US10325148B2 (en) * | 2016-09-30 | 2019-06-18 | Wipro Limited | Method and a system for optical character recognition |
WO2018071403A1 (en) * | 2016-10-10 | 2018-04-19 | Insurance Services Office, Inc. | Systems and methods for optical charater recognition for low-resolution ducuments |
KR101805318B1 (ko) * | 2016-11-01 | 2017-12-06 | 포항공과대학교 산학협력단 | 텍스트 영역 식별 방법 및 장치 |
US10276189B1 (en) * | 2016-12-28 | 2019-04-30 | Shutterstock, Inc. | Digital audio track suggestions for moods identified using analysis of objects in images from video content |
CN106845530B (zh) * | 2016-12-30 | 2018-09-11 | 百度在线网络技术(北京)有限公司 | 字符检测方法和装置 |
WO2018152304A1 (en) * | 2017-02-17 | 2018-08-23 | The Coca-Cola Company | System and method for character recognition model and recursive training from end user input |
US11354577B2 (en) | 2017-03-15 | 2022-06-07 | Samsung Electronics Co., Ltd | System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions |
US10803378B2 (en) | 2017-03-15 | 2020-10-13 | Samsung Electronics Co., Ltd | System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions |
JP7102103B2 (ja) | 2017-03-31 | 2022-07-19 | キヤノン株式会社 | 携帯型の情報処理装置及び当該情報処理装置を用いた方法及びプログラム |
WO2018213492A1 (en) | 2017-05-16 | 2018-11-22 | Spect Inc. | Stereoscopic mobile retinal imager |
WO2019009916A1 (en) | 2017-07-07 | 2019-01-10 | Hewlett-Packard Development Company, L.P. | ALIGNMENTS OF IMAGES THROUGH OPTICAL RECOGNITION OF CHARACTERS |
US10192127B1 (en) | 2017-07-24 | 2019-01-29 | Bank Of America Corporation | System for dynamic optical character recognition tuning |
US10346702B2 (en) | 2017-07-24 | 2019-07-09 | Bank Of America Corporation | Image data capture and conversion |
US10354132B2 (en) | 2017-08-22 | 2019-07-16 | Autonom8, Inc. | System and method for generating a virtual assistant |
US10482323B2 (en) | 2017-08-22 | 2019-11-19 | Autonom8, Inc. | System and method for semantic textual information recognition |
CN107704857B (zh) * | 2017-09-25 | 2020-07-24 | 北京邮电大学 | 一种端到端的轻量级车牌识别方法及装置 |
JP7088661B2 (ja) * | 2017-10-30 | 2022-06-21 | 株式会社インフォディオ | 紙帳票データ化システム、ocrエンジン学習用画像生成装置および画像分析装置 |
US10810265B2 (en) * | 2017-10-31 | 2020-10-20 | Jpmorgan Chase Bank, N.A. | Automatic note board data capture and export |
US10679085B2 (en) * | 2017-10-31 | 2020-06-09 | University Of Florida Research Foundation, Incorporated | Apparatus and method for detecting scene text in an image |
US10592787B2 (en) * | 2017-11-08 | 2020-03-17 | Adobe Inc. | Font recognition using adversarial neural network training |
US11709854B2 (en) | 2018-01-02 | 2023-07-25 | Bank Of America Corporation | Artificial intelligence based smart data engine |
JP7234495B2 (ja) * | 2018-01-25 | 2023-03-08 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
CN108256493A (zh) * | 2018-01-26 | 2018-07-06 | 中国电子科技集团公司第三十八研究所 | 一种基于车载视频的交通场景文字识别系统及识别方法 |
RU2695489C1 (ru) * | 2018-03-23 | 2019-07-23 | Общество с ограниченной ответственностью "Аби Продакшн" | Идентификация полей на изображении с использованием искусственного интеллекта |
GB2572386B (en) * | 2018-03-28 | 2021-05-19 | Canon Europa Nv | An image processing system and an image processing method |
CN108648748B (zh) * | 2018-03-30 | 2021-07-13 | 沈阳工业大学 | 医院噪声环境下的声学事件检测方法 |
WO2019195736A2 (en) * | 2018-04-05 | 2019-10-10 | Chevron U.S.A. Inc. | Classification of piping and instrumental diagram information using machine-learning |
CA3100495A1 (en) | 2018-05-16 | 2019-11-21 | Benevis Informatics, Llc | Systems and methods for review of computer-aided detection of pathology in images |
EP3572972A1 (en) * | 2018-05-23 | 2019-11-27 | IDEMIA Identity & Security Germany AG | Extendend convolutional neural network for document analysis |
CN110163192B (zh) * | 2018-05-28 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 字符识别方法、装置及可读介质 |
US10824854B2 (en) * | 2018-06-18 | 2020-11-03 | Sap Se | Systems and methods for extracting data from an image |
CA3009685C (en) | 2018-06-27 | 2023-08-08 | The Toronto-Dominion Bank | Automatic generation and population of digital interfaces based on adaptively processed image data |
US10915788B2 (en) * | 2018-09-06 | 2021-02-09 | Sap Se | Optical character recognition using end-to-end deep learning |
CN109117848B (zh) * | 2018-09-07 | 2022-11-18 | 泰康保险集团股份有限公司 | 一种文本行字符识别方法、装置、介质和电子设备 |
CN109388404B (zh) * | 2018-10-10 | 2022-10-18 | 北京如布科技有限公司 | 一种路径解码方法、装置、计算机设备及存储介质 |
WO2020079605A1 (en) * | 2018-10-16 | 2020-04-23 | Indian Institute Of Science | Device and method for enhancing readability of a low-resolution binary image |
RU2703270C1 (ru) * | 2018-10-31 | 2019-10-16 | Общество с ограниченной ответственностью "Аби Продакшн" | Оптическое распознавание символов посредством применения специализированных функций уверенности, реализуемое на базе нейронных сетей |
US10846524B2 (en) * | 2018-11-14 | 2020-11-24 | Adobe Inc. | Table layout determination using a machine learning system |
US10824808B2 (en) * | 2018-11-20 | 2020-11-03 | Sap Se | Robust key value extraction |
JP7460633B2 (ja) * | 2018-12-19 | 2024-04-02 | パックサイズ リミティド ライアビリティ カンパニー | コンピュータビジョンを使用する複合視覚検査タスクの連携学習のためのシステムと方法 |
CN111401099B (zh) * | 2018-12-28 | 2023-04-07 | 中国电信股份有限公司 | 文本识别方法、装置以及存储介质 |
CN109670480B (zh) * | 2018-12-29 | 2023-01-24 | 深圳市丰巢科技有限公司 | 图像判别方法、装置、设备及存储介质 |
JP2020123925A (ja) * | 2019-01-31 | 2020-08-13 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7298223B2 (ja) | 2019-03-19 | 2023-06-27 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
US11631266B2 (en) * | 2019-04-02 | 2023-04-18 | Wilco Source Inc | Automated document intake and processing system |
US10949664B2 (en) * | 2019-04-08 | 2021-03-16 | Kyocera Document Solutions Inc. | Optical character recognition training data generation for neural networks by parsing page description language jobs |
US11227176B2 (en) | 2019-05-16 | 2022-01-18 | Bank Of Montreal | Deep-learning-based system and process for image recognition |
CN110349147B (zh) * | 2019-07-11 | 2024-02-02 | 腾讯医疗健康(深圳)有限公司 | 模型的训练方法、眼底黄斑区病变识别方法、装置及设备 |
EP3999929A4 (en) | 2019-07-16 | 2023-06-21 | nference, inc. | SYSTEMS AND METHODS FOR POPULATING A STRUCTURED DATABASE BASED ON AN IMAGE REPRESENTATION OF A DATA TABLE |
US11481605B2 (en) | 2019-10-25 | 2022-10-25 | Servicenow Canada Inc. | 2D document extractor |
WO2021079347A1 (en) * | 2019-10-25 | 2021-04-29 | Element Ai Inc. | 2d document extractor |
ES2849123B2 (es) | 2020-02-13 | 2023-03-07 | Univ Illes Balears | Elemento de generación de señales estocásticas, neurona estocástica y red neuronal a partir de esta |
US11270153B2 (en) | 2020-02-19 | 2022-03-08 | Northrop Grumman Systems Corporation | System and method for whole word conversion of text in image |
CN111492370B (zh) * | 2020-03-19 | 2023-05-26 | 香港应用科技研究院有限公司 | 用于识别结构化布局的文本图像的装置和方法 |
US11790489B2 (en) | 2020-04-07 | 2023-10-17 | Samsung Electronics Co., Ltd. | Systems and method of training networks for real-world super resolution with unknown degradations |
US20220019932A1 (en) * | 2020-07-14 | 2022-01-20 | Sap Se | Automatic generation of odata services from sketches using deep learning |
KR102391068B1 (ko) | 2020-07-24 | 2022-04-28 | 엄춘호 | 문서 인식 시스템 및 방법 |
EP4085395A1 (en) * | 2020-08-13 | 2022-11-09 | Google LLC | Reducing power consumption by hardware accelerator during generation and transmission of machine learning inferences |
US11281928B1 (en) * | 2020-09-23 | 2022-03-22 | Sap Se | Querying semantic data from unstructured documents |
WO2022081127A1 (en) * | 2020-10-12 | 2022-04-21 | Hewlett-Packard Development Company, L.P. | Document language prediction |
CN112434689B (zh) * | 2020-12-01 | 2025-03-14 | 天冕信息技术(深圳)有限公司 | 识别图片中信息的方法、装置、设备及存储介质 |
KR20220084679A (ko) * | 2020-12-14 | 2022-06-21 | (주)윕스 | 도면 독해 및 검색 기능 제공방법 및 그 장치와 시스템 |
US12120279B2 (en) | 2021-01-13 | 2024-10-15 | Hewlett-Packard Development Company, L.P. | Output resolution selections |
CN112784857B (zh) * | 2021-01-29 | 2022-11-04 | 北京三快在线科技有限公司 | 一种模型训练以及图像处理方法及装置 |
ES2993665T3 (en) | 2021-02-22 | 2025-01-03 | Zeiss Carl Vision Int Gmbh | Devices and methods for processing eyeglass prescriptions |
CN112949257B (zh) * | 2021-02-26 | 2025-03-28 | 深圳市英威腾电气股份有限公司 | 字符显示方法、装置、设备以及计算机可读存储介质 |
EP4101367A1 (en) | 2021-06-09 | 2022-12-14 | Carl Zeiss Vision International GmbH | Method and device for determining a visual performance |
CN114419613A (zh) * | 2022-01-17 | 2022-04-29 | 北京百度网讯科技有限公司 | 图像样本生成方法、文本识别方法、装置、设备和介质 |
US12183100B2 (en) * | 2022-01-22 | 2024-12-31 | Jpmorgan Chase Bank, N.A. | System and method for generating best potential rectified data based on past recordings of data |
CN114627482B (zh) * | 2022-05-16 | 2022-08-12 | 四川升拓检测技术股份有限公司 | 基于图像处理与文字识别实现表格数字化处理方法及系统 |
CN115497106B (zh) * | 2022-11-14 | 2023-01-24 | 合肥中科类脑智能技术有限公司 | 基于数据增强和多任务模型的电池激光喷码识别方法 |
CN116781771B (zh) * | 2023-08-21 | 2023-11-17 | 南京粒聚智能科技有限公司 | 一种使用ocr技术的工位机自动截屏图片解析方法 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4173772A (en) | 1977-12-30 | 1979-11-06 | International Business Machines Corporation | Solid state image scanning system for producing a binary output |
JPH07117995B2 (ja) * | 1989-07-21 | 1995-12-18 | セイコーエプソン株式会社 | 文字認識装置 |
US5048097A (en) * | 1990-02-02 | 1991-09-10 | Eastman Kodak Company | Optical character recognition neural network system for machine-printed characters |
US5321770A (en) * | 1991-11-19 | 1994-06-14 | Xerox Corporation | Method for determining boundaries of words in text |
JP2979109B2 (ja) | 1992-12-03 | 1999-11-15 | 日本アイ・ビー・エム 株式会社 | 認識文字の情報作成方法及び装置 |
GB9226137D0 (en) | 1992-12-15 | 1993-02-10 | Ibm | Data entry system |
JPH0728946A (ja) * | 1993-07-15 | 1995-01-31 | Hitachi Eng Co Ltd | 文字認識装置及び方法 |
SG45100A1 (en) | 1994-03-07 | 1998-01-16 | Ibm | Improvements in image processing |
CA2155891A1 (en) | 1994-10-18 | 1996-04-19 | Raymond Amand Lorie | Optical character recognition system having context analyzer |
JPH08235312A (ja) * | 1995-02-23 | 1996-09-13 | Smk Corp | 光学式文字認識における文字切り出し方法 |
JP3309174B2 (ja) * | 1995-05-15 | 2002-07-29 | 日本電信電話株式会社 | 文字認識方法及び装置 |
US6128606A (en) * | 1997-03-11 | 2000-10-03 | At&T Corporation | Module for constructing trainable modular network in which each module inputs and outputs data structured as a graph |
JPH11232378A (ja) * | 1997-12-09 | 1999-08-27 | Canon Inc | デジタルカメラ、そのデジタルカメラを用いた文書処理システム、コンピュータ可読の記憶媒体、及び、プログラムコード送出装置 |
DE69822608T2 (de) | 1998-05-28 | 2005-01-05 | International Business Machines Corp. | Binarisierungsverfahren in einem Zeichenerkennungssystem |
US6192360B1 (en) | 1998-06-23 | 2001-02-20 | Microsoft Corporation | Methods and apparatus for classifying text and for building a text classifier |
US6553131B1 (en) * | 1999-09-15 | 2003-04-22 | Siemens Corporate Research, Inc. | License plate recognition with an intelligent camera |
US6687421B1 (en) | 2000-03-17 | 2004-02-03 | International Business Machines Corporation | Skew detection of text in a noisy digitized image |
US6735335B1 (en) | 2000-05-30 | 2004-05-11 | Microsoft Corporation | Method and apparatus for discriminating between documents in batch scanned document files |
US6738512B1 (en) | 2000-06-19 | 2004-05-18 | Microsoft Corporation | Using shape suppression to identify areas of images that include particular shapes |
JP2002032713A (ja) * | 2000-07-17 | 2002-01-31 | Victor Co Of Japan Ltd | 文字認識処理方法 |
US6687697B2 (en) | 2001-07-30 | 2004-02-03 | Microsoft Corporation | System and method for improved string matching under noisy channel conditions |
JP4240859B2 (ja) * | 2001-09-05 | 2009-03-18 | 株式会社日立製作所 | 携帯端末装置及び通信システム |
CN1426017A (zh) * | 2001-12-14 | 2003-06-25 | 全景软体股份有限公司 | 一种校对多个电子文件的方法及其系统 |
US20030164819A1 (en) * | 2002-03-04 | 2003-09-04 | Alex Waibel | Portable object identification and translation system |
US20030236104A1 (en) * | 2002-06-21 | 2003-12-25 | Gvc Corporation | Method and device for quickly storing a telephone book in a mobile device |
-
2004
- 2004-05-20 US US10/850,335 patent/US7499588B2/en active Active
-
2005
- 2005-05-19 EP EP05104250.5A patent/EP1598770B1/en not_active Expired - Lifetime
- 2005-05-19 ES ES05104250.5T patent/ES2610467T3/es not_active Expired - Lifetime
- 2005-05-20 KR KR1020050042600A patent/KR101114135B1/ko not_active Expired - Lifetime
- 2005-05-20 JP JP2005147966A patent/JP4698289B2/ja not_active Expired - Fee Related
- 2005-05-20 CN CNB2005100923807A patent/CN100446027C/zh not_active Expired - Fee Related
-
2010
- 2010-08-02 JP JP2010173815A patent/JP5073022B2/ja not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8340426B2 (en) | 2007-11-22 | 2012-12-25 | Samsung Electronics Co., Ltd. | Apparatus and method for recognizing characters |
KR20140059834A (ko) * | 2011-08-29 | 2014-05-16 | 퀄컴 인코포레이티드 | 콘텍스트 정보를 이용한 모바일 디바이스 상에서의 광학적 문자 인식 |
KR20170021176A (ko) * | 2015-08-17 | 2017-02-27 | 한국과학기술원 | 해파리 퇴치용 군집 로봇 시스템을 효율적으로 운용하기 위한 해파리 분포 인식 방법 및 시스템 |
KR20190142286A (ko) * | 2017-05-04 | 2019-12-26 | 주식회사 매스프레소 | 가중치 기반의 유사 문제 필터링 방법 |
KR20200076088A (ko) * | 2018-12-19 | 2020-06-29 | (주)린치핀 | 온라인 파츠북 서비스 제공 방법 및 시스템 |
KR102104605B1 (ko) * | 2019-04-24 | 2020-04-27 | 도프텍(주) | 인공지능 기반 플랜트 도면 내 심볼 자동인식 방법 및 장치 |
KR102142238B1 (ko) * | 2020-02-25 | 2020-08-07 | 주식회사 엔디소프트 | 소정 이미지에 포함된 축약어, 손글씨, 비정형 단어 및 문장과 같은 텍스트 정보를 추출한 후 그 추출 결과를 소정 언어로 자동 번역하는 방법 |
KR20200106472A (ko) * | 2020-08-31 | 2020-09-14 | (주)린치핀 | 클라우드 기반 온라인 파츠북 서비스 제공 방법 및 시스템 |
KR20200106471A (ko) * | 2020-08-31 | 2020-09-14 | (주)린치핀 | 온라인 파츠북 뷰어 시스템 |
KR20200108808A (ko) * | 2020-08-31 | 2020-09-21 | (주)린치핀 | 온라인 파츠북을 이용한 파츠 주문 배송 시스템 |
WO2021081562A3 (en) * | 2021-01-20 | 2021-12-09 | Innopeak Technology, Inc. | Multi-head text recognition model for multi-lingual optical character recognition |
Also Published As
Publication number | Publication date |
---|---|
EP1598770A3 (en) | 2008-12-10 |
JP5073022B2 (ja) | 2012-11-14 |
EP1598770B1 (en) | 2016-10-12 |
EP1598770A2 (en) | 2005-11-23 |
US20050259866A1 (en) | 2005-11-24 |
ES2610467T3 (es) | 2017-04-27 |
CN1737822A (zh) | 2006-02-22 |
KR101114135B1 (ko) | 2012-02-20 |
JP2005346707A (ja) | 2005-12-15 |
CN100446027C (zh) | 2008-12-24 |
US7499588B2 (en) | 2009-03-03 |
JP4698289B2 (ja) | 2011-06-08 |
JP2011008802A (ja) | 2011-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101114135B1 (ko) | 카메라 입력된 문서들을 위한 저해상 ocr | |
US11188713B2 (en) | Extracting structured information from a document containing filled form images | |
US10936862B2 (en) | System and method of character recognition using fully convolutional neural networks | |
US10867171B1 (en) | Systems and methods for machine learning based content extraction from document images | |
US7664325B2 (en) | Framework for detecting a structured handwritten object | |
US8345978B2 (en) | Detecting position of word breaks in a textual line image | |
US9152883B2 (en) | System and method for increasing the accuracy of optical character recognition (OCR) | |
US20090116736A1 (en) | Systems and methods to automatically classify electronic documents using extracted image and text features and using a machine learning subsystem | |
US9911034B2 (en) | Methods and systems that use hierarchically organized data structure containing standard feature symbols in order to convert document images to electronic documents | |
US11615244B2 (en) | Data extraction and ordering based on document layout analysis | |
EP3539051A1 (en) | System and method of character recognition using fully convolutional neural networks | |
JP5942361B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20230343122A1 (en) | Performing optical character recognition based on fuzzy pattern search generated using image transformation | |
JP2004171316A (ja) | Ocr装置及び文書検索システム及び文書検索プログラム | |
JP6310155B2 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
Al-Barhamtoshy et al. | Arabic OCR segmented-based system | |
Reza et al. | Grouping of handwritten Bangla basic characters, numerals and vowel modifiers for multilayer classification | |
Chen et al. | MONSTERMASH: multidirectional, overlapping, nested, spiral text extraction for recognition models of Arabic-script handwriting | |
Weber | Extracting retrievable information from archival documents | |
Sokerin et al. | Object detection in financial reporting documents for subsequent recognition | |
Fujishima et al. | Proposal of character recognition algorithm using database | |
Chaudhuri | On ocr of major indian scripts: Bangla and devanagari | |
Song et al. | Free-Flow: Unintrusive Reading Device for a Printed Text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20050520 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20100513 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20050520 Comment text: Patent Application |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20110701 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20111104 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20120201 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20120201 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20150121 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20150121 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160104 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20160104 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170119 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20170119 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180118 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20180118 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190116 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20190116 Start annual number: 8 End annual number: 8 |