KR101917525B1 - 문자열 식별 방법 및 장치 - Google Patents
문자열 식별 방법 및 장치 Download PDFInfo
- Publication number
- KR101917525B1 KR101917525B1 KR1020170084954A KR20170084954A KR101917525B1 KR 101917525 B1 KR101917525 B1 KR 101917525B1 KR 1020170084954 A KR1020170084954 A KR 1020170084954A KR 20170084954 A KR20170084954 A KR 20170084954A KR 101917525 B1 KR101917525 B1 KR 101917525B1
- Authority
- KR
- South Korea
- Prior art keywords
- probability
- character
- image
- probability map
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000011156 evaluation Methods 0.000 claims description 19
- 238000013527 convolutional neural network Methods 0.000 claims description 18
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 15
- 238000002372 labelling Methods 0.000 claims description 12
- 229910000831 Steel Inorganic materials 0.000 claims description 9
- 239000010959 steel Substances 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 description 37
- 238000010586 diagram Methods 0.000 description 29
- 238000012545 processing Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G06K9/3258—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G06K9/2054—
-
- G06K9/481—
-
- G06K9/6226—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/469—Contour-based spatial representations, e.g. vector-coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 도 1에서 나타낸 문자열 식별 장치(100)가 대상 이미지에서 문자열을 식별하는 방법을 나타낸 순서도이다.
도 3은 프로세서(110)가 대상 이미지에서 제1 부분 이미지들을 추출하는 것을 나타낸 개념도이다.
도 4는 프로세서(110)가 문자열의 세로 방향 위치를 추정하는 과정을 나타낸 개념도이다.
도 5는 프로세서(110)가 대상 이미지에서 적어도 하나의 서브 이미지를 추출하는 것을 나타낸 개념도이다.
도 6은 프로세서(110)가 제1 서브 이미지(SI1)에서 복수의 제2 부분 이미지들을 추출하는 것을 나타낸 개념도이다.
도 7은 일반적인 문자 인식에서 발생할 수 있는 문제점을 나타낸 개념도이다.
도 8은 일반적인 문자 인식에서 발생할 수 있는 문제점을 나타낸 개념도이다.
도 9는 부분 이미지에 인접한 부분 이미지들을 나타낸 도면이다.
도 10은 중첩 확률 맵의 효과를 나타낸 도면이다.
도 11은 제철소의 철강영상을 나타낸 도면이다.
도 12는 문자열의 다른 예를 나타낸 이미지이다.
도 13은 심층 컨볼루셔널 신경망의 컨볼루셔널 레이어(Convolutional Layer)에 의해 이미지의 특성을 추출하는 것을 나타내는 개념도이다.
도 14는 프로세서(110)가 도 5에서 나타낸 이미지(OI)로부터 컨볼루션 이미지를 추출한 것을 나타낸 개념도이다.
도 15은 부분 이미지에 대한 확률 벡터를 출력하는 심층 컨볼루셔널 신경망을 예시적으로 나타낸 개념도이다.
도 16는 심층 컨볼루셔널 신경망의 규격에 따른 파라미터들 개수의 변화를 나타낸 테이블이다.
도 17는 본 발명의 추가적인 실시예에 따른 문자열 식별 방법을 나타낸 순서도이다.
도 18은 프로세서(110)가 학습 데이터를 확장하는 예를 나타낸 개념도이다.
Claims (20)
- 대상 이미지에서 문자열을 식별하는 방법에 있어서,
상기 대상 이미지로부터 미리 정해진 간격으로 복수의 제1 부분 이미지들을 추출하는 단계;
상기 복수의 제1 부분 이미지들 각각이 문자로 분류될 확률을 계산하여, 제1 확률 맵을 생성하는 단계;
상기 제1 확률 맵에 기초하여, 상기 대상 이미지에서 문자열의 세로 방향 위치를 추정하는 단계;
상기 세로 방향 위치를 기준으로 복수의 제2 부분 이미지들을 추출하는 단계;
상기 복수의 제2 부분 이미지들 각각이 문자 또는 배경으로 분류될 확률을 계산하여, 제2 확률 맵을 생성하는 단계;
상기 제2 확률 맵에 기초하여, 상기 문자열의 위치 및 문자 간격을 획득하는 단계;를 포함하는 문자열 식별 방법. - 청구항 1에 있어서,
상기 문자열의 세로 방향 위치를 추정하는 단계는,
상기 제1 확률 맵의 각 행(row)에 포함된 픽셀들이 텍스트 영역으로 분류될 확률 값들을 합산함으로써, 가로 투영 프로파일을 계산하고, 상기 가로 투영 프로파일에 기초하여, 상기 문자열의 세로 방향 위치를 추정하는 문자열 식별 방법. - 청구항 1에 있어서,
상기 제2 부분 이미지들을 추출하는 단계는,
상기 대상 이미지에서, 상기 세로 방향 위치를 기준으로 적어도 하나의 서브 이미지를 추출하고, 상기 적어도 하나의 서브 이미지에서 상기 제2 부분 이미지들을 추출하는 문자열 식별 방법. - 청구항 1에 있어서,
상기 제2 부분 이미지들 사이의 간격은, 상기 제1 부분 이미지들 사이의 간격보다 작게 설정되는 문자열 식별 방법. - 청구항 1에 있어서,
상기 제2 확률 맵을 생성하는 단계는,
상기 제2 부분 이미지들 각각이 배경 또는 문자들 각각으로 분류될 확률 값들을 나타내는 확률 벡터들을 계산함으로써, 상기 제2 확률 맵을 생성하는 문자열 식별 방법. - 청구항 5에 있어서,
상기 문자열의 가로 위치 및 문자 간격을 결정하는 단계는,
상기 제2 확률 맵의 인접한 픽셀들에 대응하는 확률 벡터들의 합으로부터 중첩 확률 맵을 생성하고, 상기 중첩 확률 맵으로부터 문자열의 가로 위치 및 문자 간격을 결정하는 문자열 식별 방법. - 청구항 6에 있어서,
상기 문자열의 위치 및 문자 간격을 획득하는 단계는,
상기 중첩 확률 맵에 기초하여, 문자열의 위치 및 문자 간격에 따른 문자열 평가 점수를 계산함으로써, 상기 문자열의 위치 및 문자 간격을 획득하는 문자열 식별 방법. - 청구항 9에 있어서,
상기 문자열의 위치 및 문자 간격을 획득하는 단계는,
상기 문자열 평가 점수가 최대가 되도록 하는 문자열의 위치 및 문자 간격을 획득하는 문자열 식별 방법. - 청구항 1에 있어서,
상기 제2 확률 맵을 계산하는 단계는,
심층 컨볼루셔널 신경망(Deep Convolutional Neural Networks)을 이용하여 상기 제2 부분 이미지들 각각이 문자 또는 배경으로 분류될 확률을 계산하는 문자열 식별 방법. - 청구항 11에 있어서,
상기 제2 확률 맵을 계산하는 단계는,
필터 커널을 이용하여 상기 제2 부분 이미지에 대한 컨볼루션 이미지를 추출하는 단계 및 상기 컨볼루션 이미지에 대한 풀링(pooling)을 실시하는 단계를 포함하는 문자열 식별 방법. - 청구항 11에 있어서,
복수의 학습 이미지들 및 상기 복수의 학습 이미지들에 대한 라벨링 정보를 포함하는 학습 데이터를 이용하여, 상기 심층 컨볼루셔널 신경망을 학습시키는 단계;를 더 포함하는 문자열 식별 방법. - 청구항 13에 있어서,
상기 복수의 학습 이미지들 중 문자로 라벨링된 학습 이미지의 일부를 잘라내거나, 상기 문자로 라벨링된 학습 이미지를 확장하여 추가 학습 이미지를 생성함으로써, 학습 데이터를 확장하는 단계;를 더 포함하는 문자열 식별 방법. - 청구항 14에 있어서,
상기 학습 데이터를 확장하는 단계는,
상기 추가 학습 이미지의 크기를 미리 정해진 크기로 변경하는 문자열 식별 방법. - 철강 영상에 포함된 문자열을 식별하는 방법에 있어서,
상기 철강 영상으로부터 미리 정해진 간격으로 복수의 제1 부분 이미지들을 추출하는 단계;
상기 복수의 제1 부분 이미지들 각각이 문자로 분류될 확률을 계산하여, 제1 확률 맵을 생성하는 단계;
상기 제1 확률 맵에 기초하여, 상기 철강 영상에서 문자열의 세로 방향 위치를 추정하는 단계;
상기 세로 방향 위치를 기준으로 복수의 제2 부분 이미지들을 추출하는 단계;
상기 복수의 제2 부분 이미지들 각각이 문자 또는 배경으로 분류될 확률을 계산하여, 제2 확률 맵을 생성하는 단계;
상기 제2 확률 맵의 인접한 픽셀들에 대응하는 확률 벡터들의 합으로부터 중첩 확률 맵을 생성하는 단계;
상기 중첩 확률 맵에 기초하여, 문자열의 위치 및 문자 간격에 따른 문자열 평가 점수를 계산하는 단계; 및
상기 제2 확률 맵에 기초하여, 상기 문자열의 위치 및 문자 간격을 획득하는 단계;를 포함하는 문자열 식별 방법. - 청구항 18에 있어서,
상기 문자열의 위치 및 문자 간격을 획득하는 단계는,
상기 문자열 평가 점수가 최대가 되도록 하는 문자열의 위치 및 문자 간격을 획득하는 문자열 식별 방법. - 대상 이미지에서 문자열을 식별하는 장치에 있어서,
프로세서(processor); 및
상기 프로세서를 통해 실행되는 적어도 하나의 명령이 저장된 메모리(memory);를 포함하고,
상기 적어도 하나의 명령은, 상기 대상 이미지로부터 미리 정해진 간격으로 복수의 제1 부분 이미지들을 추출하고; 상기 복수의 제1 부분 이미지들 각각이 문자로 분류될 확률을 계산하여, 제1 확률 맵을 생성하고; 상기 제1 확률 맵에 기초하여, 상기 대상 이미지에서 문자열의 세로 방향 위치를 추정하고; 상기 세로 방향 위치를 기준으로 복수의 제2 부분 이미지들을 추출하고; 상기 복수의 제2 부분 이미지들 각각이 문자 또는 배경으로 분류될 확률을 계산하여, 제2 확률 맵을 생성하고; 상기 제2 확률 맵에 기초하여, 상기 문자열의 위치 및 문자 간격을 획득하도록 수행되는 문자열 식별 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170084954A KR101917525B1 (ko) | 2017-07-04 | 2017-07-04 | 문자열 식별 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170084954A KR101917525B1 (ko) | 2017-07-04 | 2017-07-04 | 문자열 식별 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101917525B1 true KR101917525B1 (ko) | 2018-11-09 |
Family
ID=64426488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170084954A Active KR101917525B1 (ko) | 2017-07-04 | 2017-07-04 | 문자열 식별 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101917525B1 (ko) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488108A (zh) * | 2020-12-11 | 2021-03-12 | 广州小鹏自动驾驶科技有限公司 | 一种车位号识别方法、装置、电子设备及存储介质 |
CN113743438A (zh) * | 2020-08-20 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 文本检测用数据集生成方法、装置和系统 |
KR102349510B1 (ko) * | 2021-06-08 | 2022-01-14 | 주식회사 산돌메타랩 | 인공지능 기반의 학습된 신경망을 이용한 폰트 인식 방법 및 폰트 인식 시스템 |
KR20230013846A (ko) * | 2021-07-20 | 2023-01-27 | 강상훈 | 문서 작성 보조 장치 |
KR20250027000A (ko) | 2023-08-18 | 2025-02-25 | 포항공과대학교 산학협력단 | 레이블 분산 기법을 이용한 이미지 내 텍스트 인식 장치 및 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004310251A (ja) | 2003-04-03 | 2004-11-04 | Konica Minolta Medical & Graphic Inc | 文字認識方法、文字認識装置および文字認識プログラム |
-
2017
- 2017-07-04 KR KR1020170084954A patent/KR101917525B1/ko active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004310251A (ja) | 2003-04-03 | 2004-11-04 | Konica Minolta Medical & Graphic Inc | 文字認識方法、文字認識装置および文字認識プログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743438A (zh) * | 2020-08-20 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 文本检测用数据集生成方法、装置和系统 |
CN112488108A (zh) * | 2020-12-11 | 2021-03-12 | 广州小鹏自动驾驶科技有限公司 | 一种车位号识别方法、装置、电子设备及存储介质 |
KR102349510B1 (ko) * | 2021-06-08 | 2022-01-14 | 주식회사 산돌메타랩 | 인공지능 기반의 학습된 신경망을 이용한 폰트 인식 방법 및 폰트 인식 시스템 |
KR20230013846A (ko) * | 2021-07-20 | 2023-01-27 | 강상훈 | 문서 작성 보조 장치 |
KR102509943B1 (ko) | 2021-07-20 | 2023-03-14 | 강상훈 | 문서 작성 보조 장치 |
KR20250027000A (ko) | 2023-08-18 | 2025-02-25 | 포항공과대학교 산학협력단 | 레이블 분산 기법을 이용한 이미지 내 텍스트 인식 장치 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101917525B1 (ko) | 문자열 식별 방법 및 장치 | |
US11042742B1 (en) | Apparatus and method for detecting road based on convolutional neural network | |
CN112861635B (zh) | 一种基于深度学习的火灾及烟雾实时检测方法 | |
CN110674804A (zh) | 文本图像的检测方法、装置、计算机设备和存储介质 | |
CN110032998B (zh) | 自然场景图片的文字检测方法、系统、装置和存储介质 | |
CN110796141B (zh) | 目标检测方法及相关设备 | |
US20210064871A1 (en) | Apparatus and method for recognition of text information | |
CN112036400B (zh) | 构建用于目标检测的网络的方法和目标检测方法及系统 | |
KR101805318B1 (ko) | 텍스트 영역 식별 방법 및 장치 | |
CN112836625A (zh) | 人脸活体检测方法、装置、电子设备 | |
KR20200049451A (ko) | 콘볼루션 신경망 시스템 및 그것의 동작 방법 | |
CN102800080A (zh) | 图像识别装置以及图像识别方法 | |
CN115035539B (zh) | 文档异常检测网络模型构建方法、装置、电子设备及介质 | |
CN113487610B (zh) | 疱疹图像识别方法、装置、计算机设备和存储介质 | |
CN102171723B (zh) | 红眼检测的方法 | |
CN112651364B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN112734747A (zh) | 一种目标检测方法、装置、电子设备和存储介质 | |
JP7096034B2 (ja) | 建築物抽出システム | |
CN113449620A (zh) | 基于语义分割的表格检测方法、装置、设备和介质 | |
CN112926426A (zh) | 基于监控视频的船舶识别方法、系统、设备及存储介质 | |
CN112560584A (zh) | 一种人脸检测方法及装置、存储介质、终端 | |
CN111815677B (zh) | 目标追踪方法、装置、终端设备和可读存储介质 | |
CN119107539A (zh) | 基于并行卷积自适应分割模型的桥梁表观细长病害识别方法 | |
JP7096033B2 (ja) | 建築物抽出システム | |
CN114581657B (zh) | 基于多尺度条形空洞卷积的图像语义分割方法、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170704 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20180614 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20181030 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20181105 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20181105 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20210927 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20220920 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20230921 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |