KR20220139292A - 문자 분할 방법, 장치 및 컴퓨터 판독 가능 저장 매체 - Google Patents

문자 분할 방법, 장치 및 컴퓨터 판독 가능 저장 매체 Download PDF

Info

Publication number
KR20220139292A
KR20220139292A KR1020227022859A KR20227022859A KR20220139292A KR 20220139292 A KR20220139292 A KR 20220139292A KR 1020227022859 A KR1020227022859 A KR 1020227022859A KR 20227022859 A KR20227022859 A KR 20227022859A KR 20220139292 A KR20220139292 A KR 20220139292A
Authority
KR
South Korea
Prior art keywords
character
image
grayscale image
edge
grayscale
Prior art date
Application number
KR1020227022859A
Other languages
English (en)
Inventor
청하이 훠
난겅 장
Original Assignee
차나안 브라이트 사이트 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN201911234826.3A external-priority patent/CN111027546B/zh
Priority claimed from CN201911233988.5A external-priority patent/CN111046862B/zh
Application filed by 차나안 브라이트 사이트 컴퍼니 리미티드 filed Critical 차나안 브라이트 사이트 컴퍼니 리미티드
Publication of KR20220139292A publication Critical patent/KR20220139292A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration by the use of local operators
    • G06T5/92
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18019Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern

Abstract

본 발명은 문자 분할 방법, 장치 및 컴퓨터 판독 가능 저장 매체를 제공하며, 그중 한가지 문자 분할 방법은 문자 영역 영상을 계조 영상으로 변환하는 단계(단계 101); 에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환하는 단계(단계 102); 투영 방법을 사용하여 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득하는 단계(단계 103); 및 윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하고, 타겟 문자 영역에 따라 문자 영역 영상에 대해 문자 분할을 수행하는 단계(단계 104); 를 포함한다. 다른 한가지 문자 분할 방법은, 문자 영역 영상을 계조 영상으로 변환하는 단계(단계 701); 퍼지 C-평균값을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하고, 상기 클러스터 분석 결과에 따라 상기 계조 영상에 대한 이진화 처리를 수행하는 단계(단계 702); 투영 방법을 사용하여 이진 영상으로부터 문자 위치 지정 블록을 획득하는 단계(단계 703); 및 문자 위치 지정 블록의 위치 정보에 따라 문자 영역 영상에 대한 문자 분할을 수행하는 단계(단계 704); 를 포함한다. 이러한 방법 및 장치를 사용하면 낮은 품질의 영상에 대해 문자 분할을 수행할 수 있다.

Description

문자 분할 방법, 장치 및 컴퓨터 판독 가능 저장 매체
본 발명은 디지털 영상 처리 기술분야에 속한 것으로, 상세하게는 문자 분할 방법, 장치 및 컴퓨터 판독 가능 저장 매체에 관한 것이다.
본 부분에서는 특허청구범위 중에 기재된 본 발명의 실시 형태를 위해 배경 및 상하문맥을 제공하고자 한다. 이 곳의 기재는 배경기술 부분에 포함되어 있다고 하여 종래기술에 속하는 것으로 인정해서는 안된다.
현재, 새로운 전자 기기가 널리 사용되고 있지만, 산업 환경에는 여전히 구식의 디지털 기기가 많이 존재하며, 생산 환경 때문에 중단이 허용되지 않으며 새로운 전자 기기로 대체될 수 없다. 위의 상황에 대한 일반적인 방안은 오래된 미터에 카메라를 설치하여 영상을 수집한후 원격 검침을 수행하는 것이다. 그 중 문자 분할 기능은 원격 검침 시스템의 기반이자 핵심으로서 시스템의 품질을 직접적으로 결정한다.
종래의 문자 분할 방식은 일반적으로 미터의 문자 영역 영상을 이진화한 후 투영을 통해 분할된 문자를 획득한다. 그 중 이진화 방법에는 일반적으로 1. 에지 검출 방법, 2. 히스토그램 임계값 방법, 3. 클러스터링 기술이 포함된다.
발명인은 상술한 방안을 실현하는 과정에서 다음과 같은 기술적 문제를 발견하였다.
실제 생산 환경에서, 다이얼은 녹, 얼룩, 반사 등의 문제가 발생하여, 도2에 도시 된 바와 같은 영상을 수집 할 수 있다. 또한, 문자 분할을 수행할 때, 위의 에지 검출 방법을 사용하는 경우, 느슨한 파라미터 설정을 선택하면(보다 완전한 문자 에지를 획득할 수 있음), 얼룩이나 반사와 같은 요인으로 인한 가짜 에지가많이 혼합되며, 엄격한 파라미터 설정은 타겟 문자의 에지 정보를 잃을 가능성이 있다. 그러나, 다른 두 가지 방법을 사용할 경우에는, 문자 고착이라는 심각한 문제가 있다. 이는 문자 분할 효과에 직접적인 영향을 미치며, 또한 후속 문자 인식 정확도에 영향을 미친다.
상기와 같은 종래 기술에서의 영상 품질이 좋지 않은 영상에 대하여 문자 분할을 수행하기 어려운 문제점을 해결하기 위하여, 문자 분할 방법, 장치 및 컴퓨터 판독 가능 저장 매체가 제안되고, 이러한 방법 및 장치를 사용하여, 위에서 언급한 문제를 해결할 수 있다.
본 발명은 하기 기술방안을 제공한다.
제1 측면에 있어서, 적어도 하나의 문자 프레임을 포함하는 문자 영역 영상을 획득하고, 문자 영역 영상을 계조 영상으로 변환하는 단계; 에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환하는 단계; 투영 방법을 사용하여 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득하는 단계; 및 윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하고, 타겟 문자 영역에 따라 문자 영역 영상에 대해 문자 분할을 수행하는 단계; 를 포함하는 문자 분할 방법이 제공된다.
바람직하게는, 에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환하기 전에, 계조 영상에 대한 필터링 처리를 수행하는 단계를 더 포함하며, 상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링이다.
바람직하게는, 에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환하는 단계는, canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하고, 에지 검출 결과에 따라 계조 영상을 에지 이진 영상으로 변환하는 단계를 더 포함한다.
바람직하게는, canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하기 전에, 계조 영상의 영상 품질 특징을 하는 단계; 및 계조 영상의 영상 품질 특징에 의해 canny 연산자의 파라미터를 적응적으로 조정하는 단계;를 더 포함하고, 영상 품질 특징은 글로벌 콘트라스트 및 글로벌 계조 평균값 중 하나 이상을 포함한다.
바람직하게는, 투영 방법을 사용하여 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득하는 단계는, 수직 투영 방법에 따라 에지 이진 영상에 대한 분할 처리를 수행함으로써, 적어도 하나의 문자 프레임과 대응하는 관계를 갖는 적어도 하나의 문자 프레임 분할 블록을 획득하는 단계를 포함한다.
바람직하게는, 윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하는 단계는, 윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서의 문자 윤곽을 결정하는 단계; 및 문자 프레임 분할 블록에서의 문자 윤곽의 최소 외접 직사각형 영역에 의해, 타겟 문자 영역을 결정하는 단계를 포함한다.
제2 측면에 있어서, 적어도 하나의 문자 프레임을 포함하는 문자 영역 영상을 획득하고, 문자 영역 영상을 계조 영상으로 변환하기 위한 획득 모듈; 에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환하기 위한 에지 검출 모듈; 투영 방법을 사용하여 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득하기 위한 투영 모듈; 및 윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하고, 타겟 문자 영역에 따라 문자 영역 영상에 대해 문자 분할을 수행하기 위한 윤곽 검출 모듈; 을 포함하는 문자 분할 장치가 제공된다.
바람직하게는, 에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환하기 전에, 계조 영상에 대한 필터링 처리를 수행하기 위한 필터링 모듈을 더 포함하며, 상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링이다.
바람직하게는, 에지 검출 모듈은 또한 canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하고, 에지 검출 결과에 따라 계조 영상을 에지 이진 영상으로 변환한다.
바람직하게는, 에지 검출 모듈은 또한 계조 영상의 영상 품질 특징을 검출하고, 계조 영상의 영상 품질 특징에 의해 canny 연산자의 파라미터를 적응적으로 조정하며, 상기 영상 품질 특징은 글로벌 콘트라스트 및 글로벌 계조 평균값 중 하나 이상을 포함한다.
바람직하게는, 투영 모듈은 또한 수직 투영 방법에 따라 에지 이진 영상에 대한 분할 처리를 수행함으로써, 적어도 하나의 문자 프레임과 대응하는 관계를 갖는 적어도 하나의 문자 프레임 분할 블록을 획득한다.
바람직하게는, 윤곽 검출 모듈은 또한 윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서의 문자 윤곽을 결정하고; 문자 프레임 분할 블록에서의 문자 윤곽의 최소 외접 직사각형 영역에 의해, 타겟 문자 영역을 결정한다.
제3 측면에 있어서, 다이얼에 판독값을 표시하기 위한 적어도 하나의 문자 프레임이 포함된 미터; 미터의 다이얼을 촬영하여 문자 영역 영상을 획득하기 위한 카메라 장치; 및 카메라 장치에 전기적으로 연결되여, 제1항 내지 제7항 중 어느 한 항의 방법을 수행하기 위한 문자 분할 장치;를 포함하는 스마트 미터 판독 시스템이 더 제공된다.
제4 측면에 있어서, 하나 이상의 멀티 코어 프로세서; 및 하나 이상의 프로그램을 저장하기 위한 메모리; 를 포함하고, 하나 이상의 프로그램이 하나 이상의 멀티 코어 프로세서에 의해 수행되는 경우, 적어도 하나의 문자 프레임을 포함하는 문자 영역 영상을 획득하고, 문자 영역 영상을 계조 영상으로 변환하는 단계; 에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환하는 단계; 투영 방법을 사용하여 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득하는 단계; 및 윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하고, 타겟 문자 영역에 따라 문자 영역 영상에 대해 문자 분할을 수행하는 단계; 를 하나 이상의 멀티 코어 프로세서로 하여금 구현하도록 하는 문자 분할 장치가 더 제공된다.
제5 측면에 있어서, 프로그램이 저장된 컴퓨터 판독 가능 저장 매체에 있어서, 상기 프로그램이 멀티 코어 프로세서에 의해 수행되는 경우, 상기 멀티 코어 프로세서로 하여금 상기 방법을 수행하도록 하는, 컴퓨터 판독 가능 저장 매체가 더 제공된다.
본 출원의 실시예에서 사용한 상술한 제1 측면 내지 제5 측면 중 적어도 하나의 기술방안은 하기와 같은 유리한 기술적 효과를 달성할 수 있다. 본 발명의 문자 분할 방법은 에지 검출 알고리즘과 윤곽 검출 알고리즘과 결합하고 문자 영역 영상를 여러 번 검출하여, 품질이 낮은 영상에 대해 문자 분할을 수행할 수 있으므로, 문자 분할 과정에서 분할 한계를 결정하기 어려운 문제를 피면할 수 있다.
제6 측면에 있어서, 문자 영역 영상을 획득하고 문자 영역 영상을 계조 영상으로 변환하는 단계; 퍼지 C-평균값을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하고, 상기 클러스터 분석 결과에 따라 상기 계조 영상에 대한 이진화 처리를 수행하여, 이진 영상을 획득하는 단계; 투영 방법을 사용하여 이진 영상으로부터 적어도 하나의 문자 위치 지정 블록을 획득하는 단계; 및 상기 문자 위치 지정 블록의 위치 정보에 따라 문자 영역 영상에 대한 문자 분할을 수행하는 단계; 를 포함하는 문자 분할 방법이 제공된다.
바람직하게는, 퍼지 C-평균값 클러스터링 알고리즘을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하기 전에, canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하여, 에지 영상을 획득하는 단계; 허프 변환 방정식를 사용하여 에지 영상에 대한 직선 검출을 수행하여, 상기 에지 영상의 경계선을 획득하는 단계; 및 상기 경계선에 따라 상기 계조 영상의 경계 부분을 제거하는 단계;를 더 포함한다.
바람직하게는, canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하기 전에, 상기 계조 영상의 영상 품질 특징을 검출하는 단계; 및 상기 계조 영상의 영상 품질 특징에 의해 canny 연산자의 파라미터를 적응적으로 조정하는 단계;를 더 포함하고, 상기 영상 품질 특징은 적어도 글로벌 콘트라스트 및/또는 글로벌 계조 평균값을 포함한다.
바람직하게는, canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하기 전에, 상기 방법은, 계조 영상에 대한 필터링 처리를 수행하는 단계를 더 포함하며, 상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링을 포함한다.
바람직하게는, 퍼지 C-평균값 클러스터링 알고리즘을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하기 전에, 상기 계조 영상에 대한 대수 변환을 수행하는 단계를 더 포함한다.
바람직하게는, 퍼지 C-평균값을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하고, 상기 클러스터 분석 결과에 따라 상기 계조 영상에 대한 이진화 처리를 수행하는 단계는, 상기 퍼지 C-평균값 클러스터링 알고리즘을 사용하여 상기 계조 영상에 대해 클러스터링을 수행함으로써 C개의 클러스터를 획득하는 단계; C개의 클러스터의 클러스터 중심에 따라 C개의 클러스터의 속성을 각각 결정하는 단계; 상기 계조 영상의 임의의 하나의 화소점이 상기 C개의 클러스터 각각에 대응하는 C개의 멤버십을 결정하는 단계; 상기 C개의 클러스터를 상기 멤버십에 따라 정렬하여 그중의 N개의 클러스터를 결정하고, 상기 N 개의 클러스터의 속성에 따라 상기 계조 영상의 임의의 하나의 화소점의 속성을 결정하는 단계; 및 상기 계조 영상의 임의의 하나의 화소점의 속성에 따라, 상기 계조 화상에 대하여 이진화 처리를 수행하는 단계;를 포함하고, C 및 N은 양의 정수이고 C는 상기 N보다 크다.
바람직하게는, 투영 방법을 사용하여 상기 이진 영상으로부터 적어도 하나의 문자 위치 지정 블록을 획득한 후, 상기 방법은 상기 적어도 하나의 문자 위치 지정 블록에서 각 문자 위치 지정 블록의 전경 화소 면적을 검출하는 단계; 및 전경 화소 면적에 따라, 적어도 하나의 문자 위치 지정 블록 중에서 간섭 블록을 검출하고, 상기 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하는 단계; 를 포함하고, 상기 간섭 블록의 상기 전경 화소 면적은 상기 적어도 하나의 문자 위치 지정 블록 중의 M개의 문자 위치 지정 블록의 상기 전경 화소 면적보다 작고, 상기 M는 미리 설정된 문자 수이다.
바람직하게는, 수직 투영 방법을 사용하여 상기 이진 영상으로부터 적어도 하나의 문자 위치 지정 블록을 획득한 후, 상기 방법은 비최근접 억제 알고리즘을 사용하여 상기 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하는 단계를 포함한다.
바람직하게는, 상기 적어도 하나의 문자 위치 지정 블록의 위치 정보에 따라, 상기 문자 영역 영상에 대한 문자 분할이 수행하는 단계는, 상기 적어도 하나의 문자 위치 지정 블록의 평균 폭을 결정하는 단계; 상기 적어도 하나의 문자 위치 지정 블록에 상기 평균 폭보다 폭이 작은 타겟 문자 위치 지정 블록이 존재하는 경우, 상기 타겟 문자 위치 지정 블록의 위치 정보 및 평균 폭에 따라, 상기 문자 영역 영상에 대한 문자 분할을 수행하는 단계; 를 포함한다.
제7 측면에 있어서, 문자 영역 영상을 획득하고, 상기 문자 영역 영상을 계조 영상으로 변환하기 위한 획득 모듈; 퍼지 C-평균값을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하고, 상기 클러스터 분석 결과에 따라 상기 계조 영상에 대한 이진화 처리를 수행하여, 이진 영상을 획득 하기 위한 클러스터링 모듈; 투영 방법을 사용하여 이진 영상으로부터 적어도 하나의 문자 위치 지정 블록을 획득하기 위한 문자 위치 지정 모듈; 및 상기 문자 위치 지정 블록의 위치 정보에 따라 문자 영역 영상에 대한 문자 분할을 수행하기 위한 분할모듈; 을 포함하는 문자 분할 장치가 제공된다.
바람직하게는, canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하여, 에지 영상을 획득하기 위한 에지 검출 모듈; 허프 변환 방정식를 사용하여 에지 영상에 대한 직선 검출을 수행하여, 상기 에지 영상의 경계선을 획득하기 위한 직선 검출 모듈; 상기 경계선에 따라 상기 계조 영상의 경계 부분을 제거하기 위한 경계 제거 모듈;을 더 포함한다.
바람직하게는, 상기 에지 검출 모듈은, 계조 영상의 영상 품질 특징을 검출하기 위한 품질 검출 모듈; 상기 계조 영상의 영상 품질 특징에 의해 canny 연산자의 파라미터를 적응적으로 조정하기 위한 파라미터 조정 모듈;을 더 포함하고, 상기 영상 품질 특징은 적어도 글로벌 콘트라스트 및/또는 글로벌 계조 평균값을 포함한다.
바람직하게는, 상기 장치는 상기 계조 영상에 대한 필터링 처리를 수행하기 위한 필터링 모듈을 더 포함하고, 상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링을 포함한다.
바람직하게는, 상기 계조 영상에 대한 대수 변환을 수행하기 위한 대수 변환 모듈을 더 포함한다.
바람직하게는, 상기 클러스터링 모듈은, 상기 퍼지 C-평균값 클러스터링 알고리즘을 사용하여 상기 계조 영상에 대해 클러스터링을 수행함으로써 C개의 클러스터를 획득하고; 상기 C개의 클러스터의 클러스터 중심에 따라 상기 C개의 클러스터의 속성을 각각 결정하고; 상기 계조 영상의 임의의 하나의 화소점이 상기 C개의 클러스터 각각에 대응하는 C개의 멤버십을 결정하고; 상기 C개의 클러스터를 상기 멤버십에 따라 정렬하여 그중의 N개의 클러스터를 결정하고, 상기 N 개의 클러스터의 속성에 따라 상기 계조 영상의 임의의 하나의 화소점의 속성을 결정하고; 상기 계조 영상의 임의의 하나의 화소점의 속성에 따라, 상기 계조 화상에 대하여 이진화 처리를 수행하며, C 및 N은 양의 정수이고, C는 상기 N보다 크다.
바람직하게, 상기 장치는 제1 제거 모듈을 포함하고, 제1 제거 모듈은 상기 적어도 하나의 문자 위치 지정 블록에서 각 문자 위치 지정 블록의 전경 화소 면적을 검출하고; 상기 전경 화소 면적에 따라 상기 적어도 하나의 문자 위치 지정 블록 중에서 간섭 블록을 검출하고, 상기 적어도 하나의 문자 위치 지정 블록으로부터 상기 간섭 블록을 제거하고, 상기 간섭 블록의 상기 전경 화소 면적은 상기 적어도 하나의 문자 위치 지정 블록 중의 M개의 문자 위치 지정 블록의 상기 전경 화소 면적보다 작고, 상기 M는 미리 설정된 문자 수이다.
바람직하게는, 상기 장치는 비최근접 억제 알고리즘을 사용하여 상기 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하기 위한 제2 제거 모듈을 포함한다.
바람직하게는, 상기 분할 모듈은, 상기 적어도 하나의 문자 위치 지정 블록의 평균 폭을 결정하고; 상기 적어도 하나의 문자 위치 지정 블록에 상기 평균 폭보다 폭이 작은 타겟 문자 위치 지정 블록이 존재하는 경우, 상기 타겟 문자 위치 지정 블록의 위치 정보 및 상기 평균 폭에 따라, 상기 문자 영역 영상에 대한 문자 분할을 수행한다.
제8 측면에 있어서, 하나 이상의 멀티 코어 프로세서; 및 하나 이상의 프로그램을 저장하기 위한 메모리; 를 포함하고, 하나 이상의 프로그램이 하나 이상의 멀티 코어 프로세서에 의해 수행되는 경우, 문자 영역 영상을 획득하고 문자 영역 영상을 계조 영상으로 변환하는 단계; 퍼지 C-평균값을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하고, 상기 클러스터 분석 결과에 따라 상기 계조 영상에 대한 이진화 처리를 수행하여, 이진 영상을 획득하는 단계; 투영 방법을 사용하여 이진 영상으로부터 적어도 하나의 문자 위치 지정 블록을 획득하는 단계; 및 상기 문자 위치 지정 블록의 위치 정보에 따라 문자 영역 영상에 대한 문자 분할을 수행하는 단계; 를 하나 이상의 멀티 코어 프로세서로 하여금 구현하도록 하는 문자 분할 장치가 제공된다.
제9 측면에 있어서, 프로그램이 저장된 컴퓨터 판독 가능 저장 매체에 있어서, 상기 프로그램이 멀티 코어 프로세서에 의해 수행되는 경우, 상기 멀티 코어 프로세서로 하여금 상기 방법을 수행하도록 하는, 컴퓨터 판독 가능 저장 매체가 더 제공된다.
제10 측면에 있어서, 다이얼에 문자를 표시하기 위한 미터; 미터의 다이얼을 촬영하여 문자 영역 영상을 획득하기 위한 카메라 장치; 및 카메라 장치에 전기적으로 연결되여, 제6 측면의 방법을 수행하기 위한 문자 분할 장치;를 포함하는 스마트 미터 판독 시스템이 더 제공된다.
본 출원의 실시예에서 채택된 전술한 제6 내지 제10 측면 중 적어도 하나의 기술방안은 하기와 같은 유리한 기술적 효과를 달성할 수 있다. 본 발명의 문자 분할 방안은 퍼지 C-평균값 클러스터링 알고리즘을 사용하여 원본 문자 영역 영상에 이진화 처리를 수행하여, 얼룩 및 반사 등과 같은 간섭을 대부분 제거한 이진 영상를 획득함으로써, 투영 방법을 사용하여 이진 영상에서 보다 정확한 문자 분할 위치를 획득할 수 있다. 따라서, 영상 품질이 좋지 않은 문자 영역 영상의 경우에도, 보다 정확한 문자 분할 효과를 획득할 수 있다. 본 출원의 실시예에서 사용한 상술한 적어도 하나의 기술 방안은 하기와 같은 유리한 기술적 효과를 달성할 수 있다. 본 발명의 문자 분할 방법은 에지 검출 알고리즘과 윤곽 검출 알고리즘과 결합하고 문자 영역 영상를 여러 번 검출하여, 품질이 낮은 영상에 대해 문자 분할을 수행할 수 있으므로, 문자 분할 과정에서 분할 한계를 결정하기 어려운 문제를 피면할 수 있다.
상술한 설명은 단지 본 발명 기술방안의 개략적인 설명에 지나지 않으며, 본 발명의 기술적 수단을 더욱 명확히 장악함으로써 명세서의 내용에 근거하여 실시할 수 있도록 하기 위한 것일 뿐이라는 점을 이해하여야 한다. 본 발명의 상술한 것 및 기타 것들의 목적, 특징 및 우점이 더욱 선명하고 용이하게 이해될 수 있도록 아래에는 특별히 본 발명의 구체적 실시 형태를 예시로 설명하고자 한다.
하기된 예시적 실시예의 상세한 설명을 열독함으로써 해당 분야의 일반 당업자는 본 출원서에 기재된 우점 및 유리한 이점, 그리고 기타 우점과 이점들을 명확히 이해하게 될 것이다. 첨부도면은 단지 예시적 실시예를 개시하기 위한 목적으로 제공되는 것이지, 본 발명에 대한 한정으로 인정해서는 안된다. 한편으로 전반 첨부도면에 있어서, 동일한 부호는 동일한 부재를 표시한다. 첨부도면 중 각각의 도면들은 하기와 같다.
도 1은 본 발명의 일 실시예에 따른 문자 분할 방법의 개략적인 흐름도이다.
도 2는 본 발명의 실시예에 따른 문자 영역 영상의 개략도이다.
도 3a는 본 발명의 실시예에서 한 종류의 에지 이진 영상의 개략도이고, 도 3b는 다른 종류의 에지 이진 영상의 개략도이다.
도 4는 본 발명의 실시예에서 문자 프레임 분할 블록의 개략도이다.
도 5는 본 발명의 실시예에서 타겟 문자 영역의 개략도이다.
도 6은 본 발명의 일 실시예에 따른 문자 분할 장치의 개략적인 구조도이다.
도 7은 본 발명의 다른 실시예에 따른 문자 분할 방법의 개략적인 흐름도이다.
도 8은 본 발명의 실시예에서 한 종류의 계조 영상의 개략도이다.
도 9는 본 발명의 실시예에서 한 종류의 이진 영상의 종류의 개략도이다.
도 10은 본 발명의 실시예에서 복수의 문자 위치 지정 블록의 개략도이다.
도 11은 본 발명의 실시예에서 문자 분할 후에 획득된 문자 영상의 개략도이다.
도 12는 본 발명의 일 실시예에 따른 상한 및 하한 경계를 갖는 계조 영상의 개략도이다.
도 13은 본 발명의 일 실시예에 따른 에지 영상의 개략도이다.
도 14는 본 발명의 다른 실시예에 따른 문자 분할 장치의 개략적인 구조도이다.
도 15는 본 발명의 또 다른 실시예에 따른 문자 분할 장치의 개략적인 구조도이다.
첨부도면에 있어서, 동일하거나 상응한 부호는 동일하거나 상응한 부분을 표시한다.
이하, 첨부도면을 참조하여 본 출원의 예시적 실시예를 더욱 상세하게 설명한다. 비록 첨부도면에는 본 출원 발명의 예시적인 실시예가 도시되었지만, 본 발명이 다양한 형식으로 구현될 수 있는 바 이 부분에서 개시된 실시예에만 한정되지 않는다는 점을 이해할 것이다. 반면에, 이들 실시예를 제공하는 것은 본 출원 발명을 더욱 투철히 이해하게 하기 위한 것으로, 본 출원 발명의 범위가 해당 기술분야의 당업자에게 완결하게 전달되는 것이 가능해진다.
본 발명에 있어서, 예컨대 "포함" 또는 "구비" 등과 같은 용어는 본 명세서 중에 공개된 특징, 숫자, 단계, 행위, 부재, 부분 또는 그 조합의 존재를 지시하고자 하는 것인 바, 하나 또는 복수의 기타 특징, 숫자, 단계, 행위, 부재, 부분 또는 그 조합의 존재 가능성을 배제하는 의미로 사용되는 것이 아니다.
이밖에 별도의 설명이 필요한 점이라면, 모순되지 않는 한, 본 발명 중의 실시예 및 실시예 중의 특징은 서로 조합될 수 있다. 이하, 첨부도면을 참조하고 한편으로 실시예를 결합하여 본 발명을 상세히 설명한다.
도 1은 본 출원의 일 실시예에 따른 문자 분할 방법(100)의 개략적인 흐름도로서, 상기 문자 분할 방법(100)은 미터의 문자 영역 영상을 문자 인식에 편리한 문자 영상으로 분할하는데 사용된다. 이러한 흐름에서, 장치의 각도로부터 볼때, 실행 주체는 하나 이상의 전자 장치 일 수 있고, 보다 구체적으로 이러한 장치의 카메라와 관련된 처리 모듈일 수 있으며; 프로그램 각도로부터 볼때, 그에 따라 실행 주체는 이러한 전자 장치에 탑재된 프로그램일 수 있다.
도 1의 흐름은 하기와 같은 단계 101 내지 단계104를 포함할 수 있다.
단계 101: 문자 영역 영상을 획득하고 문자 영역 영상을 계조 영상으로 변환한다.
여기서, 문자 영역 영상은 적어도 하나의 문자 프레임을 포함하며; 구체적으로, 상기 문자 영역 영상은 미터의 다이얼 영상일 수 있고, 상기 미터의 다이얼은 복수의 문자 프레임을 포함하고, 상기 복수의 문자 프레임은 동일한 크기를 가지고 규칙적으로 배열되며, 각 문자 프레임은 사용자가 값을 읽을 수 있도록 단일 문자를 표시하는 데 사용할 수 있다. 선택적으로, 문자 프레임은 직사각형, 원형등과 같은 임의의 규칙적인 형태로 형성될 수 있다. 선택적으로, 상기 미터는 일상 생활에서 흔히 볼 수 있는 수도 미터, 전기 미터, 가스 미터를 포함하나 이에 제한되지는 않고, 예를 들면, 캐릭터 휠형 수도 미터일 수도 있다. 또한, 상기 문자 영역 영상은 미터의 다이얼을 향해 설치된 카메라 장치로 획득할 수 있으며, 물론 문자 영역 영상은 다른 장비와 같은 다른 소스에서 올 수도 있고, 또는 기존 영상일 수도 있으며, 본 실시예는 이를 제한하지 않는다. 또한, 획득된 문자 영역 영상은 RGB 형식일 수 있으며, 문자 영역 영상을 획득한 후, 문자 영역 영상에서 각 화소의 계조 값은 부동소수점 알고리즘, 정수화 방법, 쉬프트 방법, 평균화 방법 등과 같은 다양한 방법에 의해 결정될 수 있고, 화소점에서의 적색, 녹색, 청색의 3채널의 화소값 대신에 해당 계조 값을 사용하여. 계조 영상을 획득한다.선택적으로, 다른 일반적인 컬러 형식의 문자 영역 영상을 사용하여, 그에 따라 계조 영상으로 변환하는 것도 가능한다.
예를 들어, 도 2를 참조하면, 문자 영역 영상의 계조 영상이 도시되어 있으며, 상기 문자 영역 영상에 포함된 5개의 문자 "0", "0", "1", "5", "8"은 미터의 5개의 문자 프레임에 표시되는 숫자를 나타내는 데 사용되고, 표면의 얼룩과 촬영광으로 인해 미터에 표시되는 문자가 상대적으로 흐릿해지는 현상을 볼 수 있으며, 정확한 문자 분할이 어려운 문제가 있다.
단계 102: 에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환한다.
구체적으로, 상기 에지 검출 알고리즘을 사용하는 목적은 계조 영상에서 문자를 표시하는 데 사용되는 복수의 문자 프레임의 경계의 위치를 지정하는 것이다. 그 중 소위 에지(edge)는 주로 타겟과 배경 사이에 존재하는 영상의 국부적 강도 변화의 가장 현저한 부분을 말하며, 각 화소점의 계조 값 그래디언트 데이터에서 검색하여 획득할 수 있으며, 일반적으로 경계에 명확한 가장자리가 있으므로 이 특징을 사용하여 영상 분할할 수 있다. 에지 검출의 경우, 에지 검출 연산자를 사용해야 하는 경우가 많으며, 그 중 일반적으로 사용되는 에지 검출 연산자에는, Roberts 연산자, Laplace 연산자, Prewitt 연산자, Sobel 연산자, Rosonfeld 연산자, Kirsch 연산자 및 Canny 연산자 등이 있다. 또한, 상기 하나 이상의 에지 검출 연산자를 이용하여 에지 화소을 추출하기 위해 계조 영상에 에지 검출을 수행하고, 에지 화소점이 검출된 후에 이진화 처리가 수행된다. 복잡한 에지와 강한 노이즈가 있는 영상의 경우, 에지 검출은 노이즈 내성과 검출 정확도 사이의 모순에 직면한다는 점에 유의할 필요가 있다. 즉, 검출 정확도가 향상되면 노이즈에 의해 생성된 가짜 에지가 불합리한 윤곽으로 이어지며; 노이즈 내성이 향상되면 윤곽이 누락된다. 본 실시예에서, 상기 에지 검출의 목적은 계조 영상에서 문자를 표시하기 위한 문자 프레임의 위치를 지정하는 것이므로, 노이즈 내성이 높은 에지 검출 파라미터를 사용함으로써, 너무 많은 가짜 에지가 검출되는 것을 피면한다. 문자 자체에 비해 문자 프레임은 더 평활하고 연속적인 경계를 가지고 있으므로, 누락된 부분의 에지가 여전히 윤곽선을 표시할 수 있음을 이해해야 한다. 입체 효과를 가지는 문자 프레임 (예를 들어, 자주 보이는 캐릭터 휠형 수도 미터의 문자 프레임)의 경우, 촬영 중 빛과 그림자 투영 작용으로 인해, 상기 문자 프레임의 화소점은 일반적으로 다른 화소점보다 높은 그라디언트를 갖는다. 선택적으로, 상기 노이즈 내성이 높은 에지 검출 파라미터를 더 획득하기 위해, 복수의 에지 검출 파라미터가 미리 설정될 수 있고 에지 검출이 수행될 수 있으며, 문자 프레임의 기본 윤곽을 유지하면서 노이즈 포인트를 최소화할 수 있는 에지 이진 영상이 선택된다. 선택적으로, 상기 노이즈 내성이 높은 에지 검출 파라미터를 획득하기 위해, 에지 검출 파라미터 모델도 사전 훈련될 수도 있으므로, 에지 검출 파라미터가 다양한 품질의 계조 영상에 대해 적응적으로 조정될 수 있어, 높은 노이즈 내성을 유지할 수 있다. 예를 들어, 계조 영상의 글로벌 콘트라스트가 낮을 때 많은 노이즈 포인트가 생성되며, 이 때 노이즈 내성이 높은 에지 검출 파라미터는 글로벌 콘트라스트에 따라 적응적으로 조정할 수 있다. 선택적으로, 경계 이진 영상은 분수령 알고리즘을 사용하여 획득할 수도 있다.
예를 들어, 도 3(a) 및 도 3(b)를 참조하면, 도 2에 도시된 계조 영상에 대해 서로 다른 에지 검출 파라미터를 사용하여 에지 검출을 수행한 후 획득한 에지 이진 영상을 나타낸다. 도 3(a)의 에지 이진 영상에는 윤곽의 검출 누설이 발생하고, 도 3(b)의 에지 이진 영상에는 가짜 에지를 많이 가지고 있음을 알 수 있다. 본 실시예에서는, 도 3(a) 에 도시된 바와 같이 노이즈 방지가 더 높은 에지 이진 영상을 사용하며, 가장 왼쪽의 문자 프레임의 숫자와 가장 오른쪽의 문자 프레임의 경계를 고려할 필요가 없다.
단계 103: 투영 방법을 사용하여 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득한다.
구체적으로, 상술한 투영 방법은 이진화 영상의 화소점 분포 히스토그램을 사용하여 분석함으로써, 인접 문자 프레임의 경계점을 찾아 분할하는데, 투영 방법은 구체적으로 수직 투영과 수평 투영을 포함한다. 상기 복수의 문자 프레임 분할 블록은 구체적으로 수직 투영도의 투영 값이 골에 위치하는 투영 위치에 의해 결정된다. 예를 들어, 도 4를 참조하면, 도 3(a)에 도시된 에지 이진 영상은 수평 투영되어 수직 투영도를 획득할 수 있으며, 수직 투영도의 투영 값이 0인 투영 위치로부터 왼쪽에서 오른쪽으로 5개의 문자 프레임 분할 블록을 획득한다.
단계 104: 윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하고 타겟 문자 영역에 따라 문자 영역 영상에 대해 문자 분할을 수행한다.
구체적으로, 윤곽 검출 알고리즘을 사용하는 목적은 윤곽 정보를 획득하기 위해 각 문자 프레임 분할 블록의 문자에 대해 윤곽 검출을 수행하고, 상기 문자의 윤곽 정보에 따라 보다 정확한 타겟 문자 영역을 찾는 것이다. 또한, 타겟 문자 영역에 해당하는 문자 영상을 문자 영역 영상에서 분할할 수 있고, 문자 영상에 따라 추가적인 문자 인식 작업을 수행할 수 있다.
예를 들어, 도 5를 참조하면, 도 4에 도시된 문자 프레임 분할 블록으로부터 획득된 타겟 문자 영역, 즉 직사각형 프레임의 내부 영역이 도시된다.
본 발명에서는, 에지 검출을 사용하여 계조 영상에 대한 대략적인 분할을 수행하여, 문자 프레임에 해당하는 대략적인 분할 결과, 즉 문자 프레임 분할 블록을 획득한 다음, 윤곽 검출 알고리즘을 상기 문자 프레임 분할 블록에 적용하여 보다 정확한 타겟 문자 영역을 획득하고, 에지 검출과 윤곽 검출을 결합하여, 품질이 낮은 영상에 대해 문자 분할을 수행할 수 있으므로, 문자 분할 과정에서 분할 한계를 결정하기 어려운 문제를 피면할 수 있다.
도 1의 문자 분할 방법에 기초하여, 본 출원의 일부 실시예는 또한 아래에 설명될 문자 분할 방법의 일부 특정 구현 방안 및 확장된 방안을 제공한다.
일 실시예에서, 단계(102) 전에, 방법(100)은, 계조 영상에 대해 필터링 처리를 수행하는 단계를 더 포함할 수 있고, 필터링 처리는 메디안 필터링 처리 및/또는 가우시안 필터링 처리이다.
구체적으로, 에지와 노이즈는 계조 불연속점으로, 둘 다 주파수 영역에서 고주파 성분이고, 미분 연산을 직접 적용하여 노이즈의 영향을 극복하기 어렵기 때문에, 미분 연산자로 에지 검출하기 전에 영상을 평활화하고 필터링해야 한다. 따라서, 본 실시예는 가우시안 필터링 및/또는 메디안 필터링을 사용하여 계조 영상을 컨볼루션하여, 명백한 노이즈 효과를 줄이고 영상을 평활화한다. 가우스 필터링은 선형 평활화 필터링으로 가우시안 노이즈를 제거하는 데 적용된다. 메디안 필터링은 비선형 평활화 필터링으로, 처리된 영상의 각 화소점의 계조 값을 특정 이웃 창에 있는 모든 화소접 계조값의 메디안으로 설정하는 것으로, 메디안 필터링 필터링은 임펄스 노이즈에 대한 우수한 필터링 효과를 가지며, 노이즈를 필터링하는 동시에 신호의 에지가 흐려지는 것을 방지할 수 있다.
이 실시예에서 제공하는 기술 방안으로 인해, 전술한 실시예와 비교하여 보면, 계조 영상에 대해 가우시안 필터링 및/또는 메디안 필터링을 수행함으로써, 미터의 얼룩이나 반사로 인한 노이즈의 영향을 줄여 후속 에지 검출의 정확도를 향상시킬 수 있다는 것을 이해할수 있다.
일 실시예에서, 단계 102는 canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하고, 에지 검출 결과에 따라 계조 영상을 에지 이진 영상으로 변환하는 단계를 더 포함할 수 있다.
구체적으로, canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하는 단계는, (1) 영상의 각 화소의 그래디언트 강도 및 방향을 계산하는 단계; (2) 비최대 억제값(Non-Maximum Suppression)을 적용하여 에지 검출로 인한 스퓨리어스 응답을 제거하는 단계; (3) 이중 임계값(Double-Threshold)검출을 적용하여 실제 및 잠재적 에지를 결정하는 단계; (4) 고립된 약한 에지를 억제함으로써 에지 검출이 최종적으로 완료되는 단게; 를 포함한다. 이중 임계값은 canny 에지 검출 알고리즘이 높은 임계값과 낮은 임계값 두 개의 값을 설정하도록 제안한다는 것을 의미한다. 높은 임계값은 영상의 타겟을 배경과 구별하는 데 사용되는 반면, 낮은 임계값은 에지를 평활화하여 불연속적인 가장자리 윤곽선을 연결하는 데 사용된다. 구체적으로, 한개 화소의 그래디언트가 높은 임계값보다 크면, 에지 화소점으로 간주되고; 낮은 임계값보다 작으면 비 에지 화소점으로 간주되며, 상기 화소점의 그라디언트가 둘 사이에 있으면 에지 화소에 연결된 경우에만 에지 화소점으로 간주된다.
또한, 상기 canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하기전에, 계조 영상의 영상 품질 특징을 검출하는 단계; 및 계조 영상 파라미터의 영상 품질 특징에 의해 canny 연산자를 적응적으로 조정하는 단계;를 더 포함할 수 있다.
여기서, 영상 품질 특징은 글로벌 콘트라스트 및 글로벌 계조 평균값 중 하나 이상을 포함한다. 구체적으로, 에지 검출 과정에서 노이즈 내성 및 검출 정확도를 동시에 고려하기 어려운 문제를 해결하기 위해, 본 실시예에서는 canny 에지 검출 알고리즘의 파라미터를 계조 영상의 영상 품질 특성에 따라 적응적으로 결정한다. 상기 영상 품질 특징은 예를 들어 글로벌 콘트라스트 합이고, 상기 canny 에지 검출 알고리즘의 파라미터는 예를 들어 높은 임계값 및/또는 낮은 임계값이다. 또한, 임계값 모델도 사전 훈련되어 현재 문자 분할이 진행 중인 문자 영역 영상의 품질에 따라 높은 임계값 및/또는 낮은 임계값을 적응적으로 조정할 수 있다.
예를 들어, 계조 영상의 글로벌 콘트라스트가 낮은 것으로 검출되면, 계조 영상의 선명도가 더 낮은 것으로 추측하고, 높은 임계값 및/또는 낮은 임계값을 사용하며, 계조 영상의 글로벌 콘트라스트가 높으면, 계조 영상의 선명도가 더 높은 것으로 추측되여, 보다 낮은, 높은 임계값 및/또는 낮은 임계값이 사용된다.
기존의 canny 에지 검출 알고리즘에서는 높은 임계값과 낮은 임계값을 인위적으로 결정하고, 높은 임계값/낮은 임계값의 비율이 고정되어 있어, canny 연산자 적용에 한계가 있음을 이해해야 하며, 본 실시예에서는, 높은 임계값과 낮은 임계값를 적응적으로 조정하는 방법이 사용됨으로써, 상기 실시예와 비교하여 볼때, 주변의 대량이고 무용한 가짜 경계 정보가 감소되어, 결함 에지에 대한 식별에 대한 노이즈로부터의 영향을 억제하고, 후속 윤곽 추출에 대해서도 매우 중요한 작용을 한다.
일 실시예에서, 단계(103)은, 수직 투영 방법에 따라 에지 이진 영상에 대해 분할 처리를 수행하여, 적어도 하나의 문자 프레임과 대응하는 관계를 갖는 적어도 하나의 문자 프레임 분할된 블록을 획득하는 단계를 더 포함할 수 있다.
구체적으로, 상기 분할 처리의 목적은, 상기 에지 이진 영상에서 서로 다른 문자 프레임에 해당하는 영상 영역을 서로 이격하여 각 영상 영역의 배경 영역을 최대한 제거함으로써, 단계(104)에서 윤곽 검출 연산량을 감소시킬수 있다.
일 실시예에서, 단계(104)는, 윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서의 문자 윤곽을 결정하는 단계; 및 문자 프레임 분할 블록에서의 문자 윤곽의 최소 외접 직사각형 영역에 의해, 목표 문자 영역을 결정하는 단계를 포함한다.
구체적으로, 각 문자 프레임 블록에 대해, 결정된 최소 외접 영역은 문자 프레임 블록의 모든 문자 윤곽선을 수용할 수 있다. 선택적으로, 계조 영상은 또한 더 많은 에지 정보를 포함하는 이진 영상으로 변환될 수 있으며, 이진 영상으로부터 복수의 문자 프레임 분할 블록의 위치에 대응하는 복수의 최적 문자 프레임 분할 블록을 잘라내고, 그 후, 복수의 최적 문자 프레임 분할 블록에 대하여 윤곽 검출을 수행함으로써 최적 목표 문자 영역 획득할 수 있다.
도 6은 도 1에 도시된 문자 분할 방법을 실행하는데 사용되는 본 출원의 실시예에 따른 문자 분할 장치(60)의 개략적인 구조도이다.
도 6에 도시된 바와 같이, 문자 분할 장치(60)는,
문자 영역 영상을 획득하고, 문자 영역 영상을 계조 영상으로 변환하기 위한 획득 모듈(601)을 포함한다. 여기서, 문자 영역 영상은 적어도 하나의 문자 프레임을 포함하며, 구체적으로, 상기 문자 영역 영상은 미터의 다이얼 영상일 수 있고, 상기 미터의 다이얼은 복수의 문자 프레임을 포함하고, 상기 복수의 문자 프레임은 동일한 크기를 가지고 규칙적으로 배열되며, 각 문자 프레임은 사용자가 값을 읽을 수 있도록 단일 문자를 표시하는 데 사용할 수 있다. 선택적으로, 문자 프레임은 직사각형, 원형등과 같은 임의의 규칙적인 형태로 형성될 수 있다. 선택적으로, 상기 미터는 일상 생활에서 흔히 볼 수 있는 수도 미터, 전기 미터, 가스 미터를 포함하나 이에 제한되지는 않고, 예를 들면, 캐릭터 휠형 수도 미터일 수도 있다. 또한, 상기 문자 영역 영상은 미터의 다이얼을 향해 설치된 카메라 장치로 획득할 수 있으며, 물론 문자 영역 영상은 다른 장비와 같은 다른 소스에서 올 수도 있고, 또는 기존 영상일 수도 있으며, 본 실시예는 이를 제한하지 않는다. 또한, 획득된 문자 영역 영상은 RGB 형식일 수 있으며, 문자 영역 영상을 획득한 후, 문자 영역 영상에서 각 화소의 계조 값은 부동소수점 알고리즘, 정수화 방법, 쉬프트 방법, 평균화 방법 등과 같은 다양한 방법에 의해 결정될 수 있고, 화소점에서의 적색, 녹색, 청색의 3채널의 화소값 대신에 해당 계조 값을 사용하여. 계조 영상을 획득한다.
예를 들어, 도 2를 참조하면, 문자 영역 영상의 계조 영상이 도시되어 있으며, 상기 문자 영역 영상에 포함된 5개의 문자 "0", "0", "1", "5", "8"은 미터의 5개의 문자 프레임에 표시되는 숫자를 나타내는 데 사용되고, 표면의 얼룩과 촬영광으로 인해 미터에 표시되는 문자가 상대적으로 흐릿해지는 현상을 볼 수 있으며, 정확한 문자 분할이 어려운 문제가 있다.
일 실시예에서, 문자 분할 장치(60)는,
에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환하기 위한 에지 검출 모듈(602)을 더 포함한다. 구체적으로, 상기 에지 검출 알고리즘을 사용하는 목적은 계조 영상에서 문자를 표시하는 데 사용되는 복수의 문자 프레임의 경계의 위치를 지정하는 것이다. 그 중 소위 에지(edge)는 주로 타겟과 배경 사이에 존재하는 영상의 국부적 강도 변화의 가장 현저한 부분을 말하며, 각 화소점의 계조 값 그래디언트 데이터에서 검색하여 획득할 수 있으며, 일반적으로 경계에 명확한 가장자리가 있으므로 이 특징을 사용하여 영상 분할할 수 있다. 에지 검출의 경우, 에지 검출 연산자를 사용해야 하는 경우가 많으며, 그 중 일반적으로 사용되는 에지 검출 연산자에는, Roberts 연산자, Laplace 연산자, Prewitt 연산자, Sobel 연산자, Rosonfeld 연산자, Kirsch 연산자 및 Canny 연산자 등이 있다. 또한, 상기 하나 이상의 에지 검출 연산자를 이용하여 에지 화소을 추출하기 위해 계조 영상에 에지 검출을 수행하고, 에지 화소점이 검출된 후에 이진화 처리가 수행된다. 복잡한 에지와 강한 노이즈가 있는 영상의 경우, 에지 검출은 노이즈 내성과 검출 정확도 사이의 모순에 직면한다는 점에 유의할 필요가 있다. 즉, 검출 정확도가 향상되면 노이즈에 의해 생성된 가짜 에지가 불합리한 윤곽으로 이어지며; 노이즈 내성이 향상되면 윤곽이 누락된다. 본 실시예에서, 상기 에지 검출의 목적은 계조 영상에서 문자를 표시하기 위한 문자 프레임의 위치를 지정하는 것이므로, 노이즈 내성이 높은 에지 검출 파라미터를 사용함으로써, 너무 많은 가짜 에지가 검출되는 것을 피면한다. 문자 자체에 비해 문자 프레임은 더 평활하고 연속적인 경계를 가지고 있으므로, 누락된 부분의 에지가 여전히 윤곽선을 표시할 수 있음을 이해해야 한다. 입체 효과를 가지는 문자 프레임 (예를 들어, 자주 보이는 캐릭터 휠형 수도 미터의 문자 프레임)의 경우, 촬영 중 빛과 그림자 투영 작용으로 인해, 상기 문자 프레임의 화소점은 일반적으로 다른 화소점보다 높은 그라디언트를 갖는다. 선택적으로, 상기 노이즈 내성이 높은 에지 검출 파라미터를 더 획득하기 위해, 복수의 에지 검출 파라미터가 미리 설정될 수 있고 에지 검출이 수행될 수 있으며, 문자 프레임의 기본 윤곽을 유지하면서 노이즈 포인트를 최소화할 수 있는 에지 이진 영상이 선택된다. 선택적으로, 상기 노이즈 내성이 높은 에지 검출 파라미터를 획득하기 위해, 에지 검출 파라미터 모델도 사전 훈련될 수도 있으므로, 에지 검출 파라미터가 다양한 품질의 계조 영상에 대해 적응적으로 조정될 수 있어, 높은 노이즈 내성을 유지할 수 있다. 예를 들어, 계조 영상의 글로벌 콘트라스트가 낮을 때 많은 노이즈 포인트가 생성되며, 이 때 노이즈 내성이 높은 에지 검출 파라미터는 글로벌 콘트라스트에 따라 적응적으로 조정할 수 있다. 선택적으로, 경계 이진 영상은 분수령 알고리즘을 사용하여 획득할 수도 있다.
예를 들어, 도 3(a) 및 도 3(b)를 참조하면, 도 2에 도시된 계조 영상에 대해 서로 다른 에지 검출 파라미터를 사용하여 에지 검출을 수행한 후 획득한 에지 이진 영상을 나타낸다. 도 3(a)의 에지 이진 영상에는 윤곽의 검출 누설이 발생하고, 도 3(b)의 에지 이진 영상에는 가짜 에지를 많이 가지고 있음을 알 수 있다. 본 실시예에서는, 도 3(a) 에 도시된 바와 같이 노이즈 방지가 더 높은 에지 이진 영상을 사용하며, 가장 왼쪽의 문자 프레임의 숫자와 가장 오른쪽의 문자 프레임의 경계를 고려할 필요가 없다.
일 실시예에서, 문자 분할 장치(60)는,
투영 방법을 사용하여 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득하기 위한 투영 모듈(603)을 더 포함한다. 구체적으로, 상술한 투영 방법은 이진화 영상의 화소점 분포 히스토그램을 사용하여 분석함으로써, 인접 문자 프레임의 경계점을 찾아 분할하는데, 투영 방법은 구체적으로 수직 투영과 수평 투영을 포함한다. 상기 복수의 문자 프레임 분할 블록은 구체적으로 수직 투영도의 투영 값이 골에 위치하는 투영 위치에 의해 결정된다. 예를 들어, 도 4를 참조하면, 도 3(a)에 도시된 에지 이진 영상은 수평 투영되어 수직 투영도를 획득할 수 있으며, 수직 투영도의 투영 값이 0인 투영 위치로부터 왼쪽에서 오른쪽으로 5개의 문자 프레임 분할 블록을 획득한다.
일 실시예에서, 문자 분할 장치(60)는,
윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하고 타겟 문자 영역에 따라 문자 영역 영상에 대해 문자 분할을 수행하기 위한 윤곽 검출 모듈(604)을 더 포함한다. 구체적으로, 윤곽 검출 알고리즘을 사용하는 목적은 윤곽 정보를 획득하기 위해 각 문자 프레임 분할 블록의 문자에 대해 윤곽 검출을 수행하고, 상기 문자의 윤곽 정보에 따라 보다 정확한 타겟 문자 영역을 찾는 것이다. 또한, 타겟 문자 영역에 해당하는 문자 영상을 문자 영역 영상에서 분할할 수 있고, 문자 영상에 따라 추가적인 문자 인식 작업을 수행할 수 있다.
예를 들어, 도 5를 참조하면, 도 4에 도시된 문자 프레임 분할 블록으로부터 획득된 타겟 문자 영역, 즉 직사각형 프레임의 내부 영역이 도시된다.
본 발명에서는, 에지 검출을 사용하여 계조 영상에 대한 대략적인 분할을 수행하여, 문자 프레임에 해당하는 대략적인 분할 결과, 즉 문자 프레임 분할 블록을 획득한 다음, 윤곽 검출 알고리즘을 상기 문자 프레임 분할 블록에 적용하여 보다 정확한 타겟 문자 영역을 획득하고, 에지 검출과 윤곽 검출을 결합하여, 품질이 낮은 영상에 대해 문자 분할을 수행할 수 있으므로, 문자 분할 과정에서 분할 한계를 결정하기 어려운 문제를 피면할 수 있다.
일 실시예에서, 분할 장치(60)는,
에지 검출 알고리즘을 사용하여 계조 영상을 에지 이진 영상으로 변환하기 전에, 계조 영상에 대해 필터링이 수행하기 위한 필터링 모듈을 더 포함할 수 있고, 필터링 처리는 메디안 필터링 처리 및/또는 가우시안 필터링 처리이다. 구체적으로, 에지와 노이즈는 계조 불연속점으로, 둘 다 주파수 영역에서 고주파 성분이고, 미분 연산을 직접 적용하여 노이즈의 영향을 극복하기 어렵기 때문에, 미분 연산자로 에지 검출하기 전에 영상을 평활화하고 필터링해야 한다. 따라서, 본 실시예는 가우시안 필터링 및/또는 메디안 필터링을 사용하여 계조 영상을 컨볼루션하여, 명백한 노이즈 효과를 줄이고 영상을 평활화한다. 가우스 필터링은 선형 평활화 필터링으로 가우시안 노이즈를 제거하는 데 적용된다. 메디안 필터링은 비선형 평활화 필터링으로, 처리된 영상의 각 화소점의 계조 값을 특정 이웃 창에 있는 모든 화소접 계조값의 메디안으로 설정하는 것으로, 메디안 필터링 필터링은 임펄스 노이즈에 대한 우수한 필터링 효과를 가지며, 노이즈를 필터링하는 동시에 신호의 에지가 흐려지는 것을 방지할 수 있다.
이 실시예에서 제공하는 기술 방안으로 인해, 전술한 실시예와 비교하여 보면, 계조 영상에 대해 가우시안 필터링 및/또는 메디안 필터링을 수행함으로써, 미터의 얼룩이나 반사로 인한 노이즈의 영향을 줄여 후속 에지 검출의 정확도를 향상시킬 수 있다는 것을 이해할수 있다.
일 실시예에서, 분할 장치(60)는,
canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하고, 에지 검출 결과에 따라 계조 영상을 에지 이진 영상으로 변환하기 위한 에지 검출 모듈(602)을 더 포함한다. 구체적으로, canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하는 단계는, (1) 영상의 각 화소의 그래디언트 강도 및 방향을 계산하는 단계; (2) 비최대 억제값(Non-Maximum Suppression)을 적용하여 에지 검출로 인한 스퓨리어스 응답을 제거하는 단계; (3) 이중 임계값(Double-Threshold)검출을 적용하여 실제 및 잠재적 에지를 결정하는 단계; (4) 고립된 약한 에지를 억제함으로써 에지 검출이 최종적으로 완료되는 단게; 를 포함한다. 이중 임계값은 canny 에지 검출 알고리즘이 높은 임계값과 낮은 임계값 두 개의 값을 설정하도록 제안한다는 것을 의미한다. 높은 임계값은 영상의 타겟을 배경과 구별하는 데 사용되는 반면, 낮은 임계값은 에지를 평활화하여 불연속적인 가장자리 윤곽선을 연결하는 데 사용된다. 구체적으로, 한개 화소의 그래디언트가 높은 임계값보다 크면, 에지 화소점으로 간주되고; 낮은 임계값보다 작으면 비 에지 화소점으로 간주되며, 상기 화소점의 그라디언트가 둘 사이에 있으면 에지 화소에 연결된 경우에만 에지 화소점으로 간주된다.
또한, 상기 canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하기전에, 계조 영상의 영상 품질 특징을 검출하는 단계; 및 계조 영상 파라미터의 영상 품질 특징에 의해 canny 연산자를 적응적으로 조정하는 단계;를 더 포함할 수 있다.
여기서, 영상 품질 특징은 글로벌 콘트라스트 및 글로벌 계조 평균값 중 하나 이상을 포함한다. 구체적으로, 에지 검출 과정에서 노이즈 내성 및 검출 정확도를 동시에 고려하기 어려운 문제를 해결하기 위해, 본 실시예에서는 canny 에지 검출 알고리즘의 파라미터를 계조 영상의 영상 품질 특성에 따라 적응적으로 결정한다. 상기 영상 품질 특징은 예를 들어 글로벌 콘트라스트 합이고, 상기 canny 에지 검출 알고리즘의 파라미터는 예를 들어 높은 임계값 및/또는 낮은 임계값이다. 또한, 임계값 모델도 사전 훈련되어 현재 문자 분할이 진행 중인 문자 영역 영상의 품질에 따라 높은 임계값 및/또는 낮은 임계값을 적응적으로 조정할 수 있다.
예를 들어, 계조 영상의 글로벌 콘트라스트가 낮은 것으로 검출되면, 계조 영상의 선명도가 더 낮은 것으로 추측하고, 높은 임계값 및/또는 낮은 임계값을 사용하며, 계조 영상의 글로벌 콘트라스트가 높으면, 계조 영상의 선명도가 더 높은 것으로 추측되여, 보다 낮은, 높은 임계값 및/또는 낮은 임계값이 사용된다.
기존의 canny 에지 검출 알고리즘에서는 높은 임계값과 낮은 임계값을 인위적으로 결정하고, 높은 임계값/낮은 임계값의 비율이 고정되어 있어, canny 연산자 적용에 한계가 있음을 이해해야 하며, 본 실시예에서는, 높은 임계값과 낮은 임계값를 적응적으로 조정하는 방법이 사용됨으로써, 상기 실시예와 비교하여 볼때, 주변의 대량이고 무용한 가짜 경계 정보가 감소되어, 결함 에지에 대한 식별에 대한 노이즈로부터의 영향을 억제하고, 후속 윤곽 추출에 대해서도 매우 중요한 작용을 한다.
일 실시예에서, 투영 모듈(603)은,
수직 투영 방법에 따라 에지 이진 영상에 대해 분할 처리를 수행하여, 적어도 하나의 문자 프레임과 대응하는 관계를 갖는 적어도 하나의 문자 프레임 분할된 블록을 획득힌다. 구체적으로, 상기 분할 처리의 목적은, 상기 에지 이진 영상에서 서로 다른 문자 프레임에 해당하는 영상 영역을 서로 이격하여 각 영상 영역의 배경 영역을 최대한 제거함으로써, 단계(104)에서 윤곽 검출 연산량을 감소시킬수 있다.
일 실시예에서, 윤곽 검출 모듈(604)은,
윤곽 검출 알고리즘을 사용하여 문자 프레임 분할 블록에서의 문자 윤곽을 결정하고, 문자 프레임 분할 블록에서의 문자 윤곽의 최소 외접 직사각형 영역에 의해, 목표 문자 영역을 결정한다. 구체적으로, 각 문자 프레임 블록에 대해, 결정된 최소 외접 영역은 문자 프레임 블록의 모든 문자 윤곽선을 수용할 수 있다. 선택적으로, 계조 영상은 또한 더 많은 에지 정보를 포함하는 이진 영상으로 변환될 수 있으며, 이진 영상으로부터 복수의 문자 프레임 분할 블록의 위치에 대응하는 복수의 최적 문자 프레임 분할 블록을 잘라내고, 그 후, 복수의 최적 문자 프레임 분할 블록에 대하여 윤곽 검출을 수행함으로써 최적 목표 문자 영역 획득할 수 있다.
도 7은 본 출원의 일 실시예에 따른 문자 분할 방법(700)의 개략적인 흐름도이며, 문자 분할 방법(700)은 (문자 인식과 같은) 후속 처리를 용이하게 하기 위해 미터의 문자 영역 영상을 문자 영상으로 분할하는데 사용된다. 이 프로세스에서 장치 관점에서 실행 본체는 하나 이상의 전자 장치, 보다 구체적으로 이러한 장치의 카메라와 관련된 처리 모듈일 수 있다. 이러한 전자 기기.
도 7의 흐름은 다음과 같은 단계 701 내지 단계704를 포함할 수 있다.
단계 701: 문자 영역 영상을 획득하고 문자 영역 영상을 계조 영상으로 변환한다.
구체적으로, 상기 미터는 일상 생활에서 흔히 볼 수 있는 수도 미터, 전기 미터, 가스 미터를 포함하나 이에 제한되지는 않고, 예를 들면, 캐릭터 휠형 수도 미터일 수도 있다. 또한, 상기 미터의 문자 영역 영상은 단일 문자 영상 또는 복수의 문자 영상일 수 있고, 미터의 다이얼을 향해 설치된 카메라 장치로 획득할 수 있으며, 물론 문자 영역 영상은 다른 장비와 같은 다른 소스에서 올 수도 있고, 또는 기존 영상일 수도 있으며, 본 실시예는 이를 제한하지 않는다. 또한, 획득된 문자 영역 영상은 RGB 형식일 수 있으며, 문자 영역 영상을 획득한 후, 문자 영역 영상에서 각 화소의 계조 값은 부동소수점 알고리즘, 정수화 방법, 쉬프트 방법, 평균화 방법 등과 같은 다양한 방법에 의해 결정될 수 있고, 화소점에서의 적색, 녹색, 청색의 3채널의 화소값 대신에 해당 계조 값을 사용하여. 계조 영상을 획득한다.
예를 들어, 도 8을 참조하면, 문자 영역 영상의 계조 영상이 도시되어 있으며, 상기 문자 영역 영상에서는, 왼쪽에서 오른쪽으로, 7개의 문자 "0", "0", "0", "0", "1", "1", "1"이 순차적으로 표시된다. 상기 복수의 문자들 사이의 경계가 충분히 명확하지 않고, 카메라의 감광 소자의 해상도가 부족하기 때문에 문자 영역 영상에 가로 줄무늬가 발생하고 또한 각 문자가 연결된 상태로 됨으로, 정확한 문자 분할을 수행하기 어려움을 알수 있다
단계 702: 퍼지 C-평균값을 사용하여 계조 영상에 대한 클러스터 분석을 수행하고 클러스터 분석 결과에 따라 계조 영상에 대한 이진화 처리를 수행하여 이진 영상을 획득한다.
구체적으로, 퍼지 C-평균값 클러스터링(fuzzy C-평균값, 이하 FCM) 알고리즘은 일종의 비지도 퍼지 클러스터링(unsupervised fuzzy clustering) 방법이며, 이는 동일한 클러스터로 분할된 대상 사이의 유사성을 최대화하는 반면, 서로 다른 클러스터 간의 사도를 최소화하는 구상에 의한 것이다. 본 실시예에서는 퍼지 집합의 개념을 통해, 클러스터링에 의해 생성된 클러스터를 퍼지 집합으로 간주하여, 계조 화상에 있어서의 각 화소점의 각 클래스에 속하는 멤버십을 획득하고, 각 화소점의 클러스터에 속하는 멤버십이 [0,1] 구간내의 값이며, 또한 각 화소점의 복수의 클러스터에 속하는 멤버십의 총합은 1과 같다. FCM 알고리즘은 일반 C-평균값 알고리즘을 개선한 것임을 이해해야 하고, 일반 C-평균값 알고리즘은 데이터 분할에 대해 엄격하며, 하드 클러스터링은 식별할 각 대상을 특정 클래스에 해당하도록 엄격하게 분할하므로, "둘 중 하나"의 특성을 갖는 반면, FCM은 유연한 퍼지 클러스터링이며, 이러한 종류의 퍼지 클러스터링은 클래스에 대한 샘플의 불확실한 설명을 구성하여, 객관적인 세계를 보다 객관적으로 반영할 수 있다.
예를 들어, 도 9는 상기 방안에 기초하여 도 8의 계조 영상에 대해 클러스터 분석 및 이진 처리를 수행하여 획득한 이진 영상을 도시한다. 여기서, 상기 클러스터링 후, 각 클러스터는 각 클러스터의 클러스터 중심을 사용하여 2개의 미리 설정된 클래스 중 하나와 연관될 수 있고, 상기 2개의 미리 설정된 클래스는 전경 및 배경일 수 있다. 다음, 각 화소점에 대해 가장 높은 멤버십을 가진 N개의 클러스터를 선택하고, N개의 클러스터와 연관된 미리 설정된 클래스에 따라 화소점이 전경 화소점인지 배경 화소점인지 결정한다. 또한, 전술한 클러스터 분석에서 각 화소점이 전경 화소 또는 배경 화소임을 획득한 후, 그에 따라 계조 영상에 대해 이진화 처리를 수행하여 타겟의 윤곽이 현저한 이진 영상을 획득한다.
단계 703: 투영 방법을 사용하여 이진 영상으로부터 하나 이상의 문자 위치 지정 블록을 획득한다.
구체적으로, 상술한 투영 방법은 이진 영상의 화소점의 분포 히스토그램을 분석하여, 인접 문자의 경계점을 찾고 그에 따라 분할합을 수행하고, 상기 이진 영상에서 서로 다른 문자에 해당하는 영상 영역을 서로 분리하여 각 영상 영역의 배경 영역을 최대한 제거한다. 전술한 투영 방법은 구체적으로 수직 투영 및 수평 투영을 포함하고, 본 실시예에서는 수직 투영이 바람직하게 사용되며, 수직 투영도에서 투영 값이 0인 투영 위치를 기반으로 상기 적어도 하나의 문자 위치 지정 블록이 결정된다.
예를 들어, 도 10을 참조하면, 도 9의 이진 영상을 수직 투영한 후 분할에 의해 획득된 복수의 문자 위치 지정 블록이 도시된다. 상기 복수의 문자 위치 지정 블록 중 노이즈에 의한 간섭 블록이 존재할 수 있으므로, 본 실시예에서는 문자 폭 임계값을 설정하고, 문자 폭 임계값보다 폭이 작은 문자 위치 지정 블록을 간섭 블록으로 제거할 수 있으며, 본 출원에서 특별히 제한되지 않는 다른 기술 방안을 사용하여 간섭 블록을 제거할 수도 있다.
단계 704: 적어도 하나의 문자 위치 지정 블록의 위치 정보에 따라 문자 영역 영상에 대한 문자 분할을 수행한다.
도 11을 참조하면, 도 10에서 획득한 복수의 문자 위치 지정 블록의 위치 정보에 따라 도 8에 도시된 문자 영역 영상으로부터 문자 분할을 수행한 후 획득된 복수의 문자 영상을 도시한다.
본 발명에서는, 퍼지 C-평균값 클러스터링 알고리즘을 사용하여 원본 문자 영역 영상에 이진화 처리를 수행하여, 얼룩 및 반사 등과 같은 간섭을 대부분 제거한 이진 영상를 획득함으로써, 투영 방법을 사용하여 이진 영상에서 보다 정확한 문자 분할 위치를 획득할 수 있다. 따라서, 영상 품질이 좋지 않은 문자 영역 영상의 경우에도, 보다 정확한 문자 분할 효과를 획득할 수 있다.
도 7의 문자 분할 방법에 기초하여, 본 출원의 일부 실시예는 또한 아래에 설명될 문자 분할 방법의 일부 특정 구현 방안 및 확장된 방안을 제공한다.
일 실시예에서, 단계(702)전에, 방법(700)은 canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하여, 에지 영상을 획득하는 단계; 허프 변환 방정식를 사용하여 가장자리 영상에 대한 직선 검출을 수행하여, 상기 에지 영상의 경계선을 획득하는 단계; 및 상기 경계선에 따라 상기 계조 영상의 경계 부분을 제거하는 단계;를 더 포함한다.
구체적으로, 도 12를 참조하면, 긴 직사각형 문자 프레임을 포함하는 계조 영상이 도시되며, 상기 계조 영상에서는, 왼쪽에서 오른쪽으로, 7개의 문자 "0", "0", "0", "0", "1", "1", "1"이 순차적으로 표시되며, 문자의 위쪽과 아래쪽에 미터의 긴 직사각형 문자 프레임이 표시된다. 따라서, 이 실시예에서, 에지 영상을 획득하기 위해 canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행할 수 있고, 그 목적은 계조 영상에서 문자를 표시하는 데 사용되는 문자 프레임의 경계의 위치를 정하는 것이다. 선택적으로, 상기 canny 연산자는 Roberts 연산자, Laplace 연산자, Prewitt 연산자, Sobel 연산자, Rosonfeld 연산자 및 Kirsch 연산자 중 하나 이상으로 대체될 수도 있다. 선택적으로, 본 실시예에서, 에지 검출의 목적은 계조 영상에서 문자를 표시하는 데 사용되는 문자 프레임의 위치를 정하는 것이기 때문에, 본 실시예에서 노이즈 내성이 높은 에지 검출 파라미터를 사용함으로써 너무 많은 가짜 에지가 검출되는 것을 방지한다. 또한, 문자 프레임은 명확한 경계를 갖는 긴 직선을 형성하기 때문에, 본 실시예에서는 허프 변환 방정식을 사용하여 에지 영상에 대한 직선 검출을 수행하여, 해당 문자 프레임의 경계선을 획득할 수 있다. 또한, 문자 프레임은 후속 문자 분할 단계에 부정적인 영향을 미치기 때문에, 본 실시예는 계조 영상중의 분할선에 대응하는 위치 이외의 부분을 제거할수 있어, 후속 문자 분할 과정에서 분할 효과에 영향을 미치는 것을 방지할 수 있다.
예를 들어, 도 13을 참조하면, 도 12의 긴 직사각형 문자 프레임을 포함하는 계조 영상에 대해 에지 검출을 수행한 에지 영상이 도시되어 있다. 도 7에 도시된 에지 영상의 위쪽 및 아래쪽에 비교적 뚜렷한 직선이 존재함을 알 수 있어, 경계선은 허프 변환식에 의해 쉽게 검출될 수 있다. 또한, 도 12에서는 검출된 경계선의 위치에 따라 해당 경계부분을 제거함으로써, 도 8과 같은 계조 영상을 획득할 수 있다. 선택적으로, 단계(703) 이전에 에지 이진 영상은 수평 투영되어, 수직 투영도의 투영 값이 0인 투영 위치에 따라 문자 프레임에 해당하는 위쪽 및 아래쪽 에지를 잘라내어 제거한다.
전술한 실시예와 비교하여, 본 실시예는 에지 검출 및 직선 검출을 통해, 문자 영역 영상에 포함된 문자 프레임으로 인한 문자 분할 오류를 방지할 수 있어, 문자 분할의 정확도를 향상시킬 수 있다.
일 실시예에서, canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하는 과정에서, 해당 과정은, 상기 계조 영상의 영상 품질 특징을 검출하는 단계; 상기 계조 영상의 영상 품질 특징에 의해 canny 연산자의 파라미터를 적응적으로 조정하는 단계;를 더 포함할 수 있다.
구체적으로, 상기 영상 품질 특성은 글로벌 콘트라스트, 글로벌 계조 평균값 과 같은 영상 품질을 나타내는 데 사용되는 특성 값을 포함할 수 있다. 구체적으로, 에지 검출 과정에서 노이즈 내성 및 검출 정확도를 동시에 고려하기 어려운 문제를 해결하기 위해, 본 실시예에서는 canny 연산자의 파라미터를 계조 영상의 영상 품질 특성에 따라 적응적으로 결정한다. 상기 영상 품질 특징은 예를 들어 글로벌 콘트라스트이고, 상기 canny 연산자의 파라미터는 예를 들어 높은 임계값 및/또는 낮은 임계값이다. 예를 들어, 계조 영상의 글로벌 콘트라스트가 낮은 것으로 검출되면, 계조 영상의 선명도가 더 낮은 것으로 추측하고, 높은 임계값 및/또는 낮은 임계값을 사용하며, 계조 영상의 글로벌 콘트라스트가 높으면, 계조 영상의 선명도가 더 높은 것으로 추측되여, 보다 낮은, 높은 임계값 및/또는 낮은 임계값이 사용된다.
canny 연산자는 이중 임계값(Double-Threshold)검출을 적용하여 실제 및 잠재적 에지를 결정함을 이해할 수 있다. 예를 들어, 한개 화소의 그래디언트가 높은 임계값보다 크면, 에지 화소점으로 간주되고; 낮은 임계값보다 작으면 비 에지 화소점으로 간주되며, 상기 화소점의 그라디언트가 둘 사이에 있으면 에지 화소에 연결된 경우에만 에지 화소점으로 간주된다. 그러나, 기존의 canny 연산자에서는 높은 임계값과 낮은 임계값을 인위적으로 결정하고, 높은 임계값/낮은 임계값의 비율이 고정되어 있어, canny 연산자 적용에 한계가 있다. 이에 따라, 본 실시예에서는, 계조 영상의 영상 품질 특성에 따라 높은 임계값과 낮은 임계값를 적응적으로 조정하는 방법이 사용됨으로써, 상기 실시예와 비교하여 볼때, 주변의 대량이고 무용한 가짜 경계 정보가 감소되어, 결함 에지에 대한 식별에 대한 노이즈로부터의 영향을 억제하고, 후속 윤곽 추출에 대해서도 매우 중요한 작용을 한다. 선택적으로, 파라미터 모델도 사전 훈련되어 현재 문자 분할이 진행 중인 문자 영역 영상의 품질에 따라 적응적으로 조정할 수 있다.
일 실시예에서, 에지 검출에 대한 노이즈의 영향을 줄이기 위해, canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하기 전에, 방법(700)은 영상에 대한 필터링 처리를 수행하는 단계를 더 포함하며, 상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링이다.
구체적으로, 노이즈가 에지 검출 결과에 미치는 영향을 최대한 줄이기 위해서는, 노이즈로 인한 오검출를 방지하려면 노이즈를 필터링해야 한다. 따라서, 본 실시예는 가우시안 필터링 및/또는 메디안 필터링을 사용하여 계조 영상을 컨볼루션하여, 명백한 노이즈 효과를 줄이고 영상을 평활화한다. 가우스 필터링은 선형 평활화 필터링으로 가우시안 노이즈를 제거하는 데 적용된다. 메디안 필터링은 비선형 평활화 필터링으로, 처리된 영상의 각 화소점의 계조 값을 특정 이웃 창에 있는 모든 화소접 계조값의 메디안으로 설정하는 것으로, 메디안 필터링 필터링은 임펄스 노이즈에 대한 우수한 필터링 효과를 가지며, 노이즈를 필터링하는 동시에 신호의 에지가 흐려지는 것을 방지할 수 있다.
전술한 실시예와 비교하여, 본 실시예는 계조 영상에 대해 가우시안 필터링 및/또는 메디안 필터링을 수행함으로써, 미터의 얼룩이나 반사로 인한 노이즈의 영향을 줄여 후속 에지 검출의 정확도를 향상시킬 수 있다.
일 실시예에서, 클러스터링에 대한 노이즈의 역효과를 더 제거하기 위해, 단계(702)가 수행되기 전에, 방법(700)은 계조 영상에 대해 대수 변환을 수행하는 단계를 더 포함할 수 있다. 상기 계조 영상에 대수 변환을 수행하는 목적은 계조 영상의 콘트라스트를 높이는 것이다. 구체적으로, 대수 변환은 계조 영상의 낮은 계조 값 부분을 확장하고 높은 계조 값 부분을 압축하여 영상의 낮은 계조 값 부분을 강조하는 목적을 달성할 수 있으므로, 글로벌 콘트라스트가 낮고 계조 값이 낮은 영상에 대해 양호한 강조 효과가 있다.
일 실시예에서, 대부분의 얼룩, 반사 등의 간섭을 추가로 제거하는 이진 영상을 획득하기 위해, 단계(702)는: C개의 클러스터의 클러스터 중심에 따라 C개의 클러스터의 속성을 각각 결정하는 단계; 상기 계조 영상의 임의의 하나의 화소점이 상기 C개의 클러스터 각각에 대응하는 C개의 멤버십을 결정하는 단계; 및 상기 C개의 클러스터를 상기 멤버십에 따라 정렬하여 그중의 N개의 클러스터를 결정하고, 상기 N 개의 클러스터의 속성에 따라 상기 계조 영상의 임의의 하나의 화소점의 속성을 결정하는 단계; 및 상기 계조 영상의 임의의 하나의 화소점의 속성에 따라, 상기 계조 화상에 대하여 이진화 처리를 수행하는 단계;를 포함하고, C 및 N은 양의 정수이고 C는 상기 N보다 크다.
구체적으로, 위의 C 및 N은 조정 가능한 동적 파라미터이며, 다양한 임계값을 결합할 수 있다. 또한, C개의 클러스터의 속성은 C개의 클러스터의 클러스터 중심에 따라 결정되며, 구체적으로, 각 클러스터의 클러스터 중심의 계조 값이 미리 설정된 임계값을 초과하는지 여부를 판단하여 각 클러스터의 속성을 전경 또는 배경으로 결정할 수 있다. 또한, 멤버십에 따라 C개의 클러스터를 정렬하여 그 중 N개의 클러스터를 결정하는 것은 멤버십이 가장 높은 N개의 클러스터를 선택하는 것일 수 있고; 또한, N개의 클러스터의 속성에 따라 계조 영상의 임의의 화소점의 속성을 결정하는 것은 N개의 클러스터의 속성을 종합적으로 고려하여 계조 영상의 임의의 화소점의 속성을 결정하는 것을 의미한다. 예를 들어, 어느 한 화소에 대해, 이와 대응하는 N개의 클러스터의 속성이 모두 전경인 경우에만 해당 화소점을 전경 화소점으로 판단하고, 그렇지 않은 경우 해당 화소점을 배경 화소점으로 판단한다. 다른 예를 들어, 어느 한 화소에 대해, 이와 대응하는 N개의 클러스터 중, 클러스터의 속성이 전경인 것이 소정의 비율을 초과한 경우, 해당 화소점을 전경 화소점으로 판단하고, 그렇지 않은 경우 해당 화소점을 배경 화소점으로 판단한다.
예를 들어, C=5, N=2으로 미리 설정하고, 또한, 미리 설정한 규칙은 다음과 같다. 즉, 어느 한 화소점에 대응하는 N개의 클러스터의 속성이 전경인 경우에만 해당 화소점을 전경 화소점으로 판단하고, 그렇지 않은 경우 해당 화소점을 배경 화소점으로 판단한다. 이를 기반으로, FCM을 이용하여 계조 영상의 각 화소의 5개의 클러스터(C1, C2, C3, C4, C5) 에 대한 멤버십 및 각 클러스터의 클러스터 중심을 출력할 수 있다. 또한, 상기 클러스터 중심은 각 클래스의 평균 특징을 나타내며, 상기 클러스터 중심을 통해 각 클러스터가 배경 클래스에 해당하는지 아니면 전경 클래스에 해당하지를 결정할 수 있다. 예를 들어 C1은 전경에 속하고, C2는 전경에 속하고, C3은 배경에 속하고, C4는 배경에 속하며, C5는 배경에 속한다. 또한, 계조 영상의 화소점 A에 대해, 5개의 클러스터(C1, C2, C3, C4, C5) 에 대한 멤버십이 각각 (b1, b2, b3, b4, b5)인 것을 얻을 수 있고, 여기서 b2>b3>b1>b4>b5의 경우, 그 중에서, 상위 2위로 정렬된 멤버십 b2 및 b3을 선택하고, 선택된 멤버십에 대응하는 2개의 클러스터 C2 및 C3에 따라, 해당 화소점 A가 전경 화소점인지 배경 화소점인지를 종합적으로 판단하여, 상술한 미리 설정된 규칙에 기반하여 화소점 A를 배경 화소점으로 판단한다.
전술한 실시예와 비교하여, 본 실시예는 문자의 기본 윤곽을 유지하면서 이진 영상에서 노이즈를 진일보 감소시킬 수 있고, 문자 분할 효과를 진일보 최적화할 수 있다.
일 실시예에서, 도 10을 참조하면, 획득된 적어도 하나의 문자 위치 지정 블록에는 노이즈로 인한 여러 간섭 블록이 존재한다. 상술한 간섭 블록을 보다 정확하게 제거하기 위해, 단계(703)이후에, 방법(700)은 적어도 하나의 문자 위치 지정 블록에서 각 문자 위치 지정 블록의 전경 화소 면적을 검출하는 단계; 및 전경 화소 면적에 따라, 적어도 하나의 문자 위치 지정 블록 중에서 간섭 블록을 검출하고, 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하는 단계; 를 더 포함하고, 상기 간섭 블록의 상기 전경 화소 면적은 상기 적어도 하나의 문자 위치 지정 블록 중의 M개의 문자 위치 지정 블록의 상기 전경 화소 면적보다 작고, 상기 M는 미리 설정된 문자 수이다.
구체적으로, 전경 화소 면적은 문자 위치 지정 블록에서 전경 화소점이 차지하는 영역을 의미한다. 선택적으로, 계산량을 더 줄이기 위해, 각 문자 위치 지정 블록에 수평 투영을 수행하여 문자 높이를 획득할 수 있으며, 문자 위치 지정 블록의 폭과 문자 높이에 따라 상기 전경 화소 면적을 계산할 수 있다. 또한, 미리 설정된 문자수 M은 미터의 다이얼에 따라 미리 확정된다. 또한, 도 10에 도시된 바와 같이, 노이즈로 인한 간섭 블록은 일반적으로 전경 화소점이 적기 때문에, 전경 화소 면적에 기반하여 적어도 하나의 문자 위치 지정 블록을 큰 것에서 작은 것으로 정렬할 수 있으며, 상위 M개의 문자 위치 지정 블록을 선택하여 후속 단계 704에서 사용하며, 나머지 문자 위치 지정 블록은 간섭 블록으로 제거한다.
이전 실시예와 비교하여 보면, 본 실시예는 각 문자 위치 지정 블록의 전경 화소 면적에 따라 노이즈로 인한 간섭 블록을 확인함으로써, 실제 문자에 대응하고 문자 폭이 작은 문자 위치 지정 블록을 간섭 블록으로서 오검출하는 것을 방지하여, 보다 정확한 제거 효과를 달성하고 문자 분할 효과를 더욱 최적화할 수 있다.
일 실시예에서, 도 10을 참조하면, 획득된 적어도 하나의 문자 위치 지정 블록에는 노이즈로 인한 여러 간섭 블록이 존재한다. 상술한 간섭 블록을 보다 정확하게 제거하기 위해, 단계(703)이후에, 방법(700)은, 비최근접 억제 알고리즘(Non Nearest Suppression, 이하 NNS라고 함)을 사용하여 상기 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하는 단계를 포함한다.
구체적으로, NMS 알고리즘을 사용하여 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하는 단계는, 구체적으로, 상기 이진 영상에서 가장 왼쪽 전경 화소점 및 가장 오른쪽 전경 화소점를 찾고, 둘의 위치 정보와 둘 사이의 폭에 따라 각 문자에 해당하는 문자 황금 중심을 결정되는 것을 포함할 수 있다.또한, 각 문자의 문자 황금 중심에 가장 가까운 문자 위치 지정 블록을 선택하여 후속 단계 704에 사용하고, 나머지 문자 위치 지정 블록은 간섭 블록으로서 제거된다.
전술한 실시예와 비교하여, 본 실시예는 노이즈로 인한 간섭 블록을 정확하고 간단하게 제거할 수 있으며, 문자 분할 효과를 더욱 최적화할 수 있다.
일 실시예에서, 일부 문자 (예: 숫자 "1" 또는 "7")의 폭이 작기 때문에, 불완전한 문자 분할이 발생하기 쉽다. 이에 기초하여, 단계(704)는, 구체적으로, 적어도 하나의 문자 위치 지정 블록의 평균 폭을 결정하는 단계;를 더 포함한다. 여기서, 상기 적어도 하나의 문자 위치 지정 블록에 평균 폭보다 폭이 작은 타겟 문자 위치 지정 블록이 존재하는 경우, 타겟 문자 위치 지정 블록의 위치 정보 및 평균 폭에 따라, 문자 영역 영상에 대한 문자 분할을 수행한다. 따라서, 불완전한 문자 분할의 발생을 방지한다.
도 14는 도 7에 도시된 문자 분할 방법을 실행하는데 사용되는, 본 출원의 실시예에 따른 문자 분할 장치(140)의 개략적인 구조도이다.
도 14에 도시된 바와 같이, 문자 분할 장치(140)는,
문자 영역 영상을 획득하고, 문자 영역 영상을 계조 영상으로 변환하기 위한 획득 모듈(141)을 포함한다. 구체적으로, 상기 미터는 일상 생활에서 흔히 볼 수 있는 수도 미터, 전기 미터, 가스 미터를 포함하나 이에 제한되지는 않고, 예를 들면, 캐릭터 휠형 수도 미터일 수도 있다. 또한, 상기 미터의 문자 영역 영상은 단일 문자 영상 또는 복수의 문자 영상일 수 있고, 미터의 다이얼을 향해 설치된 카메라 장치로 획득할 수 있으며, 물론 문자 영역 영상은 다른 장비와 같은 다른 소스에서 올 수도 있고, 또는 기존 영상일 수도 있으며, 본 실시예는 이를 제한하지 않는다. 또한, 획득된 문자 영역 영상은 RGB 형식일 수 있으며, 문자 영역 영상을 획득한 후, 문자 영역 영상에서 각 화소의 계조 값은 부동소수점 알고리즘, 정수화 방법, 쉬프트 방법, 평균화 방법 등과 같은 다양한 방법에 의해 결정될 수 있고, 화소점에서의 적색, 녹색, 청색의 3채널의 화소값 대신에 해당 계조 값을 사용하여. 계조 영상을 획득한다.
예를 들어, 도 8을 참조하면, 문자 영역 영상의 계조 영상이 도시되어 있으며, 상기 문자 영역 영상에서는, 왼쪽에서 오른쪽으로, 7개의 문자 "0", "0", "0", "0", "1", "1", "1"이 순차적으로 표시된다. 상기 복수의 문자들 사이의 경계가 충분히 명확하지 않고, 카메라의 감광 소자의 해상도가 부족하기 때문에 문자 영역 영상에 가로 줄무늬가 발생하고 또한 각 문자가 연결된 상태로 됨으로, 정확한 문자 분할을 수행하기 어려움을 알수 있다
도 8에 도시된 바와 같이, 문자 분할 장치(140)는,
퍼지 C-평균값을 사용하여 계조 영상에 대한 클러스터 분석을 수행하고 클러스터 분석 결과에 따라 계조 영상에 대한 이진화 처리를 수행하여 이진 영상을 획득하기 위한 클러스터링 모듈(142)을 포함한다. 구체적으로, 퍼지 C-평균값 클러스터링(fuzzy C-평균값, 이하 FCM) 알고리즘은 일종의 비지도 퍼지 클러스터링방법이며, 이는 동일한 클러스터로 분할된 대상 사이의 유사성을 최대화하는 반면, 서로 다른 클러스터 간의 사도를 최소화하는 구상에 의한 것이다. 본 실시예에서는 퍼지 집합의 개념을 통해, 클러스터링에 의해 생성된 클러스터를 퍼지 집합으로 간주하여, 계조 화상에 있어서의 각 화소점의 각 클래스에 속하는 멤버십을 획득하고, 각 화소점의 클러스터에 속하는 멤버십이 [0,1] 구간내의 값이며, 또한 각 화소점의 복수의 클러스터에 속하는 멤버십의 총합은 1과 같다. FCM 알고리즘은 일반 C-평균값 알고리즘을 개선한 것임을 이해해야 하고, 일반 C-평균값 알고리즘은 데이터 분할에 대해 엄격하며, 하드 클러스터링은 식별할 각 대상을 특정 클래스에 해당하도록 엄격하게 분할하므로, "둘 중 하나"의 특성을 갖는 반면, FCM은 유연한 퍼지 클러스터링이며, 이러한 종류의 퍼지 클러스터링은 클래스에 대한 샘플의 불확실한 설명을 구성하여, 객관적인 세계를 보다 객관적으로 반영할 수 있다.
예를 들어, 도 9는 상기 방안에 기초하여 도 8의 계조 영상에 대해 클러스터 분석 및 이진 처리를 수행하여 획득한 이진 영상을 도시한다. 여기서, 상기 클러스터링 후, 각 클러스터는 각 클러스터의 클러스터 중심을 사용하여 2개의 미리 설정된 클래스 중 하나와 연관될 수 있고, 상기 2개의 미리 설정된 클래스는 전경 및 배경일 수 있다. 다음, 각 화소점에 대해 가장 높은 멤버십을 가진 N개의 클러스터를 선택하고, N개의 클러스터와 연관된 미리 설정된 클래스에 따라 화소점이 전경 화소점인지 배경 화소점인지 결정한다. 또한, 전술한 클러스터 분석에서 각 화소점이 전경 화소 또는 배경 화소임을 획득한 후, 그에 따라 계조 영상에 대해 이진화 처리를 수행하여 타겟의 윤곽이 현저한 이진 영상을 획득한다.
도 14에 도시된 바와 같이, 문자 분할 장치(140)는,
투영 방법을 사용하여 이진 영상으로부터 하나 이상의 문자 위치 지정 블록을 획득하기 위한 위치 지정 모듈(143)을 포함한다. 구체적으로, 상술한 투영 방법은 이진 영상의 화소점의 분포 히스토그램을 분석하여, 인접 문자의 경계점을 찾고 그에 따라 분할합을 수행하고, 상기 이진 영상에서 서로 다른 문자에 해당하는 영상 영역을 서로 분리하여 각 영상 영역의 배경 영역을 최대한 제거한다. 전술한 투영 방법은 구체적으로 수직 투영 및 수평 투영을 포함하고, 본 실시예에서는 수직 투영이 바람직하게 사용되며, 수직 투영도에서 투영 값이 0인 투영 위치를 기반으로 상기 적어도 하나의 문자 위치 지정 블록이 결정된다.
예를 들어, 도 10을 참조하면, 도 9의 이진 영상을 수직 투영한 후 분할에 의해 획득된 복수의 문자 위치 지정 블록이 도시된다. 상기 복수의 문자 위치 지정 블록 중 노이즈에 의한 간섭 블록이 존재할 수 있으므로, 본 실시예에서는 문자 폭 임계값을 설정하고, 문자 폭 임계값보다 폭이 작은 문자 위치 지정 블록을 간섭 블록으로 제거할 수 있으며, 본 출원에서 특별히 제한되지 않는 다른 기술 방안을 사용하여 간섭 블록을 제거할 수도 있다.
도 14에 도시된 바와 같이, 문자 분할 장치(140)는,
적어도 하나의 문자 위치 지정 블록의 위치 정보에 따라 문자 영역 영상에 대한 문자 분할을 수행하기 위한 분할 모듈(144)을 포함한다. 도 11을 참조하면, 도 10에서 획득한 복수의 문자 위치 지정 블록의 위치 정보에 따라 도 8에 도시된 문자 영역 영상으로부터 문자 분할을 수행한 후 획득된 복수의 문자 영상을 도시한다.
본 발명에서는, 퍼지 C-평균값 클러스터링 알고리즘을 사용하여 원본 문자 영역 영상에 이진화 처리를 수행하여, 얼룩 및 반사 등과 같은 간섭을 대부분 제거한 이진 영상를 획득함으로써, 투영 방법을 사용하여 이진 영상에서 보다 정확한 문자 분할 위치를 획득할 수 있다. 따라서, 영상 품질이 좋지 않은 문자 영역 영상의 경우에도, 보다 정확한 문자 분할 효과를 획득할 수 있다.
도 14의 문자 분할 장치에 기초하여, 본 출원의 일부 실시예는 또한 아래에 설명될 문자 분할 방법의 일부 특정 구현 방안 및 확장된 방안을 제공한다.
일 실시예에서, 문자 분할 장치(140)는,
canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하여, 에지 영상을 획득하기 위한 에지 검출 모듈; 허프 변환 방정식를 사용하여 에지 영상에 대한 직선 검출을 수행하여, 에지 영상의 경계선을 획득하기 위한 직선 검출 모듈; 경계선에 따라 계조 영상의 경계 부분을 제거하기 위한 경계 제거 모듈;을 더 포함할 수 있다.
구체적으로, 도 12를 참조하면, 긴 직사각형 문자 프레임을 포함하는 계조 영상이 도시되며, 상기 계조 영상에서는, 왼쪽에서 오른쪽으로, 7개의 문자 "0", "0", "0", "0", "1", "1", "1"이 순차적으로 표시되며, 문자의 위쪽과 아래쪽에 미터의 긴 직사각형 문자 프레임이 표시된다. 따라서, 이 실시예에서, 에지 영상을 획득하기 위해 canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행할 수 있고, 그 목적은 계조 영상에서 문자를 표시하는 데 사용되는 문자 프레임의 경계의 위치를 정하는 것이다. 선택적으로, 상기 canny 연산자는 Roberts 연산자, Laplace 연산자, Prewitt 연산자, Sobel 연산자, Rosonfeld 연산자 및 Kirsch 연산자 중 하나 이상으로 대체될 수도 있다. 선택적으로, 본 실시예에서, 에지 검출의 목적은 계조 영상에서 문자를 표시하는 데 사용되는 문자 프레임의 위치를 정하는 것이기 때문에, 본 실시예에서 노이즈 내성이 높은 에지 검출 파라미터를 사용함으로써 너무 많은 가짜 에지가 검출되는 것을 방지한다. 또한, 문자 프레임은 명확한 경계를 갖는 긴 직선을 형성하기 때문에, 본 실시예에서는 허프 변환 방정식을 사용하여 에지 영상에 대한 직선 검출을 수행하여, 해당 문자 프레임의 경계선을 획득할 수 있다. 또한, 문자 프레임은 후속 문자 분할 단계에 부정적인 영향을 미치기 때문에, 본 실시예는 계조 영상중의 분할선에 대응하는 위치 이외의 부분을 제거할수 있어, 후속 문자 분할 과정에서 분할 효과에 영향을 미치는 것을 방지할 수 있다.
예를 들어, 도 13을 참조하면, 도 12의 긴 직사각형 문자 프레임을 포함하는 계조 영상에 대해 에지 검출을 수행한 에지 영상이 도시되어 있다. 도 13에 도시된 에지 영상의 위쪽 및 아래쪽에 비교적 뚜렷한 직선이 존재함을 알 수 있어, 경계선은 허프 변환식에 의해 쉽게 검출될 수 있다. 또한, 도 12에서는 검출된 경계선의 위치에 따라 해당 경계부분을 제거함으로써, 도 8과 같은 계조 영상을 획득할 수 있다. 선택적으로, 에지 이진 영상은 수평 투영되어, 수직 투영도의 투영 값이 0인 투영 위치에 따라 문자 프레임에 해당하는 위쪽 및 아래쪽 에지를 잘라내어 제거한다.
전술한 실시예와 비교하여, 본 실시예는 에지 검출 모듈, 직선 검출 모듈 및 경계 제거 모듈을 사용함으로써 문자 영역 영상에 포함된 문자 프레임으로 인한 문자 분할 오류를 방지할 수 있으므로, 문자 분할의 정확도를 향상시킬 수 있다.
일 실시예에서, 상술한 에지 검출 모듈은 품질 검출 모듈 및 파라미터 조정 모듈을 더 포함할 수 있다. 품질 검출 모듈은 계조 영상의 영상 품질 특징을 검출하는 데 사용될 수 있고, 파라미터 조정 모듈은 계조 영상의 영상 품질 특징을 기반으로 canny 연산자의 파라미터를 적응적으로 조정하는 데 사용할 수 있다. 구체적으로, 상기 영상 품질 특성은 글로벌 콘트라스트, 글로벌 계조 평균값 과 같은 영상 품질을 나타내는 데 사용되는 특성 값을 포함할 수 있다. 구체적으로, 에지 검출 과정에서 노이즈 내성 및 검출 정확도를 동시에 고려하기 어려운 문제를 해결하기 위해, 본 실시예에서는 canny 연산자의 파라미터를 계조 영상의 영상 품질 특성에 따라 적응적으로 결정한다. 상기 영상 품질 특징은 예를 들어 글로벌 콘트라스트이고, 상기 canny 연산자의 파라미터는 예를 들어 높은 임계값 및/또는 낮은 임계값이다. 예를 들어, 계조 영상의 글로벌 콘트라스트가 낮은 것으로 검출되면, 계조 영상의 선명도가 더 낮은 것으로 추측하고, 높은 임계값 및/또는 낮은 임계값을 사용하며, 계조 영상의 글로벌 콘트라스트가 높으면, 계조 영상의 선명도가 더 높은 것으로 추측되여, 보다 낮은, 높은 임계값 및/또는 낮은 임계값이 사용된다.
canny 연산자는 이중 임계값(Double-Threshold)검출을 적용하여 실제 및 잠재적 에지를 결정함을 이해할 수 있다. 예를 들어, 한개 화소의 그래디언트가 높은 임계값보다 크면, 에지 화소점으로 간주되고; 낮은 임계값보다 작으면 비 에지 화소점으로 간주되며, 상기 화소점의 그라디언트가 둘 사이에 있으면 에지 화소에 연결된 경우에만 에지 화소점으로 간주된다. 그러나, 기존의 canny 연산자에서는 높은 임계값과 낮은 임계값을 인위적으로 결정하고, 높은 임계값/낮은 임계값의 비율이 고정되어 있어, canny 연산자 적용에 한계가 있다. 이에 따라, 본 실시예에서는, 계조 영상의 영상 품질 특성에 따라 높은 임계값과 낮은 임계값를 적응적으로 조정하는 방법이 사용됨으로써, 상기 실시예와 비교하여 볼때, 주변의 대량이고 무용한 가짜 경계 정보가 감소되어, 결함 에지에 대한 식별에 대한 노이즈로부터의 영향을 억제하고, 후속 윤곽 추출에 대해서도 매우 중요한 작용을 한다. 선택적으로, 파라미터 모델도 사전 훈련되어 현재 문자 분할이 진행 중인 문자 영역 영상의 품질에 따라 적응적으로 조정할 수 있다.
일 실시예에서, 에지 검출에 대한 노이즈의 영향을 줄이기 위해, 문자 분할 장치(140)는,
Canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하기 전에, 계조 영상에 대한 필터링 처리를 수행하기 위한 필터링 모듈을 더 포함할 수 있으며, 상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링이다. 구체적으로, 노이즈가 에지 검출 결과에 미치는 영향을 최대한 줄이기 위해서는, 노이즈로 인한 오검출를 방지하려면 노이즈를 필터링해야 한다. 따라서, 본 실시예는 가우시안 필터링 및/또는 메디안 필터링을 사용하여 계조 영상을 컨볼루션하여, 명백한 노이즈 효과를 줄이고 영상을 평활화한다. 가우스 필터링은 선형 평활화 필터링으로 가우시안 노이즈를 제거하는 데 적용된다. 메디안 필터링은 비선형 평활화 필터링으로, 처리된 영상의 각 화소점의 계조 값을 특정 이웃 창에 있는 모든 화소접 계조값의 메디안으로 설정하는 것으로, 메디안 필터링 필터링은 임펄스 노이즈에 대한 우수한 필터링 효과를 가지며, 노이즈를 필터링하는 동시에 신호의 에지가 흐려지는 것을 방지할 수 있다.
전술한 실시예와 비교하여, 본 실시예는 계조 영상에 대해 가우시안 필터링 및/또는 메디안 필터링을 수행함으로써, 미터의 얼룩이나 반사로 인한 노이즈의 영향을 줄여 후속 에지 검출의 정확도를 향상시킬 수 있다.
일 실시예에서, 클러스터링에 대한 노이즈의 역효과를 더 제거하기 위해, 문자 분할 장치(140)는,
계조 영상에 대해 대수 변환을 수행하기 위한 대수 변환 모듈을 더 포함할 수 있다. 상기 계조 영상에 대수 변환을 수행하는 목적은 계조 영상의 콘트라스트를 높이는 것이다. 구체적으로, 대수 변환은 계조 영상의 낮은 계조 값 부분을 확장하고 높은 계조 값 부분을 압축하여 영상의 낮은 계조 값 부분을 강조하는 목적을 달성할 수 있으므로, 글로벌 콘트라스트가 낮고 계조 값이 낮은 영상에 대해 양호한 강조 효과가 있다.
일 실시예에서, 대부분의 얼룩, 반사 등의 간섭을 추가로 제거하는 이진 영상을 획득하기 위해, 클러스터링 모듈(142)은,
C개의 클러스터의 클러스터 중심에 따라 C개의 클러스터의 속성을 각각 결정하고, 상기 계조 영상의 임의의 하나의 화소점이 상기 C개의 클러스터 각각에 대응하는 C개의 멤버십을 결정하고, 상기 C개의 클러스터를 상기 멤버십에 따라 정렬하여 그중의 N개의 클러스터를 결정하고, 상기 N 개의 클러스터의 속성에 따라 상기 계조 영상의 임의의 하나의 화소점의 속성을 결정하며, 상기 계조 영상의 임의의 하나의 화소점의 속성에 따라, 상기 계조 화상에 대하여 이진화 처리를 수행하는데 사용할수 있다. 여기서 C 및 N은 양의 정수이고 C는 상기 N보다 크다. 구체적으로, 위의 C 및 N은 조정 가능한 동적 파라미터이며, 다양한 임계값을 결합할 수 있다. 또한, C개의 클러스터의 속성은 C개의 클러스터의 클러스터 중심에 따라 결정되며, 구체적으로, 각 클러스터의 클러스터 중심의 계조 값이 미리 설정된 임계값을 초과하는지 여부를 판단하여 각 클러스터의 속성을 전경 또는 배경으로 결정할 수 있다. 또한, 멤버십에 따라 C개의 클러스터를 정렬하여 그 중 N개의 클러스터를 결정하는 것은 멤버십이 가장 높은 N개의 클러스터를 선택하는 것일 수 있고; 또한, N개의 클러스터의 속성에 따라 계조 영상의 임의의 화소점의 속성을 결정하는 것은 N개의 클러스터의 속성을 종합적으로 고려하여 계조 영상의 임의의 화소점의 속성을 결정하는 것을 의미한다. 예를 들어, 어느 한 화소에 대해, 이와 대응하는 N개의 클러스터의 속성이 모두 전경인 경우에만 해당 화소점을 전경 화소점으로 판단하고, 그렇지 않은 경우 해당 화소점을 배경 화소점으로 판단한다. 다른 예를 들어, 어느 한 화소에 대해, 이와 대응하는 N개의 클러스터 중, 클러스터의 속성이 전경인 것이 소정의 비율을 초과한 경우, 해당 화소점을 전경 화소점으로 판단하고, 그렇지 않은 경우 해당 화소점을 배경 화소점으로 판단한다.
예를 들어, C=5, N=2으로 미리 설정하고, 또한, 미리 설정한 규칙은 다음과 같다. 즉, 어느 한 화소점에 대응하는 N개의 클러스터의 속성이 전경인 경우에만 해당 화소점을 전경 화소점으로 판단하고, 그렇지 않은 경우 해당 화소점을 배경 화소점으로 판단한다. 이를 기반으로, FCM을 이용하여 계조 영상의 각 화소의 5개의 클러스터(C1, C2, C3, C4, C5) 에 대한 멤버십 및 각 클러스터의 클러스터 중심을 출력할 수 있다. 또한, 상기 클러스터 중심은 각 클래스의 평균 특징을 나타내며, 상기 클러스터 중심을 통해 각 클러스터가 배경 클래스에 해당하는지 아니면 전경 클래스에 해당하지를 결정할 수 있다. 예를 들어 C1은 전경에 속하고, C2는 전경에 속하고, C3은 배경에 속하고, C4는 배경에 속하며, C5는 배경에 속한다. 또한, 계조 영상의 화소점 A에 대해, 5개의 클러스터(C1, C2, C3, C4, C5) 에 대한 멤버십이 각각 (b1, b2, b3, b4, b5)인 것을 얻을 수 있고, 여기서 b2>b3>b1>b4>b5의 경우, 그 중에서, 상위 2위로 정렬된 멤버십 b2 및 b3을 선택하고, 선택된 멤버십에 대응하는 2개의 클러스터 C2 및 C3에 따라, 해당 화소점 A가 전경 화소점인지 배경 화소점인지를 종합적으로 판단하여, 상술한 미리 설정된 규칙에 기반하여 화소점 A를 배경 화소점으로 판단한다.
전술한 실시예와 비교하여, 본 실시예는 문자의 기본 윤곽을 유지하면서 이진 영상에서 노이즈를 진일보 감소시킬 수 있고, 문자 분할 효과를 진일보 최적화할 수 있다.
일 실시예에서, 도 10을 참조하면, 획득된 적어도 하나의 문자 위치 지정 블록에는 노이즈로 인한 여러 간섭 블록이 존재한다. 상기 간섭 블록을 보다 정확하게 제거하기 위해, 문자 분할 장치(140)는,
적어도 하나의 문자 위치 지정 블록에서 각 문자 위치 지정 블록의 전경 화소 면적을 검출하고, 전경 화소 면적에 따라, 적어도 하나의 문자 위치 지정 블록 중에서 간섭 블록을 검출하고, 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하기 위한 제1 제거 모듈을 더 포함할 수 있다. 상기 간섭 블록의 상기 전경 화소 면적은 상기 적어도 하나의 문자 위치 지정 블록 중의 M개의 문자 위치 지정 블록의 상기 전경 화소 면적보다 작고, 상기 M는 미리 설정된 문자 수이다. 구체적으로, 전경 화소 면적은 문자 위치 지정 블록에서 전경 화소점이 차지하는 영역을 의미한다. 선택적으로, 계산량을 더 줄이기 위해, 각 문자 위치 지정 블록에 수평 투영을 수행하여 문자 높이를 획득할 수 있으며, 문자 위치 지정 블록의 폭과 문자 높이에 따라 상기 전경 화소 면적을 계산할 수 있다. 또한, 미리 설정된 문자수 M은 미터의 다이얼에 따라 미리 확정된다. 또한, 도 10에 도시된 바와 같이, 노이즈로 인한 간섭 블록은 일반적으로 전경 화소점이 적기 때문에, 전경 화소 면적에 기반하여 적어도 하나의 문자 위치 지정 블록을 큰 것에서 작은 것으로 정렬할 수 있으며, 상위 M개의 문자 위치 지정 블록을 선택하여 분할 모듈(144)에 입력되고, 나머지 문자 위치 지정 블록은 간섭 블록으로 제거한다.
이전 실시예와 비교하여 보면, 본 실시예는 각 문자 위치 지정 블록의 전경 화소 면적에 따라 노이즈로 인한 간섭 블록을 확인함으로써, 실제 문자에 대응하고 문자 폭이 작은 문자 위치 지정 블록을 간섭 블록으로서 오검출하는 것을 방지하여, 보다 정확한 제거 효과를 달성하고 문자 분할 효과를 더욱 최적화할 수 있다.
일 실시예에서, 도 10을 참조하면, 획득된 적어도 하나의 문자 위치 지정 블록에는 노이즈로 인한 여러 간섭 블록이 존재한다. 상술한 간섭 블록을 보다 정확하게 제거하기 위해, 문자 분할 장치(140)는,
비최근접 억제 알고리즘(Non Nearest Suppression, 이하 NNS라고 함)을 사용하여 상기 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하기 위한 제2 제거 모듈을 더 포함할 수 있다. 구체적으로, NMS 알고리즘을 사용하여 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하는 단계는, 구체적으로, 상기 이진 영상에서 가장 왼쪽 전경 화소점 및 가장 오른쪽 전경 화소점를 찾고, 둘의 위치 정보와 둘 사이의 폭에 따라 각 문자에 해당하는 문자 황금 중심을 결정되는 것을 포함할 수 있다. 또한, 각 문자의 문자 황금 중심에 가장 가까운 문자 위치 지정 블록을 선택하여 분할 모듈(144)에 입력하고, 머지 문자 위치 지정 블록은 간섭 블록으로서 제거된다.
전술한 실시예와 비교하여, 본 실시예는 노이즈로 인한 간섭 블록을 정확하고 간단하게 제거할 수 있으며, 문자 분할 효과를 더욱 최적화할 수 있다.
일 실시예에서, 일부 문자 (예: 숫자 "1" 또는 "7")의 폭이 작기 때문에, 불완전한 문자 분할이 발생하기 쉽다. 이에 기초하여, 상술한 분할 모듈(144)은,
적어도 하나의 문자 위치 지정 블록의 평균 폭을 결정한다. 여기서, 상기 적어도 하나의 문자 위치 지정 블록에 평균 폭보다 폭이 작은 타겟 문자 위치 지정 블록이 존재하는 경우, 타겟 문자 위치 지정 블록의 위치 정보 및 평균 폭에 따라, 문자 영역 영상에 대한 문자 분할을 수행한다. 따라서, 불완전한 문자 분할의 발생을 방지한다.
도 15는 본 출원의 일 실시예에 따른 문자 분할 장치로서, 적어도 하나의 프로세서, 및 상기 적어도 하나의 프로세서와 통신하도록 연결된 메모리를 포함하고, 상기 메모리는 적어도 하나의 프로세서에 의해 실행 가능한 명령어를 저장하고, 명령어는 적어도 하나의 프로세서에 의해 실행될때, 적어도 하나의 프로세서로 하여금 도 1에 도시된 문자 분할 방법 및/또는 도 7에 도시된 다른 문자 분할 방법을 수행할 수 있게 한다.
본 출원의 일부 실시예에 따르면, 컴퓨터 실행 가능 명령어가 저장된 문자 분할 방법을 제공하는 비휘발성 컴퓨터 저장 매체에 있어서, 컴퓨터 실행 가능 명령어는 프로세서에 의해 실행될 때, 도 1에 도시된 문자 분할 방법 및/또는 도 7에 도시된 문자 분할 방법을 실행되도록 구성된다.
본 출원의 일부 실시예에 따르면, 다이얼에 판독값을 표시하기 위한 적어도 하나의 문자 프레임이 포함된 미터; 미터의 다이얼을 촬영하여 문자 영역 영상을 획득하기 위한 카메라 장치; 및 카메라 장치에 전기적으로 연결되여, 도 1에 도시된 문자 분할 방법 및/또는 도 7에 도시된 문자 분할 방법을 수행하기 위한 문자 분할 장치;를 포함하는 스마트 미터 판독 시스템이 제공된다.
본 출원에서의 각 실시예는 점진적으로 설명되며, 각 실시예 사이의 동일하거나 유사한 부분은 서로 참조될 수 있으며, 각 실시예는 다른 실시예와의 차이점에 초점을 맞춘다. 구체적으로, 장치, 기기 및 컴퓨터 판독 가능 저장 매체 실시예의 경우, 기본적으로 방법 실시예와 유사하므로, 그 설명을 간략화하고, 관련된 부분은 방법 실시예의 일부 설명을 참조할 수 있다.
본 출원의 실시예에서 제공되는 장치, 기기 및 컴퓨터 판독 가능 저장 매체 및 방법은 일대일 대응하므로, 본 발명의 장치, 기기 및 컴퓨터 판독 가능 저장 매체는 또한 그와 해당 방법과 유사한 유익한 기술적 효과를 가지며, 방법의 유익한 기술적 효과는 위에서 상세히 설명되었으므로, 장치, 기기 및 컴퓨터 판독 가능 저장 매체의 유익한 기술적 효과는 여기에서 반복되지 않는다.
당업자에 의해 이해할수 있는 바와 같이, 본 발명의 실시예는 방법, 시스템 또는 컴퓨터 프로그램 제품을 제공할 수 있다. 따라서, 본 발명은 전체 하드웨어 실시예, 전체 소프트웨어 실시예, 또는 소프트웨어와 하드웨어 측면을 결합한 실시예의 형태를 사용할 수 있다. 또한, 본 발명은 컴퓨터에서 사용할 수 있는 프로그램이 포함되어 있는 하나 이상의 컴퓨터에서 사용할 수 있는 저장 매체(디스크 메모리, CD-ROM, 광학 메모리 등을 포함하지만 이에 국한되지 않음)에서 실행할 수 있는 컴퓨터 프로그램 제품의 형태를 사용할 수 있다.
본 발명은 본 발명의 실시예에 따른 방법, 장치(시스템), 및 컴퓨터 프로그램 제품의 흐름도 및/또는 블록도를 참조하여 설명된다. 흐름도 및/또는 블록도의 각 흐름 및/또는 블록, 및 흐름도 및/또는 블록도의 흐름 및/또는 블록의 조합은 컴퓨터 프로그램 명령에 의해 구현될 수 있음이 이해될 것이다. 이러한 컴퓨터 프로그램 명령어는 범용 컴퓨터, 특수 목적 컴퓨터, 임베디드 프로세서 또는 기타 프로그램 가능한 데이터 처리 장치의 프로세서에 제공되어, 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치의 프로세서에 의해 실행된 명령어가 흐름도의 흐름 및/또는 블록도의 하나 이상의 블록에 지정된 기능을 구현하기 위한 수단을 생성하게 한다.
이러한 컴퓨터 프로그램 명령어는 또한 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치가 특정 방식으로 작동하도록 지시할 수 있는 컴퓨터 판독 가능 메모리에 저장될 수 있어, 컴퓨터 판독가능 메모리에 저장된 명령어들로 하여금 명령어 수단을 포함하는 제조 물품을 생성하게 하며, 상기 명령어 수단은 흐름도의 하나 이상의 흐름 및/또는 블록도의 하나 이상의 블록에 지정된 기능을 구현한다.
이러한 컴퓨터 프로그램 명령어는 또한 컴퓨터 또는 기타 프로그램 가능한 데이터 처리 장치에 로드될 수 있어, 컴퓨터 또는 기타 프로그램 가능한 장치에서 일련의 작동 단계가 수행되어 컴퓨터로 구현되는 프로세스를 생성함으로써, 컴퓨터 또는 기타 프로그램 가능한 장치에서 실행되는 명령어는 흐름도의 하나 이상의 흐름 및/또는 블록도의 하나 이상의 블록에 지정된 기능을 구현하기 위한 단계를 제공한다.
전형적인 구성에서는, 컴퓨팅 장치는 하나 이상의 프로세서(CPU), 입력/출력 인터페이스, 네트워크 인터페이스, 및 메모리를 포함한다.
메모리는 컴퓨터 판독 가능 매체의 비영구적 메모리, 랜덤 액세스 메모리(RAM) 및/또는 비휘발성 메모리(읽기 전용 메모리(ROM) 또는 플래시 메모리(flash RAM)) 등 형태일 수 있다.
컴퓨터가 읽을 수 있는 매체는 영구 매체와 비영구 매체, 이동식 매체와 비이동식 매체를 모두 포함하며, 정보의 저장은 어떠한 방법이나 기술로도 구현될 수 있다. 정보는 컴퓨터 판독 가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터일 수 있다. 컴퓨터 저장 매체의 예에는 상변화 메모리(PRAM), 정적 랜덤 액세스 메모리(SRAM), 동적 랜덤 액세스 메모리(DRAM), 기타 유형의 랜덤 액세스 메모리(RAM), 읽기 전용 메모리(ROM), 전기적 지우기 가능 프로그램화 읽기 전용 메모리(EPROM), 플래시 메모리 또는 기타 메모리 기술, 콤팩트 디스크 읽기 전용 메모리(CD-ROM), 디지털 다기능 디스크(DVD) 또는 기타 광학 저장 장치, 자기 테이프 카세트, 자기 테이프 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨팅 장치에서 액세스할 수 있는 정보를 저장하는 데 사용할 수 있는 임의의 기타 비전송 매체가 포함되지만 이에 국한되지는 않는다. 또한, 비록 첨부도면 중에서는 특정된 순서로 본 발명 방법의 동작을 기재하였지만, 반드시 당해 특정 순서에 따라 이들 동작을 수행해야만 한다는 의미, 또는 반드시 전반 개시의 동작을 수행해야만 기대하는 결과를 구현할 수 있다는 의미를 요구하거나 암시하고자 하는 것이 아니다. 부가적으로 또는 선택적으로, 일부분 단계를 생략할 수도 있고, 복수의 단계를 하나의 단계로 병합하여 수행할 수도 있으며, 한편/또는 하나의 단계를 복수의 단계로 분할하여 수행할 수도 있다.
비록 약간의 구체적 실시 형태를 참조하여 본 발명의 사상 및 원리를 이미 설명하였지만, 이해되어야 할 점은 본 발명이 개시된 구체적인 실시 형태에 한정되지 않는 바, 각각의 측면에 대한 구분 또한 이들 측면 중의 특징이 조합을 통해 유리한 효과를 향유할 수 있다는 점을 부인하는 것이 아니며, 이와 같은 구분은 단지 기재의 편리를 위한 것일 뿐이다. 본 발명은 첨부된 특허청구범위의 사상 및 범위 내에 포함되는 여러가지 수정 및 균등한 구성요소를 포괄하고자 하는 바이다.

Claims (34)

  1. 적어도 하나의 문자 프레임을 포함하는 문자 영역 영상을 획득하고, 문자 영역 영상을 계조 영상으로 변환하는 단계;
    에지 검출 알고리즘을 사용하여 상기 계조 영상을 에지 이진 영상으로 변환하는 단계;
    투영 방법을 사용하여 상기 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득하는 단계; 및
    윤곽 검출 알고리즘을 사용하여 상기 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하고, 상기 타겟 문자 영역에 따라 상기 문자 영역 영상에 대해 문자 분할을 수행하는 단계; 를 포함하는 것을 특징으로 하는 문자 분할 방법.
  2. 제1항에 있어서,
    에지 검출 알고리즘을 사용하여 상기 계조 영상을 에지 이진 영상으로 변환하기 전에,
    상기 계조 영상에 대한 필터링 처리를 수행하는 단계를 더 포함하며;
    상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링인 것을 특징으로 하는 문자 분할 방법.
  3. 제1항에 있어서,
    에지 검출 알고리즘을 사용하여 상기 계조 영상을 에지 이진 영상으로 변환하는 단계는,
    canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하고, 상기 에지 검출 결과에 따라 상기 계조 영상을 상기 에지 이진 영상으로 변환하는 단계를 더 포함하는 것을 특징으로 하는 문자 분할 방법.
  4. 제3항에 있어서,
    canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하기 전에,
    상기 계조 영상의 영상 품질 특징을 검출하는 단계; 및
    상기 계조 영상의 영상 품질 특징에 의해 상기 canny 연산자의 파라미터를 적응적으로 조정하는 단계를 더 포함하고;
    상기 영상 품질 특징은 글로벌 콘트라스트 및 글로벌 계조 평균값 중 하나 이상을 포함하는 것을 특징으로 하는 문자 분할 방법.
  5. 제1항에 있어서,
    투영 방법을 사용하여 상기 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득하는 단계는,
    수직 투영 방법에 따라 상기 에지 이진 영상에 대한 분할 처리를 수행함으로써, 상기 적어도 하나의 문자 프레임과 대응하는 관계를 갖는 적어도 하나의 상기 문자 프레임 분할 블록을 획득하는 것을 특징으로 하는 문자 분할 방법.
  6. 제1항에 있어서,
    윤곽 검출 알고리즘을 사용하여 상기 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하는 단계는,
    윤곽 검출 알고리즘을 사용하여 상기 문자 프레임 분할 블록에서의 문자 윤곽을 결정하는 단계; 및
    상기 문자 프레임 분할 블록에서의 상기 문자 윤곽의 최소 외접 직사각형 영역에 의해, 상기 타겟 문자 영역을 결정하는 단계를 포함하는 것을 특징으로 하는 문자 분할 방법.
  7. 적어도 하나의 문자 프레임을 포함하는 문자 영역 영상을 획득하고, 상기 문자 영역 영상을 계조 영상으로 변환하기 위한 획득 모듈;
    에지 검출 알고리즘을 사용하여 상기 계조 영상을 에지 이진 영상으로 변환하기 위한 에지 검출 모듈;
    투영 방법을 사용하여 상기 에지 이진 영상으로부터 문자 프레임 분할 블록을 획득하기 위한 투영 모듈; 및
    윤곽 검출 알고리즘을 사용하여 상기 문자 프레임 분할 블록에서 타겟 문자 영역을 결정하고, 상기 타겟 문자 영역에 따라 상기 문자 영역 영상에 대해 문자 분할을 수행하기 위한 윤곽 검출 모듈; 을 포함하는 것을 특징으로 하는 문자 분할 장치.
  8. 제7항에 있어서,
    에지 검출 알고리즘을 사용하여 상기 계조 영상을 에지 이진 영상으로 변환하기 전에, 상기 계조 영상에 대한 필터링 처리를 수행하기 위한 필터링 모듈을 더 포함하며;
    상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링하는 것을 특징으로 하는 문자 분할 장치.
  9. 제7항에 있어서,
    상기 에지 검출 모듈은 또한 canny 연산자를 사용하여 계조 영상에 대한 에지 검출을 수행하고, 에지 검출 결과에 따라 계조 영상을 에지 이진 영상으로 변환하는 것을 특징으로 하는 문자 분할 장치.
  10. 제9항에 있어서,
    상기 에지 검출 모듈은,
    상기 계조 영상의 영상 품질 특징을 검출하고;
    상기 계조 영상의 영상 품질 특징에 의해 canny 연산자의 파라미터를 적응적으로 조정하며;
    상기 영상 품질 특징은 글로벌 콘트라스트 및 글로벌 계조 평균값 중 하나 이상을 포함하는 것을 특징으로 하는 문자 분할 장치.
  11. 제7항에 있어서,
    상기 투영 모듈은,
    수직 투영 방법에 따라 상기 에지 이진 영상에 대한 분할 처리를 수행함으로써, 상기 적어도 하나의 문자 프레임과 대응하는 관계를 갖는 적어도 하나의 상기 문자 프레임 분할 블록을 획득하는 것을 특징으로 하는 문자 분할 장치.
  12. 제7항에 있어서,
    상기 윤곽 검출 모듈은,
    윤곽 검출 알고리즘을 사용하여 상기 문자 프레임 분할 블록에서의 문자 윤곽을 결정하고;
    상기 문자 프레임 분할 블록에서의 상기 문자 윤곽의 최소 외접 직사각형 영역에 의해, 상기 타겟 문자 영역을 결정하는 것을 특징으로 하는 문자 분할 장치.
  13. 하나 이상의 멀티 코어 프로세서; 및
    하나 이상의 프로그램을 저장하기 위한 메모리; 를 포함하고;
    상기 하나 이상의 프로그램이 상기 하나 이상의 멀티 코어 프로세서에 의해 수행되는 경우, 상기 하나 이상의 멀티 코어 프로세서로 하여금 청구항 제1항 내지 제7항중 임의의 한 항에 기재된 방법을 구현하도록 하는 것을을 특징으로 하는 문자 분할 장치.
  14. 프로그램이 저장된 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 프로그램이 멀티 코어 프로세서에 의해 수행되는 경우, 상기 멀티 코어 프로세서로 하여금 청구항 제1항 내지 제7항중 임의의 한 항에 기재된 방법을 수행하도록 하는 것을 특징으로 하는 컴퓨터 판독 가능 저장 매체.
  15. 문자 영역 영상을 획득하고 상기 문자 영역 영상을 계조 영상으로 변환하는 단계;
    퍼지 C-평균값을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하고, 상기 클러스터 분석 결과에 따라 상기 계조 영상에 대한 이진화 처리를 수행하여, 이진 영상을 획득하는 단계;
    투영 방법을 사용하여 상기 이진 영상으로부터 적어도 하나의 문자 위치 지정 블록을 획득하는 단계; 및
    상기 문자 위치 지정 블록의 위치 정보에 따라 상기 문자 영역 영상에 대한 문자 분할을 수행하는 단계; 를 포함하는 것을 특징으로 하는 문자 분할 방법.
  16. 제15항에 있어서,
    퍼지 C-평균값 클러스터링 알고리즘을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하기 전에,
    canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하여, 에지 영상을 획득하는 단계;
    허프 변환 방정식를 사용하여 상기 에지 영상에 대한 직선 검출을 수행하여, 상기 에지 영상의 경계선을 획득하는 단계; 및
    상기 경계선에 따라 상기 계조 영상의 경계 부분을 제거하는 단계;를 더 포함하는 것을 특징으로 하는 문자 분할 방법.
  17. 제16항에 있어서,
    canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하기 전에,
    상기 계조 영상의 영상 품질 특징을 검출하는 단계;
    상기 계조 영상의 영상 품질 특징에 의해 상기 canny 연산자의 파라미터를 적응적으로 조정하는 단계; 를 더 포함하고,
    상기 영상 품질 특징은 글로벌 콘트라스트 및/또는 글로벌 계조 평균값을 포함하는 것을 특징으로 하는 문자 분할 방법.
  18. 제16항에 있어서,
    canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하기 전에, 상기 방법은,
    상기 계조 영상에 대한 필터링 처리를 수행하는 단계를 더 포함하며;
    상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링을 포함하는 것을 특징으로 하는 문자 분할 방법.
  19. 제15항에 있어서,
    퍼지 C-평균값 클러스터링 알고리즘을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하기 전에,
    상기 계조 영상에 대한 대수 변환을 수행하는 단계를 더 포함하는 것을 특징으로 하는 문자 분할 방법.
  20. 제15항에 있어서,
    퍼지 C-평균값을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하고, 상기 클러스터 분석 결과에 따라 상기 계조 영상에 대한 이진화 처리를 수행하는 단계는,
    상기 퍼지 C-평균값 클러스터링 알고리즘을 사용하여 상기 계조 영상에 대해 클러스터링을 수행함으로써 C개의 클러스터를 획득하는 단계;
    상기 C개의 클러스터의 클러스터 중심에 따라 상기 C개의 클러스터의 속성을 각각 결정하는 단계;
    상기 계조 영상의 임의의 하나의 화소점이 상기 C개의 클러스터 각각에 대응하는 C개의 멤버십을 결정하는 단계;
    상기 C개의 클러스터를 상기 멤버십에 따라 정렬하여 그중의 N개의 클러스터를 결정하고, 상기 N 개의 클러스터의 속성에 따라 상기 계조 영상의 임의의 하나의 화소점의 속성을 결정하는 단계; 및
    상기 계조 영상의 임의의 하나의 화소점의 속성에 따라, 상기 계조 화상에 대하여 이진화 처리를 수행하는 단계;를 포함하고,
    상기 C 및 N은 양의 정수이고, 상기 C는 상기 N보다 큰 것을 특징으로 하는 문자 분할 방법.
  21. 제15항에 있어서,
    투영 방법을 사용하여 상기 이진 영상으로부터 적어도 하나의 문자 위치 지정 블록을 획득한 후, 상기 방법은,
    상기 적어도 하나의 문자 위치 지정 블록에서 각 문자 위치 지정 블록의 전경 화소 면적을 검출하는 단계; 및
    상기 전경 화소 면적에 따라, 상기 적어도 하나의 문자 위치 지정 블록 중에서 간섭 블록을 검출하고, 상기 적어도 하나의 문자 위치 지정 블록으로부터 상기 간섭 블록을 제거하는 단계; 를 포함하고,
    상기 간섭 블록의 상기 전경 화소 면적은 상기 적어도 하나의 문자 위치 지정 블록 중의 M개의 문자 위치 지정 블록의 상기 전경 화소 면적보다 작고, 상기 M는 미리 설정된 문자 수인 것을 특징으로 하는 문자 분할 방법.
  22. 제15항에 있어서,
    수직 투영 방법을 사용하여 상기 이진 영상으로부터 적어도 하나의 문자 위치 지정 블록을 획득한 후, 상기 방법은,
    비최근접 억제 알고리즘을 사용하여 상기 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하는 단계를 포함하는 것을 특징으로 하는 문자 분할 방법.
  23. 제21항 또는 제22항에 있어서,
    상기 적어도 하나의 문자 위치 지정 블록의 위치 정보에 따라, 상기 문자 영역 영상에 대한 문자 분할이 수행하는 단계는,
    상기 적어도 하나의 문자 위치 지정 블록의 평균 폭을 결정하는 단계;
    상기 적어도 하나의 문자 위치 지정 블록에 상기 평균 폭보다 폭이 작은 타겟 문자 위치 지정 블록이 존재하는 경우, 상기 타겟 문자 위치 지정 블록의 위치 정보 및 상기 평균 폭에 따라, 상기 문자 영역 영상에 대한 문자 분할을 수행하는 단계; 를 포함하는 것을 특징으로 하는 문자 분할 방법.
  24. 문자 영역 영상을 획득하고, 상기 문자 영역 영상을 계조 영상으로 변환하기 위한 획득 모듈;
    퍼지 C-평균값을 사용하여 상기 계조 영상에 대한 클러스터 분석을 수행하고, 상기 클러스터 분석 결과에 따라 상기 계조 영상에 대한 이진화 처리를 수행하여, 이진 영상을 획득 하기 위한 클러스터링 모듈;
    투영 방법을 사용하여 상기 이진 영상으로부터 적어도 하나의 문자 위치 지정 블록을 획득하기 위한 문자 위치 지정 모듈; 및
    상기 문자 위치 지정 블록의 위치 정보에 따라 상기 문자 영역 영상에 대한 문자 분할을 수행하기 위한 분할모듈; 을 포함하는 것을 특징으로 하는 문자 분할 장치.
  25. 제24항에 있어서,
    canny 연산자를 사용하여 상기 계조 영상에 대한 에지 검출을 수행하여, 에지 영상을 획득하기 위한 에지 검출 모듈;
    허프 변환 방정식를 사용하여 상기 에지 영상에 대한 직선 검출을 수행하여, 상기 에지 영상의 경계선을 획득하기 위한 직선 검출 모듈;
    상기 경계선에 따라 상기 계조 영상의 경계 부분을 제거하기 위한 경계 제거 모듈;을 더 포함하는 것을 특징으로 하는 문자 분할 장치.
  26. 제25항에 있어서,
    상기 에지 검출 모듈은,
    상기 계조 영상의 영상 품질 특징을 검출하기 위한 품질 검출 모듈;
    상기 계조 영상의 영상 품질 특징에 의해 상기 canny 연산자의 파라미터를 적응적으로 조정하기 위한 파라미터 조정 모듈;을 더 포함하고,
    상기 영상 품질 특징은 적어도 글로벌 콘트라스트 및/또는 글로벌 계조 평균값을 포함하는 것을 특징으로 하는 문자 분할 장치.
  27. 제25항에 있어서,
    상기 장치는,
    상기 계조 영상에 대한 필터링 처리를 수행하기 위한 필터링 모듈을 더 포함하고,
    상기 필터링 처리는 메디안 필터링 및/또는 가우시안 필터링을 더 포함하는 것을 특징으로 하는 문자 분할 장치.
  28. 제24항에 있어서,
    상기 계조 영상에 대한 대수 변환을 수행하기 위한 대수 변환 모듈을 더 포함하는 것을 특징으로 하는 문자 분할 장치.
  29. 제24항에 있어서,
    상기 클러스터링 모듈은,
    상기 퍼지 C-평균값 클러스터링 알고리즘을 사용하여 상기 계조 영상에 대해 클러스터링을 수행함으로써 C개의 클러스터를 획득하고;
    상기 C개의 클러스터의 클러스터 중심에 따라 상기 C개의 클러스터의 속성을 각각 결정하고;
    상기 계조 영상의 임의의 하나의 화소점이 상기 C개의 클러스터 각각에 대응하는 C개의 멤버십을 결정하고;
    상기 C개의 클러스터를 상기 멤버십에 따라 정렬하여 그중의 N개의 클러스터를 결정하고, 상기 N 개의 클러스터의 속성에 따라 상기 계조 영상의 임의의 하나의 화소점의 속성을 결정하고;
    상기 계조 영상의 임의의 하나의 화소점의 속성에 따라, 상기 계조 화상에 대하여 이진화 처리를 수행하며,
    상기 C 및 N은 양의 정수이고, 상기 C는 상기 N보다 큰 것을 특징으로 하는 문자 분할 장치.
  30. 제24항에 있어서,
    상기 장치는,
    상기 적어도 하나의 문자 위치 지정 블록에서 각 문자 위치 지정 블록의 전경 화소 면적을 검출하고;
    상기 전경 화소 면적에 따라 상기 적어도 하나의 문자 위치 지정 블록 중에서 간섭 블록을 검출하고, 상기 적어도 하나의 문자 위치 지정 블록으로부터 상기 간섭 블록을 제거하기 위한 제1 제거 모듈을 포함하고;
    상기 간섭 블록의 상기 전경 화소 면적은 상기 적어도 하나의 문자 위치 지정 블록 중의 M개의 문자 위치 지정 블록의 상기 전경 화소 면적보다 작고, 상기 M는 미리 설정된 문자 수인 것을 특징으로 하는 문자 분할 장치.
  31. 제24항에 있어서,
    상기 장치는,
    비최근접 억제 알고리즘을 사용하여 상기 적어도 하나의 문자 위치 지정 블록으로부터 간섭 블록을 제거하기 위한 제2 제거 모듈을 포함하는 것을 특징으로 하는 문자 분할 장치.
  32. 제24항에 있어서,
    상기 분할 모듈은,
    상기 적어도 하나의 문자 위치 지정 블록의 평균 폭을 결정하고;
    상기 적어도 하나의 문자 위치 지정 블록에 상기 평균 폭보다 폭이 작은 타겟 문자 위치 지정 블록이 존재하는 경우, 상기 타겟 문자 위치 지정 블록의 위치 정보 및 상기 평균 폭에 따라, 상기 문자 영역 영상에 대한 문자 분할을 수행하는 것을 특징으로 하는 문자 분할 장치.
  33. 하나 이상의 멀티 코어 프로세서; 및
    하나 이상의 프로그램을 저장하기 위한 메모리; 를 포함하고,
    상기 하나 이상의 프로그램이 상기 하나 이상의 멀티 코어 프로세서에 의해 수행되는 경우, 상기 하나 이상의 멀티 코어 프로세서로 하여금 청구항 제15항 내지 제23항 중 임의의 한 항에 기재된 방법을 구현하도록 하는 것을 특징으로 하는 문자 분할 장치.
  34. 프로그램이 저장된 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 프로그램이 멀티 코어 프로세서에 의해 수행되는 경우, 상기 멀티 코어 프로세서로 하여금 청구항 제15항 내지 제23항 중 임의의 한 항에 기재된 방법을 수행하도록 하는것을 특징으로 하는 컴퓨터 판독 가능 저장 매체
KR1020227022859A 2019-12-05 2020-09-29 문자 분할 방법, 장치 및 컴퓨터 판독 가능 저장 매체 KR20220139292A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201911234826.3 2019-12-05
CN201911233988.5 2019-12-05
CN201911234826.3A CN111027546B (zh) 2019-12-05 2019-12-05 一种字符分割方法、装置以及计算机可读存储介质
CN201911233988.5A CN111046862B (zh) 2019-12-05 2019-12-05 一种字符分割方法、装置以及计算机可读存储介质
PCT/CN2020/118675 WO2021109697A1 (zh) 2019-12-05 2020-09-29 字符分割方法、装置以及计算机可读存储介质

Publications (1)

Publication Number Publication Date
KR20220139292A true KR20220139292A (ko) 2022-10-14

Family

ID=76221415

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227022859A KR20220139292A (ko) 2019-12-05 2020-09-29 문자 분할 방법, 장치 및 컴퓨터 판독 가능 저장 매체

Country Status (5)

Country Link
US (1) US20230009564A1 (ko)
EP (1) EP4071665A4 (ko)
JP (2) JP2023505663A (ko)
KR (1) KR20220139292A (ko)
WO (1) WO2021109697A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115984863B (zh) * 2023-03-17 2023-05-26 中化现代农业有限公司 图像处理方法、装置、设备及存储介质
CN116128877B (zh) * 2023-04-12 2023-06-30 山东鸿安食品科技有限公司 一种基于温度检测的排汽回收智能监测系统
CN116168027B (zh) * 2023-04-24 2023-07-04 山东交通学院 基于视觉定位的木工机械智能切割方法
CN116777845B (zh) * 2023-05-26 2024-02-13 浙江嘉宇工程管理有限公司 基于人工智能的建筑工地安全风险智能评估方法及系统
CN116681628B (zh) * 2023-08-03 2023-10-24 湖南华菱电子商务有限公司 一种基于深度学习的营业执照数据处理方法及系统
CN116843687A (zh) * 2023-09-01 2023-10-03 山东东方智光网络通信有限公司 一种通信光缆表面瑕疵检测方法及装置
CN117095423B (zh) * 2023-10-20 2024-01-05 上海银行股份有限公司 一种银行单据字符的识别方法及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08264591A (ja) * 1995-03-28 1996-10-11 Oki Electric Ind Co Ltd Tab接続方法
JP2998718B2 (ja) * 1997-09-22 2000-01-11 日本電気株式会社 光学式文字読取方法および装置
US7302098B2 (en) * 2004-12-03 2007-11-27 Motorola, Inc. Character segmentation method and apparatus
CN102426649B (zh) * 2011-10-13 2013-08-21 石家庄开发区冀科双实科技有限公司 一种简单的高准确率的钢印数字自动识别方法
US20150039637A1 (en) * 2013-07-31 2015-02-05 The Nielsen Company (Us), Llc Systems Apparatus and Methods for Determining Computer Apparatus Usage Via Processed Visual Indicia
CN104156704A (zh) * 2014-08-04 2014-11-19 胡艳艳 一种新的车牌识别方法及系统
JP6599672B2 (ja) * 2015-07-17 2019-10-30 日本電産サンキョー株式会社 文字切り出し装置、文字認識装置、および文字切り出し方法
CN105373794B (zh) * 2015-12-14 2018-02-06 河北工业大学 一种车牌识别方法
CN105825212A (zh) * 2016-02-18 2016-08-03 江西洪都航空工业集团有限责任公司 一种基于Hadoop的分布式车牌识别方法
US10026004B2 (en) * 2016-07-08 2018-07-17 Conduent Business Services, Llc Shadow detection and removal in license plate images
FR3055721B1 (fr) * 2016-09-05 2019-10-18 Ingenico Group Procede de reconnaissance de caracteres en reliefs, produit programme d'ordinateur et dispositif correspondants
JP7030462B2 (ja) * 2017-09-21 2022-03-07 キヤノン株式会社 スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
CN109522889A (zh) * 2018-09-03 2019-03-26 中国人民解放军国防科技大学 一种基于图像分析的水文尺水位识别估算方法
CN109543688A (zh) * 2018-11-14 2019-03-29 北京邮电大学 一种新型的基于多层卷积神经网络的水表读数检测与识别的方法
CN109598271B (zh) * 2018-12-10 2021-02-09 北京奇艺世纪科技有限公司 一种字符分割方法及装置
CN109726717B (zh) * 2019-01-02 2022-03-01 西南石油大学 一种车辆综合信息检测系统
CN111027546B (zh) * 2019-12-05 2024-03-26 嘉楠明芯(北京)科技有限公司 一种字符分割方法、装置以及计算机可读存储介质
CN111046862B (zh) * 2019-12-05 2023-10-27 嘉楠明芯(北京)科技有限公司 一种字符分割方法、装置以及计算机可读存储介质

Also Published As

Publication number Publication date
JP2024050880A (ja) 2024-04-10
EP4071665A4 (en) 2023-11-22
US20230009564A1 (en) 2023-01-12
EP4071665A1 (en) 2022-10-12
WO2021109697A1 (zh) 2021-06-10
JP2023505663A (ja) 2023-02-10

Similar Documents

Publication Publication Date Title
KR20220139292A (ko) 문자 분할 방법, 장치 및 컴퓨터 판독 가능 저장 매체
CN113781402B (zh) 芯片表面划痕缺陷的检测方法、装置和计算机设备
CN107833220B (zh) 基于深度卷积神经网络与视觉显著性的织物缺陷检测方法
CN109636732B (zh) 一种深度图像的空洞修复方法以及图像处理装置
CN111027546B (zh) 一种字符分割方法、装置以及计算机可读存储介质
WO2018107939A1 (zh) 一种基于边缘完备度的图像分割最优识别方法
TWI655586B (zh) 用於檢測預定區域中特定標識圖像的方法及裝置
CN108830873B (zh) 深度图像物体边缘提取方法、装置、介质及计算机设备
CN111415363B (zh) 一种图像边缘识别方法
US10748023B2 (en) Region-of-interest detection apparatus, region-of-interest detection method, and recording medium
US20150003725A1 (en) Depth constrained superpixel-based depth map refinement
CN111046862B (zh) 一种字符分割方法、装置以及计算机可读存储介质
Lo et al. Joint trilateral filtering for depth map super-resolution
WO2007061779A1 (en) Shadow detection in images
CN103455994A (zh) 图像模糊度的确定方法和设备
US20170178341A1 (en) Single Parameter Segmentation of Images
US20150220804A1 (en) Image processor with edge selection functionality
US20120320433A1 (en) Image processing method, image processing device and scanner
CN111354047A (zh) 一种基于计算机视觉的摄像模组定位方法及系统
CN110097569B (zh) 基于颜色马尔科夫链显著性模型的油罐目标检测方法
CN113744200B (zh) 一种摄像头脏污检测方法、装置及设备
Bergevin et al. Detection and characterization of junctions in a 2D image
CN111476821B (zh) 基于在线学习的目标跟踪方法
CN113538500B (zh) 图像分割方法、装置、电子设备和存储介质
CN113128435B (zh) 图像中手部区域分割方法、装置、介质及计算机设备