KR20200145174A - 번호판 인식 방법 및 시스템 - Google Patents

번호판 인식 방법 및 시스템 Download PDF

Info

Publication number
KR20200145174A
KR20200145174A KR1020190073813A KR20190073813A KR20200145174A KR 20200145174 A KR20200145174 A KR 20200145174A KR 1020190073813 A KR1020190073813 A KR 1020190073813A KR 20190073813 A KR20190073813 A KR 20190073813A KR 20200145174 A KR20200145174 A KR 20200145174A
Authority
KR
South Korea
Prior art keywords
license plate
learning
image
recognition
learning model
Prior art date
Application number
KR1020190073813A
Other languages
English (en)
Other versions
KR102197930B1 (ko
Inventor
권장우
사이드라술콘
이선우
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020190073813A priority Critical patent/KR102197930B1/ko
Publication of KR20200145174A publication Critical patent/KR20200145174A/ko
Application granted granted Critical
Publication of KR102197930B1 publication Critical patent/KR102197930B1/ko

Links

Images

Classifications

    • G06K9/3258
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • G06K2209/15

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

번호판 인식 시스템 및 방법이 개시된다. 일 실시예에 따른 인식 시스템에 의해 수행되는 번호판 인식 방법은, 복수 개의 기술이 결합된 복합 신경망에 기반한 학습 모델을 구성하는 단계; 및 상기 구성된 학습 모델에 기초하여 이미지를 학습시킴에 따라 번호판을 인식하는 단계를 포함할 수 있다.

Description

번호판 인식 방법 및 시스템{SYSTEM AND METHOD FOR RECOGNIZING LICENSE PLATES}
아래의 설명은 이미지로부터 번호판을 감지하고 인식하는 기술에 관한 것이다.
자동 번호판 인식 시스템(ANPR)은 차량 번호판(등록판)의 위치를 파악한 후 문자 분할을 사용하여 플레이트 데이터를 추출하기 위해 사진(이미지)에 적용된 광학 문자 인식(OCR)에 주로 기반을 둔 보안 감시 기술이다. 주로 ANPR 시스템은 도로 집행 카메라에 구현되는 내장 소프트웨어와 같다.
광학 문자 인식을 이용한 차량 번호판을 인식하는 작업은 다양한 번호판의 형식과 불규칙한 조명 조건 때문에 상당히 어려운 문제이다. 인식 효율이 높고 강력한 ANPR이 개발되었으나, 캡쳐된 이미지를 처리하는 데 한계가 있다. 예를 들면, 낮은 이미지 해상도, 흐릿한 그림 또는 물체가 너무 멀리 위치할 경우, 인식되지 않는다. 더욱이, 가장 일반적으로 잘못 인식되는 경우는 조도가 좋지 않은 경우다.
한편, 한국등록특허 제10-1931804호는 차량 번호판의 인식률 증대 장치 및 방법에 관한 것으로, SRGAN 학습을 통하여 저해상도의 차량 번호판을 고해상도의 차량 번호판으로 해상도를 높이는 구성을 개시하고 있다.
텍스트 인식 기술과 이미지 변환 기술을 번호판 인식의 정확도를 향상시키는 방법 및 시스템을 제공할 수 있다.
심층 학습에 기반하여 이미지로부터 번호판을 검출하고, 번호판을 인식하는 방법 및 시스템을 제공할 수 있다.
인식 시스템에 의해 수행되는 번호판 인식 방법은, 복수 개의 기술이 결합된 복합 신경망에 기반한 학습 모델을 구성하는 단계; 및 상기 구성된 학습 모델에 기초하여 이미지를 학습시킴에 따라 번호판을 인식하는 단계를 포함할 수 있다.
상기 학습 모델을 구성하는 단계는, 장면 텍스트 인식(Scene text recognition)기법과 기하학적 이미지 변환(geometrical image transformation)이 결합된 학습 모델을 구성하는 단계를 포함할 수 있다.
상기 학습 모델을 구성하는 단계는, 경쟁 평균 정밀도(mAP) 점수로 로지스틱 회귀 분석을 사용하여 각 경계 박스의 객체 점수와 번호판의 유형을 예측하기 위한 YOLOv3을 학습 모델로 생성하는 단계를 포함하고, 상기 번호판은 인식하는 단계는, 상기 이미지의 히스토그램 값을 변경하여 어둠 속에서 번호판을 식별하도록 YOLOv3을 학습시킴에 따라 번호판이 존재하는 영역을 감지하는 단계를 포함할 수 있다.
상기 구성하는 단계는, 완전 연결 계층(Fully connected layers)을 제거한 표준 VGG 네트워크에서 콘볼루션 및 맥스-풀링(Max-pooling layers) 계층으로 구성된 CRNN(Convolutional Recurrent Neural Networks)을 학습 모델로 생성하는 단계를 포함하고, 상기 번호판은 인식하는 단계는, 상기 이미지를 상기 CRNN에 입력하여 학습시킴에 따라 상기 이미지로부터 문자와 숫자의 순서를 식별하는 단계를 포함할 수 있다.
상기 번호판은 인식하는 단계는, 상기 이미지에 대한 그레이 스케일 이미지를 사용하여 특징 학습이 y축에 따라 번호판 한 줄마다 레이블 시퀀스를 획득하고, 상기 학습이 수행된 영역을 인식 필드(perceptive field)라고 정의하고, 상기 인식 필드가 LSTM 스택의 특정 유닛에 공급되고, 문자의 확률로 정의되는 CTC 계층을 사용하여 상기 학습이 수행된 영역의 전후로 추출된 특징을 양방향 LSTM 스택에 저장하는 단계를 포함할 수 있다.
인식 시스템은, 복수 개의 기술이 결합된 복합 신경망에 기반한 학습 모델을 구성하는 구성부; 및 상기 구성된 학습 모델에 기초하여 이미지를 학습시킴에 따라 번호판을 인식하는 인식부를 포함할 수 있다.
텍스트 인식 기술과 이미지 변환 기술에 기반한 복합 신경망을 이용하여 번호판 인식의 정확도를 향상시킬 수 있다.
도 1은 일 실시예에 따른 인식 시스템의 동작을 설명하기 위한 도면이다.
도 2는 일 실시예에 따른 인식 시스템의 구성을 설명하기 위한 블록도이다.
도 3은 일 실시예에 따른 인식 시스템에서 번호판을 인식하는 방법을 설명하기 위한 흐름도이다.
도 4는 일 실시예에 있어서, 번호판의 크기를 생성하는 것을 설명하기 위한 예이다.
도 5는 대한민국 차량의 번호판의 종류를 나타낸 예이다.
도 6 내지 도 8은 일 실시예에 따른 인식 시스템에서 번호판은 인식하는 것을 설명하기 위한 예이다.
이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.
도 1은 일 실시예에 따른 인식 시스템의 동작을 설명하기 위한 도면이다.
인식 시스템은 장면 텍스트 인식(Scene text recognition)기법과 기하학적 이미지 변환(geometrical image transformation) 기법이 결합된 학습 모델을 통하여 번호판을 감지하고, 감지된 번호판의 숫자와 문자를 식별할 수 있다.
기하학적 이미지 변환은 이미지를 변형하는 심층 이미지 분석과 학습을 기반으로 한다. 경계 박스에 대한 빠른 훈련 융합과 경쟁 평균 정밀도(mAP)를 갖는 실시간 객체 탐지를 위한 최첨단 방식인 YOLOv3를 학습시킬 수 있다. 이때, 번호판이 사람의 눈으로 거의 인식될 수 없는 어두운 이미지로 구성된 서로 다른 각도에서 촬영된 복수 개의 이미지들로 데이터 세트가 준비될 수 있다. 예를 들면, 서로 다른 각도에서 촬영된 약 5만대의 CCTV 이미지들로 자체 데이터 세트를 준비할 수 있다.
인식 시스템은 YOLOv3 네트워크를 학습하여 번호판의 위치를 식별할 수 있다. 기본적으로, YOLOv3는 이미지 처리를 통항 로컬리제이션(localization), 오리엔테이션(orientation), 사이징(sizing), 분할(segmentation) 등 여러 알고리즘을 한꺼번에 완성한다. 번호판 감지의 성능을 향상시키기 위하여 데이터 세트에 다른 배경 이미지와 비례하는 균형이 있어야 한다. 실시예에서는 자동차 번호판을 식별하는 것이기 때문에 이미지로 주차 이미지와 CCTV 이미지를 사용할 수 있다. 인식 시스템은 주차 이미지를 CCTV 카메라의 수와 동일하게 하기 위하여 이미지의 수평 및 수직 뒤집기의 조합을 사용하여 이미지를 보강할 수 있다. 이미지를 회전하여 데이터 세트의 이미지의 수를 증가시키기 때문에 이러한 간단한 증강을 객체 감지에 적용시킬 수 있다.
도 6을 참고하면, 감지된 객체 영역의 히스토그램 값이 향상된 이미지를 나타낸 것이다. 구체적으로, 인식 시스템은 이미지의 히스토그램 값을 변경하여 어둠 속에서 객체를 식별하도록 YOLOv3을 학습시켜 필요한 영역만 밝게 추출되도록 할 수 있다. 인식 시스템은 mAP 점수로 로지스틱 회귀 분석을 사용하여 각 경계 박스의 객체 점수와 번호판의 유형을 예측하기 위한 YOLOv3을 학습 모델로 생성할 수 있다. 인식 시스템은 이미지의 히스토그램 값을 변경하여 어둠 속에서 번호판을 식별하도록 YOLOv3을 학습시킴에 따라 번호판이 존재하는 영역을 감지할 수 있다. 인식 시스템은 각 경계 박스의 객체 점수와 번호판의 유형을 예측할 수 있다.
인식 시스템은 번호판의 인식을 위하여 CRNN 이라는 또 다른 네트워크에 기반하여 감지된 이미지 영역에 존재하는 문자와 숫자의 순서를 식별할 수 있다. CRNN이란 CNN과 RNN의 조합을 이용하여 전체의 작업을 콘볼루션 계층(convolutional layers), 반복층(recurrent layers), 전사층(transcription layers) 등 3가지 구성요소로 나누어 이미지로부터 장면 텍스트를 인식할 수 있도록 구성된 것을 의미할 수 있다. CRNN에서 그레이 스케일 이미지가 VGG 네트워크에 입력됨에 따라 획득된 맵들이 특징 시퀀스로 공급되어 반복 계층으로 전달되며, 레벨 양방향 LSTM 스택이 사용된 경우, 각 프레임에 대한 라벨 분포가 예측되고, 각 프레임별 예측 분포가 정렬될 수 있다. 이때, CRNN 네트워크를 학습시키기 위하여 복수 개의 번호판 이미지가 필요하다. CRNN 네트워크는 특징 학습보다는 순서(sequence) 학습에 기초하기 때문에 합성 번호판 생성기가 추가될 수 있다. 데이터 세트를 추가하여 복수 개(예를 들면, 거의 6만개)의 번호판 이미지를 생성하고, 데이터 세트를 절반으로 합성할 수 있다.
번호판을 생성하기 위하여 OpenCV 라이브러리에서 제공하는 기능이 사용될 수 있다. 인식 시스템은 번호판의 실제 크기를 판단하고, 번호판에서 각 문자의 위치 정보를 추출할 수 있다. 그런 다음, 인식 시스템은 OpenCV 라이브러리를 사용하여 생성된 배경에 각 문자와 숫자를 자를 수 있다. 이때, 각 유형마다 차원과 문자의 크기가 다른 것도 고려될 수 있다. 인식 시스템은 번호판의 정확한 크기를 생성할 수 있다. 도 4를 참고하면, 번호판 상의 문자 위치를 나타낸 것으로, 화면 dpi가 72로 픽셀값을 변환할 때 번호판의 크기가 520x110mm 이면, 그림은 1679x355 픽셀이 될 수 있다.
도 5를 참고하면 번호판을 설명하기 위한 것이다. 번호판의 종류는 다양하게 존재할 수 있으나, 설명의 편의를 위하여 자동차 번호판을 예를 들어 설명하기로 한다. 도 5를 참고하면, 대한민국 자동차의 번호판의 종류를 나타낸 것으로, 국토교통부가 디자인한 유효한 자동차 번호판의 유형을 확인할 수 있다. 가장 최신, 그리고 가장 널리 사용되는 자동차 번호판의 종류들은 2006년 이후로 생산되고 있다. 이 중 특히, 가장 널리 사용되는 번호판을 복수 개를 선택하여 형태와 모습에 모양에 따라 구분할 수 있다. 각 유형에는 번호판에서 사용되는 고유 한글 문자의 수가 존재한다. 예를 들면, 제1 타입, 제2 타입 및 제5타입의 경우, 분류 클래스로 간주할 수 있는 특정 문자가 50개, 제3 타입 및 제4타입의 경우, 각각 36개의 문자가 존재할 수 있다. 이러한 자동차의 번호판 타입은 일부 지역(도시) 이름들이 사용되었고, 단지 5개의 한글 문자만이 두 번째 기호로 사용되었다.
구체적으로, 인식 시스템은 CRNN에서 완전 연결 계층을 제거한 표준 VGG 네트워크에서 콘볼루션 및 맥스-풀링 계층으로 구성할 수 있다. 이에, 시퀀스 추출은 콘볼루션 및 맥스-풀링 계층에서 특징을 추출함으로써 시퀀스가 획득되고, 추출된 특징 벡터는 반복 계층에 대한 입력이 될 수 있다. 인식 시스템은 100x32 픽셀의 그레이 스케일 이미지를 사용하여 특징 학습이 y축에 따라 번호판 한 줄(line)에서 레이블 시퀀스를 획득할 수 있다. 이때, 학습이 수행된 영역을 인식 필드(perceptive field)라고 정의할 수 있다. 인식 필드는 LSTM 스택의 특정 유닛에 공급될 수 있다. 도 7을 참고하면, LSTM에 입력되는 인식 영역을 시각화한 것이다. 이 부분은 모든 문자가 클래스로 간주되고, 클래스에 문자가 속할 확률이 계산될 수 있다. 인식 시스템은 문자의 확률로 정의되는 CTC 계층을 사용하여 학습이 수행된 영역의 전후로 추출된 특징을 양방향 LSTM 스택에 저장할 수 있다. 이때, CTC 계층을 사용하여 학습이 수행됨에 따라 추출된 특징이 포함된 영역을 기준으로 이전 영역에 추출된 특징과 다음 영역에 추출된 특징이 양방향 LSTM 스택에 저장될 수 있다.
도 5에 도시된 바와 같이 제3 타입과 제5타입과 같이 2개 행이 존재하는 번호에서는 하나의 인식 필드에서 가장 높은 확률을 갖는 문자가 선택되고, 다른 문자는 무시될 수 있다. 인식 시스템은 단순 기하학적 이미지 변환 기법을 사용하여 이미지를 왜곡하고 모든 문자가 LSTM에 공급되는 하나의 인식 영역에 배치되지 않도록 설정할 수 있다. 이에 따라, 2개 행 이미지만 변환하여 검출 정확도를 높일 수 있다.
도 8을 참고하면, 기하학적 이미지 변환을 통하여 인식 영역을 시각화한 것을 나타낸 것이다. 기하학적 이미지 변환 기법은 이미지 콘텐츠를 변경하지 않고 대상 이미지로 변형시킴으로써 픽셀 그리드만 변경하며 2차원 영상에 적용될 수 있다. 각 LSTM 계층에 256개 유닛이 있는 112x32 픽셀의 그레이 스케일 이미지를 사용할 수 있다. 각 이미지에는 256 개의 인식 영역이 존재하고, 각 인식 영역은 전방-후방 확률이 계산되는 각 유닛에 누적될 수 있다. 또한, 인식 시스템은 번호판의 모든 숫자와 문자의 길이인 시퀀스 길이를 표시할 수 있다.
도 2는 일 실시예에 따른 인식 시스템의 구성을 설명하기 위한 블록도이고, 도 3은 일 실시예에 따른 인식 시스템에서 번호판을 인식하는 방법을 설명하기 위한 흐름도이다.
인식 시스템(100)에 포함된 프로세서는 구성부(210) 및 인식부(220)를 포함할 수 있다. 이러한 프로세서 및 프로세서의 구성요소들은 도 3의 번호판을 인식하는 방법이 포함하는 단계들(310 내지 320)을 수행하도록 인식 시스템을 제어할 수 있다. 이때, 프로세서 및 프로세서의 구성요소들은 메모리가 포함하는 운영체제의 코드와 적어도 하나의 프로그램의 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다. 여기서, 프로세서의 구성요소들은 인식 시스템(100)에 저장된 프로그램 코드가 제공하는 제어 명령에 따라 프로세서에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다.
프로세서는 번호판을 인식하는 방법을 위한 프로그램의 파일에 저장된 프로그램 코드를 메모리에 로딩할 수 있다. 예를 들면, 인식 시스템(100)에서 프로그램이 실행되면, 프로세서는 운영체제의 제어에 따라 프로그램의 파일로부터 프로그램 코드를 메모리에 로딩하도록 인식 시스템을 제어할 수 있다.
단계(310)에서 구성부(210)는 복수 개의 기술이 결합된 복합 신경망에 기반한 학습 모델을 구성할 수 있다. 구성부(210)는 장면 텍스트 인식(Scene text recognition)기법과 기하학적 이미지 변환(geometrical image transformation)이 결합된 학습 모델을 구성할 수 있다. 구성부(210)는 이미지의 히스토그램 값을 변경하여 어둠 속에서 객체를 식별하도록 구성된 것으로, 경쟁 평균 정밀도(mAP) 점수로 로지스틱 회귀 분석을 사용하여 각 경계 박스의 객체 점수와 번호판의 유형을 예측하기 위한 YOLOv3을 학습 모델로 생성할 수 있다. 구성부(210)는 완전 연결 계층(Fully connected layers)을 제거한 표준 VGG 네트워크에서 콘볼루션 및 맥스-풀링(Max-pooling layers) 계층으로 구성된 CRNN(Convolutional Recurrent Neural Networks)을 학습 모델로 생성할 수 있다.
단계(320)에서 인식부(220)는 구성된 학습 모델에 기초하여 이미지를 학습시킴에 따라 번호판을 인식할 수 있다. 인식부(220)는 이미지의 히스토그램 값을 변경하여 어둠 속에서 번호판을 식별하도록 YOLOv3을 학습시킴에 따라 번호판이 존재하는 영역을 감지할 수 있다. 인식부(220)는 이미지를 CRNN에 입력하여 학습시킴에 따라 이미지로부터 문자와 숫자의 순서를 식별할 수 있다. 인식부(220)는 이미지에 대한 그레이 스케일 이미지를 사용하여 특징 학습이 y축에 따라 번호판 한 줄마다 레이블 시퀀스를 획득하고, 학습이 수행된 영역을 인식 필드(perceptive field)라고 정의하고, 인식 필드가 LSTM 스택의 특정 유닛에 공급되고, 문자의 확률로 정의되는 CTC 계층을 사용하여 학습이 수행된 영역의 전후로 추출된 특징을 양방향 LSTM 스택에 저장할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (6)

  1. 인식 시스템에 의해 수행되는 번호판 인식 방법에 있어서,
    복수 개의 기술이 결합된 복합 신경망에 기반한 학습 모델을 구성하는 단계; 및
    상기 구성된 학습 모델에 기초하여 이미지를 학습시킴에 따라 번호판을 인식하는 단계
    를 포함하는 번호판 인식 방법.
  2. 제1항에 있어서,
    상기 학습 모델을 구성하는 단계는,
    장면 텍스트 인식(Scene text recognition)기법과 기하학적 이미지 변환(geometrical image transformation)이 결합된 학습 모델을 구성하는 단계
    를 포함하는 번호판 인식 방법.
  3. 제1항에 있어서,
    상기 학습 모델을 구성하는 단계는,
    경쟁 평균 정밀도(mAP) 점수로 로지스틱 회귀 분석을 사용하여 각 경계 박스의 객체 점수와 번호판의 유형을 예측하기 위한 YOLOv3을 학습 모델로 생성하는 단계
    를 포함하고,
    상기 번호판은 인식하는 단계는,
    상기 이미지의 히스토그램 값을 변경하여 어둠 속에서 번호판을 식별하도록 YOLOv3을 학습시킴에 따라 번호판이 존재하는 영역을 감지하는 단계
    를 포함하는 번호판 인식 방법.
  4. 제1항에 있어서,
    상기 구성하는 단계는,
    완전 연결 계층(Fully connected layers)을 제거한 표준 VGG 네트워크에서 콘볼루션 및 맥스-풀링(Max-pooling layers) 계층으로 구성된 CRNN(Convolutional Recurrent Neural Networks)을 학습 모델로 생성하는 단계
    를 포함하고,
    상기 번호판은 인식하는 단계는,
    상기 이미지를 상기 CRNN에 입력하여 학습시킴에 따라 상기 이미지로부터 문자와 숫자의 순서를 식별하는 단계
    를 포함하는 번호판 인식 방법.
  5. 제4항에 있어서,
    상기 번호판은 인식하는 단계는,
    상기 이미지에 대한 그레이 스케일 이미지를 사용하여 특징 학습이 y축에 따라 번호판 한 줄마다 레이블 시퀀스를 획득하고, 상기 학습이 수행된 영역을 인식 필드(perceptive field)라고 정의하고, 상기 인식 필드가 LSTM 스택의 특정 유닛에 공급되고, 문자의 확률로 정의되는 CTC 계층을 사용하여 상기 학습이 수행된 영역의 전후로 추출된 특징을 양방향 LSTM 스택에 저장하는 단계
    를 포함하는 번호판 인식 방법.
  6. 인식 시스템에 있어서,
    복수 개의 기술이 결합된 복합 신경망에 기반한 학습 모델을 구성하는 구성부; 및
    상기 구성된 학습 모델에 기초하여 이미지를 학습시킴에 따라 번호판을 인식하는 인식부
    를 포함하는 인식 시스템.
KR1020190073813A 2019-06-21 2019-06-21 번호판 인식 방법 및 시스템 KR102197930B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190073813A KR102197930B1 (ko) 2019-06-21 2019-06-21 번호판 인식 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190073813A KR102197930B1 (ko) 2019-06-21 2019-06-21 번호판 인식 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20200145174A true KR20200145174A (ko) 2020-12-30
KR102197930B1 KR102197930B1 (ko) 2021-01-04

Family

ID=74088438

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190073813A KR102197930B1 (ko) 2019-06-21 2019-06-21 번호판 인식 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102197930B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435446A (zh) * 2021-07-07 2021-09-24 南京云创大数据科技股份有限公司 一种基于深度学习的倾斜车牌矫正方法
CN114639090A (zh) * 2021-10-28 2022-06-17 中国公路工程咨询集团有限公司 一种非可控环境下的鲁棒中文车牌识别方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102383377B1 (ko) * 2021-06-02 2022-04-08 (주)트루엔 차량용 번호판을 인식하기 위한 전자 장치
KR102624702B1 (ko) * 2021-06-15 2024-01-11 롯데정보통신 주식회사 자동차 번호 인식 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130105952A (ko) * 2012-03-19 2013-09-27 한밭대학교 산학협력단 차량 번호판 인식 방법과 그 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130105952A (ko) * 2012-03-19 2013-09-27 한밭대학교 산학협력단 차량 번호판 인식 방법과 그 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435446A (zh) * 2021-07-07 2021-09-24 南京云创大数据科技股份有限公司 一种基于深度学习的倾斜车牌矫正方法
CN113435446B (zh) * 2021-07-07 2023-10-31 南京云创大数据科技股份有限公司 一种基于深度学习的倾斜车牌矫正方法
CN114639090A (zh) * 2021-10-28 2022-06-17 中国公路工程咨询集团有限公司 一种非可控环境下的鲁棒中文车牌识别方法

Also Published As

Publication number Publication date
KR102197930B1 (ko) 2021-01-04

Similar Documents

Publication Publication Date Title
KR102197930B1 (ko) 번호판 인식 방법 및 시스템
TWI677826B (zh) 車牌辨識系統與方法
Jiao et al. A configurable method for multi-style license plate recognition
US20210110180A1 (en) Method and apparatus for traffic sign detection, electronic device and computer storage medium
Nagare License plate character recognition system using neural network
Punyavathi et al. Vehicle tracking and detection techniques using IoT
CN107506763A (zh) 一种基于卷积神经网络的多尺度车牌精准定位方法
Hoang et al. Enhanced detection and recognition of road markings based on adaptive region of interest and deep learning
KR101848019B1 (ko) 차량 영역 검출을 통한 차량 번호판 검출 방법 및 장치
WO2019174405A1 (zh) 车牌辨识方法以及其系统
Xu et al. Fast vehicle and pedestrian detection using improved Mask R‐CNN
US10963719B1 (en) Optimized vehicle license plate recognition
Nordeng et al. DEBC detection with deep learning
Usmankhujaev et al. Korean license plate recognition system using combined neural networks
Shafi et al. License plate identification and recognition in a non-standard environment using neural pattern matching
Singh et al. Vehicle detection and accident prediction in sand/dust storms
Gu et al. Embedded and real-time vehicle detection system for challenging on-road scenes
Saha et al. i LPR: An indian license plate recognition system
Prabhu et al. Recognition of Indian license plate number from live stream videos
CN111881984A (zh) 一种基于深度学习的目标检测方法和装置
Peng et al. Real-time illegal parking detection algorithm in urban environments
CN115953744A (zh) 一种基于深度学习的车辆识别追踪方法
Gerhardt et al. Neural network-based traffic sign recognition in 360° images for semi-automatic road maintenance inventory
KR102026280B1 (ko) 딥 러닝을 이용한 씬 텍스트 검출 방법 및 시스템
Oluchi et al. Development of a Nigeria vehicle license plate detection system

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant