KR20230164411A - 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템 - Google Patents
송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템 Download PDFInfo
- Publication number
- KR20230164411A KR20230164411A KR1020220064130A KR20220064130A KR20230164411A KR 20230164411 A KR20230164411 A KR 20230164411A KR 1020220064130 A KR1020220064130 A KR 1020220064130A KR 20220064130 A KR20220064130 A KR 20220064130A KR 20230164411 A KR20230164411 A KR 20230164411A
- Authority
- KR
- South Korea
- Prior art keywords
- invoice
- image
- divided
- classification
- printed
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000013145 classification model Methods 0.000 claims abstract description 26
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 239000000284 extract Substances 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0838—Historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/087—Inventory or stock management, e.g. order filling, procurement or balancing against orders
- G06Q10/0875—Itemisation or classification of parts, supplies or services, e.g. bill of materials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/164—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/06—Recognition of objects for industrial automation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Character Discrimination (AREA)
Abstract
송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템이 제시된다. 본 발명에서 제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템은 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 이미지 전처리 모듈, 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력하는 택배사 및 데이터 분류 모듈, 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 인쇄체 및 필기체를 분류하는 인쇄체 및 필기체 분류 모듈 및 상기 분류된 인쇄체 및 필기체를 인식하는 인쇄체 및 필기체 인식 모듈을 포함한다.
Description
본 발명은 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템에 관한 것이다.
상거래가 고도로 발달한 현대 사회에서는 택배 시장이 매년 급증하고 있으며, 우리나라의 경우 택배 업체 한 곳에서는 하루 최대 140만 박스의 택배 화물을 배송하며, 명절 등 택배 수요가 몰리는 기간에는 약 500만 박스의 물량이 집중된다. 따라서, 택배 화물을 보다 빠르고 정확하게 분류하도록 하는 작업이 무엇보다 가장 필수적인 기술이라고 할 수 있다.
그러나, 종래의 택배 화물 인식 시스템의 경우, 택배 화물에 부착된 송장을 컨베이어 등을 통하여 움직인 후, 별도로 고용된 택배 분류원이 송장의 바코드를 인식하도록 수작업으로 분류하여 택배 화물을 일일이 분류하고 있었다.
이는 운송회사에 불필요한 인력을 과다하게 고용하게 되는 문제점을 낳게 되었으며, 수작업으로 일일이 바코드에 찍어 대는 방법으로 진행하였으므로 그 속도가 일정 이상 확보되지 못하는 단점이 존재하였다. 따라서, 컨베이어를 통하여 움직이는 택배 화물을 카메라를 통해 자동으로 인식하는 기술을 개발하는 필요성이 대두되고 있다.
종래의 시스템은 이미지, 주소DB 등을 이용하여 송장을 인식하지만 보편적인 방법이고 구체적인 인식방법은 제시되어 있지 않다. 따라서 시스템에 포함된 모듈의 동작에 대한 정의가 완료된 구체적인 송장 자동인식 시스템이 필요하다.
본 발명이 이루고자 하는 기술적 과제는 택배 이미지를 이용하여 송장에 작성된 정보를 자동인식 및 전산화 하기 위한 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템에 대한 세부 구조를 제공하는데 있다.
일 측면에 있어서, 본 발명에서 제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템은 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 이미지 전처리 모듈, 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력하는 택배사 및 데이터 분류 모듈, 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 인쇄체 및 필기체 분류 모듈 및 상기 분류된 인쇄체 및 필기체를 인식하는 인쇄체 및 필기체 인식 모듈을 포함한다.
상기 이미지 전처리 모듈은 택배 이미지를 입력 받아 송장 이미지를 추출하는 송장 인식 모델 및 상기 추출된 송장 이미지에 대하여 잡음을 제거하는 잡음 제거 모델을 포함한다.
상기 택배사 및 데이터 분류 모듈은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하는 택배사별 송장 분류 모델 및 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력하는 택배사별 송장 내용 추출 모델을 포함한다.
상기 택배사별 송장 내용 추출 모델은 상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력한다.
상기 인쇄체 및 필기체 분류 모듈은 상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류하고, 송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력한다.
또 다른 일 측면에 있어서, 본 발명에서 제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법은 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 단계, 택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력하는 단계, 인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 단계 및 인쇄체 및 필기체 인식 모듈이 상기 분류된 인쇄체 및 필기체를 인식하는 단계를 포함한다.
본 발명의 실시예들에 따른 택배 이미지를 이용한 정보입력 방법 및 시스템을 통해 송장에 작성된 정보를 자동인식 및 전산화하고, 본 발명에서 제안하는 시스템에 포함된 모듈의 동작에 따라 택배 이미지, 주소DB 등을 이용하여 송장을 자동 인식함으로써 택배 화물을 자동으로 분류할 수 있다.
도 1은 본 발명의 일 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템의 구성을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 이미지 전처리 모듈을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 택배사 및 데이터 분류 모듈을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 인쇄체 및 필기체 분류 모듈을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 이미지 전처리 모듈을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 택배사 및 데이터 분류 모듈을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 인쇄체 및 필기체 분류 모듈을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법을 설명하기 위한 흐름도이다.
이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템의 구성을 나타내는 도면이다.
제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템(100)은 이미지 전처리 모듈(110), 택배사 및 데이터 분류 모듈(120), 인쇄체 및 필기체 분류 모듈(130) 및 인쇄체 및 필기체 인식 모듈(140)을 포함한다.
본 발명의 실시예에 따른 이미지 전처리 모듈(110)은 택배 이미지(111)에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거한다.
본 발명의 실시예에 따른 이미지 전처리 모듈(110)은 송장 인식 모델 및 잡음 제거 모델을 포함한다.
본 발명의 실시예에 따른 송장 인식 모델은 택배 이미지를 입력 받아 송장 이미지를 추출한다.
본 발명의 실시예에 따른 잡음 제거 모델은 상기 추출된 송장 이미지에 대하여 잡음을 제거한다.
본 발명의 실시예에 따른 택배사 및 데이터 분류 모듈(120)은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력한다.
본 발명의 실시예에 따른 택배사 및 데이터 분류 모듈(120)은 택배사별 송장 분류 모델 및 택배사별 송장 내용 추출 모델을 포함한다.
본 발명의 실시예에 따른 택배사별 송장 분류 모델은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력한다.
본 발명의 실시예에 따른 택배사별 송장 내용 추출 모델은 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력한다.
본 발명의 실시예에 따른 택배사별 송장 내용 추출 모델은 상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(130)은 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(130)은 상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(130)은 송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 인식 모듈(140)은 상기 분류된 인쇄체 및 필기체를 인식(141)한다. 도 2 내지 도 4를 참조하여 본 발명의 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템의 각각의 구성에 관하여 더욱 상세하게 설명한다.
도 2는 본 발명의 일 실시예에 따른 이미지 전처리 모듈을 설명하기 위한 도면이다.
본 발명의 실시예에 따른 이미지 전처리 모듈(200)은 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거한다.
본 발명의 실시예에 따른 이미지 전처리 모듈(200)은 송장 인식 모델(210) 및 잡음 제거 모델(220)을 포함한다.
본 발명의 실시예에 따른 송장 인식 모델(210)은 택배 이미지를 입력 받아 송장 이미지를 추출한다. 예를 들어, 입력된 택배 이미지에서 송장 이미지 추출 및 아핀(affine) 변환을 통해 직사각형의 송장 이미지를 출력할 수 있다.
본 발명의 실시예에 따른 잡음 제거 모델(220)은 상기 추출된 송장 이미지에 대하여 잡음을 제거한다. 최종적으로 이미지 전처리 모듈(200)에서는 잡음이 제거된 선명한 송장 이미지를 출력할 수 있다.
도 3은 본 발명의 일 실시예에 따른 택배사 및 데이터 분류 모듈을 설명하기 위한 도면이다.
본 발명의 실시예에 따른 택배사 및 데이터 분류 모듈(300)은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력한다.
본 발명의 실시예에 따른 택배사 및 데이터 분류 모듈(300)은 택배사별 송장 분류 모델(310) 및 택배사별 송장 내용 추출 모델(320)을 포함한다.
본 발명의 실시예에 따른 택배사별 송장 분류 모델(310)은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력한다.
본 발명의 실시예에 따른 택배사별 송장 분류 모델(310)은 CNN(Convolutional Neural Network) 기반 이미지 분류 모델로 택배사 및 송장의 양식마다 다른 분류값을 출력할 수 있다. 예를 들어, 우체국택배 1번양식의 경우 분류값 0, 우체국택배 2번양식의 경우 분류값 1, ... XX택배사 4번양식의 경우 분류값 22 등으로 분류값을 매칭할 수 있다. 분류값과 송장 이미지는 택배사별 송장 내용 추출 모델에 입력되어 송장 내 이미지를 분할한다.
본 발명의 실시예에 따른 택배사별 송장 내용 추출 모델(320)은 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력한다.
본 발명의 실시예에 따른 택배사별 송장 내용 추출 모델(320)은 상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태(예를 들어, 라벨1-이미지)로 변환하여 출력한다.
도 4는 본 발명의 일 실시예에 따른 인쇄체 및 필기체 분류 모듈을 설명하기 위한 도면이다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(400)은 CNN 기반 인쇄체 및 필기체 분류 모델(410)을 이용하여 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(400)은 상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(400)은 송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태(예를 들어, 라벨1-라벨2-이미지)로 출력한다. 이는 제2 라벨에 따라 인쇄체 인식 모듈 또는 필기체 인식 모듈에 입력된다. 각 인식 모듈에서 출력된 데이터를 통해 최종적으로 송장정보를 인식한다.
도 5는 본 발명의 일 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법을 설명하기 위한 흐름도이다.
제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법은 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 단계(510), 택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력하는 단계(520), 인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 단계(530) 및 인쇄체 및 필기체 인식 모듈이 상기 분류된 송장정보의 인쇄체 및 필기체를 인식하는 단계(540)를 포함한다.
단계(510)에서, 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거한다.
본 발명의 실시예에 따르면, 송장 인식 모델을 통해 택배 이미지를 입력 받아 송장 이미지를 추출하고, 잡음 제거 모델을 통해 상기 추출된 송장 이미지에 대하여 잡음을 제거한다.
단계(520)에서, 택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력한다.
본 발명의 실시예에 따르면, 학습 기반 이미지 분류 모델인 택배사별 송장 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 택배사별 송장 내용 추출 모델을 통해 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력한다.
상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력한다.
단계(530)에서, 인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따르면, 상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류하고, 송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력한다.
단계(540)에서, 인쇄체 및 필기체 인식 모듈이 상기 분류된 송장정보의 인쇄체 및 필기체를 인식한다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
Claims (10)
- 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 이미지 전처리 모듈;
학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력하는 택배사 및 데이터 분류 모듈;
상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 인쇄체 및 필기체 분류 모듈; 및
상기 분류된 송장정보의 인쇄체 및 필기체를 인식하는 인쇄체 및 필기체 인식 모듈
을 포함하는 택배 이미지를 이용한 정보입력 시스템. - 제1항에 있어서,
상기 이미지 전처리 모듈은,
택배 이미지를 입력 받아 송장 이미지를 추출하는 송장 인식 모델; 및
상기 추출된 송장 이미지에 대하여 잡음을 제거하는 잡음 제거 모델
을 포함하는 택배 이미지를 이용한 정보입력 시스템. - 제1항에 있어서,
상기 택배사 및 데이터 분류 모듈은,
학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하는 택배사별 송장 분류 모델; 및
상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력하는 택배사별 송장 내용 추출 모델
을 포함하는 택배 이미지를 이용한 정보입력 시스템. - 제3항에 있어서,
상기 택배사별 송장 내용 추출 모델은,
상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력하는
택배 이미지를 이용한 정보입력 시스템. - 제1항에 있어서,
상기 인쇄체 및 필기체 분류 모듈은,
상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류하고,
송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력하는
택배 이미지를 이용한 정보입력 시스템. - 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 단계;
택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력하는 단계;
인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 단계; 및
인쇄체 및 필기체 인식 모듈이 상기 분류된 송장정보의 인쇄체 및 필기체를 인식하는 단계
를 포함하는 택배 이미지를 이용한 정보입력 방법. - 제6항에 있어서,
상기 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 단계는,
송장 인식 모델을 통해 택배 이미지를 입력 받아 송장 이미지를 추출하고,
잡음 제거 모델을 통해 상기 추출된 송장 이미지에 대하여 잡음을 제거하는
택배 이미지를 이용한 정보입력 방법. - 제6항에 있어서,
상기 택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력하는 단계는,
학습 기반 이미지 분류 모델인 택배사별 송장 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고,
택배사별 송장 내용 추출 모델을 통해 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력하는
택배 이미지를 이용한 정보입력 방법. - 제8항에 있어서,
상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력하는
택배 이미지를 이용한 정보입력 방법. - 제6항에 있어서,
상기 인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 단계는,
상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류하고,
송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력하는
택배 이미지를 이용한 정보입력 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220064130A KR20230164411A (ko) | 2022-05-25 | 2022-05-25 | 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220064130A KR20230164411A (ko) | 2022-05-25 | 2022-05-25 | 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230164411A true KR20230164411A (ko) | 2023-12-04 |
Family
ID=89165276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220064130A KR20230164411A (ko) | 2022-05-25 | 2022-05-25 | 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20230164411A (ko) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100992858B1 (ko) | 2008-12-30 | 2010-11-09 | 엔에이치엔(주) | Ocr 결과를 보정하기 위한 방법, 시스템 및 컴퓨터 판독가능한 기록 매체 |
KR101540994B1 (ko) | 2014-02-14 | 2015-08-03 | 박태일 | 수기식 송장의 정보입력시스템 및 그 입력방법 |
KR101615306B1 (ko) | 2015-08-10 | 2016-04-25 | (주)이씨에이시스템 | 운송장의 문자를 인식하여 배송지를 검출하는 운송장 문자인식시스템 |
-
2022
- 2022-05-25 KR KR1020220064130A patent/KR20230164411A/ko unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100992858B1 (ko) | 2008-12-30 | 2010-11-09 | 엔에이치엔(주) | Ocr 결과를 보정하기 위한 방법, 시스템 및 컴퓨터 판독가능한 기록 매체 |
KR101540994B1 (ko) | 2014-02-14 | 2015-08-03 | 박태일 | 수기식 송장의 정보입력시스템 및 그 입력방법 |
KR101615306B1 (ko) | 2015-08-10 | 2016-04-25 | (주)이씨에이시스템 | 운송장의 문자를 인식하여 배송지를 검출하는 운송장 문자인식시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11348353B2 (en) | Document spatial layout feature extraction to simplify template classification | |
US9626555B2 (en) | Content-based document image classification | |
US11113557B2 (en) | System and method for generating an electronic template corresponding to an image of an evidence | |
US10896357B1 (en) | Automatic key/value pair extraction from document images using deep learning | |
US11893765B2 (en) | Method and apparatus for recognizing imaged information-bearing medium, computer device and medium | |
CN112508011A (zh) | 一种基于神经网络的ocr识别方法及设备 | |
CN113963147A (zh) | 一种基于语义分割的关键信息提取方法及系统 | |
CN112949455A (zh) | 一种增值税发票识别系统及方法 | |
CN107403179B (zh) | 一种物品包装信息的注册方法及装置 | |
Fateh et al. | Enhancing optical character recognition: Efficient techniques for document layout analysis and text line detection | |
Karanje et al. | Survey on text detection, segmentation and recognition from a natural scene images | |
Adyanthaya | Text recognition from images: a study | |
KR20230164411A (ko) | 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템 | |
Das et al. | Hand-written and machine-printed text classification in architecture, engineering & construction documents | |
CN109919153A (zh) | 基于手写识别人工智能技术的自动单据录入系统及方法 | |
Ali et al. | UOCR: A ligature based approach for an Urdu OCR system | |
Janssen et al. | Receipts2go: the big world of small documents | |
US11928877B2 (en) | Systems and methods for automatic context-based annotation | |
Dhandra et al. | Kannada and English numeral recognition system | |
KR102627591B1 (ko) | 문서로부터 정보를 추출하기 위한 장치의 동작 방법 및 그 장치 | |
US11789990B1 (en) | Automated splitting of document packages and identification of relevant documents | |
Bouressace et al. | A convolutional neural network for Arabic document analysis | |
Bhalerao et al. | Frequently Used Devanagari Words in Marathi and Pali Language Documents | |
Iskandar | Manga Layout Analysis via Deep Learning | |
CN118053171A (zh) | 基于人工智能和大数据技术对多国邮快件面单识别的方法 |