KR20230164411A - 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템 - Google Patents

송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템 Download PDF

Info

Publication number
KR20230164411A
KR20230164411A KR1020220064130A KR20220064130A KR20230164411A KR 20230164411 A KR20230164411 A KR 20230164411A KR 1020220064130 A KR1020220064130 A KR 1020220064130A KR 20220064130 A KR20220064130 A KR 20220064130A KR 20230164411 A KR20230164411 A KR 20230164411A
Authority
KR
South Korea
Prior art keywords
invoice
image
divided
classification
printed
Prior art date
Application number
KR1020220064130A
Other languages
English (en)
Inventor
서동환
성주현
이수환
서홍일
배주원
신영재
정성범
신성인
Original Assignee
한국해양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국해양대학교 산학협력단 filed Critical 한국해양대학교 산학협력단
Priority to KR1020220064130A priority Critical patent/KR20230164411A/ko
Publication of KR20230164411A publication Critical patent/KR20230164411A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • G06Q10/0838Historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • G06Q10/0875Itemisation or classification of parts, supplies or services, e.g. bill of materials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/06Recognition of objects for industrial automation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템이 제시된다. 본 발명에서 제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템은 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 이미지 전처리 모듈, 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력하는 택배사 및 데이터 분류 모듈, 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 인쇄체 및 필기체를 분류하는 인쇄체 및 필기체 분류 모듈 및 상기 분류된 인쇄체 및 필기체를 인식하는 인쇄체 및 필기체 인식 모듈을 포함한다.

Description

송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템{Method and System for Information Input using Courier Image for Automatic Invoice Recognition and Computerization}
본 발명은 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템에 관한 것이다.
상거래가 고도로 발달한 현대 사회에서는 택배 시장이 매년 급증하고 있으며, 우리나라의 경우 택배 업체 한 곳에서는 하루 최대 140만 박스의 택배 화물을 배송하며, 명절 등 택배 수요가 몰리는 기간에는 약 500만 박스의 물량이 집중된다. 따라서, 택배 화물을 보다 빠르고 정확하게 분류하도록 하는 작업이 무엇보다 가장 필수적인 기술이라고 할 수 있다.
그러나, 종래의 택배 화물 인식 시스템의 경우, 택배 화물에 부착된 송장을 컨베이어 등을 통하여 움직인 후, 별도로 고용된 택배 분류원이 송장의 바코드를 인식하도록 수작업으로 분류하여 택배 화물을 일일이 분류하고 있었다.
이는 운송회사에 불필요한 인력을 과다하게 고용하게 되는 문제점을 낳게 되었으며, 수작업으로 일일이 바코드에 찍어 대는 방법으로 진행하였으므로 그 속도가 일정 이상 확보되지 못하는 단점이 존재하였다. 따라서, 컨베이어를 통하여 움직이는 택배 화물을 카메라를 통해 자동으로 인식하는 기술을 개발하는 필요성이 대두되고 있다.
종래의 시스템은 이미지, 주소DB 등을 이용하여 송장을 인식하지만 보편적인 방법이고 구체적인 인식방법은 제시되어 있지 않다. 따라서 시스템에 포함된 모듈의 동작에 대한 정의가 완료된 구체적인 송장 자동인식 시스템이 필요하다.
한국 등록특허 제10-0992858호 (2010.11.02) 한국 등록특허 제10-1540994호 (2015.07.27) 한국 등록특허 제10-1615306호 (2016.04.19)
본 발명이 이루고자 하는 기술적 과제는 택배 이미지를 이용하여 송장에 작성된 정보를 자동인식 및 전산화 하기 위한 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템에 대한 세부 구조를 제공하는데 있다.
일 측면에 있어서, 본 발명에서 제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템은 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 이미지 전처리 모듈, 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력하는 택배사 및 데이터 분류 모듈, 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 인쇄체 및 필기체 분류 모듈 및 상기 분류된 인쇄체 및 필기체를 인식하는 인쇄체 및 필기체 인식 모듈을 포함한다.
상기 이미지 전처리 모듈은 택배 이미지를 입력 받아 송장 이미지를 추출하는 송장 인식 모델 및 상기 추출된 송장 이미지에 대하여 잡음을 제거하는 잡음 제거 모델을 포함한다.
상기 택배사 및 데이터 분류 모듈은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하는 택배사별 송장 분류 모델 및 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력하는 택배사별 송장 내용 추출 모델을 포함한다.
상기 택배사별 송장 내용 추출 모델은 상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력한다.
상기 인쇄체 및 필기체 분류 모듈은 상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류하고, 송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력한다.
또 다른 일 측면에 있어서, 본 발명에서 제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법은 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 단계, 택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력하는 단계, 인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 단계 및 인쇄체 및 필기체 인식 모듈이 상기 분류된 인쇄체 및 필기체를 인식하는 단계를 포함한다.
본 발명의 실시예들에 따른 택배 이미지를 이용한 정보입력 방법 및 시스템을 통해 송장에 작성된 정보를 자동인식 및 전산화하고, 본 발명에서 제안하는 시스템에 포함된 모듈의 동작에 따라 택배 이미지, 주소DB 등을 이용하여 송장을 자동 인식함으로써 택배 화물을 자동으로 분류할 수 있다.
도 1은 본 발명의 일 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템의 구성을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 이미지 전처리 모듈을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 택배사 및 데이터 분류 모듈을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 인쇄체 및 필기체 분류 모듈을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법을 설명하기 위한 흐름도이다.
이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템의 구성을 나타내는 도면이다.
제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템(100)은 이미지 전처리 모듈(110), 택배사 및 데이터 분류 모듈(120), 인쇄체 및 필기체 분류 모듈(130) 및 인쇄체 및 필기체 인식 모듈(140)을 포함한다.
본 발명의 실시예에 따른 이미지 전처리 모듈(110)은 택배 이미지(111)에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거한다.
본 발명의 실시예에 따른 이미지 전처리 모듈(110)은 송장 인식 모델 및 잡음 제거 모델을 포함한다.
본 발명의 실시예에 따른 송장 인식 모델은 택배 이미지를 입력 받아 송장 이미지를 추출한다.
본 발명의 실시예에 따른 잡음 제거 모델은 상기 추출된 송장 이미지에 대하여 잡음을 제거한다.
본 발명의 실시예에 따른 택배사 및 데이터 분류 모듈(120)은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력한다.
본 발명의 실시예에 따른 택배사 및 데이터 분류 모듈(120)은 택배사별 송장 분류 모델 및 택배사별 송장 내용 추출 모델을 포함한다.
본 발명의 실시예에 따른 택배사별 송장 분류 모델은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력한다.
본 발명의 실시예에 따른 택배사별 송장 내용 추출 모델은 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력한다.
본 발명의 실시예에 따른 택배사별 송장 내용 추출 모델은 상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(130)은 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(130)은 상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(130)은 송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 인식 모듈(140)은 상기 분류된 인쇄체 및 필기체를 인식(141)한다. 도 2 내지 도 4를 참조하여 본 발명의 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 시스템의 각각의 구성에 관하여 더욱 상세하게 설명한다.
도 2는 본 발명의 일 실시예에 따른 이미지 전처리 모듈을 설명하기 위한 도면이다.
본 발명의 실시예에 따른 이미지 전처리 모듈(200)은 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거한다.
본 발명의 실시예에 따른 이미지 전처리 모듈(200)은 송장 인식 모델(210) 및 잡음 제거 모델(220)을 포함한다.
본 발명의 실시예에 따른 송장 인식 모델(210)은 택배 이미지를 입력 받아 송장 이미지를 추출한다. 예를 들어, 입력된 택배 이미지에서 송장 이미지 추출 및 아핀(affine) 변환을 통해 직사각형의 송장 이미지를 출력할 수 있다.
본 발명의 실시예에 따른 잡음 제거 모델(220)은 상기 추출된 송장 이미지에 대하여 잡음을 제거한다. 최종적으로 이미지 전처리 모듈(200)에서는 잡음이 제거된 선명한 송장 이미지를 출력할 수 있다.
도 3은 본 발명의 일 실시예에 따른 택배사 및 데이터 분류 모듈을 설명하기 위한 도면이다.
본 발명의 실시예에 따른 택배사 및 데이터 분류 모듈(300)은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력한다.
본 발명의 실시예에 따른 택배사 및 데이터 분류 모듈(300)은 택배사별 송장 분류 모델(310) 및 택배사별 송장 내용 추출 모델(320)을 포함한다.
본 발명의 실시예에 따른 택배사별 송장 분류 모델(310)은 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력한다.
본 발명의 실시예에 따른 택배사별 송장 분류 모델(310)은 CNN(Convolutional Neural Network) 기반 이미지 분류 모델로 택배사 및 송장의 양식마다 다른 분류값을 출력할 수 있다. 예를 들어, 우체국택배 1번양식의 경우 분류값 0, 우체국택배 2번양식의 경우 분류값 1, ... XX택배사 4번양식의 경우 분류값 22 등으로 분류값을 매칭할 수 있다. 분류값과 송장 이미지는 택배사별 송장 내용 추출 모델에 입력되어 송장 내 이미지를 분할한다.
본 발명의 실시예에 따른 택배사별 송장 내용 추출 모델(320)은 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력한다.
본 발명의 실시예에 따른 택배사별 송장 내용 추출 모델(320)은 상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태(예를 들어, 라벨1-이미지)로 변환하여 출력한다.
도 4는 본 발명의 일 실시예에 따른 인쇄체 및 필기체 분류 모듈을 설명하기 위한 도면이다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(400)은 CNN 기반 인쇄체 및 필기체 분류 모델(410)을 이용하여 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(400)은 상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따른 인쇄체 및 필기체 분류 모듈(400)은 송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태(예를 들어, 라벨1-라벨2-이미지)로 출력한다. 이는 제2 라벨에 따라 인쇄체 인식 모듈 또는 필기체 인식 모듈에 입력된다. 각 인식 모듈에서 출력된 데이터를 통해 최종적으로 송장정보를 인식한다.
도 5는 본 발명의 일 실시예에 따른 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법을 설명하기 위한 흐름도이다.
제안하는 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법은 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 단계(510), 택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력하는 단계(520), 인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 단계(530) 및 인쇄체 및 필기체 인식 모듈이 상기 분류된 송장정보의 인쇄체 및 필기체를 인식하는 단계(540)를 포함한다.
단계(510)에서, 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거한다.
본 발명의 실시예에 따르면, 송장 인식 모델을 통해 택배 이미지를 입력 받아 송장 이미지를 추출하고, 잡음 제거 모델을 통해 상기 추출된 송장 이미지에 대하여 잡음을 제거한다.
단계(520)에서, 택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력한다.
본 발명의 실시예에 따르면, 학습 기반 이미지 분류 모델인 택배사별 송장 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 택배사별 송장 내용 추출 모델을 통해 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력한다.
상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력한다.
단계(530)에서, 인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류한다.
본 발명의 실시예에 따르면, 상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류하고, 송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력한다.
단계(540)에서, 인쇄체 및 필기체 인식 모듈이 상기 분류된 송장정보의 인쇄체 및 필기체를 인식한다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다.  또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.  이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.  예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.  또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.  소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다.  소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (10)

  1. 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 이미지 전처리 모듈;
    학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하여 출력하는 택배사 및 데이터 분류 모듈;
    상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 인쇄체 및 필기체 분류 모듈; 및
    상기 분류된 송장정보의 인쇄체 및 필기체를 인식하는 인쇄체 및 필기체 인식 모듈
    을 포함하는 택배 이미지를 이용한 정보입력 시스템.
  2. 제1항에 있어서,
    상기 이미지 전처리 모듈은,
    택배 이미지를 입력 받아 송장 이미지를 추출하는 송장 인식 모델; 및
    상기 추출된 송장 이미지에 대하여 잡음을 제거하는 잡음 제거 모델
    을 포함하는 택배 이미지를 이용한 정보입력 시스템.
  3. 제1항에 있어서,
    상기 택배사 및 데이터 분류 모듈은,
    학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하는 택배사별 송장 분류 모델; 및
    상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력하는 택배사별 송장 내용 추출 모델
    을 포함하는 택배 이미지를 이용한 정보입력 시스템.
  4. 제3항에 있어서,
    상기 택배사별 송장 내용 추출 모델은,
    상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력하는
    택배 이미지를 이용한 정보입력 시스템.
  5. 제1항에 있어서,
    상기 인쇄체 및 필기체 분류 모듈은,
    상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류하고,
    송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력하는
    택배 이미지를 이용한 정보입력 시스템.
  6. 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 단계;
    택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력하는 단계;
    인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 단계; 및
    인쇄체 및 필기체 인식 모듈이 상기 분류된 송장정보의 인쇄체 및 필기체를 인식하는 단계
    를 포함하는 택배 이미지를 이용한 정보입력 방법.
  7. 제6항에 있어서,
    상기 이미지 전처리 모듈이 택배 이미지에서 송장 이미지를 추출하고, 추출된 송장 이미지의 잡음을 제거하는 단계는,
    송장 인식 모델을 통해 택배 이미지를 입력 받아 송장 이미지를 추출하고,
    잡음 제거 모델을 통해 상기 추출된 송장 이미지에 대하여 잡음을 제거하는
    택배 이미지를 이용한 정보입력 방법.
  8. 제6항에 있어서,
    상기 택배사 및 데이터 분류 모듈이 학습 기반 이미지 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고, 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 라벨과 결합된 형태로 출력하는 단계는,
    학습 기반 이미지 분류 모델인 택배사별 송장 분류 모델을 통해 상기 송장 이미지에 대하여 택배사 및 송장의 양식에 따라 상이한 분류값을 출력하고,
    택배사별 송장 내용 추출 모델을 통해 상기 출력된 분류값과 송장 이미지를 이용하여 송장 내 이미지를 분할하고, 분할된 송장 내 이미지 각각을 제1 라벨과 결합된 형태로 출력하는
    택배 이미지를 이용한 정보입력 방법.
  9. 제8항에 있어서,
    상기 각각의 제1 라벨이 보내는 이의 이름, 받는 이의 이름, 전화번호, 주소의 정보를 포함하고, 상기 분할된 송장 내 이미지와 매칭된 형태로 변환하여 출력하는
    택배 이미지를 이용한 정보입력 방법.
  10. 제6항에 있어서,
    상기 인쇄체 및 필기체 분류 모듈이 상기 분할된 송장 내 이미지를 입력 받아 상기 분할된 송장 내 이미지에 포함된 송장정보의 인쇄체 및 필기체를 분류하는 단계는,
    상기 분할된 송장 내 이미지와 결합된 제1 라벨을 입력 받아 송장 내 이미지에 포함된 송장정보의 텍스트의 인쇄체 및 필기체를 분류하고,
    송장 내 이미지에 포함된 텍스트가 인쇄체인지 또는 필기체인지를 나타내는 제2 라벨을 상기 분할된 송장 내 이미지 및 제1 라벨과 결합된 형태로 출력하는
    택배 이미지를 이용한 정보입력 방법.
KR1020220064130A 2022-05-25 2022-05-25 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템 KR20230164411A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220064130A KR20230164411A (ko) 2022-05-25 2022-05-25 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220064130A KR20230164411A (ko) 2022-05-25 2022-05-25 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20230164411A true KR20230164411A (ko) 2023-12-04

Family

ID=89165276

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220064130A KR20230164411A (ko) 2022-05-25 2022-05-25 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR20230164411A (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100992858B1 (ko) 2008-12-30 2010-11-09 엔에이치엔(주) Ocr 결과를 보정하기 위한 방법, 시스템 및 컴퓨터 판독가능한 기록 매체
KR101540994B1 (ko) 2014-02-14 2015-08-03 박태일 수기식 송장의 정보입력시스템 및 그 입력방법
KR101615306B1 (ko) 2015-08-10 2016-04-25 (주)이씨에이시스템 운송장의 문자를 인식하여 배송지를 검출하는 운송장 문자인식시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100992858B1 (ko) 2008-12-30 2010-11-09 엔에이치엔(주) Ocr 결과를 보정하기 위한 방법, 시스템 및 컴퓨터 판독가능한 기록 매체
KR101540994B1 (ko) 2014-02-14 2015-08-03 박태일 수기식 송장의 정보입력시스템 및 그 입력방법
KR101615306B1 (ko) 2015-08-10 2016-04-25 (주)이씨에이시스템 운송장의 문자를 인식하여 배송지를 검출하는 운송장 문자인식시스템

Similar Documents

Publication Publication Date Title
US11348353B2 (en) Document spatial layout feature extraction to simplify template classification
US9626555B2 (en) Content-based document image classification
US11113557B2 (en) System and method for generating an electronic template corresponding to an image of an evidence
US10896357B1 (en) Automatic key/value pair extraction from document images using deep learning
US11893765B2 (en) Method and apparatus for recognizing imaged information-bearing medium, computer device and medium
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
CN113963147A (zh) 一种基于语义分割的关键信息提取方法及系统
CN112949455A (zh) 一种增值税发票识别系统及方法
CN107403179B (zh) 一种物品包装信息的注册方法及装置
Fateh et al. Enhancing optical character recognition: Efficient techniques for document layout analysis and text line detection
Karanje et al. Survey on text detection, segmentation and recognition from a natural scene images
Adyanthaya Text recognition from images: a study
KR20230164411A (ko) 송장 자동인식 및 전산화를 위한 택배 이미지를 이용한 정보입력 방법 및 시스템
Das et al. Hand-written and machine-printed text classification in architecture, engineering & construction documents
CN109919153A (zh) 基于手写识别人工智能技术的自动单据录入系统及方法
Ali et al. UOCR: A ligature based approach for an Urdu OCR system
Janssen et al. Receipts2go: the big world of small documents
US11928877B2 (en) Systems and methods for automatic context-based annotation
Dhandra et al. Kannada and English numeral recognition system
KR102627591B1 (ko) 문서로부터 정보를 추출하기 위한 장치의 동작 방법 및 그 장치
US11789990B1 (en) Automated splitting of document packages and identification of relevant documents
Bouressace et al. A convolutional neural network for Arabic document analysis
Bhalerao et al. Frequently Used Devanagari Words in Marathi and Pali Language Documents
Iskandar Manga Layout Analysis via Deep Learning
CN118053171A (zh) 基于人工智能和大数据技术对多国邮快件面单识别的方法