KR20110103264A - 영수증 판독을 통한 자동 정보 수집 시스템 및 방법 - Google Patents

영수증 판독을 통한 자동 정보 수집 시스템 및 방법 Download PDF

Info

Publication number
KR20110103264A
KR20110103264A KR1020100022504A KR20100022504A KR20110103264A KR 20110103264 A KR20110103264 A KR 20110103264A KR 1020100022504 A KR1020100022504 A KR 1020100022504A KR 20100022504 A KR20100022504 A KR 20100022504A KR 20110103264 A KR20110103264 A KR 20110103264A
Authority
KR
South Korea
Prior art keywords
receipt
information
item
area
server
Prior art date
Application number
KR1020100022504A
Other languages
English (en)
Other versions
KR101139801B1 (ko
Inventor
김민숙
이진걸
Original Assignee
에스케이마케팅앤컴퍼니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이마케팅앤컴퍼니 주식회사 filed Critical 에스케이마케팅앤컴퍼니 주식회사
Priority to KR1020100022504A priority Critical patent/KR101139801B1/ko
Publication of KR20110103264A publication Critical patent/KR20110103264A/ko
Application granted granted Critical
Publication of KR101139801B1 publication Critical patent/KR101139801B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/20Point-of-sale [POS] network systems
    • G06Q20/209Specified transaction journal output feature, e.g. printed receipt or voice output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/434Query formulation using image data, e.g. images, photos, pictures taken by a user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • G06V30/2247Characters composed of bars, e.g. CMC-7

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 영수증 판독을 통한 자동 정보 수집 시스템 및 방법에 관한 것으로, 더욱 상세하게는 영수증에 인쇄된 구매 물품, 구매 수량, 사용 금액 등을 광학 문자 판독기(OCR) 등을 통해 판독하여 저장함으로써 해당 영수증의 사용자의 구매 정보를 자동으로 수집, 관리하도록 하여 활용도 높은 고객 관리 정보를 창출하며, 영수증 이미지 정보의 판독시 다양한 영수증 종류에 관계없이 필요정보를 정확하게 인식하는 구성을 제공함으로써 영수증 판독 효율을 높일 수 있어 데이터베이스의 정확성을 향상시키고, 영수증에 인쇄된 문자바코드정보를 활용하여 인식한 구매 물품 정보를 대표화 함으로써 입력 효율을 향상시켜 판독 에러율을 감소시키며 데이터베이스 입력 속도를 높이며, 영수증에 부착된 개인별 식별수단을 판독하여 해당 영수증의 구매 물품 정보를 개인별 식별수단 정보와 연계하여 저장함으로써 개인별 구매 이력 정보를 생성하도록 하여 고객 관리 시스템 등에 활용할 수 있고, 판독한 영수증 정보 데이터베이스를 이용한 각종 통계정보를 제공함으로써 리서치 조사를 대체하는 수단으로 활용 가능하여 조사 원가를 절감하며, 영수증을 제공한 개인에게 경품이나 포인트를 제공함으로써 개인의 활발한 참여를 유도하여 데이터베이스의 품질을 높이는 효과가 있다.

Description

영수증 판독을 통한 자동 정보 수집 시스템 및 방법{AUTOMATIC DATA GATHERING SYSTEM USING BY READING RECEIPT AND METHOD THEREOF}
본 발명은 영수증 판독을 통한 자동 정보 수집 시스템 및 방법에 관한 것으로, 특히 광학 문자 판독기(OCR) 등을 통해 영수증에 인쇄된 구매 물품, 구매 수량, 사용 금액 등을 인식하여 해당 영수증의 사용자의 구매 정보 및 영수증 통계 정보를 자동으로 수집하는 자동 정보 수집 시스템 및 방법에 관한 것이다.
다양한 개인의 취향을 파악하여 마케팅 자료나 정책 자료로 활용하기 위하여 개인이나 가족 단위의 소비 정보를 취합, 가공하여 의미 있는 정보를 얻는 구매 동향 정보 수집의 수단으로서, 피설문자가 리서치 회사에서 배포한 설문지에 각 개인별 구매활동을 수기로 작성한 후 해당 회사에서 이를 취합하여 수작업으로 데이터베이스화하는 방법이 있다. 그러나, 이러한 구매 동향 정보 수집의 방법은 설문 집단의 크기가 커지면 그에 따른 비용이 증가하며, 데이터베이스화하기 위한 노동력 및 시간이 증가하는 문제점이 있다.
또한, 이를 개선한 구매 동향 정보 수집의 방법으로 피설문자가 인터넷을 통해 온라인 설문 사이트에 접속한 후, 해당 사이트의 온라인 설문지에 직접 자신의 구매 이력을 작성하여 이를 데이터베이스화하는 방법도 있다. 그러나, 이와 같은 방법은 데이터베이스화하기 위한 노동력 및 시간은 절감되나, 피설문자가 직접 자신의 구매 이력을 작성해야 하는 번거로움 때문에 그 작성에 대한 대가가 충분히 제공되지 않는 이상 성실한 답변을 기대하기 어려운 점이 있다. 따라서, 이러한 개인 구매 정보 수집 방법도 개인 구매 이력 중 일부 한정된 정보만 수집 가능한 것이 현실이며 또한 입력 데이터의 신뢰성도 보장하기 어려운 측면이 있다.
현재 대부분의 마트 또는 편의점에서는 사람들이 물품을 구매할 때, 물품의 계산이 완료된 후 계산원이 매장의 계산대에 설치된 포스(POS:Point Of Sales)단말장치를 이용하여 도 1에 도시한 바와 같은 종류의 영수증을 출력하여 구매자에게 건네주는 것으로 해당 물품의 구매 사실을 증명하게 된다.
이러한 영수증은 구매자의 물품 구매정보(3) 및 포인트 정보(2) 등 다양한 정보를 표시하고 있으므로, 구매자들로부터 영수증들을 지속적으로 취합하여 정보화한 후 이를 데이터베이스화하면 구매자들에 대한 타겟팅(Targeting) 광고 혹은 고객관리시스템 등의 다양한 시스템에 이러한 영수증 데이터베이스를 활용할 수 있을 것이다.
그러나, 전자 정보 형태가 아닌 인쇄된 형태의 영수증들을 취합하여 정보화하기에는 몇 가지 문제점이 존재한다. 우선, 인쇄된 영수증들을 취합한 후 수기로 입력하는 방식을 이용하여 데이터베이스화하는 것은 입력 비용 단가에 따른 원가 부담이 너무 크기 때문에 수기 입력 방식을 이용하는 것은 어려운 측면이 있다. 따라서, 수기 입력 방식이 아닌 스캐너 등을 이용하여 광학 문자 판독기(OCR:Optical Character Reader) 등을 이용하여 인쇄 문자를 이미지 정보화한 후 이를 문자 정보로 인식하여 데이터베이스화하는 방식을 이용하여야 한다.
그러나, 영수증을 스캔하여 이미지를 문자로 인식하는 방식을 이용한다 하더라도 마트, 편의점, 백화점 등에서 발행하는 영수증의 형태가 대단히 다양하고 출력 품질 또한 가변적이어서 그 인식률이 극히 낮아 실용성이 없다. 즉, 매장에 따른 영수증 종류에 따라 물품 영수 내용의 위치가 각각 상이하며(2), 이미지가 삽입된 로고가 존재하거나(1), 폰트의 크기가 다르거나(4), 글자인쇄 상태가 고르지 못하거나, 복합폰트가 섞여 있다던지 하는 이유로 인해 문자인식률이 극히 낮아 광학 인식의 어려움이 존재한다. 또한, 판매처마다 상품명 등 영수증에 쓰이는 항목별 명칭이 상이할 뿐 아니라, 그 위치나 배치가 각각 다르므로 단순한 인식 방법을 이용한 광학 문자 판독의 방법은 사용하기 어렵다. 더불어, 상기 인쇄된 영수증의 경우 개인을 식별하기 어려우므로 해당 영수증들을 취합하여 정보화하더라도 개인별 구분을 위한 별도의 노력이 필요하게 된다.
따라서, 인쇄된 영수증을 이용하여 데이터베이스를 생성하는 정보 수집 시스템을 구축하는데 있어서, 영수증을 스캐닝한 이미지 정보를 새로운 판독 방법을 이용하여 인식함으로써 다양한 종류의 영수증을 인식 가능하도록 하며, 인식된 영수증 정보를 개인정보화한 데이터베이스로 관리하여 다양한 곳에 활용할 수 있도록 하고 이와 같은 프로세스를 자동화하여 구매 동향 정보 수집의 원가를 절감시키는 영수증 판독을 통한 정보 수집 시스템 및 방법이 요구된다.
전술한 문제점을 개선하기 위한 본 발명 실시 예들의 목적은 영수증에 인쇄된 구매 물품, 구매 수량, 사용 금액 등을 광학 문자 판독기(OCR) 등을 통해 판독하여 저장함으로써 해당 영수증의 사용자의 구매 정보를 자동으로 수집, 관리하도록 한 영수증 판독을 통한 자동 정보 수집 시스템 및 방법을 제공하는 것이다.
본 발명 실시 예들의 다른 목적은 영수증 이미지 정보의 판독시 다양한 영수증 종류에 관계없이 필요정보를 정확하게 인식하는 구성을 제공함으로써 영수증 판독 효율을 높일 수 있는 영수증 판독을 통한 자동 정보 수집 시스템 및 방법을 제공하는 것이다.
본 발명 실시 예들의 또 다른 목적은 영수증에 인쇄된 문자바코드정보를 활용하여 인식한 구매 물품 정보를 대표화 함으로써 입력 효율을 향상시킨 영수증 판독을 통한 자동 정보 수집 시스템 및 방법을 제공하는 것이다.
본 발명 실시 예들의 또 다른 목적은 영수증에 부착된 개인별 식별수단을 판독하여 해당 영수증의 구매 물품 정보를 개인별 식별수단 정보와 연계하여 저장함으로써 개인별 구매 이력 정보를 생성하도록 한 영수증 판독을 통한 자동 정보 수집 시스템 및 방법을 제공하는 것이다.
본 발명 실시 예들의 또 다른 목적은 판독한 영수증 정보 데이터베이스를 이용한 각종 통계정보를 제공함으로써 리서치 조사를 대체하는 수단으로 활용 가능한 영수증 판독을 통한 자동 정보 수집 시스템 및 방법을 제공하는 것이다.
본 발명 실시 예들의 또 다른 목적은 영수증을 제공한 개인에게 경품이나 포인트를 제공함으로써 개인의 활발한 참여를 유도하는 영수증 판독을 통한 자동 정보 수집 시스템 및 방법을 제공하는 것이다.
상기한 목적을 달성하기 위하여 본 발명의 실시 예에 따른 영수증 판독을 통한 자동 정보 수집 시스템은 실물 영수증을 스캐닝하여 변환된 영수증 이미지 정보의 금액 열 영역을 우선 인식한 후, 이를 기준으로 각 데이터별 영역을 인식하여 문자 정보로 변환하며, 이후 기 설정된 분류 규칙에 따라 각 영역의 상기 문자 정보를 소정의 항목으로 분류하는 인식분류 서버, 상기 분류된 항목 중 상품 식별 코드인 문자바코드정보 항목을 이용하여 해당 상품 관련 항목을 검증하는 검증 서버, 상기 검증된 영수증의 항목을 영수증 데이터베이스에 저장하는 영수증 데이터베이스 서버를 포함한다.
상기 검증 서버는 상기 항목의 검증시 수정된 항목 정보를 상기 문자바코드정보를 기준으로 갱신하여, 이후 검증시 이전 검증 작업에서 갱신된 항목 정보를 재이용하는 것을 특징으로 한다.
상기 인식분류 서버는 상기 영수증 이미지 정보의 최 우측을 기준으로 0으로 시작되는 영역이 포함된 열을 금액 열 영역으로 우선 인식하는 것을 특징으로 한다.
상기 인식분류 서버는 상기 우선 인식한 금액 열 영역을 기준으로 행 방향 인식을 병행하여 수량 영역, 단가 영역, 상품명 영역 중 적어도 하나 이상의 영역을 인식하거나, 각 데이터별 영역에서 상기 문자 정보의 코드 종류, 위치, 숫자 유무, 조합 패턴 중 적어도 하나 이상을 이용한 분류 규칙을 이용하여 항목을 분류하거나, 상기 금액 열 영역에서 각각의 숫자를 인식하여 금액 항목으로 분류하는 것을 특징으로 한다.
또한, 상기 인식분류 서버는 상기 분류한 금액 항목의 좌측 영역으로 행 방향 이동한 부분의 일 단위 또는 십 단위 자릿수를 인식하여 상기 금액의 수량 항목으로 분류하며, 상기 분류한 수량 항목의 좌측 영역으로 행 방향 이동한 부분의 금액을 인식하여 단가 항목으로 분류하고, 상기 분류한 단가 항목의 좌측 영역에서 한글, 영문, 숫자 중 적어도 하나 이상으로 구성된 1 바이트 또는 2 바이트 코드의 조합을 인식하여 상품명 항목으로 분류하며, 상기 분류한 단가 항목의 좌측 영역에서 숫자로만 조합된 1 바이트 코드의 조합을 인식하여 문자바코드정보 항목으로 분류한다.
상기 인식분류 서버는 상기 영수증의 전체 영역에서 3자리와 2자리 및 5자리의 1 바이트 숫자를 포함한 코드 조합을 인식하여 사업자 번호 항목으로 분류할 수 있다.
본 발명에 따른 영수증 판독을 통한 자동 정보 수집 시스템은 상기 인식분류 서버가 상기 영수증 이미지 정보에 포함된 판매점 바코드 정보를 이용하여 판매점 식별 정보를 인식하고, 상기 영수증 데이터베이스 서버가 검증된 영수증의 항목을 상기 인식된 판매점 식별 정보별로 영수증 데이터베이스에 저장하는 것을 특징으로 하거나, 상기 인식분류 서버가 상기 실물 영수증의 일면에 개인별 고유 식별 수단이 부착된 경우 이를 스캐닝하여 변환한 개인별 고유 식별 이미지 정보에서 개인 식별 정보를 인식하고, 상기 영수증 데이터베이스 서버는 상기 검증된 영수증의 항목을 상기 인식된 개인 식별 정보별로 저장하는 것을 특징으로 할 수 있다.
또한, 상기한 목적을 달성하기 위하여 본 발명의 실시 예에 따른 영수증 판독을 통한 자동 정보 수집 방법은 인식분류 서버가 실물 영수증을 스캐닝하여 변환된 영수증 이미지 정보의 금액 열 영역을 우선 인식한 후, 이를 기준으로 각 데이터별 영역을 인식하여 문자 정보로 변환하며, 이후 기 설정된 분류 규칙에 따라 각 영역의 상기 문자 정보를 소정의 항목으로 분류하는 단계, 검증 서버가 상기 분류된 항목 중 상품 식별 코드인 문자바코드정보 항목을 이용하여 해당 상품 관련 항목을 검증하는 단계, 영수증 데이터베이스 서버가 상기 검증된 영수증의 항목을 영수증 데이터베이스에 저장하는 단계를 포함한다.
본 발명 실시 예들에 따른 영수증 판독을 통한 자동 정보 수집 시스템 및 방법은 영수증에 인쇄된 구매 물품, 구매 수량, 사용 금액 등을 광학 문자 판독기(OCR) 등을 통해 판독하여 저장함으로써 해당 영수증의 사용자의 구매 정보를 자동으로 수집, 관리하도록 하여 활용도 높은 고객 관리 정보를 창출하는 효과가 있다.
본 발명 실시 예들에 따른 영수증 판독을 통한 자동 정보 수집 시스템 및 방법은 영수증 이미지 정보의 판독시 다양한 영수증 종류에 관계없이 필요정보를 정확하게 인식하는 구성을 제공함으로써 영수증 판독 효율을 높일 수 있어 데이터베이스의 정확성을 향상시키는 효과가 있다.
본 발명 실시 예들에 따른 영수증 판독을 통한 자동 정보 수집 시스템 및 방법은 영수증에 인쇄된 문자바코드정보를 활용하여 인식한 구매 물품 정보를 대표화 함으로써 입력 효율을 향상시켜 판독 에러율을 감소시키며 데이터베이스 입력 속도를 높이는 효과가 있다.
본 발명 실시 예들에 따른 영수증 판독을 통한 자동 정보 수집 시스템 및 방법은 영수증에 부착된 개인별 식별수단을 판독하여 해당 영수증의 구매 물품 정보를 개인별 식별수단 정보와 연계하여 저장함으로써 개인별 구매 이력 정보를 생성하도록 하여 고객 관리 시스템 등에 활용할 수 있는 효과가 있다.
본 발명 실시 예들에 따른 영수증 판독을 통한 자동 정보 수집 시스템 및 방법은 판독한 영수증 정보 데이터베이스를 이용한 각종 통계정보를 제공함으로써 리서치 조사를 대체하는 수단으로 활용 가능하여 조사 원가를 절감하는 효과가 있다.
본 발명 실시 예들에 따른 영수증 판독을 통한 자동 정보 수집 시스템 및 방법은 영수증을 제공한 개인에게 경품이나 포인트를 제공함으로써 개인의 활발한 참여를 유도하여 데이터베이스의 품질을 높이는 효과가 있다.
도 1은 일반적인 영수증의 일 예.
도 2는 본 발명의 실시 예에 따른 영수증 판독을 통한 자동 정보 수집 시스템의 구성도.
도 3은 일반적인 판독 방법을 통한 영수증 인식 방법의 예시도.
도 4는 본 발명의 실시 예에 따른 영수증 판독 방법을 통한 영수증 인식 방법의 예시도.
도 5는 본 발명의 실시 예에 따른 영수증 판독 방법 중 영역 분석 정책을 설명한 예시도.
도 6은 본 발명의 실시 예에 따른 영수증 판독 방법의 정확성을 비교한 그래프.
도 7은 본 발명의 실시 예에 따른 영수증 데이터 검증 프로그램의 화면 예시도.
도 8은 본 발명의 실시 예에 따른 개인별 식별 수단이 부착된 영수증 후면의 예시도.
도 9는 본 발명의 실시 예에 따른 검증 데이터베이스를 활용한 영수증 판독 방법의 속도를 비교한 그래프.
도 10은 본 발명의 실시 예에 따른 자동 정보 수집 방법의 순서도.
도 11은 본 발명의 실시 예에 따른 인식분류단계의 순서도.
도 12는 본 발명의 실시 예에 따른 검증단계의 순서도.
상기한 바와 같은 본 발명을 첨부된 도면들과 실시 예들을 통해 상세히 설명하도록 한다.
도 2는 본 발명의 실시 예에 따른 영수증 판독을 통한 자동 정보 수집 시스템의 구성도로서, 상기 영수증 판독을 통한 자동 정보 수집 시스템은 취합한 다양한 종류의 영수증을 스캐닝(Scanning)하여 이미지 정보로 변환하는 스캔 서버(220), 상기 이미지 정보를 판독하여 문자 정보로 변환하는 인식분류 서버(230), 상기 변환된 문자 정보를 기 설정된 규칙에 따라 검증하고 오류 데이터를 수정하는 검증 서버(240), 상기 검증 완료된 문자 정보를 데이터베이스화하여 저장하는 저장 서버(250)를 포함한다.
이때, 상기 인식분류 서버(230)는 실물 영수증을 스캐닝하여 변환된 영수증 이미지 정보의 금액 열 영역을 우선 인식한 후, 이를 기준으로 각 데이터별 영역을 인식하여 문자 정보로 변환하며, 이후 기 설정된 분류 규칙에 따라 각 영역의 상기 문자 정보를 소정의 항목으로 분류하고, 상기 검증 서버(240)는 상기 분류된 항목 중 상품 식별 코드인 문자바코드정보 항목을 이용하여 해당 상품 관련 항목을 검증하며, 상기 저장 서버(250)는 상기 검증된 영수증의 항목을 영수증 데이터베이스에 저장하는 것을 특징으로 한다.
상기 스캔 서버(220)는 마트, 편의점, 백화점 등 다양한 곳에서 발행되는 프린트된 형태의 영수증(210)을 취합한 후, 이를 스캐닝하여 이미지 정보로 변환한 후 저장한다. 이때, 작업의 편의를 위하여 영수증 크기에 따른 분류 작업이 선행될 수 있으며, 관리의 편의를 위해 영수증을 스캔하여 생성한 이미지 파일을 해당 영수증을 입수한 날짜 또는 입수 장소에 따라 분류하여 저장할 수 있다.
또한, 영수증의 입수 전 해당 영수증에 영수증 사용자를 식별할 수 있는 개인 식별 수단의 부착을 유도한 후, 개인 식별 수단이 부착된 형태의 영수증을 입수하여, 스캔 서버에서 스캐닝시 영수증에 부착된 개인별 식별수단을 판독하여 해당 영수증의 구매 물품 정보과 연계하여 저장함으로써 개인별 구매 이력 정보를 생성하도록 하여 고객 관리 시스템 등에 활용하도록 한다. 이와 관련하여, 도 8에서 보다 자세히 설명하기로 한다.
상기 인식분류 서버(230)는 상기 스캔 서버(220)에 저장된 이미지 정보를 판독하여 문자 정보로 변환(231)하는데, 상기 문자 정보로 변환하는 작업은 이미지 정보를 판독하여 문자 정보로 인식하는 작업 및 인식된 문자 정보 영역의 분석 작업으로 구분할 수 있다.
상기 문자 정보 인식 작업은 다양한 영수증의 종류가 존재하기 때문에 일반적인 문자 판독 방법인 가로 방향으로 인식하는 방법을 사용할 경우 인식률이 극히 저조하므로, 이미지 정보 중 금액 열을 찾아내어 가로 방향이 아닌 세로 방향으로 해당 열을 우선 인식한 후 이를 기준으로 다른 영역을 인식하는 방법을 사용한다. 이와 같은 방법을 사용하면 영수증 이미지 정보의 판독시 다양한 영수증 종류에 관계없이 인식할 수 있어 영수증 판독 효율을 높일 수 있다. 상기 문자 정보 인식 작업은 도 3 내지 도 4에서 자세히 설명하기로 한다.
상기 영역 분석 작업은 상기 문자 정보 인식 작업에서 인식한 문자 정보의 각 영역에 따른 특징 및 패턴을 분석하여 해당 영역의 데이터 유형을 판독하여 분류한다. 이때, 해당 문자 정보의 종류(바이트 수), 위치, 숫자 유무, 조합 패턴 등을 이용한 규칙을 판독, 분류의 기준으로 사용한다. 상기 영역 분석 작업의 분류 기준 설정 방법 및 규칙에 대한 자세한 설명은 도 5 내지 도 6에서 하기로 한다.
이처럼, 상기 인식분류 서버(230)는 영수증에 인쇄된 구매 물품, 구매 수량, 사용 금액 등을 판독하여 저장하고, 이러한 데이터를 검증 서버에서 검증한 후 데이터베이스화하여 이를 활용할 수 있다.
상기 검증 서버(240)는 상기 인식분류 서버(230)에서 특정 항목으로 분류된 문자 정보를 기 설정된 규칙에 따라 검증(242)하고 수정한다. 인쇄된 영수증에는 상품의 식별을 위해 상품명뿐만 아니라, 해당 상품명과 대응되는 고유의 숫자 조합으로 구성된 문자바코드정보가 상품명과 함께 표시된다. 상기 검증 서버(240)는 상기 인식분류 서버(230)에서 분류된 문자 정보 항목 중 이러한 문자바코드정보를 이용하여 스캔한 이미지 정보와 분류된 문자 정보 항목을 비교, 검증하는 것을 특징으로 한다. 또한, 각 물품 금액을 합산하여 합계 금액과 비교 검증하는 체크 디지트 검증 방식을 이용할 수 있으며, 합계 오류 또는 인식 오류 시 검증자의 검증 화면의 항목 색깔을 변경시켜 주의를 환기시킬 수 있다.
상기 검증 서버(240)는 상기 검증 과정으로 인해 확인되고 수정되는 상품 코드, 상품명과 같은 데이터를 검증 데이터베이스(241)로 저장하고, 이후 검증 작업(242)시 상기 검증 데이터베이스(241)의 수정된 데이터를 활용하여 각 항목을 검증하도록 하여 항목 인식 에러율을 낮추고 검증 속도를 크게 단축할 수 있다. 이처럼, 상기 검증 서버(240)는 영수증에 인쇄된 문자바코드정보를 활용하여 인식한 구매 물품 데이터를 검증함으로써 데이터 인식률을 향상시켜 판독 에러율을 감소시키며 데이터베이스 입력 속도를 높일 수 있다. 상기 검증 서버(240)의 검증 규칙 및 방법은 도 7에서 자세히 설명한다.
상기 저장 서버(250)는 인식, 분류, 검증을 거친 영수증 문자 정보를 영수증 데이터베이스(251)화하여 저장하고 외부 요청시 요청한 데이터를 전송한다. 상기 영수증 데이터베이스(251)는 허가된 사용자가 자료조회의 목적으로 활용하거나, 또는 마케팅 관리 시스템이나 고객 관리 시스템에서 특정한 목적으로 활용될 수 있다. 또한, 상기 영수증 데이터베이스(251)의 품질을 높이기 위해 영수증을 제공한 개인에게 경품이나 포인트를 제공하는 것으로 개인의 활발한 참여를 유도할 수 있으며, 판독한 영수증 정보 데이터베이스를 이용한 각종 통계정보를 제공하여 리서치 조사를 대체하는 수단으로 활용 가능하므로 조사 원가를 절감할 수 있다. 부가적으로, 개인별 영수증 데이터베이스의 구축뿐만 아니라 해당 영수증에 표시되는 바코드 정보를 이용하여 각 판매처별 통계정보를 구축할 수도 있다.
도 3 내지 도 4를 통해 상기 인식분류 서버의 문자 정보 인식 작업을 설명한다. 도 3은 일반적인 판독 방법을 통한 영수증 인식 방법의 예고, 도 4는 본 발명의 실시 예에 따른 영수증 판독 방법을 통한 영수증 인식 방법의 예이다.
일반적인 문서 판독 방법은 도 3에 도시한 바와 같이 이미지 정보에서 가로 방향(32)으로 인식 방향을 설정하여 문자 정보 인식 작업을 진행한다. 그러나, 도 3의 두 가지 종류의 영수증 형태에서 보는 바와 같이 각각의 영수증에 이미지가 삽입되거나 로고 위치가 다르거나(31), 같은 위치의 폰트 크기가 다르거나(33), 같은 위치에 다른 항목이 배열(32, 33)되는 등 각 단락의 배열이 영수증마다 상이하다. 따라서, 일반적인 문서 판독 방법을 이용하여 영수증을 인식하면 각각의 판매처에서의 영수증 형태가 상이한 이유로 인해 인식률이 극히 저조할 수밖에 없다.
도 4는 본 발명의 실시 예에 따른 영수증 판독 방법을 통한 영수증 인식 방법의 예로서, 인식분류 서버는 이미지 정보 중 금액 열(41)을 찾아내어 가로 방향이 아닌 세로 방향으로 해당 열을 우선 인식한 후 이를 기준으로 다른 영역을 인식하는 방법을 사용한다. 이때, 상기 인식분류 서버는 영수증 이미지 정보의 최 우측에서 0으로 시작되는 영역 또는 숫자로 시작되는 영역을 추적하여 금액 열 영역(41)으로 인식한다. 이후, 상기 우선 인식한 금액 열 영역(41)을 기준으로 행 방향 인식(42, 43, 44)을 병행하여 각각 수량, 단가, 상품명 등의 영역을 인식한다. 또한, 해당 금액 열 중 마이너스(45) 표시된 금액은 할인 금액으로 인식하고, 각 금액의 합산과 같은 금액은 합계정보로 인식하는 인식규칙을 부가할 수 있다. 더불어, 전면 하단부에 위치한 판매점 바코드 정보(46)를 이용하여 해당 판매점 정보를 식별하고 해당 영수증 정보를 이와 연계하여 저장하여 추후 판매점별 영수증 정보로써 활용할 수도 있다.
이처럼, 상기 인식분류 서버는 금액 열을 우선 인식 후 이를 기준으로 타 영역의 행 방향 인식을 병행함으로써 영수증 이미지 정보의 판독시 영수증의 크기 및 배치와 관계없이 인식할 수 있다. 이로 인해, 영수증 종류와 상관없이 영수증 판독 효율을 높일 수 있어 영수증 데이터베이스의 정확성을 크게 향상시킬 수 있다.
도 5는 본 발명의 실시 예에 따른 영수증 판독 방법 중 영역 분석 정책을 설명한 예시도로서, 상기 문자 정보 인식 작업에서 파악된 각 영역의 데이터 유형을 판독하여 분류한다. 이때, 데이터의 특성에 따른 바이트 수, 위치, 숫자 유무, 조합 패턴 등을 이용한 규칙을 해당 영역 데이터의 판독, 분류의 기준으로 사용한다.
영수증 상단 영역에서 3자리, 2자리, 5자리의 조합으로 이루어진 1 바이트 숫자 조합은 사업자 번호 항목(51)으로 분류한다. 또한, 상기 상단 영역에서 네 자릿수 년도, 두 자릿수 월간, 두 자릿수 일자의 1 바이트 숫자 조합을 구매일 항목(52)으로 분류하며, 가장 우측에서 0 또는 숫자로 시작되는 영역인 금액 열 영역에서 각각의 숫자를 인식하여 금액(53) 항목으로 분류한다. 또한, 분류한 금액 항목(53)의 좌측 영역으로 행 방향 이동한 부분의 일 단위 또는 십 단위 자릿수를 상기 금액의 수량(54) 항목으로 분류한다. 상기 수량(54)의 좌측 영역으로 행 방향 이동한 부분의 금액을 단가(55) 항목으로 분류한다. 이때, 상기 단가는 금액의 배수인 숫자를 인식하도록 분류 규칙을 설정할 수 있다. 상기 단가의 좌측 영역에서 한글, 영문, 숫자가 혼합된 1 바이트, 2 바이트 코드 조합을 상품명 항목(57)으로 분류하며, 숫자로만 이루어진 1 바이트 코드 조합은 해당 상품명에 대한 상품 코드 항목(56)으로 인식한다. 상기 상품 코드는 해당 상품명에 대한 문자로 구성된 바코드 정보로서, 이와 같은 문자 바코드 정보를 이용하여 상품명을 데이터베이스화한 후, 추후 검증시 이를 이용하여 검증하여 검증 속도를 단축할 수 있다. 상품명 항목의 좌측의 2 자리 또는 3 자리 숫자는 상품의 순번 항목(58)으로 인식한다.
이처럼, 영수증을 스캐닝한 이미지 정보를 단순 가로 인식하여 데이터를 문자로 표현하는 일반적인 문서 인식 방법을 이용한 영수증 인식 방법을 이용하는 것에 비하여, 스캐닝한 영수증 이미지 정보 중 금액 열에 해당하는 영역을 파악하고 이를 기준으로 상품명, 단가, 수량 등의 항목을 인식한 후, 해당 영역에서 인식한 문자 정보 중 기 설정된 규칙을 이용하여 해당 데이터의 항목을 분류하는 방법을 이용하는 것이 해당 영역 내에서 특징적인 데이터 패턴을 추출하여 데이터 종류를 파악하기 용이하므로 영수증 데이터 분석의 정확도를 높일 수 있다.
부가적으로, 상기 사업자 번호(51)는 상기 상단 영역뿐만 아니라 영수증 전체 영역에서 판독하여 분류할 수 있으며, 구매일(52)은 2천 단위로 시작하는 것을 년도로 인식하도록 분류 규칙을 지정할 수 있다. 또한, 구매일(52) 이후 두 자릿수 연속 패턴을 구매시간 항목으로 인식하도록 분류 규칙을 설정할 수 있다.
상기의 방법으로 분류된 영수증 정보, 즉 영수증에 인쇄된 구매 물품, 구매 수량, 사용 금액 등을 판독, 분류하여 데이터베이스화하여, 상기 데이터베이스에서 해당 영수증 사용자의 구매 정보를 타 시스템으로 자유롭게 활용할 수 있다.
도 6은 본 발명의 실시 예에 따른 영수증 판독 방법의 정확성을 비교한 그래프로서, 일반적인 문자 정보 인식 방법인 가로 분석 방법과 본 발명의 실시 예에 따른 금액 열 인식 후 각각의 열 단위 영역을 인식하는 방법의 정확도를 비교한 것이다.
일반적인 가로 분석 방법(620)과 본 발명의 실시 예에 따른 열 단위 분석 방법(610)은 그 분석 대상 항목의 개수가 증가함에 따라서 모두 정확도가 감소하는 경향을 보이고 있으나, 본 발명의 실시 예에 따른 열 단위 분석 방법(610)의 경우 그 정확도가 감소하는 비율이 일반적인 가로 분석 방법(620)에 비해 상대적으로 작다. 또한, 절대적인 정확도 비율에 있어서도 그 항목의 개수에 관계없이 일반적인 방법에 비해 전체적으로 월등히 높음을 알 수 있다.
도 7은 본 발명의 실시 예에 따른 영수증 데이터 검증 프로그램의 화면 예시도로서, 상기 검증 프로그램의 화면은 영수증 이미지 정보를 표시하는 영수증 정보 부분(710), 해당 영수증에서 스캐닝한 구매 상품 내역 및 이를 인식한 문자 정보를 표시하며 상기 상품 내역과 인식 문자 정보를 비교, 검증하는 상품정보 부분(720), 해당 영수증의 회원번호, 사업자정보 등 관련 정보를 표시하는 영수증 관련 정보 부분(730)을 포함하여 구성된다. 이때, 상기 영수증 데이터 검증 프로그램은 사용자 단말에 설치되어, 검증자가 도시한 바와 같은 화면을 이용하여 검증 후 각각의 부분에서 수정된 내용이 검증 서버에 저장되도록 구성한다.
상기 영수증 정보 부분(710)은 영수증 이미지 정보 위에 인식된 사업자 번호, 구매일, 상품명, 상품 코드, 단가, 수량, 금액 등 각각의 항목 종류에 따라 색깔을 구분하여 표시(711)하여, 해당 항목의 인식 여부를 검증자가 시각적으로 쉽게 파악하도록 구성할 수 있다.
상기 상품 정보 부분(720)은 해당 영수증에서 스캐닝한 구매 상품 내역 및 이를 인식한 문자 정보를 표시(721)하며, 데이터 인식률을 향상시키기 위해 인식 항목 중 상품 코드 항목 즉, 상품명에 대한 문자 바코드 정보를 이용하여 인식한 구매 물품명 및 단가, 수량, 금액 등을 검증하도록 구성한다.
이때, 코드 및 상품명 영역(722, 723)의 상단 부분에 스캐닝한 문자 바코드 이미지 정보(722) 및 상품명 이미지 정보(723)를 표시하고 하단 부분에 이를 이용하여 인식한 문자 바코드 정보(722) 및 상품명 정보(723)를 표시하여, 검증자가 스캐닝한 이미지를 보고 인식한 문자 바코드 정보(722)를 수정할 수 있게 구성한다. 또한, 검증자가 수정한 문자 바코드 정보 및 상품 정보가 검증 서버에 임시상품 데이터베이스로 저장되게 구성하여, 이후 상기 임시상품 데이터베이스에 저장된 상품명을 이용하여 스캐닝한 문자 바코드 이미지 정보의 인식 및 검증에 활용할 수 있게 한다. 예를 들어, 어떤 문자 바코드 정보(722)에 해당하는 상품명(723)이 "옥수수수염차40T"인데 이를 "욱수수수염차40T" 로 인식하였더라도, 검증자가 스캐닝한 이미지 정보를 보고 "옥수수수염차40T"로 올바르게 정정하면 검증 서버는 해당 문자 바코드 정보 및 정정한 상품명을 임시상품 데이터베이스에 저장하여 이후 동일한 문자 바코드 정보에 따른 상품명은 "옥수수수염차40T"로 인식한다.
영수증에 인쇄된 상품명을 이용하여 구매 상품 항목을 인식할 경우 상품명이 대부분 문자로 구성되어 인식 오류율이 높아 데이터베이스 입력 속도가 현저히 낮아지므로, 상품명(723) 대신 문자 바코드 정보(722)를 이용하여 이를 기준으로 인식한 구매 물품 데이터를 검증함으로써 데이터 인식률을 향상시켜 판독 에러율을 감소시키며 데이터베이스 입력 속도를 높일 수 있다. 또한, 검증자가 정정한 상품 정보는 상기 검증 서버에 구성된 임시상품 데이터베이스로 갱신되어 다음 검증 때 활용하도록 하므로 입력 속도를 더욱 향상시킬 수 있다.
상기 영수증 관련 정보 부분(730)은 회원 번호, 사업자 정보를 식별하여 회원 및 판매처 정보(732)를 식별한다. 상기 판매처 정보(732)는 상기 사업자 번호 및 영수증에서 인식한 전화번호 정보를 병행하여 기 저장된 판매처 정보 데이터베이스에서 검색하여 식별할 수도 있다. 상기 회원 번호는 바코드 패턴(731)으로 인식하여 인식 오류율이 극히 낮다. 이때, 상기 회원 번호를 위한 바코드 패턴(731)은 개인별 고유 정보로서, 상기 영수증에 부착된 개인별 식별 수단으로부터 스캐닝하여 획득한다. 상기 개인별 식별 수단이 부착된 영수증의 예는 도 8에서 설명한다.
도 8은 본 발명의 실시 예에 따른 개인별 식별 수단이 부착된 영수증 후면의 예시도로서, 개인별 고유 바코드 정보(810)가 인쇄된 스티커 형태의 개인별 식별 수단이 영수증의 후면에 부착된 것을 도시한 것이다.
상기 영수증의 개인별 바코드 정보(810)는 영수증 후면을 스캐닝하고 바코드 부분을 인식하여, 기 저장된 개인별 바코드 정보에서 검색하는 것으로 해당 영수증의 사용자를 식별할 수 있다. 또한, 바코드 형태로 인식하기 때문에 스캐닝시 인식 오류율이 낮아 데이터베이스 입력 속도를 높일 수 있다.
이때, 상기 개인별 식별 수단의 발급 예로서, 마트 등에 자동 개인별 식별 수단 발급기를 설치하고, 사용자가 개인 소유의 카드를 해당 발급기의 투입구에 투입하거나 또는 발급기의 버튼을 이용하여 주민번호를 입력하고 발급버튼을 누르는 것으로 사용자 고유의 바코드 정보가 인쇄된 스티커를 획득할 수 있다. 이후, 사용자는 상기 개인별 바코드가 인쇄된 스티커를 소지하고 있는 영수증 후면에 부착한다. 상기 스캔 서버는 영수증에 부착된 개인별 식별수단을 판독하여 해당 영수증의 구매 물품 정보를 상기 개인별 바코드 정보를 스캐닝하여 획득한 개인별 식별 정보와 연계하여 저장하여 개인별 구매 이력 정보를 생성할 수 있고, 이를 이용하여 다양한 고객 관리 시스템에 활용할 수 있어 해당 영수증의 정보 가치가 크게 높아진다. 부가적으로, 상기 스캔 서버는 스캐닝 시간을 단축하기 위해 전면의 물품 정보 및 후면의 개인별 식별 수단을 동시에 스캔할 수 있는 양면 스캔 서버로 구성할 수도 있다.
도 9는 본 발명의 실시 예에 따른 검증 데이터베이스를 활용한 영수증 판독 방법의 속도를 비교한 그래프로서, 수정한 항목을 저장 및 갱신하여 이후 검증시 활용할 수 있는 임시상품 데이터베이스를 구성한 검증 방법의 속도와, 상기 임시상품 데이터베이스를 활용하지 않은 검증 방법의 속도를 비교한 것이다.
상기 임시상품 데이터베이스를 이용한 검증 방법(910)은 항목의 개수와 관계없이 공히 임시상품 데이터베이스를 이용하지 않은 검증 방법(920)에 비해 속도가 단축되며, 항목의 개수가 많아지면 많아질수록 그 속도의 차이는 점점 더 커지는 것을 볼 수 있다.
도 10은 본 발명의 실시 예에 따른 자동 정보 수집 방법의 순서도로서, 상기 자동 정보 수집 방법은 다양한 종류의 영수증을 스캐닝하여 이미지 정보로 변환하는 스캔 단계(S101), 상기 이미지 정보를 판독하여 문자 정보로 변환하는 인식분류단계(S102), 상기 변환된 문자 정보를 기 설정된 규칙에 따라 검증하고 오류 데이터를 수정하는 검증단계(S103), 상기 검증 완료된 문자 정보를 영수증 데이터베이스에 저장하는 저장단계(S104)를 포함한다.
상기 스캔 단계(S101)는 개인별 식별 수단이 부착된 영수증을 스캐닝하여 해당 영수증의 구매 물품 정보와 연계하여 저장할 수 있다. 이후, 상기 개인별 식별 수단이 부착된 영수증을 제공한 개인에게 경품이나 포인트를 제공함으로써 개인의 활발한 참여를 유도하여 데이터베이스의 품질을 높일 수 있다.
또한, 상기 자동 정보 수집 방법은 상기 저장 단계(S104)에서 저장한 영수증 데이터베이스를 타 시스템으로 전송하는 활용 단계를 더 포함할 수 있으며, 상기 영수증 데이터베이스를 전송받은 타 시스템은 이를 고객 관리 등에 활용할 수 있다. 또한, 상기 활용 단계에서 판독한 영수증 정보 데이터베이스를 이용한 각종 통계정보를 제공함으로써 리서치 조사를 대체하는 수단으로 활용 가능하여 조사 원가를 절감할 수 있다.
도 11은 본 발명의 실시 예에 따른 인식분류단계의 순서도로서, 상기 인식분류 단계는 개인별 식별 수단에서 사용자를 인식하는 사용자정보 인식단계(S111), 스캐닝한 영수증 이미지 정보 중 금액 열 영역을 기준으로 설정하는 기준 설정단계(S112), 상기 금액 열 영역에서 각각의 금액 항목을 우선 인식하는 우선 인식단계(S113), 상기 금액 항목을 기준으로 그와 관련된 항목을 인식하는 항목별 인식단계(S114)를 포함한다.
상기 사용자정보 인식단계(S111)는 상기 스캔 단계에서 스캐닝한 개인별 식별 수단에서 개인 고유 정보를 인식한다.
상기 기준 설정단계(S112)는 상기 영수증 이미지 정보의 가장 우측에서 0으로 시작되거나 숫자로 시작되는 영역을 추적하여 금액 열 영역으로 인식하고 이를 기준으로 설정한다.
상기 우선 인식단계(S113)는 상기 금액 열 영역에서 각각의 금액 항목을 우선 인식한다.
이후 상기 항목별 인식단계(S114)에서 상기 우선 인식한 금액 항목을 기준으로 행 방향 인식을 병행하여 각각의 타 영역에서 특징적인 데이터 패턴에 따른 수량, 단가, 상품명 등을 인식 및 분류한다.
상기 인식분류단계에서 금액 열 우선 인식 후 이를 기준으로 타 영역의 인식 및 분류를 병행하여 영수증 종류와 관계없이 영수증 판독률을 크게 높이고 영수증 데이터베이스의 정확성을 향상시킬 수 있다.
도 12는 본 발명의 실시 예에 따른 검증단계의 순서도로서, 상기 검증단계는 기 저장된 임시상품 데이터베이스(S124)를 이용하여 영수증의 오류 정보를 검증하는 오류정보 체크단계(S121), 상기 오류정보 체크단계(S121)에서 오류정보 발생시 해당 오류정보를 정정하는 오류정보 수정단계(S122), 상기 오류정보 수정단계(S122)에서 정정된 상품 정보를 상기 임시상품 데이터베이스(S124)로 갱신하는 임시상품 데이터베이스 갱신단계(S123)를 포함한다.
상기 오류정보 체크단계(S121)는 해당 상품명의 문자 바코드 정보를 활용하여 검증함으로써 데이터 인식률을 향상시켜 판독 에러율을 감소시키며 검증의 정확성을 높일 수 있다.
또한, 상기 오류정보 수정단계(S122)에서 정정한 상품정보는 상기 임시상품 데이터베이스 갱신단계(S123)에서 상기 임시상품 데이터베이스(S124)로 갱신되어, 다음 검증 시 활용하도록 구성되어 영수증 데이터베이스의 입력 속도를 더욱 향상시킬 수 있다.
이상에서는 본 발명에 따른 바람직한 실시 예들에 대하여 도시하고 또한 설명하였다. 그러나 본 발명은 상술한 실시 예에 한정되지 아니하며, 특허 청구의 범위에서 첨부하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능할 것이다.
220: 스캐닝 서버 230: 인식 분류 서버
231: 광학 문자 판독 엔진 240: 검증 서버
241: 검증 데이터베이스 242: 검증부
250: 자료 저장 서버 251: 영수증 정보 데이터베이스

Claims (19)

  1. 실물 영수증을 기반으로 사용자별 구매 이력을 수집하기 위한 영수증 판독을 통한 자동 정보 수집 시스템에 있어서,
    실물 영수증을 스캐닝하여 변환된 영수증 이미지 정보의 금액 열 영역을 우선 인식한 후, 이를 기준으로 각 데이터별 영역을 인식하여 문자 정보로 변환하며, 이후 기 설정된 분류 규칙에 따라 각 영역의 상기 문자 정보를 소정의 항목으로 분류하는 인식분류 서버;
    상기 분류된 항목 중 상품 식별 코드인 문자바코드정보 항목을 이용하여 해당 상품 관련 항목을 검증하는 검증 서버;
    상기 검증된 영수증의 항목을 영수증 데이터베이스에 저장하는 영수증 데이터베이스 서버를 포함하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  2. 제 1항에 있어서, 상기 검증 서버는
    상기 항목의 검증시 수정된 항목 정보를 상기 문자바코드정보를 기준으로 갱신하여, 이후 검증시 이전 검증 작업에서 갱신된 항목 정보를 재이용하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  3. 제 1항에 있어서, 상기 인식분류 서버는
    상기 영수증 이미지 정보의 최 우측을 기준으로 0으로 시작되는 영역이 포함된 열을 금액 열 영역으로 우선 인식하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  4. 제 3항에 있어서, 상기 인식분류 서버는
    상기 우선 인식한 금액 열 영역을 기준으로 행 방향 인식을 병행하여 수량 영역, 단가 영역, 상품명 영역 중 적어도 하나 이상의 영역을 인식하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  5. 제 3항에 있어서, 상기 인식분류 서버는
    각 데이터별 영역에서 상기 문자 정보의 코드 종류, 위치, 숫자 유무, 조합 패턴 중 적어도 하나 이상을 이용한 분류 규칙을 이용하여 항목을 분류하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  6. 제 3항에 있어서, 상기 인식분류 서버는
    상기 금액 열 영역에서 각각의 숫자를 인식하여 금액 항목으로 분류하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  7. 제 6항에 있어서, 상기 인식분류 서버는
    상기 분류한 금액 항목의 좌측 영역으로 행 방향 이동한 부분의 일 단위 또는 십 단위 자릿수를 인식하여 상기 금액의 수량 항목으로 분류하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  8. 제 7항에 있어서, 상기 인식분류 서버는
    상기 분류한 수량 항목의 좌측 영역으로 행 방향 이동한 부분의 금액을 인식하여 단가 항목으로 분류하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  9. 제 8항에 있어서, 상기 인식분류 서버는
    상기 분류한 단가 항목의 좌측 영역에서 한글, 영문, 숫자 중 적어도 하나 이상으로 구성된 1 바이트 또는 2 바이트 코드의 조합을 인식하여 상품명 항목으로 분류하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  10. 제 8항에 있어서, 상기 인식분류 서버는
    상기 분류한 단가 항목의 좌측 영역에서 숫자로만 조합된 1 바이트 코드의 조합을 인식하여 문자바코드정보 항목으로 분류하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  11. 제 3항에 있어서, 상기 인식분류 서버는
    상기 영수증의 전체 영역에서 3자리와 2자리 및 5자리의 1 바이트 숫자를 포함한 코드 조합을 인식하여 사업자 번호 항목으로 분류하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  12. 제 1항에 있어서,
    상기 인식분류 서버가 상기 영수증 이미지 정보에 포함된 판매점 바코드 정보를 이용하여 판매점 식별 정보를 인식하고, 상기 영수증 데이터베이스 서버가 검증된 영수증의 항목을 상기 인식된 판매점 식별 정보별로 영수증 데이터베이스에 저장하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  13. 제 1항에 있어서,
    상기 인식분류 서버는 상기 실물 영수증의 일면에 개인별 고유 식별 수단이 부착된 경우 이를 스캐닝하여 변환한 개인별 고유 식별 이미지 정보에서 개인 식별 정보를 인식하고,
    상기 영수증 데이터베이스 서버는 상기 검증된 영수증의 항목을 상기 인식된 개인 식별 정보별로 저장하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 시스템.
  14. 스캔 및 OCR부를 포함하는 자동 정보 수집 시스템을 이용한 영수증 판독을 통한 자동 정보 수집 방법에 있어서,
    a) 인식분류 서버가 실물 영수증을 스캐닝하여 변환된 영수증 이미지 정보의 금액 열 영역을 우선 인식한 후, 이를 기준으로 각 데이터별 영역을 인식하여 문자 정보로 변환하며, 이후 기 설정된 분류 규칙에 따라 각 영역의 상기 문자 정보를 소정의 항목으로 분류하는 단계;
    b) 검증 서버가 상기 분류된 항목 중 상품 식별 코드인 문자바코드정보 항목을 이용하여 해당 상품 관련 항목을 검증하는 단계;
    c) 영수증 데이터베이스 서버가 상기 검증된 영수증의 항목을 영수증 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 방법.
  15. 제 14항에 있어서, 상기 b)단계는
    상기 검증 서버가 상기 항목의 검증시 수정된 항목 정보를 상기 문자바코드정보를 기준으로 갱신하여, 이후 검증시 이전 검증 작업에서 갱신된 항목 정보를 재이용하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 방법.
  16. 제 14항에 있어서, 상기 a)단계는
    상기 인식분류 서버가 상기 영수증 이미지 정보의 최 우측을 기준으로 0으로 시작되는 영역이 포함된 열을 금액 열 영역으로 우선 인식하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 방법.
  17. 제 16항에 있어서, 상기 a)단계는
    상기 인식분류 서버가 상기 우선 인식한 금액 열 영역을 기준으로 행 방향 인식을 병행하여 수량 영역, 단가 영역, 상품명 영역 중 적어도 하나 이상의 영역을 인식하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 방법.
  18. 제 16항에 있어서, 상기 a)단계는
    상기 인식분류 서버가 각 데이터별 영역에서 상기 문자 정보의 코드 종류, 위치, 숫자 유무, 조합 패턴 중 적어도 하나 이상을 이용한 분류 규칙을 이용하여 항목을 분류하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 방법.
  19. 제 14항에 있어서,
    상기 인식분류 서버가 상기 실물 영수증의 일면에 개인별 고유 식별 수단이 부착된 경우 이를 스캐닝하여 변환한 개인별 고유 식별 이미지 정보에서 개인 식별 정보를 인식하는 단계;
    상기 영수증 데이터베이스 서버가 상기 검증된 영수증의 항목을 상기 인식된 개인 식별 정보별로 저장하는 단계를 더 포함하는 것을 특징으로 하는 영수증 판독을 통한 자동 정보 수집 방법.
KR1020100022504A 2010-03-12 2010-03-12 영수증 판독을 통한 자동 정보 수집 시스템 및 방법 KR101139801B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100022504A KR101139801B1 (ko) 2010-03-12 2010-03-12 영수증 판독을 통한 자동 정보 수집 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100022504A KR101139801B1 (ko) 2010-03-12 2010-03-12 영수증 판독을 통한 자동 정보 수집 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20110103264A true KR20110103264A (ko) 2011-09-20
KR101139801B1 KR101139801B1 (ko) 2012-04-30

Family

ID=44954568

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100022504A KR101139801B1 (ko) 2010-03-12 2010-03-12 영수증 판독을 통한 자동 정보 수집 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101139801B1 (ko)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101516684B1 (ko) * 2013-12-19 2015-05-11 주식회사 지트레이스 Ocr을 이용한 문서 변환 서비스 방법
KR101691477B1 (ko) * 2015-07-16 2016-12-30 주용철 영수증 판독을 통한 구매정보 관리 시스템
WO2017222168A1 (ko) * 2016-06-20 2017-12-28 비씨카드(주) 부가세 환급을 위한 거래자료분류 서비스를 제공하는 방법 및 이를 수행하는 서비스 제공 서버
JP2018018466A (ja) * 2016-07-29 2018-02-01 セイコーエプソン株式会社 情報処理装置、情報処理装置の制御方法、及び、制御プログラム
WO2018105780A1 (ko) * 2016-12-06 2018-06-14 주식회사 슈퍼갈땐슈퍼맨 슈퍼마켓에 설치된 pos 단말기와의 연동을 통해 상품 정보 데이터베이스의 관리가 가능한 슈퍼마켓에 대한 상품 주문 처리 서비스 장치 및 그 동작 방법
KR20180065141A (ko) * 2016-12-07 2018-06-18 비씨카드(주) 부가세 환급을 위한 거래자료분류 서비스를 제공하는 방법 및 이를 수행하는 서비스 제공 서버
KR101980574B1 (ko) * 2017-12-22 2019-05-21 주식회사 슈퍼갈땐슈퍼맨 슈퍼마켓에 설치된 pos 단말기와 연동하여 신선식품 데이터베이스의 관리가 가능한 상품 주문 처리 장치 및 그 동작 방법
KR20200084144A (ko) 2019-01-02 2020-07-10 이재혁 스마트 영수증 스캔 시스템
KR102170075B1 (ko) * 2020-07-03 2020-10-26 주식회사 니즈 식자재 유통기한의 관리를 위한 스마트 시스템
WO2021040193A1 (ko) * 2019-08-27 2021-03-04 박회준 비급여 정보를 이용한 의료 기관 정보 제공 장치 및 방법
KR102246460B1 (ko) * 2019-12-24 2021-04-30 유한회사 하존솔루션 빅데이터 기반 구매 이력 영상 관리 시스템 및 방법
KR20220042585A (ko) * 2020-09-28 2022-04-05 로켓뷰 주식회사 구매 영수증 이미지를 활용한 오프라인 리테일 환경에서의 상품 정보 검색 장치 및 이를 위한 제어방법

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101992178B1 (ko) * 2012-09-25 2019-06-24 엘지전자 주식회사 휴대용기기 및 휴대용기기 제어방법
KR102067817B1 (ko) * 2012-09-28 2020-01-17 엘지전자 주식회사 전기 제품의 제어방법
WO2014163391A1 (ko) * 2013-04-02 2014-10-09 Bae Hyo-Hwan 구매 행위에 대한 리워드 제공 방법 및 그 장치
KR20140120259A (ko) * 2013-04-02 2014-10-13 배효환 구매 행위에 대한 리워드 제공 방법 및 그 장치
KR20200056753A (ko) 2018-11-15 2020-05-25 주식회사 굿핀 영수증으로부터 전화번호를 추출하여 해당 전화번호로 문자를 전송하는 시스템 및 방법
KR102149050B1 (ko) 2020-04-24 2020-08-28 주식회사 애자일소다 인공지능을 이용한 ocr 기반 문서 분석 시스템 및 방법
KR102149052B1 (ko) 2020-04-24 2020-08-28 주식회사 애자일소다 Nlp를 이용한 ocr 기반 문서 분석 시스템 및 방법
KR102149051B1 (ko) 2020-04-24 2020-08-28 주식회사 애자일소다 자기 신뢰도 정보를 이용한 ocr 기반 문서 분석 시스템 및 방법
KR102455536B1 (ko) * 2020-06-29 2022-10-17 한화손해보험주식회사 영수증 인식 장치, 영수증의 스캔 이미지에서 진료 항목을 자동적으로 인식하는 방법 및 컴퓨터 프로그램
KR102211516B1 (ko) 2020-08-21 2021-02-04 주식회사 애자일소다 가상 셀을 이용한 ocr 기반 문서 분석 시스템 및 방법
KR102461018B1 (ko) 2021-05-11 2022-11-01 김동주 정보 처리 방법, 서버 및 정보 제공 방법
KR102347386B1 (ko) 2021-09-10 2022-01-05 주식회사 애자일소다 단어 정의 기반 헤더 추출 장치 및 방법
KR102392644B1 (ko) 2021-10-19 2022-04-29 주식회사 애자일소다 유사도 기반의 문서 분류 장치 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050096853A (ko) * 2005-03-25 2005-10-06 주식회사 인텔리전스 마케팅 영수증의 영상데이터를 이용한 시장조사시스템 및시장조사방법
KR100707943B1 (ko) * 2005-04-27 2007-04-18 최철규 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101516684B1 (ko) * 2013-12-19 2015-05-11 주식회사 지트레이스 Ocr을 이용한 문서 변환 서비스 방법
KR101691477B1 (ko) * 2015-07-16 2016-12-30 주용철 영수증 판독을 통한 구매정보 관리 시스템
WO2017222168A1 (ko) * 2016-06-20 2017-12-28 비씨카드(주) 부가세 환급을 위한 거래자료분류 서비스를 제공하는 방법 및 이를 수행하는 서비스 제공 서버
JP2018018466A (ja) * 2016-07-29 2018-02-01 セイコーエプソン株式会社 情報処理装置、情報処理装置の制御方法、及び、制御プログラム
WO2018105780A1 (ko) * 2016-12-06 2018-06-14 주식회사 슈퍼갈땐슈퍼맨 슈퍼마켓에 설치된 pos 단말기와의 연동을 통해 상품 정보 데이터베이스의 관리가 가능한 슈퍼마켓에 대한 상품 주문 처리 서비스 장치 및 그 동작 방법
KR20180065141A (ko) * 2016-12-07 2018-06-18 비씨카드(주) 부가세 환급을 위한 거래자료분류 서비스를 제공하는 방법 및 이를 수행하는 서비스 제공 서버
KR101980574B1 (ko) * 2017-12-22 2019-05-21 주식회사 슈퍼갈땐슈퍼맨 슈퍼마켓에 설치된 pos 단말기와 연동하여 신선식품 데이터베이스의 관리가 가능한 상품 주문 처리 장치 및 그 동작 방법
WO2019124612A1 (ko) * 2017-12-22 2019-06-27 주식회사 슈퍼갈땐슈퍼맨 슈퍼마켓에 설치된 pos 단말기와 연동하여 신선식품 데이터베이스의 관리가 가능한 상품 주문 처리 장치 및 그 동작 방법
KR20200084144A (ko) 2019-01-02 2020-07-10 이재혁 스마트 영수증 스캔 시스템
WO2021040193A1 (ko) * 2019-08-27 2021-03-04 박회준 비급여 정보를 이용한 의료 기관 정보 제공 장치 및 방법
KR102246460B1 (ko) * 2019-12-24 2021-04-30 유한회사 하존솔루션 빅데이터 기반 구매 이력 영상 관리 시스템 및 방법
KR102170075B1 (ko) * 2020-07-03 2020-10-26 주식회사 니즈 식자재 유통기한의 관리를 위한 스마트 시스템
KR20220042585A (ko) * 2020-09-28 2022-04-05 로켓뷰 주식회사 구매 영수증 이미지를 활용한 오프라인 리테일 환경에서의 상품 정보 검색 장치 및 이를 위한 제어방법

Also Published As

Publication number Publication date
KR101139801B1 (ko) 2012-04-30

Similar Documents

Publication Publication Date Title
KR101139801B1 (ko) 영수증 판독을 통한 자동 정보 수집 시스템 및 방법
US10510218B2 (en) Information processing apparatus, information processing method, and non-transitory storage medium
JP4768789B2 (ja) 車両番号行動指示システム、および、車両番号行動指示方法
US20060242011A1 (en) Method and system for automatic, customer-specific purchasing preferences and patterns of complementary products
US20150161745A1 (en) Sales data processing apparatus and computer-readable storage medium
US20060085270A1 (en) Process and system for providing information to customers at point of sale
JP2014048752A (ja) 表示札処理システム
US20140040160A1 (en) System and method of rating a product
JP2013003872A (ja) 売上データ処理装置及びプログラム
US20100280873A1 (en) Electronic coupon storage and manipulation system and method
KR102110723B1 (ko) 스와치 자동인식 기반 빅데이터 자재정보 관리 시스템
US20170083984A1 (en) Tax exemption processing system, information processing apparatus and method for simplifying management of taxable amount
JP6949611B2 (ja) 商品登録装置及びそのプログラム
JP5114887B2 (ja) Posレジスタ
US10956729B2 (en) Data processing apparatus and method, and non-transitory computer readable medium
US20190034904A1 (en) Information processing apparatus, information processing method, and non-transitory storage medium
CN115735221A (zh) 信息处理系统、信息处理方法以及程序
JP2002260100A (ja) 商品販売データ処理装置、商品販売データ処理システム、サーバコンピュータ、商品販売システム、クーポン値引き方法及びプログラム
JP2012089024A (ja) 商品販売管理装置
JP6934162B2 (ja) Posシステム
US20180240091A1 (en) Tax-exempt processing apparatus and tax-exempt processing method
KR20140103090A (ko) 품목 전자 영수증 제공 시스템 및 방법
JP6947890B2 (ja) 電子レシートシステムおよび情報処理方法
JP2019191641A (ja) 会計システム、会計方法及び会計プログラム
US20230028398A1 (en) Information processing device and method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160406

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170406

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180413

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190405

Year of fee payment: 8

R401 Registration of restoration