KR20170019087A - 영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법 - Google Patents

영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법 Download PDF

Info

Publication number
KR20170019087A
KR20170019087A KR1020150112999A KR20150112999A KR20170019087A KR 20170019087 A KR20170019087 A KR 20170019087A KR 1020150112999 A KR1020150112999 A KR 1020150112999A KR 20150112999 A KR20150112999 A KR 20150112999A KR 20170019087 A KR20170019087 A KR 20170019087A
Authority
KR
South Korea
Prior art keywords
information
price
extracting
store
extracted
Prior art date
Application number
KR1020150112999A
Other languages
English (en)
Other versions
KR101771524B1 (ko
Inventor
김지훈
Original Assignee
주식회사 쿼리젯
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 쿼리젯 filed Critical 주식회사 쿼리젯
Priority to KR1020150112999A priority Critical patent/KR101771524B1/ko
Publication of KR20170019087A publication Critical patent/KR20170019087A/ko
Application granted granted Critical
Publication of KR101771524B1 publication Critical patent/KR101771524B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06K9/00442
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/12Payment architectures specially adapted for electronic shopping systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/20Point-of-sale [POS] network systems
    • G06Q20/209Specified transaction journal output feature, e.g. printed receipt or voice output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

사용자들이 촬영한 영수증 이미지로부터 매장 및 상품 가격에 관한 정보를 추출하는 방법과, 사용자들이 제공한 영수증 이미지로부터 추출된 정보를 가공하여 특정 상품에 대한 매장별 가격 정보를 제공하는 방법이 제공된다. 본 발명의 일 실시예에 따른 영수증에서 추출한 가격정보 제공방법은, 단말로부터 영수증 이미지를 수신하는 단계와, 영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와, 추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와, 추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와, 추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계와, 상품가격 검색요청을 수신하면 상품가격 검색요청에 포함된 검색조건에 맞는 가격정보를 포함하는 검색결과를 상품가격 데이터베이스에서 추출하여 사용자에게 제공하는 검색단계를 구비한다. 본 발명에 따르면, 영수증에서 상품의 가격 정보를 추출하므로 다수의 상품에 대한 가격을 한번에 획득할 수 있을 뿐만 아니라 실제로 판매된 가격을 획득할 수 있다.

Description

영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법 {Method for extracting price information from a receipt and method for providing price information}
본 발명은 영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법에 관한 것으로서, 더욱 상세하게는 사용자들이 촬영한 영수증 이미지로부터 매장 및 상품 가격에 관한 정보를 추출하는 방법과, 사용자들이 제공한 영수증 이미지로부터 추출된 정보를 가공하여 특정 상품에 대한 매장별 가격 정보를 제공하는 방법에 관한 것이다.
상품 구매를 결정함에 있어서 중요한 요소는 가격이다. 따라서 다양한 상품의 여러 판매처에서의 가격을 비교해주는 가격비교 사이트가 많이 운용되고 있다. 예를 들면, 등록특허 제10-1336151호에서는 온라인 쇼핑몰에 구매자의 관심상품으로 저장되어 있는 정보를 이용하여 용이하게 가격비교를 할 수 있도록 하고, 관심상품 정보를 이용하여 가격비교 사이트의 상품정보를 갱신하도록 하는 방법이 개시되어 있다.
그러나, 기존의 가격비교 사이트는 가격 정보를 쉽게 획득할 수 있는 온라인 쇼핑몰을 대상으로 한 것이다. 오프라인 매장에 대한 가격 비교 서비스를 제공하기 어려운 것은 시시각각으로 변하는 오프라인 매장들에서의 가격 정보를 신뢰성 있게 획득하기가 어렵기 때문이다.
한편, 등록특허 제10-1137541호 "온라인/오프라인 통합가격비교 서비스 방법 및 시스템"에서는, 오프라인 매장을 방문한 사용자에 의해 촬영된 특정 제품의 가격 정보를 사용자 단말에 의해 촬영된 특정 제품의 바코드와 가격태그 이미지 정보를 이용하여 획득하도록 구성하고 있다. 그러나, 사용자들이 오프라인 매장의 모든 제품의 바코드와 가격태그 이미지를 일일이 촬영하여 업로드 하기를 기대하기는 어려우며, 바코드에 기록된 정보는 동일 제품에 대해서도 매장마다 관리 코드를 다르게 사용하는 경우가 많아서 정확한 제품 정보를 획득하기가 어렵다. 또한, 사용자가 제품 가격 이미지를 업로드 하였다 하더라고 이 정보가 최신의 정보인지를 확인할 수 있는 방법이 없으므로, 가격이 시시각각 변하는 상황에서는 유용한 정보가 되기 어렵다. 또한, 가격태그에 기재된 가격에서 할인을 적용받아서 결제가 이루어지는 경우가 많이 있으므로, 가격태그에 기재된 가격이 실제로 판매되는 가격이라는 보장이 없다.
본 발명은 이러한 점을 감안하여 이루어진 것으로서, 다수의 상품에 대한 오프라인 매장별 가격정보를 정확하게 획득할 수 있도록 영수증에서 매장 정보, 날짜 정보 및 상품의 가격 정보 등의 정보를 추출하는 방법과, 영수증으로부터 추출된 정보를 이용하여 매장별 가격정보를 제공하는 방법을 제공하는 것을 목적으로 한다.
본 발명의 일 실시예에 따른 영수증 가격정보 추출방법은, 단말로부터 영수증 이미지를 수신하는 단계와, 영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와, 추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와, 추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와, 추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계를 포함한다.
본 발명의 일 실시예에 따른 영수증에서 추출한 가격정보 제공방법은, 단말로부터 영수증 이미지를 수신하는 단계와, 영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와, 추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와, 추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와, 추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계와, 상품가격 검색요청을 수신하면 상품가격 검색요청에 포함된 검색조건에 맞는 가격정보를 포함하는 검색결과를 상품가격 데이터베이스에서 추출하여 사용자에게 제공하는 검색단계를 구비한다. 검색결과를 사용자에게 제공할 때에 검색조건에 관련된 광고도 함께 제공할 수 있다. 또한, 검색결과에 포함된 가격정보를 업로드한 사용자에게 포인트를 적립하도록 구성할 수도 있다.
매장정보 추출단계는, 추출된 텍스트로부터 사업자 등록번호 패턴을 찾아서 사업자 등록번호를 추출하는 단계와, 추출된 사업자 등록번호를 사용하여 사업자 데이터베이스에서 해당 사업자의 매장에 관한 정보를 추출하는 단계를 포함할 수 있다. 추출된 사업자 등록번호와 동일한 사업자 등록번호가 상기 사업자 데이터베이스에 없는 경우에는 상기 추출된 텍스트로부터 주소 패턴, 전화번호 패턴 중의 적어도 하나를 찾아서 주소, 전화번호 중의 적어도 하나를 추출하고, 추출된 주소, 전화번호 중의 적어도 하나를 사용하여 상기 사업자 데이터베이스에서 일치하는 매장에 관한 정보를 추출할 수 있다.
단말로부터 영수증 이미지를 수신할 때에 단말의 위치정보도 함께 수신하는 것이 바람직하다. 또한, 상기 추출된 주소, 전화번호 중의 적어도 하나와 일치하는 매장이 상기 사업자 데이터페이스에 없는 경우에는 상기 위치정보에 해당하는 좌표로부터 소정 반경 이내에 존재하는 매장들을 상기 사업자 데이터베이스에서 검색하여 상기 영수증 이미지로부터 추출된 텍스트들과 비교하여 매칭율이 가장 높은 매장에 관한 정보를 추출할 수 있다.
상품정보 추출단계는, 추출된 텍스트에서 개행되지 않은 한 행의 문자열("제1 문자열"이라 함) 중에서 '문자열("제2 문자열"이라 함) + 공백 + 숫자'의 패턴을 가진 행만 남기고 나머지 행은 제거하는 단계와, 남은 각 행의 상기 제2 문자열에 대해서 상품명 사전 데이터베이스를 사용하여 상품명을 획득하고, 상기 숫자를 사용하여 해당 상품에 대한 가격을 획득하는 단계를 포함할 수 있다. 이때, '제2 문자열 + 공백 + 숫자'의 패턴을 가진 행 중에서 제2 문자열에 청구액, 총액, 합계를 포함하는 상품명과 관련없는 불용어가 포함된 행을 제거하는 것이 바람직하다.
실시예에 따라서는, 추출된 텍스트로부터 날짜정보를 추출하여, 추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장할 때에 날짜정보도 함께 연계하여 상품가격 데이터베이스에 저장하도록 구성할 수 있다.
본 발명에 따르면, 영수증에서 상품의 가격 정보를 추출하므로 다수의 상품에 대한 가격을 한번에 획득할 수 있을 뿐만 아니라 실제로 판매된 가격을 획득할 수 있다. 또한, 영수증에 기재된 날짜정보를 이용하여 가장 최신의 가격 정보를 파악할 수 있을 뿐만 아니라, 가격 변동의 흐름을 파악할 수 있다.
도 1은 본 발명의 방법을 설명하기 위한 네트워크 다이아그램이다.
도 2는 가격정보 제공서버의 내부 구성을 보여주는 블록도이다.
도 3은 영수증으로부터 매장정보, 상품정보, 날짜정보를 추출하여 저장하는 절차를 보여주는 흐름도이다.
도 4는 매장정보를 추출하는 방법을 보여주는 흐름도이다.
도 5는 상품정보를 추출하는 방법을 보여주는 흐름도이다.
도 6은 상품가격 검색요청에 따라 상품가격정보와 광고를 보여주고 리워드를 제공하는 절차를 보여주는 흐름도이다.
이하, 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다.
도 1은 본 발명의 방법을 설명하기 위한 네트워크 다이아그램이다.
오프라인 매장에서 상품을 구입한 (또는 서비스를 이용한) 사용자는 모바일 단말(200)을 이용하여 영수증을 촬영하여 가격정보 제공서버(100)로 영수증 이미지를 전송한다. 모바일 단말(200)로는 스마트폰, 태블릿 PC, 노트북 컴퓨터 등 카메라가 내장된 이동정보단말장치가 사용될 수 있다. 바람직하게는 모바일 단말(200)에 이를 위한 전용 어플리케이션을 설치하여, 영수증 촬영 및 전송을 전용 어플리케이션을 사용하여 수행하도록 하는 것이 좋지만, 본 발명은 이에 한정되는 것은 아니며, 이메일이나 SNS(Social Network Service) 도구를 사용하여 촬영된 이미지를 전송하도록 구성하는 것도 가능하다. 또한, 전용 어플리케이션은 촬영된 영수증 이미지를 그대로 전송할 수도 있고, 전송 데이터를 줄이기 위하여 또는 서버에서의 처리시간을 줄이기 위하여 영수증 이미지를 2진화(binarization), 세그멘테이션(segmentation) 등의 전처리 작업을 수행한 이후에 전송하도록 구성하는 것도 가능하다. 실시예에 따라서는 모바일 단말에서 문자 인식을 수행한 후에 인식된 텍스트 정보만을 전송하도록 구성하는 것도 가능하다.
가격정보 제공서버(100)는 모바일 단말(200)로부터 수신한 영수증 이미지로부터 구매한 매장의 정보, 상품명 및 가격을 포함하는 상품정보, 구매한 날짜정보 등을 추출하여 데이터베이스화 한다. 그리고, 가격정보 제공서버(100)는 검색단말(300)로부터 특정 상품에 대한 가격정보에 대한 검색요청을 수신하면, 데이터베이스로부터 조건에 맞는 데이터를 검색하여 검색단말(300)에게 제공한다. 검색단말(300)로는 데스크탑 PC, 스마트폰, 태블릿 PC, 노트북 컴퓨터 등 다양한 정보단말장치가 사용될 수 있다.
사용자의 영수증 이미지 업로드를 촉진하기 위하여, 검색요청에 대하여 가격정보를 제공할 때에 요청된 상품 또는 지역에 관련된 광고를 함께 제공하고, 가격정보 제공에 사용된 영수증 이미지를 업로드 하였던 사용자에게 리워드를 제공하도록 구성할 수 있다.
다음으로, 도 2를 참조하여 가격정보 제공서버(100)의 구성을 설명한다.
가격정보 제공서버(100)는 사용자로부터 영수증 이미지를 등록받기 위한 영수증등록 인터페이스(110)를 구비한다. 영수증등록 인터페이스(110)는 사용자의 모바일 단말(200)에 설치되어 있는 전용 어플리케이션과의 통신을 위한 인터페이스일 수도 있고, 이메일 또는 SNS를 통해 전송되어 오는 영수증 이미지를 수신하기 위한 인터페이스일 수도 있다. 매장에 관한 보다 정확한 정보 획득을 위하여 가격정보 제공서버(100)는 사용자로부터 영수증 이미지를 받을 때 사용자의 위치정보도 함께 받을 수 있다. 사용자가 영수증 이미지를 전송할 때의 위치가 매장 위치와 다른 경우에는 사용자가 이를 표시할 수 있도록 전용 어플리케이션을 구성할 수도 있다.
영수증 인식부(120)는 사용자로부터 수신한 영수증 이미지로부터 문자를 인식하여 문자열(텍스트)을 추출하고, 추출된 문자열로부터 매장정보 DB(121)와 상품명 사전 DB(122)를 이용하여 매장정보, 상품명 및 가격을 포함하는 상품정보, 구매한 날짜정보 등을 추출한다. 매장정보, 상품정보 등의 구체적인 추출방법은 후술한다.
추출된 매장정보와 상품정보는 연계되어 상품가격 DB(130)에 저장된다. 즉, 특정 매장에서 특정 상품이 얼마의 가격에 판매가 되었는지에 관한 정보가 저장된다. 또한, 바람직하게는 해당 상품이 해당 매장에서 판매된 날짜에 관한 정보가 함께 연계되어 저장된다. 이로부터 사용자는 가장 최근의 판매가와, 판매가의 변동 현황을 파악할 수 있다.
검색사용자 인터페이스(160)는 인터넷 등을 통해 접속한 사용자로부터의 검색요청에 따라 검색엔진(140)에 검색을 요청하고, 검색엔진(140)으로부터의 검색결과를 사용자의 검색단말(300)에 맞는 형태로 가공하여 검색단말(300)에 제공한다. 사용자로부터의 검색요청은 사용자의 현재 위치에서 가장 가까운 곳에 위치한 몇 개의 매장에서의 특정 상품에 대한 가격정보일 수 있다. 예를 들면, "사용자의 위치에서 가장 가까운 3군데의 주유소의 휘발유 가격"일 수 있다. 이를 위하여 검색사용자 인터페이스(160)는 사용자로부터 검색요청을 받을 때에 사용자의 위치정보도 함께 받을 수 있다.
검색엔진(140)은 검색사용자 인터페이스(160)로부터의 검색요청에 따라 상품가격 DB(130)에서 검색요청에 포함된 검색 조건에 부합하는 가격정보를 추출하여 검색사용자 인터페이스(160)에 제공한다. 검색 조건에는 위치에 관한 조건, 가격대에 관한 조건, 상품명에 관한 조건, 매장에 관한 조건 등이 포함될 수 있다.
검색사용자 인터페이스(160)는 검색결과를 검색단말(300)에 제공할 때에 광고를 삽입하여 제공할 수 있다. 이를 위하여 광고 삽입부(150)는 검색 조건에 부합되는 광고를 광고 DB(151)에서 추출하여 검색사용자 인터페이스(160)에 제공하고, 검색사용자 인터페이스(160)는 검색엔진(140)으로부터의 검색결과와 광고 삽입부(150)로부터의 광고 정보를 결합한 페이지를 생성하여 검색단말(300)에게 제공한다.
한편, 이와 같이 검색결과에 사용된 가격정보를 업로드한 사용자에 대해서는 리워드를 제공할 수 있다. 이를 위하여 상품가격 DB에는 가격정보(영수증 이미지)를 업로드한 사용자에 관한 정보도 같이 저장되어 있다. 광고 정산부(170)는 광고 노출에 따른 소정의 포인트 또는 금액을 가격정보를 제공한 사용자에게 부여한다.
다음으로 도 3 내지 도 5를 참조하여 영수증 인식부(120)에서의 동작에 대해서 설명한다.
도 3은 영수증으로부터 매장정보, 상품정보, 날짜정보를 추출하여 저장하는 절차를 보여주는 흐름도이다.
영수증 인식부(120)는 영수증등록 인터페이스(110)를 통해 영수증 이미지를 수신하고(S310), 수신된 영수증 이미지에서 문자를 인식한다(S320). 문자 인식율을 높이기 위하여 영수증에서 일반적으로 사용되는 문자열에 대한 사전 데이터베이스를 활용할 수도 있다.
영수증에는 매장정보, 상품정보, 날짜정보와는 관련없이 일반적으로 사용되는 불용어가 있다. 불용어의 예로는 '신용승인', '감사합니다', '일시불', '카드번호', '승인번호', '매입', '회원용', '고객용', '단말기NO' 등이 있다. 단계 S320에서 추출된 문자열에서 이러한 불용어를 제거한다(단계 S330). 한편 불용어의 제거는 매장정보 추출단계(S340), 상품정보 추출단계(S350) 등에서 수행하도록 하는 것도 가능하다. 또한, 불용어를 제거할 때에 불용어에 수단되어 있는 숫자열 등도 함께 제거할 수 있다. 예를 들면, '카드번호'라는 불용어 옆에는 결제에 사용된 신용카드번호가 기재되게 되는데, '카드번호'라는 불용어를 제거할 때에 그 옆의 신용카드번호도 함께 제거하는 것이다.
영수증 인식부(120)는 불용어가 제거된 문자열로부터 매장에 관한 정보(매장정보)와, 상품명 및 해당 상품의 가격에 관한 정보(상품정보), 그리고 날짜정보를 추출한다(단계 S340, S350, S360). 매장정보, 상품정보, 날짜정보의 추출 순서는 임의로 설계할 수 있다. 즉, 문자열의 처음부터 마지막까지 순서대로 정보를 추출할 수도 있고, 매장정보와 날짜정보를 추출한 후에 상품정보를 추출하도록 구성할 수도 있으며, 본 발명은 특정 순서에 한정되지 않는다.
영수증 인식부(120)는 추출된 매장정보, 상품정보, 날짜정보를 서로 연계하여 상품가격 DB(130)에 저장한다.
도 4를 참조하여 영수증에서 매장정보를 추출하는 한가지 예를 설명한다.
먼저, 영수증에서 추출한 전체 문자열 중에 사업자등록번호 패턴이 존재하는지를 확인한다(단계 S410). 사업자등록번호는 '사업자'라는 문자열 뒤에 나타날 수도 있고, 그러한 문자열 없이 바로 사업자등록번호가 나타날 수도 있다. 사업자등록번호는 "3자리 숫자 + '-' + 두자리 숫자 + '-' + 다섯자리 숫자"로 구성되므로, 이러한 패턴을 가진 문자열이 있는지를 확인한다.
사업자등록번호 패턴이 있는 경우에는 단계 S420에서 해당 사업자등록번호가 매장정보 DB(121)에 존재하는지를 확인한다. 매장정보 DB(121)에 해당 사업자등록번호가 있는 경우에는 단계 S470에서 해당 매장의 정보(매장 ID, 상호명, 매장주소, 매장전화번호 중의 일부 또는 전부)를 임시로 저장해둔다.
사업자등록번호를 추출하는데 실패하였거나 매장정보 DB(121)에 해당 사업자등록번호가 없는 경우에는 단계 S430에서 전체 문자열에 주소정보가 존재하는지를 확인한다. 주소정보로는 주소와 전화번호가 포함될 수 있다. 전체 문자열에 주소 패턴 또는 전화번호 패턴을 갖는 문자열이 있으면 매장정보 DB(121)에 해당 주소 또는 전화번호를 갖는 매장이 존재하는지를 확인한다(단계 S440). 매장정보 DB(121)에 해당 주소정보가 있는 경우에는 단계 S470에서 해당 매장의 정보(매장 ID, 상호명, 매장주소, 매장전화번호 중의 일부 또는 전부)를 임시로 저장해둔다.
주소정보를 추출하는데 실패하였거나 매장정보 DB(121)에 일치하는 주소정보가 없는 경우에는 단계 S450에서 사용자의 모바일 단말(200)로부터 수신한 위치정보로부터 해당 단말의 위치에서 소정의 반경 내에 존재하는 매장이 매장정보 DB(121)에 등록되어 있는지를 확인한다. 소정의 반경 내에 매장이 존재하고 해당 매장정보와 전체 문자열에 일치하는 정보가 있는 경우에는 단계 S470에서 해당 매장의 정보(매장 ID, 상호명, 매장주소, 매장전화번호 중의 일부 또는 전부)를 임시로 저장해둔다. 실시예에 따라서는, 소정 반경 이내에 존재하는 매장들을 상기 사업자 데이터베이스에서 검색하여 상기 영수증 이미지로부터 추출된 텍스트들과 비교하여 매칭율이 가장 높은 매장을 선택하도록 구성할 수도 있다.
이러한 과정을 거쳐서도 매장정보를 획득하지 못한 경우에는 따로 분류하여 두었다가 추후에 관리자가 영수증 이미지를 보고 수기로 매장정보를 입력하도록 구성할 수 있다(단계 S460). 또는 단계 S460을 생략하고 매장정보 획득에 실패한 영수증 이미지를 폐기하도록 구성하는 것도 가능하다.
도 5를 참조하여 상품정보를 추출하는 한가지 예를 설명한다.
먼저, 전체 문자열에서 가격 패턴을 갖는 행을 추출한다(단계 S510). 가격 패턴을 갖는 행이란, 추출된 텍스트에서 개행되지 않은 한 행의 문자열("제1 문자열"이라 함) 중에서 '문자열("제2 문자열"이라 함) + 공백 + 숫자'의 패턴을 가진 행을 말한다. 즉, 전체 문자열에서 가격 패턴을 갖지 않는 행을 삭제함으로써 가격 패턴을 갖는 행만을 추출한다.
이어서, 상품명 불용어가 포함된 행을 제거한다(단계 S520). 상품명 불용어로는 '청구액', '총액', '합계' 등을 들 수 있다. 즉, 가격 패턴을 갖는 행들 중에서 개별 상품의 가격을 나타내는 행이 아닌 행들을 제거하는 것이다.
이와 같이 상품의 가격을 나타내는 행만을 추출한 후에 남은 각 행에 대하여 상기 제2 문자열에 대해서 상품명 사전 DB(122)를 사용하여 상품명을 획득하고, 상기 숫자를 사용하여 해당 상품에 대한 가격을 획득한다. 상품명 사전 DB(122)는 상품명으로 사용될 가능성이 높은 단어 또는 문자열들을 그에 대한 표준적인 상품명에 매핑하여 놓은 데이터베이스이다. 또한, 상품명 사전 DB(122)는 매장별로 사용되는 상품명을 데이터베이스화하여 놓은 것일 수도 있으며, 이 경우에는 단계 S340에서 획득한 매장정보에 따라 적절한 데이터베이스를 사용하여 상품명을 획득할 수 있다. 이렇게 획득한 상품정보는 단계 S470에서 임시로 저장된 매장정보와 함께 연계하여 상품가격 DB(130)에 저장된다.
다음으로 도 6을 참조하여, 사용자로부터의 상품가격 검색요청에 따라 상품가격정보와 광고를 보여주고 리워드를 제공하는 절차를 설명한다.
검색단말(300)로부터 상품가격 검색요청을 접수하면(단계 S610), 검색사용자 인터페이스(160)는 수신된 검색요청에서 검색조건을 추출하여 검색엔진(140)에 전달하여 검색조건에 맞는 가격정보를 검색하도록 한다(단계 S620). 검색 조건에는 매장의 위치에 관한 조건, 상품의 가격대에 관한 조건, 상품에 관한 조건, 매장에 관한 조건 등이 포함될 수 있다.
또한, 검색사용자 인터페이스(160)는 검색조건을 광고 삽입부(150)에 전달하여 검색조건과 관련된 광고를 조회하도록 한다(S630). 검색조건과 관련된 광고로는 예를 들면, 사용자가 요청한 상품에 관련된 광고, 사용자가 요청한 위치와 관련된 광고, 사용자가 요청한 매장에 관련된 광고 등이 될 수 있다.
검색엔진(140)으로부터 검색결과를 수신하고, 광고 삽입부(150)로부터 광고 정보를 수신한 검색사용자 인터페이스(160)는 검색단말(300)에 맞도록 광고가 포함된 가격정보 페이지를 구성하여 검색단말(300)에 제공한다(단계 S640).
그리고, 검색사용자 인터페이스(160)는 검색결과에 사용된 가격정보를 업로드한 사용자에 관한 정보를 상품가격 DB(130)로부터 획득하여 광고 정산부(170)에 전달하고, 광고 정산부(170)는 소정의 포인트 또는 리워드를 해당 사용자에게 적립한다(단계 S650).
이상, 본 발명을 몇가지 예를 들어 설명하였으나, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 반도체 기록매체, 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.
또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재할 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100 가격정보 제공서버,
120 영수증 인식부,
130 상품가격 DB,
140 검색엔진,
150 광고삽입부,
170 광고정산부,
200 모바일 단말,
300 검색단말.

Claims (20)

  1. 단말로부터 영수증 이미지를 수신하는 단계와,
    영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와,
    추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와,
    추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와,
    추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계
    를 구비하는 영수증 가격정보 추출방법.
  2. 제1항에 있어서, 상기 매장정보 추출단계는
    추출된 텍스트로부터 사업자등록번호 패턴을 찾아서 사업자 등록번호를 추출하는 단계와,
    추출된 사업자등록번호를 사용하여 사업자 데이터베이스에서 해당 사업자의 매장에 관한 정보를 추출하는 단계
    를 포함하는 영수증 가격정보 추출방법.
  3. 제2항에 있어서,
    추출된 사업자등록번호와 일치하는 사업자 등록번호가 상기 사업자 데이터베이스에 없는 경우에는 상기 추출된 텍스트로부터 주소 패턴, 전화번호 패턴 중의 적어도 하나를 찾아서 주소, 전화번호 중의 적어도 하나를 추출하고, 추출된 주소, 전화번호 중의 적어도 하나를 사용하여 상기 사업자 데이터베이스에서 일치하는 매장에 관한 정보를 추출하는 것을 특징으로 하는 영수증 가격정보 추출방법.
  4. 제3항에 있어서,
    상기 단말로부터 영수증 이미지를 수신할 때에 상기 단말의 위치정보도 함께 수신하며,
    상기 추출된 주소, 전화번호 중의 적어도 하나와 일치하는 매장이 상기 사업자 데이터페이스에 없는 경우에는 상기 위치정보에 해당하는 좌표로부터 소정 반경 이내에 존재하는 매장들을 상기 사업자 데이터베이스에서 검색하여 상기 영수증 이미지로부터 추출된 텍스트들과 비교하여 매칭율이 가장 높은 매장에 관한 정보를 추출하는 것을 특징으로 하는 영수증 가격정보 추출방법.
  5. 제4항에 있어서, 매칭율이 가장 높은 매장의 매칭율이 소정의 기준 이상인 경우에만 매장에 관한 정보를 추출하는 것을 특징으로 하는 영수증 가격정보 추출방법.
  6. 제2항 내지 제4항 중 어느 한 항에 있어서,
    상기 사업자의 매장에 관한 정보는 상호명, 주소, 전화번호를 포함하는 영수증 가격정보 추출방법.
  7. 제1항에 있어서, 상기 상품정보 추출단계는
    추출된 텍스트에서 개행되지 않은 한 행의 문자열("제1 문자열"이라 함) 중에서 '문자열("제2 문자열"이라 함) + 공백 + 숫자'의 패턴을 가진 행만 남기고 나머지 행은 제거하는 단계와,
    남은 각 행의 상기 제2 문자열에 대해서 상품명 사전 데이터베이스를 사용하여 상품명을 획득하고, 상기 숫자를 사용하여 해당 상품에 대한 가격을 획득하는 단계
    를 포함하는 영수증 가격정보 추출방법.
  8. 제7항에 있어서,
    '제2 문자열 + 공백 + 숫자'의 패턴을 가진 행 중에서 제2 문자열에 청구액, 총액, 합계를 포함하는 상품명과 관련없는 불용어가 포함된 행을 제거하는 단계를 더 포함하는 영수증 가격정보 추출방법.
  9. 제1항 내지 제5항, 제7항, 제8항 중 어느 한 항에 있어서,
    추출된 텍스트로부터 날짜정보를 추출하는 날짜정보 추출단계를 더 포함하며,
    추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장할 때에 날짜정보도 함께 연계하여 상품가격 데이터베이스에 저장하는 것을 특징으로 하는 영수증 가격정보 추출방법.
  10. 제1항 내지 제5항, 제7항, 제8항 중 어느 한 항에 있어서, 텍스트 추출단계 이후에 추출된 텍스트 중에서 명시적으로 추출대상이 아닌 불용단어를 제거하는 단계를 더 포함하는 영수증 가격정보 추출방법.
  11. 단말로부터 영수증 이미지를 수신하는 단계와,
    영수증 이미지로부터 텍스트를 추출하는 텍스트 추출단계와,
    추출된 텍스트로부터 매장정보를 추출하는 매장정보 추출단계와,
    추출된 텍스트로부터 상품명 및 가격을 포함하는 상품정보를 추출하는 상품정보 추출단계와,
    추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장하는 단계와,
    상품가격 검색요청을 수신하면 상품가격 검색요청에 포함된 검색조건에 맞는 가격정보를 포함하는 검색결과를 상품가격 데이터베이스에서 추출하여 사용자에게 제공하는 검색단계
    를 구비하는 영수증에서 추출한 가격정보 제공방법.
  12. 제11항에 있어서, 상기 매장정보 추출단계는
    추출된 텍스트로부터 사업자 등록번호 패턴을 찾아서 사업자 등록번호를 추출하는 단계와,
    추출된 사업자 등록번호를 사용하여 사업자 데이터베이스에서 해당 사업자의 매장에 관한 정보를 추출하는 단계
    를 포함하는 영수증에서 추출한 가격정보 제공방법.
  13. 제12항에 있어서,
    추출된 사업자 등록번호와 동일한 사업자 등록번호가 상기 사업자 데이터베이스에 없는 경우에는 상기 추출된 텍스트로부터 주소 패턴, 전화번호 패턴 중의 적어도 하나를 찾아서 주소, 전화번호 중의 적어도 하나를 추출하고, 추출된 주소, 전화번호 중의 적어도 하나를 사용하여 상기 사업자 데이터베이스에서 일치하는 매장에 관한 정보를 추출하는 것을 특징으로 하는 영수증에서 추출한 가격정보 제공방법.
  14. 제13항에 있어서,
    상기 단말로부터 영수증 이미지를 수신할 때에 상기 단말의 위치정보도 함께 수신하며,
    상기 추출된 주소, 전화번호 중의 적어도 하나와 일치하는 매장이 상기 사업자 데이터페이스에 없는 경우에는 상기 위치정보에 해당하는 좌표로부터 소정 반경 이내에 존재하는 매장들을 상기 사업자 데이터베이스에서 검색하여 상기 영수증 이미지로부터 추출된 텍스트들과 비교하여 매칭율이 가장 높은 매장에 관한 정보를 추출하는 것을 특징으로 하는 영수증에서 추출한 가격정보 제공방법.
  15. 제11항에 있어서, 상기 상품정보 추출단계는
    추출된 텍스트에서 개행되지 않은 한 행의 문자열("제1 문자열"이라 함) 중에서 '문자열("제2 문자열"이라 함) + 공백 + 숫자'의 패턴을 가진 행만 남기고 나머지 행은 제거하는 단계와,
    남은 각 행의 상기 제2 문자열에 대해서 상품명 사전 데이터베이스를 사용하여 상품명을 획득하고, 상기 숫자를 사용하여 해당 상품에 대한 가격을 획득하는 단계
    를 포함하는 영수증에서 추출한 가격정보 제공방법.
  16. 제15항에 있어서,
    '제2 문자열 + 공백 + 숫자'의 패턴을 가진 행 중에서 제2 문자열에 청구액, 총액, 합계를 포함하는 상품명과 관련없는 불용어가 포함된 행을 제거하는 단계를 더 포함하는 영수증에서 추출한 가격정보 제공방법.
  17. 제11항에 있어서,
    추출된 텍스트로부터 날짜정보를 추출하는 날짜정보 추출단계를 더 포함하며,
    추출된 매장정보와 상품정보를 연계하여 상품가격 데이터베이스에 저장할 때에 날짜정보도 함께 연계하여 상품가격 데이터베이스에 저장하는 것을 특징으로 하는 영수증에서 추출한 가격정보 제공방법.
  18. 제11항 내지 제17항 중 어느 한 항에 있어서,
    상기 검색조건에는 매장의 위치에 관한 조건, 상품의 가격대에 관한 조건, 상품에 관한 조건, 매장에 관한 조건 중의 적어도 하나가 포함되는, 영수증에서 추출한 가격정보 제공방법.
  19. 제11항 내지 제17항 중 어느 한 항에 있어서,
    검색결과를 사용자에게 제공할 때에 검색조건에 관련된 광고도 함께 제공하는 것을 특징으로 하는 영수증에서 추출한 가격정보 제공방법.
  20. 제19항에 있어서,
    검색결과에 포함된 가격정보를 업로드한 사용자에게 포인트를 적립하는 단계를 더 포함하는 것을 특징으로 하는 영수증에서 추출한 가격정보 제공방법.
KR1020150112999A 2015-08-11 2015-08-11 영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법 KR101771524B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150112999A KR101771524B1 (ko) 2015-08-11 2015-08-11 영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150112999A KR101771524B1 (ko) 2015-08-11 2015-08-11 영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법

Publications (2)

Publication Number Publication Date
KR20170019087A true KR20170019087A (ko) 2017-02-21
KR101771524B1 KR101771524B1 (ko) 2017-08-25

Family

ID=58314000

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150112999A KR101771524B1 (ko) 2015-08-11 2015-08-11 영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법

Country Status (1)

Country Link
KR (1) KR101771524B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210007227A (ko) * 2019-07-10 2021-01-20 다인에프씨 주식회사 치킨 비프랜차이즈 식재료 지원 방법
CN113205359A (zh) * 2021-04-27 2021-08-03 金蝶软件(中国)有限公司 单据中商品价格的确定方法、装置和计算机设备
KR102304921B1 (ko) * 2021-02-10 2021-09-27 주식회사 모비노마 견적서 등록을 통한 차량의 정비 이력 관리 방법
KR20230021281A (ko) * 2021-08-05 2023-02-14 문희태 지역 기반의 상품정보 공유를 위한 사용자인터페이스 및 이를 이용한 상품정보공유방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102226864B1 (ko) * 2019-05-14 2021-03-11 조성호 슈퍼마켓에서 발행되는 영수증 내 상품 명칭을 표준화된 상품 명칭으로 변경하여 영수증 정보를 저장하는 영수증 정보 관리 장치

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210007227A (ko) * 2019-07-10 2021-01-20 다인에프씨 주식회사 치킨 비프랜차이즈 식재료 지원 방법
KR102304921B1 (ko) * 2021-02-10 2021-09-27 주식회사 모비노마 견적서 등록을 통한 차량의 정비 이력 관리 방법
CN113205359A (zh) * 2021-04-27 2021-08-03 金蝶软件(中国)有限公司 单据中商品价格的确定方法、装置和计算机设备
CN113205359B (zh) * 2021-04-27 2024-04-05 金蝶软件(中国)有限公司 单据中商品价格的确定方法、装置和计算机设备
KR20230021281A (ko) * 2021-08-05 2023-02-14 문희태 지역 기반의 상품정보 공유를 위한 사용자인터페이스 및 이를 이용한 상품정보공유방법

Also Published As

Publication number Publication date
KR101771524B1 (ko) 2017-08-25

Similar Documents

Publication Publication Date Title
US8117071B1 (en) Method and system for matching via an image search query at a point of sale
US9646286B2 (en) System and method for automated retail product accounting
CN107291732B (zh) 一种信息推送方法及装置
KR101771524B1 (ko) 영수증으로부터 가격정보를 추출하는 방법 및 이를 이용하여 가격정보를 제공하는 방법
US20150006326A1 (en) Search Method and Apparatus Based on E-commerce Platform
US20180025398A1 (en) System, method and computer program product for tracking and correlating online user activities with sales of physical goods
US9129276B1 (en) Inventory management
JP5395920B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
US20140149240A1 (en) Method for collecting point-of-sale data
US10102537B2 (en) Methods, systems and computer readable media for utilizing payment card transaction data to conduct product price comparisons
US20140149846A1 (en) Method for collecting offline data
US20160180365A1 (en) Instant Multimedia-Based Customer Feedback System
KR101684680B1 (ko) 병행 수입품 가격 비교를 위한 독점 수입품 가격정보 제공 시스템 장치
US20220180379A1 (en) Transaction-based information processing system, method, and article
US20210073752A1 (en) Method, device and program for managing proofs of purchase
JP6042367B2 (ja) 資産管理サーバ、資産管理方法、及び、資産管理サーバ用プログラム
US20080071553A1 (en) Generation of Commercial Presentations
US20190004762A1 (en) Display control method, computer-readable recording medium, and display control apparatus
US20140046760A1 (en) Methods, systems, and computer readable media for identifying qualifying consumer offers
US20150379573A1 (en) Electronic content filtering server between a mobile computing device and an electronic receipt server
KR20120076489A (ko) 코드 기반의 가격 비교 서비스 및 프로모션 서비스 제공 시스템 및 방법
US20130110605A1 (en) Product recognition promotional offer matching
KR102564646B1 (ko) 온라인 상품 정보 자동 생성 방법 및 시스템
KR101764361B1 (ko) 소셜 네트워크 서비스 기반 쇼핑몰 서비스 제공 방법 및 이를 위한 장치
US20190318386A1 (en) Information processing method, program, information processing system, and information processing apparatus

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant