KR20210077251A - 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법 - Google Patents

표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법 Download PDF

Info

Publication number
KR20210077251A
KR20210077251A KR1020190168680A KR20190168680A KR20210077251A KR 20210077251 A KR20210077251 A KR 20210077251A KR 1020190168680 A KR1020190168680 A KR 1020190168680A KR 20190168680 A KR20190168680 A KR 20190168680A KR 20210077251 A KR20210077251 A KR 20210077251A
Authority
KR
South Korea
Prior art keywords
image
matrix
mxn
text
texts
Prior art date
Application number
KR1020190168680A
Other languages
English (en)
Other versions
KR102328034B1 (ko
Inventor
안치연
윤영주
Original Assignee
주식회사 한글과컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한글과컴퓨터 filed Critical 주식회사 한글과컴퓨터
Priority to KR1020190168680A priority Critical patent/KR102328034B1/ko
Publication of KR20210077251A publication Critical patent/KR20210077251A/ko
Application granted granted Critical
Publication of KR102328034B1 publication Critical patent/KR102328034B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2291User-Defined Types; Storage management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • G06K9/00456
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)

Abstract

표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법이 개시된다. 본 발명에 따른 데이터베이스 구축 장치 및 그 동작 방법은 표가 삽입된 이미지에 대하여, 상기 이미지를 구성하는 복수의 화소들의 색상 값에 따른 이미지 행렬을 생성한 후, 상기 이미지 행렬에 수직선 필터와 수평선 필터를 적용하여 상기 이미지로부터 표를 구성하는 수직선들과 수평선들을 검출하고, 상기 수직선들과 상기 수평선들에 의해 생성되는 복수의 셀들에, 상기 이미지로부터 OCR을 통해 추출한 복수의 텍스트들을 삽입하여 제1 표가 삽입된 전자 문서를 생성하며, 상기 제1 표에 삽입된 필드명과 데이터를 기초로 하는 복수의 데이터 세트들을 데이터 저장소에 저장함으로써, 표가 삽입된 이미지로부터 지식 데이터베이스를 구축할 수 있다.

Description

표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법{DATABASE BUILDING DEVICE THAT CAN BUILD A KNOWLEDGE DATABASE FROM A TABLE-INSERTED IMAGE AND OPERATING METHOD THEREOF}
본 발명은 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법에 대한 것이다.
최근, 이미지로부터 문자를 인식할 수 있는 다양한 OCR(Optical Character Reader) 관련 기술들이 등장하면서, 이를 이용한 다양한 응용 서비스가 제공되고 있다.
예컨대, 이미지로부터 문자를 인식하여 해당 문자에 대한 자동 번역 기능을 제공하는 서비스나 주변 사물의 간판 이미지에서 문자를 인식하여 주변 사물에 대한 관련 정보를 인터넷을 통해 검색하여 제공하는 서비스들이 존재한다.
한편, 사람들은 병원에서 진료를 받은 뒤 진료비 영수증과 처방전을 받을 때 일반적으로 인쇄된 종이 문서 형태의 진료비 영수증과 처방전을 받는다. 또한, 학생들은 학교에서 시험을 치른 뒤, 인쇄된 종이 문서 형태의 시험 성적표를 받는다.
그러나, 종이 문서는 보관한 지 오래되면, 보관했던 장소를 잃어버릴 염려도 있고, 나중에 해당 문서를 참조할 필요가 있는 경우, 스마트폰과 같은 전자 기기를 통하여 바로바로 확인할 수 없다는 불편함이 있다.
관련하여, 종이 문서를 스캔하여 보관할 수 있으나, 스캔 이미지는 표가 삽입된 이미지라 하여도 전자 문서 형식이 아닌 단순한 이미지 파일 형식으로 저장되므로, 규격화 및 편집이 가능한 전자 문서 형식으로 기록하고 싶은 경우에는, 일일이 표를 만들고, 표를 구성하는 복수의 셀들에 텍스트들을 하나하나 입력하는 과정을 거쳐야 한다는 불편함이 있다.
만약, 표가 삽입된 스캔 이미지로부터 표를 구성하는 선을 추출하고, OCR을 이용하여 표 내부에 기록된 텍스트들을 추출함으로써, 스캔 이미지로부터 표가 삽입된 전자 문서를 생성할 수 있다면, 사용자의 편의를 도모할 수 있을 것이다.
더불어, 특정 업무 조직 내에서 표가 삽입된 전자 문서가 공유될 경우, 다른 사용자의 단말에서 작성된 표의 데이터를 쉽게 획득하지 못하는 경우를 대비하여, 상기 전자 문서에 포함된 표의 데이터들을 하나의 지식 데이터베이스로 구축할 수 있다면, 같은 업무 조직 내에 속하는 사용자들이 손쉽게 업무 관련 데이터를 공유할 수 있어 유용할 것이다.
따라서, 표가 삽입된 이미지를 전자 문서로 변환할 수 있고, 변환된 전자 문서에 삽입된 표의 데이터들을 기초로 지식 데이터베이스를 구축할 수 있는 기술에 대한 연구가 필요하다.
본 발명에 따른 데이터베이스 구축 장치 및 그 동작 방법은 표가 삽입된 이미지에 대하여, 상기 이미지를 구성하는 복수의 화소들의 색상 값에 따른 이미지 행렬을 생성한 후, 상기 이미지 행렬에 수직선 필터와 수평선 필터를 적용하여 상기 이미지로부터 표를 구성하는 수직선들과 수평선들을 검출하고, 상기 수직선들과 상기 수평선들에 의해 생성되는 복수의 셀들에, 상기 이미지로부터 OCR을 통해 추출한 복수의 텍스트들을 삽입하여 제1 표가 삽입된 전자 문서를 생성하며, 상기 제1 표에 삽입된 필드명과 데이터를 기초로 하는 복수의 데이터 세트들을 데이터 저장소에 저장함으로써, 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능하도록 지원하고자 한다.
본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치는 표를 구성하는 선의 색상으로 미리 정해진 색상 값 범위가 저장되어 있는 색상 값 저장부, 사용자로부터 제1 표 - 상기 제1 표는 첫 번째 행과 첫 번째 열 각각에 적어도 하나의 필드명이 삽입되어 있음 - 가 삽입된 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 기설정된(predetermined) 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성하는 행렬 생성부, OCR(Optical Character Reader)을 이용하여 상기 제1 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 텍스트 위치 정보 - 상기 텍스트 위치 정보는 상기 제1 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 이미지 내에서의 상대적 위치에 대한 정보를 의미함 - 를 텍스트 저장소에 서로 대응시켜 저장하는 텍스트 저장부, 상기 m x n의 이미지 행렬에 대해, 이미지 내에서의 수직선을 검출하기 위한 기설정된 m x n의 수직선 필터 행렬 - 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 기설정된 복수의 제1 열들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임 - 과 이미지 내에서의 수평선을 검출하기 위한 기설정된 m x n의 수평선 필터 행렬 - 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 기설정된 복수의 제1 행들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임 - 을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 복수의 수직선들과 복수의 수평선들을 검출하는 선 검출부, 상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 제2 표가 삽입된 전자 문서를 생성하는 전자 문서 생성부, 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 복수의 셀들에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료하는 텍스트 삽입부, 상기 제2 표의 구성이 완료되면, 상기 제2 표를 구성하는 상기 복수의 셀들에 삽입된 상기 복수의 텍스트들 중 첫 번째 행에 삽입된 적어도 하나의 제1 필드명과 첫 번째 열에 삽입된 적어도 하나의 제2 필드명을 확인한 후, 첫 번째 행과 첫 번째 열을 제외한 나머지 셀들에 삽입된 텍스트를 확인하는 텍스트 확인부, 상기 적어도 하나의 제1 필드명 중 하나인 세로 필드명과 상기 적어도 하나의 제2 필드명 중 하나인 가로 필드명, 및 상기 세로 필드명과 상기 가로 필드명에 대응되는 셀에 삽입된 텍스트를 하나의 데이터 세트로 구성함으로써, 상기 전자 문서에 삽입된 상기 제2 표로부터 복수의 데이터 세트들을 생성하는 데이터 세트 생성부 및 상기 복수의 데이터 세트들을 데이터 저장소에 저장함으로써, 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스의 구축을 완료하는 지식 데이터베이스 구축부를 포함한다.
또한, 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법은 표를 구성하는 선의 색상으로 미리 정해진 색상 값 범위가 저장되어 있는 색상 값 저장부를 유지하는 단계, 사용자로부터 제1 표 - 상기 제1 표는 첫 번째 행과 첫 번째 열 각각에 적어도 하나의 필드명이 삽입되어 있음 - 가 삽입된 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n개, 세로 m개의 기설정된 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성하는 단계, OCR을 이용하여 상기 제1 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 텍스트 위치 정보 - 상기 텍스트 위치 정보는 상기 제1 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 이미지 내에서의 상대적 위치에 대한 정보를 의미함 - 를 텍스트 저장소에 서로 대응시켜 저장하는 단계, 상기 m x n의 이미지 행렬에 대해, 이미지 내에서의 수직선을 검출하기 위한 기설정된 m x n의 수직선 필터 행렬 - 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 기설정된 복수의 제1 열들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임 - 과 이미지 내에서의 수평선을 검출하기 위한 기설정된 m x n의 수평선 필터 행렬 - 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 기설정된 복수의 제1 행들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임 - 을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 복수의 수직선들과 복수의 수평선들을 검출하는 단계, 상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 제2 표가 삽입된 전자 문서를 생성하는 단계, 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 복수의 셀들에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료하는 단계, 상기 제2 표의 구성이 완료되면, 상기 제2 표를 구성하는 상기 복수의 셀들에 삽입된 상기 복수의 텍스트들 중 첫 번째 행에 삽입된 적어도 하나의 제1 필드명과 첫 번째 열에 삽입된 적어도 하나의 제2 필드명을 확인한 후, 첫 번째 행과 첫 번째 열을 제외한 나머지 셀들에 삽입된 텍스트를 확인하는 단계, 상기 적어도 하나의 제1 필드명 중 하나인 세로 필드명과 상기 적어도 하나의 제2 필드명 중 하나인 가로 필드명, 및 상기 세로 필드명과 상기 가로 필드명에 대응되는 셀에 삽입된 텍스트를 하나의 데이터 세트로 구성함으로써, 상기 전자 문서에 삽입된 상기 제2 표로부터 복수의 데이터 세트들을 생성하는 단계 및 상기 복수의 데이터 세트들을 데이터 저장소에 저장함으로써, 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스의 구축을 완료하는 단계를 포함한다.
본 발명에 따른 데이터베이스 구축 장치 및 그 동작 방법은 표가 삽입된 이미지에 대하여, 상기 이미지를 구성하는 복수의 화소들의 색상 값에 따른 이미지 행렬을 생성한 후, 상기 이미지 행렬에 수직선 필터와 수평선 필터를 적용하여 상기 이미지로부터 표를 구성하는 수직선들과 수평선들을 검출하고, 상기 수직선들과 상기 수평선들에 의해 생성되는 복수의 셀들에, 상기 이미지로부터 OCR을 통해 추출한 복수의 텍스트들을 삽입하여 제1 표가 삽입된 전자 문서를 생성하며, 상기 제1 표에 삽입된 필드명과 데이터를 기초로 하는 복수의 데이터 세트들을 데이터 저장소에 저장함으로써, 표가 삽입된 이미지로부터 지식 데이터베이스를 구축할 수 있다.
도 1은 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 구조를 도시한 도면이다.
도 2 내지 도 4는 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치를 설명하기 위한 도면이다.
도 5는 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법을 도시한 순서도이다.
이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.
본 문서에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 본 발명의 다양한 실시예들에 있어서, 각 구성요소들, 기능 블록들 또는 수단들은 하나 또는 그 이상의 하부 구성요소로 구성될 수 있고, 각 구성요소들이 수행하는 전기, 전자, 기계적 기능들은 전자회로, 집적회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들 또는 기계적 요소들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수도 있다.
한편, 첨부된 블록도의 블록들이나 흐름도의 단계들은 범용 컴퓨터, 특수용 컴퓨터, 휴대용 노트북 컴퓨터, 네트워크 컴퓨터 등 데이터 프로세싱이 가능한 장비의 프로세서나 메모리에 탑재되어 지정된 기능들을 수행하는 컴퓨터 프로그램 명령들(instructions)을 의미하는 것으로 해석될 수 있다. 이들 컴퓨터 프로그램 명령들은 컴퓨터 장치에 구비된 메모리 또는 컴퓨터에서 판독 가능한 메모리에 저장될 수 있기 때문에, 블록도의 블록들 또는 흐름도의 단계들에서 설명된 기능들은 이를 수행하는 명령 수단을 내포하는 제조물로 생산될 수도 있다. 아울러, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 명령들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 가능한 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 정해진 순서와 달리 실행되는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 실질적으로 동시에 수행되거나, 역순으로 수행될 수 있으며, 경우에 따라 일부 블록들 또는 단계들이 생략된 채로 수행될 수도 있다.
도 1은 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 구조를 도시한 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치(110)는 색상 값 저장부(111), 행렬 생성부(112), 텍스트 저장부(113), 선 검출부(114), 전자 문서 생성부(115), 텍스트 삽입부(116), 데이터 세트 생성부(117) 및 지식 데이터베이스 구축부(118)를 포함한다.
색상 값 저장부(111)에는 표를 구성하는 선의 색상으로 미리 정해진 색상 값 범위가 저장되어 있다.
예컨대, 도 2 내지 도 4에서 볼 수 있듯이, 표를 구성하는 선의 색상이 하늘색 계열의 색상으로 이루어진 경우, 색상 값 저장부(111)에는 표를 구성하는 선의 색상으로 하늘색 계열의 색상 값 범위가 저장되어 있을 수 있다.
행렬 생성부(112)는 사용자로부터 제1 표가 삽입된 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 기설정된(predetermined) 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성한다.
여기서, 상기 제1 표는 첫 번째 행과 첫 번째 열 각각에 적어도 하나의 필드명이 삽입되어 있다.
예컨대, 상기 제1 표는 도 2의 도면부호 210에 도시된 그림과 같이, 첫 번째 행(211)과 첫 번째 열(212)에 필드명이 삽입되어 있고, 내부 셀(213)에 각 필드명에 매칭되는 데이터가 삽입되어 있을 수 있다.
이때, 본 발명의 일실시예에 따르면, 행렬 생성부(112)는 평균 값 연산부(120) 및 행렬 생성 처리부(121)를 포함할 수 있다.
평균 값 연산부(120)는 상기 사용자로부터 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n개, 세로 m개의 상기 기설정된 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산한다.
행렬 생성 처리부(121)는 상기 사각 영역들 중 상기 복수의 화소들의 색상 값의 평균 값이 상기 색상 값 범위에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 상기 색상 값 범위에 포함되지 않는 사각 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, 상기 m x n의 이미지 행렬을 생성한다.
예컨대, 도 2의 도면부호 210과 같이, 표가 삽입된 '이미지 1'(210)이 존재한다고 가정하자.
평균 값 연산부(120)는 사용자로부터 표가 삽입된 '이미지 1'(210)에 대한 지식 데이터베이스 구축 명령이 수신되면, '이미지 1'(210)을 가로 n개, 세로 m개의 상기 기설정된 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산할 수 있다.
여기서, n이 '34', m이 '22'라고 가정하면, 평균 값 연산부(120)는 '이미지 1'(210)을 도면부호 220과 같이 가로 '34'개, 세로 '22'개의 기설정된 크기의 사각 영역들(220)로 분할할 수 있고, 사각 영역들(220) 각각에 대해, 사각 영역들(220) 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산할 수 있다.
구체적으로, 평균 값 연산부(120)는 사각 영역들(220) 중 표를 구성하는 선의 영역(221)에 대해 하늘색 계열의 색상 값의 평균 값을 연산할 수 있고, 표 내부의 배경을 구성하는 영역(222)에 대해 하얀색 계열의 색상 값의 평균 값을 연산할 수 있으며, 글자를 구성하는 영역(223)에 대해 검은색 계열의 색상 값의 평균 값을 연산할 수 있다.
이후, 행렬 생성 처리부(121)는 사각 영역들(220) 중 상기 복수의 화소들의 색상 값의 평균 값이 앞선 예에서의 상기 색상 값 범위인 하늘색 계열에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 상기 색상 값 범위인 하늘색 계열에 포함되지 않는 사각 영역에 대해 0의 코드를 할당함으로써, '이미지 1'(210)을 이진화할 수 있다.
즉, 행렬 생성 처리부(121)는 사각 영역들(220) 중 표를 구성하는 선의 영역(221)에 대해서는 1의 코드를 할당하고, 표 내부의 배경을 구성하는 영역(222)과 글자를 구성하는 영역(223)에 대해서는 0의 코드를 할당하여 '이미지 1'(210)을 이진화함으로써, 도면부호 230과 같은 '22' x '34'의 이미지 행렬(230)을 생성할 수 있다.
텍스트 저장부(113)는 OCR(Optical Character Reader)을 이용하여 상기 제1 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 텍스트 위치 정보를 텍스트 저장소(미도시)에 서로 대응시켜 저장한다.
여기서, 상기 텍스트 위치 정보는 상기 제1 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 이미지 내에서의 상대적 위치에 대한 정보를 의미한다.
또한, 상기 OCR은 종이에 인쇄되거나 손으로 쓴 문자를 광학적 수단에 의해 인식하여 컴퓨터 텍스트로 변환하는 입력 장치를 의미하는 것으로, 스마트폰을 통한 전자상거래 결제 시, 결제하려는 신용카드에 대한 정보를 직접 입력하는 대신 스마트폰에 내장된 카메라를 통해 촬영함으로써, 촬영된 신용카드의 이미지에서 카드 번호와 유효 기간 등이 자동으로 추출되는 등에 활용될 수 있다.
관련해서, 도 3의 '이미지 1'(210)에 삽입된 표에는 'A', 'B', '가', '나', '데이터 1', '데이터 2', '데이터 3' 및 '데이터 4'라는 복수의 텍스트들이 입력되어 있다.
도 3을 참조하면, 텍스트 저장부(113)는 OCR을 이용하여 '이미지 1'(210) 내에 존재하는 상기 복수의 텍스트들인 'A', 'B', '가', '나', '데이터 1', '데이터 2', '데이터 3' 및 '데이터 4'를 추출한 후, 상기 복수의 텍스트들인 'A', 'B', '가', '나', '데이터 1', '데이터 2', '데이터 3' 및 '데이터 4'와 상기 복수의 텍스트들 각각에 대한 '이미지 1'(210) 내에서의 텍스트 위치 정보를 텍스트 저장소에 서로 대응시켜 저장할 수 있다.
구체적으로, 텍스트 저장부(113)는 상기 복수의 텍스트들 중 'A'에 대한 텍스트 위치 정보로 '이미지 1'(210)의 최좌측 상단 지점(311)에서 'A'에 대한 텍스트 중간 지점(312)까지의 수평 거리(313)와 수직 거리(314)를 측정한 후, 'A'와, 'A'에 대한 텍스트 위치 정보인 수평 거리(313) 및 수직 거리(314)를 상기 텍스트 저장소에 서로 대응시켜 저장할 수 있다.
그리고 텍스트 저장부(113)는 같은 방식으로 'B', '가', '나', '데이터 1', '데이터 2', '데이터 3' 및 '데이터 4'에 대해서도 텍스트 위치 정보를 획득하여, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 텍스트 위치 정보를 상기 텍스트 저장소에 서로 대응시켜 저장할 수 있다.
선 검출부(114)는 상기 m x n의 이미지 행렬에 대해, 이미지 내에서의 수직선을 검출하기 위한 기설정된 m x n의 수직선 필터 행렬과 이미지 내에서의 수평선을 검출하기 위한 기설정된 m x n의 수평선 필터 행렬을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 복수의 수직선들과 복수의 수평선들을 검출한다.
여기서, 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 기설정된 복수의 제1 열들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬이고, 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 기설정된 복수의 제1 행들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬이다.
관련해서, 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 상기 복수의 열들 중 미리 정해진 표 양식에 따라, 수직선에 대응하는 영역에 1의 코드가 할당되고, 수직선에 대응하지 않는 영역에 0의 코드가 할당되도록 미리 구성되어 있을 수 있다.
마찬가지로, 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 상기 복수의 행들 중 미리 정해진 표 양식에 따라, 수평선에 대응하는 영역에 1의 코드가 할당되고, 수평선에 대응하지 않는 영역에 0의 코드가 할당되도록 미리 구성되어 있을 수 있다.
이때, 본 발명의 일실시예에 따르면, 선 검출부(114)는 연산부(122) 및 선 검출 처리부(123)를 포함할 수 있다.
연산부(122)는 상기 m x n의 이미지 행렬과 상기 m x n의 수직선 필터 행렬 간의 아다마르 곱(Hadamard product)을 연산하여 m x n의 제1 연산 행렬을 생성하고, 상기 m x n의 이미지 행렬과 상기 m x n의 수평선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제2 연산 행렬을 생성한 후, 상기 m x n의 제1 연산 행렬과 상기 m x n의 제2 연산 행렬 간의 논리합 연산(OR)을 수행하여 m x n의 제3 연산 행렬을 생성한다.
여기서, 아다마르 곱이란 같은 크기의 행렬 또는 벡터에서 각 성분을 곱하는 연산을 의미하는 것으로, '[a b c]'와 '[x y z]'라는 두 행렬이 있을 때, 상기 두 행렬 간의 아다마르 곱을 연산한 행렬은 '[ax by cz]'로 나타낼 수 있다.
선 검출 처리부(123)는 상기 제1 이미지에서, 상기 m x n의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 상기 복수의 수직선들과 상기 복수의 수평선들을 검출한다.
관련해서, 상기 제1 이미지에 대한 상기 m x n의 이미지 행렬이 하기의 수학식 1과 같은 '9' x '7' 행렬이라고 가정하고, 상기 m x n의 수직선 필터 행렬이 하기의 수학식 2와 같은 '9' x '7' 행렬이라고 가정하며, 상기 m x n의 수평선 필터 행렬이 하기의 수학식 3과 같은 '9' x '7' 행렬이라고 가정하고, 연산부(122)와 선 검출 처리부(123)의 동작을 설명하면 다음과 같다.
Figure pat00001
Figure pat00002
Figure pat00003
우선, 연산부(122)는 하기의 수학식 4와 같이 상기 '9' x '7'의 이미지 행렬과 상기 '9' x '7'의 수직선 필터 행렬 간의 아다마르 곱을 연산함으로써, 미리 정해진 표 양식에 따라 수직선에 대응하는 영역과 일치하는 영역만이 검출되도록 '9' x '7'의 제1 연산 행렬을 생성할 수 있다.
Figure pat00004
그리고, 연산부(122)는 하기의 수학식 5와 같이, 상기 '9' x '7'의 이미지 행렬과 상기 '9' x '7'의 수평선 필터 행렬 간의 아다마르 곱을 연산함으로써, 상기 미리 정해진 표 양식에 따라 수평선에 대응하는 영역과 일치하는 영역만이 검출되도록 '9' x '7'의 제2 연산 행렬을 생성할 수 있다.
Figure pat00005
그 이후, 연산부(122)는 하기의 수학식 6과 같이, 상기 '9' x '7'의 제1 연산 행렬과 상기 '9' x '7'의 제2 연산 행렬 간의 논리합 연산(OR)을 수행함으로써, '9' x '7'의 제3 연산 행렬을 생성할 수 있다.
Figure pat00006
이렇게, 연산부(122)를 통해, 상기 수학식 6에서와 같은 상기 '9' x '7'의 제3 연산 행렬이 생성되면, 선 검출 처리부(123)는 제1 이미지에서, 상기 '9' x '7'의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 도 4에 도시된 그림과 같이, 상기 제1 이미지로부터 상기 제1 표를 구성하는 복수의 수직선들과 복수의 수평선들을 검출할 수 있다.
전자 문서 생성부(115)는 상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 제2 표가 삽입된 전자 문서를 생성한다.
텍스트 삽입부(116)는 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 복수의 셀들에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료한다.
이때, 본 발명의 일실시예에 따르면, 텍스트 삽입부(116)는 삽입 지점 연산부(124) 및 삽입 처리부(125)를 포함할 수 있다.
삽입 지점 연산부(124)는 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각에 대한 상기 전자 문서 내에서의 텍스트 삽입 지점을 연산한다.
여기서, 상기 텍스트 삽입 지점은 상기 전자 문서의 최좌측 상단 지점을 기준으로 상기 텍스트 위치 정보에 따른 위치를 연산한 지점을 의미한다.
삽입 처리부(125)는 상기 복수의 텍스트들 각각에 대하여, 상기 전자 문서에 삽입된 상기 제2 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀을 확인한 후, 상기 복수의 텍스트들 각각을 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료한다.
예컨대, 전술한 예에 따라 도 3을 참조하여 설명하면, 삽입 지점 연산부(124)는 우선, 상기 복수의 텍스트들 중 'A'에 대한 텍스트 위치 정보인 '이미지 1'(210)의 최좌측 상단 지점(311)에서 'A'에 대한 텍스트 중간 지점(312)까지의 수평 거리(313)와 수직 거리(314)를 기초로, 상기 전자 문서 내에서의 최좌측 상단 지점을 기준으로 한 수직 거리(313)와 수평 거리(314)에 따른 지점을 연산함으로써, 'A'에 대한 텍스트 삽입 지점을 연산할 수 있다.
이와 같은 방식으로, 삽입 지점 연산부(124)는 'B', '가', '나', '데이터 1', '데이터 2', '데이터 3' 및 '데이터 4'에 대해서도, '이미지 1'(210) 내에서의 상기 텍스트 위치 정보를 기초로, 'B', '가', '나', '데이터 1', '데이터 2', '데이터 3' 및 '데이터 4' 각각에 대한 상기 전자 문서 내에서의 텍스트 삽입 지점을 연산할 수 있다.
이후, 삽입 처리부(125)는 상기 복수의 텍스트들인 'A', 'B', '가', '나', '데이터 1', '데이터 2', '데이터 3' 및 '데이터 4' 각각에 대하여, 상기 전자 문서에 삽입된 상기 제2 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀을 확인한 후, 상기 복수의 텍스트들 각각을 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료할 수 있다.
이렇게, 데이터베이스 구축 장치(110)는 상기 제1 이미지로부터 검출된 상기 복수의 수직선들과 상기 복수의 수평선들에 의해 구성되는 상기 제2 표가 삽입된 상기 전자 문서에, 상기 제1 이미지로부터 추출된 상기 복수의 텍스트들을 삽입함으로써, 상기 제1 이미지에 삽입된 상기 제1 표와 동일하게 구성된 표인 상기 제2 표가 삽입된 전자 문서가 생성되도록 지원할 수 있다.
그리고, 텍스트 확인부(117)는 상기 제2 표의 구성이 완료되면, 상기 제2 표를 구성하는 상기 복수의 셀들에 삽입된 상기 복수의 텍스트들 중 첫 번째 행에 삽입된 적어도 하나의 제1 필드명과 첫 번째 열에 삽입된 적어도 하나의 제2 필드명을 확인한 후, 첫 번째 행과 첫 번째 열을 제외한 나머지 셀들에 삽입된 텍스트를 확인한다.
데이터 세트 생성부(118)는 상기 적어도 하나의 제1 필드명 중 하나인 세로 필드명과 상기 적어도 하나의 제2 필드명 중 하나인 가로 필드명, 및 상기 세로 필드명과 상기 가로 필드명에 대응되는 셀에 삽입된 텍스트를 하나의 데이터 세트로 구성함으로써, 상기 전자 문서에 삽입된 상기 제2 표로부터 복수의 데이터 세트들을 생성한다.
지식 데이터베이스 구축부(119)는 상기 복수의 데이터 세트들을 데이터 저장소(미도시)에 저장함으로써, 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스의 구축을 완료한다.
관련해서, 앞선 예에 따라 '이미지 1'(210)에 삽입된 표와 동일하게 구성된 상기 제2 표의 구성이 완료되면, 텍스트 확인부(117)는 상기 제2 표를 구성하는 상기 복수의 셀들에 삽입된 상기 복수의 텍스트들인 'A', 'B', '가', '나', '데이터 1', '데이터 2', '데이터 3' 및 '데이터 4' 중 첫 번째 행에 삽입된 적어도 하나의 제1 필드명으로 'A' 및 'B'를 확인하고, 첫 번째 열에 삽입된 적어도 하나의 제2 필드명으로 '가' 및 '나'를 확인한 후, 첫 번째 행과 첫 번째 열을 제외한 나머지 셀들에 삽입된 텍스트로 '데이터 1', '데이터 2', '데이터 3' 및 '데이터 4'를 확인할 수 있다.
데이터 세트 생성부(118)는 상기 적어도 하나의 제1 필드명 중 'A'라고 하는 세로 필드명과 상기 적어도 하나의 제2 필드명 중 '가'라고 하는 가로 필드명, 및 'A'와 '가'에 대응되는 셀에 삽입된 '데이터 1'을 '(A, 가, 데이터 1)'이라고 하는 하나의 데이터 세트로 구성하는 방식으로, 'A', 'B'와 '가', '나' 각각에 대응하는 데이터 세트들을 구성함으로써, 상기 전자 문서에 삽입된 상기 제2 표로부터 복수의 데이터 세트들인 '(A, 가, 데이터 1)', '(A, 나, 데이터 2)', '(B, 가, 데이터 3)' 및 '(B, 나, 데이터 4)'를 생성할 수 있다.
지식 데이터베이스 구축부(119)는 상기 복수의 데이터 세트들인 '(A, 가, 데이터 1)', '(A, 나, 데이터 2)', '(B, 가, 데이터 3)' 및 '(B, 나, 데이터 4)'를 데이터 저장소에 저장함으로써, 표가 삽입된 '이미지 1'(210)에 대한 지식 데이터베이스의 구축을 완료할 수 있다.
도 5는 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법을 도시한 순서도이다.
단계(S510)에서는 표를 구성하는 선의 색상으로 미리 정해진 색상 값 범위가 저장되어 있는 색상 값 저장부를 유지한다.
단계(S520)에서는 사용자로부터 제1 표(상기 제1 표는 첫 번째 행과 첫 번째 열 각각에 적어도 하나의 필드명이 삽입되어 있음)가 삽입된 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n개, 세로 m개의 기설정된 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성한다.
단계(S530)에서는 OCR을 이용하여 상기 제1 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 텍스트 위치 정보(상기 텍스트 위치 정보는 상기 제1 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 이미지 내에서의 상대적 위치에 대한 정보를 의미함)를 텍스트 저장소에 서로 대응시켜 저장한다.
단계(S540)에서는 상기 m x n의 이미지 행렬에 대해, 이미지 내에서의 수직선을 검출하기 위한 기설정된 m x n의 수직선 필터 행렬(상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 기설정된 복수의 제1 열들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임)과 이미지 내에서의 수평선을 검출하기 위한 기설정된 m x n의 수평선 필터 행렬(상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 기설정된 복수의 제1 행들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임)을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 복수의 수직선들과 복수의 수평선들을 검출한다.
단계(S550)에서는 상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 제2 표가 삽입된 전자 문서를 생성한다.
단계(S560)에서는 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 복수의 셀들에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료한다.
단계(S570)에서는 상기 제2 표의 구성이 완료되면, 상기 제2 표를 구성하는 상기 복수의 셀들에 삽입된 상기 복수의 텍스트들 중 첫 번째 행에 삽입된 적어도 하나의 제1 필드명과 첫 번째 열에 삽입된 적어도 하나의 제2 필드명을 확인한 후, 첫 번째 행과 첫 번째 열을 제외한 나머지 셀들에 삽입된 텍스트를 확인한다.
단계(S580)에서는 상기 적어도 하나의 제1 필드명 중 하나인 세로 필드명과 상기 적어도 하나의 제2 필드명 중 하나인 가로 필드명, 및 상기 세로 필드명과 상기 가로 필드명에 대응되는 셀에 삽입된 텍스트를 하나의 데이터 세트로 구성함으로써, 상기 전자 문서에 삽입된 상기 제2 표로부터 복수의 데이터 세트들을 생성한다.
단계(S590)에서는 상기 복수의 데이터 세트들을 데이터 저장소에 저장함으로써, 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스의 구축을 완료한다.
이때, 본 발명의 일실시예에 따르면, 단계(S520)에서는 상기 사용자로부터 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n개, 세로 m개의 상기 기설정된 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산하는 단계 및 상기 사각 영역들 중 상기 복수의 화소들의 색상 값의 평균 값이 상기 색상 값 범위에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 상기 색상 값 범위에 포함되지 않는 사각 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성하는 단계를 포함할 수 있다.
또한, 본 발명의 일실시예에 따르면, 단계(S540)에서는 상기 m x n의 이미지 행렬과 상기 m x n의 수직선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제1 연산 행렬을 생성하고, 상기 m x n의 이미지 행렬과 상기 m x n의 수평선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제2 연산 행렬을 생성한 후, 상기 m x n의 제1 연산 행렬과 상기 m x n의 제2 연산 행렬 간의 논리합 연산을 수행하여 m x n의 제3 연산 행렬을 생성하는 단계 및 상기 제1 이미지에서, 상기 m x n의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 상기 복수의 수직선들과 상기 복수의 수평선들을 검출하는 단계를 포함할 수 있다.
또한, 본 발명의 일실시예에 따르면, 단계(S560)에서는 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각에 대한 상기 전자 문서 내에서의 텍스트 삽입 지점(상기 텍스트 삽입 지점은 상기 전자 문서의 최좌측 상단 지점을 기준으로 상기 텍스트 위치 정보에 따른 위치를 연산한 지점을 의미함)을 연산하는 단계 및 상기 복수의 텍스트들 각각에 대하여, 상기 전자 문서에 삽입된 상기 제2 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀을 확인한 후, 상기 복수의 텍스트들 각각을 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료하는 단계를 포함할 수 있다.
이상, 도 5를 참조하여 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법은 도 1 내지 도 4를 이용하여 설명한 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.
본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.
또한, 본 발명의 일실시예에 따른 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
110: 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치
111: 색상 값 저장부 112: 행렬 생성부
113: 텍스트 저장부 114: 선 검출부
115: 전자 문서 생성부 116: 텍스트 삽입부
117: 텍스트 확인부 118: 데이터 세트 생성부
119: 지식 데이터베이스 구축부 120: 평균 값 연산부
121: 행렬 생성 처리부 122: 연산부
123: 선 검출 처리부 124: 삽입 지점 연산부
125: 삽입 처리부

Claims (10)

  1. 표를 구성하는 선의 색상으로 미리 정해진 색상 값 범위가 저장되어 있는 색상 값 저장부;
    사용자로부터 제1 표 - 상기 제1 표는 첫 번째 행과 첫 번째 열 각각에 적어도 하나의 필드명이 삽입되어 있음 - 가 삽입된 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 기설정된(predetermined) 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성하는 행렬 생성부;
    OCR(Optical Character Reader)을 이용하여 상기 제1 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 텍스트 위치 정보 - 상기 텍스트 위치 정보는 상기 제1 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 이미지 내에서의 상대적 위치에 대한 정보를 의미함 - 를 텍스트 저장소에 서로 대응시켜 저장하는 텍스트 저장부;
    상기 m x n의 이미지 행렬에 대해, 이미지 내에서의 수직선을 검출하기 위한 기설정된 m x n의 수직선 필터 행렬 - 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 기설정된 복수의 제1 열들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임 - 과 이미지 내에서의 수평선을 검출하기 위한 기설정된 m x n의 수평선 필터 행렬 - 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 기설정된 복수의 제1 행들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임 - 을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 복수의 수직선들과 복수의 수평선들을 검출하는 선 검출부;
    상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 제2 표가 삽입된 전자 문서를 생성하는 전자 문서 생성부;
    상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 복수의 셀들에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료하는 텍스트 삽입부;
    상기 제2 표의 구성이 완료되면, 상기 제2 표를 구성하는 상기 복수의 셀들에 삽입된 상기 복수의 텍스트들 중 첫 번째 행에 삽입된 적어도 하나의 제1 필드명과 첫 번째 열에 삽입된 적어도 하나의 제2 필드명을 확인한 후, 첫 번째 행과 첫 번째 열을 제외한 나머지 셀들에 삽입된 텍스트를 확인하는 텍스트 확인부;
    상기 적어도 하나의 제1 필드명 중 하나인 세로 필드명과 상기 적어도 하나의 제2 필드명 중 하나인 가로 필드명, 및 상기 세로 필드명과 상기 가로 필드명에 대응되는 셀에 삽입된 텍스트를 하나의 데이터 세트로 구성함으로써, 상기 전자 문서에 삽입된 상기 제2 표로부터 복수의 데이터 세트들을 생성하는 데이터 세트 생성부; 및
    상기 복수의 데이터 세트들을 데이터 저장소에 저장함으로써, 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스의 구축을 완료하는 지식 데이터베이스 구축부
    를 포함하는 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치.
  2. 제1항에 있어서,
    상기 행렬 생성부는
    상기 사용자로부터 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n개, 세로 m개의 상기 기설정된 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산하는 평균 값 연산부; 및
    상기 사각 영역들 중 상기 복수의 화소들의 색상 값의 평균 값이 상기 색상 값 범위에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 상기 색상 값 범위에 포함되지 않는 사각 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, 상기 m x n의 이미지 행렬을 생성하는 행렬 생성 처리부
    를 포함하는 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치.
  3. 제1항에 있어서,
    상기 선 검출부는
    상기 m x n의 이미지 행렬과 상기 m x n의 수직선 필터 행렬 간의 아다마르 곱(Hadamard product)을 연산하여 m x n의 제1 연산 행렬을 생성하고, 상기 m x n의 이미지 행렬과 상기 m x n의 수평선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제2 연산 행렬을 생성한 후, 상기 m x n의 제1 연산 행렬과 상기 m x n의 제2 연산 행렬 간의 논리합 연산(OR)을 수행하여 m x n의 제3 연산 행렬을 생성하는 연산부; 및
    상기 제1 이미지에서, 상기 m x n의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 상기 복수의 수직선들과 상기 복수의 수평선들을 검출하는 선 검출 처리부
    를 포함하는 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치.
  4. 제1항에 있어서,
    상기 텍스트 삽입부는
    상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각에 대한 상기 전자 문서 내에서의 텍스트 삽입 지점 - 상기 텍스트 삽입 지점은 상기 전자 문서의 최좌측 상단 지점을 기준으로 상기 텍스트 위치 정보에 따른 위치를 연산한 지점을 의미함 - 을 연산하는 삽입 지점 연산부; 및
    상기 복수의 텍스트들 각각에 대하여, 상기 전자 문서에 삽입된 상기 제2 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀을 확인한 후, 상기 복수의 텍스트들 각각을 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료하는 삽입 처리부
    를 포함하는 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치.
  5. 표를 구성하는 선의 색상으로 미리 정해진 색상 값 범위가 저장되어 있는 색상 값 저장부를 유지하는 단계;
    사용자로부터 제1 표 - 상기 제1 표는 첫 번째 행과 첫 번째 열 각각에 적어도 하나의 필드명이 삽입되어 있음 - 가 삽입된 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n(n은 2이상의 자연수임)개, 세로 m(m은 2이상의 자연수임)개의 기설정된(predetermined) 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 중 상기 색상 값 범위에 대응되는 색상을 갖는 사각 영역에 대해 1의 코드를 할당하고, 나머지 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, m x n의 이미지 행렬을 생성하는 단계;
    OCR(Optical Character Reader)을 이용하여 상기 제1 이미지 내에 존재하는 복수의 텍스트들을 추출한 후, 상기 복수의 텍스트들과 상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 텍스트 위치 정보 - 상기 텍스트 위치 정보는 상기 제1 이미지의 최좌측 상단 지점을 기준으로 한 각 텍스트의 상기 제1 이미지 내에서의 상대적 위치에 대한 정보를 의미함 - 를 텍스트 저장소에 서로 대응시켜 저장하는 단계;
    상기 m x n의 이미지 행렬에 대해, 이미지 내에서의 수직선을 검출하기 위한 기설정된 m x n의 수직선 필터 행렬 - 상기 m x n의 수직선 필터 행렬은 상기 m x n의 수직선 필터 행렬을 구성하는 복수의 열들 중 기설정된 복수의 제1 열들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 열들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임 - 과 이미지 내에서의 수평선을 검출하기 위한 기설정된 m x n의 수평선 필터 행렬 - 상기 m x n의 수평선 필터 행렬은 상기 m x n의 수평선 필터 행렬을 구성하는 복수의 행들 중 기설정된 복수의 제1 행들을 구성하는 성분에 1의 코드가 할당되어 있고, 나머지 행들을 구성하는 성분에 0의 코드가 할당되어 있는 행렬임 - 을 기초로 한 행렬 연산을 수행함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 복수의 수직선들과 복수의 수평선들을 검출하는 단계;
    상기 복수의 수직선들과 상기 복수의 수평선들에 의해 생성되는 복수의 셀들을 확인한 후, 상기 복수의 셀들로 구성되는 제2 표가 삽입된 전자 문서를 생성하는 단계;
    상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각을 상기 복수의 셀들에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료하는 단계;
    상기 제2 표의 구성이 완료되면, 상기 제2 표를 구성하는 상기 복수의 셀들에 삽입된 상기 복수의 텍스트들 중 첫 번째 행에 삽입된 적어도 하나의 제1 필드명과 첫 번째 열에 삽입된 적어도 하나의 제2 필드명을 확인한 후, 첫 번째 행과 첫 번째 열을 제외한 나머지 셀들에 삽입된 텍스트를 확인하는 단계;
    상기 적어도 하나의 제1 필드명 중 하나인 세로 필드명과 상기 적어도 하나의 제2 필드명 중 하나인 가로 필드명, 및 상기 세로 필드명과 상기 가로 필드명에 대응되는 셀에 삽입된 텍스트를 하나의 데이터 세트로 구성함으로써, 상기 전자 문서에 삽입된 상기 제2 표로부터 복수의 데이터 세트들을 생성하는 단계; 및
    상기 복수의 데이터 세트들을 데이터 저장소에 저장함으로써, 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스의 구축을 완료하는 단계
    를 포함하는 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법.
  6. 제5항에 있어서,
    상기 m x n의 이미지 행렬을 생성하는 단계는
    상기 사용자로부터 상기 제1 표가 삽입된 상기 제1 이미지에 대한 지식 데이터베이스 구축 명령이 수신되면, 상기 제1 이미지를 가로 n개, 세로 m개의 상기 기설정된 크기의 사각 영역들로 분할한 후, 상기 사각 영역들 각각에 대해, 상기 사각 영역들 각각을 구성하는 복수의 화소들의 색상 값의 평균 값을 연산하는 단계; 및
    상기 사각 영역들 중 상기 복수의 화소들의 색상 값의 평균 값이 상기 색상 값 범위에 포함되는 사각 영역에 대해 1의 코드를 할당하고, 상기 색상 값 범위에 포함되지 않는 사각 영역에 대해 0의 코드를 할당하여 상기 제1 이미지를 이진화함으로써, 상기 m x n의 이미지 행렬을 생성하는 단계
    를 포함하는 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법.
  7. 제5항에 있어서,
    상기 복수의 수직선들과 상기 복수의 수평선들을 검출하는 단계는
    상기 m x n의 이미지 행렬과 상기 m x n의 수직선 필터 행렬 간의 아다마르 곱(Hadamard product)을 연산하여 m x n의 제1 연산 행렬을 생성하고, 상기 m x n의 이미지 행렬과 상기 m x n의 수평선 필터 행렬 간의 아다마르 곱을 연산하여 m x n의 제2 연산 행렬을 생성한 후, 상기 m x n의 제1 연산 행렬과 상기 m x n의 제2 연산 행렬 간의 논리합 연산(OR)을 수행하여 m x n의 제3 연산 행렬을 생성하는 단계; 및
    상기 제1 이미지에서, 상기 m x n의 제3 연산 행렬을 구성하는 성분들 중 1의 코드가 할당된 성분들에 대응되는 지점들을 선을 구성하는 영역으로 확인함으로써, 상기 제1 이미지로부터 상기 제1 표를 구성하는 상기 복수의 수직선들과 상기 복수의 수평선들을 검출하는 단계
    를 포함하는 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법.
  8. 제5항에 있어서,
    상기 제2 표의 구성을 완료하는 단계는
    상기 복수의 텍스트들 각각에 대한 상기 제1 이미지 내에서의 상기 텍스트 위치 정보를 기초로, 상기 복수의 텍스트들 각각에 대한 상기 전자 문서 내에서의 텍스트 삽입 지점 - 상기 텍스트 삽입 지점은 상기 전자 문서의 최좌측 상단 지점을 기준으로 상기 텍스트 위치 정보에 따른 위치를 연산한 지점을 의미함 - 을 연산하는 단계; 및
    상기 복수의 텍스트들 각각에 대하여, 상기 전자 문서에 삽입된 상기 제2 표를 구성하는 상기 복수의 셀들 중 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀을 확인한 후, 상기 복수의 텍스트들 각각을 상기 복수의 텍스트들 각각에 대한 상기 텍스트 삽입 지점을 포함하는 셀에 삽입함으로써, 상기 전자 문서에 삽입된 상기 제2 표의 구성을 완료하는 단계
    를 포함하는 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치의 동작 방법.
  9. 제5항 내지 제8항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
  10. 제5항 내지 제8항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램.
KR1020190168680A 2019-12-17 2019-12-17 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법 KR102328034B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190168680A KR102328034B1 (ko) 2019-12-17 2019-12-17 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190168680A KR102328034B1 (ko) 2019-12-17 2019-12-17 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법

Publications (2)

Publication Number Publication Date
KR20210077251A true KR20210077251A (ko) 2021-06-25
KR102328034B1 KR102328034B1 (ko) 2021-11-17

Family

ID=76629066

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190168680A KR102328034B1 (ko) 2019-12-17 2019-12-17 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법

Country Status (1)

Country Link
KR (1) KR102328034B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102413162B1 (ko) * 2021-12-30 2022-06-24 주식회사 다리소프트 차량에 탑재된 정보 수집 단말과의 연동을 통해 도로 상의 위험물의 실제 크기를 추정할 수 있는 위험물 정보 관리 서버 및 그 동작 방법
KR102413157B1 (ko) * 2021-12-30 2022-06-24 주식회사 다리소프트 차량에 탑재된 정보 수집 단말과의 연동을 통해 도로 상의 위험물 정보를 수집하여 관리할 수 있는 위험물 정보 관리 서버 및 그 동작 방법

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10164337A (ja) * 1996-11-28 1998-06-19 Nippon Denki Ido Tsushin Kk Faxデータの電子メール転送システム
JP2002312208A (ja) * 2001-04-11 2002-10-25 Mitsubishi Electric Corp データウェアハウスシステム
JP4181892B2 (ja) * 2003-02-21 2008-11-19 キヤノン株式会社 画像処理方法
JP2009277006A (ja) * 2008-05-14 2009-11-26 Fuji Xerox Co Ltd 情報処理装置、文書管理システム、情報処理システム、及びプログラム
KR101445171B1 (ko) * 2014-03-28 2014-10-02 주식회사 한글과컴퓨터 종이 문서에 대한 전자 문서 변환 장치 및 방법
KR101739540B1 (ko) * 2016-01-27 2017-06-08 주식회사 솔트룩스 통합 지식베이스 구축 시스템 및 방법
KR101797573B1 (ko) * 2016-05-23 2017-11-14 주식회사 한글과컴퓨터 웹 기반의 스프레드시트 서비스 제공 장치 및 방법
KR101846342B1 (ko) * 2016-09-30 2018-04-09 주식회사 아이온커뮤니케이션즈 전자문서 관리방법을 컴퓨터에서 실행시키기 위한 프로그램을 저장한 기록매체 및 전자문서 관리 시스템
KR101907029B1 (ko) * 2017-08-24 2018-10-12 (주) 더존비즈온 서식 자동화를 위한 테이블 생성 장치 및 방법
CN108804400A (zh) * 2018-06-13 2018-11-13 深圳市轱辘汽车维修技术有限公司 一种电子文档处理方法、装置及相关设备
KR20190095651A (ko) * 2018-02-07 2019-08-16 삼성에스디에스 주식회사 문자 학습 트레이닝 데이터 생성 장치 및 그 방법

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10164337A (ja) * 1996-11-28 1998-06-19 Nippon Denki Ido Tsushin Kk Faxデータの電子メール転送システム
JP2002312208A (ja) * 2001-04-11 2002-10-25 Mitsubishi Electric Corp データウェアハウスシステム
JP4181892B2 (ja) * 2003-02-21 2008-11-19 キヤノン株式会社 画像処理方法
JP2009277006A (ja) * 2008-05-14 2009-11-26 Fuji Xerox Co Ltd 情報処理装置、文書管理システム、情報処理システム、及びプログラム
KR101445171B1 (ko) * 2014-03-28 2014-10-02 주식회사 한글과컴퓨터 종이 문서에 대한 전자 문서 변환 장치 및 방법
KR101739540B1 (ko) * 2016-01-27 2017-06-08 주식회사 솔트룩스 통합 지식베이스 구축 시스템 및 방법
KR101797573B1 (ko) * 2016-05-23 2017-11-14 주식회사 한글과컴퓨터 웹 기반의 스프레드시트 서비스 제공 장치 및 방법
KR101846342B1 (ko) * 2016-09-30 2018-04-09 주식회사 아이온커뮤니케이션즈 전자문서 관리방법을 컴퓨터에서 실행시키기 위한 프로그램을 저장한 기록매체 및 전자문서 관리 시스템
KR101907029B1 (ko) * 2017-08-24 2018-10-12 (주) 더존비즈온 서식 자동화를 위한 테이블 생성 장치 및 방법
KR20190095651A (ko) * 2018-02-07 2019-08-16 삼성에스디에스 주식회사 문자 학습 트레이닝 데이터 생성 장치 및 그 방법
CN108804400A (zh) * 2018-06-13 2018-11-13 深圳市轱辘汽车维修技术有限公司 一种电子文档处理方法、装置及相关设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102413162B1 (ko) * 2021-12-30 2022-06-24 주식회사 다리소프트 차량에 탑재된 정보 수집 단말과의 연동을 통해 도로 상의 위험물의 실제 크기를 추정할 수 있는 위험물 정보 관리 서버 및 그 동작 방법
KR102413157B1 (ko) * 2021-12-30 2022-06-24 주식회사 다리소프트 차량에 탑재된 정보 수집 단말과의 연동을 통해 도로 상의 위험물 정보를 수집하여 관리할 수 있는 위험물 정보 관리 서버 및 그 동작 방법
WO2023128112A1 (ko) * 2021-12-30 2023-07-06 주식회사 다리소프트 차량에 탑재된 정보 수집 단말과의 연동을 통해 도로 상의 위험물 정보를 수집하여 관리할 수 있는 위험물 정보 관리 서버 및 그 동작 방법

Also Published As

Publication number Publication date
KR102328034B1 (ko) 2021-11-17

Similar Documents

Publication Publication Date Title
CN110442744B (zh) 提取图像中目标信息的方法、装置、电子设备及可读介质
US10339378B2 (en) Method and apparatus for finding differences in documents
US8958644B2 (en) Creating tables with handwriting images, symbolic representations and media images from forms
CN106373447A (zh) 一种智能阅卷系统及方法
US9298685B2 (en) Automatic creation of multiple rows in a table
KR102328034B1 (ko) 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법
JP6882362B2 (ja) 身元確認書類を含む画像を識別するシステムおよび方法
CN109447019B (zh) 基于图像识别与数据库存储的纸质扫描文档电子化方法
CN108304815A (zh) 一种数据获取方法、装置、服务器及存储介质
CN104408403B (zh) 一种二次录入不一致的仲裁方法及装置
KR102234172B1 (ko) 디지털 트윈 책장 제공 장치 및 방법
KR102300475B1 (ko) 표가 삽입된 이미지를 전자 문서로 변환할 수 있는 전자 장치 및 그 동작 방법
KR102352726B1 (ko) 종이로 인쇄된 진료비 영수증을 전자 문서로 변환할 수 있는 전자 장치 및 그 동작 방법
JP5878004B2 (ja) 複数文書認識システム及び複数文書認識方法
JP2020017149A (ja) 情報処理装置及び情報処理方法
KR102375566B1 (ko) 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치 및 그 동작 방법
JP4474231B2 (ja) 文書リンク情報取得システム
Pattnaik et al. A Framework to Detect Digital Text Using Android Based Smartphone
Van Nguyen et al. Digitalization of Administrative Documents A Digital Transformation Step in Practice
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
JP2020053891A (ja) 情報処理装置、情報処理方法及びプログラム
EP4379677A1 (en) Image processing system, image processing method, and program
EP4379678A1 (en) Image processing system, image processing method, and program
JPH0384681A (ja) 名刺情報の入力処理方法
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right