KR102555809B1 - 문서 양식을 웹폼으로 변환하는 방법 및 시스템 - Google Patents

문서 양식을 웹폼으로 변환하는 방법 및 시스템 Download PDF

Info

Publication number
KR102555809B1
KR102555809B1 KR1020220124832A KR20220124832A KR102555809B1 KR 102555809 B1 KR102555809 B1 KR 102555809B1 KR 1020220124832 A KR1020220124832 A KR 1020220124832A KR 20220124832 A KR20220124832 A KR 20220124832A KR 102555809 B1 KR102555809 B1 KR 102555809B1
Authority
KR
South Korea
Prior art keywords
document
layout
web
web form
text
Prior art date
Application number
KR1020220124832A
Other languages
English (en)
Inventor
박상일
Original Assignee
에스케이 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 주식회사 filed Critical 에스케이 주식회사
Priority to KR1020220124832A priority Critical patent/KR102555809B1/ko
Application granted granted Critical
Publication of KR102555809B1 publication Critical patent/KR102555809B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

문서 양식을 웹폼으로 변환하는 방법 및 시스템이 제공된다. 본 발명의 실시예에 따른 문서 양식을 웹폼으로 변환하는 방법은, 시스템이, 입력된 문서 양식에서 데이터를 추출하는 제1 단계; 및 시스템이, 추출된 데이터를 기반으로 웹폼을 생성하는 제2 단계;를 포함하고, 이때, 생성되는 웹폼은, 업무 프로세서 진행을 위한 워크 플로우를 구성하는 복수의 작업 절차 중 어느 하나에 매칭될 수 있다. 이에 의해, 문서 이미지에서 문서 양식을 추출하여 업무 프로세서 진행을 위해 워크 플로우를 구성하는 작업 절차에 매칭할 수 있는 웹 문서의 양식을 제공함으로써, 웹 상에서 각각의 작업 절차에서 필요로 하는 문서를 작성하는 작업의 업무 처리 효율을 향상시킬 수 있다.

Description

문서 양식을 웹폼으로 변환하는 방법 및 시스템{Method and system for converting document form to web form}
본 발명은 문서 양식을 웹폼으로 변환하는 방법 및 시스템에 관한 것으로, 더욱 상세하게는 문서 이미지에서 문서 양식을 추출하여 웹 환경에서 작성하거나 편집할 수 있는 웹 문서의 양식인 웹폼으로 변환하는 방법 및 시스템에 관한 것이다.
보편적으로 기업에서 특정 업무를 수행하기 위해 하나의 업무를 각각의 단계로 나누어 관리하는 방식이 주를 이루었다.
이러한 경우, 동일한 업무를 구성하는 각각의 작업 절차는, 업무를 진행함에 있어 필요한 자료가 각 단계별로 유기적으로 연결될 수 있으나, 각각의 작업 절차에서 필요로 하는 문서의 종류나 양식이 달라질 수 있다.
기존에는 각각의 작업 절차에서 필요로 하는 문서의 종류나 양식에 따라 각각의 문서를 Office 프로그램이나 Web Office 서비스를 이용하여 작성하였으나, Office 프로그램이나 Web Office 서비스는 문서를 작성하는 기능에 중심을 두고 있어, Office 프로그램이나 Web Office 상에서 작성된 문서를 활용하여 회사 내에서의 결재 등의 업무 등으로 확장하는데 그 한계가 존재한다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 문서 이미지에서 문서 양식을 추출하여 업무 프로세서 진행을 위해 워크 플로우를 구성하는 작업 절차에 매칭할 수 있는 웹 문서의 양식인 웹폼으로 변환하는 방법 및 시스템을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 문서 양식을 웹폼으로 변환하는 방법은, 시스템이, 입력된 문서 양식에서 데이터를 추출하는 제1 단계; 및 시스템이, 추출된 데이터를 기반으로 웹폼을 생성하는 제2 단계;를 포함하고, 이때, 생성되는 웹폼은, 업무 프로세서 진행을 위한 워크 플로우를 구성하는 복수의 작업 절차 중 문서 작업이 필요한 어느 하나에 매칭될 수 있다.
그리고 본 발명의 일 실시예에 따른, 문서 양식을 웹폼으로 변환하는 방법은, 시스템이, 생성된 웹폼을 워크 플로우를 구성하는 복수의 작업 절차 중 문서 작업이 필요한 어느 하나의 작업 절차에 매칭되도록 하는 제3 단계;를 더 포함할 수 있다.
또한, 시스템은, 특정 작업 절차의 진행 시, 해당 작업 절차에 매칭된 웹폼을 기반으로 웹 문서가 작성되면, 작성된 웹 문서를 해당 작업 절차에 매칭하여 등록할 수 있다.
그리고 제3 단계는, 생성된 제1 웹폼을 편집하여 제2 웹폼을 생성하는 경우, 사용자의 입력에 따라 제2 웹폼이 제1 웹폼이 매칭된 작업 절차와 다른 문서 작업이 필요한 작업 절차에 매칭되는 것을 허용할 수 있다.
또한, 제1 단계는, 입력된 문서 양식에서 레이아웃 데이터 및 텍스트 데이터를 분리하여 추출할 수 있다.
그리고 제2 단계는, 추출된 레이아웃 데이터를 기반으로 문서 양식의 레이아웃이 자동 작성되는 단계; 사용자의 입력에 따라 자동 작성된 레이아웃의 편집이 수행되는 단계; 및 편집된 레이아웃에 추출된 텍스트 데이터를 기입하여 문서 양식을 생성하는 단계;를 포함할 수 있다.
또한, 제1 단계는, 입력된 문서 양식에서 텍스트 데이터 추출 시, 수기로 작성된 텍스트는 제외하고, 프린트된 텍스트만 추출할 수 있다.
그리고 제2 단계는, 레이아웃 편집 시, 사용자의 입력에 따라 텍스트 데이터가 기입될 정형화된 영역들의 배치를 편집하고, 문서 양식 생성 시, 배치가 완료된 정형화된 영역들에 개별적으로 설정된 제한 조건이 허용하는 범주 내에서 텍스트 데이터를 기입할 수 있다.
한편, 본 발명의 다른 실시예에 따른, 문서 양식을 웹폼으로 변환하는 시스템은, 입력된 문서 양식에서 데이터를 추출하는 데이터 추출부; 및 추출된 데이터를 기반으로 웹폼을 생성하는 웹폼 생성부;를 포함하고, 이때, 생성되는 웹폼은, 업무 프로세서 진행을 위한 워크 플로우를 구성하는 복수의 작업 절차 중 문서 작업이 필요한 어느 하나에 매칭될 수 있다.
이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 문서 이미지에서 문서 양식을 추출하여 업무 프로세서 진행을 위해 워크 플로우를 구성하는 작업 절차에 매칭할 수 있는 웹 문서의 양식을 제공함으로써, 웹 상에서 각각의 작업 절차에서 필요로 하는 문서를 작성하는 작업의 업무 처리 효율을 향상시킬 수 있다.
도 1은, 본 발명의 일 실시예에 따른 문서 양식을 웹폼으로 변환하는 시스템의 구성 설명에 제공된 도면,
도 2는, 상기 도 1에 도시된 프로세서의 더욱 상세한 설명에 제공된 도면, 그리고
도 3은, 본 발명의 일 실시예에 따른 문서 양식을 웹폼으로 변환하는 방법의 설명에 제공된 흐름도이다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
도 1은, 본 발명의 일 실시예에 따른 문서 양식을 웹폼으로 변환하는 시스템의 구성 설명에 제공된 도면이다.
도 1을 참조하면, 본 실시예에 따른 문서 양식을 웹폼으로 변환하는 시스템(이하에서는 '시스템'으로 총칭하기로 함)은, 통신부(100), 프로세서(200), 입력부(300), 출력부(400) 및 저장부(500)를 포함한다.
통신부(100)는, 시스템이 외부와 통신 네트워크로 연결되도록 하기 위한 통신 수단이고, 입력부(300)는, 마우스, 키보드, 스캐너 등 사용자의 입력을 수신하는 입력 인터페이스 장치를 구비할 수 있다.
출력부(400)는, 프로세서(200)가 동작하여 출력하고자 하는 정보들을 화면에 출력하는 디스플레이 수단이고, 저장부(500)는, 프로세서(200)가 동작함에 있어 필요한 프로그램 및 데이터를 저장하는 저장매체이다.
프로세서(200)는, 시스템의 제반사항을 처리하기 위해 마련된다.
예를 들면, 프로세서(200)는, 입력된 문서 양식에서 데이터를 추출하여, 추출된 데이터를 기반으로 웹폼을 생성할 수 있다.
구체적으로 예를 들면, 프로세서(200)는, 통신부(100)를 통해, 외부로부터 문서 파일 또는 스캐닝된 문서 이미지를 수신하거나 또는 입력부(300)를 통해, 입력되는 문서 파일 또는 스캐닝되는 문서 이미지에서 레이아웃 데이터 및 텍스트 데이터를 추출할 수 있다.
또한, 프로세서(200)는, 생성된 웹폼을 워크 플로우를 구성하는 복수의 작업 절차 중 문서 작업이 필요한 어느 하나의 작업 절차에 매칭되도록 할 수 있다.
여기서, 프로세서(200)에 의해 생성되는 웹폼은, 업무 프로세서 진행을 위한 워크 플로우를 구성하는 복수의 작업 절차 중 어느 하나에 매칭될 수 있으며, 동시에, Web Office 상에서 각각의 고유한 양식에 따라 정형화된 영역을 기입할 수 있는 웹 문서의 양식을 의미한다.
도 2는, 상기 도 1에 도시된 프로세서의 더욱 상세한 설명에 제공된 도면이다.
도 2를 참조하면, 프로세서(200)는, 데이터 추출부(210), 웹폼 생성부(220) 및 워크 플로우 관리부(230)를 포함할 수 있다.
데이터 추출부(210)는, 입력된 문서 양식에서 데이터를 추출할 수 있다.
예를 들면, 데이터 추출부(210)는, 입력된 문서 양식에서 레이아웃 데이터 및 텍스트 데이터를 분리하여 추출할 수 있다.
구체적으로 예를 들면, 데이터 추출부(210)는, 입력된 문서 양식에서 텍스트를 객체로 검출하고, 검출된 객체가 포함된 영역을 나누는 테두리(선)를 추출할 수 있다.
여기서, 레이아웃 데이터는, 문서 내 페이지의 텍스트 데이터가 기입되는 전체 영역의 개수 및 각 영역의 크기 및 위치(배치) 등에 대한 정보가 포함될 수 있다.
또한, 데이터 추출부(210)는, 입력된 문서 양식에서 하나 이상의 텍스트 영역을 검출하고, 검출되는 하나 이상의 텍스트 영역의 크기 및 위치를 식별하여, 각각의 텍스트 영역을 대상으로 텍스트 데이터를 추출할 수 있다
예를 들면, 데이터 추출부(210)는, 입력된 문서 양식에서 텍스트 데이터 추출 시, 텍스트 영역 내 텍스트들을 분석하여 프린트된 활자와 수기로 작성된 활자를 분류하도록 학습된 인공지능 모델을 이용하여, 각각의 텍스트 영역을 프린트된 텍스트 영역과 수기로 작성된 텍스트 영역으로 분류하여, 수기로 작성된 텍스트는 제외하고, 프린트된 텍스트만 텍스트 데이터로 추출할 수 있다.
삭제
여기서, 해당 인공지능 모델은, 텍스트 영역 내 텍스트들의 활자 크기, 기울기, 활자 간 간격 등을 분석하여 프린트된 활자와 수기로 작성된 활자를 분류하도록 학습된 인공지능 모델일 수 있다.
이러한 인공지능 모델은, CNN(Convolutional Nerual Network), DNN(Depp Neural Network), GAN(Generative Adversarial Network), RNN(Recurrent Neural Network) 등과 같은 딥러닝 학습 모델일 수 있으며, 이러한 딥러닝 학습 모델은, 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 준지도 학습(semi supervised), 강화 학습(Reinforcement Learning)과 같은 머신러닝을 통해 학습될 수 있다.
웹폼 생성부(220)는, 추출된 데이터를 기반으로 웹폼을 생성할 수 있다.
구체적으로, 웹폼 생성부(220)는, 추출된 레이아웃 데이터를 기반으로 문서 양식의 레이아웃이 자동 작성되도록 할 수 있다.
즉, 웹폼 생성부(220)는, 추출된 레이아웃 데이터를 기반으로 입력된 문서 양식과 텍스트 등이 기입될 영역의 개수 및 각 영역의 크기 및 위치(배치) 등이 가능한 유사하게 구현된 웹폼의 레이아웃을 작성할 수 있다.
그리고 웹폼 생성부(220)는, 문서 양식의 레이아웃이 자동 작성된 이후, 사용자의 입력에 따라 자동 작성된 레이아웃의 편집을 수행할 수 있으며, 편집된 레이아웃에 추출된 텍스트 데이터를 기입하여 문서 양식을 생성할 수 있다.
예를 들면, 웹폼 생성부(220)는, 레이아웃 편집 시, 레이아웃이 자동 작성된 문서 양식에서 텍스트, 그림, 이미지 등이 기입될 영역의 개수를 조정하거나, 특정 영역의 크기, 위치(배치) 등을 조정하는 방식으로 자동 작성된 레이아웃의 편집할 수 있다
특히, 웹폼 생성부(220)는, 텍스트 데이터가 항목명/설명/비고 등으로 기입될 정형화된 영역들의 개수, 크기, 배치(위치)를 편집한 이후, 추출된 텍스트 데이터를 정형화된 각 영역에 개별적으로 기입하여, 문서 양식의 생성 작업을 완료할 수 있다.
이때, 웹폼 생성부(220)는, 문서 양식 생성 시, 배치가 완료된 정형화된 영역들에 개별적으로 설정된 제한 조건이 허용하는 범주 내에서 텍스트 데이터를 기입하여 문서 양식을 생성할 수 있다.
예를 들면, 웹폼 생성부(220)는, 사업자 등록번호 및 생년월일 등을 기입할 수 있는 특정 영역에 숫자에 해당하는 텍스트만 기입할 수 있도록 제한 조건이 설정되는 경우, 숫자가 아닌 텍스트를 기입하는 것을 제한함으로써, 해당 영역에 잘못된 텍스트가 기입되는 것을 방지할 수 있다.
워크 플로우 관리부(230)는, 사용자의 입력에 따라 업무 프로세스 진행을 위한 워크 플로우가 작성되도록 하고, 생성된 웹폼을 워크 플로우를 구성하는 복수의 작업 절차 중 어느 하나의 작업 절차에 매칭되도록 할 수 있다.
예를 들면, 워크 플로우 관리부(230)는, "검사 요청=> 접수=> 검사 결과서 작성=> 검사 결과 통보"로 구성되는 워크 플로우를 작성하고, 작성된 워크 플로우를 대상으로, 검사 요청 절차에 검사 요청서의 웹폼이 매칭되도록 하고, 검사 결과서 작성 절차에 검사 보고서의 웹폼이 매칭되도록 할 수 있다.
이를 통해, 업무 프로세서를 진행하는 사용자는, 해당 작업 절차에 매칭된 웹폼을 기반으로 웹 문서를 작성하여, 시스템에 등록하는 방식으로 특정 작업 절차를 진행할 수 있다.
여기서, 작성되는 워크 플로우는, 복수의 작업 절차가 순차적으로 배치되어 작성되는 순차 구간과 설정되는 분기 조건에 따라 둘 이상의 작업 절차가 병렬적으로 배치되어 작성되는 분기 구간을 포함할 수 있다.
워크 플로우 관리부(230)는, 둘 이상의 작업 절차가 병렬적으로 배치되는 분기 구간의 경우, 병렬적으로 배치되는 작업 절차에 따라 분기 조건을 단순화하여, 사용자가 분기 구간을 작성하는 부담을 최소화하도록 할 수 있다.
예를 들면, 워크 플로우 관리부(230)는, 접수 절차의 후속 절차로 배치되는 검사 결과서 작성 절차에서 '승인'과 '반려'라는 두 개의 선택지가 존재하는 경우, '승인'이라는 결과에 따른 후속 절차를 사용자가 배치(지정)하는 경우, '반려'라는 결과에 따른 후속 절차는 자동으로 종료 또는 재검사 요청 절차로 회귀하도록 할 수 있다.
워크 플로우 관리부(230)는, 이러한 분기 조건 자동 작성 기능을 위해, 병렬적으로 배치된 복수의 작업 절차를 분석하여 분기 조건을 작성하도록 학습된 인공지능 모델을 이용할 수 있다.
또한, 워크 플로우 관리부(230)는, 생성된 웹폼을 어느 작업 절차에 매칭하는 작업 전, 해당 웹폼의 속성 정보에 따라 기존 매칭 이력(기존 웹폼 및 작업 절차 간의 매칭 이력)을 기반으로 작성되는 매칭 추천 리스트가 제공되어, 매칭 작업을 수행하는 사용자에게 편의를 제공할 수 있다.
여기서, 웹폼의 속성 정보는, 해당 웹폼이 E-mail, 통보서, 요청서/신청서, 투자 의향서, 업무 기안서, 품질 평가서, 운영 메뉴얼, 내역서, Invoice와 같은 다양한 웹 문서 중 어느 웹 문서 유형의 웹폼에 해당하는지 파악(구분)할 수 있는 정보를 포함할 수 있다.
그리고 워크 플로우 관리부(230)는, 생성된 특정 웹폼(ex. 제1 웹폼)을 편집하여 다른 웹폼(ex. 제2 웹폼)을 생성하는 경우, 제2 웹폼이 제1 웹폼이 매칭된 작업 절차와 다른 작업 절차에 매칭되는 것을 허용하여, 사용자에게 편의를 제공할 수 있다.
즉, 같은 작업 절차에 이용되는 웹 문서라도 이를 처리하는 기업, 업무 프로세서 등에 따라 그 문서들의 웹폼이 서로 다를 수 있어, 워크 플로우 관리부(230)는, 기존에 생성된 제1 웹폼(ex. 검사 요청서)을 불러내어 편집하여 제2 웹폼(ex. 재검사 요청서)을 생성하는 것을 지원하고, 이때, 제2 웹폼(ex. 재검사 요청서)이 제1 웹폼(ex. 검사 요청서)이 매칭된 작업 절차(ex. 검사 요청 절차)와 다른 프로세서의 작업 절차 또는 동일 프로세서의 다른 작업 절차(ex. 재검사 요청 절차)에 매칭되는 것을 허용할 수 있다.
도 3은, 본 발명의 일 실시예에 따른 문서 양식을 웹폼으로 변환하는 방법의 설명에 제공된 흐름도이다.
본 실시예에 따른 문서 양식을 웹폼으로 변환하는 방법은 도 1 내지 도 2를 참조하여 전술한 시스템에 의해 실행될 수 있다.
도 3을 참조하면, 본 문서 양식을 웹폼으로 변환하는 방법은 시스템을 통해, 입력된 문서 양식에서 데이터를 추출하여(S310), 추출된 데이터를 기반으로 웹폼을 생성할 수 있다(S320).
그리고 문서 양식을 웹폼으로 변환하는 방법은 시스템을 통해, 생성된 웹폼을 워크 플로우를 구성하는 복수의 작업 절차 중 어느 하나의 작업 절차에 매칭되도록 할 수 있다(S330).
이를 통해, 웹 상에서 각각의 작업 절차에서 필요로 하는 문서를 작성하는 작업의 업무 처리 효율을 향상시킬 수 있다.
한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
100 : 통신부
200 : 프로세서
210 : 데이터 추출부
220 : 웹폼 생성부
230 : 워크 플로우 관리부
300 : 입력부
400 : 출력부
500 : 저장부

Claims (9)

  1. 시스템이, 입력된 문서 양식에서 데이터를 추출하는 제1 단계;
    시스템이, 추출된 데이터를 기반으로 웹폼을 생성하는 제2 단계; 및
    시스템이, 생성된 웹폼을 업무 프로세서 진행을 위한 워크 플로우를 구성하는 복수의 작업 절차 중 문서 작업이 필요한 어느 하나의 작업 절차에 매칭되도록 하는 제3 단계;를 포함하고,
    시스템은,
    특정 작업 절차의 진행 시, 해당 작업 절차에 매칭된 웹폼을 기반으로 웹 문서가 작성되면, 작성된 웹 문서를 해당 작업 절차에 매칭하여 등록하고,
    제3 단계는,
    생성된 제1 웹폼을 편집하여 제2 웹폼을 생성하는 경우, 사용자의 입력에 따라 제2 웹폼이 제1 웹폼이 매칭된 작업 절차와 다른 문서 작업이 필요한 작업 절차에 매칭되는 것을 허용하고,
    제1 단계는,
    입력된 문서 양식에서 레이아웃 데이터 및 텍스트 데이터를 분리하여 추출하며,
    제1 단계는,
    입력된 문서 양식에서 텍스트 데이터 추출 시, 텍스트 영역 내 텍스트들의 활자 크기, 기울기 및 활자 간 간격을 분석하여 프린트된 활자와 수기로 작성된 활자를 분류하도록 학습된 인공지능 모델을 이용하여, 각각의 텍스트 영역을 프린트된 텍스트 영역과 수기로 작성된 텍스트 영역으로 분류함으로써, 수기로 작성된 텍스트는 제외하고, 프린트된 텍스트만 추출하며,
    제2 단계는,
    추출된 레이아웃 데이터를 기반으로 문서 양식의 레이아웃이 자동 작성되는 단계;
    사용자의 입력에 따라 자동 작성된 레이아웃의 편집이 수행되는 단계; 및
    편집된 레이아웃에 추출된 텍스트 데이터를 기입하여 문서 양식을 생성하는 단계;를 포함하고,
    제2 단계는,
    레이아웃 편집 시, 사용자의 입력에 따라 텍스트 데이터가 기입될 정형화된 영역들의 배치를 편집하고,
    문서 양식 생성 시, 배치가 완료된 정형화된 영역들에 개별적으로 설정된 제한 조건이 허용하는 범주 내에서 텍스트 데이터를 기입하며,
    제2 단계는,
    문서 양식의 레이아웃이 자동 작성되는 경우, 추출된 레이아웃 데이터를 기반으로 입력된 문서 양식과 텍스트가 기입될 영역의 개수 및 각 영역의 크기 및 배치가 가능하게 구현된 웹폼의 레이아웃이 작성되며,
    제2 단계는,
    문서 양식의 레이아웃이 자동 작성된 이후, 사용자의 입력에 따라 자동 작성된 레이아웃의 편집이 수행되면, 편집된 레이아웃에 추출된 텍스트 데이터가 기입되어, 문서 양식이 생성되며,
    레이아웃 편집 시, 사용자의 입력에 따라 레이아웃이 자동 작성된 문서 양식에서 텍스트, 그림 및 이미지가 기입될 영역의 개수를 조정하거나, 또는 특정 영역의 크기, 배치를 조정하는 방식으로 자동 작성된 레이아웃이 편집되고,
    제3 단계는,
    생성된 웹폼을 어느 작업 절차에 매칭하는 작업이 수행되기 전, 해당 웹폼의 속성 정보에 따라 기존 웹폼 및 작업 절차 간의 매칭 이력을 기반으로 작성되는 매칭 추천 리스트가 제공되고,
    상기 웹폼의 속성 정보는,
    해당 웹폼이 복수의 웹 문서 유형 중 어느 웹 문서 유형의 웹폼에 해당하는지 구분할 수 있는 정보를 포함하는 것을 특징으로 하는 문서 양식을 웹폼으로 변환하는 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 입력된 문서 양식에서 데이터를 추출하는 데이터 추출부;
    추출된 데이터를 기반으로 웹폼을 생성하는 웹폼 생성부; 및
    생성된 웹폼을 업무 프로세서 진행을 위한 워크 플로우를 구성하는 복수의 작업 절차 중 문서 작업이 필요한 어느 하나의 작업 절차에 매칭되도록 하는 워크 플로우 관리부;를 포함하고,
    워크 플로우 관리부는,
    특정 작업 절차의 진행 시, 해당 작업 절차에 매칭된 웹폼을 기반으로 웹 문서가 작성되면, 작성된 웹 문서가 해당 작업 절차에 매칭되도록 하고,
    워크 플로우 관리부는,
    생성된 제1 웹폼을 편집하여 제2 웹폼을 생성하는 경우, 사용자의 입력에 따라 제2 웹폼이 제1 웹폼이 매칭된 작업 절차와 다른 문서 작업이 필요한 작업 절차에 매칭되는 것을 허용하고,
    데이터 추출부는,
    입력된 문서 양식에서 레이아웃 데이터 및 텍스트 데이터를 분리하여 추출하며,
    데이터 추출부는,
    입력된 문서 양식에서 텍스트 데이터 추출 시, 텍스트 영역 내 텍스트들의 활자 크기, 기울기 및 활자 간 간격을 분석하여 프린트된 활자와 수기로 작성된 활자를 분류하도록 학습된 인공지능 모델을 이용하여, 각각의 텍스트 영역을 프린트된 텍스트 영역과 수기로 작성된 텍스트 영역으로 분류함으로써, 수기로 작성된 텍스트는 제외하고, 프린트된 텍스트만 추출하며,
    웹폼 생성부는,
    추출된 레이아웃 데이터를 기반으로 문서 양식의 레이아웃이 자동 작성되도록 하고, 사용자의 입력에 따라 자동 작성된 레이아웃의 편집이 수행되면, 편집된 레이아웃에 추출된 텍스트 데이터를 기입하여 문서 양식을 생성하며,
    웹폼 생성부는,
    레이아웃 편집 시, 사용자의 입력에 따라 텍스트 데이터가 기입될 정형화된 영역들의 배치를 편집하고,
    문서 양식 생성 시, 배치가 완료된 정형화된 영역들에 개별적으로 설정된 제한 조건이 허용하는 범주 내에서 텍스트 데이터가 기입되도록 하며,
    웹폼 생성부는,
    문서 양식의 레이아웃이 자동 작성되는 경우, 추출된 레이아웃 데이터를 기반으로 입력된 문서 양식과 텍스트가 기입될 영역의 개수 및 각 영역의 크기 및 배치가 가능하게 구현된 웹폼의 레이아웃이 작성되며,
    웹폼 생성부는,
    문서 양식의 레이아웃이 자동 작성된 이후, 사용자의 입력에 따라 자동 작성된 레이아웃의 편집이 수행되면, 편집된 레이아웃에 추출된 텍스트 데이터가 기입되어, 문서 양식이 생성되며,
    레이아웃 편집 시, 사용자의 입력에 따라 레이아웃이 자동 작성된 문서 양식에서 텍스트, 그림 및 이미지가 기입될 영역의 개수를 조정하거나, 또는 특정 영역의 크기, 배치를 조정하는 방식으로 자동 작성된 레이아웃이 편집되고,
    워크 플로우 관리부는,
    생성된 웹폼을 어느 작업 절차에 매칭하는 작업이 수행되기 전, 해당 웹폼의 속성 정보에 따라 기존 웹폼 및 작업 절차 간의 매칭 이력을 기반으로 작성되는 매칭 추천 리스트가 제공되고,
    상기 웹폼의 속성 정보는,
    해당 웹폼이 복수의 웹 문서 유형 중 어느 웹 문서 유형의 웹폼에 해당하는지 구분할 수 있는 정보를 포함하는 것을 특징으로 하는 문서 양식을 웹폼으로 변환하는 시스템.
KR1020220124832A 2022-09-30 2022-09-30 문서 양식을 웹폼으로 변환하는 방법 및 시스템 KR102555809B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220124832A KR102555809B1 (ko) 2022-09-30 2022-09-30 문서 양식을 웹폼으로 변환하는 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220124832A KR102555809B1 (ko) 2022-09-30 2022-09-30 문서 양식을 웹폼으로 변환하는 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR102555809B1 true KR102555809B1 (ko) 2023-07-13

Family

ID=87160354

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220124832A KR102555809B1 (ko) 2022-09-30 2022-09-30 문서 양식을 웹폼으로 변환하는 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102555809B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170061683A (ko) * 2014-09-30 2017-06-05 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 레이아웃 의도 추론 기법
KR20190040537A (ko) * 2017-10-11 2019-04-19 (주)피터앤데이브 수행업무 보고를 위한 전자서식 형태의 폼 포맷 생성과 공유 시스템 및 방법
KR20210023271A (ko) * 2019-08-22 2021-03-04 주식회사 심플랩 전자문서를 생성하는 서버 및 그 방법
JP2021167990A (ja) * 2020-04-08 2021-10-21 Arithmer株式会社 レイアウト解析装置、その解析プログラムおよびその解析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170061683A (ko) * 2014-09-30 2017-06-05 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 레이아웃 의도 추론 기법
KR20190040537A (ko) * 2017-10-11 2019-04-19 (주)피터앤데이브 수행업무 보고를 위한 전자서식 형태의 폼 포맷 생성과 공유 시스템 및 방법
KR20210023271A (ko) * 2019-08-22 2021-03-04 주식회사 심플랩 전자문서를 생성하는 서버 및 그 방법
JP2021167990A (ja) * 2020-04-08 2021-10-21 Arithmer株式会社 レイアウト解析装置、その解析プログラムおよびその解析方法

Similar Documents

Publication Publication Date Title
US11354490B1 (en) Systems, methods, and computer readable media for creating slide presentations
EP3709245A1 (en) Generating a meeting review document that includes links to one or more documents reviewed
Villán Mastering OpenCV 4 with Python: a practical guide covering topics from image processing, augmented reality to deep learning with OpenCV 4 and Python 3.7
JP4676225B2 (ja) スキャン・ドキュメントから電子フォームに取り込むための方法および装置
JP5927809B2 (ja) タスク値付け技術
US20050289182A1 (en) Document management system with enhanced intelligent document recognition capabilities
US10970534B2 (en) Document processing system capture flow compiler
US11087409B1 (en) Systems and methods for generating accurate transaction data and manipulation
US9558467B1 (en) Systems and/or methods for grid-based multi-level digitization of enterprise models
US11625660B2 (en) Machine learning for automatic extraction and workflow assignment of action items
JP2012048723A (ja) コンテンツ・プライバシー保護のためのマイクロタスクを生成する技術
US20220121821A1 (en) Extracting data from documents using multiple deep learning models
US11755973B2 (en) System and method for intelligent contract guidance
US9135234B1 (en) Collaborative generation of digital content with interactive reports
Jayoma et al. OCR based document archiving and indexing using PyTesseract: A record management system for dswd caraga, Philippines
Kaluarachchi et al. A systematic literature review on automatic website generation
US20240143899A1 (en) Systems and methods for conversion of documents to reusable content types
KR102555809B1 (ko) 문서 양식을 웹폼으로 변환하는 방법 및 시스템
US20220374838A1 (en) Artificial Intelligence System and Method for Prioritizing Jobseekers
US11170211B2 (en) Information processing apparatus for extracting portions filled with characters from completed document without user intervention and non-transitory computer readable medium
US10990338B2 (en) Information processing system and non-transitory computer readable medium
Steenhuis et al. Weaving Pathways for Justice with GPT: LLM-driven automated drafting of interactive legal applications
Fernando Intelligent Document Processing: A Guide For Building RPA Solutions
KR102572130B1 (ko) 문서 이미지에서 문서 양식을 추출하는 방법 및 시스템
US20240233430A9 (en) System to extract checkbox symbol and checkbox option pertaining to checkbox question from a document

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant