KR19980057376A - 문자인식기를 이용한 데이터베이스 구축방법 - Google Patents

문자인식기를 이용한 데이터베이스 구축방법 Download PDF

Info

Publication number
KR19980057376A
KR19980057376A KR1019960076660A KR19960076660A KR19980057376A KR 19980057376 A KR19980057376 A KR 19980057376A KR 1019960076660 A KR1019960076660 A KR 1019960076660A KR 19960076660 A KR19960076660 A KR 19960076660A KR 19980057376 A KR19980057376 A KR 19980057376A
Authority
KR
South Korea
Prior art keywords
data
database
input
error
found
Prior art date
Application number
KR1019960076660A
Other languages
English (en)
Inventor
임기용
Original Assignee
이준
한국전기통신공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이준, 한국전기통신공사 filed Critical 이준
Priority to KR1019960076660A priority Critical patent/KR19980057376A/ko
Publication of KR19980057376A publication Critical patent/KR19980057376A/ko

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
문서화된 자료를 데이터베이스화 하는데 사용하는 자료 입력방법임
2. 발명이 해결하려고 하는 기술적 과제
양식화된 자료의 내용을 일일이 수작업으로 입력할 필요없이 공지된 문자 인식기능을 이용하여 스캐닝된 이미지화일을 아스키화일로 변환하고, 그중 테이블 생성기에 의해 선정된 항목의 자료는 데이터베이스에 자동입력되도록 하는 문자인식기를 이용한 데이터베이스 구축방법을 제공하고자 함
3. 발명의 해결방법의 요지
데이터베이스에 입력될 자료를 포함하고 있는 문서를 스캐너로 읽어 이미지화일로 변환하는 단계; 상기 이미지화일을 아스키화일로 변환하는 단계; 변환된 아스키화일중 운용자가 지정하는 데이터베이스화 할 항목들을 선정하고 그 각각에 저장될 데이터의 포맷을 운용자의 요구에 따라 지정하는 단계; 각각의 항목에 따른 테이블생성문을 운용자의 의도에 따라 생성하고 실행하여 상기 데이터베이스에 실제로 해당 테이블들이 생성되도록 하는 단계; 및 상기 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하고 데이터입력을 실행하는 단계를 포함하는 것을 특징으로 함
4. 발명의 중요한 용도
문서화된 자료를 데이터베이스화 하는데 이용됨

Description

문자인식기를 이용한 데이터베이스 구축방법
본 발명은 문서화된 자료를 데이터베이스화 하는 기술에 관한 것으로, 특히 기존의 양식화된 자료의 내용을 일일이 수작업으로 입력할 필요없이 공지된 문자인식기능을 이용하여 자동입력되도록 하는 데이터베이스 구축방법에 관한 것이다.
종래의 데이터베이스 구축방법을 간단히 살펴보면, 자료가 입력될 항목의 테이블과 배열위치가 정해진 고정된 시스템에서, 운용자가 문서형식으로 정리된 자료를 보면서 일일이 수작업으로 입력한 후, 제대로 입력되었는지를 검증하는 과정을 거치는 것이 통예이다. 그러나, 상기한 바와 같은 기존의 방법에 의하면, 많은 량의 데이터를 처리하는 경우에 인력과 소요시간이 과다하게 요구될 뿐만아니라, 입력과정에서 발생될 수 있는 인위적인 오류에 인해 데이터베이스의 신뢰성을 크게 저하시키며, 항상 그에 대한 검증 및 정정작업 등을 필요케하는 문제점을 내포하고 있다.
따라서, 본 발명은 상기한 바와 같이 종래기술의 제반 문제점을 해결하기 위해 안출된 것으로서, 양식화된 자료의 내용을 일일이 수작업으로 입력할 필요없이 공지된 문자 인식기능을 이용하여 스캐닝된 이미지화일을 아스키화일로 변환하고,그중 테이블 생성기에 의해 선정된 항목의 자료는 데이터베이스에 자동입력되도록 하는 문자인식기를 이용한 데이터베이스 구축방법을 제공함에 그 목적을 두고 있다.
도 1은 본 발명이 적용되는 데이터베이스 시스템의 개략적인 구성을 나타낸 블럭도,
도 2A 및 도 2B는 본 발명에 따른 문자인식기를 이용한 데이터베이스 구축방법의 일실시예 흐름도,
도 3A는 데이터베이스 구축시 사용되는 일반적인 입력서식의 일예시도,
도 3B는 상기 도 3A의 일반적인 입력서식을 스캐닝하여 아스키화일로 변환한 예시도,
도 4는 상기 도 3B의 아스키로 변환된 파일중 데이터베이스에 구비되어야 하는 항목의 테이블을 생성하기 위한 테이블생성문(SQL)의 일예시도,
도 5는 생성된 테이블에 데이터를 입력하기 위한 데이터입력문(SQL)의 일예시도.
* 도면의 주요부분에 대한 부호의 설명
10 : 워크스테이션, 11 : 데이터베이스 관리시스테(DBMS), 12 : 데이터베이스(DB), 20 : 단말 컴퓨터, 21 : 문자인식기, 22 : 테이블생성기, 23 : 자료입력기, 30 : 스캐너
상기 목적을 달성하기 위하여 본 발명은, 데이터베이스에 입력될 자료를 포함하고 있는 문서를 스캐너로 읽어 이미지화일로 변환하는 제 1 단계; 상기 스캐너로부터 입력되는 이미지화일을 문자인식기를 통해 아스키화일로 변환하는 제 2 단계; 상기 문서인식기에 의해 변환된 아스키화일중 운용자가 지정하는 데이터베이스화 할 항목들을 선정하고 그 각각에 저장될 데이터의 포맷을 운용자의 요구에 따라 지정하는 제 3 단계; 각각의 항목에 따른 테이블생성문을 운용자의 의도에 따라 생성하고 실행하여 상기 데이터베이스에 실제로 해당 테이블들이 생성되도록 하는 제 4 단계; 및 상기 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하고 데이터입력을 실행하는 제 5 단계를 포함하는 것을 특징으로 한다.
또한, 상기 제 1 단계 수행후, 생성된 화일을 단말 컴퓨터로 보내기 전에, 스캐닝작업시 오류가 발생되었는지를 확인하여 오류발생이 발견되면 상기 문서를 바르게 재장착한 후 스캐닝을 반복하는 제 6 단계; 상기 제 2 단계 수행후, 화일 변환상의 오류가 있었는지를 확인하여, 오류가 발견되면 수정하는 제 7 단계; 및 상기 제 5 단계 수행후, 입력완료된 결과내용을 검사하여 입력오류가 발견되는지 여부를 확인하고, 입력오류가 발견되면 그 내용을 수정하여 바로잡는 제 8 단계를 더 포함하는 것을 특징으로 한다.
그리고, 상기 제 4 단계는, 상기 제 3 단계에서 선정된 각각의 항목에 따른 테이블생성문을 작성하는 과정; 상기 테이블생성문을 검사하여 오류가 발견되면 수정하는 과정; 및 상기 테이블생성문을 실행하여 상기 데이터베이스에 실제로 해당 테이블 들이 생성되도록 하는 과정을 포함하여 이루어지는 것을 특징으로 하며, 상기 제 5 단계는, 상기 제 4 단계에 의해 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하는 과정; 상기 데이터 입력문에 오류가 있는지를 확인하여 오류가 발견되면 수정하는 과정; 및 상기 데이터입력문을 실행하여 상기 데이터베이스의 테이블들에 각각 해당되는 실제의 데이터들이 입력되도록 하는 과정을 포함하여 이루어지는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명의 일실시예를 상세히 설명한다.
도 1은 본 발명이 적용되는 데이터베이스 시스템의 예로서, 그 개략적인 구성을 나타낸 블록도이다. 도면에서 10은 워크스테이션, 11은 데이터베이스 관리시스템(DBMS), 12는 데이터베이스(DB), 20은 단말 컴퓨터, 21은 문자인식기, 22는 테이블생성기, 23은 자료입력기, 30은 스캐너를 각각 나타낸 것이다.
본 발명이 적용되는 데이터베이스 시스템의 일예는 도면에 도시된 바와 같이, 자료가 저장되는 데이터베이스(DB)(12)와 상기 데이터베이스를 관리하고 효율적으로 운용하는 소프트웨어인 데이터베이스 관리시스템(일반적으로 DBMS라 함)(11)을 구비하고 있으며 다수의 단말 컴퓨터가 연결가능하고 그들의 서버(Servr)로 동작하는 워크스테이션(10)과, 상기 워크스테이션(10)에 연결되어 있으며 입력되는 이미지화일을 아스키코드의 문자로 변환해주는 공지의 문서인식 소프트웨어(이하 간단히 문자인식기라 함)(21)와 데이터베이스에 저장할 자료의 항목 및 데이터 형식을 지정하는 소프트웨어(이하 간단히 테이블 생성기라 함)(22)와 판독된 입력자료중 지정된 항목의 자료를 지정된 저장형식에 따라 데이터베이스에 저장하는 소프트웨어(이하 간단히 자료입력기라 함)를 구비하고 있으며 상기 서버(Server)로 동작하는 워크스테이션(10)에 대해 클라이언트(Client) 기능을 수행하는 다수의 단말 컴퓨터(20)와, 상기 단말 컴퓨터(20)에 연결되어 있으며 문서를 판독하여 이미지화일로 출력하는 스캐너(30)로 이루어진다.
이는 데이터베이스에 저장될 자료의 양이 방대하고, 그 자료들을 공유하면서 이용할 단말 컴퓨터의 수가 많은 경우의 데이터베이스 시스템이며, 그 규모 및 특성에 따라 이와 달리 다양하게 구축할 수 있다.
도 2A 및 도 2B는 본 발명에 따른 문자인식기를 이용한 데이터베이스 구축방법의 일실시예 흐름도이다. 그리고, 도 3A는 데이터베이스 구축시 사용되는 일반적인 입력서식의 일예시도이고, 도 3B는 상기 도 3A의 일반적인 입력서식을 스캐닝하여 아스키화일로 변환한 예시도이며, 도 4는 상기 도 3B의 아스키로 변환된 파일중 데이터베이스에 구비되어야 하는 항목의 테이블을 생성하기 위한 테이블생성문(SQL)의 일예시도이고, 도 5는 생성된 테이블에 데이터를 입력하기 위한 데이터입력문(SQL)의 일예시도이다.
우선, 입력될 자료를 담고있는 문서(도 3A의 입력 서식의 예시도 참조)를 사용자가 스캐너(30)에 올려놓고 판독을 지시하면, 스캐너(30)에서 상기 문서를 스캐닝하여 이미지화일로 생성하며(201), 그 생성된 화일을 단말 컴퓨터(20)로 보내기전에, 스캐닝작업시 오류가 발생되었는지를 확인하여(203) 오류가 발견되면 상기 문서를 바르게 재장착한 후 스캐닝을 반복한다(205).
상기 단말 컴퓨터(20)의 문서인식기(21)는 상기 스캐너(30)에서 생성된 이미지화일을 아스키문자 화일로 변환한다. 그리고 나서 변환상의 오류가 있었는지를 확인하여(209), 오류가 발견되면 수정하는 과정을 거치도록 한다(211). 이러한 과정을 통해 판독 및 변환예로서, 본 실시예에서는 도 3B에 상기 도 3A의 입력서식을 아스키화일로 변환한 예를 보이고 있다.
상기 단말 컴퓨터(20)의 테이블생성기(22)는 상기 문서인식기(21)에 의해 변환된 아스키화일중 운용자가 지정하는 데이터베이스화 할 항목들을 선정하고 그 각각에 저장될 데이터의 포맷을 운용자의 요구에 따라 지정한다(213). 본 실시예에서는 이때 항목을 지정하는 방법으로 운용자가 키보드나 마우스를 이용하여 디스플레이상에 올려진 판독된 자료의 특정위치에서 클릭(click)하면 해당위치의 좌표(coordinate)가 결정되어 독립된 항목으로 지정되도록 하고, 그 영역에 저장될 데이터의 포맷을 사용자가 정의하도록 하는 과정을 운용자의 의도에 따라 반복하면서 상기 문서의 내용중 데이터베이스화 할 내용이 모두 지정되도록 하므로써, 동종 문서의 내용중 상기 지정된 좌표들의 내용은 동일한 항목하에 동일한 포맷으로 각 문서의 내용들이 저장될 수 있도록 한다.
그리하여, 하나의 입력문서에서 운용자의 의도에 따라 데이터베이스화 할 항목 및 데이터 포맷 지정이 완료되면, 각각의 항목에 따른 테이블생성문이 작성되도록 한 후(215), 그 테이블생성문을 검사하여 오류가 발견되면(219) 수정하는 과정을 거치도록 한다(221). 본 실시예에서는 이러한 과정을 통해 생성된 테이블생성문의 일예를 도 4로 예시하고 있다.
그리고 나서, 테이블생성문을 실행하여 상기 데이터베이스(12)에 실제로 해당 테이블들이 생성되도록 한다(223).
상기 단말 컴퓨터(20)의 데이터입력기(23)는 상기 테이블생성기(22)에 의해 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성한다(227). 그리고 상기 데이터 입력문에 오류가 있는지를 확인하여 오류가 발견되면 수정하는 과정을 거치도록 한다(231, 233). 이러한 과정을 통해 생성된 데이터입력문의 예로서, 본 실시예에서는 도 5로 예시하고 있다.
그리고 나서, 상기 데이터입력문을 실행하여 상기 데이터베이스(12)의 테이블들에 각각 해당되는 실제의 데이터들이 입력되도록 한다(231). 그리고, 입력완료된 결과내용을 검사하여 입력오류가 발견되는지 여부를 확인하여(241) 발견되면 그 입력내용을 수정하여 바로잡도록 하는 과정을 거치도록 할 수도 있다(243).
그리하여 본 발명은, 동종의 문서가 상기 스캐너(30)에 의해 판독되고 상기 문서인식기(21)에 의해 아스키 화일로 변환된 되는대로 지정된 항목의 데이터들이 자동적으로 입력되도록하여 데이터베이스(DB)를 구축하는 것이다.
이상에서 설명한 본 발명은, 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니며, 특정환경에 제한됨이 없이 일정한 형식을 갖는 다른 동류의 입력양식에도 용이하게 적용될 수 있다.
상기와 같은 본 발명은, 운용자가 문서형식으로 정리된 자료를 보면서 일일이 수작업으로 입력할 필요가 없도록 함으로써, 인력소모를 현저하게 줄일 수 있도록 할 뿐만아니라, 정확하게 판독된 입력자료의 코드변환을 통해 자동적으로 입력되도록 함으로써 자료입력시 마다 일일이 입력오류를 검증할 필요가 없으며, 인위적인 입력오류를 배제하여 데이터베이스(DB)의 신뢰성을 크게 향상시키는 우수한 효과가 있다.

Claims (6)

  1. 데이터베이스에 입력될 자료를 포함하고 있는 문서를 스캐너로 읽어 이미지화일로 변환하는 제 1 단계;
    상기 스캐너로부터 입력되는 이미지화일을 문자인식기를 통해 아스키화일로 변환하는 제 2 단계;
    상기 문서인식기에 의해 변환된 아스키화일중 운용자가 지정하는 데이터베이스화 할 항목들을 선정하고 그 각각에 저장될 데이터의 포맷을 운영자의 요구에 따라 지정하는 제 3 단계;
    각각의 항목에 따른 테이블생성문을 운용자의 의도에 따라 생성하고 실행하여 상기 데이터베이스에 실제로 해당 테이블들이 생성되도록 하는 제 4 단계; 및
    상기 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하고 데이터입력을 실행하는 제 5 단계를 포함하는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
  2. 청구항 1에 있어서,
    상기 제 1 단계 수행후, 생성된 화일을 단말 컴퓨터로 보내기 전에, 스캐닝 작업시 오류가 발생되었는지를 확인하여 오류발생이 발견되면 상기 문서를 바르게 재장착한 후 스캐닝을 반복하는 제 6 단계를 더 포함하는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
  3. 청구항 1에 있어서,
    상기 제 2 단계 수행후, 화일 변환상의 오류가 있었는지를 확인하여, 오류가 발견되면 수정하는 제 7 단계를 더 포함하는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
  4. 청구항 1에 있어서,
    상기 제 4 단계는,
    상기 제 3 단계에서 선정된 각각의 항목에 따른 테이블생성문을 작성하는 과정;
    상기 테이블생성문을 검사하여 오류가 발견되면 수정하는 과정; 및
    상기 테이블생성문을 실행하여 상기 데이터베이스에 실제로 해당 테이블 들이 생성되도록 하는 과정을 포함하여 이루어지는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
  5. 청구항 1에 있어서,
    상기 제 5 단계는,
    상기 제 4 단계에 의해 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하는 과정;
    상기 데이터 입력문에 오류가 있는지를 확인하여 오류가 발견되면 수정하는 과정; 및
    상기 데이터입력문을 실행하여 상기 데이터베이스의 테이블들에 각각 해당되는 실제의 데이터들이 입력되도록 하는 과정을 포함하여 이루어지는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
  6. 청구항 1에 있어서,
    상기 제 5 단계 수행후, 입력완료된 결과내용을 검사하여 입력오류가 발견되는지 여부를 확인하고, 입력오류가 발견되면 그 내용을 수정하여 바로잡는 제 8단계를 더 포함하는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
KR1019960076660A 1996-12-30 1996-12-30 문자인식기를 이용한 데이터베이스 구축방법 KR19980057376A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960076660A KR19980057376A (ko) 1996-12-30 1996-12-30 문자인식기를 이용한 데이터베이스 구축방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960076660A KR19980057376A (ko) 1996-12-30 1996-12-30 문자인식기를 이용한 데이터베이스 구축방법

Publications (1)

Publication Number Publication Date
KR19980057376A true KR19980057376A (ko) 1998-09-25

Family

ID=66395900

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960076660A KR19980057376A (ko) 1996-12-30 1996-12-30 문자인식기를 이용한 데이터베이스 구축방법

Country Status (1)

Country Link
KR (1) KR19980057376A (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000026259A (ko) * 2000-03-10 2000-05-15 강영희 다량의 문서 디지털자동변환방법
KR20030089778A (ko) * 2002-05-18 2003-11-28 에스케이 텔레콤주식회사 이동 통신 시스템에서의 고객 신청서 및 정보 관리 방법
KR100422270B1 (ko) * 2000-08-02 2004-03-12 김회율 컴퓨터 비젼 시스템을 이용한 기안용지 계수 방법
KR100426340B1 (ko) * 2000-11-10 2004-04-08 주식회사 한국인식기술 문서관리시스템 및 그 방법
KR20040106633A (ko) * 2003-06-11 2004-12-18 안종백 이미지 인식에 의한 처방전 입력장치 및 방법
KR100650235B1 (ko) * 2004-12-06 2006-11-28 삼성화재해상보험 주식회사 복수의 문서를 연속적으로 데이터베이스에 자동 저장하는방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000026259A (ko) * 2000-03-10 2000-05-15 강영희 다량의 문서 디지털자동변환방법
KR100422270B1 (ko) * 2000-08-02 2004-03-12 김회율 컴퓨터 비젼 시스템을 이용한 기안용지 계수 방법
KR100426340B1 (ko) * 2000-11-10 2004-04-08 주식회사 한국인식기술 문서관리시스템 및 그 방법
KR20030089778A (ko) * 2002-05-18 2003-11-28 에스케이 텔레콤주식회사 이동 통신 시스템에서의 고객 신청서 및 정보 관리 방법
KR20040106633A (ko) * 2003-06-11 2004-12-18 안종백 이미지 인식에 의한 처방전 입력장치 및 방법
KR100650235B1 (ko) * 2004-12-06 2006-11-28 삼성화재해상보험 주식회사 복수의 문서를 연속적으로 데이터베이스에 자동 저장하는방법

Similar Documents

Publication Publication Date Title
US7103835B1 (en) Process builder for a routable electronic document system and method for using the same
WO2006002009A2 (en) Document management system with enhanced intelligent document recognition capabilities
CN110705237B (zh) 文档的自动生成方法、数据处理设备及存储介质
US20030037302A1 (en) Systems and methods for automatically converting document file formats
CN108762743A (zh) 一种数据表操作代码生成方法及装置
US20070146793A1 (en) Method of using printed forms to transmit the information necessary to create electronic forms
CN112417516A (zh) 文件处理方法、装置、设备及介质
KR19980057376A (ko) 문자인식기를 이용한 데이터베이스 구축방법
US10872156B2 (en) Typescript security scanner
CN112632110A (zh) 一种自动生成查询语句的数据提取方法及装置
KR20000015619A (ko) 웹 문서 자동 생성장치 및 그 방법
JP2021140430A (ja) データベースマイグレーション方法、データベースマイグレーションシステム、及びデータベースマイグレーションプログラム
US8108828B2 (en) System for generating optimized computer data field conversion routines
US6948005B2 (en) Peripheral device for programmable controller
CN112631567A (zh) 一种生成数据库操作文件的方法及装置
EP0344083A2 (en) Explicit specification of valid compound document data stream structure and content
CN110609984B (zh) 一种Windows系统中自动拆分谷歌key的方法及系统
CN115017032A (zh) 一种fpga代码规则检测方法、装置和设备
JPH06149894A (ja) スキーマ定義情報作成方法
KR20210069241A (ko) 규칙 기반으로 공간정보 처리용 워크플로우 서비스를 제공하는 방법 및 이러한 방법을 실행시키기 위한 명령어들이 저장된 컴퓨터 판독 가능한 저장 매체
CN112988164A (zh) 文本转换方法、文本转换装置、文本转换设备及存储介质
CN115934682A (zh) 一种数据库迁移方法及系统
CN116108781A (zh) 一种co-lay零件检查方法、装置、设备、介质
CN103514093B (zh) 嵌入式系统字库测试方法及装置
CN116257551A (zh) 数据库查询语句的处理方法、存储介质与设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
SUBM Surrender of laid-open application requested