KR19980057376A - 문자인식기를 이용한 데이터베이스 구축방법 - Google Patents
문자인식기를 이용한 데이터베이스 구축방법 Download PDFInfo
- Publication number
- KR19980057376A KR19980057376A KR1019960076660A KR19960076660A KR19980057376A KR 19980057376 A KR19980057376 A KR 19980057376A KR 1019960076660 A KR1019960076660 A KR 1019960076660A KR 19960076660 A KR19960076660 A KR 19960076660A KR 19980057376 A KR19980057376 A KR 19980057376A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- database
- input
- error
- found
- Prior art date
Links
Landscapes
- Character Discrimination (AREA)
Abstract
1. 청구범위에 기재된 발명이 속한 기술분야
문서화된 자료를 데이터베이스화 하는데 사용하는 자료 입력방법임
2. 발명이 해결하려고 하는 기술적 과제
양식화된 자료의 내용을 일일이 수작업으로 입력할 필요없이 공지된 문자 인식기능을 이용하여 스캐닝된 이미지화일을 아스키화일로 변환하고, 그중 테이블 생성기에 의해 선정된 항목의 자료는 데이터베이스에 자동입력되도록 하는 문자인식기를 이용한 데이터베이스 구축방법을 제공하고자 함
3. 발명의 해결방법의 요지
데이터베이스에 입력될 자료를 포함하고 있는 문서를 스캐너로 읽어 이미지화일로 변환하는 단계; 상기 이미지화일을 아스키화일로 변환하는 단계; 변환된 아스키화일중 운용자가 지정하는 데이터베이스화 할 항목들을 선정하고 그 각각에 저장될 데이터의 포맷을 운용자의 요구에 따라 지정하는 단계; 각각의 항목에 따른 테이블생성문을 운용자의 의도에 따라 생성하고 실행하여 상기 데이터베이스에 실제로 해당 테이블들이 생성되도록 하는 단계; 및 상기 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하고 데이터입력을 실행하는 단계를 포함하는 것을 특징으로 함
4. 발명의 중요한 용도
문서화된 자료를 데이터베이스화 하는데 이용됨
Description
본 발명은 문서화된 자료를 데이터베이스화 하는 기술에 관한 것으로, 특히 기존의 양식화된 자료의 내용을 일일이 수작업으로 입력할 필요없이 공지된 문자인식기능을 이용하여 자동입력되도록 하는 데이터베이스 구축방법에 관한 것이다.
종래의 데이터베이스 구축방법을 간단히 살펴보면, 자료가 입력될 항목의 테이블과 배열위치가 정해진 고정된 시스템에서, 운용자가 문서형식으로 정리된 자료를 보면서 일일이 수작업으로 입력한 후, 제대로 입력되었는지를 검증하는 과정을 거치는 것이 통예이다. 그러나, 상기한 바와 같은 기존의 방법에 의하면, 많은 량의 데이터를 처리하는 경우에 인력과 소요시간이 과다하게 요구될 뿐만아니라, 입력과정에서 발생될 수 있는 인위적인 오류에 인해 데이터베이스의 신뢰성을 크게 저하시키며, 항상 그에 대한 검증 및 정정작업 등을 필요케하는 문제점을 내포하고 있다.
따라서, 본 발명은 상기한 바와 같이 종래기술의 제반 문제점을 해결하기 위해 안출된 것으로서, 양식화된 자료의 내용을 일일이 수작업으로 입력할 필요없이 공지된 문자 인식기능을 이용하여 스캐닝된 이미지화일을 아스키화일로 변환하고,그중 테이블 생성기에 의해 선정된 항목의 자료는 데이터베이스에 자동입력되도록 하는 문자인식기를 이용한 데이터베이스 구축방법을 제공함에 그 목적을 두고 있다.
도 1은 본 발명이 적용되는 데이터베이스 시스템의 개략적인 구성을 나타낸 블럭도,
도 2A 및 도 2B는 본 발명에 따른 문자인식기를 이용한 데이터베이스 구축방법의 일실시예 흐름도,
도 3A는 데이터베이스 구축시 사용되는 일반적인 입력서식의 일예시도,
도 3B는 상기 도 3A의 일반적인 입력서식을 스캐닝하여 아스키화일로 변환한 예시도,
도 4는 상기 도 3B의 아스키로 변환된 파일중 데이터베이스에 구비되어야 하는 항목의 테이블을 생성하기 위한 테이블생성문(SQL)의 일예시도,
도 5는 생성된 테이블에 데이터를 입력하기 위한 데이터입력문(SQL)의 일예시도.
* 도면의 주요부분에 대한 부호의 설명
10 : 워크스테이션, 11 : 데이터베이스 관리시스테(DBMS), 12 : 데이터베이스(DB), 20 : 단말 컴퓨터, 21 : 문자인식기, 22 : 테이블생성기, 23 : 자료입력기, 30 : 스캐너
상기 목적을 달성하기 위하여 본 발명은, 데이터베이스에 입력될 자료를 포함하고 있는 문서를 스캐너로 읽어 이미지화일로 변환하는 제 1 단계; 상기 스캐너로부터 입력되는 이미지화일을 문자인식기를 통해 아스키화일로 변환하는 제 2 단계; 상기 문서인식기에 의해 변환된 아스키화일중 운용자가 지정하는 데이터베이스화 할 항목들을 선정하고 그 각각에 저장될 데이터의 포맷을 운용자의 요구에 따라 지정하는 제 3 단계; 각각의 항목에 따른 테이블생성문을 운용자의 의도에 따라 생성하고 실행하여 상기 데이터베이스에 실제로 해당 테이블들이 생성되도록 하는 제 4 단계; 및 상기 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하고 데이터입력을 실행하는 제 5 단계를 포함하는 것을 특징으로 한다.
또한, 상기 제 1 단계 수행후, 생성된 화일을 단말 컴퓨터로 보내기 전에, 스캐닝작업시 오류가 발생되었는지를 확인하여 오류발생이 발견되면 상기 문서를 바르게 재장착한 후 스캐닝을 반복하는 제 6 단계; 상기 제 2 단계 수행후, 화일 변환상의 오류가 있었는지를 확인하여, 오류가 발견되면 수정하는 제 7 단계; 및 상기 제 5 단계 수행후, 입력완료된 결과내용을 검사하여 입력오류가 발견되는지 여부를 확인하고, 입력오류가 발견되면 그 내용을 수정하여 바로잡는 제 8 단계를 더 포함하는 것을 특징으로 한다.
그리고, 상기 제 4 단계는, 상기 제 3 단계에서 선정된 각각의 항목에 따른 테이블생성문을 작성하는 과정; 상기 테이블생성문을 검사하여 오류가 발견되면 수정하는 과정; 및 상기 테이블생성문을 실행하여 상기 데이터베이스에 실제로 해당 테이블 들이 생성되도록 하는 과정을 포함하여 이루어지는 것을 특징으로 하며, 상기 제 5 단계는, 상기 제 4 단계에 의해 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하는 과정; 상기 데이터 입력문에 오류가 있는지를 확인하여 오류가 발견되면 수정하는 과정; 및 상기 데이터입력문을 실행하여 상기 데이터베이스의 테이블들에 각각 해당되는 실제의 데이터들이 입력되도록 하는 과정을 포함하여 이루어지는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명의 일실시예를 상세히 설명한다.
도 1은 본 발명이 적용되는 데이터베이스 시스템의 예로서, 그 개략적인 구성을 나타낸 블록도이다. 도면에서 10은 워크스테이션, 11은 데이터베이스 관리시스템(DBMS), 12는 데이터베이스(DB), 20은 단말 컴퓨터, 21은 문자인식기, 22는 테이블생성기, 23은 자료입력기, 30은 스캐너를 각각 나타낸 것이다.
본 발명이 적용되는 데이터베이스 시스템의 일예는 도면에 도시된 바와 같이, 자료가 저장되는 데이터베이스(DB)(12)와 상기 데이터베이스를 관리하고 효율적으로 운용하는 소프트웨어인 데이터베이스 관리시스템(일반적으로 DBMS라 함)(11)을 구비하고 있으며 다수의 단말 컴퓨터가 연결가능하고 그들의 서버(Servr)로 동작하는 워크스테이션(10)과, 상기 워크스테이션(10)에 연결되어 있으며 입력되는 이미지화일을 아스키코드의 문자로 변환해주는 공지의 문서인식 소프트웨어(이하 간단히 문자인식기라 함)(21)와 데이터베이스에 저장할 자료의 항목 및 데이터 형식을 지정하는 소프트웨어(이하 간단히 테이블 생성기라 함)(22)와 판독된 입력자료중 지정된 항목의 자료를 지정된 저장형식에 따라 데이터베이스에 저장하는 소프트웨어(이하 간단히 자료입력기라 함)를 구비하고 있으며 상기 서버(Server)로 동작하는 워크스테이션(10)에 대해 클라이언트(Client) 기능을 수행하는 다수의 단말 컴퓨터(20)와, 상기 단말 컴퓨터(20)에 연결되어 있으며 문서를 판독하여 이미지화일로 출력하는 스캐너(30)로 이루어진다.
이는 데이터베이스에 저장될 자료의 양이 방대하고, 그 자료들을 공유하면서 이용할 단말 컴퓨터의 수가 많은 경우의 데이터베이스 시스템이며, 그 규모 및 특성에 따라 이와 달리 다양하게 구축할 수 있다.
도 2A 및 도 2B는 본 발명에 따른 문자인식기를 이용한 데이터베이스 구축방법의 일실시예 흐름도이다. 그리고, 도 3A는 데이터베이스 구축시 사용되는 일반적인 입력서식의 일예시도이고, 도 3B는 상기 도 3A의 일반적인 입력서식을 스캐닝하여 아스키화일로 변환한 예시도이며, 도 4는 상기 도 3B의 아스키로 변환된 파일중 데이터베이스에 구비되어야 하는 항목의 테이블을 생성하기 위한 테이블생성문(SQL)의 일예시도이고, 도 5는 생성된 테이블에 데이터를 입력하기 위한 데이터입력문(SQL)의 일예시도이다.
우선, 입력될 자료를 담고있는 문서(도 3A의 입력 서식의 예시도 참조)를 사용자가 스캐너(30)에 올려놓고 판독을 지시하면, 스캐너(30)에서 상기 문서를 스캐닝하여 이미지화일로 생성하며(201), 그 생성된 화일을 단말 컴퓨터(20)로 보내기전에, 스캐닝작업시 오류가 발생되었는지를 확인하여(203) 오류가 발견되면 상기 문서를 바르게 재장착한 후 스캐닝을 반복한다(205).
상기 단말 컴퓨터(20)의 문서인식기(21)는 상기 스캐너(30)에서 생성된 이미지화일을 아스키문자 화일로 변환한다. 그리고 나서 변환상의 오류가 있었는지를 확인하여(209), 오류가 발견되면 수정하는 과정을 거치도록 한다(211). 이러한 과정을 통해 판독 및 변환예로서, 본 실시예에서는 도 3B에 상기 도 3A의 입력서식을 아스키화일로 변환한 예를 보이고 있다.
상기 단말 컴퓨터(20)의 테이블생성기(22)는 상기 문서인식기(21)에 의해 변환된 아스키화일중 운용자가 지정하는 데이터베이스화 할 항목들을 선정하고 그 각각에 저장될 데이터의 포맷을 운용자의 요구에 따라 지정한다(213). 본 실시예에서는 이때 항목을 지정하는 방법으로 운용자가 키보드나 마우스를 이용하여 디스플레이상에 올려진 판독된 자료의 특정위치에서 클릭(click)하면 해당위치의 좌표(coordinate)가 결정되어 독립된 항목으로 지정되도록 하고, 그 영역에 저장될 데이터의 포맷을 사용자가 정의하도록 하는 과정을 운용자의 의도에 따라 반복하면서 상기 문서의 내용중 데이터베이스화 할 내용이 모두 지정되도록 하므로써, 동종 문서의 내용중 상기 지정된 좌표들의 내용은 동일한 항목하에 동일한 포맷으로 각 문서의 내용들이 저장될 수 있도록 한다.
그리하여, 하나의 입력문서에서 운용자의 의도에 따라 데이터베이스화 할 항목 및 데이터 포맷 지정이 완료되면, 각각의 항목에 따른 테이블생성문이 작성되도록 한 후(215), 그 테이블생성문을 검사하여 오류가 발견되면(219) 수정하는 과정을 거치도록 한다(221). 본 실시예에서는 이러한 과정을 통해 생성된 테이블생성문의 일예를 도 4로 예시하고 있다.
그리고 나서, 테이블생성문을 실행하여 상기 데이터베이스(12)에 실제로 해당 테이블들이 생성되도록 한다(223).
상기 단말 컴퓨터(20)의 데이터입력기(23)는 상기 테이블생성기(22)에 의해 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성한다(227). 그리고 상기 데이터 입력문에 오류가 있는지를 확인하여 오류가 발견되면 수정하는 과정을 거치도록 한다(231, 233). 이러한 과정을 통해 생성된 데이터입력문의 예로서, 본 실시예에서는 도 5로 예시하고 있다.
그리고 나서, 상기 데이터입력문을 실행하여 상기 데이터베이스(12)의 테이블들에 각각 해당되는 실제의 데이터들이 입력되도록 한다(231). 그리고, 입력완료된 결과내용을 검사하여 입력오류가 발견되는지 여부를 확인하여(241) 발견되면 그 입력내용을 수정하여 바로잡도록 하는 과정을 거치도록 할 수도 있다(243).
그리하여 본 발명은, 동종의 문서가 상기 스캐너(30)에 의해 판독되고 상기 문서인식기(21)에 의해 아스키 화일로 변환된 되는대로 지정된 항목의 데이터들이 자동적으로 입력되도록하여 데이터베이스(DB)를 구축하는 것이다.
이상에서 설명한 본 발명은, 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니며, 특정환경에 제한됨이 없이 일정한 형식을 갖는 다른 동류의 입력양식에도 용이하게 적용될 수 있다.
상기와 같은 본 발명은, 운용자가 문서형식으로 정리된 자료를 보면서 일일이 수작업으로 입력할 필요가 없도록 함으로써, 인력소모를 현저하게 줄일 수 있도록 할 뿐만아니라, 정확하게 판독된 입력자료의 코드변환을 통해 자동적으로 입력되도록 함으로써 자료입력시 마다 일일이 입력오류를 검증할 필요가 없으며, 인위적인 입력오류를 배제하여 데이터베이스(DB)의 신뢰성을 크게 향상시키는 우수한 효과가 있다.
Claims (6)
- 데이터베이스에 입력될 자료를 포함하고 있는 문서를 스캐너로 읽어 이미지화일로 변환하는 제 1 단계;상기 스캐너로부터 입력되는 이미지화일을 문자인식기를 통해 아스키화일로 변환하는 제 2 단계;상기 문서인식기에 의해 변환된 아스키화일중 운용자가 지정하는 데이터베이스화 할 항목들을 선정하고 그 각각에 저장될 데이터의 포맷을 운영자의 요구에 따라 지정하는 제 3 단계;각각의 항목에 따른 테이블생성문을 운용자의 의도에 따라 생성하고 실행하여 상기 데이터베이스에 실제로 해당 테이블들이 생성되도록 하는 제 4 단계; 및상기 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하고 데이터입력을 실행하는 제 5 단계를 포함하는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
- 청구항 1에 있어서,상기 제 1 단계 수행후, 생성된 화일을 단말 컴퓨터로 보내기 전에, 스캐닝 작업시 오류가 발생되었는지를 확인하여 오류발생이 발견되면 상기 문서를 바르게 재장착한 후 스캐닝을 반복하는 제 6 단계를 더 포함하는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
- 청구항 1에 있어서,상기 제 2 단계 수행후, 화일 변환상의 오류가 있었는지를 확인하여, 오류가 발견되면 수정하는 제 7 단계를 더 포함하는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
- 청구항 1에 있어서,상기 제 4 단계는,상기 제 3 단계에서 선정된 각각의 항목에 따른 테이블생성문을 작성하는 과정;상기 테이블생성문을 검사하여 오류가 발견되면 수정하는 과정; 및상기 테이블생성문을 실행하여 상기 데이터베이스에 실제로 해당 테이블 들이 생성되도록 하는 과정을 포함하여 이루어지는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
- 청구항 1에 있어서,상기 제 5 단계는,상기 제 4 단계에 의해 생성된 테이블 및 지정된 데이터 포맷에 따라 해당되는 각각의 데이터 입력문을 생성하는 과정;상기 데이터 입력문에 오류가 있는지를 확인하여 오류가 발견되면 수정하는 과정; 및상기 데이터입력문을 실행하여 상기 데이터베이스의 테이블들에 각각 해당되는 실제의 데이터들이 입력되도록 하는 과정을 포함하여 이루어지는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
- 청구항 1에 있어서,상기 제 5 단계 수행후, 입력완료된 결과내용을 검사하여 입력오류가 발견되는지 여부를 확인하고, 입력오류가 발견되면 그 내용을 수정하여 바로잡는 제 8단계를 더 포함하는 것을 특징으로 하는 문자인식기를 이용한 데이터베이스 구축방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019960076660A KR19980057376A (ko) | 1996-12-30 | 1996-12-30 | 문자인식기를 이용한 데이터베이스 구축방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019960076660A KR19980057376A (ko) | 1996-12-30 | 1996-12-30 | 문자인식기를 이용한 데이터베이스 구축방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR19980057376A true KR19980057376A (ko) | 1998-09-25 |
Family
ID=66395900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019960076660A KR19980057376A (ko) | 1996-12-30 | 1996-12-30 | 문자인식기를 이용한 데이터베이스 구축방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR19980057376A (ko) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000026259A (ko) * | 2000-03-10 | 2000-05-15 | 강영희 | 다량의 문서 디지털자동변환방법 |
KR20030089778A (ko) * | 2002-05-18 | 2003-11-28 | 에스케이 텔레콤주식회사 | 이동 통신 시스템에서의 고객 신청서 및 정보 관리 방법 |
KR100422270B1 (ko) * | 2000-08-02 | 2004-03-12 | 김회율 | 컴퓨터 비젼 시스템을 이용한 기안용지 계수 방법 |
KR100426340B1 (ko) * | 2000-11-10 | 2004-04-08 | 주식회사 한국인식기술 | 문서관리시스템 및 그 방법 |
KR20040106633A (ko) * | 2003-06-11 | 2004-12-18 | 안종백 | 이미지 인식에 의한 처방전 입력장치 및 방법 |
KR100650235B1 (ko) * | 2004-12-06 | 2006-11-28 | 삼성화재해상보험 주식회사 | 복수의 문서를 연속적으로 데이터베이스에 자동 저장하는방법 |
-
1996
- 1996-12-30 KR KR1019960076660A patent/KR19980057376A/ko not_active IP Right Cessation
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000026259A (ko) * | 2000-03-10 | 2000-05-15 | 강영희 | 다량의 문서 디지털자동변환방법 |
KR100422270B1 (ko) * | 2000-08-02 | 2004-03-12 | 김회율 | 컴퓨터 비젼 시스템을 이용한 기안용지 계수 방법 |
KR100426340B1 (ko) * | 2000-11-10 | 2004-04-08 | 주식회사 한국인식기술 | 문서관리시스템 및 그 방법 |
KR20030089778A (ko) * | 2002-05-18 | 2003-11-28 | 에스케이 텔레콤주식회사 | 이동 통신 시스템에서의 고객 신청서 및 정보 관리 방법 |
KR20040106633A (ko) * | 2003-06-11 | 2004-12-18 | 안종백 | 이미지 인식에 의한 처방전 입력장치 및 방법 |
KR100650235B1 (ko) * | 2004-12-06 | 2006-11-28 | 삼성화재해상보험 주식회사 | 복수의 문서를 연속적으로 데이터베이스에 자동 저장하는방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7103835B1 (en) | Process builder for a routable electronic document system and method for using the same | |
US20050289182A1 (en) | Document management system with enhanced intelligent document recognition capabilities | |
US20030037302A1 (en) | Systems and methods for automatically converting document file formats | |
US20070146793A1 (en) | Method of using printed forms to transmit the information necessary to create electronic forms | |
KR19980057376A (ko) | 문자인식기를 이용한 데이터베이스 구축방법 | |
US10872156B2 (en) | Typescript security scanner | |
CN112632110A (zh) | 一种自动生成查询语句的数据提取方法及装置 | |
JP2019211805A (ja) | データベースマイグレーション支援システム及びプログラム | |
KR20000015619A (ko) | 웹 문서 자동 생성장치 및 그 방법 | |
JP2021140430A (ja) | データベースマイグレーション方法、データベースマイグレーションシステム、及びデータベースマイグレーションプログラム | |
US8108828B2 (en) | System for generating optimized computer data field conversion routines | |
US6948005B2 (en) | Peripheral device for programmable controller | |
KR20190101555A (ko) | 문서 자동 점검 시스템 | |
CN110737642B (zh) | 数据库信息分析方法、装置、计算机装置及存储介质 | |
CN113986951A (zh) | 一种通用etl代码的生成系统及方法 | |
CN112631567A (zh) | 一种生成数据库操作文件的方法及装置 | |
CN112445461A (zh) | 一种业务规则生成方法、装置、电子设备和可读存储介质 | |
EP0344083A2 (en) | Explicit specification of valid compound document data stream structure and content | |
CN112148710B (zh) | 微服务分库方法、系统和介质 | |
JPH06149894A (ja) | スキーマ定義情報作成方法 | |
Eshun et al. | Data integrity in an IGES description of turned part geometry | |
CN112988164A (zh) | 文本转换方法、文本转换装置、文本转换设备及存储介质 | |
JPH05241806A (ja) | 設計仕様逆生成装置 | |
CN115934682A (zh) | 一种数据库迁移方法及系统 | |
CN116108781A (zh) | 一种co-lay零件检查方法、装置、设备、介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
SUBM | Surrender of laid-open application requested |