KR20000074956A - 조합형 한글 워드프로세서의 문서를 통합 완성형 전자 문서로변환시키는 방법 및 그 컴퓨터 프로그램이 저장된 기록 매체 - Google Patents

조합형 한글 워드프로세서의 문서를 통합 완성형 전자 문서로변환시키는 방법 및 그 컴퓨터 프로그램이 저장된 기록 매체 Download PDF

Info

Publication number
KR20000074956A
KR20000074956A KR1019990019243A KR19990019243A KR20000074956A KR 20000074956 A KR20000074956 A KR 20000074956A KR 1019990019243 A KR1019990019243 A KR 1019990019243A KR 19990019243 A KR19990019243 A KR 19990019243A KR 20000074956 A KR20000074956 A KR 20000074956A
Authority
KR
South Korea
Prior art keywords
document
character
word processor
program
page
Prior art date
Application number
KR1019990019243A
Other languages
English (en)
Other versions
KR100327549B1 (ko
Inventor
장수진
Original Assignee
이준욱
주식회사 대양이앤씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이준욱, 주식회사 대양이앤씨 filed Critical 이준욱
Priority to KR1019990019243A priority Critical patent/KR100327549B1/ko
Publication of KR20000074956A publication Critical patent/KR20000074956A/ko
Application granted granted Critical
Publication of KR100327549B1 publication Critical patent/KR100327549B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

본 발명은 조합형 한글 워드프로세서 문서를 통합 완성형 전자문서로 변환하는 방법에 관한 것이다. 조합형 한글 워드프로세서 문서를 캐릭터의 종류에 따라 코드 변환이 가능한 문서 변환, 코드 변환이 안되는 문서는 단색 이미지로 입력, 단색 이미지는 단색 이미지로 입력, 컬러 이미지는 컬러 이미지로 입력, 다각형(다각형, 표, 선 등)은 벡터 값에 의해 동일한 다각형으로 변환함으로써, 본래의 조합형 문서를 손실 없이 통합 완성형 한글 전자 문서로 변환할 수 있다.
또한, 하나의 컴퓨터 장치 또는 네트워크나 인트라넷으로 연결된 컴퓨터에서 저장 매체에 저장되어 있는 문서 파일을 본 발명의 방법에 따라 하나하나 탐색해서 통합 완성형 한글 전자 문서로 변환함으로써 문서 파일의 효율적 관리 및 정보의 공유를 달성할 수 있다.

Description

조합형 한글 워드프로세서의 문서를 통합 완성형 전자 문서로 변환시키는 방법 및 그 컴퓨터 프로그램이 저장된 기록 매체{Method for transforming compound Hangul wordprocessor file into Integral completion Hangul wordprocessor file and storage medium storing the computer program thereof}
본 발명은 조합형 한글 워드프로세서의 문서를 통합 완성형 전자 문서로 변환시키는 방법, 그 컴퓨터 프로그램이 저장된 기록 매체 및 다수의 문서 파일을 통합 완성형 전자 문서로 변환하는 방법에 관한 것이다.
컴퓨터 워드프로세서 프로그램은 사용자가 문자, 기호 또는 그림 등을 입력하여 출력하거나 파일(file) 형태로 저장하는 소프트웨어의 일종으로, 현재 컴퓨터 프로그램 중에서 가장 널리 보급되어 사용되고 있다.
한글에 관한 워드프로세서 프로그램은 크게 두 종류로 대별될 수 있으며, 한글을 형성하는 방법을 기준으로 조합형과 완성형으로 구분된다. 조합형 워드프로세서로서 대표적인 것은 (주)한글과 컴퓨터에서 제조한 "아래아한글" 프로그램이 있으며, 완성형으로는 (주)마이크로소프트의 "MS Word" 또는 (주)삼성전자의 "훈민정음" 등이 있다.
그러나, 컴퓨터의 운용체계가 (주)마이크로소프트의 윈도95 및 윈도 98에 의해 실질적으로 표준화된 상황에서 전세계적으로 글자와 그림을 포함하는 통합형 전자문서가 일반화되었다. 즉, PDF(potable document format) 형식의 전자 문서가 실질적인 표준화 문서로 수용되어, 모든 워드프로세서 프로그램이 PDF 아크로뱃 프로그램으로 변환되어 저장 및 전송되는 실정에 있다. 특히, PDF 형식의 전자 문서는 윈도즈 95, 윈도즈 98은 물론 유닉스에서도 잘 구동되므로, 어떤 컴퓨터에서나 적용가능하기 때문에, 전자 문서의 표준으로 인정되고 있다. PDF 파일의 Writer 및 Reader 프로그램으로는 "Adobe Acrobat"이 가장 널리 이용되고 있다(www.abobe.com/acrobat).
PDF 파일 포맷은 국제 표준 페이지 기술 언어인 포스트스크립트(postscript)를 기반으로 하고 있어 인터넷 및 인트라넷을 통한 온라인 환경에서 전자 출판을 가능하게 할 뿐만 아니라, 오프 라인 환경에서도 디스켓이나 CD-롬 등의 수단으로 멀티미디어 자료를 손쉽게 제작하고 배포할 수 있는 장점을 가지고 있다.
PDF 파일은 글자와 기호 및 그림을 모두 수용할 뿐만 아니라, 파일의 사이즈(size)가 작기 때문에 인터넷이나 PC 통신을 이용한 전송에 유리하며, 저장 매체에 저장하는 경우에도 메모리의 점유가 적다는 장점이 있다. 또한, 작성된 문서를 리더(reader) 프로그램으로는 임의로 편집할 수 없어서 논문이나 기사 등을 PDF 파일로 작성하여 배포하는데도 유리하다. 특히 서로 다른 각종 워드프로세서 문서간에 상호 호환이 이루어지지 않는 상황에서, 모든 워드프로세서 프로그램이 PDF 파일로 변환 가능하게 함으로써 PDF 파일이 중심이 된 표준화가 반드시 필요하게 되었다.
그러나 PDF 파일은 윈도 환경의 완성형을 기본으로 작성되기 때문에 기존의 MS 워드와 같은 완성형 워드프로세서 문서는 큰 어려움이 없이 PDF 파일로 변환하는 것이 가능하지만, 한글의 조합형 워드프로세서로 작성된 파일은 완성형 기반의 PDF로 변환하는 것이 불가능하였다. 따라서, 조합형 워드프로세서로 작성된 파일을 PDF 파일로 변환하면 문서 전체를 이미지로 인식하여 변환한다.
조합형 워드프로세서 문서가 전체적으로 이미지로 인식되어 PDF 파일로 변환되면 그 문서는 이미 문자로서의 워드프로세서 문서가 아니어서 문자 검색이 불가능하고 또한 저장된 문서의 사이즈도 역시 매우 크기 때문에, 실질적으로 PDF 파일로 변환한 의미를 상실하게 된다.
따라서, 본 발명의 목적은 조합형 워드프로세서의 문서를 통합 완성형 전자 문서로 변환시키는 방법을 제공하는 것이다.
본 발명의 다른 목적은 조합형 워드프로세서의 문서를 통합 완성형 전자 문서로 변환시키는 컴퓨터 프로그램이 저장된 기록 매체를 제공하는 것이다.
본 발명의 또다른 목적은 저장 매체에 저장되어 있는 다수의 문서 파일을 통합 완성형 전자 문서로 변환시키는 방법을 제공하는 것이다.
도 1은 본 발명에 따라 조합형 한글 워드프로세서 문서 파일을 통합 완성형 전자 문서로 변환하는 과정을 설명한 플로우차트,
도 2는 본 발명에 따라 저장 매체에 저장되어 있는 문서 파일을 통합 완성형 전자 문서로 변환하는 과정을 보인 플로우차트.
이와 같은 본 발명의 목적은, 조합형 워드프로세서의 문서를 완성형 통합 전자 문서로 변환시키는 방법에 있어서, ⒜ 상기 조합형 워드프로세서의 문서의 각 페이지의 시작을 인식하고; ⒝ 문서의 캐릭터의 종류를 인식하여 문자인 경우 조합형 코드를 완성형 코드로 변환시키고; ⒞ 문서의 캐릭터의 종류를 인식하여 문자로서 그것에 대응하는 완성형 코드가 없는 경우에는 단색 이미지로 변환시키고; ⒟ 문서의 캐릭터의 종류를 인식하여 컬러 이미지인 경우에는 컬러 이미지로 변환시키고; ⒠ 문서의 캐릭터의 종류를 인식하여 다각형의 경우에는 벡터 값으로 출력하여 동일한 다각형으로 변환시키고; ⒡ 페이지의 끝을 인식하여 페이지를 닫고; ⒢ 상기 조합형 문서의 최종 페이지에 도달할 때까지 상기 ⒜ 내지⒡의 단계를 반복하는 것을 특징으로 하는 방법에 의해 달성될 수 있다.
본 명세서에서 캐릭터라 함은 워드프로세서 프로그램을 실행하여 사용자가 입력하는 문자, 기호, 부호, 표(table) 및 그림을 포함하여 워드프로세서 문서내에 포함된 모든 입력 사항을 의미하는 것이다.
본 명세서에서 완성형 통합 전자 문서라 함은 한글의 완성형 KS 코드 값을 기본으로 하여 문자, 기호, 부호, 표 및 그림 등을 통합하여 포함하는 PDF 파일 형식의 문서를 의미하는 것이다.
본 발명에 있어서 한글 조합형 워드프로세서 문서는 페이지 단위로 통합 완성형 전자문서로 변환된다. 따라서, 변환의 기초 단위는 한 페이지가 되며, 페이지마다 변환을 반복하여 모든 페이지의 변환이 끝나면 문서의 변환이 종료된다.
따라서, 변환하고자 하는 조합형 워드프로세서의 문서로부터 먼저 페이지의 처음을 인식한다. 페이지의 처음이 인식되면 바로 문서의 캐릭터를 인식한다. 이 때 캐릭터의 종류를 판단한다.
캐릭터가 조합형 코드로부터 완성형 코드로 변환이 가능한 경우에는 직접 코드값의 변환을 실행한다. 예컨대 한글의 "가"의 조합형 코드 값은 "8861"이고 KS 완성형 코드 값은 "BOA1"이므로, 조합형 문서로부터 인식된 캐릭터가 "가"이면 바로 코드 값을 "BOA1"으로 변환함으로써 완성형 문자로 직접 변환된다. 이렇게 변환된 캐릭터는 완성형 문자로 인식, 저장되며, 따라서 PDF 파일에서문자의 검색이나 편집이 가능하게 된다.
마찬가지로 조합형 한글 "나"의 경우에는 코드 값을 "9061"로부터 "B3AA"로 변환시키고, "다"의 경우에는 코드 값을 "9461"로부터 "B409"로 변환시킨다. 완성형 KS 코드 값은 이미 정해져 공개되어 있고, 조합형 코드 값은 각각 공개된 코드 값을 이용할 수 있다.
인식된 캐릭터가 코드 변환이 불가능한 경우가 있다. 즉, 조합형 워드프로세서에서 특별히 지원하는 특수 문자나 부호 또는 단색 이미지는 그것에 대응하는 완성형 KS 코드 값이 없는 경우가 있다. 이 경우에는 해당 캐릭터는 문자 변환이 아닌 이미지 변환을 한다. 따라서, 그 캐릭터는 문자가 아닌 이미지로서 완성형 통합 문서에 포함되며, 이미지로 인식, 저장되기 때문에 문자 검색에 의해서는 검색될 수 없다. 이 때 이미지 변환은 비트맵(Bit Map) 방식이 바람직하다. 여기서 단색 이미지라 함은 컬러 이미지가 아닌 흑백 및 회색으로 이루어진 이미지를 말하는 것이다. 따라서, 코드 변환이 불가능한 문자 등과 단색 이미지가 비트맵 방식으로 단색 이미지로 변환된다.
인식된 캐릭터가 컬러 이미지인 경우에는 그대로 컬러 이미지로 변환된다. 이 때 컬러 이미지의 형태는 비트맵 방식이 바람직하다.
인식된 캐릭터가 다각형인 경우에는 그대로 다각형으로 유지되어 변환된다. 다각형이라 함은 기하학의 개념상 삼각형 이상의 다각형은 물론 조합형 원, 선, 표 등 문자나 그림이 아닌 벡터 값으로 구현되는 것을 말하는 것이다. 이러한 다각형은 변환 과정에서도 동일한 벡터 값을 유지하여 통합 완성형 전자 문서에서도 그 형태가 그대로 유지될 수 있다.
이와 같이 조합형 전자 문서의 한 페이지에 대해 각각의 캐릭터를 모두 완성형 통합 전자 문서의 형태로 변환한 후에는 다음 페이지에 대해 동일한 방법으로 변환을 계속한다. 이렇게 페이지마다 완성형으로 변환을 하여 마침내 마지막 페이지까지 변환을 완료함으로써 조합형 워드프로세서 문서를 완성형 통합 전자 문서로 변환시킨다.
본 발명의 프로그램은 조합형 워드프로세서 문서를 완성형 통합 전자 문서로 변환시키는 프로그램으로서, 바람직하게는 조합형 워드프로세서 프로그램에 추가 설치되는 프로그램으로 구성된다.
이러한 프로그램은 조합형 워드프로세서 프로그램의 예컨대 워드프로세서의 보조 프로그램인 프린터 구동 프로그램("드라이버")의 하나로 제공될 수 있다. 따라서, 본 발명의 프로그램을 설치하면 조합형 워드프로세서 프로그램의 프린터 드라이버에 하나의 드라이버가 추가되고, 그 추가된 드라이버를 선택하여 프린터 명령을 내렸을 때 본 발명에 따라 문서의 변환이 이루어진다. 물론, 프린터 드라이버의 형태가 아니고, 직접 변환 명령을 입력하도록 하거나 다른 이름으로 저장(save as)하는 형태로 변환 명령을 실행하도록 구성하는 것도 가능하다.
이러한 변환 명령에 따라서 페이지의 처음을 인식하고, 캐릭터의 종류를 인식하고, 인식된 종류에 근거해서 문자인 경우에는 코드 변환에 의한 완성형으로의 변환, 코드 변환이 불가능한 문자인 경우에는 단색 이미지로 변환, 단색 이미지인 경우에는 단색 이미지로 변환, 컬러 이미지의 경우에는 컬러 이미지로 변환, 선이나 표 등인 경우에는 벡터 값을 인식하여 동일한 선이나 표로 변환하고, 이러한 변환에 의해 해당 페이지의 끝을 인식한 후 새로운 페이지로부터 동일한 과정을 반복한 끝에 마지막 페이지까지 변환을 마침으로써 변환을 종료하는 컴퓨터 프로그램이 제공된다.
본 발명에 따른 프로그램은 그것이 하드 디스크와 같은 컴퓨터의 저장 장치에 설치되었을 때 이미 설치되어 있는 워드프로세서 프로그램에 결합되어 작동하는 하나의 보조 프로그램으로서 프린터 드라이버 또는 변환 프로그램의 하나로 될 수 있다. 또한, 이러한 보조 프로그램으로서가 아니라, 독립된 프로그램으로서 변환하고자 하는 문서를 선택하여 선택된 문서를 본 발명에 따라 PDF 포맷 파일로 변환하는 것도 물론 가능한 것이다.
이하 도면을 참조하여 본 발명을 상세히 설명한다.
도 1은 본 발명에 따라 한글의 조합형 워드프로세서로 작성된 문서를 전자 표준문서로 변환하는 과정을 보인 플로우챠트이다. 이것은 조합형 워드프로세서 프로그램의 프린터 드라이버의 한 형태로 제공되는 것이기 때문에, 사용자는 프린터 명령을 통해 제시된 프린터 드라이버 중에서 본 발명에 따라 추가된 변환 프린터 드라이버를 선택하게 된다. 이렇게 프린터 드라이버를 선택한 후 인쇄 명령을 하면, 본 발명의 프로그램에 따라 변환 및 저장을 진행한다.
따라서, 사용자는 먼저 프린터 드라이버 중에서 본 발명에 따른 변환 드라이버를 선택한다(100). 드라이버를 선택한 후 인쇄 명령을 내리면(102), 2단계 설정 변경을 진행한다. 먼저, 프린트 명령에 따라 해당 조합형 워드프로세서 프로그램에 현재 설치되어 있는 프린터의 설정 사항이 입력되며, 계속해서 PDF 라이터(writer)의 저장되는 형태의 설정을 변경한다(104).
설정 변경이 끝나면 프린터에 인쇄 시작을 입력하므로 프린터의 구동에 따라 문서의 변환이 시작된다(106). PDF 문서는 페이지 단위로 이루어지므로, 페이지의 시작을 인식한다(108). 이어서, 조합형 문서의 캐릭터들이 변환된다. 변환을 위해서 먼저 캐릭터(출력물)의 종류를 판단한다(110).
캐릭터가 문자로서 코드 값의 변경에 의해 PDF 포맷으로 변경 가능한 경우에는(112) 지정된 코드 값을 바꾸어 줌으로써 코드 변환이 이루어진다(120). 캐릭터가 단색 이미지인 경우에는 비트맵 이미지의 형태로 입력되어(114) 비트맵 이미지로 출력된다(126).
여기서 캐릭터가 문자인 경우에 코드 변경에 의해 문서의 변환을 진행하는 도중에 정의되지 않은 문자로 판단된 경우에는 이를 바로 단색 이미지로 인식하여 비트맵 이미지로 출력하도록 한다(122). 코드 값에 의해 정의되지 않은 문자를 제대로 변환하지 못함으로써 변환 없이 출력되어 이상한 문자가 나타나거나 변환이 이루어지지 않은 채 진행되는 오류를 방지할 수 있다. 물론 이와 같이 정의되지 않음 문자로서 이미지로 출력된 문자는 검색 기능에 의해 검색될 수 없다.
캐릭터가 컬러 이미지인 경우에는 이미지로 입력되어 출력된다(116, 128). 이 때 이미지의 포맷은 비트맵 형식으로 통일하는 것이 바람직하다. 또한, 캐릭터가 선이나 표 또는 다각형 등인 경우에는 인식된 다각형의 구성에 따라 PDF 라이터의 다각형 그리기를 실행한다(118). 이 때 다각형의 내부가 채워진 경우에는 폐쇄된 다각형으로 인식하고, 내부가 채워지지 않은 경우에는 선으로 인식하여 선으로 출력한다(132).
이와 같이 조합형 문서의 한 페이지에 들어 있는 첫 번째 캐릭터를 문자, 단색 이미지, 컬러 이미지 및 다각형 중 어느 하나로 인식하여 PDF 형식으로 출력을 진행한 후에는 그것이 해당 페이지의 끝인지를 파악한다(136). 그것이 해당 페이지의 끝이 아닌 경우에는 출력물의 종류를 판단하는 단계(110)을 복귀해서 캐릭터의 종류를 판단하여 변환을 진행한다.
이러한 과정의 진행에 의해 한 페이지의 캐릭터를 처음부터 하나씩 변환을 진행해서 마침내 그 페이지의 끝에 도달하면, 그 페이지를 닫는다(138). 해당 페이지의 변환이 끝난 후에는 다시 변환하고자 하는 조합형 문서의 끝까지 변환이 완성되었는지를 판단한다(140).
따라서, 문서의 끝에 도달하지 못한 경우에는 변환이 끝난 페이지의 다음 페이지의 시작을 인식하는 단계(108)로 복귀하여 캐릭터의 종류를 판단한 후 변환을 진행하는 과정을 반복한다. 이와 같이 조합형 문서의 처음 페이지부터 변환을 진행하여 마침내 페이지의 끝에 도달하면(140), 프린터 시스템의 설정을 원상태로 변경하고 또한 PDF 라이터의 설정도 원상태로 복구시킨 후 프로그램을 종료한다(142).
이러한 변환에 의해 조합형 워드프로세서 문서는 페이지 단위로 PDF 파일로 저장되며, 어떠한 문자, 기호, 부호, 이미지 또는 다각형이나 선 표 등도 손실되지 않고 그대로 PDF 파일로 변환될 수 있는 것이다. 특히 이미지를 단색 및 컬러로 분류하여 코드 변환이 되지 않는 문자 캐릭터를 단색 이미지로 변환시킴으로써 전체적으로 손실이나 에러 없는 변환이 가능하다.
본 발명의 다른 특징에 따라서, 조합형 한글 워드프로세서 문서를 통합 완성형 전자 문서로 변환시키는 방법에 있어서, ⒜ 상기 조합형 워드프로세서의 문서의 각 페이지의 시작을 인식하고; ⒝ 문서의 캐릭터의 종류를 인식하고; ⒞ 상기 인식된 캐릭터가 코드 변환이 가능한 문자인 경우에는 조합형 코드를 완성형 코드로 변환시키고; ⒟ 상기 인식된 캐릭터가 코드 변환할 수 없는 문자인 경우에는 단색 이미지로 변환시키고, ⒠ 상기 인식된 캐릭터가 컬러 이미지인 경우에는 컬러 이미지로 변환시키고, ⒡ 상기 인식된 캐릭터가 다각형의 경우에는 벡터 값으로 출력하여 동일한 다각형으로 변환시키고; ⒢ 페이지의 끝을 인식하여 페이지를 닫고; ⒣ 상기 조합형 문서의 최종 페이지에 도달할 때까지 상기 ⒜ 내지 ⒢의 단계를 반복하는 것을 특징으로 하는 컴퓨터 프로그램이 저장된 기록 매체가 제공된다.
한글 조합형 워드프로세서에 의해 작성된 문자 파일을 열어 캐릭터의 종류를 인식하고, 인식된 캐릭터의 종류에 따라 코드 변환이 가능한 문자는 코드 변환에 의해서, 코드 변환이 불가능한 문자는 단색 이미지로, 단색 이미지는 단색 비트맵 이미지로, 컬러 이미지는 컬러 이미지로, 선, 표 또는 다각형은 벡터 값을 분석하여 이를 PDF 라이터에 의해 동일하게 선, 표 또는 다각형으로 표시함으로써 한글 조합형 문서 파일을 통합 완성형 전자 문서로 변환시키는 단계는 앞에서 설명한 바와 같다. 이러한 방법을 구현하는 컴퓨터 소프트웨어로서의 프로그램은 공지된 저장장치에 저장될 수 있다.
이러한 프로그램을 저장하는 매체로는 하드 디스크, 플로피 디스크, CD-롬 타이틀, DVD-롬 타이틀, 자기 테이프, 광 파일 등 알려진 저장 매체를 모두 사용할 수 있다. 이들 저장 매체에 기록된 본 발명의 컴퓨터 프로그램은 PC, 워크스테이션, 기타 컴퓨터 시스템에 설치될 수 있으며, 이 때 해당 컴퓨터의 하드디스크 등에 설치될 수도 있고, 플로피 디스크, CD롬 타이틀 또는 DVD 타이틀 등에서 구동될 수도 있다.
기록 매체에 저장된 본 발명에 따른 프로그램은 컴퓨터에 설치됨으로써 컴퓨터의 연산장치에 의해 구동, 실행되며, 그 결과물도 기록 매체에 저장될 수 있다.
본 발명의 또다른 특징에 따라서, 저장 매체에 저장되어 있는 워드프로세서에 의해 작성된 문서 파일을 통합 완성형 전자 문서로 변환시키는 방법에 있어서, ⒜ 상기 저장 매체에 저장되어 있는 파일 중에서 문서 파일을 검색하고; ⒝ 상기 발견된 문서 파일의 소스가 인식 가능한지를 판단하고; ⒞ 소스의 인식이 불가능한 문서 파일의 경우에는 변환을 중지하고, 소스의 인식이 가능한 문서 파일의 경우에는 통합 완성형 전자 문서 기록 프로그램의 형식을 설정하고; ⒟ 상기 발견된 문서를 작성한 프로그램을 판단하여 조합형 한글 워드프로세서 프로그램, 완성형 한글 워드프로세서 프로그램 및 소스가 인식된 관련 한글 워드프로세서 프로그램 중 어느 하나에 해당되는 지를 판단하고; ⒠ 상기 발견된 문서가 조합형 한글 워드프로세서 문서인 경우에는 ㉮ 그 문서를 작성한 워드 프로세서를 인식하여 실행시키고; ㉯ 상기 조합형 워드프로세서의 문서의 각 페이지의 시작을 인식하고; ㉰ 문서의 캐릭터의 종류를 인식하고; ㉱ 상기 인식된 캐릭터가 코드 변환이 가능한 문자인 경우에는 조합형 코드를 완성형 코드로 변환시키고; ㉲ 상기 인식된 캐릭터가 코드 변환할 수 없는 문자인 경우에는 단색 이미지로 변환시키고; ㉳ 상기 인식된 캐릭터가 컬러 이미지인 경우에는 컬러 이미지로 변환시키고; ㉴ 상기 인식된 캐릭터가 다각형의 경우에는 벡터 값으로 출력하여 동일한 다각형으로 변환시키고; ㉵ 페이지의 끝을 인식하여 페이지를 닫고; ㉶ 상기 조합형 문서의 최종 페이지에 도달할 때까지 상기 ㉯ 내지 ㉵ 의 단계를 반복하여 조합형 문서를 통합 완성형 전자 문서로 변환시키고; ⒡ 상기 발견된 문서가 완성형 워드프로세서 문서인 경우에는 ㈎ 그 문서를 작성한 프로그램을 인식하여 실행시키고; ㈏ 소스 파일을 열어 통합 완성형 워드프로세서 프로그램으로 변환시키고; ⒢ 상기 발견된 문서가 파일의 소스가 인식된 관련 한글 워드프로세서 문서인 경우에는 ㈎ 해당 응용 프로그램을 인식하여 실행시키고; ㈏ 문서를 열어 통합 완성형 전자 문서로의 변환을 실행하고; ⒣ 실행된 워드프로세서 프로그램을 종료하고; ⒤ 상기 저장 매체의 문서 파일을 모두 변환할 때까지 상기 ⒜ 내지 ⒣ 단계를 반복하는 단계;를 포함하는 방법이 제공된다.
컴퓨터를 사용해서 워드프로세서 프로그램을 이용해 문서를 작성하는 사용자는 그 선호도에 따라 하나 또는 복수개의 워드프로세서 프로그램을 사용한다. 특히 하나의 프로그램을 사용하는 경우에는 그 프로그램에 대해 본 발명의 프로그램을 프린터 드라이버를 추가하는 형식으로 설치하여 통합 완성형 전자 문서로 변환시킬 수 있다. 그러나, 워드프로세서 프로그램을 사용함에 따라 저장된 문서는 수 개, 수십 개 또는 그 이상 수백 개의 파일이 생성될 수 있고, 이렇게 많은 문서를 일일이 열어 통합 완성형 전자문서 PDF 형식으로 저장하는 것은 매우 불편하고 번거로운 일이다.
더욱이, 다수의 사용자가 나름대로 선호하는 워드프로세서 프로그램을 사용하는 경우에 이들 프로그램 사이에는 상호 호환성이 부족한 경우가 많을 뿐만 아니라, 전혀 호환이 불가능한 프로그램도 있다.
따라서, 다수의 사용자를 갖는 회사나 학교 또는 단체에서 네트워크로 연결된 다수의 컴퓨터 또는 대형 컴퓨터에 연결된 단말기를 통해 다수의 서로 다른 형식의 문서들이 정리되지 않은 채 저장 매체에 분산되어 저장되어 있는 경우가 많다. 이들 문서를 하나의 형식으로 통일하여 누구나 접근할 수 있고 검색이 가능하도록 하는 것은, 업무의 효율성을 제고하고 사장된 자료를 누구나 사용 가능한 상태로 하는 것으로서 특히 회사나 연구소 또는 학교 등의 자료를 정리하여 표준화된 문서에 대한 접근성을 확보하는 것이므로 매우 중요하고 시급한 일이 아닐 수 없다.
이를 위하여 통합형 완성 한글 표준문서로 이들 복잡한 문서를 표준화하여 저장함으로써 누구나 이들 자료에 접근할 수 있고 특히 검색이 가능하므로 업무의 효율을 크게 향상시킬 수 있는 것이다.
이하 도 2의 플로우챠트에 따라 본 발명의 방법을 상세히 설명한다. 본 발명의 방법은 컴퓨터 프로그램으로 구현되는 것이 바람직하다. 컴퓨터에 설치된 본 발명의 프로그램은, 특히 하드디스크에 설치되어 기존에 설치된 워드프로세서 프로그램과 연결하여 작동된다. 본 발명의 프로그램은 일단 인쇄 명령의 형식으로 작동을 시작하므로, 인쇄 명령에 따라 먼저 프린터의 설정을 변경한다. 프린터의 설정 변경은 먼저 해당 컴퓨터의 기본 프린터로 설정되어 있는 프린터를 불러들여 PDF 라이터로 설정한다.
이어서 컴퓨터의 저장 매체에 저장된 워드프로세서 문서 파일을 탐색한다(202). 탐색은 저장된 파일의 확장자, 즉 아래아한글 프로그램 문서의 확장자 hwp, MS 워드 문서의 확장자 doc, 훈민정음 문서의 hun, 기타 텍스트 문서의 txt 등의 확장자를 검색하여 문서 파일을 확인한다. 물론, 이러한 확장자는 본 발명의 프로그램의 설정사항으로 자동 입력될 수도 있고, 사용자가 원하는 확장자를 지정하여 입력함으로써 프로그램의 실행에 의해 해당 저장 매체에 저장된 워드프로세서 문서 중에서 지정된 확장자의 파일만을 검색하도록 설정하는 것도 가능하다.
이렇게 검색된 문서 파일에 대해 소스 파일이 확인되는지를 판단한다(204). 만약 검색된 문서 파일에 대해 소스가 없는 경우에는 변환이 불가능하므로, 본 발명의 프로그램을 종료하게 된다. 이 경우에, 문서 전체를 이미지 형태로 PDF 파일로 변환하도록 구성하는 것은 가능하다. 여기서 프로그램의 설정에 따라 검색된 문서 파일을 자동으로 변환하도록 구성할 수도 있고, 검색 목록을 제공한 후 사용자로 하여금 변환할 문서를 지정하도록 구성하는 것도 가능하다.
검색된 문서 파일의 소스가 확인되면 PDF 라이터를 설정한다(206). 이 설정을 위해서 PDF 파일의 파일명을 결정하고, 필요한 옵션 사항을 PDF 라이터의 설정 파일(ini file)에 설정한다.
설정이 끝나면 해당 워드프로세서 문서의 프로그램이 어떤 종류인지를 확인한다(208). 이러한 확인은 물론 확장자에 따라 분류될 수 있다.
해당 문서를 작성한 프로그램이 조합형 워드프로세서 문서인 경우에는 그 프로그램을 실행한다(210). 이렇게 실행된 프로그램에서 본 발명의 프로그램에 따라 통합 완성형 문서로 변환을 한다. 이 때의 변환은 도 1과 관련하여 앞에서 설명한 바와 같이 캐릭터의 구분에 따라 코드 변환이 가능한 문자의 코드 값 변환, 단색 이미지 입력, 컬러 이미지 입력, 다각형 입력의 방법으로 변환을 진행한다.
변환이 끝나면 해당 워드프로세서 프로그램을 종료한다(228). 이렇게 하나의 문서를 변환한 후에는 다시 다음 문서 파일을 검색하는 단계로 복귀하여 계속해서 문서 파일의 변환을 진행하는 것이다(202).
상기 응용 프로그램의 확인 단계(208)에서, 그 문서가 완성형 워드프로세서 프로그램(예컨대, MS 워드 프로그램)인 경우에는 그 프로그램을 작성한 완성형 워드프로세서 프로그램을 실행하고(218), 소스 파일을 연 후에(218), 프린터를 본 발명의 방법에 따라 PDF 라이터로 설정하고(222), 소스 파일을 프린트 형식으로 PDF 파일로 변환한 후(224), 소스 파일을 닫고(226), 그 워드프로세서 프로그램을 종료한다(228).
이렇게 완성형 문서 파일의 변환이 끝나면 다시 다음 문서를 검색하는 단계로 복귀한다(202). 한편, 지정된 조합형 또는 완성형 프로그램에 의해 작성된 문서가 아니고 특별히 설정된 워드프로세서 프로그램이나 텍스트 기반의 문서 파일의 경우에는(214), 그 문서를 작성한 프로그램을 실행하여(214) 알려진 소스에 따라 변환을 실행하고(220) 응용 프로그램을 종료한다(228). 이 경우에도 다시 다음 문서를 검색하는 단계로 복귀한다(202).
이러한 방법으로 저장 매체에 저장되어 있는 문서 파일을 검색하여 하나하나 PDF 파일로 변환함으로써 문서 파일 전체의 변환이 끝나면 본 발명의 프로그램을 종료한다.
본 발명의 방법에서 저장 매체에 저장된 문서는 모두 PDF 파일로 변환되지만, 저장 매체가 해당 컴퓨터에 고정된 것만 아니라 연결된 저장 매체 또는 네트워크로 연결된 컴퓨터의 문서 파일도 검색 및 변환하도록 구성될 수도 있다.
이상 설명으로부터 명백한 바와 같이, 본 발명의 방법에 의해 조합형 워드프로세서 문서를 손실 없이 통합 완성형 PDF 전자 문서로 변환할 수 있다. 또한, 저장 매체에 저장되어 있는 문서를 탐색하여 전체적으로 통합 완성형 문서로 변환하므로, 프로그램의 종류에 따라 호환이 불가능하거나 검색이 불가능한 폐단을 없애고 누구나 표준화된 문서에 접근 및 검색이 가능하므로, 전자 문서의 효율적 관리 및 유용성을 크게 제고할 수 있는 것이다.
특히 인트라넷 환경에서 곳곳에 저장된 문서 파일을 찾아 일정한 장소에 본 발명에 따라 표준 문서로 저장함으로써 문서의 통합 관리 및 정보의 공유를 달성할 수 있는 장점이 있다.

Claims (5)

  1. 한글의 조합형 워드프로세서의 문서를 통합 완성형 전자 문서로 변환시키는 방법에 있어서,
    ⒜ 상기 조합형 워드프로세서의 문서의 각 페이지의 시작을 인식하고;
    ⒝ 문서의 캐릭터의 종류를 인식하고,
    ⒞ 상기 인식된 캐릭터가 코드 변환이 가능한 문자인 경우에는 조합형 코드를 완성형 코드로 변환시키고,
    ⒟ 상기 인식된 캐릭터가 코드 변환할 수 없는 문자인 경우에는 단색 이미지로 변환시키고,
    ⒠ 상기 인식된 캐릭터가 컬러 이미지인 경우에는 컬러 이미지로 변환시키고,
    ⒡ 상기 인식된 캐릭터가 다각형의 경우에는 벡터 값으로 출력하여 동일한 다각형으로 변환시키고;
    ⒢ 페이지의 끝을 인식하여 페이지를 닫고;
    ⒣ 상기 조합형 문서의 최종 페이지에 도달할 때까지 상기 ⒜ 내지 ⒢의 단계를 반복하는 단계;를 포함하는 방법.
  2. 제 1 항에 있어서, 상기 ⒟ 및 ⒠ 단계에서 비트맵 이미지로 변환하는 것을 특징으로 하는 방법.
  3. 조합형 한글 워드프로세서 문서를 통합 완성형 전자 문서로 변환시키는 방법에 있어서,
    ⒜ 상기 조합형 워드프로세서의 문서의 각 페이지의 시작을 인식하고;
    ⒝ 문서의 캐릭터의 종류를 인식하고,
    ⒞ 상기 인식된 캐릭터가 코드 변환이 가능한 문자인 경우에는 조합형 코드를 완성형 코드로 변환시키고,
    ⒟ 상기 인식된 캐릭터가 코드 변환할 수 없는 문자인 경우에는 단색 이미지로 변환시키고,
    ⒠ 상기 인식된 캐릭터가 컬러 이미지인 경우에는 컬러 이미지로 변환시키고,
    ⒡ 상기 인식된 캐릭터가 다각형의 경우에는 벡터 값으로 출력하여 동일한 다각형으로 변환시키고;
    ⒢ 페이지의 끝을 인식하여 페이지를 닫고;
    ⒣ 상기 조합형 문서의 최종 페이지에 도달할 때까지 상기 ⒜ 내지 ⒢의 단계를 반복하는 것을 특징으로 하는 컴퓨터 프로그램이 저장된 기록 매체.
  4. 제 1 항에 있어서, 프린터 출력 형태로 완성형 통합 전자문서로 변환 및 저장하는 것을 특징으로 하는 방법.
  5. 저장 매체에 저장되어 있는 워드프로세서에 의해 작성된 문서 파일을 통합 완성형 전자 문서로 변환시키는 방법에 있어서,
    ⒜ 상기 저장 매체에 저장되어 있는 파일 중에서 문서 파일을 검색하고;
    ⒝ 상기 발견된 문서 파일의 소스가 인식 가능한지를 판단하고;
    ⒞ 소스의 인식이 불가능한 문서 파일의 경우에는 변환을 중지하고, 소스의 인식이 가능한 문서 파일의 경우에는 통합 완성형 전자 문서 기록 프로그램의 형식을 설정하고;
    ⒟ 상기 발견된 문서를 작성한 프로그램을 판단하여 조합형 한글 워드프로세서 프로그램, 완성형 한글 워드프로세서 프로그램 및 소스가 인식된 관련 한글 워드프로세서 프로그램 중 어느 하나에 해당되는 지를 판단하고;
    ⒠ 상기 발견된 문서가 조합형 한글 워드프로세서 문서인 경우에는 ㉮ 그 문서를 작성한 워드 프로세서를 인식하여 실행시키고; ㉯ 상기 조합형 워드프로세서의 문서의 각 페이지의 시작을 인식하고; ㉰ 문서의 캐릭터의 종류를 인식하고; ㉱ 상기 인식된 캐릭터가 코드 변환이 가능한 문자인 경우에는 조합형 코드를 완성형 코드로 변환시키고; ㉲ 상기 인식된 캐릭터가 코드 변환할 수 없는 문자인 경우에는 단색 이미지로 변환시키고; ㉳ 상기 인식된 캐릭터가 컬러 이미지인 경우에는 컬러 이미지로 변환시키고; ㉴ 상기 인식된 캐릭터가 다각형의 경우에는 벡터 값으로 출력하여 동일한 다각형으로 변환시키고; ㉵ 페이지의 끝을 인식하여 페이지를 닫고; ㉶ 상기 조합형 문서의 최종 페이지에 도달할 때까지 상기 ㉯ 내지 ㉵ 의 단계를 반복하여 조합형 문서를 통합 완성형 전자 문서로 변환시키고;
    ⒡ 상기 발견된 문서가 완성형 워드프로세서 문서인 경우에는 ㈎ 그 문서를 작성한 프로그램을 인식하여 실행시키고; ㈏ 소스 파일을 열어 통합 완성형 워드프로세서 프로그램으로 변환시키고;
    ⒢ 상기 발견된 문서가 파일의 소스가 인식된 관련 한글 워드프로세서 문서인 경우에는 ㈎ 해당 응용 프로그램을 인식하여 실행시키고; ㈏ 문서를 열어 통합 완성형 전자 문서로의 변환을 실행하고;
    ⒣ 실행된 워드프로세서 프로그램을 종료하고;
    ⒤ 상기 저장 매체의 문서 파일을 모두 변환할 때까지 상기 ⒜ 내지 ⒣ 단계를 반복하는 단계;를 포함하는 방법.
KR1019990019243A 1999-05-27 1999-05-27 조합형 한글 워드프로세서의 문서를 통합 완성형 전자 문서로변환시키는 방법 및 그 컴퓨터 프로그램이 저장된 기록 매체 KR100327549B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990019243A KR100327549B1 (ko) 1999-05-27 1999-05-27 조합형 한글 워드프로세서의 문서를 통합 완성형 전자 문서로변환시키는 방법 및 그 컴퓨터 프로그램이 저장된 기록 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990019243A KR100327549B1 (ko) 1999-05-27 1999-05-27 조합형 한글 워드프로세서의 문서를 통합 완성형 전자 문서로변환시키는 방법 및 그 컴퓨터 프로그램이 저장된 기록 매체

Publications (2)

Publication Number Publication Date
KR20000074956A true KR20000074956A (ko) 2000-12-15
KR100327549B1 KR100327549B1 (ko) 2002-03-14

Family

ID=19588141

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990019243A KR100327549B1 (ko) 1999-05-27 1999-05-27 조합형 한글 워드프로세서의 문서를 통합 완성형 전자 문서로변환시키는 방법 및 그 컴퓨터 프로그램이 저장된 기록 매체

Country Status (1)

Country Link
KR (1) KR100327549B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101366796B1 (ko) * 2009-01-30 2014-02-25 후지제롯쿠스 가부시끼가이샤 인쇄 정보 변환 장치, 인쇄 장치, 인쇄 시스템 및 프로그램을 저장한 컴퓨터 판독가능 매체

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101366796B1 (ko) * 2009-01-30 2014-02-25 후지제롯쿠스 가부시끼가이샤 인쇄 정보 변환 장치, 인쇄 장치, 인쇄 시스템 및 프로그램을 저장한 컴퓨터 판독가능 매체

Also Published As

Publication number Publication date
KR100327549B1 (ko) 2002-03-14

Similar Documents

Publication Publication Date Title
CN101183355B (zh) 复制和粘贴处理方法及装置
US7134073B1 (en) Apparatus and method for enabling composite style sheet application to multi-part electronic documents
US20060092467A1 (en) Print job workflow system
KR100907671B1 (ko) 기록 매체 및 문자 입력 편집 방법
EP1672537A2 (en) Data semanticizer
EP2053522A2 (en) Conversion of a Collection of Data to a Structured, Printable and Navigable Format
US7272792B2 (en) Kana-to-kanji conversion method, apparatus and storage medium
JPH10228468A (ja) 文書情報管理システム
US5778380A (en) Intelligent resource transformation engine for translating files
US9135234B1 (en) Collaborative generation of digital content with interactive reports
US7203898B2 (en) Document processing method and apparatus
US20060271850A1 (en) Method and apparatus for transforming a printer into an XML printer
US11182542B2 (en) Exposing annotations in a document
JP4666996B2 (ja) 電子ファイリングシステム、電子ファイリング方法
KR102296939B1 (ko) 다중 모드를 지원하는 pdf 등의 전자문서를 관리하는 장치 및 방법
JP2008310816A (ja) 複数のマークアップ・ページ・データをコンパクトに表現するシステムおよび方法
US6040789A (en) Data conversion system
KR100327549B1 (ko) 조합형 한글 워드프로세서의 문서를 통합 완성형 전자 문서로변환시키는 방법 및 그 컴퓨터 프로그램이 저장된 기록 매체
Jorgensen DoD classes of electronic technical manuals
US8170270B2 (en) Universal reader
KR102189832B1 (ko) 오프라인 콘텐츠를 온라인 콘텐츠로 변환하기 위한 프로그램을 기록한 컴퓨터로 판독할 수 있는 매체 및 콘텐츠 변환 방법
JP4726252B2 (ja) 情報処理装置及び方法並びに制御プログラム
van Lit Philology: Standards for Digital Editing
Jansen ELECTRONIC PUBLISHING BUILDING ON SGML
CN111858978A (zh) 一种自动制作网络课件图标的方法及系统

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20050217

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee