KR20060101803A - 동적 열람이 가능한 전자 문서의 제작 및 열람 방법 - Google Patents

동적 열람이 가능한 전자 문서의 제작 및 열람 방법 Download PDF

Info

Publication number
KR20060101803A
KR20060101803A KR1020060025826A KR20060025826A KR20060101803A KR 20060101803 A KR20060101803 A KR 20060101803A KR 1020060025826 A KR1020060025826 A KR 1020060025826A KR 20060025826 A KR20060025826 A KR 20060025826A KR 20060101803 A KR20060101803 A KR 20060101803A
Authority
KR
South Korea
Prior art keywords
document
character
string
electronic document
information
Prior art date
Application number
KR1020060025826A
Other languages
English (en)
Inventor
양윤원
김동춘
Original Assignee
휴먼드림 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 휴먼드림 주식회사 filed Critical 휴먼드림 주식회사
Publication of KR20060101803A publication Critical patent/KR20060101803A/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J2/00Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed
    • B41J2/005Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed characterised by bringing liquid or particles selectively into contact with a printing material
    • B41J2/01Ink jet
    • B41J2/17Ink jet characterised by ink handling
    • B41J2/175Ink supply systems ; Circuit parts therefor
    • B41J2/17503Ink cartridges
    • B41J2/17506Refilling of the cartridge
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J2/00Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed
    • B41J2/005Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed characterised by bringing liquid or particles selectively into contact with a printing material
    • B41J2/01Ink jet
    • B41J2/17Ink jet characterised by ink handling
    • B41J2/175Ink supply systems ; Circuit parts therefor
    • B41J2/17563Ink filters
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J2/00Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed
    • B41J2/005Typewriters or selective printing mechanisms characterised by the printing or marking process for which they are designed characterised by bringing liquid or particles selectively into contact with a printing material
    • B41J2/01Ink jet
    • B41J2/17Ink jet characterised by ink handling
    • B41J2/175Ink supply systems ; Circuit parts therefor
    • B41J2/17596Ink pumps, ink valves

Abstract

본 발명에 따르면 각종 원본전자 문서 또는 원본이미지를 온/오프라인 환경에서 플랫폼에 독립적으로 열람할 수 있도록 변환하는 방법 및 이를 지원하는 문서 포맷을 제공한다.
대부분의 문서는 작성된 플랫폼이 지원하는 폰트에 종속적이지만, 본 방법을 통해 변환된 문서는 플랫폼에 독립적으로 열람 가능하다.
또한, 본 발명에 따르면 데이터 통신망을 통해 스트리밍 방식(랜덤 엑세스 방식)으로 사용자가 요청하는 페이지를 우선하여 즉시 전송함으로써 전체 문서를 다운로드 받을 때까지 기다려야 하는 종래 문서 포맷에 비하여 웹 서버에 저장된 문서를 데이터 통신망에 접속하여 열람하고자 하는 사용자의 편의성을 획기적으로 높인다.
또한, 본 발명에 따르면 원본문서로부터 이미지와 텍스트 정보를 분리, 추출하는 방식을 취함. 이미지 정보를 추출함으로써 원본 편집형태를 유지할 수 있고 텍스트 정보를 추출함으로써 검색/인덱싱 등이 가능하게 된다.

Description

동적 열람이 가능한 전자 문서의 제작 및 열람 방법 {Creating and Active Viewing Method for An Electronic Document}
도 1은 본 발명에 따른 전자 문서의 제작 방법을 간략히 도시한 도면,
도 2는 본 발명에 따른 전자 문서를 열람하는 열람 방법을 간략히 도시한 도면,
도 3은 본 발명에 따른 전자 문서 제작 방법에 따라 제작된 전자 문서의 소스 구성 일 예를 도시한 도면,
도 4는 본 발명에 따른 전자 문서를 열람하는 열람 화면 구성 예, 그리고
도 5는 도 4의 상태에서 검색어 문자열을 입력하고 검색을 요청한 결과 화면 예이다.
본 발명은 전자 문서의 작성 및 열람 방법에 대한 것이며, 기존의 범용의 상용 소프트웨어로 작성된 전자 문서로 부터 문서에 대한 이미지 데이터와 텍스트 데이터를 추출하여 본 발명의 실시에 적합한 전자 문서 형식으로 생성하고, 이를 클라이언트가 열람하도록 하는 방법을 제공하는 것을 목적으로 한다.
종래에는 마이크로소프트사의 "Word" , "Excel", "PowerPoint", 한글과 컴퓨 터 사의 "한글" 등의 전자 문서 형식이 있다. 이들 전자 문서는 기본적으로 텍스트 문서로서, 문자 정보를 텍스트 데이터로 처리하는 방식을 채용하고 있다. 그러나, 이러한 문서는 어느 시스템에서나 편집을 계속할 수 있도록 하기 위해서 문자 정보가 텍스트 데이터로 처리되므로, 문서가 열리는 시스템의 환경에 따라 표시 형태가 종속되는 결과를 가져온다. 그 결과, 문서를 열람하는 열람자의 컴퓨터에 문서에서 지정한 폰트가 없는 경우, 문서의 표시상태가 생성자의 의도와 다르게 현저히 변형되는 경우가 발생한다.
한편, 시스템 환경과 관계 없이 문서가 보이는 형태를 유지하는 문서 포맷으로는 Acrobat 사의 "PDF"파일 포맷이 있다. 이 파일 포맷은 문서의 유통과정에서 서로 다른 플랫폼에서도 문서의 구성이 초기 편집상태를 유지하도록 하는 목적으로 제작되어, 특정 글꼴의 존재 여부와 관계 없는 것은 물론, 서로 다른 운영체제에서도 동일한 문서 형태를 유지하는 장점이 있다.
하지만, PDF 파일 포맷은 온라인 상에서 유통되는 경우, 문서의 구성이 복잡하여 뷰어 프로그램의 크기도 크고, 그에 따라 요청 시점부터 문서를 열람하기까지의 시간이 오래 걸린다는 문제점을 가진다.
플랫폼에 독립적인 상태로 문서를 제공하는 방법으로는, 상표명 "데자뷰(DjVu)" 파일 포맷이 있다. 이 데자뷰 파일 포맷은 PDF 파일 포맷에서의 응답속도가 늦어지는 단점을 극복하기 위하여 각각의 페이지를 별도의 파일로 나누어 생성하여 서비스하고 있다. 그러나, 한 문서에 대한 파일 개수가 증가함에 따라 관리상의 불편함이 뒤따르게 된다.
또한, 플랫폼 독립적인 상태로 문서를 제공하는 관련 기술로는, 본 출원인이 취득한 특허 제405060호 "데이터 통신망을 통한 디지털 확대 이미지 제공방법,디지털 확대 이미지 제공장치"이 있다.
이 발명에 따르면, 다수의 이미지 파일 각각을 하나 이상의 이미지로 잘라서 조각이미지를 만들고 이 조각이미지들을 원격의 클라이언트로 전송한 후, 원격의 클라이언트가 조각 이미지를 결합하여 전체 이미지를 볼 수 있도록 하는 기술을 공개하고 있다. 그러나, 이 발명은 문서 파일의 경우 별도의 이미지로 생성하여야 하고, 또, 조각이미지를 개별로 관리하므로, 관리가 불편하다는 단점이 있다.
본 발명은 전술한 바와 같은 종래의 전자 문서 유통에서 발생하는 여러가지 단점을 극복하고, 제작이 간편한 플랫폼 독립 형식의 문서 포맷을 제공하기 위한 것으로서, 특히, 온라인 유통과정에서 빠른 응답속도를 실현하는 문서 형식을 제공하는 것을 기술적 과제로 한다.
본 발명에 따르면 각종 원본전자 문서 또는 원본이미지를 온/오프라인 환경에서 플랫폼에 독립적으로 열람할 수 있도록 변환하는 방법 및 이를 지원하는 문서 포맷을 제공한다.
대부분의 문서는 작성된 플랫폼이 지원하는 폰트에 종속적이지만, 본 방법을 통해 변환된 문서는 플랫폼에 독립적으로 열람 가능하다.
또한, 본 발명에 따르면 데이터 통신망을 통해 스트리밍 방식 ( 랜덤 엑세 스 방식)으로 사용자가 요청하는 페이지를 우선하여 즉시 전송함으로써 전체 문서를 다운로드 받을 때까지 기다려야 하는 종래 문서 포맷에 비하여 웹 서버에 저장된 문서를 데이터 통신망에 접속하여 열람하고자 하는 사용자의 편의성을 획기적으로 높인다.
또한, 본 발명에 따르면 원본문서로부터 이미지와 텍스트 정보를 분리, 추출하는 방식을 취하여, 이미지 정보를 추출함으로써 원본 편집형태를 유지할 수 있고 텍스트 정보를 추출함으로써 검색/인덱싱 등이 가능하게 된다.
또한, 본 발명자의 등록기술(특허 제0456438호) 인 3차원 입체 표시 영상이 삽입 표시되는 전자카탈로그를 이용하여 홍보 상품에 대한 고객 선호도를 조사하는 방법 및 조사분석시스템을 적용하여 인터넷을 통해 본 문서를 열람하는 사용자의 반응을 수집/분석할 수 있도록 하는 효과도 얻을 수 있다.
전술한 과제를 해결하기 위해서, 본 발명은, 문서 편집 소프트웨어의 출력 형태를 구성하고 이로부터 문서가 인쇄될 이미지 영역을 추출하여 이미지화된 영역을 생성하는 단계와, 출력 형태의 이미지화된 영역에서 문자가 표시된 영역에 대한 정보인 문자 위치 정보를 해당 영역의 문자 데이터와 함께 추출하는 단계와, 상기 이미지화된 영역과 문자 위치 정보 및 문자 데이터를 기초로 지정된 암호화 규칙에 따라 패키징된 단일 문서를 생성하는 단계를 포함하는 것을 특징으로 하는 전자 문서의 제작 방법을 제공한다.
이와 같은 전자문서의 제공방법을 제공함으로써, 이미지화된 영역, 이미지화된 영역 내의 문자에 대한 문자 정보 및 문자 위치 정보를 포함하고 있어, 플랫폼에 독립적인 상태로 원본 편집 상태를 유지하며 추출된 텍스트 정보에 따라 검색 및 인덱싱이 가능한 전자 문서를 제공할 수 있게 되었다.
또한, 본 발명에 따르면, 상기 이미지화된 영역을 생성하는 단계는 원시 문서의 특성에 따라 적절한 이미지 압축방식을 선정하는 최적화 단계를 포함하도록 한다.
그 결과 문서의 현재 상태에 최적인 압축방식을 택할 수 있어, 이미지 화질을 최적의 상태로 유지하면서도 압축률을 높일 수 있게 되었다.
또한, 본 발명에 따르면, 상기의 단일 문서를 생성하는 단계는 인터넷 브라우저가 바로 열람할 수 있는 포맷으로 패키징되는 것을 특징으로 하는 전자 문서의 제작 방법을 제공한다.
그 결과, 문서의 유통 및 관리가 편리하게 되었다.
또한, 본 발명에 따르면, 상기의 전자 문서 제작 방법의 수행은 클라이언트와 원격 접속된 서버에 의해 클라이언트 컴퓨터로부터 전송된 데이터에 대해서 일괄 처리되도록 하였다.
그 결과, 다수의 사용자가 하나의 서버에 접속하여 전자 문서를 보관하고 공유할 수 있도록 하는 문서 관리 시스템의 구성이 간편하게 되었다.
또한, 본 발명에 따르면, 이미지화된 영역과 상기 이미지화된 영역 내의 문자에 대한 문자 정보 및 문자 위치 정보를 기초로 지정된 암호화 규칙에 따라 패키 징된 다수 페이지의 단일 문서를 열람하는 전자 문서 열람 방법에 있어서, 전자 문서의 열람 도중 클라이언트가 검색어 문자열을 입력하고 검색을 요청함에 따라, 문서 내부의 문자 정보에서 검색어 문자열과 일치하는 문자열과 해당 문자열의 위치 정보를 찾아내고, 문자 위치 정보를 기초로 해당 문자열이 위치하는 이미지화된 영역의 특정 위치에 식별 표식을 표시하는 것을 특징으로 하는 전자 문서의 열람 방법을 제공한다.
그 결과, 이미지 기반의 문서이어서 문서에 대한 변형을 할 수 없도록 하면서도 문서 내의 문자에 대한 검색 및 문자 정보의 추출이 가능하게 되었다.
또한, 본 발명에 따르면, 이미지화된 영역과 상기 이미지화된 영역 내의 문자에 대한 문자 정보 및 문자 위치 정보를 기초로 지정된 암호화 규칙에 따라 패키징된 다수 페이지의 단일 문서를 열람하는 전자 문서 열람 방법에 있어서, 상기 서버는 클라이언트 요청에 따라 다수의 페이지 중 클라이언트가 요구한 페이지의 표시에 필요한 정보만을 우선 전송하고, 클라이언트의 추후 요구에 따라 표시될 다른 페이지의 데이터를 백그라운드 상태에서 연속적으로 전송할 수 있도록 구성되는 것을 특징으로 하는 전자 문서의 열람 방법을 제공한다.
그 결과, 용량이 큰 문서의 경우에도 열람하고자 하는 페이지를 먼저 볼 수 있도록 하므로 대용량 전자 문서 열람에 따른 응답 지연 현상을 제거할 수 있게 되었다.
또한, 본 발명에 따르면, 상기 전자 문서의 열람 방법에서 네트워크 사의 상기 클라이언트의 시스템은 상기 전자 문서를 열람하는 상태를 열람 상태 데이터로 서 추출하여 전자 문서가 지정한 위치의 특정 서버로 전송하여, 전자 문서를 열람하는 동안의 고객 반응을 분석할 수 있도록 한다. 그 결과, 고객이 전자 문서를 열람하면서 행하는 각종의 반응을 수집하여 분석할 수 있다.
또한, 본 발명에 따르면, 이미지화된 영역과 상기 이미지화된 영역 내의 문자에 대한 문자 정보 및 문자 위치 정보를 기초로 지정된 암호화 규칙에 따라 패키징된 다수 페이지의 단일 문서를 열람하는 전자 문서 열람 방법에 있어서, 검색어로서 문자열을 입력하는 단계와, 상기 입력된 검색 문자열을 다수의 전자 문서 각각에 포함되는 문자 정보와 비교하고, 그 결과로서 검색 문자열을 포함하는 문서와 검색 문자열이 포함된 위치의 전후 문장을 요약 표시하는 단계와, 사용자가 상기 요약 표시된 결과들 중에서 열람을 원하는 하나를 선택하면, 해당 문자열의 문자에 대한 위치 정보를 기초로 상기 검색어가 포함된 문서를 찾아 해당 문자열이 포함된 페이지를 표시하는 단계를 포함하는 것을 특징으로 하는 전자 문서의 열람 방법을 제공한다.
그 결과, 여러 전자 문서들 중에서 원하는 부분을 선택하여, 해당 문서의 해당 페이지로 즉시 이동하는 랜덤 액세스를 구현할 수 있으므로 문서를 찾는 효율성을 대폭으로 증대시킬 수 있게 되었다.
이때, 상기 전자 문서 각각의 문자 정보와 문자 위치 정보는 별도로 추출되어 검색용 인덱스 파일로 관리되도록 하면, 전자 문서의 수량이 늘어나게 되는 경우에도 빠르게 해당 문서의 해당 페이지로 액세스하는 속도를 높일 수 있다.
이하, 본 발명에 따른 동적 열람이 가능한 전자 문서의 제작 및 열람 방법에 대한 상세한 원리 및 작동 방법을 첨부된 도면을 참고하여 설명하도록 한다.
다음은 본 발명의 설명에 사용되는 용어에 대한 설명이다.
SDF : 본 발명에서 발명한 문서 포맷 (Streaming Document Format)
생성자 : SDF 문서를 생성하는 사용자
SDF 뷰어 : 열람자의 플랫폼에서 구동되며 SDF 문서를 열람 가능하게 하여주는 소프트웨어. SDF 문서 형식과 연결되어 있어서 임의의 SDF 문서를 호출하면 호출된 SDF 문서는 SDF 뷰어를 통하여 열람하게 된다. 또한, SDF 뷰어는 플랫폼에서 구동되고 있는 인터넷 브라우져에 플러그인 되어 있어서 브라우져를 통하여도 SDF 문서를 열람할 수 있다. SDF 뷰어는 실제 책을 펼쳐서 열람하는 사용자 환경을 제공한다.
열람자, 사용자 : 생성자에 의해서 생성된 SDF 문서를 온라인 상태 또는 오프라인 상태에서 열람하는 자.
온라인 : 통상의 인터넷 또는 특정 데이터 통신망을 통하여 SDF 문서에 접근하는 상태.
오프라인 : 열람자가 사용하고 있는 플랫폼의 저장 장치에 저장된 SDF 문서에 접근하여 열람하는 상태.
플랫폼 : 생성자 또는 열람자가 사용하고 있는 컴퓨터와 오퍼레이팅 시스템(OS)를 통합하여 부르는 말.
동적 열람 : 온라인 또는 오프라인 상태에서 SDF 문서의 첫 페이지가 열람된 상태에서 열람자가 원하는 페이지를 즉각 열람할 수 있거나, 특정한 설정에 의해서 SDF 문서가 최초로 열람될 때 첫 페이지가 아닌 다른 임의의 페이지를 열람 가능하게 하는 기능.
스트리밍(Streaming): 온라인 상에서 동적 열람이 가능하게 데이터를 전송하는 것.
페이지 : 열람 대상이 되는 문서의 한 쪽.
이하 첨부된 도면을 참고하여 본 발명의 보다 상세한 구성을 설명하도록 한다.
본 발명은 크게 두 부분으로 구성되어 있다. 원본 문서를 부호화하여 SDF 문서 파일을 생성하는 단계와, 온라인 또는 오프라인에서 SDF 문서 파일을 열람하는 단계가 그것이다.
먼저, 도 1을 참고하면서 원본 문서를 부호화하고 SDF 문서 파일을 생성하는 단계에 대해 상세히 설명한다.
도 1의 단계 1(S 1)은 원본 문서에 대한 변환 옵션을 설정하는 단계로서, 미리 설정된 값으로 자동 입력되거나 또는 사용자에 의해 수동 입력된다 . 다음은 일반적인 옵션을 나타낸 것이다.
(1) 보안 관련 항목 : 열람자 범위, 서비스 범위(온라인, 오프라인, 서비스 서버 제한, 열람자 플랫폼 제한, 암호 설정 여부, 암호화 알고리즘 선택, 인쇄 지원 여부, 화면 복사 가능 여부)
(2) 저작권 관련 항목 : 저작자 정보, 열람자가 보안 설정에 의해 허가 되지 않는 경우 처리 방법 지정(문서 삭제, 지정한 URL 로의 자동 이동, 경고 메시지 지 정).
(3) 사용자 반응 분석 관련 항목 : 특허 제 0456438호의 기술과 관련한 사용자 반응 분석 사용 여부, 반응 분석에 필요한 요소 설정, 반응 분석 서버 주소, 사용자 반응 분석 항목의 범위.
단계 2(S 2)는 원본 문서를 입수하는 단계로서, 원본 문서는 일반적으로 사용되는 문서인 DOC, PPT, HWP, XLS, PDF 등의 문서파일과 JPG, PNG, GIF 등의 이미지 파일 등 어느 것이나 좋으며 인쇄 가능한 상태의 문서 포맷이라면 적용 가능하다.
단계 3(S 3)은, 변환 소프트웨어를 사용하여 원본 문서를 플랫폼 독립적인 형태의 파일로 변환하는 단계로서, 변환 소프트웨어는 문서처리용 소프트웨어에 플러그 인되거나 또는 단독으로 작동하도록 설치된다.
단계 4(S 4) 및 단계 5(S 5)는, 중립 형식화 과정을 거친 파일을 분석하여 원본 문서의 종류에 알맞은 형식의 SDF 파일의 데이터 구조를 결정 및 생성하는 단계이다.
단계 6(S 6) 내지 단계 8(S 8)은, 단계 3(S 3)에서 생성된 중립 파일로부터 원본 문서에 포함되어 있는 문자를 추출하는 단계이다. 이 단계에서의 문자 추출은 원본 문서가 문자 형식인 경우는 중립 문서로부터 직접 추출하고 방식으로 이루어지며, 원본 문서가 이미지 파일 형식인 경우에는 원본 문서에 대한 광학 문자 인식(OCR) 과정을 통하여 이루어진다.
이 과정에서, 원본 문서로부터 추출된 각 문자에 대한 좌표값과 각 문자의 상대 크기는 쌍으로 묶여서 데이터베이스화 한다.
데이터베이스화 방법은 관계형 데이터베이스가 사용될 수도 있으며, 원본 문서 각각에 대응하는 XML 형식의 데이터를 생성하는 방식을 사용할 수도 있다. XML 형식의 데이터를 생성하면 문서 단위의 관리가 편리해진다는 장점이 있다.
단계 9(S 9) 내지 단계 11(S 11)은 단계 3에서 생성된 중립 파일을 원본의 구성을 유지하면서 플랫폼 독립성을 부여한 표준 데이터로 변환하는 작업을 수행하는 단계이다. 이 과정에는 각 페이지의 특성을 분석하여 데이터 최적화 과정을 통해 데이터의 크기를 줄이는 과정이 포함된다.
구체적으로, 원본이 이미지 데이터인 경우에 데이터 최적화 과정에서는 색상공간에 대한 3차원 최적화 과정을 통하여 팔레트를 생성하며, 팔레트의 특성에 알맞은 이미지 압축 포맷으로 자동으로 재변환하게 된다. 예를 들면, 원본이 흑백 문서인 경우에는 GIF 포맷을 사용하며, 컬러 사진인 경우라면 JPG 포맷이 사용될 수 있다.
단계 12(S 12) 및 단계 13(S 13)은, 동적 열람 및 스트리밍이 가능한 데이터 포맷을 구성할 수 있도록 단계 8(S 8) 및 단계 11(S 11)에서 생성된 데이터의 상호 관련 정보를 계산하여 단계 5(S 5)에서 생성된 데이터 구조를 바탕으로 단계 1(S 1)의 데이터를 포함하는 메타 데이터를 생성하는 단계이다.
단계 14(S 14) 및 단계 15(S 15)는 단계 8, 11, 13의 각 단계에서 생성된 데이터를 암호화하고 합성하여 최종적으로 SDF 문서를 생성하는 단계이다. 이때 암호화는 단계 1(S 1)에서 생성자가 지정한 암호화 방식을 사용한다.
최종 생성된 SDF 문서는 인터넷 익스플로러 등의 인터넷 브라우저가 열람할 수 있는 형태로 하나의 파일로 패키징되는 것이 바람직하다. 하나의 파일로 패키징 되어야 파일의 유통 및 관리가 간단해진다.
패키징된 파일의 확장자도 인터넷 브라우저가 바로 열람할 수 있는 형식이 적합하다. htm 이나 html 등의 확장자를 사용하면 더욱 바람직하다.
도 3은 파일 확장자를 html로 한 경우로서, 파일에 대한 소스 보기를 한 상태이다. 파일은 앞쪽의 html파일 형식에 맞게 기술된 부분과 뒤쪽의 암호화된 부분으로 구분된다. 인터넷 브라우저는 이 SDF 포맷의 파일을 html파일로 판단하여 열고나서 앞쪽의 처리를 수행하고 SDF 파일 뷰어를 열어 뒤쪽의 암호화된 데이터를 처리한다.
도 1의 단계 1(S 1) 내지 15(S 2)에서의 작업은 클라이언트 컴퓨터에 설치된 전용 소프트웨어에 의해 오프라인 상태로 처리될 수도 있지만, 클라이언트 컴퓨터와 네트워크로 접속된 서버를 통해서, 웹 서비스 형태로 제공될 수도 있다.
또한, 현재 문서를 지정하여 문서별로 개별 작업을 수행하도록 구성할 수도 있으며, 특정 폴더를 지정하여 여러 문서에 대해 일괄적인 처리(Batch Processing)를 수행하도록 구성할 수도 있다.
일괄 처리를 수행하는 경우, 소스 폴더 및 타깃 폴더 지정 및 변경을 위한 옵션 설정이 필요하며, 일괄 처리는 문서 변환을 웹 서비스 형태로 수행하도록 구성하는 경우에 특히 적합하다.
다음으로, 도 2를 참고하여 온라인 또는 오프라인 상태에서 SDF 문서 파일을 열람하는 과정에 대해 상세히 설명하도록 한다.
도 2의 단계 17(S 17)는, SDF 뷰어가 SDF 문서로부터 메타 데이터를 읽어오는 단계이다. 열람자의 플랫폼에 SDF 문서를 복호화할 수 있는 SDF 뷰어가 이미 설치되어 있거나 온라인 또는 오프라인 상태에서 자동 설치가 완료된 상태에서 SDF문서를 읽게 되면, SDF 뷰어는 파일로부터 메타 데이터를 가장 먼저 읽어 오게 된다.
단계 18(S 18)은, SDF 뷰어가 단계 17(S 17)에서 읽어 들인 메타 데이터로부터 보안 및 열람 조건 관련 데이터만을 분석하여 현재의 열람 상황이 생성자가 지정한 보안 및 열람 조건을 만족하는지를 점검하는 단계이다. 이 단계에서 점검 결과 부적합으로 판명되면 SDF 뷰어는 생성자가 지정한 처리 단계를 수행하게 되고, 적합으로 판명되면 열람 조건에 맞게 환경을 설정시키고 단계 19(S 19)로 진행한다.
단계 19(S 19)는, SDF 뷰어가 단계 17(S 17)에서 읽어 들인 메타 데이터에서 페이지 데이터 구조에 관련된 데이터를 분석하여 동적 열람이 가능한 조건을 만드는 단계이다. 이때 페이지 데이터에서 검색을 위한 데이터를 우선적으로 읽어 들이게 된다.
단계 20(S 20) 및 21(S 21)에서 SDF 뷰어는 먼저 첫 페이지 또는 생성자에 의해서 설정된 특정 페이지 데이터를 스트리밍 방식으로 읽어 들이고, 그 이후에 사용자가 요구하는 임의의 페이지 데이터를 읽어 들이게 된다. 이때 SDF 뷰어가 현재 열람하고 있는 페이지의 전후 페이지 데이터를 SDF 문서로부터 다 읽어 오지 않은 상태라면, 단계 20(S 20) 및 단계 22(S 22) 내지 단계 25(S 25)의 작업은 백 그라운드 상태로 지속 수행된다.
단계 22(S 22)는, 단계 20(S 20)에서 읽은 페이지 데이터를 복호화하여, 도 1의 단계 8(S 8) 및 단계 11(S 11)의 데이터로 복원하는 단계이다.
단계 23(S 23)은, 단계 22(S 22)를 거쳐 복원된 페이지 데이터로부터 적용된 이미지 압축 알고리즘을 확인하고, 그에 따라서 복호화를 수행하여 이미지를 생성하는 단계이다.
단계 24(S 23) 및 단계 25( S 25)는, 단계 22(S 22)를 거쳐 복원된 페이지 데이터에서 단계 7(S 7)에서 계산된 결과를 바탕으로 페이지 내에서의 문자 데이터의 좌표를 계산하여 표시하는 단계이다. 이때, 열람자가 검색을 할 경우에는 검색 결과 문자의 위치가 표시될 수 있도록 재활용 가능한 상태로 문자 및 좌표 계산 데이터를 유지한다.
단계 26(S 26)은, SDF 뷰어가 단계 23(S 23) 및 25(S 25)에서 생성된 결과를 통합하여 열람자 플랫폼의 화면에 표시해 주는 단계이다.
이 경우, 사용자가 문자 검색을 요청한 경우라면, 검색된 문자의 위치에는 음영표시가 이루어져 사용자가 쉽게 식별할 수 있도록 한다.
단계 27(S 27)은, 단계 21(S 21)에서 열람자가 현재 페이지에 대해서 확대/축소/이동/링크이 있는 경우에 단계 22 내지 단계 25의 작업을 수행하지 않고 열람자의 요정에 맞는 화면을 구성하여 단계 26(S 26)으로 진행하는 단계이다..
단계 28(S 28)은, 단계 21(S 21)에서의 열람자의 요청의 행태 및 플랫폼에서 작동하고 있는 입력장치(마우스, 키보드 등)의 상태를 특허 제 0456438호 의 기술 을 이용하여 열람자의 반응 분석을 처리하는 단계이다.
문서에 대한 고객 반응 분석은 문서를 온라인 상태로 게시하고 열람자가 문서를 열람하고 있는 상태에서, 검색어를 입력하거나 마우스로 특정 위치를 클릭하는 등의 반응을 수집하여 문서에서 지정한 원격의 분석 서버로 전송하는 것으로 이루어진다.
원격의 고객 반응 분석 서버는 여러 명의 문서 열람자가 문서 열람 상태에서 보여준 반응을 수집하고 통계 분석하여 그 결과를 종합한다.
도 3은 본 발명에 따라 생성된 SDF 파일에 대한 소스 보기를 한 상태이다. 도면에서 확인할 수 있는 것처럼, 도 3의 SDF 파일은 html 파일 포맷으로 구성하였으며, 외부적으로도 파일 확장자를 html로 하였다.
그 결과, 인터넷 익스플로러 등의 인터넷 브라우저가 SDF 파일을 바로 읽어낼 수 있다. 다만, SDF 파일 포맷을 온전한 상태로 읽기 위해서는 뷰어가 설치되어야 하며, 인터넷 브라우저는 뷰어가 설치되어 있지 않은 경우, 온라인 상태에서 지정된 URL로부터 뷰어를 다운로드 받아 설치하게 된다.
인터넷 브라우저에 플러그인 된 형태로 설치된 SDF 뷰어는, 도 3의 하단에 표시된 바와 같이 파일의 뒷부분에 첨부된 소스 부분에서 SDF 파일의 표시에 필요한 SDF 소스 데이터를 추출하여 브라우저를 통해 표시하게 된다.
도 4는 인터넷 브라우저를 이용하여 본 발명에 따라 구성된 SDF 파일을 열람한 경우의 화면을 캡처한 것이다.
도 4의 화면에서 사용자는 확대, 축소, 책넘김 효과 표시 등을 수행하며 파 일 내용을 열람할 수 있다. 또한, 사용자는 SDF 파일 포맷의 문서에 포함된 추출문자 정보를 이용하여, 검색 문자의 입력과 검색된 문자의 표시(음영 표시)를 행할 수 있다.
도 5는 도 4의 표시 화면에서 사용자가 검색어를 입력하고 검색을 요청한 경우의 결과 화면이다. 도면에 도시된 바와 같이, 사용자가 요청한 검색어의 검색 결과는 노란색으로 음영 표시되었다. 또한 다수의 검색 결과는 오른쪽의 검색결과 창에 목록으로 표시되었으므로 사용자의 선택에 따라 해당 위치로 즉시 이동할 수 있다.
도 4 및 도 5는 본 발명에 따른 SDF 파일 포맷의 문서 내에서 특정한 문자열의 위치를 찾아내는 경우를 예로 들었다. 그러나, 이러한 검색 기능은 여러 개의 SDF 문서에서 원하는 문자열이 존재하는 파일과 해당 파일에서 문자열이 존재하는 위치 정보를 찾는 것으로 기능이 확장될 수 있다.
여러 문서로부터 특정 문자열이 포함된 위치를 찾는 경우에는, 특정한 위치에 저장된 여러 SDF 파일 포맷 문서로부터 특정 문자열을 포함하는 파일을 구분하고 해당 파일로부터 문자열이 존재하는 위치를 찾아 검색된 결과로서 목록으로 표시된다.
사용자가 검색된 결과 목록에서 원하는 문자열을 선택하면, 선택한 결과가 포함되는 특정 문서를 선택하고 그 특정 문서에서의 사용자가 선택한 문자열이 포함되 페이지를 열게 된다.
이와 같은 방법을 응용하여 문서관리시스템 또는 지식관리시스템을 구성하 면, 해당 시스템에서 원하는 문자열이 포함되는 문서를 찾고 동시에 해당 문서를 선택하여 사용자가 찾기 원하는 위치를 바로 이동할 수 있어 검색 문자열에 대한 랜덤 액세스를 실현할 수 있다.
이때, 전자 문서 내에 포함된 문자 정보와 각 문자의 문자위치 정보는 추출되어 별도의 인덱스 파일로 관리될 수도 있다. 별도의 인덱스 파일을 사용하면, 전자문서의 수량이 증가하게 되더라도 전자 문서 파일 각각을 분석하지 않고 인덱스 파일만을 분석하여 동일 효과를 얻을 수 있으므로, 파일에 대한 정보 검색을 보다 빨리 수행할 수 있다.
본 발명에 따른 동적 열람이 가능한 전자 문서의 제작 및 열람 방법을 제공함으로써, 온라인을 통해 문서를 열람하는 경우에 문서량이 커지거나 네트워크 대역폭이 제한되는 경우에 로딩 시간이 길어지는 기존의 전자문서(예를 들면 PDF)가 가지는 웹 서비스에 부적합해지는 문제를 제거할 수 있게 되었다.
또한, 기존 웹 문서가 가지는 문제인, 원본의 폰트 / 편집형태를 유지하지 못하는 문제를 해소할 수 있게 되었다. 그리고, 기존 이미지 기반 전자책 포맷의 문제인, 원본 폰트 / 편집형태를 유지하고 랜덤 액세스할 수 있지만 폰트 정보를 처리하지 못하며 특정 플랫폼에 종속되는 문제 등을 극복할 수 있게 되었다.

Claims (10)

  1. 문서 편집 소프트웨어의 출력 형태를 구성하고 이로부터 문서가 인쇄될 이미지 영역을 추출하여 이미지화된 영역을 생성하는 단계와,
    출력 형태의 이미지화된 영역에서 문자가 표시된 영역에 대한 정보인 문자 위치 정보를 해당 영역의 문자 데이터와 함께 추출하는 단계와,
    상기 이미지화된 영역과 문자 위치 정보 및 문자 데이터를 기초로 지정된 암호화 규칙에 따라 패키징된 단일 문서를 생성하는 단계를 포함하는 것을 특징으로 하는 전자 문서의 제작 방법.
  2. 제 1항에 있어서,
    이미지화된 영역을 생성하는 단계는 원시 문서의 특성에 따라 적절한 이미지 압축방식을 선정하는 최적화 단계를 포함하는 것을 특징으로 하는 전자 문서의 제작 방법.
  3. 제1항에 있어서,
    단일 문서를 생성하는 단계는 인터넷 브라우저가 바로 열람할 수 있는 포맷으로 패키징되는 것을 특징으로 하는 전자 문서의 제작 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    전자 문서 제작 방법의 수행은 클라이언트와 원격 접속된 서버에 의해 클라이언트 컴퓨터로부터 전송된 데이터에 대해서 일괄 처리되는 것을 특징으로 하는 전자 문서의 제작 방법.
  5. 이미지화된 영역과 상기 이미지화된 영역 내의 문자에 대한 문자 정보 및 문자 위치 정보를 기초로 지정된 암호화 규칙에 따라 패키징된 다수 페이지의 단일 문서를 열람하는 전자 문서 열람 방법에 있어서,
    전자 문서의 열람 도중 클라이언트가 검색어 문자열을 입력하고 검색을 요청함에 따라,
    문서 내부의 문자 정보에서 검색어 문자열과 일치하는 문자열과 해당 문자열의 위치 정보를 찾아내고, 문자 위치 정보를 기초로 해당 문자열이 위치하는 이미지화된 영역의 특정 위치에 식별 표식을 표시하는 것을 특징으로 하는 전자 문서의 열람 방법.
  6. 이미지화된 영역과 상기 이미지화된 영역 내의 문자에 대한 문자 정보 및 문자 위치 정보를 기초로 지정된 암호화 규칙에 따라 패키징된 다수 페이지의 단일 문서를 열람하는 전자 문서 열람 방법에 있어서,
    상기 서버는 클라이언트 요청에 따라 다수의 페이지 중 클라이언트가 요구한 페이지의 표시에 필요한 정보만을 우선 전송하고,
    클라이언트의 추후 요구에 따라 표시될 다른 페이지의 데이터를 백그라운드 상태에서 연속적으로 전송할 수 있도록 구성되는 것을 특징으로 하는 전자 문서의 열람 방법.
  7. 제6항에 있어서,
    전자 문서의 열람 도중 클라이언트가 검색어 문자열을 입력하고 검색을 요청함에 따라,
    문서 내부의 문자 정보에서 검색어 문자열과 일치하는 문자열과 해당 문자열의 위치 정보를 찾아내고, 문자 위치 정보를 기초로 해당 문자열이 위치하는 이미지화된 영역의 특정 위치에 식별 표식을 표시하는 것을 특징으로 하는 전자 문서의 열람 방법.
  8. 제6항 또는 제7항에 있어서,
    네트워크 사의 상기 클라이언트의 시스템은 상기 전자 문서를 열람하는 상태를 열람 상태 데이터로서 추출하여 전자 문서가 지정한 위치의 특정 서버로 전송하여, 전자 문서를 열람하는 동안의 고객 반응을 분석할 수 있도록 하는 것을 특징으로 하는 전자 문서의 열람 방법.
  9. 이미지화된 영역과 상기 이미지화된 영역 내의 문자에 대한 문자 정보 및 문자 위치 정보를 기초로 지정된 암호화 규칙에 따라 패키징된 다수 페이지의 단일 문서를 열람하는 전자 문서 열람 방법에 있어서,
    검색어로서 문자열을 입력하는 단계와,
    상기 입력된 검색 문자열을 다수의 전자 문서 각각에 포함되는 문자 정보와 비교하고, 그 결과로서 검색 문자열을 포함하는 문서와 검색 문자열이 포함된 위치의 전후 문장을 요약 표시하는 단계와,
    사용자가 상기 요약 표시된 결과들 중에서 열람을 원하는 하나를 선택하면, 해당 문자열의 문자에 대한 위치 정보를 기초로 상기 검색어가 포함된 문서를 찾아 해당 문자열이 포함된 페이지를 표시하는 단계를 포함하는 것을 특징으로 하는 전자 문서의 열람 방법.
  10. 제9항에 있어서,
    상기 전자 문서 각각의 문자 정보와 문자 위치 정보는 별도로 추출되어 검색용 인덱스 파일로 관리되는 것을 특징으로 하는 전자 문서의 열람 방법.
KR1020060025826A 2005-03-21 2006-03-21 동적 열람이 가능한 전자 문서의 제작 및 열람 방법 KR20060101803A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020050023401A KR20050052421A (ko) 2005-03-21 2005-03-21 동적 열람이 가능한 전자 문서의 제작 및 열람 방법
KR1020050023401 2005-03-21

Publications (1)

Publication Number Publication Date
KR20060101803A true KR20060101803A (ko) 2006-09-26

Family

ID=37248403

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020050023401A KR20050052421A (ko) 2005-03-21 2005-03-21 동적 열람이 가능한 전자 문서의 제작 및 열람 방법
KR1020060025826A KR20060101803A (ko) 2005-03-21 2006-03-21 동적 열람이 가능한 전자 문서의 제작 및 열람 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020050023401A KR20050052421A (ko) 2005-03-21 2005-03-21 동적 열람이 가능한 전자 문서의 제작 및 열람 방법

Country Status (1)

Country Link
KR (2) KR20050052421A (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100877634B1 (ko) * 2007-04-16 2009-01-08 (주)씨오엑스시스템 대용량 pdf문서의 처리시스템
KR101204039B1 (ko) * 2012-06-28 2012-11-23 (주) 사이냅소프트 문자열 추출 시스템 및 그 방법
KR101371406B1 (ko) * 2013-10-08 2014-03-13 (주)에프데스크 Pdf 문서의 소스분석을 통한 전자책 제작방법 및 시스템
KR102129030B1 (ko) * 2020-01-28 2020-07-02 주식회사 지란지교데이터 전자문서의 보안정보 비식별화 방법 및 장치
KR102201930B1 (ko) * 2019-11-07 2021-01-12 신현준 문서 정보를 포함한 이미지 파일의 자동 문서화 장치 및 방법
CN112860645A (zh) * 2021-02-09 2021-05-28 恒安嘉新(北京)科技股份公司 一种离线压缩文件的处理方法、装置、计算机设备及介质
KR102393926B1 (ko) 2021-11-17 2022-05-03 (주)케이엔랩 이미지 검색 기반의 가공 이미지 및 설명 생성 방법, 정보 관리 시스템, 이를 위한 컴퓨터 프로그램

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100736336B1 (ko) * 2006-08-04 2007-07-06 (주)인트라테크 분철 페이지 문서 가상 바인딩 방법 및 그 시스템
KR100826959B1 (ko) * 2007-03-26 2008-05-02 정상국 동영상 제작 방법 및 시스템
KR101142076B1 (ko) * 2010-08-23 2012-05-03 주식회사 하나아이앤에스 문서의 전자화 방법 및 전자화 문서의 열람 방법
KR101636335B1 (ko) * 2015-04-29 2016-07-06 (주)오렌지디지트코리아 인터랙티브 효과를 자동 부여하는 문서 변환 시스템, 방법 및 그 방법을 실행시킬 수 있는 프로그램이 저장된 기록매체

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100877634B1 (ko) * 2007-04-16 2009-01-08 (주)씨오엑스시스템 대용량 pdf문서의 처리시스템
KR101204039B1 (ko) * 2012-06-28 2012-11-23 (주) 사이냅소프트 문자열 추출 시스템 및 그 방법
KR101371406B1 (ko) * 2013-10-08 2014-03-13 (주)에프데스크 Pdf 문서의 소스분석을 통한 전자책 제작방법 및 시스템
KR102201930B1 (ko) * 2019-11-07 2021-01-12 신현준 문서 정보를 포함한 이미지 파일의 자동 문서화 장치 및 방법
KR102129030B1 (ko) * 2020-01-28 2020-07-02 주식회사 지란지교데이터 전자문서의 보안정보 비식별화 방법 및 장치
CN112860645A (zh) * 2021-02-09 2021-05-28 恒安嘉新(北京)科技股份公司 一种离线压缩文件的处理方法、装置、计算机设备及介质
KR102393926B1 (ko) 2021-11-17 2022-05-03 (주)케이엔랩 이미지 검색 기반의 가공 이미지 및 설명 생성 방법, 정보 관리 시스템, 이를 위한 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR20050052421A (ko) 2005-06-02

Similar Documents

Publication Publication Date Title
KR20060101803A (ko) 동적 열람이 가능한 전자 문서의 제작 및 열람 방법
AU2007210092B2 (en) Presenting digitized content on a network
US8423537B2 (en) Method and arrangement for handling of information search results
US20090052804A1 (en) Method process and apparatus for automated document scanning and management system
US8482808B2 (en) Image processing apparatus and method for displaying a preview of scanned document data
US11610066B2 (en) Creation of component templates based on semantically similar content
US20080115057A1 (en) High precision data extraction
US20230281377A1 (en) Systems and methods for displaying digital forensic evidence
JP2005512185A (ja) マルチページsvg文書用ディレクトリ
JP5676167B2 (ja) サーチ結果を生成するシステムと方法
US20010032084A1 (en) Multimedia information structuring and application generating method and apparatus
JP2000222394A (ja) 文書管理装置及びその文書管理方法並びにその制御プログラムを記録した記録媒体
US20170337251A1 (en) Systems and methods for graphical exploration of forensic data
US10839146B2 (en) Information processing system, information processing apparatus, control method, and storage medium
US20120046937A1 (en) Semantic classification of variable data campaign information
JP5103051B2 (ja) 情報処理システム及び情報処理方法
US20090100023A1 (en) Information processing apparatus and computer readable information recording medium
JP6840597B2 (ja) 検索結果要約装置、プログラム及び方法
CN116401432A (zh) 一种数字化档案加工管理系统及方法
WO1999023584A2 (en) Information component management system
CN105740317A (zh) 用于将非文本内容对象化以及用于文档发现的方法和系统
KR101975111B1 (ko) 대용량 웹페이지 문서 변환 시스템 및 그 방법
US20050050452A1 (en) Systems and methods for generating an electronically publishable document
JP2006309443A (ja) 情報処理システム、情報処理装置、情報処理端末、情報処理方法、その方法をコンピュータで実行するプログラム、および記録媒体
JP7134814B2 (ja) システム、ページデータ出力方法、及びプログラム

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination