KR101971172B1 - 전자문서 파일 변환시스템 및 그 방법 - Google Patents

전자문서 파일 변환시스템 및 그 방법 Download PDF

Info

Publication number
KR101971172B1
KR101971172B1 KR1020180098622A KR20180098622A KR101971172B1 KR 101971172 B1 KR101971172 B1 KR 101971172B1 KR 1020180098622 A KR1020180098622 A KR 1020180098622A KR 20180098622 A KR20180098622 A KR 20180098622A KR 101971172 B1 KR101971172 B1 KR 101971172B1
Authority
KR
South Korea
Prior art keywords
multimedia
file
document file
document
information
Prior art date
Application number
KR1020180098622A
Other languages
English (en)
Inventor
김용회
강기훈
Original Assignee
(주)씨에스피아이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)씨에스피아이 filed Critical (주)씨에스피아이
Priority to KR1020180098622A priority Critical patent/KR101971172B1/ko
Application granted granted Critical
Publication of KR101971172B1 publication Critical patent/KR101971172B1/ko

Links

Images

Classifications

    • G06F17/2264
    • G06F17/211
    • G06F17/2247

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 전자문서 파일을 웹브라우저 상에서 열람가능하도록 변환하는 전자문서 파일 변환시스템 및 그 방법에 관한 것으로, 특히, 메타데이타 및/또는 멀티미디어 개체를 포함하는 전자문서 파일을 웹브라우저 상에서 열람가능한 형태의 파일로 변환하는 전자문서 파일 변환 및 열람시스템 및 그 방법에 관한 것이다.

Description

전자문서 파일 변환시스템 및 그 방법{ Electronic Documnent File Converting System and the Method thereof}
본 발명은 전자문서 파일을 웹브라우저 상에서 열람가능하도록 변환하는 전자문서 파일 변환시스템 및 그 방법에 관한 것으로, 특히, 메타데이타 및/또는 멀티미디어 개체를 포함하는 전자문서 파일을 웹브라우저 상에서 열람가능한 형태의 파일로 변환하는 전자문서 파일 변환시스템 및 그 방법에 관한 것이다.
인터넷과 각종 모바일 디바이스 기술이 발전함에 따라, 인터넷을 통해 전자문서를 교환/열람하는 기술들이 발전하고 있다. 전자문서 파일을 웹브라우저 상에서 열람하기 위해서는, 열람가능한 형태로 전자문서 파일을 변환하는 과정을 거쳐야 한다. 전자문서는 동영상, 이미지 등과 같은 멀티미디어 개체, 하이퍼링크나 페이지링크와 같은 메타데이타, 텍스트를 포함하고 있고, 지금까지의 전자문서 변환기술은, 텍스트만 열람가능한 형태로 변환될 뿐 메타데이타/멀티미디어개체에 대한 정보를 처리하지 못해서, 원본 전자문서에 첨부된 메타데이타/멀티미디어개체에 대한 정보를 변환된 전자문서에서는 열람이 불가능한 한계가 있다. 예를 들면, 원본 전자문서가 오디어 클립을 포함하는 경우에는 변환과정에서 오디어클립이 처리되지 못하기 때문에, 변환된 전자문서를 웹에서 열람할 때는 오디오 클립이 표시되지 아니하며, 비디오 클립이 포함된 경우에는, 변환된 전자문서를 웹에서 열람할 때 비디오 클립을 재생할 수 없는 형태의 정지된 사진처럼 표시되거나 표시되지 않는 기술적 한계가 있었다. 또한, 원본 전자문서가 페이지 링크나 하이퍼링크를 가지는 경우에도, 변환후에는 클릭이나 터치 등 제어가 불가능하고 나아가 시각화처리가 되어 있지 않아서 해당 링크가 전자문서에 존재하는지 여부를 사용자가 알 수 없어서 원본 전자문서 그대로 열람할 수 없는 문제가 있다.
대한민국 공개특허 제2002-0061887호 "문서변환 방법 및 그 프로그램의 기록매체"는 문서변환의 일반적인 기술을 개시하고 있지만, 앞서 본 문제점을 그대로 안고 있다.
본 발명의 목적은, 전자문서 파일을 웹에서 열람가능한 형태로 변환하는 전자문서 변환시스템과 그 방법을 제공하는 것이다.
본 발명의 다른 목적은, 멀티미디어 개체가 포함된 원본 전자문서를 변환함에 있어서 변환된 전자문서를 열람하는 단말단에서 멀티미디어개체를 포함한 전자문서를 열람가능하도록 하는 전자문서 변환시스템과 그 방법을 제공하는 것이다.
본 발명의 또 다른 목적은, 메타데이타가 포함된 원본 전자문서를 변환함에 있어서 변환된 전자문서를 열람하는 단말단에서 메타데이타가 포함된 전자문서를 열람가능하도록 하는 전자문서 변환시스템과 그 방법을 제공하는 것이다.
본 발명의 또 다른 목적은, 멀티미디어와 메타데이타를 포함하는 원본 전자문서인 경우에도, 웹브라우저에서 볼 수 있는 포맷을 변환되는 과정을 거칠때, 멀티미디어나 메타데이타를 원본 문서와 동일하게 확인 및 재생할 수 있어서, 전용뷰어를 구비하지 않아도, 인터넷이 되는 환경이라면 언제 어디서나 문서를 열람할 수 있도록 하는 전자문서 변환시스템과 그 방법을 제공하는 것이다.
본 발명은 앞서 본 목적을 달성하기 위하여, 다음과 같은 구성을 가진 실시예에 의하여 구현된다.
본 발명의 일실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 원본 문서파일의 요소를 분리 추출하여 웹브라우저에서 표현가능한 리소스로 변환하는 문서변환부를 포함하며,상기 문서변환부는 원본 문서파일에서 멀티미디어를 추출하여 저장부에 저장한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 문서변환부는 원본 문서파일에서 멀티미디어 개체를 추출하는 멀티미디어 추출부를 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 멀티미디어 추출부는 멀티미디어 개체를 추출하는 멀티미디어개체 추출모듈과, 상기 멀티미디어 개체에 대한 정보를 추출하는 멀티미디어정보추출모듈을 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 문서변환부는 원본 문서파일에서 메타데이타를 추출하여 저장부에 저장하는 메타데이타 추출부를 추가로 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 메타데이타 추출부는 원본 문서파일에서 페이지링크를 추출하는 페이지링크 추출모듈과 하이퍼링크를 추출하는 하이퍼링크 추출모듈 중 어느 하나 이상을 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 문서변환부는 원본 문서파일에서 텍스트를 추출하여 저장부에 저장하는 텍스트추출부를 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 문서변환부는 추출된 멀티미디어 개체에 대한 정보인 멀티미디어 개체정보. 메타데이타, 멀티미디어 개체의 경로정보 등를 저장하는 정보저장파일을 생성하는 정보저장파일생성부를 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 문서변환부는, 원본 문서파일에서 추출된 멀티미디개체, 멀티미디어 개체정보, 메타데이타, 텍스트를 웹브라우저에서 표현가능한 포맷의 리소스로 변환하는 변환부를 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 문서파일변환부는 변환대상파일이 문서파일인지 여부를 확인하는 문서파일확인부를 추가로 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 멀티미디어 추출부는 원본 문서파일을 파싱(Parsing)하여 멀티미디어 관련 노드를 검색하고, 원본 문서파일 내에 삽입된 멀티미디어 개체인 경우에는 해당 멀티미디어 개체를 추출하여 저장부에 저장하고, 멀티미디어 개체에 대한 정보인 멀티미디어 개체 정보를 추출하여 저장부에 저장한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은, 상기 멀티미디어 개체에 대한 정보는, 멀티미디어개체에 대한 파일명, 멀티미디어 개체 위치, 멀티미디어 개체 크기를 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환시스템은,상기 리소스를 조합하여 웹에서 열람가능하도록 문서파일로 생성하는 문서생성부를 추가로 포함하며, 상기 문서생성부는 상기 멀티미디어 개체, 멀티미디어 개체 정보, 멀티미디어개체 경로정보, 메타데이타, 텍스트 중 어느 하나 이상을 정보저장파일을 참조하여 저장부에서 추출하여 웹에서 열람가능한 문서파일로 생성한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환방법은, 원본 문서파일에서 멀티미디어 개체를 추출하여 웹에서 열람가능한 포맷으로 변환하는 문서변환단계를 포함하며, 상기 문서변환단계는 원본 문서파일에서 멀티미디어를 추출하여 저장부에 저장하는 멀티미디어 추출단계를 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환방법은, 상기 멀티미디어 추출단계는, 문서파일에 포함된 멀티미디어 개체를 추출하여 저장부에 저장하는 멀티미디어개체 추출단계와, 상기 멀티미디어 개체 정보를 추출하는 멀티미디어정보추출단계를 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환방법은, 상기 문서변환단계는 원본 문서파일에서 메타데이타를 추출하여 저장부에 저장하는 메타데이타 추출단계를 추가로 포함하며, 상기 메타데이타 추출단계는 원본 문서파일에서 페이지링크를 추출하는 페이지링크 추출단계와, 하이퍼링크를 추출하는 하이퍼링크 추출단계 중 어느 하나 이상을 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환방법은, 상기 문서변환단계는 멀티미디어 개체정보, 메타데이타, 멀티미디어 개체의 경로정보를 저장하는 정보저장파일을 생성하는 정보저장파일 생성단계를 추가로 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환방법은, 상기 문서변환단계는, 추출된 멀티미디어 개체, 멀티미디어 개체정보, 메타데이타를 웹브라우저에서 표현가능한 포맷의 리소스로 변환하는 변환단계를 추가로 포함한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환방법은, 상기 멀티미디어 추출단계는 파싱된 원본 문서파일에서 멀티미디어 관련 노드를 검색하고 멀티미디어 개체가 문서파일에 포함된 것인지 아니면 링크로 연결된 것인지를 판단하여 문서파일에 포함된 경우에 한해 멀티미디어 개체와 그 멀티미디어 개체정보를 추출한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환방법은, 상기 멀티미디어 추출단계는 파싱된 원본 문서파일에서 멀티미디어 개체의 파일명, 위치, 크기에 관한 정보를 추출하여 멀티미디어 개체정보를 구성한다.
본 발명의 다른 실시예에 따르면, 본 발명의 전자문서파일 변환방법은, 상기 리소스를 조합하여 웹에서 열람가능하도록 문서파일로 생성하는 문서생성단계를 추가로 포함하며, 상기 문서생성단계는, 멀티미디어 개체와 그 개체정보, 멀티미디어 개체의 경로정보, 메타데이타 중 어느 하나 이상을 정보저장파일을 참조하여 웹에서 열람가능한 문서파일로 생성한다.
본 발명은 위와 같은 구성에 의해 다음과 같은 효과를 얻을 수 있다.
본 발명은, 전자문서 파일을 웹에서 열람가능한 형태로 원본 문서의 손상없이 변환할 수 있는 효과를 가진다.
본 발명은, 멀티미디어 개체가 포함된 원본 전자문서를 변환함에 있어서 변환된 전자문서를 열람하는 단말단에서 멀티미디어 개체를 포함한 전자문서를 열람가능하도록 하는 효과를 도모할 수 있다.
본 발명은, 메타데이타가 포함된 원본 전자문서를 변환함에 있어서 변환된 전자문서를 열람하는 단말단에서 메타데이타가 포함된 전자문서를 열람가능하도록 하는 효과를 얻을 수 있다.
본 발명은, 멀티미디어와 메타데이타를 포함하는 원본 전자문서인 경우에도, 웹브라우저에서 볼 수 있는 포맷을 변환되는 과정을 거칠 때, 멀티미디어나 메타데이타를 원본 문서와 동일하게 확인 및 재생할 수 있어서, 전용뷰어를 구비하지 않아도, 인터넷이 되는 환경이라면 언제 어디서나 문서를 열람할 수 있도록 하는 효과를 가진다.
도 1은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템의 전체 개략도.
도 2는 본 발명의 일실시예에 따른 전자문서파일 변환 시스템의 서버를 도시하는 블럭도.
도 3은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템의 문서등록부를 도시하는 블록도.
도 4는 본 발명의 일실시예에 따른 전자문서파일 변환 시스템의 문서파일변환부를 도시하는 블록도.
도 5는 본 발명의 일실시예에 따른 전자문서파일 변환 시스템의 문서파일 확인부를 도시하는 블록도.
도 6은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템의 멀티미디어 추출부의 블럭도.
도 7은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템의 메타데이타 추출부의 블럭도.
도 8은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템의 문서생성부의 블럭도.
도 9는 본 발명의 일실시예에 따른 전자문서파일 변환 시스템의 저장부의 블럭도.
도 10은 본 발명의 일실시예에 따른 전자문서파일 변환 방법의 블록도.
도 11은 본 발명의 일실시예에 따른 전자문서파일 변환 방법의 흐름도.
도 12는 본 발명의 일실시예에 따른 전자문서파일 변환 시스템과 그 방법에 적용된 원본 문서파일의 화면을 캡쳐한 도면.
도 13은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템에 원본 문서파일을 등록하는 과정을 보여주는 화면을 캡쳐한 도면.
도 14는 본 발명의 일실시예에 따른 전자문서파일 변환 시스템에 등록되고 파싱된 원본 문서파일에서 추출된 문서파일의 요소가 저장된 상태를 보여주는 화면을 캡쳐한 도면.
도 15는 본 발명의 일실시예에 따른 전자문서파일 변환 시스템에서 추출된 멀티미디어 개체가 소정의 경로에 저장된 상태를 보여주는 화면을 캡쳐한 도면.
도 16은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템에서 추출된 멀티미디어 개체정보가 저장된 정보저장파일의 일 부분을 보여주는 화면을 캡쳐한 도면.
도 17은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템에서 추출된 멀티미디어개체정보, 메타데이타가 저장된 정보저장파일의 일 부분을 보여주는 화면을 캡쳐한 도면.
도 18은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템에 의해 변환된 문서를 웹에서 열람할 때 원본 문서에 포함된 페이지링크를 그대로 보여주는 화면을 캡쳐한 도면.
도 19은 본 발명의 일실시예에 따른 전자문서파일 변환 시스템에 의해 변환된 문서를 웹에서 열람할 때 원본 문서에 하이퍼링크를 그대로 보여주는 화면을 캡쳐한 도면.
도 20과 21는 본 발명의 일실시예에 따른 전자문서파일 변환 시스템에 의해 변환된 문서를 웹에서 열람할 때 동영상이 재생되는 상태를 보여주는 화면을 캡쳐한 도면.
도 22는 도 19에서 하이퍼링크 부분을 클릭했을 때 하이퍼링크에 연결된 웹페이지를 보여주는 화면을 캡쳐한 도면.
이하에서는 본 발명에 따른 미아방지 시스템을 첨부된 도면을 참조하여 상세히 설명한다. 도면들 중 동일한 구성요소들은 가능한 한 어느 곳에서든지 동일한 부호들로 나타내고 있음에 유의해야 한다. 또한 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다. 특별한 정의가 없는 한 본 명세서의 모든 용어는 본 발명이 속하는 기술분야의 통상의 지식을 가진 기술자가 이해하는 당해 용어의 일반적 의미와 동일하고 만약 본 명세서에 사용된 용어의 의미와 충돌하는 경우에는 본 명세서에 사용된 정의에 따른다.
본 발명의 일 실시예에 따른 문서파일변환시스템을 도시하는 도 1에 따르면, 본 발명의 시스템은 문서파일을 전송하는 전송측 단말(2)과, 전송된 문서파일을 등록하고 이를 변환하는 서버(1)와, 상기 서버로부터 변환된 문서파일을 웹을 통해 열람하는 열람측 단말(3)을 포함한다.
상기 전송측 단말(2)은 열람측 단말(3)에서 열람하는 문서를 작성해서 전송하거나 단순히 전송만 하는 단말기이다. 컴퓨터, 스마트폰, 태블릿 등 인터넷에 접속되어 문서파일을 전송할 수 있는 통신가능한 전자기기라면 전송측 단말(2)이 될 수 있다. 그리고, 여기서, '전송'이라 함은, 변환되지 아니한 원본 문서를 서버(1)에 보내는 것을 의미하며, 열람측 단말(2)에 보내는 것은 배제한다. 그리고, '원본 문서'라 함은, 텍스트를 가진 모든 전자 문서를 의미하며, '원본 문서파일'이라 함은 '원본 문서'의 전자적 파일을 의미한다. 예를 들면, 'ppt', 'doc', 'xls' 확장자를 가진 MS-Office 프로그램에서 생성된 파일, 'pdf', 'hwp', 'txt' 확장자를 가진 파일 등으로 포함한다. 하지만, 여기에 국한되지 아니하고 다양한 문서파일 포맷을 포함하는 것으로 해석된다. 위와 같은 확장자를 가진 '원본 문서파일'는 해당 확장자를 지원하는 전용 프로그램이 있어야만 하기 때문에, 해당 프로그램을 구비하지 아니한 단말에서는 해당 원본 문서를 수신하더라도 열람할 수 없는 어려움이 있다. 이에, 본원발명은, 해당 문서파일 전용 프로그램이 설치되지 아니한 단말에서도 인터넷에 연결되어 있기만 하면 언제 어디서라도 문서 파일을 열람할 수 있도록 원본 문서파일을 웹브라우저에서 열람가능한 포맷으로 변환하여 제공하게 된다.
상기 서버(1)는 상기 전송측 단말(2)로부터 전송받은 원본문서 파일을 저장부에 등록하는 문서등록부(4), 상기 문서등록부(4)에 의해 등록된 원본 문서파일을 웹브라우저에서 열람할 수 있는 포맷으로 변환하는 문서변환부(5), 상기 문서변환부(5)로부터 변환된 문서파일의 리소스들을 조합하여 웹에서 전용뷰어없이도 열람할 수 있는 열람 문서파일로 생성하는 문서생성부(6)을 포함한다. 전송측 단말(2)은 원본 문서파일을 문서등록부(4)를 통해 등록하고, 등록된 원본 문서파일을 파싱하여 문서변환부에서 열람가능한 리소스로 변환하여 저장한다. 그리고, 서버는 변환된 문서파일의 경로정보(통상 원본 문서를 웹에서 열람할 수 있는 "url" 정보를 의미함)를 전송측 단말(2)이나 열람측 단말(3)에 제공한다. 이어서, 전송측 단말이나 열람측 단말이 해당 경로정보에 접속하며 열람을 시도하면, 상기 문서생성부(6)는 저장부(7)에서 변환된 리소스들을 추출하여 열람가능한 열람 문서파일로 생성하여 웹브라우저에서 볼 수 있도록 한다.
도 3에 도시된 바와 같이, 상기 문서등록부(4)는 전송측 단말(2)에서 전송한 원본 문서파일 마다 코드를 생성하고 부여하는 코드생성부(41)와 상기 저장부에 상기 코드마다 저장공간을 생성하는 디렉토리생성부(43)를 포함한다.
상기 코드생성부(41)는 원본 문서파일과 이에 연관된 모든 정보나 자료들을 관리하기 위하여 원본 문서파일이 전송되면 원본 문서파일마다 고유의 코드를 부여하게 된다. 따라서, 코드를 이용하여 수많은 원본 문서파일들을 식별하게 된다.
상기 디렉토리생성부(43)는 고유의 코드에 대응되는 원본 문서파일이나 이와 관련된 모든 파일들을 저장할 수 있는 저장공간을 저장부에 생성하게 된다. 원본 문서파일과 추출되어 변환된 리소스 그리고 열람 문서파일이 모두 동일한 저장공간 또는 각각이 서로 상이한 저장공간에 저장될 수 있도록 디렉토리가 생성될 수 있다. 중요한 것은, 저장공간의 경로정보는 항상 기록/유지관리된다는 점이다. 도 13의 'pptx'확장자를 가진 원본 문서파일이 등록되면, 도 14에 도시된 바와 같이, 해당 원본 문서파일에 해당하는 코드가 생성되고 그 코드에 대응되는 디렉토리(71)가 저장부(7)에 저장공간으로서 생성된다. 도 14를 참조하면, 원본 문서파일이 저장되는 저장공간(711), 그리고 멀티미디어 파일이 저장되는 저장공간(712)이 생성되었음을 확인할 수 있다. 뿐만 아니라, 텍스트가 저장되는 저장공간(714), 정보저장파일이 저장되는 저장공간(713)이 각각 생성될 수 있다.
상기 문서파일변환부(5)는 등록된 원본 문서파일을 웹브라우저에서 열람가능하도록 변환하는 역할을 한다. 자세하게는, 문서파일확인부(51), 멀티미디어추출부(52), 메타데이타추출부(53), 텍스트추출부(54), 정보저장파일생성부(55), 변환부(56)을 포함한다.
상기 문서파일확인부(51)는 등록요청된 원본 문서파일이 문서파일인지 여부를 확인하는 문서파일판단모듈(511)과, 문서파일인 경우 그 종류를 선별하는 문서파일선별모듈(512)을 포함한다.
상기 문서파일판단모듈(511)은 전송측 단말(2)로부터 변환요청된 파일이 문서 파일인지 여부를 확인하여 문서파일이면 다음 단계를 진행하고 그렇지 않으면 종료하게 된다. 문서파일인지 여부의 확인은, 파일의 확장자로 판단을 하게 된다. 본원발명의 시스템상에 미리 등록된 문서파일에 해당하는 확장자 그룹과 변환요청된 파일의 확장자를 대비하여, 변환요청된 파일의 확장자가 확장자 그룹에 존재하면 문서파일로 판단하고 그 다음 단계를 진행하고 그렇지 않으면 종료하게 된다. 예를 들면, 'pptx', 'doc', 'xls' 확장자를 가진 MS-Office 프로그램에서 생성된 파일, 'pdf', 'hwp', 'txt' 확장자를 가진 파일 등이 있을 수 있으며, 파일이 위 열거된 확장자를 가질 경우에는 문서파일로 판단하게 된다. 나아가, 본 발명의 다른 실시예에 따르면, 신규 포맷의 확장자를 가진 문서파일에 대한 확장성을 확보하기 위하여, 신규 포맷의 확장자를 후속적으로 시스템상에 추가할 수도 있도록 할 수도 있다.
상기 문서파일선별모듈(512)은, 변환요청된 문서파일이 MS-OFFICE 프로그램에 의해 작성된 문서인지, 'pdf' 파일인지, 'hwp'파일인지, 'txt' 파일인지를 선별한다. 이는, 후술하는 바와 같이, 해당 문서파일을 파싱하는데 필요한 최적의 API를 선정하기 위하여 필요하다. 예를 들면, MS-OFFICE프로그램으로 작성된 문서라면 'Open XML API'를 사용하고 그렇지 않다면 각각의 확장자마다 제공되는 'third party API'를 선정하게 된다.
상기 멀티미디어추출부(52)는 선별된 원본 문서파일에서 멀티미디어개체(81)를 추출하는 멀티미디어개체추출모듈(521)과 멀티미디어개체에 대한 정보(82,83,84)를 추출하는 멀티미디어정보추출모듈(522)를 포함한다.
상기 멀티미디어개체추출모듈(521)은, 앞서 본 소정의 API 기반으로 파싱한 후 문서파일에 첨부된 멀티미디어개체(81)를 추출한다.구체적으로, 문서파일의 스트림을 열어 각 페이지의 계층도에서 멀티미디어 관련 노드를 탐색한다. 그리고, 관련 노드 아래에서 실제 멀티미디어개체를 탐색하게 된다. 실제 멀티미디어개체가 링크의 형태로 외부서버에 존재하는 경우에는 멀티미디어 파일을 추출하는 프로세스를 종료하고 다음 노드를 탐색한다. 그렇지 않은 경우에는, 노드 탐색결과, 멀티미디어 파일이 존재하는 경우에는 멀티미디어개체를 추출한다. 추출된 멀티미디어개체(81)는, 도 15에 도시된 바와 같이, 위 저장공간(712)에 저장된다.
상기 멀티미디어정보추출모듈(522)은, 멀티미디어개체가 파일내에 삽입된 경우에는, 관련 노드를 탐색하여, 해당 멀티미디어개체의 파일의 이름(82), 문서내에 삽입된 위치(83)와 크기(84)에 관한 정보를 추출하고 멀티미디어개체를 저장할 경로를 설정한다. 본원에서는 멀티미디어 파일의 이름, 삽입된 위치, 크기를 멀티미디어개체 정보라 총칭한다. 여기서, 저장할 경로는, 앞서 본 멀티미디어 파일이 저장되는 저장공간의 주소를 의미한다. 그리고, 추출된 멀티미디어개체 정보는, 지정된 포맷의 파일, 예컨대 xml 파일로 저장된다. 도 16을 참조하면, 멀티미디어개체의 파일이름(82)은 "media1.mp4", "media2.mp4"로, 파일위치(83)는 x, y 값으로, 파일크기(83)는 width, height로 표기되어 xml 파일로 저장된다.
상기 메타데이타추출부(53)는 문서파일에 포함된 메타데이타를 추출한다. 여기서, 메타데이타는 크게 페이지링크와 하이퍼링크를 포함한다. 상기 메타데이타추출부(53)는 페이지링크추출부(531)과, 하이퍼링크추출부(532)를 포함한다.
상기 페이지링크추출부(531)는 해당 문서파일내에 존재하는 페이지링크를 추출하는데, 문서파일의 파일 스트림을 열거나 바이너리 파일을 파싱한 후 xml을 검색하여 페이지링크의 존재 여부를 탐색하여 페이지링크에 관한 정보를 추출하게 된다. 여기서, 페이지링크에 관한 정보(91)는, 클릭했을 때 이동될 해당 링크에 연결된 페이지(913), 클릭가능한 영역의 크기(911), 문서내에서의 위치(912)를 포함한다(도 17 참조). 예를들면, 문서내에 목차가 페이지링크 형태로 작성된 경우에는 목차를 클릭했을 때 이동해갈 페이지, 해당 목차에서 클릭가능한 범위, 해당 목차의 문서내에서의 위치 정보를 의미할 수 있다. 그리고, 이렇게 추출된 페이지링크에 관한 정보들은, 지정된 포맷의 파일, 예컨대 xml 파일로 저장된다(도 14 참조).
상기 하이퍼링크추출부(532)는 문서내에 포함된 하이퍼링크를 추출하는데, 문서파일의 파일 스트림을 열거나 바이너리 파일을 파싱한 후 xml을 검색하여 하이퍼링크의 존재 여부를 탐색하여 하이퍼링크에 관한 정보를 추출하게 된다. 여기서, 하이퍼링크에 관한 정보는, 클릭했을 때 이동하게 될 url(933), 클릭가능한 영역의 크기(931), 문서내에서 위치(932)를 포함한다(도 17 참조). 그리고, 이렇게 추출된 하이퍼링크에 관한 정보들(93)은, 지정된 포맷의 파일, 예컨대 xml 파일로 저장되고, 저장공간(713)에 저장될 수 있다(도 14 참조).
도 17을 참조하면, 상기 하이퍼링크, 페이지링크에 관한 정보가 저장된 xml 파일의 일예를 확인할 수 있다. 도 17에는, 메타데이타, 페이지링크, 멀티미디어개체에 관한 정보들이 동일 xml 파일에 저장되어 있지만, 각각 상이한 파일에 저장될 수도 있음이 배제되지 아니한다.
도 4에 도시된 바에 의하면, 상기 텍스트추출부(54)는 문서파일 내에 존재하는 텍스트를 추출하여 저장한다. 텍스트는 별도의 저장공간(714)에 저장될 수 있다.
상기 정보저장파일생성부(55)는 문서파일에서 추출된 멀티미디어개체가 저장된 경로정보, 멀티미디어 파일명, 위치, 크기 등의 멀티미디어개체정보, 페이지링크와/또는 하이퍼링크에 관한 정보인 메타데이타를 저장하는 정보저장파일을 생성한다. 이들 각각의 정보는 하나의 정보저장파일에 저장될 수도 있고 각각의 파일로 저장될 수도 있다. 예를 들면, xml 파일 포맷으로 저장될 수 있다. 도 16과 17에는 xml 파일의 일예가 도시되어 있다.
상기 변환부(56)는 파일의 텍스트, 메타데이타 등을 웹브라우저에 표현가능한 리소스로 변환한다. 바람직하게는 html 포맷으로 변환되며, 변환된 파일들은 저장부(7)의 저장공간에 저장된다. 여기서, "웹브라우저에서 표현가능한"은 단말단에서 웹을 통해 접속하면, 단말단에서 별도의 전용뷰어없이도 웹에서 표현될 수 있다는 것을 의미한다.
위와 같이 상기 변환부에 의해 변환프로세스가 완료된 후, 문서파일의 url은 이메일, 문자메세지 등 전자적 방법으로 단말측(통상 열람측 단말(3))에 전송되고, 열람측단말(3)은 해당 url을 클릭하여 문서열람요청신호를 생성하고 서버(1)로 전송한다.
도 8에 도시된 바와 같이, 상기 서버의 문서생성부(6)는 문서열람요청신호를 수신하고 문서를 생성하여 열람에 제공하게 된다. 구체적으로는, 상기 문서생성부(6)는 열람요청확인부(61), 멀티미디어확인추출부(62), 메타데이타확인추출부(63), 텍스트확인추출부(64), 문서완성부(65)를 포함한다.
상기 열람요청확인부(61)는 열람측 단말(3)로부터 수신한 문서열람요청신호를 확인하여 전송된 url상의 전자문서가 맞는지 여부를 확인한다. 정당한 요청신호가 아니면 프로세스를 종료한다.
상기 멀티미디어확인추출부(62)는 열람하고자 하는 문서파일에 멀티미디어가 포함되어 있는지 여부를 확인하고 이를 추출한다. 상기 멀티미디어확인추출부(62)는 도 17에 도시된 상기 정보저장파일(예컨대, xml 파일)을 확인하여 멀티미디어개체(81)와 그 정보(83,84,85)가 존재하는지 여부를 확인함으로 문서파일에 멀티미디어가 포함되어 있는지 여부를 확인하며, 확인되면 멀티미디어개체의 경로정보(85)를 기초로 해당 멀티미디어개체를 추출한다.
상기 메타데이타확인추출부(63)는 열람하고자 하는 문서파일에 메타데이타가 포함되어 있는지 여부를 확인하고 이를 추출한다. 상기 메타데이타확인추출부(63)는 도 17에 도시된 상기 정보저장파일을 확인하여 페이지링크(91) 및/또는 하이퍼링크(93)와 같은 메타데이타가 존재하는지 여부를 확인하고 존재한다면 해당 정보를 추출한다. 도 17에 도시된 바에 의하면, 페이지링크의 클릭가능한 영역(911), 위치(912), 이동한 페이지정보(913)가 저장된 정보저장파일로부터 해당 정보를 추출하게 되고, 하이퍼링크의 클릭가능한 영역(931), 위치(932), 이동할 url(933)을 정보저장파일로부터 추출하게 된다.
상기 텍스트확인추출부(64)는 열람하고자 하는 문서파일에 텍스트가 존재하는지 여부를 확인하고 이를 추출한다.
상기 문서완성부(65)는, 멀티미디어개체 정보를 기반으로 멀티미디어의 위치, 크기, 그리고 메타데이타 등을 참조하여, 상기 변환부(56)에 의해 변환되어 저장된 리소스를 인출하여, 웹에서 열람가능한 전자문서파일로 생성하여 열람측단말에 제공하게 된다. 변환부에 의해 변환되어 저장된 리소스를 기반으로 정보저장파일에 저장된 멀티디어개체의 크기, 문서상에의 위치에 멀티미디어 개체를 삽입하여 원본 전자문서파일과 동일한 문서를 생성하여, 열람측 단말(3)에 제공하게 된다. 메타데이타가 있는 경우에는, 마찬가지로 정보저장파일에서, 페이지링크의 페이지수(913), 클릭가능한 영역(911), 문서내에서의 위치정보(912)를 참조하거나, 하이퍼링크의 이동할 url(933), 클릭가능한 영역(931), 문서내에서의 위치정보(932)를 참조하여 변환부에 의해 변환되어 저장된 리소스를 기반으로, 해당 페이지링크와 하이퍼링크를 부가하여 원본 전자문서파일과 동일한 문서를 생성하여(도 18 내지 22 참조), 열람측 단말(3)에 제공하게 된다. 웹브라우저에서 표현가능한 포맷의 리소스로 이미 변환된 파일과, 추출되어 저장된 메타데이타 및/또는 멀티미디어를 조합하여 문서를 생성하여 열람에 제공하므로, 인터넷 통신이 가능하다면 언제 어디서든 별도의 전용 뷰어 없이도 원하는 전자문서를 열람할 수 있게 된다.
도 9에 도시된 바와 같이, 상기 저장부(7)는 크게 원본 문서파일을 저장하는 원본문서저장부(711), 멀티미디어개체를 저장하는 멀티미디어개체저장부(712), xml 파일과 같은 정보저장파일을 저장하는 정보저장파일저장부(713), 텍스트를 저장하는 텍스트저장부(714), 텍스트, 메타데이타 등이 웹브라우저에서 표현가능한 포맷의 리소스로 변환된 변환데이타가 저장되는 변환데이타저장부(715)를 포함한다. 문서열람요청이 오면, 멀티미디어개체저장부(712)에 저장된 멀티미디어개체를, 정보저장파일저장부에 저장된 정보저장파일에 기록된 위치, 크기 등을 참조하여 변환데이타저장부(715)에 저장된 변환데이타에 삽입하여 열람측 단말의 열람에 제공하게 된다. 페이지링크와 하이퍼링크의 메타데이타도 동일한 방식을 따른다.
출원인은, 이하에서 본 발명의 또 다른 실시예인 전자문서파일변환 및 열람방법을 도 10 내지 22를 참조하여 살펴본다.
도 10을 참조하면, 상기 문서파일 변환 및 열람방법은, 크게 문서등록단계(S1) 문서변환단계(S3), 문서생성단계(S5)를 포함한다.
도 13에 도시된 바와 같이, 전송측 단말(2)이 원본 문서파일을 등록하게 되면, 상기 문서등록단계(S1)는 전송측 단말(2)에서 전송한 원본 문서파일 마다 코드를 생성하고 부여하는 코드생성단계(S11)와 상기 저장부에 상기 코드마다 저장공간을 생성하는 디렉토리생성단계(S13)를 포함한다.
상기 코드생성단계(S11)는 원본 문서파일과 이에 연관된 모든 정보나 자료들을 관리하기 위하여 원본 문서파일이 전송되면 원본 문서파일마다 고유의 코드를 생성한다. 따라서, 코드를 이용하여 수많은 원본 문서파일들을 식별하게 된다.
상기 디렉토리생성단계(S13)는 고유의 코드에 대응되는 원본 문서파일이나 이와 관련된 모든 파일들을 저장할 수 있는 저장공간을 저장부에 생성한다. 원본 문서파일과 추출되어 변환된 리소스 그리고 열람 문서파일이 모두 동일한 저장공간 또는 각각이 서로 상이한 저장공간에 저장될 수 있도록 디렉토리가 생성될 수 있다. 중요한 것은, 저장공간의 경로정보는 항상 기록/유지관리된다는 점이다. 도 13의 'ppt'확장자를 가진 원본 문서파일이 등록되면, 도 14에 도시된 바와 같이, 해당 원본 문서파일에 해당하는 코드가 생성되고 그 코드에 대응되는 디렉토리(71)가 저장부(7)에 저장공간으로서 생성된다. 도 14를 참조하면, 원본 문서파일이 저장되는 저장공간(711, 원본문서저장부), 그리고 멀티미디어 파일이 저장되는 저장공간(712, 멀티미디어개체저장부)이 생성되었음을 확인할 수 있다. 뿐만 아니라, 텍스트가 저장되는 저장공간(714, 텍스트저장부), 정보저장파일이 저장되는 저장공간(713, 정보저장파일저장부)이 각각 생성될 수 있다.
상기 문서파일변환단계(S3)는 등록된 원본 문서파일을 웹브라우저에서 열람가능하도록 변환한다. 자세하게는, 문서파일확인단계(S31), 멀티미디어추출단계(S33), 메타데이타추출단계(S35), 텍스트추출단계(S36), 정보저장파일생성단계(S37), 변환단계(S38)을 포함한다.
상기 문서파일확인단계(S31)는 등록요청된 원본 문서파일이 문서파일인지 여부를 확인하는 문서파일판단단계(S311)과, 문서파일인 경우 그 종류를 선별하는 문서파일선별단계(S312)를 포함한다.
도 10과 11을 참조하면, 상기 문서파일판단단계(S311)은 전송측 단말(2)로부터 변환요청된 파일이 문서 파일인지 여부를 확인하여 문서파일이면 다음 단계를 진행하고 그렇지 않으면 종료하게 된다. 문서파일인지 여부의 확인은, 파일의 확장자로 판단을 하게 된다. 본원발명의 시스템상에 미리 등록된 문서파일에 해당하는 확장자 그룹과 변환요청된 파일의 확장자를 대비하여, 변환요청된 파일의 확장자가 확장자 그룹에 존재하면 문서파일로 판단하고 그 다음 단계를 진행하고 그렇지 않으면 종료하게 된다. 예를 들면, 'pptx', 'doc', 'xls' 확장자를 가진 MS-Office 프로그램에서 생성된 파일, 'pdf', 'hwp', 'txt' 확장자를 가진 파일 등이 있을 수 있으며, 파일이 위 열거된 확장자를 가질 경우에는 문서파일로 판단하게 된다. 도 12에 도시된 바와 같이, 'pptx'문서파일은 2개의 페이지링크(91), 1개의 하이퍼링크(93), 2개의 동영상(81)을 포함하고 있다. 이와 같은 문서파일을 등록하면, 문서파일의 확장자인 'pptx'를 확인한 후, 문서파일로 판단하고 그 다음 프로세스를 진행한다. 나아가, 본 발명의 다른 실시예에 따르면, 신규 포맷의 확장자를 가진 문서파일에 대한 확장성을 확보하기 위하여, 신규 포맷의 확장자를 후속적으로 시스템상에 추가할 수도 있도록 할 수도 있다.
상기 문서파일선별단계(S312)는, 변환요청된 문서파일이 MS-OFFICE 프로그램에 의해 작성된 문서인지, 'pdf' 파일인지, 'hwp'파일인지, 'txt' 파일인지를 선별한다. 이는, 후술하는 바와 같이, 해당 문서파일을 파싱하는데 필요한 최적의 API를 선정하기 위하여 필요하다. 예를 들면, MS-OFFICE프로그램으로 작성된 문서라면 'Open XML API'를 사용하고 그렇지 않다면 각각의 확장자마다 제공되는 'third party API'를 선정하게 된다. 앞서 본 도 12의 전자문서파일의 경우, 확장자가 'ppt'이므로, 문서파일을 'MS-OFFICE 프로그램'에 의해 작성된 문서로 판단하고, 파싱의 기반 API로 'Open XML API'를 사용하게 된다.
상기 멀티미디어추출단계(S33)는 선별된 원본 문서파일에서 멀티미디어개체(81)를 추출하는 멀티미디어개체추출단계(S331)와 멀티미디어개체에 대한 정보(82,83,84)를 추출하는 멀티미디어정보추출단계(S332)를 포함한다.
상기 멀티미디어개체추출단계(S331)는, 앞서 본 소정의 API 기반으로 파싱한 후 문서파일에 첨부된 멀티미디어개체(81)를 추출한다.구체적으로, 문서파일의 스트림을 열어 각 페이지의 계층도에서 멀티미디어 관련 노드를 탐색한다. 그리고, 관련 노드 아래에서 실제 멀티미디어개체를 탐색하게 된다. 실제 멀티미디어개체가 링크의 형태로 외부서버에 존재하는 경우에는 멀티미디어 파일을 추출하는 프로세스를 종료하고 다음 노드를 탐색한다. 그렇지 않은 경우에는, 노드 탐색결과, 멀티미디어 파일이 존재하는 경우에는 멀티미디어개체를 추출한다. 추출된 멀티미디어개체(81)는, 도 15에 도시된 바와 같이, 위 저장공간(712)에 저장된다.
상기 멀티미디어정보추출단계(S332)는, 멀티미디어개체가 파일내에 삽입된 경우에는, 관련 노드를 탐색하여, 해당 멀티미디어개체의 파일의 이름(82), 문서내에 삽입된 위치(83)와 크기(84)에 관한 정보를 추출하고 멀티미디어개체를 저장할 경로를 설정한다. 그리고, 추출된 멀티미디어개체 정보는, 지정된 포맷의 파일, 예컨대 xml 파일로 저장된다. 도 16을 참조하면, 멀티미디어개체의 파일이름은 "media1.mp4", "media2.mp4"로, 파일위치는 x, y 값으로, 파일크기는 width, height로 표기되어 xml 파일로 저장된다. 도 17에 도시된 바에 의하면, 멀티미디어 개체(81), 멀티미디어개체의 파일명(82), 위치(83), 크기(84),그 경로정보(85)는 정보저장파일에 저장된다.
상기 메타데이타추출단계(S35)는 문서파일에 포함된 메타데이타를 추출한다. 상기 메타데이타추출단계(S35)는 페이지링크추출단계(S351)와 하이퍼링크추출단계(S352)를 포함한다.
상기 페이지링크추출단계(S351)는 해당 문서파일내에 존재하는 페이지링크를 추출하는데, 문서파일의 파일 스트림을 열거나 바이너리 파일을 파싱한 후 xml을 검색하여 페이지링크의 존재 여부를 탐색하여 페이지링크에 관한 정보를 추출하게 된다. 여기서, 페이지링크에 관한 정보는, 클릭했을 때 이동될 해당 링크에 연결된 페이지(913), 클릭가능한 영역의 크기(911), 문서내에서의 위치정보(912)를 포함한다. 예를들면, 문서내에 목차가 페이지링크 형태로 작성된 경우에는 목차를 클릭했을 때 이동해갈 페이지, 해당 목차에서 클릭가능한 범위, 해당 목차의 문서내에서의 위치 정보를 의미할 수 있다. 그리고, 이렇게 추출된 페이지링크에 관한 정보들은, 지정된 포맷의 파일, 예컨대 xml 파일로 저장된다. 도 13의 원본 문서파일에 포함된 2개의 페이지링크 "Brief background information", "Mission statement"에 대한 페이지링크에 관한 정보는(91) 도 17에 도시된 바와 같이, 클릭할 영역(911), 문서내의 위치(912), 이동할 페이지(913)로 추출되어 xml파일과 같은 정보저장파일에 기록될 수 있다.
상기 하이퍼링크추출단계(S37)는 문서내에 포함된 하이퍼링크를 추출하는데, 문서파일의 파일 스트림을 열거나 바이너리 파일을 파싱한 후 xml을 검색하여 하이퍼링크의 존재 여부를 탐색하여 하이퍼링크에 관한 정보를 추출하게 된다. 여기서, 하이퍼링크에 관한 정보는, 클릭했을 때 이동하게 될 url, 클릭가능한 영역의 크기, 문서내에서 위치정보를 포함한다. 그리고, 이렇게 추출된 하이퍼링크에 관한 정보들은, 지정된 포맷의 파일, 예컨대 xml 파일로 저장되고, 저장공간(713)에 저장될 수 있다(도 14 참조). 도 13의 원본 문서파일에 포함된 1개의 하이퍼링크 "Problem Statement"에 대한 하이퍼링크에 관한 정보(93)는 도 17에 도시된 바와 같이 클릭할 영역(931), 문서내의 위치(932), 이동할 url(933)로 추출되어 xml 파일과 같은 정보저장파일에 기록될 수 있다.
위 멀티미디어 관련 정보, 하이퍼링크 정보, 페이지 링크 정보는 추출되어 하나의 정보저장 파일에 저장될 수도 있고, 각각의 정보저장파일에 분리되어 저장될 수도 있다.
상기 텍스트추출단계(S36)는 문서파일 내에 존재하는 텍스트를 추출하여 저장한다. 텍스트는 별도의 저장공간(714)에 저장될 수 있다.
상기 정보저장파일생성단계(S37)는 문서파일에서 추출된 멀티미디어개체가 저장된 경로정보(85), 멀티미디어 파일명(82), 위치(83), 크기(84) 등의 멀티미디어개체정보, 페이지링크와/또는 하이퍼링크에 관한 정보(91,93)인 메타데이타를 저장하는 정보저장파일을 생성한다. 이들 각각의 정보는 하나의 정보저장파일에 저장될 수도 있고 각각의 파일로 저장될 수도 있다. 예를 들면, xml 파일 포맷으로 저장될 수 있다. 도 16과 17에는 xml 파일의 일예가 도시되어 있다.
상기 변환단계(56)는 파일의 텍스트, 메타데이타 등을 웹브라우저에 표현가능한 리소스로 변환한다. 바람직하게는 html 포맷으로 변환되며, 변환된 파일들은 저장부(7)의 저장공간에 저장된다. 여기서, "웹브라우저에서 표현가능한"은 단말단에서 웹을 통해 접속하면, 단말단에서 별도의 전용뷰어없이도 웹에서 표현될 수 있다는 것을 의미한다.
위와 같이 상기 변환단계에 의해 변환프로세스가 완료된 후, 문서파일의 url은 이메일, 문자메세지 등 전자적 방법으로 단말측(통상 열람측 단말(3))에 전송되고, 열람측단말(3)은 해당 url을 클릭하여 문서열람요청신호를 생성하고 서버(1)로 전송한다.
상기 문서생성단계(S5)는 문서열람요청신호를 수신하고 문서를 생성하여 열람에 제공하게 된다. 구체적으로는, 상기 문서생성단계(S5)는 열람요청확인단계(S51), 멀티미디어확인추출단계(S52), 메타데이타확인추출단계(S53), 텍스트확인추출단계(S54), 문서완성단계(S55), 문서디스플레이단계(S56)를 포함한다.
상기 열람요청확인단계(S51)는 열람측 단말(3)로부터 수신한 문서열람요청신호를 확인하여 전송된 url상의 전자문서가 맞는지 여부를 확인한다. 정당한 요청신호가 아니면 프로세스를 종료한다.
상기 멀티미디어확인추출단계(S52)는 열람하고자 하는 문서파일에 멀티미디어가 포함되어 있는지 여부를 확인하고 이를 추출한다. 상기 멀티미디어확인추출단계(S52)는 상기 정보저장파일(예컨대, xml 파일)을 확인하여 멀티미디어개체와 그 정보가 존재하는지 여부를 확인하는 멀티미디어확인단계(S521)를 통해 문서파일에 멀티미디어가 포함되어 있는지 여부를 확인하며, 확인되면 멀티미디개체의 경로정보를 기초로 해당 멀티미디어 개체를 추출하는 멀티미디어추출단계(S522)를 진행한다. 만약,멀티미디어가 존재하지 아니한다면 멀티미디어개체 추출단계를 거치지 않고 메타데이타확인추출단계로 진행한다.
상기 메타데이타확인추출단계(S53)는 열람하고자 하는 문서파일에 메타데이타가 포함되어 있는지 여부를 확인하고 이를 추출한다. 상기 메타데이타확인추출단계(S53)는 상기 정보저장파일을 확인하여 페이지링크 및/또는 하이퍼링크와 같은 메타데이타가 존재하는지 여부를 확인하는 메타데이타확인단계(S531)를 통해 해당 문서파일에 페이지링크 및/또는 하이퍼링크가 존재한다면 해당 정보저장파일에서 해당 정보를 추출하는 메타데이타추출단계(S532)를 진행하게 된다. 메타데이타가 없다면 아래 텍스트확인추출단계를 거친 후 후술하는 문서완성단계(S55)로 진행한다.
상기 텍스트확인추출단계(S54)는 열람하고자 하는 문서파일에 텍스트가 존재하는지 여부를 확인하고 이를 추출한다.
상기 문서완성단계(S55)는, 멀티미디어개체 정보를 기반으로 멀티미디어의 위치, 크기, 그리고 메타데이타 등을 참조하여, 상기 변환단계(S38)를 통해 변환되어 저장된 리소스를 인출하여, 웹에서 열람가능한 전자문서파일로 생성하여 열람측단말에 제공하게 된다. 변환단계에 의해 변환되어 저장된 리소스를 기반으로 정보저장파일에 저장된 멀티디어개체의 크기, 문서상에의 위치에 멀티미디어 개체를 삽입하여 원본 전자문서파일과 동일한 문서를 생성하여, 열람측 단말(3)에 제공하게 된다. 메타데이타가 있는 경우에는, 마찬가지로 정보저장파일에서, 페이지링크의 페이지수, 클릭가능한 영역, 문서내에서의 위치정보를 참조하거나, 하이퍼링크의 이동할 url, 클릭가능한 영역, 문서내에서의 위치정보를 참조하여 변환부에 의해 변환되어 저장된 리소스를 기반으로, 해당 페이지링크와 하이퍼링크를 부가하여 원본 전자문서파일과 동일한 문서(열람 문서파일)를 생성한다.
이어서, 상기 문서디스플레이단계(S56)는 열람 문서파일을 열람측 단말(3)에 제공하게 하여 디스플레이되도록 한다(S56).
웹브라우저에서 표현가능한 포맷의 리소스로 이미 변환된 파일과, 추출되어 저장된 메타데이타 및/또는 멀티미디어를 조합하여 생성된 열람 문서파일를 생성하여 열람에 제공하므로, 인터넷이 되는 지역이면 언제 어디서든 별도의 전용 뷰어 없이도 원하는 전자문서를 열람할 수 있게 된다. 열람측 단말(3)이 전송된 url를 클릭하면 도 18 내지 21과 같은 원본 문서파일과 동일한 문서파일이 디스플레이상에 표현된다. 그리고, 열람측 단말(3)이 도 18의 페이지링크인 "Brief background information", "Mission statment"(91)을 클릭하면, 여기에 링크된 도 20과 21의 페이지로 이동하게 되고, 나아가 도 20과 21의 페이지 포함된 동영상을 클릭하면 해당 동영상의 경로정보에 저장된 동영상이 실시간으로 열람측 단말(3)측에 디스플레이된다. 또한, 열람측 단말(3)이 도 19의 페이지에 표현된 하이퍼링크"Problem Statement"를 클릭하면, 도 22와 같이 하이퍼링크된 url "http://ebook.cspi.co.kr"로 이동하게 된다. 따라서, 열람측 단말(3)은 인터넷에 연결된 상태로 별도의 전용뷰어를 설치하지 아니하고도 원본 문서파일에 있는 멀티미디어, 페이지링크, 하이퍼링크를 모두 열람할 수 있게 된다.

Claims (20)

  1. 원본 문서파일의 요소를 분리 추출하여 웹브라우저에서 표현가능한 리소스로 변환하는 문서변환부를 포함하며, 상기 문서변환부는 변환대상 문서파일을 확인하는 문서파일확인부, 원본 문서파일에서 멀티미디어를 추출하는 멀티미디어 추출부, 원본 문서파일에서 추출된 텍스트와 메타데이타를 웹브라우저에서 표현가능한 포맷의 리소스로 변환하는 변환부 및 추출한 멀티미디어를 저장하는 저장부를 포함하되,
    상기 문서파일확인부는 변환대상 문서파일의 종류에 따라 파싱하는데 필요한 최적의 API를 선정하는 문서파일선별모듈을 포함하며,
    상기 멀티미디어 추출부는 멀티미디어 개체를 추출하는 멀티미디어개체 추출모듈과, 상기 멀티미디어 개체에 대한 정보를 추출하는 멀티미디어정보추출모듈을 포함하는 것을 특징으로 하는 전자문서 파일 변환시스템.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서, 상기 문서변환부는 원본 문서파일에서 메타데이타를 추출하여 저장부에 저장하는 메타데이타 추출부를 추가로 포함하는 전자문서 파일 변환시스템.
  5. 제4항에 있어서, 상기 메타데이타 추출부는 원본 문서파일에서 페이지링크를 추출하는 페이지링크 추출모듈과 하이퍼링크를 추출하는 하이퍼링크 추출모듈 중 어느 하나 이상을 포함하는 전자문서 파일 변환시스템.
  6. 제5항에 있어서, 상기 문서변환부는 원본 문서파일에서 텍스트를 추출하여 저장부에 저장하는 텍스트추출부를 포함하는 전자문서 파일 변환시스템.
  7. 제6항에 있어서, 상기 문서변환부는 추출된 멀티미디어 개체에 대한 정보인 멀티미디어 개체정보, 메타데이타, 멀티미디어 개체의 경로정보 등를 저장하는 정보저장파일을 생성하는 정보저장파일생성부를 포함하는 전자문서 파일 변환시스템.
  8. 삭제
  9. 삭제
  10. 제4항 내지 제7항 중 어느 한 항에 있어서, 상기 멀티미디어 추출부는 원본 문서파일을 파싱하여 멀티미디어 관련 노드를 검색하고, 원본 문서파일 내에 삽입된 멀티미디어 개체인 경우에는 해당 멀티미디어 개체를 추출하여 저장부에 저장하고, 멀티미디어 개체에 대한 정보인 멀티미디어 개체 정보를 추출하여 저장부에 저장하는 전자문서 파일 변환시스템.
  11. 제10항에 있어서, 상기 멀티미디어 개체에 대한 정보는, 멀티미디어개체에 대한 파일명, 멀티미디어 개체 위치, 멀티미디어 개체 크기를 포함하는 전자문서 파일 변환시스템.
  12. 제7항에 있어서,
    상기 리소스를 조합하여 웹에서 열람가능하도록 문서파일로 생성하는 문서생성부를 추가로 포함하며,
    상기 문서생성부는 상기 멀티미디어 개체, 멀티미디어 개체 정보, 멀티미디어개체 경로정보, 메타데이타, 텍스트 중 어느 하나 이상을 정보저장파일을 참조하여 저장부에서 추출하여 웹에서 열람가능한 문서파일로 생성하는 전자문서 파일 변환시스템.
  13. 문서변환부에서 원본 문서파일에서 멀티미디어 개체를 추출하여 웹에서 열람가능한 포맷으로 변환하는 문서변환단계를 포함하며,
    상기 문서변환단계는 문서파일선별모듈이 원본 문서파일의 종류를 선별하는 문서파일선별단계, 멀티미디어 추출부가 원본 문서파일에서 멀티미디어를 추출하여 저장부에 저장하는 멀티미디어 추출단계 및 변환부가 추출된 텍스트와 메타데이타를 웹브라우저에서 표현가능한 포맷의 리소스로 변환하는 변환단계를 포함하고,
    상기 멀티미디어 추출단계는, 멀티미디어개체추출모듈이 문서파일에 포함된 멀티미디어 개체를 추출하는 멀티미디어개체 추출단계와, 멀티미디어정보추출모듈이 상기 멀티미디어 개체 정보를 추출하는 멀티미디어정보추출단계를 포함하는 전자문서 파일 변환방법.
  14. 삭제
  15. 제13항에 있어서, 상기 문서변환단계는 메타데이타 추출부가 원본 문서파일에서 메타데이타를 추출하여 저장부에 저장하는 메타데이타 추출단계를 추가로 포함하며,
    상기 메타데이타 추출단계는 페이지링크추출모듈이 원본 문서파일에서 페이지링크를 추출하는 페이지링크 추출단계와, 하이퍼링크추출모듈이 하이퍼링크를 추출하는 하이퍼링크 추출단계 중 어느 하나 이상을 포함하는 전자문서 파일 변환방법.
  16. 제15항에 있어서, 상기 문서변환단계는 정보저장파일생성부가 멀티미디어 개체정보, 메타데이타, 멀티미디어 개체의 경로정보를 저장하는 정보저장파일을 생성하는 정보저장파일 생성단계를 추가로 포함하는 전자문서 파일 변환방법.
  17. 삭제
  18. 제13항, 제15항 내지 제16항 중 어느 한 항에 있어서, 상기 멀티미디어 추출단계는 멀티미디어 추출부가 파싱된 원본 문서파일에서 멀티미디어 관련 노드를 검색하고 멀티미디어 개체가 문서파일에 포함된 것인지 아니면 링크로 연결된 것인지를 판단하여 문서파일에 포함된 경우에 한해 멀티미디어 개체와 그 멀티미디어 개체정보를 추출하는 전자문서 파일 변환방법.
  19. 제18항에 있어서, 상기 멀티미디어 추출단계는 멀티미디어정보추출모듈이 파싱된 원본 문서파일에서 멀티미디어 개체의 파일명, 위치, 크기에 관한 정보를 추출하여 멀티미디어 개체정보를 구성하는 전자문서 파일 변환방법.
  20. 제13항, 제15항 내지 제16항 중 어느 한 항에 있어서, 문서생성부가 상기 리소스를 조합하여 웹에서 열람가능하도록 문서파일로 생성하는 문서생성단계를 추가로 포함하며,
    상기 문서생성단계는, 멀티미디어 개체와 그 개체정보, 멀티미디어 개체의 경로정보, 메타데이타 중 어느 하나 이상을 정보저장파일을 참조하여 웹에서 열람가능한 문서파일로 생성하는 전자문서 파일 변환방법.



KR1020180098622A 2018-08-23 2018-08-23 전자문서 파일 변환시스템 및 그 방법 KR101971172B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180098622A KR101971172B1 (ko) 2018-08-23 2018-08-23 전자문서 파일 변환시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180098622A KR101971172B1 (ko) 2018-08-23 2018-08-23 전자문서 파일 변환시스템 및 그 방법

Publications (1)

Publication Number Publication Date
KR101971172B1 true KR101971172B1 (ko) 2019-04-23

Family

ID=66285274

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180098622A KR101971172B1 (ko) 2018-08-23 2018-08-23 전자문서 파일 변환시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR101971172B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220048698A (ko) * 2020-10-13 2022-04-20 주식회사 한글과컴퓨터 전자 문서를 지식 데이터 문서로 변환하는 전자 장치 및 그 동작 방법
KR102524124B1 (ko) * 2022-11-18 2023-04-20 주식회사 무하유 문서 내 이미지 객체의 변형 및 표절 검증을 위한 메타데이터 생성 장치 및 그 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101101162B1 (ko) * 2010-03-10 2012-01-05 김진우 웹페이지의 멀티미디어 파일 출력 방법 및 장치
KR101111031B1 (ko) * 2011-04-13 2012-02-13 장진혁 피디에프 문서 기반의 이북용 멀티미디어 재생 시스템 및 그 재생 방법
KR20150081994A (ko) * 2014-01-07 2015-07-15 한국전자통신연구원 전자문서 기반 지식 구축 방법 및 장치
KR20150086861A (ko) * 2014-01-21 2015-07-29 한국전자통신연구원 개체 정보 추출을 이용한 포렌식 문서 필터 장치 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101101162B1 (ko) * 2010-03-10 2012-01-05 김진우 웹페이지의 멀티미디어 파일 출력 방법 및 장치
KR101111031B1 (ko) * 2011-04-13 2012-02-13 장진혁 피디에프 문서 기반의 이북용 멀티미디어 재생 시스템 및 그 재생 방법
KR20150081994A (ko) * 2014-01-07 2015-07-15 한국전자통신연구원 전자문서 기반 지식 구축 방법 및 장치
KR20150086861A (ko) * 2014-01-21 2015-07-29 한국전자통신연구원 개체 정보 추출을 이용한 포렌식 문서 필터 장치 및 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220048698A (ko) * 2020-10-13 2022-04-20 주식회사 한글과컴퓨터 전자 문서를 지식 데이터 문서로 변환하는 전자 장치 및 그 동작 방법
KR102466721B1 (ko) * 2020-10-13 2022-11-14 주식회사 한글과컴퓨터 전자 문서를 지식 데이터 문서로 변환하는 전자 장치 및 그 동작 방법
KR102524124B1 (ko) * 2022-11-18 2023-04-20 주식회사 무하유 문서 내 이미지 객체의 변형 및 표절 검증을 위한 메타데이터 생성 장치 및 그 방법

Similar Documents

Publication Publication Date Title
TWI235924B (en) Methods, apparatus, and systems for storing, retrieving and playing multimedia data
JP5688092B2 (ja) ビデオコンテンツと電子ブックコンテンツの同期化装置及び方法とそのシステム
US8219688B2 (en) Method, apparatus and system for service selection, and client application server
CN101207782B (zh) 内容联动型信息提示装置及提示方法
JP4351405B2 (ja) トランスコーディングシステム及びアノテーション管理装置
US20100268694A1 (en) System and method for sharing web applications
CN104753966A (zh) 一种基于服务器和客户端缓存的资源文件查询方法及系统
EP2015202A1 (en) Method and apparatus for generating electronic content guide
US10289747B2 (en) Dynamic file concatenation
CN104333531A (zh) 网络资源的分享及获取方法、装置、终端
CN105808587B (zh) 在网页中嵌入信息的方法、网关设备及系统
JP2001209570A (ja) コンピュータネットワーク上でのリンク有効性検査装置及び方法
JP4771915B2 (ja) Htmlテキストを変換する装置、方法、およびプログラム
US20010049728A1 (en) Electronic music distribution service system and method using synchronous multimedia integration language format
CN1996295A (zh) 图像形成装置和搜索和打印网络上的图像的方法
KR101971172B1 (ko) 전자문서 파일 변환시스템 및 그 방법
JP4386011B2 (ja) Webページ再編集方法及びシステム
KR20060118470A (ko) 컨텐츠 기반의 부분 다운로드
US8195762B2 (en) Locating a portion of data on a computer network
KR100996037B1 (ko) 무선 인터넷 접속이 가능한 이동 통신 단말기에서 하이퍼링크 정보를 제공하기 위한 장치 및 방법
JP2004510251A (ja) 電子ドキュメントの構成可能な変換方法
US20100333204A1 (en) System and method for virus resistant image transfer
US20110209051A1 (en) Document browsing system and document conversion server
WO2001073560A1 (fr) Systeme fournisseur de contenus
CN111414495B (zh) 多媒体数据获取方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant