KR100473050B1 - 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법 - Google Patents

웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법 Download PDF

Info

Publication number
KR100473050B1
KR100473050B1 KR10-2002-0075630A KR20020075630A KR100473050B1 KR 100473050 B1 KR100473050 B1 KR 100473050B1 KR 20020075630 A KR20020075630 A KR 20020075630A KR 100473050 B1 KR100473050 B1 KR 100473050B1
Authority
KR
South Korea
Prior art keywords
file
text
image
web
case
Prior art date
Application number
KR10-2002-0075630A
Other languages
English (en)
Other versions
KR20040047414A (ko
Inventor
김소희
Original Assignee
삼성에스디에스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성에스디에스 주식회사 filed Critical 삼성에스디에스 주식회사
Priority to KR10-2002-0075630A priority Critical patent/KR100473050B1/ko
Publication of KR20040047414A publication Critical patent/KR20040047414A/ko
Application granted granted Critical
Publication of KR100473050B1 publication Critical patent/KR100473050B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법에 있어서, 서버에서 파일을 받을때 확장자를 보고 시스템이 지원하는 파일의 형태인지를 확인하는 단계; 시스템이 지원하지 않는 파일의 경우 사용자의 임시 디렉토리로 파일을 임시 저장하는 단계; 상기 임시 저장된 파일중에서 텍스트가 존재하고 텍스트를 추출할 수 있는 파일의 경우, 상기 파일에 존재하는 텍스트를 추출해 XML 파일로 변환하는 단계; 상기 임시 저장된 파일중에서 텍스트가 존재하지 않거나 텍스트를 추출할 수 없는 파일의 경우, 내부적으로 프린터 스풀러를 구동시켜 프린트시 동작되는 프린트 DC를 이미지로 저장하여 이미지 파일로 변환하는 단계; 및 상기 변환된 XML 파일과 이미지 파일을 웹 브라우저를 통하여 보여주는 단계;를 포함하는 것을 특징으로 하는 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법에 관한 것이다.

Description

웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법{Real time data conversion method to open attachment file in the web}
본 발명은 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법에 관한 것으로, 보다 상세하게는 웹 시스템에서 첨부된 파일을 보려고 할 때, 사용자의 시스템에 해당 프로그램이 존재하지 않으면 단지 다운로드만 받을 수 있는 기존의 방식과는 달리 해당 프로그램이 없어도 실시간으로 데이터를 변환하여 빠른 시간내에 데이터를 볼 수 있도록 한 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법에 관한 것이다.
기존의 첨부파일 보기 방식은 웹 시스템에 하이퍼링크되어 있는 파일을 클릭하면 서버에 존재하는 데이터의 확장자를 보고 사용자의 시스템에 있는 적합한 연결 프로그램을 찾아 다운로드하고 오픈하거나, 사용자의 시스템에 적합한 어플리케이션이 존재하지 않는다면 단지 다운로드만을 받는 방식이었다.
따라서, 웹 시스템에서 첨부되어 있는 데이터를 보기 위해서는 해당 파일을 열 수 있는 어플리케이션이 필요한데, 사용자가 해당 어플리케이션이 없을 경우 다운받은 프로그램을 읽을 수 없다는 문제점이 있었다.
또한, 상기 방식은 사용자가 해당 어플리케이션을 가지고 있지 않을때 다운로드 받은 파일을 읽기 위하여 프로그램을 또다시 깔아야 하고 다운로드시에 그 결과 파일을 읽기위한 시간이 오래 걸린다는 어려움이 있어왔다.
따라서, 본 발명은 상기한 바와 같은 문제점을 해결하기 위하여 안출된 것으로, 기존의 첨부파일 다운로드 기능에 더해서 다른 형식으로도 파일을 읽기만 하고자 할 때 별도의 프로그램을 장착하지 않고도 파일을 볼 수 있도록 하는 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법을 제공하는데 그 목적이 있다.
본 발명은 상기 목적을 달성하기 위하여 다음과 같은 구성을 가진다.
본 발명의 일 태양에 따르면, 본 발명의 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법은 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법에 있어서, 서버에서 파일을 받을때 확장자를 보고 시스템이 지원하는 파일의 형태인지를 확인하는 단계; 시스템이 지원하지 않는 파일의 경우 사용자의 임시 디렉토리로 파일을 임시 저장하는 단계; 상기 임시 저장된 파일중에서 텍스트가 존재하고 텍스트를 추출할 수 있는 파일의 경우, 상기 파일에 존재하는 텍스트를 문자 인식 프로그램을 이용해 추출해 XML 파일로 변환하는 단계; 상기 임시 저장된 파일중에서 텍스트가 존재하지 않거나 텍스트를 추출할 수 없는 파일의 경우, 내부적으로 프린터 스풀러를 구동시켜 프린트시 동작되는 프린트 DC를 이미지로 저장하여 이미지 파일로 변환하는 단계; 및 상기 변환된 XML 파일과 이미지 파일을 웹 브라우저를 통하여 보여주는 단계;를 포함하는 것을 특징으로 한다
이하, 상기한 본 발명을 실시하기 위한 바람직한 실시예에 대해 도면을 참조하여 구체적으로 살펴보기로 한다.
도 1은 본 발명에 따른 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법의 처리흐름도이다.
먼저, 사용자가 웹페이지상에서 링크되어 있는 파일을 클릭하면(s110), 서버는 해당 파일의 확장자를 보고(s120) 해당 어플리케이션이 존재하는지를 판단한다(s130). 만약 해당 어플리케이션이 존재할 경우에는 실행해서 열어줄 수 있지만(s140), 연결된 어플리케이션이 없을 시에는 첨부파일을 열 수가 없다. 따라서, 이와 같은 경우에는 서버에 있는 데이터에 대한 해당 포맷을 일단 사용자의 시스템의 임시 디렉토리에 저장시켜(s150) 시스템이 기본적으로 가지고 있는 데이터 포맷으로 변환시킨 후(s160), 첨부파일을 열고 화면에 디스플레이 해주는 것이다(s170).
도 2는 본 발명에 따른 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법에서의 데이터 포맷 변환을 나타내는 처리흐름도이다.
서버에서 파일을 받을때 확장자를 보고 시스템이 지원하는 파일의 형태인지를 먼저 확인한다(s210).
시스템에 없는 파일의 경우, 만약 한글, MS-OFFICE, PDF, GUL 등과 같은 파일의 경우와 같이 텍스트가 존재하고 텍스트를 추출할 수 있는 파일의 경우 텍스트를 추출해 XML로 변환한다(s240).
만일, 텍스트가 존재하지 않거나 텍스트를 추출할 수 없는 파일포맷인 경우에는 내부적으로 프린터 스풀러를 구동시켜(s220) 프린터를 할 때 동작되는 프린트 DC(Device Context)를 중간에서 가로채 바로 이미지로 저장시켜서(s230) 파일을 이미지로 덤프(저장,export)하여 메모리 상에 올린후 이미지 파일로 변환한다(s240). 즉, 서버상에 있는 파일에서 만약 이미지 파일이 있으면 실제 데이터 파일인 이미지 파일을 추출 및 저장하고, 텍스트가 있으면 XML로 변환하여 읽기에 용이하게 가공한다. 이것은 웹 화면에서 직접 처리하는 것이 아니라 사용자가 모르게 자신시스템의 Temp 폴더에 변환된 이미지 파일들을 저장해 놓고 보여줄 수 있겠다. 텍스트와 이미지로 저장하는 방법은 후술하기로 한다.
이렇게 변환된 XML 파일과 이미지 파일을 웹 브라우저(IE 5.0이상)를 통하여 디스플레이 서비스할 수 있다(s250).
또한, 파일 저장 방식을 XML 포맷으로 파일을 저장할 수 있도록 하여, 이에 따라 사용자들은 자신의 시스템에 해당 애플리케이션이 없어도 저장 파일을 열어 새로운 작업을 할 수 있다.
이하에서는 텍스트를 추출하는 방법에 대해서 살펴보겠다.
일반적으로 문서를 스캐닝한 데이터들은 이용자의 눈에 일반적인 글씨로 보이고 인식되지만 컴퓨터는 사진이건 글씨건 모두를 다 하나의 이미지로 인식한다. 그 이미지를 본 알고리즘에서는 비트맵 이미지 데이터 한글자의 코드로 바꾸어 주는 역할을 한다. 이러한 기법은 문서를 스캐닝한 데이터에서 한 글자씩 분석하고 컴퓨터에서 데이터의 처리가 가능하도록 글자 이미지를 아스키와 같은 글자코드로 번역하는 작업을 수행하는 문자 인식 기술로서 다음과 같다. 먼저 'D'라는 문자를 인식하는 과정을 살펴보면, 'D'라는 영문자는 쓰는 사람과 프린터에 따라 다양한 형태로 구분되어질 수 있다. 그러나 컴퓨터는 모든 문자를 여러 조각으로 잘라 흑백의 개수를 체크한다. 즉, 원본 이미지에서 흑의 조각이 42개이고 백의 조각이 22개이면 오른쪽의 비교대상 문자를 확인하여 같은 조각의 수가 나타나는 문자를 찾아내어 아스키 코드로 변환해 주는 것을 말한다. 이러한 방법을 통해 'A', 'C', 'D', 'O'의 비슷한 문자를 비교하여 찾아냄으로써 글자를 인식해 낸다. 또한, 다른 방법으로는 선과 원형 폐곡선 등을 비교하여 찾아내는 방법이 있다. 이 방법은 'D'라는 문자의 정보는 1개의 수직선, 0개의 수평선, 0개의 사선, 1개의 곡선, 0개의 독립선으로 분석한 후 이것을 중심으로 여러 문자와 비교하여 찾아내는 방법이다. 이 방법은 앞의 방법보다 좀 더 확실하게 문자 를 인식하는 방법이다.
동일한 자료를 텍스트 형태로 저장하면 이미지 형태로 저장한 것에 비해 저장용량을 수십배 내지 수백배 절약할 수 있다. 따라서 이 방법을 이용하면 정보 저장에 요구되는 하드디스크 시스템의 용량을 대폭 감소시킬 수 있다는 장점이 있다. 저장요구량이 감소함에 따라 자료의 분실, 손실 및 파손의 위험성이 작아진다는 장점도 누릴 수 있다.
다음에서는 이미지로 저장하는 방법에 대하여 살펴보겠다.
이 방법을 이용하면 대용량의 정보를 빠른 시간안에 입력하는 것이 가능하며, 이 이미지 정보를 이미 입력한 색인 데이터와 연결시키면 최단시간내에 데이터베이스 시스템을 구축할 수 있다. 그러나 이때 압축과정을 거쳐야 한다.
클라이언트가 파일을 서버로 요청하면 그 파일을 일단 사용자의 시스템에 저장시킨다음 그 파일에 대하여 내부적으로 프린터 스풀러를 작동시킨다. 그 스풀러는 데이터를 만들어주고, 데이터를 WMF(Window Meta File)파일로, 또 그 WMF파일을 Tiff로 변환시켜준다. 이 과정은 파일에 대한 DC를 프린터 DC가 가로채서 파일을 열지 않고도 이미지로 변환시키는 과정이다. 이 과정은 파일의 크기가 커질 수 있으므로 항상 압축을 하여야 한다.
만일 A4용지를 압축하지 않고 그대로 이미지화를 한다면 약 1MB이상의 정보 량이 나온다. 이만한 정보량을 10Mbps 용량을 가지고 있는 이더넷을 이용하여 전송하면 이미지 몇 개를 가져오는 동안 네트워크상에서 다른 작업을 하지 못하는 문제를 유발한다. 따라서 이러한 문제점 때문에 이미지를 압축하여 전송하고 검색할 수 있게 하는 방법을 이용한다.
이미지 압축의 방법으로는 많은 방법을 이용할 수 있는데, TIFF(Tag Image Film Format)방식과 JPEG(Joint Photographic Experts Group)방식이 있다. 먼저 TIFF방식은 매킨토시와 PC환경 모두에서 광범위하게 사용되는 장점을 지니고 있다. 따라서 시스템간의 이동작업에 편리하며 이러한 이점 때문에 많은 프로그램들이 TIFF형식을 지원한다. 또한, TIFF형식은 저장할 수 있는 해상도의 한계가 없으며, 보통의 경우 256단계로 충분히 가능한 환경을 지닐 수 있다. 이에 반해 JPEG 압축방법은 연속적인 톤을 가지고 있는 이미지에 효과적인 압축을 할 수 있다. 그러나 한번 JPEG기법을 이용해서 압축하면 원래의 이미지가 어느 정도 손실되기 때문에 원래의 파일상태로 되돌릴 수 없다는 단점을 지니고 있다.
이와 같이, 본 발명의 상세한 설명에서는 구체적인 실시예에 관해 설명하였으나, 본 발명의 범주에서 벗어나지 않는 한도내에서 여러가지 변형이 가능함은 물론이다. 그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며 후술하는 특허청구범위 뿐만 아니라 이 특허청구범위와 균등한 것들에 의하여 정해져야 된다.
이상에서 상세히 설명한 바와 같이, 본 발명에 따른 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법에 따르면, 기존의 첨부파일 다운로드 기능에 더해서 다른 형식으로도 파일을 읽기만 하고자 할 때 별도의 프로그램을 내장하지 않고도 파일을 볼 수 있도록 함으로써, 사용자가 해당 어플리케이션을 가지고 있지 않을 때에도 다운로드 받은 파일을 읽기 위하여 프로그램을 또다시 설치할 필요가 없고 따라서 파일을 읽기위한 시간을 절약할 수 있게 된다.
도 1은 본 발명에 따른 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법의 처리흐름도.
도 2는 본 발명에 따른 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법에서의 데이터 포맷 변환을 나타내는 처리흐름도.

Claims (1)

  1. 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법에 있어서,
    서버에서 파일을 받을때 확장자를 보고 시스템이 지원하는 파일의 형태인지를 확인하는 단계;
    시스템이 지원하지 않는 파일의 경우 사용자의 임시 디렉토리로 파일을 임시 저장하는 단계;
    상기 임시 저장된 파일중에서 텍스트가 존재하고 텍스트를 추출할 수 있는 파일의 경우, 상기 파일에 존재하는 텍스트를 문자 인식 프로그램을 이용해 추출해 XML 파일로 변환하는 단계;
    상기 임시 저장된 파일중에서 텍스트가 존재하지 않거나 텍스트를 추출할 수 없는 파일의 경우, 내부적으로 프린터 스풀러를 구동시켜 프린트시 동작되는 프린트 DC를 이미지로 저장하여 이미지 파일로 변환하는 단계; 및
    상기 변환된 XML 파일과 이미지 파일을 웹 브라우저를 통하여 보여주는 단계;를 포함하는 것을 특징으로 하는 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법.
KR10-2002-0075630A 2002-11-30 2002-11-30 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법 KR100473050B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2002-0075630A KR100473050B1 (ko) 2002-11-30 2002-11-30 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0075630A KR100473050B1 (ko) 2002-11-30 2002-11-30 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법

Publications (2)

Publication Number Publication Date
KR20040047414A KR20040047414A (ko) 2004-06-05
KR100473050B1 true KR100473050B1 (ko) 2005-03-10

Family

ID=37342811

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0075630A KR100473050B1 (ko) 2002-11-30 2002-11-30 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법

Country Status (1)

Country Link
KR (1) KR100473050B1 (ko)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175419A (ja) * 1997-12-17 1999-07-02 Sharp Corp 電子メール送受信システム
JP2000231522A (ja) * 1999-02-10 2000-08-22 Sharp Corp 電子メールサーバ
JP2001075892A (ja) * 1999-09-09 2001-03-23 Matsushita Electric Ind Co Ltd 電子メール受信装置、電子メール受信方法および記録媒体
JP2001075885A (ja) * 1999-09-03 2001-03-23 Canon Inc データ通信装置およびデータ通信方法
US6260043B1 (en) * 1998-11-06 2001-07-10 Microsoft Corporation Automatic file format converter
JP2001197248A (ja) * 2000-01-14 2001-07-19 Sharp Corp 画像伝送装置
JP2001318864A (ja) * 2000-05-11 2001-11-16 Casio Comput Co Ltd データ処理装置、および、記憶媒体
KR20020024024A (ko) * 2002-01-08 2002-03-29 (주)이지스템 다국어 메일 수신을 위한 메일의 이미지 처리된 메일전송방법

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175419A (ja) * 1997-12-17 1999-07-02 Sharp Corp 電子メール送受信システム
US6260043B1 (en) * 1998-11-06 2001-07-10 Microsoft Corporation Automatic file format converter
JP2000231522A (ja) * 1999-02-10 2000-08-22 Sharp Corp 電子メールサーバ
JP2001075885A (ja) * 1999-09-03 2001-03-23 Canon Inc データ通信装置およびデータ通信方法
JP2001075892A (ja) * 1999-09-09 2001-03-23 Matsushita Electric Ind Co Ltd 電子メール受信装置、電子メール受信方法および記録媒体
JP2001197248A (ja) * 2000-01-14 2001-07-19 Sharp Corp 画像伝送装置
JP2001318864A (ja) * 2000-05-11 2001-11-16 Casio Comput Co Ltd データ処理装置、および、記憶媒体
KR20020024024A (ko) * 2002-01-08 2002-03-29 (주)이지스템 다국어 메일 수신을 위한 메일의 이미지 처리된 메일전송방법

Also Published As

Publication number Publication date
KR20040047414A (ko) 2004-06-05

Similar Documents

Publication Publication Date Title
US7930292B2 (en) Information processing apparatus and control method thereof
US5907835A (en) Electronic filing system using different application program for processing drawing commands for printing
TW464811B (en) Storage management system for document image database
US8593661B2 (en) Image output apparatus including transmission units, image output apparatus control method, program, electronic document management system
US6199073B1 (en) Automatic archiving of documents during their transfer between a peripheral device and a processing device
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
US20060085442A1 (en) Document image information management apparatus and document image information management program
US7715625B2 (en) Image processing device, image processing method, and storage medium storing program therefor
US7738702B2 (en) Image processing apparatus and image processing method capable of executing high-performance processing without transmitting a large amount of image data to outside of the image processing apparatus during the processing
EP1312041B1 (en) Method and means for mobile capture,processing, storage and transmission of text and mixed information containing characters and images
US5406384A (en) Document filing apparatus in which a title and/or a key word is selected from image information displayed
JPH08147446A (ja) 電子ファイリング装置
US20060103872A1 (en) Electronic document management program and electronic document management apparatus
EP1552466B1 (en) System and method for automatic preparation of data repositories from microfilm-type materials
JP2004214991A (ja) 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法
KR100473050B1 (ko) 웹에서 첨부파일을 보기 위한 실시간 데이터 변환 방법
JP2006331274A (ja) ネットワーク文書管理システム、及びその制御方法、並びに記憶媒体
US20050025348A1 (en) Method of and apparatus for processing image data
JP4145171B2 (ja) 画像処理装置の不正使用監視装置
JP2003016070A (ja) 画像蓄積管理装置及び画像蓄積管理方法
CN100546332C (zh) 图像处理系统,方法和程序以及图像形成装置
JPH08161467A (ja) 電子ファイル装置並びに電子ファイルシステム
JP2000306076A (ja) 画像処理装置及び制御方法及び記憶媒体
JP2010092141A (ja) 画像処理システム、画像読取装置、画像処理装置および画像処理プログラム
JP2003308325A (ja) データ登録装置、データ登録方法、データ登録プログラムおよび記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130108

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140103

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20141231

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20151228

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20170102

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20171213

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20190102

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20200121

Year of fee payment: 16