KR100708389B1

KR100708389B1 - 디지탈 카메라에서 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 장치 및 그 방법

Info

Publication number: KR100708389B1
Application number: KR1020040051361A
Authority: KR
Inventors: 이종태; 박창호
Original assignee: 동국대학교 산학협력단
Priority date: 2004-07-02
Filing date: 2004-07-02
Publication date: 2007-04-18
Also published as: KR20060002358A

Abstract

본 발명은 디지털 데이터를 보안성을 가진 PDF파일로 압축 저장하는 기술에 관한 것이다.

이 같은 본 발명은, 원본 보존성과 보안성 그리고 광학문자인식 기술의 적용에 따른 검색 및 재사용 기능이 제공되는 PDF파일을 생성함으로써, 종래 JPEG 포맷으로 저정한 파일은 열어서 다른 포맷으로 재저장하여도 선명도를 회복할 수 없고 한번 압축하면 압축 이전 상태로 복원이 불가능한 단점을 개선하고, 촬영이 이루어진 인쇄 출판물을 디지털신호로 변환한 값을 그대로 매핑함으로써 데이터의 인식률에 대한 최대 효과를 창출하는 한편, PDF파일을 생성하는 과정에서 PDF형식에 보안기능을 추가함으로써 유저 단말기로 전송된 데이터가 보안 옵션의 설정값에 따라 인쇄, 내용 복사 및 추출 등을 원천적으로 차단할 수 있는 등 전자문서의 보안 효과를 극대화시키며, 종래 이미지 압축 저장방법인 JPEG의 대안 기술 배양 및 JPEG 칩셋, PDF 및 문자인식 기술에 대한 수입 대체효과, 그리고 친환경 저단가의 문서 생성 및 검색 기술 제공으로 문서관리시스템의 시장 확대를 기여하는 효과를 제공한다.

PDF, OCR, A/D컨버터, CCD, CMOS, 디지털 데이터, 보안성

Description

디지탈 카메라에서 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 장치 및 그 방법{The device which the compression and memorial to a PDF file of the security and method thereof}

도 1은 본 발명의 일실시예로 디지털 데이터를 보안성의 PDF파일로 압축 저장하는 시스템의 전체 구성도.

도 2는 본 발명의 일실시예로 디지털 데이터를 보안성의 PDF파일로 압축 저장하기 위한 PDF칩셋의 상세 블럭도.

도 3은 본 발명의 일실시예로 디지털 데이터로부터 한글 언어를 인식하는 단계의 흐름도.

도 4는 본 발명의 일실시예로 디지털 데이터로부터 영어 언어를 인식하는 단계의 흐름도.

도 5는 본 발명의 일실시예로 디지털 데이터로부터 기호를 인식하는 단계의 흐름도.

*도면의 주요 부분에 대한 부호의 설명*

1 ; CCD 2 ; A/D컨버터

5 ; 메모리 카드 100; PDF칩셋

10; 광학문자인식수단 20; PDF변환부

30; PDF보정부 40; PDF디코더부

41; 보안모듈

본 발명은 디지털 데이터를 보안성을 가진 피디에프(PDF; Portable Document Format) 파일로 압축 저장하는 기술에 관한 것으로서, 보다 상세하게는 전하결합소자(CCD; Charge Coupled Device)나 CMOS(Complementary Metal-oxide Semiconductor)에서 출력되는 연속적인 영상 및 이미지 아날로그 신호를 A/D컨버터(Analog Digital Converter)에서 디지털신호로 변환한 후 그 변환된 디지털신호로부터 입자들의 컬러 정보를 비트화한 데이터를 PDF파일로 압축 저장할 수 있도록 하는 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 장치 및 그 방법에 관한 것이다.

주지된 바와같이, PDF파일은 포스트 스크립트 기술 기반으로 생성된 파일 포맷으로, 이는 원본이 갖고 있는 레이 아웃을 그대로 보여 주는 특징을 갖는다.

그리고 PDF파일을 보기 위해서는 PDF리더 프로그램이 필요한데, 이는 아도비 사이트 또는 고스트스크립트 사이트에 무료로 다운로드 받을 수 있으며, 상기 PDF리더는 사용자의 필요에 따라 별도의 독립된 프로그램으로 사용하거나, 웹 브라우저에 플러그인(plug-in)의 형태로 사용할 수 있다.

상기 PDF파일은 윈도우나 맥킨토시, 유닉스, OS/2 등 어떤 타입의 컴퓨터 시스템 환경하에서도 전송과 읽기가 가능하여 문서 정보의 공유 및 전송 등의 여러 장점을 가지고 있다.

즉, 인터넷/인트라넷에서의 정보 공유를 위한 기존 HTML은 이미지와 텍스트, 그래픽 파일이 따로 존재하고, 그러한 파일에 링크를 통하여 화면에서 볼 수 있도록 하였지만, 상기 그래픽의 경우에는 이미지 형태로만 정보 공유가 가능한 단점이 있다.

반면, PDF파일의 모든 텍스트, 이미지, 그래픽은 파일내에 정해진 위치에 존재하고, 폰트나 그래픽(Line, Area, Point) 등은 벡터(Vector) 기반하에 실제 위치상에 나타내 주기 때문에 아무리 확대를 하거나 축소를 해도 그 해상도가 변하지 않고 원래의 그래픽을 그대로 유지하는 고품질 출력물을 얻을 수 있을뿐만 아니라, 다양한 문서의 포맷을 여러 시스템 환경에서 제공 및 공유할 수 있고, 문서 자료를 압축된 자료로 전송하여 보여줄 수 있으며, 그리고 원격지에서 특정 문서를 보내고 고품질의 프린팅을 원할 경우에 있어서도 유용하여 온라인이나 오프라인상에서 그 활용도가 확대되는 특징을 갖는다.

이에따라, 상기 PDF파일은 종이문서나, 아래한글, MS워드 등에서 작성된 문서 파일들을 PDF파일로 단순 변환시켜 PDF리더로 불러 들여 읽거나, 고품질 출력을 위한 인쇄물 출력에 그 사용이 이루어지도록 하였다.

아울러, PDF파일은 명함이나 각종 인쇄물을 디자인하고 즉석에서 인쇄하거나, 인터넷에서 서적 내용을 PDF파일로 제공하거나, PDF를 이용한 디지털 신문 제 작에 그 활용범위가 확대되고 있다.

그러나, 국내외에서는 아직까지 디지털 카메라내에서 직접 문자인식이 가능한 보안 PDF파일을 생성하거나 활용하는 것과 관련한 기술은 선보이지 않고 있다.

즉, 현재 문자 인식이 가능한 보안용 PDF파일은 아크로뱃 풀버젼(Acrobat Full Version) 또는 그외 여러 회사에서 개발된 PDF프린터 드라이버를 통하여 만들 수 있는데, 그 생성과정을 살펴보면, 먼저 디지털 카메라 또는 스캐너를 이용하여 이미지를 캡쳐하고 이를 사용자 단말기로 전송한다.

다음, 이미지 편집 툴 등을 통하여 이미지 보정작업을 마친 후 인쇄버튼을 통하여 이미 설치된 PDF프런터 드라이버로 스풀링하는 방식으로 그 생성이 이루어지도록 하였다.

더불어 문자인식이 가능하도록 지원하기 위해서는 이미지 파일을 대상으로 문자인식을 위한 전문 프로그램을 통하여 인식과정을 거친 후 PDF변환기로 인쇄하는 방법을 적용하였다.

그러나, 상기와 같은 방식으로 만들어지는 PDF파일은 그 생성 과정이 사용자 단말기내에 내장된 PDF프린터 드라이버를 통해 이루어지고 문자인식이나 보안을 위해 또 다른 프로그램을 활용해야 하는 복잡하고 번거로운 측면이 있다.

특히 문자인식은 이미지 파일 생성이 이루어진 후에 재차 이루어지기 때문에 인식률이 떨어지며 인식에 소요되는 전체 시간이 길이지는 단점이 있다.

더불어 종래에는 디지털 카메라 또는 핸드폰 카메라에 의해 촬영된 영상 또는 이미지에 대해서는 JPEG(Joint Photographics Expert Group)만을 활용하고 있는 데, 상기 JPEG파일은 흑백 및 컬러를 포함한 모든 정지 영상의 디지털 압축 기술에 관한 표준안으로 그 압축방식은 공간적으로 중복되는 색상 정보를 삭제함으로써 데이터를 압축하고, 별도의 장치를 필요로 하지 않고 CPU에서 바로 데이터를 압축하는 특징을 갖는다.

즉, 상기 JPEG는 다른 압축 기법들에 비해 매우 높은 압축비를 제공하며, RGB나 CMYK처림 높은 비트의 해상도(Bit Resolution)를 지닌 이미지 모드를 저장할 수 있으며, JPEG포맷으로 이미지를 저장하면 가장 높은 품질을 설정하더라도 파일의 크기는 거의 1/10수준이 되어 용량을 줄이는 효과를 기재할 수 있는 것이다.

그러나, 상기 JPEG포맷은 이미지의 선명도를 저하시키는 경향이 있으며, 이러한 현상은 압축비가 높을수록 두드러진다.

즉, 상기 JPEG포맷으로 저장한 파일은 열어서 다른 포맷으로 재저장하여도 선명도를 회복할 수 없는 것으로, 이는 JPEG로 한 번 압축이 이루어지면 압축 이전의 상태로 그 복원이 불가능한 단점을 가지고 있다.

따라서, 본 발명은 상기와 같은 종래의 문제점을 해결하기 위해 안출된 것으로서 본 발명은, 디지털카메라나 휴대 전화기의 카메라에 구비되는 전하결합소자(CCD)나 CMOS에서 출력되는 연속적인 영상 및 이미지 아날로그 신호를 A/D컨버터에서 디지털신호로 변환한 후 그 변환된 디지털신호로부터 입자들의 컬러 정보를 비트화한 데이터를 압축 해제시 원본과 동일한 이미지가 얻어질 수 있도록 무손실성을 가지는 디지털 카메라에서 디지털 데이터를 PDF파일로 압축 저장하는 장치 및 그 방법을 제공하려는데 그 목적이 있다.

또한 본 발명은 문서 열기의 암호 부여 기능을 포함하여 인쇄, 복사, 내용 추출을 원천적으로 금지시킬 수 있도록 전자문서의 보안성을 가지는 PDF파일을 생성하려는데 또 다른 목적이 있다.

또한 본 발명은 높은 인식율을 얻기 위한 기울기 보정, 색상 보정, 명암 보정 등의 작업을 병행하도록 독자적인 패턴매칭(Patten Matching) 및 구조분석(Structure Analysis) 기법에 기반한 하향식 접근방식(top-down approach)과 상향식 접근방식(bottom-up approach)의 광학문자인식(OCR) 기술을 적용함으로써, 피사체 내의 문자 요소들을 문단 또는 줄 단위의 계층적 구조에 맞게 분할한 후 연결요소(connected component) 또는 단일문자로부터 인식을 시작하여 전체적인 문서 구조의 그룹화가 가능하도록 함은 물론, 그 그룹화로부터 문서를 검색 가능한 PDF파일로 생성할 수 있도록 하려는데 또 다른 목적이 있다.

본 발명은, LCD뷰어 사용시 메모리에 저장된 영상을 PDF파일로 생성시킨 후 이를 유무선망을 통해 전송하여 편집이나 재활용이 가능하도록 한 PDF문서를 생성하려는데 또 다른 목적이 있다.

이하, 첨부된 도면에 의거하여 본 발명의 바람직한 일실시예를 설명하면 다음과 같다.

도 1은 본 발명의 일실시예로 디지털 데이터를 보안성의 PDF파일로 압축 저장하는 디지털 카메라 시스템의 전체 구성도이고, 도 2는 본 발명의 일실시예로 디지털 카메라에서 디지털 데이터를 보안성의 PDF파일로 압축 저장하기 위한 PDF칩셋의 상세 블럭도 이다.

도 1 및 도 2에 도시된 바와같이, CCD(또는 CMOS)(1), A/D컨버터(2), 마이크로 프로세서(3), 플래쉬 메모리(4), 메모리 카드(5), 출력단자(6)의 구성요소를 포함하는 시스템에 있어서,

상기 CCD(또는 CMOS)(1)에서 출력되는 연속적인 영상 및 이미지의 아날로그 신호가 A/D컨버터(2)에 의해 디지털신호로 변환될 때 그 변환된 디지털신호를 무손실성을 가지는 PDF파일로 압축 저장하는 PDF칩셋(100)을 더 포함하여 구성함을 특징으로 한다.

다른 일면에 따라, 상기 PDF칩셋(100)은,

A/D컨버터(2)로부터 변환된 디지털신호의 컬러 정보를 비트화시킨 후 그 비트화된 데이터의 문자 요소들을 문단이나 줄 단위의 계층적 구조에 맞게 분할하면서 연결요소나 단일 문자로부터 인식을 시작하여 검색이 가능한 전체적인 문서 구조로 그룹화시키는 광학문자인식수단(10);

상기 광학문자인식수단(10)으로부터 그룹화된 문서 구조를 PDF파일의 패턴으로 변환시키는 PDF변환부(20);

상기 PDF변환부(20)에 의해 변환된 PDF파일을 보정하는 PDF보정부(30); 및,

상기 PDF보정부(30)에 의해 보정이 이루어진 PDF파일을 압축한 후 이를 메모리카드(5)로 저장시키는 PDF디코더부(40); 로 구성함을 특징으로 한다.

또 다른 일면에 따라, 상기 광학문자인식수단(10)은,

디지털신호의 컬러 정보를 비트화시킨 후 그 비트화된 데이터의 문자 요소들을 문단이나 줄 단위의 계층적 구조에 맞게 처리하는 데이터 처리부(Preprocessing)(11);

상기 데이터 처리부(11)에 의해 처리된 문단이나 줄 단위의 데이터로부터 연결요소나 단일 문자에 대한 언어 특성을 분석하는 특성 분석부(Language Class Finder)(12);

상기 특성 분석부(12)에 의해 분석된 정보로부터 언어별 종류를 인식하는 언어 인식부(Recognition)(13) 및,

상기 언어 인식부(13)에 의해 종류별로 인식된 언어를 검색이 가능하도록 문단별 문서 구조로 그룹화시키는 라인 구성부(14)로 구성함을 특징으로 한다.

또 다른 일면에 따라, 상기 데이터 처리부(11)에는,

비트화된 데이터의 명암 및 색상을 분석하는 분석기(11a),

상기 명암 및 색상이 분석된 비트화된 데이터에서 노이즈를 제거하는 노이즈 제거기(11b),

상기 노이즈가 제거된 비트화된 데이터의 기울기를 보정하는 기울기 보정기(11c) 및,

상기 기울기가 보정된 비트화된 데이터에서 문단이나 줄 단위의 계층적 구조에 맞게 그림과 표 및 문단 위치를 구분하는 그래픽 처리기(11d)를 포함하여 구성함을 특징으로 한다.

또 다른 일면에 따라, 상기 언어 인식부(13)에는,

특성 분석부(12)에 의해 분석된 언어 특성으로부터 2바이트(byte)의 한글 언어를 인식하는 한글 인식기(13a),

특성 분석부(12)에 의해 분석된 언어 특성으로부터 1바이트(byte)의 영어 언어를 인식하는 영어 인식기(13b) 및,

특성 분석부(12)에 의해 분석된 언어 특성으로부터 기호를 인식하는 기호 인식기(13c)를 포함하여 구성함을 특징으로 한다.

또 다른 일면에 따라, 상기 PDF변환부(20)에는,

문자열이나 숫자의 효과적인 매핑을 지원하는 데이터 구조를 탑재 구성함을 특징으로 한다.

또 다른 일면에 따라, 상기 PDF디코더부(40)에는,

PDF파일의 압축시 인쇄, 전송, 내용 복사 및 추출을 금지시키는 보안 모듈(41)을 더 포함하여 구성함을 특징으로 한다.

한편, 상기의 시스템에 의해 구현되는 디지털 카메라의 디지털 데이터를 보안성의 PDF파일로 압축 저장하는 방법은,

연속변량(連續變量)의 함수인 아날로그신호를 이산적이고 부호화된 디지털신호로 변환 출력하는 단계;

상기 변환 출력된 디지털신호에서 광전 변환 입자들의 컬러 정보를 비트화된 데이터로 표현하는 단계;

상기 비트화된 데이터를 패턴매칭 방법과 구조분석 방법에 기반한 하향식 접근방식과 상향식 접근방식의 광학문자인식 기법을 이용하여 비트화된 데이터의 문자 요소들을 문단이나 줄 단위의 계층적 구조에 맞게 분할하면서 좌표를 지정하는 단계;

상기 지정된 좌표로부터 언어 특성을 분석한 후 언어별 종류를 인식하여 검색이 가능한 문서구조로 그룹화시키는 단계; 및,

상기 그룹화된 문서구조를 PDF 구문론에 적용 배열하여 PDF파일을 생성한 후 이를 압축하여 메모리카드(3)에 저장하는 단계; 로 진행함을 특징으로 한다.

다른 일면에 따라, 상기 언어별 종류 인식단계에는,

도 3에 도시된 바와같이 인식 단위를 구분한 후 그룹화에 의한 단어를 구성하여 음소 구분 및 글자 유형을 판별한 상태에서 구조 분석에 의한 글자 인식을 통해 PDF파일의 압축을 위한 타당성을 평가하여 대안을 분석하는 한글인식단계; 를 포함함을 특징으로 한다.

또 다른 일면에 따라, 상기 언어별 종류 인식단계에는,

도 4에 도시된 바와같이 인식 단위를 구분한 후 패턴분석에 의한 그룹을 인식하여 매칭분석에 의한 글자를 인식한 상태에서 글자조립에 의한 영어 단어 구성을 통해 PDF파일의 압축을 위한 타당성을 평가하여 대안을 분석하는 영어인식단계; 를 포함함을 특징으로 한다.

또 다른 일면에 따라, 상기 언어별 종류 인식단계에는,

도 5에 도시된 바와같이 인식 단위를 구분한 후 패턴분석에 의한 그룹을 인식하여 상대 위치 분석에 의한 세부그룹을 인식한 상태에서 매칭분석에 의한 기호 인식을 통해 PDF파일의 압축을 위한 타당성을 평가하여 대안을 분석하는 기호인식단계; 를 포함하여 진행함을 특징으로 한다.

또 다른 일면에 따라, 상기 언어별 종류 인식단계에는,

PDF파일 생성 완료 후 PDF파일의 검색이 가능하도록 문자나 숫자에 대해 CID폰트를 추가 지원함을 특징으로 한다.

이와같이 구성된 본 발명의 일실시예에 대한 작용을 첨부된 도 1 내지 도 5를 참조하여 설명하면 다음과 같다.

먼저, 디지털 카메라 또는 카메라가 구비되는 휴대 전화기에 마련되는 CCD(또는 CMOS)(1)에서 연속적인 영상 및 이미지의 아날로그 신호가 A/D컨버터(2)로 출력될 경우, 상기 A/D컨버터(2)는 영상 및 이미지의 아날로그 신호를 이산적이고 부호화된 디지털신호로 변환한 후 이를 PDF칩셋(100)에 출력한다.

그러면, 상기 PDF칩셋(100)에서는 연속적인 영상 및 이미지의 디지털 신호를 무손실성을 가지는 PDF파일로 압축한 후 이를 메모리카드(3)에 저장하게 된다.

이를 보다 구체적으로 살펴보면, 상기 PDF칩셋(100)내에는 광학문자인식수단(10), PDF변환부(20), PDF보정부(30), PDF디코더부(40)를 포함하고 있는 바,

상기 광학문자인식수단(10)은 비트화된 데이터를 패턴매칭 방법과 구조분석 방법에 기반한 하향식 접근방식과 상향식 접근방식의 광학문자인식 기법을 이용하여 A/D컨버터(2)로부터 변환된 디지털신호의 컬러 정보를 비트화시킨 후 그 비트화된 데이터의 문자 요소들을 문단이나 줄 단위의 계층적 구조에 맞게 분할하면서 좌표를 지정한 후 연결요소나 단일 문자로부터 인식을 시작하여 검색이 가능한 전체적인 문서 구조로 그룹화시킨 후 이를 PDF변환부(20)로 출력하게 된다.

즉, 상기 광학문자인식수단(10)에는 데이터 처리부(11), 특성분석부(12), 언어 인식부(13), 라인 구성부(14)를 포함하고 있는 상태에서, 상기 데이터 처리부(11)에는 분석기(11a), 노이즈 제거기(11b), 기울기 보정기(11c), 그래픽 처리기(11d)를 포함하고, 상기 언어 인식부(13)에는 한글 인식기(13a), 영어 인식기(13b), 기호 인식기(13c)를 포함하고 있는 바,

상기 데이터처리부(11)내의 분석기(11a)에서는 비트화된 데이터의 명암 및 색상을 분석한 후 이를 노이즈 제거기(11b)로 출력하고, 상기 노이즈 제거기(11b)는 상기 명암 및 색상이 분석된 비트화된 데이터에서 노이즈를 제거한 후 이를 기울기 보정기(11c)로 출력한다.

그러면, 상기 기울기 보정기(11c)는 노이즈가 제거된 비트화된 데이터의 기울기를 보정한 후 이를 그래픽 처리기(11d)로 출력함으로써, 상기 그래픽 처리기(11d)에서는 기울기가 보정된 비트화된 데이터에서 문단이나 줄 단위의 계층적 구조에 맞게 그림과 표 및 문단 위치를 구분한 후 이를 특성 분석부(12)로 출력하게 된다.

이때, 상기 특성 분석부(12)는 데이터 처리부(11)에 의해 처리된 문단이나 줄 단위의 데이터로부터 연결요소나 단일 문자에 대한 언어 특성을 분석하여 그 언어의 색상이나 명암이 기준치를 만족하지 못할 경우, 상기의 색상이나 명암의 재조정을 위한 신호를 데이터 처리부(11)로 출력하고, 기준치를 만족할 경우에는 특성 분석이 이루어진 언어를 언어 인식부(13)로 출력하게 된다.

그러면, 상기 언어 인식부(13)에서는 특성 분석부(12)에 의해 분석된 정보로부터 언어별 종류를 인식하게 된다.

즉, 상기 언어 인식부(13)에 포함된 한글 인식기(13a)는 도 3에서와 같이 인 식 단위 분석을 통해 특성 분석부(12)에 의해 분석된 언어 특성으로부터 2바이트의 한글 언어를 인식한 후 그룹화에 의한 단어를 구성하여 음소 구분 및 글자 유형을 판별한 상태에서 구조 분석에 의한 글자 인식을 통해 PDF파일의 압축을 위한 타당성 평가의 대안을 분석한다.

상기 언어 인식부(13)에 포함된 영어 인식기(13b)는 도 4에서와 같이 인식 단위 분석을 통해 특성 분석부(12)에 의해 분석된 언어 특성으로부터 1바이트의 영어 언어를 인식한 후 패턴분석에 의한 그룹을 인식하여 매칭분석에 의한 글자를 인식한 상태에서 글자조립에 의한 영어 단어 구성을 통해 PDF파일의 압축을 위한 타당성 평가의 대안을 분석한다.

상기 언어 인식부(13)에 포함된 기호 인식기(13c)는 도 5에서와 같이 인식 단위 분석을 통해 특성분석부(12)에 의해 분석된 언어 특성으로부터 기호를 인식한 후 패턴 분석에 의한 그룹을 인식하여 상대 위치 분석에 의한 세부그룹을 인식한 상태에서 매칭분석에 의한 기호 인식으로 PDF파일의 압축을 위한 타당성 평가의 대안을 분석하게 되는 것이다.

이때, 상기 라인 구성부(14)는 언어 인식부(13)에 의해 종류별로 인식된 언어를 검색이 가능하도록 문단별 문서 구조로 그룹화시킨 후 이를 PDF변환부(20)로 출력한다.

그러면, 상기 PDF변환부(20)는 라인 구성부(14)에 의해 그룹화된 문서 구조를 열람 및 편집과 재활용이 가능한 PDF파일의 패턴으로 생성하게 되는데, 이때 상기 PDF변환부(20)에는 문자열이나 숫자의 효과적인 매핑을 지원하는 데이터 구조가 탑재함은 물론, 문자나 숫자에 대해 CID폰트가 지원되도록 구성함으로써, PDF파일의 생성이 완료될 때, 상기 생성되는 PDF파일은 후술하는 보안모듈(41)로부터 부여되는 암호에 의해 그 검색이 보다 자유롭게 이루어질 수 있게 되는 것이다.

이후, 상기 PDF보정부(30)는 생성된 PDF파일을 보정한 후 이를 PDF디코더부(40)로 출력함으로써, 상기 PDF디코더부(40)는 생성된 PDF파일을 압축하게 된다.

이때, 상기 PDF디코더부(40)에는 보안모듈(41)이 포함되어 있으므로, 상기 보안모듈(41)은 PDF파일을 압축할 때 그 인쇄 및 전송과 내용복사는 물론 추출을 금지하는 암호를 부여한 후 그 부여된 암호에 따라 검색이 가능하도록 메모리카드(5)에 저장시키게 되는 것이다.

이상에서 설명한 바와같이 본 발명은 원본 보존성과 보안성 그리고 광학문자인식 기술의 적용에 따른 검색 및 재사용 기능이 제공되는 PDF파일을 생성함으로써, 종래 JPEG 포맷으로 저정한 파일은 열어서 다른 포맷으로 재저장하여도 선명도를 회복할 수 없고 한번 압축하면 압축 이전 상태로 복원이 불가능한 단점을 개선시키는 특징을 갖는다.

또한, 본 발명은 촬용이 이루어진 인쇄 출판물을 디지털신호로 변환한 값을 그대로 매핑함으로써 데이터의 인식률에 대한 최대 효과를 창출하는 한편, PDF파일을 생성하는 과정에서 PDF형식에 보안기능을 추가함으로써 유저 단말기로 전송된 데이터가 보안 옵션의 설정값에 따라 인쇄, 내용 복사 및 추출 등을 원천적으로 차 단할 수 있는 등 전자문서의 보안 효과를 극대화시키는 특징을 갖는다.

또한, 본 발명은 종래 이미지 압축 저장방법인 JPEG의 대안 기술 배양 및 JPEG 칩셋, PDF 및 문자인식 기술에 대한 수입 대체효과, 그리고 친환경 저단가의 문서 생성 및 검색 기술 제공으로 문서관리시스템의 시장 확대를 기여하는 효과를 제공할 수 있는 것이다.

본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와같은 변경은 청구범위 기재의 범위내에 있게 된다.

Claims

CCD(또는 CMOS), A/D컨버터, 마이크로 프로세서, 플래쉬 메모리, 메모리 카드 및 출력단자를 포함하는 디지털 카메라의 파일 압축 시스템에 있어서,

상기 CCD(또는 CMOS)에서 출력되는 연속적인 영상 및 이미지의 아날로그 신호가 A/D컨버터에 의해 디지털신호로 변환될 때 그 변환된 디지털신호를 무손실성을 가지는 PDF파일로 압축 저장하는 PDF칩셋을 더 포함하여 구성되되,

상기 PDF칩셋은,

A/D컨버터로부터 변환된 디지털신호의 컬러 정보를 비트화시킨 후 그 비트화된 데이터의 문자 요소들을 문단이나 줄 단위의 계층적 구조에 맞게 분할하면서 연결요소나 단일 문자로부터 인식을 시작하여 검색이 가능한 전체적인 문서 구조로 그룹화시키는 광학문자인식수단;

상기 광학문자인식수단으로부터 그룹화된 문서 구조를 PDF파일의 패턴으로 변환시키는 PDF변환부;

상기 PDF변환부에 의해 변환된 PDF파일을 보정하는 PDF보정부; 및,

상기 PDF보정부에 의해 보정이 이루어진 PDF파일을 압축한 후 이를 메모리카드로 저장시키는 PDF디코더부; 로 구성함을 특징으로 하는 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 디지털 카메라.
삭제
제 1 항에 있어서, 상기 광학문자인식수단은,

디지털신호의 컬러 정보를 비트화시킨 후 그 비트화된 데이터의 문자 요소들을 문단이나 줄 단위의 계층적 구조에 맞게 처리하는 데이터 처리부;

상기 데이터 처리부에 의해 처리된 문단이나 줄 단위의 데이터로부터 연결요소나 단일 문자에 대한 언어 특성을 분석하는 특성 분석부;

상기 특성 분석부에 의해 분석된 정보로부터 언어별 종류를 인식하는 언어 인식부 및,

상기 언어 인식부에 의해 종류별로 인식된 언어를 검색이 가능하도록 문단별 문서 구조로 그룹화시키는 라인 구성부로 구성함을 특징으로 하는 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 디지털 카메라.
제 3 항에 있어서, 상기 데이터 처리부에는,

비트화된 데이터의 명암 및 색상을 분석하는 분석기, 상기 명암 및 색상이 분석된 비트화된 데이터에서 노이즈를 제거하는 노이즈 제거기, 상기 노이즈가 제거된 비트화된 데이터의 기울기를 보정하는 기울기 보정기 및, 상기 기울기가 보정된 비트화된 데이터에서 문단이나 줄 단위의 계층적 구조에 맞게 그림과 표 및 문단 위치를 구분하는 그래픽 처리기를 포함하여 구성함을 특징으로 하는 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 디지털 카메라.
제 3 항에 있어서, 상기 언어 인식부에는,

특성 분석부에 의해 분석된 언어 특성으로부터 2바이트의 한글 언어를 인식하는 한글 인식기, 특성 분석부에 의해 분석된 언어 특성으로부터 1바이트의 영어 언어를 인식하는 영어 인식기 및, 특성 분석부에 의해 분석된 언어 특성으로부터 기호를 인식하는 기호 인식기를 포함하여 구성함을 특징으로 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 디지털 카메라.
제 1 항에 있어서, 상기 PDF변환부에는,

문자열이나 숫자의 효과적인 매핑을 지원하는 데이터 구조를 탑재 구성함을 특징으로 하는 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 디지털 카메라.
제 1 항에 있어서, 상기 PDF디코더부에는,

PDF파일의 압축시 인쇄, 전송, 내용 복사 및 추출을 금지시키는 보안 모듈을 더 포함하여 구성함을 특징으로 하는 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 디지털 카메라.
연속변량의 함수인 영상 및 이미지의 아날로그신호를 이산적이고 부호화된 디지털신호로 변환 출력하는 단계;

상기 변환 출력된 디지털신호에서 광전 변환 입자들의 컬러 정보를 비트화된 데이터로 표현하는 단계;

상기 비트화된 데이터를 패턴매칭 방법과 구조분석 방법에 기반한 하향식 접근방식과 상향식 접근방식의 광학문자인식 기법을 이용하여 비트화된 데이터의 문자 요소들을 문단이나 줄 단위의 계층적 구조에 맞게 분할하면서 좌표를 지정하는 단계;

상기 지정된 좌표로부터 언어 특성을 분석한 후 언어별 종류를 인식하여 검색이 가능한 문서구조로 그룹화시키는 단계; 및,

상기 그룹화된 문서구조를 PDF 구문론에 적용 배열하여 PDF파일을 생성한 후 이를 압축하여 메모리카드에 저장하는 단계; 로 진행함을 특징으로 하는 디지털 카메라에서 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 방법.
제 8 항에 있어서, 상기 언어별 종류 인식단계에는,

인식 단위를 구분한 후 그룹화에 의한 단어를 구성하여 음소 구분 및 글자 유형을 판별한 상태에서 구조 분석에 의한 글자 인식을 통해 PDF파일의 압축을 위한 타당성을 평가하여 대안을 분석하는 한글인식단계; 를 포함함을 특징으로 하는 디지털 카메라에서 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 방법.
제 8 항에 있어서, 상기 언어별 종류 인식단계에는,

인식 단위를 구분한 후 패턴분석에 의한 그룹을 인식하여 매칭분석에 의한 글자를 인식한 상태에서 글자조립에 의한 영어 단어 구성을 통해 PDF파일의 압축을 위한 타당성을 평가하여 대안을 분석하는 영어인식단계; 를 포함함을 특징으로 하는 디지털 카메라에서 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 방법.
제 8 항에 있어서, 상기 언어별 종류 인식단계에는,

인식 단위를 구분한 후 패턴분석에 의한 그룹을 인식하여 상대 위치 분석에 의한 세부그룹을 인식한 상태에서 매칭분석에 의한 기호 인식을 통해 PDF파일의 압축을 위한 타당성을 평가하여 대안을 분석하는 기호인식단계; 를 포함하여 진행함을 특징으로 하는 디지털 카메라에서 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 방법.
제 8 항에 있어서, 상기 언어별 종류 인식단계에는,

PDF파일 생성 완료 후 PDF파일의 검색이 가능하도록 문자나 숫자에 대해 CID폰트를 추가 지원함을 특징으로 하는 디지털 카메라에서 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 방법.