KR20070026239A - 화상 처리 장치 및 그 방법 - Google Patents

화상 처리 장치 및 그 방법 Download PDF

Info

Publication number
KR20070026239A
KR20070026239A KR1020060084201A KR20060084201A KR20070026239A KR 20070026239 A KR20070026239 A KR 20070026239A KR 1020060084201 A KR1020060084201 A KR 1020060084201A KR 20060084201 A KR20060084201 A KR 20060084201A KR 20070026239 A KR20070026239 A KR 20070026239A
Authority
KR
South Korea
Prior art keywords
information
output
output information
image
document
Prior art date
Application number
KR1020060084201A
Other languages
English (en)
Other versions
KR100808713B1 (ko
Inventor
다에꼬 야마자끼
Original Assignee
캐논 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 캐논 가부시끼가이샤 filed Critical 캐논 가부시끼가이샤
Publication of KR20070026239A publication Critical patent/KR20070026239A/ko
Application granted granted Critical
Publication of KR100808713B1 publication Critical patent/KR100808713B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03GELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
    • G03G15/00Apparatus for electrographic processes using a charge pattern
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/44Secrecy systems
    • H04N1/4406Restricting access, e.g. according to user identity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/44Secrecy systems
    • H04N1/4406Restricting access, e.g. according to user identity
    • H04N1/444Restricting access, e.g. according to user identity to a particular document or image or part thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/44Secrecy systems
    • H04N1/4446Hiding of documents or document information

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

문서는 높은 문자 인식율을 가진 영역 및 그다지 높지 않은 문자 인식율을 가진 영역을 포함한다. 따라서, 동일한 속성을 가지고 있기 때문에 동일한 정보 유형들이 제공되는 경우라 하더라도, 만족스러운 정보 제공이 이루어질 수 있다고 말하기는 어렵다. 또한, 출력 방법들에 따라, 상이한 종류의 정보들이 요구된다. 이러한 문제점들을 해결하기 위해, 각 영역에 출력되어야 할 출력 정보는 문서 화상의 출력 목적지 정보 및 문서 화상 내의 각각의 영역들의 속성들에 기초해 판정되고, 출력되어야 할 출력 정보들의 부분들은 통합되어 출력 목적지로 출력된다. 각 영역에 출력되어야 할 출력 정보가 문서 화상의 출력 목적지 정보, 문서 화상 내의 각각의 영역들의 속성들, 및 사용자의 권한 정보에 기초해 판정될 수 있다.
문자 인식율, 문서 화상, 출력 정보, 영역, 속성, 통합, 사용자 권한 정보, 화상 처리

Description

화상 처리 장치 및 그 방법 {IMAGE PROCESSING APPARATUS AND METHOD THEREOF}
도 1은 화상 처리 장치의 구성을 도시하는 블록도이다.
도 2는 화상 처리 장치에 데이터를 등록하기 위한 처리를 도시하는 흐름도이다.
도 3은 영역 속성들에 따라 선택된 출력 모드들과 출력 정보 사이의 관계를 도시하는 표다.
도 4는 컬러 문서 화상의 일례를 도시한다.
도 5는 문서 정보를 분할된 각 영역의 출력 정보와 연관짓는 정보를 예시하는 도면이다.
도 6은 출력 정보를 출력하는 처리를 도시하는 흐름도이다.
도 7은 출력 정보의 기존 유형들로부터 변환될 수 있는 출력 정보의 유형들을 도시한다.
도 8은 컬러 문서를 흑백-복사하는 것에 의해 취득되는 문서의 디지털 화상의 일례를 도시한다.
도 9는 모니터 디스플레이의 경우에서 출력 정보의 설정 처리를 설명하기 위한 흐름도이다.
도 10은 PDA 디스플레이의 경우에서 출력 정보의 설정 처리를 설명하기 위한 흐름도이다.
도 11은 확대 디스플레이의 경우에서 출력 정보의 설정 처리를 설명하기 위한 흐름도이다.
도 12는 확대 영역의 일례를 도시한다.
도 13은 초확대 디스플레이의 경우에서 출력 정보의 설정 처리를 설명하기 위한 흐름도이다.
도 14는 문서 정보를 분할된 각 영역의 정보와 연관짓는 정보를 예시하는 도면이다.
도 15는 제2 실시예에 따른 화상 처리 장치에 데이터를 등록하기 위한 처리를 도시하는 흐름도이다.
도 16은 도 4에 도시된 문서 화상으로부터 생성되는 출력 정보의 일례를 도시하는 표다.
도 17a 내지 도 17c는 사진 영역에 대한 출력 정보 그룹의 일례를 도시하는 도면들이다.
도 18은 문서 정보, 출력 정보, 및 주어진 분할 영역의 사용 권한 정보 사이의 관계에 대한 일례를 도시한다.
도 19a 및 도 19b는 출력 모드-의존적 사용 권한들을 도시하는 표의 예이다.
도 20a 내지 도 20d는 내용-의존적 사용 권한들을 도시하는 표의 예들이다.
도 21은 출력 정보를 출력하는 처리를 도시하는 흐름도이다.
도 22a 내지 도 22d는 도 4에 도시된 문서 화상에 대응하는 등록 데이터의 출력 예들을 도시한다.
도 23a 및 도 23b는 제3 실시예에 따라 도 4에 도시된 문서 화상에 대하여 설정되는 출력 모드-의존적 사용 권한들을 도시하는 표들이다.
도 24는 등록 데이터에 대해 준비된 것들에만 기초해서는 출력 정보가 출력될 수 없을 경우에 실행되는 처리를 설명하기 위한 흐름도이다.
<도면의 주요 부분에 대한 부호의 설명>
301, 306 : 텍스트 영역
302 : 사진 영역
303 : 텍스트 영역
304 : 드로잉 영역
305 : 표 영역
401 : 문서 정보
402, 403 : 출력 정보
<발명의 분야>
본 발명은, 문서 화상들의 사용, 변경, 표시, 이동, 공유 등을 허용하는 화상 처리 장치 및 그 방법에 관한 것이다.
<관련 기술의 설명>
다기능 주변기기(MFP:Multi Functional Peripheral)들은 두드러지게 향상된 기능들을 취득하여 왔는데, 복사 및 인쇄 기능에 추가하여 스캐너와 팩스 기능들을 가진 장치들이 시장의 주된 흐름이 되어 왔다. 사무실의 MFP는 지면들 상에 인쇄된 정보와 디지털 데이터 사이의 인터페이스로서 중요한 역할을 한다.
특히, MFP의 스캐너 기능은 다량의 문서들을 디지털 데이터로 효율적으로 변환할 수 있다. 이런 이유 때문에, 많은 경우에 있어서 문서들은 스캐닝되고 네트워크상의 데이터베이스(DB) 또는 MFP 자체의 데이터베이스에 저장되어, 문서 관리된다. 문서를 스캐닝하는 것에 의해 취득되는 디지털 데이터를 이하에서는 "문서 화상"으로 지칭한다.
퍼스널 컴퓨터들(PC들)의 대중화와 함께, 그러한 PC 상의 애플리케이션 소프트웨어를 사용하는 문서 생성도 일반화되었다. 애플리케이션 소프트웨어에 의해 생성되는 디지털 데이터 상태의 문서를 이하에서는 "디지털 문서"라고 지칭한다.
문서 화상들 및 디지털 문서들은, 지면들 상에 인쇄된 문서들에 비해, 데이터의 용이한 재편집과 재사용, 대다수 사람들에 의한 데이터의 용이한 공유, 시간의 경과에 따른 품질 비저하 등의 이점들을 가진다. 한편, 지면들 상에 인쇄된 문서들은, 문서 화상들 및 디지털 문서들에 비해, 높은 가독성, 취급의 용이성, 운반의 편리성, 높은 이해 가능성 등의 이점들을 가진다. 이런 이유 때문에, 많은 예들에서, 디지털 문서들 및 문서 화상들을 지면들 상에 인쇄하는 것이 종종 효율적이다.
반대로, 지면들 상에 인쇄된 문서들과 동일하거나 유사한 문서 화상들 및 디지털 문서들이 종종 필요하다. 예를 들어, 사용자는 지면들 상에 인쇄된 일부 문서 페이지들이 훼손되어, 디지털 문서를 처음 상태로 인쇄하고 싶어한다. 또한, 사용자는, 원래는 컬러 문서지만 흑백 문서로 인쇄된 디지털 문서를 컬러로 재인쇄하기를 원한다.
문서 화상에 함께 포함되어 있는 사진, 텍스트, 표, 및 선화(line art)가 각각 분석되고 분석 결과들이 재사용되어야 하는 다수 상황들이 존재할 수도 있다. 예를 들어, 문서 화상이 텍스트 데이터로서 사용되는 경우의 문자 인식에 기초한 데이터 변환, 특정 영역이 보기 쉽도록 확대되는 경우에 화상 품질의 임의의 저하로부터도 자유로운 벡터 화상으로의 변환 등이 그러한 상황이다.
이런 식으로, 지면들 상에 인쇄된 문서를 출발점으로 하여, 사용자가 용이하게 데이터의 사용, 변경, 표시, 이동, 공유 등을 하게 하는 문서 관리 시스템이 요구된다.
사진과 텍스트를 함께 포함하는 문서를 스캐닝하는 것에 의해 생성된 문서 화상이 재인쇄될 때, 예를 들어, A4-사이즈의, 300 dpi로 JPEG-압축된 컬러 스캔 화상은 3.5MB에 근접한 데이터 사이즈를 갖고, 대다수 문서 화상들이 네트워크를 통해 이동한다면, 네트워크에 대한 부하가 가중될 것이다. 그러나, 해상도가 감소되면, 텍스트 영역의 화상 품질이 저하된다. 따라서, 문서 화상의 한 페이지에 적용될 균일한 화상 처리는 한계를 가지고, 다음과 같은 종래 기술들이 제안되었다.
일본 특개평 제8-204950호는, 입력 화상을 사진 영역과 텍스트 영역으로 분 할하고 사진 영역과 텍스트 영역의 해상도들을 가변인 것으로 설정하는 화상 관리를 개시한다. 그러나, 래스터 화상(raster image)만이 가변 해상도를 가지며, 벡터 화상 및 텍스트 영역의 문자 인식 결과는 관리되지 않는다. 일본 특개평 제2003-348326호는, 문서 화상을 각각의 라인들에 대해 분할하고 스캔 화상을 휴대용 단말기(PDA)에 표시하기 위해 분할된 라인들을 재통합하는 기술을 개시한다. 그러나, 출력 목적지는 휴대용 단말기로 한정되고, 처리될 오브젝트는 래스터 화상만이며, 벡터 화상 및 문자 인식 결과는 지원되지 않는다.
일본 특개평 제2000-306103호는, 문서 화상을 텍스트 영역, 화상 영역, 및 배경 영역으로 분할하고, 이 영역들을 미리 준비된 계층들에 분배하여 문서 화상의 데이터 사이즈를 크게 감소시키고, 문서 데이터를 데이터의 용이한 재사용이 가능한 포맷으로 보유하는 기술을 개시한다. 재사용이 용이한 포맷의 문서 데이터에서도, 각 영역의 정보는 오직 한가지 유형만 있다.
이러한 종래 기술들에 공통적인 특징은, 화상들이 영역들의 각각의 속성들에 대해 관리된다는 점이다. 그러나, 동일한 속성을 가진 영역들이라 하더라도 다양한 특징들을 가진다. 예를 들어, 하나의 문서 화상에 2개의 상이한 텍스트 영역들이 제공될 경우, 하나의 영역은 높은 문자 인식율을 가질 수 있지만, 다른 영역은 그다지 높지 않은 인식율을 가질 수도 있다. 이런 식으로, 그들이 동일한 속성을 가지고 있어 동일한 정보 유형들이 제공되는 경우라 하더라도, 만족스러운 정보 전달이 이루어질 수 있다고 말하기는 어렵다.
이러한 종래 기술들은, 데이터 등록 시에 한정된 방식으로, 해상도 변환 등과 같은 처리를 실행하고, 출력 시에 사용자가 원하는 해상도로 변환하기 위한 처리를 지원하지 않는다.
본 환경들하에서는, 사용자가 원래는 컬러 디지털 문서지만 흑백 문서로서 인쇄된 디지털 문서를 컬러 문서로서 재인쇄하기를 원하거나 사용자가 지면들 상에 인쇄된 문서에 기초해 원본의 디지털 문서를 취득하기를 원할 경우, 그 또는 그녀는 통상적으로, 필요한 디지털 문서를 취득하기 위해, 원래의 디지털 문서를 생성한 사람에게 문의한다.
프린터들, 모니터들, PDA 등과 같은 광범위한 장치들이 문서 화상들을 출력하는데 사용되고, 출력 내용들은 대개 완전한 또는 부분적인 문서 화상일 수 있다. 또한, 변경될 수 있는 데이터가 종종 요구되며, 다양한 정보 유형들이 문서 화상에 대해 요구된다.
그러나, 일본 특개평 제8-204950호에서는, 래스터 화상만이 가변 해상도를 가질 수 있다. 벡터 화상, 텍스트 영역의 문자 인식 결과 등은 관리되지 않는다. 또한, 일본 특개평 제2003-348326호에서는, 그것의 출력 목적지가 PDA로 한정되고, 변경될 오브젝트는 래스터 화상만이며, 벡터 화상 및 문자 인식 결과는 지원되지 않는다.
문서에 함께 포함되어 있는 사진, 텍스트, 표, 및 선화가 각각 분석되고 오브젝트들의 속성들에 따른 화상 처리를 적용하여 문서가 출력되어야 하는 다수 상황들이 존재할 수 있다. 일본 특개평 제2000-306103호의 기술은, 상술한 바와 같 이, 문서 화상을 용이하게 재사용 할 수 있는 포맷으로 보유한다. 그러나, 각 영역의 한가지 정보 유형만이 다른 장치 또는 애플리케이션으로 출력된다.
이 영역들은 영역들의 각각의 속성들마다 화상들을 관리한다. 그러나, 상술한 바와 같이, 영역들은, 그들이 동일한 속성을 가지고 있음에도 불구하고, 다양한 특징들을 가진다. 동일한 속성을 가지고 있기 때문에 동일한 정보 유형들이 제공되는 경우라 하더라도, 정보는 종종 만족스럽게 전달될 수 없다.
또한, 문서의 각각의 오브젝트들에 대해서, 문서의 출력 모드, 오브젝트들의 내용들 등에 따라 데이터 포맷들 또는 데이터 자체를 대체하여, 문서를 출력하는 것은 가능하지 않다.
본 발명의 제1 양태는, 메모리에 저장되어 있는 문서 화상의 출력 목적지에 대한 정보를 취득하는 단계; 출력 목적지의 정보 및 문서 화상 내의 각각의 영역들의 속성들에 기초하여 각각의 영역들에 대해 출력되어야 할 출력 정보의 유형들을 판정하는 단계; 각각의 영역들에 대해 출력되어야 할 유형들의 출력 정보들을 취득하는 단계; 각각의 영역들에 대해 취득된 출력 정보들을 문서 화상으로 통합하는 단계; 및 통합된 문서 화상을 출력 목적지로 출력하는 단계를 구비하는 화상 처리 방법을 개시한다.
본 발명의 제2 양태는, 메모리에 저장되어 있는 문서 화상의 출력 목적지에 대한 정보를 취득하도록 구성되어 있는 제1 취득기; 출력 목적지의 정보 및 문서 화상 내의 각각의 영역들의 속성들에 기초하여 각각의 영역들에 대해 출력되어야 할 출력 정보의 유형들을 판정하도록 구성되어 있는 판정기; 각각의 영역들에 대해 출력되어야 할 유형들의 출력 정보들을 취득하도록 구성되어 있는 제2 취득기; 각각의 영역들에 대해 취득된 출력 정보들을 문서 화상으로 통합하도록 구성되어 있는 통합기; 및 통합된 문서 화상을 출력 목적지로 출력하도록 구성되어 있는 출력부를 구비하는 화상 처리 장치를 개시한다.
본 발명에 따르면, 문서 화상의 각 영역에 대한 출력 정보의 출력 시에, 그것의 출력 목적지에 따른 유형의 출력 정보가 출력될 수 있다.
첨부된 도면들을 참조하는 예시적 실시예들에 다음의 상세한 설명으로부터, 본 발명의 추가 특징들이 명백해 질 것이다.
<실시예들의 설명>
이하에서는, 첨부 도면들을 참조하여, 본 발명의 바람직한 실시예들에 따른 화상 처리 장치 및 그 방법이 상세하게 설명될 것이다.
<제1 실시예>
[장치의 구성]
도 1은 본 실시예에 따른 화상 처리 장치의 구성을 도시하는 블록도이다.
CPU(101)는 ROM(102)에 저장되어 있는 제어 프로그램들에 따라 RAM(103)을 작업 메모리로 사용해 전체 장치를 제어한다. ROM(102)은 CPU(101)에 의해 실행될 (후술될) 제어 프로그램들 등을 저장한다. RAM(103) 및 자기 디스크 등과 같은 HDD(104)는 (후술될) 처리 프로그램들, 문서 화상들 등을 저장한다.
스캐너(108)는 범용 인터페이스(예를 들어, 도시되지 않은 USB 또는 IEEE1394)를 통해 화상 처리 장치에 접속되어 있다. 스캐너(108)는, CPU(101)의 제어에 따라, 지면상에 인쇄된 원문의 화상을 스캐닝하여 문서 화상을 출력한다. CPU(101)는 디스플레이(105)에 사용자 인터페이스를 디스플레이하고, 예를 들어, USB 등과 같은 인터페이스를 통해 접속되어 있는, 키보드(106) 또는 마우스 등과 같은 포인팅 장치(107)로부터 사용자의 명령들을 입력한다.
화상 처리 장치는 네트워크 인터페이스(I/F;109)를 통해 LAN(local area network) 등과 같은 네트워크(110)에 접속되어 있다. 화상 처리 장치는 데이터 및 프로그램들을 교환하기 위해 네트워크상의 다른 장치(서버들, 컴퓨터들, 프린터들, 스캐너들, MFP들 등)와 통신한다.
또한, 화상 처리 장치는 범용 컴퓨터에 의해서도 구현될 수 있다. 그런 경우에, 화상 처리 장치는 네트워크(110) 또는 저장 매체들을 통해 제공되는 제어 프로그램들 및 처리 프로그램들을 HDD(104)에 저장한다. 그 다음, 이들 프로그램들은 사용자 등의 명령들에 따라 CPU(101)에 의해 실행될 수 있다.
[등록 처리]
도 2는 화상 처리 장치에 데이터를 등록하기 위한 처리를 도시하는 흐름도이다. 이 처리는 사용자 등의 명령들에 기초해 CPU(101)에 의해 실행된다.
등록될 문서 화상이 스캐너(108) 또는 네트워크(110)로부터 입력되고(S201), 텍스트, 사진, 표, 선화 등과 같은 속성들을 가진 영역들로 분할된다(S202). 문서 정보가 분할된 각 영역에 대해 생성된다(S203). 문서 정보는 관심있는 영역의 속성 정보, 페이지상의 위치 좌표들 등을 나타내는 레이아웃 정보, 영역 정보 등을 포함한다. 영역 정보는, 텍스트 속성의 분할 영역인 경우, 문자 코드 스트링, 문단들, 제목 등과 같은 문서의 논리 구조 등을 포함한다.
다음으로, 분할된 각 영역은 출력 정보로 변환된다(S204). 본 실시예에서는, 다른 장치, 다른 애플리케이션 등으로 출력되어야 할 정보(전달될 정보)를 출력 정보라고 한다. 출력 정보는 렌더링을 위해 필요한 정보이고, 텍스트 속성을 갖는 분할 영역인 경우, 예를 들어, 다음과 같은 정보, 즉, 해상도-가변 래스터 화상, 벡터 화상, 흑백 화상 또는 컬러 화상, 출력 정보 각각의 파일 사이즈, 문자 인식 결과로서의 텍스트, 각각의 문자들의 위치와 폰트명 또는 폰트형, 문자 인식의 신뢰도 등을 포함한다.
출력 정보의 출력시에, 영역들의 속성들에 대한 특징들 및 사용자의 사용 조건들을 고려하여 다음과 같은 출력 모드들, 즉, 컬러 인쇄, (고품질 화상의) 컬러 인쇄, 흑백 인쇄, (고품질 화상의) 흑백 인쇄, 모니터 디스플레이, PDA 디스플레이, 확대 디스플레이, 초확대(ultra enlarged) 디스플레이 및 변경을 포함하는 출력 모드들의 9가지 패턴들 및 사용자에 의해 설정되는 수동 출력 모드가 준비된다.
도 3은 출력 모드들의 10가지 패턴들과 영역 속성들에 기초해 선택될 출력 정보간의 관계를 도시한다. 이 관계는, 예를 들어, HDD(104) 등에 표로서 저장되어 있다.
상기 모드들 모두가 각 영역의 출력 정보로서 준비될 필요는 없으며, 빈번하게 사용될 것으로 예상되는 모드들이 준비될 수 있다. 이 경우, 출력 정보를 저장하는 메모리가 절감될 수 있다. 예를 들어, 도 3에서, 아주 낮은 사용 빈도를 가 질 수 있는 "PDA 디스플레이 - 배경" 통합을 위한 출력 정보는 디폴트로서 준비되어 있지 않다. 마찬가지로, "초확대 디스플레이 - (높은 인식 신뢰도의) 텍스트", "초확대 디스플레이 - (낮은 인식 신뢰도의) 텍스트", 및 "초확대 디스플레이 - 선화"의 통합들 각각을 위한 출력 정보도 디폴트로서 준비되어 있지 않다. 또한, 수동 출력 모드에서의 영역 속성들과 출력 정보 사이의 관계는 사용자 인터페이스, 키보드(106), 및 포인팅 장치(107)를 이용해 사용자에 의해 설정된다.
다음의 설명에서, 흑백 인쇄 및 모니터 디스플레이는 기본 출력 모드(기본 패턴들이라고 불림)로서 사용되고, 다른 출력 모드들(응용 패턴들이라고 불림)은 기본 패턴들보다 낮은 사용 빈도를 가진다. 따라서, 다음과 같이, 기본 패턴들 각각에 대한 출력 정보만이 준비되어 있는 경우가 설명될 것이다.
흑백 인쇄 모니터 디스플레이
텍스트 영역 래스터 화상 래스터 화상
사진 영역 그레이 스케일 래스터 화상 저해상도 래스터 화상
선화 영역 래스터 화상 래스터 화상
표 영역 래스터 화상 저해상도 래스터 화상
다음으로는, 분할된 각각의 영역들의 문서 정보와 출력 정보를 연관짓고 트리 구조로 설명되는 구조화 문서가 생성된다(S205). 마지막으로, 생성된 데이터 그룹(분할된 각각의 영역들의 문서 정보와 출력 정보 및 구조화 문서)은 HDD(104) 등에 보존(등록)된다(S206). 데이터 그룹의 보존 목적지는 네트워크(110) 상의 서버일 수 있다.
앞서 언급된 등록 처리가 도 4에 도시된 컬러 문서 화상에 적용되는 경우가 후술될 것이다.
블랙 픽셀 클러스터들 및 화이트 픽셀 클러스터들의 세트들이 도 4에 도시된 문서 화상으로부터 추출되고, 텍스트, 사진, 드로잉(drawing), 표, 프레임, 및 선화와 같은 속성들을 가진 영역들이 그들의 형태들, 사이즈들, 설정 상태들 등과 같은 특징량들(feature amounts)에 기초해 추출된다. 도 4에 도시된 일례에서는, 텍스트 속성 영역들(301, 303, 및 306), 컬러 사진 속성 영역들(302), 드로잉 속성 영역(304), 및 표 속성 영역(305)이 분할된다. 로고형의 분할 영역(301)은 일반적 폰트들과는 상이한 문자 모드를 가지고 있으므로, 문자 인식 결과의 낮은 신뢰도를 가진다고 가정한다. 또한, 분할 영역(306)의 문자들은 분할 영역(303)의 문자들보다 상당히 작다.
도 5는 분할된 각 영역의 문서 정보를 출력 정보와 연관짓는 정보를 예시하는 도면이다.
다시 말해, 소정 분할 영역의 문서 정보(401)는 단계 S204에서 취득된 그 영역의 2가지 출력 정보들(402 및 403)을 보유한다. 이러한 트리 구조는 각각의 분할 영역들 사이의 관계를 계층 구조로 표현할 수 있다. 문서 정보가 출력 정보의 복수 유형들을 보유할 수 있다는 것에 주의한다.
연관된 정보의 이러한 부분들은 XML에 의해 표현되는 구조화 문서의 포맷으로 생성되고 보존된다.
[출력 정보의 출력]
도 6은 출력 정보를 출력하기 위한 출력 처리를 도시하는 흐름도이다. 이 처리는 사용자 등의 명령들에 기초해 CPU(101)에 의해 실행된다.
사용자에 의해 지정된 등록 데이터가 HDD(104) 등으로부터 판독되고(S501), 그것에 대한 출력 목적지의 장치 정보가 취득된다(S502). 그 다음, 분할된 각 영역에 대해 출력되어야 할 출력 정보 유형이 출력 목적지에 따라 판정된 출력 모드에 맞춰 설정된다(S503). 이러한 설정 처리의 세부 사항들은 후술될 것이다.
설정된 유형의 출력 정보가 분할된 각 영역의 출력 정보로서 이용 가능한지가 점검된다(S504). 데이터 등록시에, 기본 패턴 각각의 출력 정보가 준비된다. 따라서, 기본 패턴들(흑백 인쇄 및 모니터 디스플레이)을 위한 출력 정보들은 항상 이용 가능하다. 한편, 낮은 사용 빈도를 가진 응용 패턴 각각의 출력 정보는, 그것이 기본 패턴과 동일한 유형의 출력 정보라면 이용 가능하다. 그러나, 기본 패턴과 상이한 유형의 출력 정보는 이용 불가능하다. 따라서, 설정된 유형의 출력 정보가 이용 가능한지가 점검된다. 그러한 출력 정보가 이용 가능하다면, 흐름은 단계 S513으로 건너뛰고, 그렇지 않다면, 흐름은 단계 S505로 분기한다.
설정된 유형의 출력 정보가 이용 가능하다면, 그 출력 정보가 추출되고(S513), 각각의 영역들에 대한 출력 정보들이 통합된다(S514). 통합된 출력 정보는 출력 목적지로 출력된다(S515).
한편, 설정된 유형의 출력 정보가 이용 불가능하다면, 기존의 출력 정보가 설정 유형의 출력 정보로 변환될 수 있는지가 점검된다(S505). 변환될 수 있는 출력 정보가 이용 가능하다면, 흐름은 단계 S506으로 분기하고; 그렇지 않다면, 흐름은 단계 S508로 분기한다.
도 7은 기존의 출력 정보로부터 변환될 수 있는 출력 정보 유형들을 도시한다. 도 7에서, ○ 마크들은 변환이 가능하다는 것을 나타내고, × 마크들은 변환 이 불가능하다는 것을 나타낸다. 그러한 정보는 HDD(104) 등에 표로서 저장된다.
예를 들어, 확대 디스플레이가 수행되어야 하지만 확대 디스플레이에 적합한 벡터 화상이 이용 불가능하다면, 벡터 화상으로 변환될 수 있는 기존의 출력 정보가 이용 가능한지 여부가 점검된다. 래스터 화상이 출력 정보로서 이용 가능하다면, 그것은 벡터 화상으로 변환될 수 있고, 흐름은 단계 S506으로 분기한다. 한편, 도 4에 도시된 컬러 원본 문서를 흑백-복사하는 것에 의해 취득되는 문서의 디지털 화상(도 8)이 등록되고 출력 모드가 컬러 인쇄인 경우, 분할 영역(302')을 컬러-인쇄하는데 필요한 출력 정보가 요구된다. 따라서, 컬러 인쇄에 적합한 컬러 래스터 화상으로 변환될 수 있는 출력 정보가 흑백 사진 속성의 분할 영역(302')을 위한 출력 정보로서 이용 가능한지 여부가 점검된다. 이 경우, 도 7에 도시된 바와 같이, 흑백 래스터 화상을 컬러 래스터 화상으로 변환하는 것은 불가능하므로, 흐름은 단계 S508로 분기한다.
변환에 사용될 수 있는 기존의 출력 정보가 이용 가능하다면, 그러한 변환 정보는 설정된 유형의 출력 정보로 변환된다(S506). 변환에 의해 취득되는 출력 정보(변환 정보)는 데이터 등록시에 생성된 분할 영역들에 대한 문서 정보와 출력 정보의 연관 정보에 부가된다(S507). 그 다음, 각각의 영역들에 대한 출력 정보들은 통합되고(S514), 통합된 출력 정보는 출력 목적지로 출력된다(S515).
변환에 사용될 수 있는 기존의 출력 정보가 이용 불가능하다면, 분할 영역의 출력 정보를 검색 키로서 사용해, 출력 모드에 적합한 출력 정보(대체 정보;alternative information)가 HDD(104) 또는 서버로부터 검색된다(S508). 검색 적중(hit)이 점검된다(S509). 검색이 적중하면, 흐름은 단계 S510으로 진행하고, 그렇지 않다면, 흐름은 단계 S511로 진행한다. 이러한 검색으로써, 예를 들어, 흑백 사진 속성의 분할 영역이 컬러-인쇄되어야 할 경우, 그 영역의 출력 정보(흑백 화상)를 검색 키로서 사용해, 유사한 컬러 화상이 검색된다. 이 처리의 세부 사항들은 생략될 것이다. 간략하게, 화상 각도의 변화, 오브젝트 위치의 변화, 및 촬영 조건들로 인한 화상 특징량들의 소정 차이들을 흡수하는 것에 의해 약간의 불명료함을 남기기는 하지만, 유사한 화상 검색이 적절하게 수행될 수 있다. 일본 특개평 제10-260983호 등에서 설명된 기술은 유사한 화상 검색의 실례로서 이용 가능하다.
대체 정보가 검색되지 않으면, 분할 영역의 출력 정보에 적합한 출력 정보가 이용 불가능하다는 것을 나타내는 메시지 및 사용자에게 기존 출력 정보의 사용 또는 출력의 취소를 선택할 것을 촉구하는 메시지가 디스플레이(105)상에 디스플레이된다(S511). 단계 S512에서의 판정 결과에 기초하여 사용자가 출력 취소 명령을 입력하면, 처리는 종료하고, 기존의 출력 정보를 사용하라는 명령을 입력하면, 흐름은 단계 S513으로 진행한다.
대체 정보가 검색될 수 있다면, 그 정보가 취득되고(S510), 그 정보는 데이터 등록시에 생성된 분할 영역들에 대한 문서 정보와 출력 정보의 연관 정보에 부가된다(S507). 그 다음, 각각의 영역들에 대한 출력 정보들이 통합되고(S514), 통합된 출력 정보는 출력 목적지로 출력된다(S515).
도 6에 도시되지는 않았지만, 단계들(S504 내지 S513)의 프로세스들은 각각 의 분할 영역들에 대해 반복적으로 실행된다.
[출력 정보의 설정]
분할된 각 영역의 출력 정보를 설정하는 것에 관한 처리(S503)가 후술될 것이다. 설정 기준들로서, 분할 영역의 속성과 함께, 생성된 출력 정보 자체의 특징이 고려된다. 출력 정보의 설정이 기본 패턴들, 응용 패턴들 등과 같은 각 패턴에 대해 후술될 것이다.
기본 패턴으로서의 흑백 인쇄의 경우, 취득될 출력 정보는 원래의 사본에 충실하며 높은 해상도를 가진다. 따라서, 래스터 화상이 분할된 각 영역의 출력 정보로서 설정된다.
도 4에 도시된 원래 화상을 일례로서 취한다면, 각각의 분할 영역들로서 제공되는 출력 정보들은 다음과 같다.
텍스트 영역(301) 래스터 화상
사진 영역(302) 고해상도 래스터 화상
텍스트 영역(303) 래스터 화상
드로잉 영역(304) 래스터 화상
표 영역(305) 래스터 화상
텍스트 영역(306) 래스터 화상
기본 패턴으로서의 모니터 디스플레이의 경우, 인쇄를 위한 해상도만큼의 높은 해상도는 불필요하지만, 모니터에서 선명하게 시청되는 출력 정보가 요구된다. 문자 정보가 텍스트로서 핸들링되어야 하는 경우를 고려하여, 출력 정보는 분할 영역의 문자 인식에 대한 신뢰도에 기초해 설정된다.
도 9는 모니터 디스플레이의 경우에서 출력 정보 설정 처리(S503)을 설명하기 위한 흐름도이다. 이 처리는 CPU(101)에 의해 실행된다.
관심있는 분할 영역(이하에서 관심 영역이라고 함)의 속성이 텍스트인지가 점검된다(S601). 관심 영역이 텍스트 속성을 가진다면, 관심 영역과 연관된 출력 정보에 기초하여 문자 인식의 신뢰도가 소정 값(X%) 이상인지가 점검된다(S602).
텍스트 속성 이외의 속성 영역 및 X% 미만의 문자 인식 신뢰도를 가진 텍스트 속성의 영역에 대해, 저해상도 래스터 화상이 설정된다(S603). X% 이상의 문자 인식 신뢰도를 가진 텍스트 속성 영역에 대해서는, 문자 인식 결과의 텍스트가 설정된다(S604).
출력 정보 유형들이 문서 화상의 모든 분할 영역들에 대해 설정되었는지가 점검된다(S605). 설정될 분할 영역이 여전히 남아 있다면, 흐름은 단계 S601로 복귀하고, 그렇지 않다면, 처리는 종료한다(흐름은 도 6에 도시된 단계 S504로 진행한다).
도 9에 도시된 처리의 실행에 의해, 도 4에 도시된 문서 화상의 분할 영역 각각에 제공되는 출력 정보는 다음과 같다.
텍스트 영역(301) 저해상도 래스터 화상(낮은 신뢰도)
사진 영역(302) 저해상도 래스터 화상
텍스트 영역(303) 텍스트(높은 신뢰도)
드로잉 영역(304) 저해상도 래스터 화상
표 영역(305) 저해상도 래스터 화상
텍스트 영역(306) 텍스트(높은 신뢰도)
응용 패턴들(컬러 인쇄, 고품질 화상의 인쇄, PDA 디스플레이, 확대 디스플레이, 초확대 디스플레이, 및 변경)에 대한 출력 정보의 설정 처리가 후술될 것이다.
컬러 인쇄의 경우, 흑백 인쇄에 의해 정의된 조건들 이외에 컬러 정보가 요 구된다. 고품질 화상 인쇄의 경우, 흑백 인쇄 및 컬러 인쇄에 의해 정의된 조건들보다 높은 해상도를 가진 래스터 화상이 요구된다. PDA 디스플레이의 경우, PDA는 한정된 메모리 사이즈를 가지므로, 작은 데이터 사이즈를 가지며 높은 처리 속도를 허용하는 출력 정보가 우선적으로 설정된다.
도 10은 PDA 디스플레이 경우에서의 출력 정보 설정 처리(S503)을 설명하기 위한 흐름도이다. 이 처리는 CPU(101)에 의해 실행된다.
관심있는 분할 영역의 속성이 텍스트인지가 점검된다(S701). 관심 영역이 텍스트 속성을 가진다면, 관심 영역과 연관된 출력 정보에 기초하여 문자 인식의 신뢰도가 소정 값(X%) 이상인지가 점검된다(S703). X% 이상의 문자 인식 신뢰도를 가진 텍스트 속성 영역에 대해서는, 문자 인식 결과의 텍스트가 설정된다(S707).
관심 영역이 텍스트 속성 이외의 속성을 가진다면, 관심 영역의 속성이 사진인지가 점검된다(S702). 관심 영역이 사진 속성을 가지면, 저해상도 래스터 화상이 설정된다(S705).
관심 영역이 텍스트 속성도 사진 속성도 갖지 않거나 텍스트 속성의 관심 영역에 대한 문자 인식 신뢰도가 X% 미만이라면, 관심 영역과 연관된 출력 정보에 기초하여 래스터 화상의 파일 사이즈가 Y 바이트 이하인지가 점검된다(S704). 파일 사이즈가 Y 바이트 이하인 래스터 화상이 PDA 디스플레이에 적합하므로, 이 경우에는 저해상도 래스터 화상이 설정된다(S705). 래스터 화상의 파일 사이즈가 Y 바이트를 초과하면, 그러한 래스터 화상은 PDA 디스플레이에 부적합하므로, 벡터 화상이 설정된다(S706).
문서 화상의 모든 분할 영역들에 대해 출력 정보의 유형들이 설정되었는지가 점검된다(S708). 설정될 분할 영역들이 여전히 남아 있다면, 흐름은 단계 S701로 복귀하고, 그렇지 않다면, 처리는 종료한다(흐름은 도 6에 도시된 단계 S504로 진행한다).
도 10에 도시된 처리의 실행에 의해, 도 4에 도시된 문서 화상의 분할 영역 각각에 제공되는 출력 정보는 다음과 같다.
텍스트 영역(301) 벡터 화상(낮은 신뢰도 및 Y 바이트 이상의 데이터 사이즈)
사진 영역(302) 저해상도 래스터 화상
텍스트 영역(303) 텍스트(높은 신뢰도)
드로잉 영역(304) 벡터 화상(Y 바이트 이상의 데이터 사이즈)
표 영역(305) 저해상도 래스터 화상
텍스트 영역(306) 텍스트(높은 신뢰도)
다음으로, 확대 디스플레이의 경우, 원래의 사본에 충실하며 확대 이후라 하더라도 품질 저하되지 않는 출력 정보가 설정된다. 확대될 복수의 영역들이 존재할 수 있거나 영역의 일부가 확대될 수도 있다는 것에 주의한다.
도 11은 확대 디스플레이 경우에서의 출력 정보 설정 처리(S503)을 설명하기 위한 흐름도이다. 이 처리는 CPU(101)에 의해 실행된다.
문서 화상의 확대될 분할 영역이 선택된다(S801). 이 경우, 영역은 속성들에 걸쳐 설정될 수도 있다.
관심 영역의 속성이 사진인지가 점검된다(S802). 관심 영역이 사진 속성을 가진다면, 고해상도 래스터 화상이 설정된다(S804). 관심 영역이 사진 속성 이외의 속성을 가진다면, 벡터 화상이 설정된다(S803). 출력 정보의 유형들이 디지털 화상의 모든 분할 영역들에 대해 설정되었는지가 점검된다(S805). 설정될 분할 영 역이 여전히 남아 있다면, 흐름은 단계 S801로 복귀하고, 그렇지 않다면, 처리는 종료한다(흐름은 도 6에 도시된 단계 S504로 진행한다).
도 11에 도시된 처리가 도 4에 도시된 분할 영역들(302 및 305)의 일부(도 12에 도시된 영역(901)) 확대에 대해 실행될 경우, 도 12에 도시된 확대 영역(901)에 제공되는 출력 정보는 다음과 같다.
사진 영역(302) 고해상도 래스터 화상
표 영역(305) 벡터 화상
다음으로, 초확대 디스플레이의 경우, 상술된 확대 디스플레이보다 큰 확대 이후라 하더라도 품질 저하되지 않는 출력 정보가 요구된다.
도 13은 초확대 디스플레이 경우에서의 출력 정보 설정 처리(S503)을 설명하기 위한 흐름도이다. 이 처리는 CPU(101)에 의해 실행된다. 도 11에 도시된 확대 디스플레이의 경우, 사진 속성 영역의 확대 디스플레이에 대해, 고해상도 래스터 화상이 설정된다(S804). 그러나, 도 13에 도시된 초확대 디스플레이의 경우, 사진 속성 영역의 초확대 디스플레이에 대해 초고해상도(ultra high-resolution) 래스터 화상이 설정된다(S1001). 초확대 디스플레이는 이 처리에서 확대 디스플레이와 상이하지만, 다른 처리에서는 확대 디스플레이 처리와 동일하다.
도 13에 도시된 처리가 도 4에 도시된 분할 영역들(302 및 305)의 일부(도 12에 도시된 영역(901))에 대한 초확대에 대해 실행될 경우, 도 12에 도시된 초확대 영역(901)에 제공되는 출력 정보는 다음과 같다.
사진 영역(302) 초고해상도 래스터 화상
표 영역(305) 벡터 화상
상기 설명에서, 출력 정보는 각각의 패턴에 대해 자동적으로 설정된다. 그 러나, 그러한 자동 설정으로는, 사용자가 원하는 출력 정보를 빈번하게 취득할 수 없다. 따라서, 도 3에 도시된 바와 같이, 사용자로 하여금 각 영역 속성에 대응되는 출력 모드 및 출력 정보를 판정할 수 있게 하는 수동 모드가 준비된다. 예를 들어, 사용자는 문자 인식 결과의 텍스트를 도 4에 도시된 디지털 화상의 표 영역(305)에 대한 출력 정보로서 설정할 수 있다. 또한, 사용자는 수동 모드에서, 상술된 5가지 상이한 설정 방법들과 유사한 템플릿들을 생성할 수도 있다.
[변환 정보(대체 정보)의 연관]
다음에서는, 변환 정보(대체 정보)를 연관짓기 위한 처리(S507)가 설명될 것이다.
도 14는, 분할된 각 영역의 문서 정보와 출력 정보를 연관짓는 정보를 예시하는 도면이다.
소정 분할 영역의 문서 정보(1101)는 그 영역의 출력 정보(1102;데이터 등록시에 생성된 기존의 출력 정보)를 보유한다. 새로운 출력 정보가 단계 S506 또는 S510에서 취득될 경우, 출력 정보(1103;새로운 출력 정보)가 추가된다. 물론, 그러한 추가는, 새롭게 취득된 출력 정보(1103)가 장차 재사용될 가능성이 크거나 출력 정보를 저장하는 메모리가 충분한 여유를 가질 경우로 한정될 수도 있다. 도 14에 도시된 바와 같이, 출력 정보가 추가되면, 출력 정보(1103)가 다시 요구될 때, 출력 정보(1103)는 즉각적으로 사용될 수 있다.
<제2 실시예>
이하에서는, 본 발명의 제2 실시예에 따른 화상 처리 장치 및 그것에 관한 방법이 설명될 것이다. 제2 실시예의 동일한 참조 번호들은 제1 실시예에서와 동일한 부분들을 나타내므로, 그것에 관한 상세한 설명은 생략될 것이다.
[등록 처리]
도 15는 화상 처리 장치에 데이터를 등록하기 위한 처리를 도시하는 흐름도이다. 이 처리는 사용자 등의 명령들에 기초해 CPU(101)에 의해 실행된다. 데이터 등록은, 스캐너(108) 또는 네트워크 I/F(109)를 통해 판독된 문서 화상을 처리하고 처리된 문서 화상을 RAM(103) 또는 HDD(104)에 저장하는 처리를 나타낸다.
등록될 문서 화상이 스캐너(108) 또는 네트워크(110)로부터 입력되어(S1101), 텍스트, 사진, 표, 선화 등과 같은 속성들을 가진 영역들로 분할된다(S1102). 그 다음, 분할 영역들 중 하나가 선택된다(S1103).
선택된 분할 영역의 문서 정보가 생성된다(S1104).
선택된 분할 영역의 문서 정보는 출력 정보로 변환된다(S1105).
예를 들어, 문서의 소정 분할 영역은 대체로 상표명들 또는 저작권들의 제한이 있는 사진, 기밀 정보를 포함하는 텍스트 등을 포함한다. 그러한 경우, 동일한 데이터 포맷을 갖지만 상이한 디스플레이 내용들을 가진 출력 정보가 준비될 수 있다. 다시 말해, 문서 정보를 그대로 렌더링하여 취득되는 출력 정보와, 그 분할 영역에 모자이크, 블랙 아웃 등과 같은, 시각적으로 볼 수 없게 하는 처리를 한 출력 정보의 통합이 준비된다. 다른 방법으로는, 유사한 내용들을 가진, 저작권의 제한이 없는 사진과 같은, 문제점을 제기하지 않는 다른 정보가 네트워크(110)상의 데이터베이스로부터 취득될 수도 있고, 하나의 출력 정보로서 추가될 수도 있다.
다음에서는, 도 4에 도시된 문서의 사진 영역이 저작권 보호되는 사진(copyrighted photo)을 포함하고 다음과 같은 출력 정보의 3개 부분들: (1) 원래대로의 문서 정보를 렌더링하는 것에 의해 취득되는 출력 정보, (2) 모자이크 처리가 적용되는 출력 정보, 및 (3) 저작권의 제한이 없는 유사 사진을 가진 출력 정보가 준비되는 일례가 설명될 것이다. 도 16은 도 4에 도시된 문서 화상에 기초해 상기 처리에 의해 생성되는 출력 정보의 일례를 나타낸다.
도 17A 내지 도 17C는 사진 영역(302)의 출력 정보 그룹의 일례들을 도시한다. 도 17A는 원래대로의 문서 화상을 렌더링하는 것에 의해 취득되는 사진을 도시하고, 도 17B는 도 17A에 도시된 사진에 모자이크 변경을 적용하는 것에 의해 취득되는 사진을 도시하며, 도 17C는 도 17A에 도시된 것과 유사한, 저작권의 제한이 없는 사진이다.
다음으로는, 사용 권한 정보가 문서 정보 및 출력 정보에 첨부된다(S1106). 사용 권한 정보의 세부 사항들이 후술될 것이다.
분할 영역의 문서 정보와 출력 정보를 연관어 트리 구조로 기술하는 구조화 문서가 생성된다(S1107). 분할된 각 영역의 문서 정보와 출력 정보간의 연관은 앞서 도 5를 사용해 설명된 것과 같다.
모든 분할 영역에 대한 처리가 완결되었는지가 점검된다(S1108). 단계들(S1103 내지 S1107)의 처리들은, 모든 분할 영역에 대한 처리가 완결될 때까지 반복된다.
마지막으로, 생성된 데이터 그룹(분할된 각 영역의 문서 정보와 출력 정보 및 구조화 문서)은 HDD(104) 등에 저장(등록)된다(S1109). 데이터 그룹의 저장 목적지는 네트워크(110)상의 서버일 수도 있다.
[사용 권한 정보]
도 18은 소정 분할 영역의 문서 정보, 출력 정보, 및 사용 권한 정보 사이의 관계에 대한 일례를 도시한다.
사용 권한 정보는 사용 권한들의 2가지 유형들, 즉, 출력 정보의 사용 목적 각각에 대해 설정되는 출력 모드-의존적 사용 권한 및 출력 정보의 내용 각각에 대해 설정되는 내용-의존적 사용 권한을 포함한다. 하나의 분할 영역은 하나의 문서 정보(501) 및 출력 정보의 복수의 부분들(503 내지 505)을 포함한다. 사용 권한 정보 중 하나로서의 출력 모드-의존적 사용 권한(502)은 문서 정보(501)에 대해 설정되고, 내용-의존적 사용 권한들(506 내지 508)은 출력 정보의 각각의 부분들(503 내지 505)에 대해 설정된다.
출력 모드-의존적 사용 권한은 그 분할 영역에 포함되어 있는 출력 정보의 모든 부분들에 영향을 미치고, 내용-의존적 사용 권한은 대응되는 출력 정보에 영향을 미친다. 다시 말해, 도 18에서, 출력 모드-의존적 사용 권한(502)는 출력 정보의 3개 부분들(503 내지 505)에 영향을 미치고, 내용-의존적 사용 권한(506)는 출력 정보(503)에만 영향을 미친다.
도 19A 및 도 19B는 출력 모드-의존적 사용 권한(502)을 나타내는 표들의 일례들을 도시한다. 이 표는 각각의 분할 영역에 대해 보유된다. 다시 말해, 출력 모드-의존적 사용 권한(502)은 사용자의 사용 권한 레벨에 따라 이용 가능한 출력 모드들을 한정한다. 예를 들어, 도 19A에서, 사용 권한 레벨 1의 사용자는 모든 출력 모드들을 선택할 수 있지만, 사용 권한 레벨 3의 사용자가 선택할 수 있는 출력들은 흑백 인쇄, 모니터 디스플레이, 및 확대 디스플레이로 한정된다.
각각의 분할 영역들에 대해 상이한 출력 모드-의존적 사용 권한들(502)이 이용 가능하므로, 표 내용들은, 도 19A 및 도 19B에 도시된 바와 같이, 각각의 분할 영역들에 대해 상이하다. 그러한 표를 모드-의존적 사용 권한(502)으로 보유하는 것에 의해, 분할 영역의 출력은 문서 화상에 포함되어 있는 기밀 정보, 개인 정보, 저작권 보호형 사진 등에 대해 사용 권한 레벨에 따라 한정될 수 있다.
도 20A 내지 도 20D는 내용-의존적 사용 권한들을 나타내는 표들의 일례들을 도시한다. 이 표는 각각의 출력 정보에 대해 보유된다. 다시 말해, 내용-의존적 사용 권한은 사용자의 사용 권한 레벨에 따라 대응되는 출력 정보 자체가 사용될 수 있는지의 여부를 판정한다. 예를 들어, 저작권 보호형 출력 정보 및 저작권의 제한이 없는 출력 정보가 소정 분할 영역에 준비되어 있다. 그 다음에는, 다음과 같은 사용이 허용된다. 다시 말해, 저작권 보호형 출력 정보는 유료 회원 자격의 멤버(사용자)에 의해 사용되도록 허용되고, 저작권의 제한이 없는 출력 정보는 무료 회원 자격의 멤버(사용자)에게 제공된다.
다시 말해, 출력 모드-의존적 사용 권한과 내용-의존적 사용 권한을 통합하는 것에 의해, 도 4에 도시된 사진 영역(302)에 대해 다음과 같은 사용 제한들이 설정될 수 있다. 도 19A에 도시된 출력 모드-의존적 사용 권한이 사진 영역(302)에 대해 설정된다. 도 20A에 도시된 내용-의존적 사용 권한이 도 17A(원래 화상) 에 대응되는 출력 정보에 대해 설정되고, 도 20B에 도시된 내용-의존적 사용 권한이 도 17B(모자이크 화상)에 대응되는 출력 정보에 대해 설정되며, 도 20C에 도시된 내용-의존적 사용 권한이 도 17C(저작권의 제한이 없는 화상)에 대응되는 출력 정보에 대해 설정된다. 이런 식으로, 사용 권한 레벨 1의 사용자는 원래 화상의 컬러 또는 흑백 인쇄, 디스플레이, 변경 등과 같은 모든 출력 모드들을 선택할 수 있다. 사용 권한 레벨 2의 사용자는 모자이크 화상의 (고품질 화상을 제외한) 컬러 또는 흑백 인쇄 및 (PDA 디스플레이를 제외한) 디스플레이를 선택할 수 있다. 사용 권한 레벨 3의 사용자는 저작권으로부터 자유로운 화상의 흑백 인쇄, 모니터 디스플레이, 및 확대 디스플레이를 선택할 수 있다.
도 4에 도시된 사진 영역(302)을 제외한 분할 영역들에 대해서는, 도 19B에 도시된 출력 모드-의존적 사용 권한이 설정되고 도 20D에 도시된 내용-의존적 사용 권한이 출력 정보의 각각의 부분들에 대해 설정된다. 따라서, 사용자의 사용 권한 레벨에 상관없이, 사진 영역(302)을 제외한 분할 영역들에 대해 모든 출력 모드들이 이용 가능하다.
[출력 정보의 출력]
다음에서는, 출력 정보의 출력 처리가 설명될 것이다. 출력 정보의 출력 처리는, (이하, "등록 데이터"로서 언급될) RAM(103) 또는 HDD(104)에 등록된, 분할된 각각의 영역들의 문서 정보와 출력 정보 및 구조화 문서를 디스플레이(105), (도시되지 않은) 프린터 또는 PDA 등과 같은 출력 장치들로 출력하기 위한 처리를 나타낸다.
도 21은 출력 정보를 출력하기 위한 처리를 도시하는 흐름도이다. 이 처리는 사용자 등의 명령들에 따라 CPU(101)에 의해 실행된다.
사용자의 사용 권한 레벨이 취득된다(S1301). 이 레벨은, 예를 들어, 키보드(106)를 통해 입력된 사용자 정보에 기초해 네트워크(110)상의 서버로부터 취득될 수 있다.
등록 데이터가 열리고(S1302), 출력 목적지로서의 출력 장치의 정보가 취득되며(S1303), 등록 데이터에 포함되어 있는 분할 영역들 중 하나가 선택된다(S1304). 그 다음, 출력 목적지의 조건들에 대응되는 선택된 분할 영역의 데이터 포맷이 판정된다(S1305).
다음으로는, 사용자의 사용 권한 레벨에 적합한 출력 정보를 추출하기 위해, 사용자의 사용 권한 레벨이 분할 영역의 출력 모드-의존적 사용 권한 및 내용-의존적 사용 권한들과 비교된다(S1306). 단계 S1305에서 판정된 데이터 포맷의 출력 정보가 추출된 출력 정보로부터 선택된다(S1307). 대응되는 데이터 포맷의 출력 정보가 이용 불가능하다면, 그에 상응하게 권고하는 메시지가 사용자에게로 송신되고, 흐름은 후속 처리으로 진행한다.
등록 데이터의 모든 분할 영역들에 대한 처리가 완결되었는지가 점검되고(S1308), 단계들(S1304 내지 S1307)의 프로세스들은, 등록 데이터의 모든 분할 영역들에 대한 처리가 완결될 때까지 반복된다.
모든 분할 영역들에 대한 처리의 완결시에, 분할 영역들로부터 선택된 출력 정보의 각각의 부분들이 통합되고(S1309), 통합된 출력 정보는 출력 장치로 출력된 다(S1310).
도 22A 내지 도 22D는 도 4에 도시된 문서 화상에 대응되는 등록 데이터의 출력 일례들을 도시한다.
사용 권한 레벨 1의 사용자인 경우, 도 22A에 도시된 문서 화상이 출력된다. 사용 권한 레벨 1의 사용자는 사진 영역(302)의 출력 정보에 대한 도 17A에 도시된 원래 화상을 출력할 수 있으므로, 도 4에 도시된 문서 화상과 거의 동일한 문서 화상을 출력할 수 있다.
사용 권한 레벨 2의 사용자인 경우, 도 22B에 도시된 문서 화상이 출력된다. 사용 권한 레벨 2의 사용자는 사진 영역(302)의 출력 정보에 대한 도 17B에 도시된 모자이크 화상을 출력할 수 있으므로, 사진 영역(302)이 모자이크 처리되었다는 것을 제외하면, 도 4에 도시된 문서 화상과 거의 동일한 문서 화상을 출력할 수 있다.
사용 권한 레벨 3의 사용자인 경우, 도 22C에 도시된 문서 화상이 출력된다. 사용 권한 레벨 3의 사용자는 도 17C에 도시된 저작권의 제한이 없는 화상을 출력할 수 있으므로, 사진 영역(302)의 화상이 대체되었다는 것을 제외하면, 도 4에 도시된 문서 화상과 거의 동일한 문서 화상을 출력할 수 있다.
사용 권한 레벨 2의 사용자는 사진 영역(302)에 대해 고품질 화상 인쇄 및 PDA 디스플레이를 선택할 수 없다. 또한, 사용 권한 레벨 3의 사용자는 컬러 인쇄, 흑백의 고품질 화상 인쇄, PDA 디스플레이, 및 초확대 디스플레이를 선택할 수 없다. 따라서, 사용 권한 레벨 2 또는 3의 사용자에 허용되지 않는 인쇄 또는 디 스플레이 명령들이 발행될 경우, 사진 영역(302)은, 도 22D에 도시된 바와 같이, 인쇄 또는 디스플레이되지 않는다(공백 상태).
이런 식으로, 각각의 분할 영역에 대해 동일한 데이터 포맷의 출력 정보에 대한 복수의 유형들이 준비될 수 있고, 사용자의 사용 권한 레벨에 따른 출력 정보가 각각의 분할 영역에 대해 선택되고 출력될 수 있다. 따라서, 문서의 오브젝트 각각에 대해, 문서의 출력 모드, 오브젝트의 내용들, 및 사용자의 사용 권한에 따라 데이터 포맷 또는 데이터 자체를 바꾸어 문서를 출력할 수 있다.
<제3 실시예>
다음에서는, 본 발명의 제3 실시예에 따른 화상 처리 장치 및 그 방법이 설명될 것이다. 제3 실시예의 동일한 참조 번호들은 제1 및 제2 실시예들에서와 동일한 부분들을 나타내므로, 그에 관한 상세한 설명은 생략될 것이다.
모든 출력 모드들을 지원하기 위해, 출력 정보의 데이터 포맷들의 모든 유형들이 데이터 등록시에 준비될 수 있다. 그러나, 빈번하게 사용될 것으로 예상되는 데이터 포맷들의 출력 정보에 대한 일부 유형들만이 준비될 수도 있다. 그 다음, 사용자는 출력 정보의 데이터 포맷들을, 출력 모드들에 상응하여 준비되는 각각의 영역 속성들에 대해 미리 설정하는 것이 바람직하다.
다음의 설명에서, 흑백 인쇄 및 모니터 디스플레이는 기본 패턴들로서 설명될 것이고, 다른 출력 모드들은 응용 패턴들로서 설명될 것이다. 다시 말해, 응용 패턴들의 출력들은 기본 패턴들보다 낮은 사용 빈도를 갖는 것으로 가정된다.
출력 정보가 응용 모드로 출력되어야 할 경우, 분할 영역은 대체로 희망 데 이터 정보를 포함하지 않는다. 그러한 경우, 기존의 출력 정보가 희망 데이터 포맷의 출력 정보로 변환되거나, 기존의 출력 정보를 검색 키로서 사용해, 희망 데이터 포맷의 출력 정보가 데이터베이스로부터 검색된다. 제3 실시예에서, 변환 또는 검색이 실행되는지의 여부는 사용자의 사용 권한 레벨에 따라 판정된다.
도 23A 및 도 23B는 도 4에 도시된 문서 화상에 대해 설정될 출력 모드-의존적 사용 권한들을 도시한다. 도 23A에 도시된 모드-의존적 사용 권한은 사진 영역(302)에 대해 설정되고, 도 23B에 도시된 모드-의존적 사용 권한은 다른 분할 영역들에 대해 설정된다. 도 22A 내지 도 22D에 도시된 출력 정보의 내용-의존적 사용 권한들은 제2 실시예에서와 같이 설정된다.
다음 설명은, 흑백 인쇄의 사용 빈도가 출력 모드만큼 높고, 출력 정보의 다음 부분들이 출력 정보로의 변환 처리(S1105)에서 준비된다는 가정하에서 이루어질 것이다.
텍스트 영역 래스터 화상
사진 영역 그레이 스케일 래스터 화상
선화 영역 래스터 화상
표 영역 래스터 화상
ㆍ 출력 정보의 변환 및 검색
도 24는, 등록 데이터에 대해 준비된 출력 정보에만 기초해 출력 정보가 출력될 수 없을 경우에 실행되는 처리를 도시하는 흐름도이다. 이 처리는 사용자 등의 명령들에 기초해 CPU(101)에 의해 실행된다.
출력 데이터 포맷에 적합한 출력 정보 및 사용자의 사용 권한 레벨이 이용 가능한지가 점검된다(S1401). 그러한 출력 정보가 이용 가능하다면, 흐름은 단계 S1409로 건너 뛴다.
출력 데이터 포맷에 적합한 출력 정보 및 사용자의 사용 권한 레벨이 이용 불가능하다면, 출력 정보의 변환이 사용자에 허용되는지를 알아보기 위해, 분할 영역의 출력 모드-의존적 사용 권한이 점검된다(S1402). 사용자에 허용된다면, 흐름은 단계 S1403으로 진행하고, 그렇지 않으면, 흐름은 단계 S1404로 건너 뛴다.
사용자에게 출력 정보를 변환하는 것이 허용된다면, 이용 가능한 출력 정보가 필요한 데이터 포맷으로 변환될 수 있는지가 점검된다(S1403). 변환 가능한 데이터 포맷들은 미리 설정된다(도 7 참고). 이용 가능한 출력 정보가 변환될 수 있다면, 그것은 출력 데이터 포맷으로 변환되고(S1405), 흐름은 단계 S1409로 건너 뛴다. 한편, 이용 가능한 출력 정보가 변환될 수 없다면, 흐름은 단계 S1404로 건너 뛴다.
사용자에게 출력 정보를 변환하는 것이 허용되지 않거나 출력 정보를 변환하는 것이 불가능하다면, 사용자에게 출력 정보를 검색하는 것이 허용되는지를 알아보기 위해, 분할 영역의 출력 모드-의존적 사용 권한이 점검된다(S1404). 사용자에게 검색이 허용되지 않으면, 흐름은 단계 S1408로 건너 뛴다.
한편, 사용자에게 출력 정보를 검색하는 것이 허용된다면, 분할 영역의 출력 정보를 검색 키로서 사용해, 출력 모드에 적합한 정보가 검색된다. 사용자의 사용 권한 레벨이 검색시에 고려된다는 것에 주의한다. 예를 들어, 흑백 화상의 출력 정보가 컬러-인쇄되어야 할 경우, 그러한 흑백 화상을 검색 키로서 사용해 유사한 컬러 화상이 검색된다(S1406).
검색이 적중하는지가 점검된다(S1407). 동일한 분할 영역에서라도, 이용 가능한 데이터는 사용자의 사용 권한 레벨에 따라 달라진다. 예를 들어, 저작권 보호되는 데이터는 저작권에 대해 비용을 지불한 사용자에게 제공될 수 있고, 저작권에 대해 비용을 지불하지 않은 사용자에게는 유사한 내용들을 가진, 저작권의 제한이 없는, 데이터가 제공된다. 검색이 적중하면, 흐름은 단계 S1409로 진행하고, 그렇지 않으면(또는 적중이 소정의 검색 시간 내에 발생하지 않으면), 흐름은 단계 S1408로 진행한다.
출력 데이터 포맷의 출력 정보가 이용 가능하거나 출력 데이터 포맷에 적합한 출력 정보가 변환 또는 검색에 의해 취득된다면, 그 출력 정보가 출력되어야 할 출력 정보로서 판정되고(S1409), 그에 따라, 처리는 종료한다.
일부 경우들에서는, 출력 데이터 포맷의 출력 정보가 이용 불가능하고, 사용자에게는 출력 정보를 변환 및 검색하는 것이 허용되지 않거나, 사용자에게 출력 정보를 검색하는 것이 허용된다 하더라도, 적중이 발생하지 않는다. 그러한 경우에서는, 출력 데이터 포맷의 출력 정보가 취득될 수 없다는 것을 나타내는 메시지가 사용자에게 송신되고(S1408), 그에 따라, 분할 영역의 처리는 종료한다.
ㆍ 출력 정보의 출력
다음에서는, 상술한 바와 같이, 컬러 인쇄를 위한 데이터 포맷의 출력 정보가 흑백 인쇄를 위한 출력 정보만을 포함하는 등록 데이터로부터 취득되어 컬러 인쇄가 실행되는 경우의 사진 영역(302)에 대한 처리가 설명될 것이다.
사용 권한 레벨 1의 사용자는 모든 분할 영역에 대해 컬러 인쇄 모드를 사용 할 수 있다. 그러나, 사진 영역(302)의 출력 정보는 흑백 화상을 포함하고 컬러 인쇄를 위한 데이터 포맷은 전혀 가지고 있지 않다. 사용자에게는 사진 영역(302)의 출력 정보를 변환하는 것이 허용되지만, 흑백 화상은 컬러 화상으로 변환될 수 없다. 그러나, 사용자에게는 사진 영역(302)의 출력 정보를 검색 키로서 사용해 다른 정보를 검색할 것이 허용되므로, 흑백 화상을 검색 키로서 사용해 컬러 화상을 검색하고 적중된 출력 정보를 사진 영역(302)의 출력 정보로서 사용해 문서 화상을 컬러 인쇄한다.
사용 권한 레벨 2의 사용자는 컬러 인쇄 모드를 모든 분할 영역에 대해 사용할 수 있다. 그러나, 사진 영역(302)의 출력 정보는 흑백 화상을 포함하고, 컬러 인쇄를 위한 데이터 포맷은 전혀 가지고 있지 않다. 사용자에게는 사진 영역(302)의 출력 정보를 변환할 것이 허용되지만, 흑백 화상이 컬러 화상으로 변환될 수는 없다. 또한, 사용자에게는 사진 영역(302)의 출력 정보를 검색 키로서 사용해 다른 정보를 검색하는 것이 허용되지 않는다. 따라서, 사진 영역(302)의 컬러 화상이 출력될 수 없다는 것을 나타내는 메시지가 사용자에게로 송신되고, 문서 화상은 흑백 화상을 사진 영역(302)의 출력 정보로서 사용해 컬러 인쇄된다.
사용 권한 레벨 3의 사용자는 사진 영역(302)을 제외한 분할 영역들에 대해 컬러 인쇄 모드를 사용할 수 있지만 사진 영역(302)에 대해서는 컬러 인쇄 모드를 사용할 수 없다. 따라서, 사진 영역(302)의 컬러 화상이 출력될 수 없다는 것을 나타내는 메시지가 사용자에게로 송신되고, 문서 화상은 흑백 화상을 사진 영역(302)의 출력 정보로서 사용해 컬러 인쇄된다.
이런 식으로, 동일한 데이터 포맷의 출력 정보에 대한 복수의 유형들이 각각의 분할 영역에 대해 준비되고, 사용자의 사용 권한 레벨에 따른 출력 정보가 각각의 분할 영역에 대해 선택되어 출력될 수 있다. 따라서, 문서의 오브젝트 각각에 대해, 문서의 출력 모드, 오브젝트의 내용들, 및 사용자의 사용 권한 레벨에 따라 데이터 포맷 또는 데이터 자체를 바꾸어, 문서를 출력할 수 있다.
상술한 바와 같이, 기존 출력 정보의 변환에 대한 허용/금지 및 기존의 출력 정보를 검색 키로서 사용하는 검색의 허용/금지가 각각의 분할 영역에 대해 설정되므로, 출력 모드에 적합한 데이터 포맷의 출력 정보가 이용 불가능하다고 하더라도, 적합한 출력 정보가 최대한 많이 출력될 수 있다.
[실시예들의 변경]
상기 실시예들에서는, 텍스트 속성의 분할 영역에 대응되는 출력 정보가 문자 인식 결과의 텍스트를 포함하는 일례가 설명되었다. 다른 방법으로, 그 텍스트를 다른 언어로 번역하는 것에 의해 취득되는 번역 결과의 텍스트가 준비될 수도 있다.
각각의 분할 영역에 대응되는 출력 정보가 시각 정보로서 설명되었다. 다른 방법으로, 각각의 분할 영역 특징을 가청 데이터로 변환하는 것에 의해 취득되는 가청 정보가 분할 영역의 출력 정보로서 준비될 수도 있다. 예를 들어, 도 4의 사진 속성의 분할 영역(302)에 대한 사진은 2마리의 새들이 하늘과 바다를 배경으로 날고 있는 상태를 도시한다. 이 경우, "photo that shows sky, sea, and two flying birds" 등과 같은 청각 정보가 출력 정보에 첨부된다. 한편, 도 4에 도시 된 텍스트 속성의 분할 영역(303)에는 문자 인식 결과의 텍스트를 큰소리로 판독하는 청각 정보가 첨부된다.
분할 영역 각각의 출력 정보로서, 그 영역의 특징에 대응되는 촉각 정보가 표시될 수도 있다. 예를 들어, 텍스트 속성의 분할 영역에 대해, 문자 인식 결과의 텍스트를 브라유식 점자(Braille)로 변환하는 것에 의해 취득되는 정보가 첨부된다. 선화 속성의 분할 영역에 대해, 각 라인의 오목한 모양과 볼록한 모양에 대한 촉각 정보가 첨부된다. 사진 속성의 분할 영역에 대해서는, 그 영역의 오브젝트에 대한 3차원의 형태, 질감 등의 촉각 정보가 첨부된다.
다른 방법으로는, 분할 영역 각각의 출력 정보로서, 그 영역의 특징에 대응되는 후각 정보가 준비될 수도 있다. 예를 들어, 도 4에 도시된 사진 속성의 분할 영역(302)은 바다를 도시하므로, 바다의 독특한 소금 냄새 정보가 출력 정보에 첨부된다.
게다가, 분할 영역 각각의 출력 정보로서, 그 영역의 특징에 대응되는 미각 정보가 준비될 수도 있다. 예를 들어, 사진 속성의 분할 영역이 음식을 도시할 경우, 그 음식의 미각 정보가 그 영역의 출력 정보로서 첨부된다.
이런 식으로, 각각의 영역들마다 출력 정보의 복수의 유형들이 준비된다. 출력 정보의 출력시에, 적합한 유형의 출력 정보가 각 영역에 대해 선택됨으로써, 다양한 출력 환경들과 요청들에 상응하는 출력 정보를 제공한다. 적합한 유형의 출력 정보가 출력시에 이용 불가능할 경우, 기존 정보를 적합한 정보로 변환하기 위한 처리가 실행됨으로써, 초기 상태의 데이터 사이즈를 감소시키고 사용자의 동 적 요청에 유연하게 대처한다. 물론, 변환에 의해 새롭게 생성된 유형의 출력 정보는 분할 영역과 추가적으로 연관되므로, 그 출력 정보의 재가용성(re-usability)이 향상될 수 있다.
다른 실시예
본 발명은 복수의 장치들(예를 들어, 호스트 컴퓨터, 인터페이스, 판독기, 프린터)로 구성되는 시스템에 또는 단일 장치(예를 들어, 복사기, 팩시밀리)를 포함하는 장치에 적용될 수 있다.
또한, 본 발명의 목적은 컴퓨터 시스템 또는 장치(예를 들어, 퍼스널 컴퓨터)에 대해 상기 프로세스들을 수행하기 위한 프로그램 코드들을 저장하는 저장 매체를 제공하고, 컴퓨터 시스템 또는 장치의 CPU 또는 MPU에 의해, 저장 매체로부터 프로그램 코드들을 판독한 다음, 프로그램을 실행하는 것에 의해 실현될 수도 있다.
이 경우, 저장 매체로부터 판독되는 프로그램 코드들은 실시예들에 따른 기능들을 실현하고, 프로그램 코드들을 저장하는 저장 매체가 본 발명을 구성한다.
또한, 플로피 디스크, 하드 디스크, 광 디스크, 광자기 디스크, CD-ROM, CD-R, 자기 테이프, 비휘발성 메모리 카드, 및 ROM과 같은, 저장 매체가 프로그램 코드들을 제공하는데 사용될 수도 있다.
또한, 컴퓨터에 의해 판독되는 프로그램 코드들을 실행하는 것에 의해 실현되는 상기 실시예들에 따른 상기 기능들 이외에도, 본 발명은 컴퓨터에서 실행 중인 OS(오퍼레이팅 시스템) 등이 프로그램 코드들의 목적지들에 따른 프로세스들의 일부 또는 전부를 수행하고 상기 실시예들에 따른 기능들을 실현하는 경우를 포함한다.
또한, 본 발명은, 저장 매체로부터 판독된 프로그램 코드들이 컴퓨터에 삽입되어 있는 기능 확대 카드 또는 컴퓨터에 접속되어 있는 기능 확대 유닛에서 제공되는 메모리에 기입된 후에, 기능 확대 카드 또는 유닛에 포함되어 있는 CPU 등이 프로그램 코드들의 지시들에 따라 프로세스의 일부 또는 전부를 수행하여 상기 실시예들의 기능들을 실현하는 경우도 포함한다.
본 발명이 상기 저장 매체에 적용되는 경우, 저장 매체는 실시예들에서 설명된 흐름도들에 대응되는 프로그램 코드들을 저장한다.
예시적 실시예들을 참조하여 본 발명을 설명하기는 하였지만, 본 발명이 개시된 예시적 실시예들로 한정되지 않는다는 것을 이해할 수 있어야 한다. 다음 청구항들의 범위는 그러한 모든 변경들 및 등가 구조들과 기능들을 포함하기 위해 최광의로 해석되어야 한다.
따라서, 본 발명에 따르면, 각 영역에 대해 출력되어야 할 출력 정보가 문서 화상의 출력 목적지 정보, 문서 화상 내의 각각의 영역들의 속성들, 및 사용자의 권한 정보에 기초해 판정될 수 있는 화상 처리 장치 및 방법이 제공된다.

Claims (16)

  1. 화상 처리 방법에 있어서,
    메모리에 저장되어 있는 문서 화상의 출력 목적지에 대한 정보를 취득하는 단계;
    상기 출력 목적지의 정보 및 상기 문서 화상 내의 각각의 영역들의 속성들에 기초하여, 각각의 영역들에 대해 출력되어야 할 출력 정보의 유형들을 판정하는 단계;
    상기 각각의 영역들에 대해 출력되어야 할 유형들의 출력 정보들을 취득하는 단계;
    상기 각각의 영역들에 대해 취득된 상기 출력 정보들을 문서 화상으로 통합하는 단계; 및
    상기 통합된 문서 화상을 상기 출력 목적지로 출력하는 단계
    를 포함하는 화상 처리 방법.
  2. 제1항에 있어서,
    등록될 문서 화상을 화상 속성들에 기초해 복수의 영역들로 분할하는 단계;
    상기 분할된 영역들 내의 화상들을 하나 또는 복수 유형의 출력 정보들로 변환하는 단계;
    상기 각각의 영역들의 출력 정보들을 연관지음으로써, 상기 문서 화상의 구 조를 나타내는 구조화 문서 정보를 생성하는 단계; 및
    상기 각각의 영역들의 출력 정보들 및 상기 구조화 문서 정보를 상기 문서 화상으로서 상기 메모리에 저장하는 단계
    를 더 포함하는 화상 처리 방법.
  3. 제1항에 있어서,
    상기 출력 정보를 취득하는 단계는, 출력되어야 할 유형의 출력 정보가 이용 가능하지 않은 영역에 대해, 상기 출력되어야 할 유형과 상이한 유형의 출력 정보를 상기 출력되어야 할 유형의 출력 정보로 변환하여 해당 영역의 출력 정보를 취득하는 단계를 포함하는 화상 처리 방법.
  4. 제3항에 있어서,
    상기 상이한 유형의 출력 정보를 변환하여 취득되는 상기 출력 정보를 상기 영역과 관련하여 상기 메모리에 저장하는 단계를 더 포함하는 화상 처리 방법.
  5. 제1항에 있어서,
    상기 출력 정보를 취득하는 단계는, 출력되어야 할 유형의 출력 정보가 이용 가능지 않은 영역에 대해, 해당 영역의 화상과 유사한 상기 출력되어야 할 유형의 출력 정보를 검색하여 검색된 출력 정보를 해당 영역의 출력 정보로서 취득하는 단계를 포함하는 화상 처리 방법.
  6. 제5항에 있어서,
    상기 검색된 출력 정보를 상기 영역과 연관지어 상기 메모리에 저장하는 단계를 더 포함하는 화상 처리 방법.
  7. 제1항에 있어서,
    상기 메모리에 저장된 문서 화상과 연관된 정보는 각 영역의 속성 정보 및 레이아웃 정보를 포함하는 화상 처리 방법.
  8. 제1항에 있어서,
    상기 출력 정보는 해상도-가변 래스터(resolution-variable raster) 화상, 벡터 화상, 흑백 화상, 컬러 화상, 3차원 화상, 문자 인식 결과의 텍스트, 폰트 정보, 및 다른 언어로의 번역 결과 중 적어도 하나인 화상 처리 방법.
  9. 제1항에 있어서,
    상기 판정 단계는, 상기 출력 목적지의 정보 및 상기 각각의 영역들의 상기 출력 정보의 특징들에 기초하여 상기 각각의 영역들에 대해 출력되어야 할 상기 출력 정보의 유형들을 판정하는 단계를 포함하는 화상 처리 방법.
  10. 제1항에 있어서,
    상기 문서 화상의 출력 지시를 입력하는 사용자의 권한 정보를 취득하는 단계를 더 포함하고,
    상기 출력 정보를 취득하는 단계는, 상기 출력 목적지의 정보 및 상기 사용자의 권한 정보에 기초하여 각 영역에 대한 상기 출력 정보를 취득하는 단계를 포함하는 화상 처리 방법.
  11. 제10항에 있어서,
    상기 메모리에 저장되어 있는 상기 문서 화상과 연관된 정보는 각 영역에 대해 설정된 사용 권한 정보를 포함하고,
    상기 출력 정보를 취득하는 단계는, 상기 출력 목적지 정보, 상기 사용자의 권한 정보, 및 각 영역의 상기 사용 권한 정보에 기초하여 각 영역에 대한 상기 출력 정보를 취득하는 단계를 포함하는 화상 처리 방법.
  12. 제11항에 있어서,
    등록될 문서 화상을 화상 속성들에 기초하여 복수의 영역들로 분할하는 단계;
    상기 분할된 영역들 내의 화상들을 하나 또는 복수의 유형의 출력 정보로 변환하는 단계;
    각 영역에 대해 상기 사용 권한 정보를 설정하는 단계;
    상기 각각의 영역들의 출력 정보들과 상기 각각의 영역들의 상기 사용 권한 정보들을 연관지음으로써, 상기 문서 화상의 구조를 나타내는 구조화 문서 정보를 생성하는 단계; 및
    상기 각각의 영역들의 출력 정보들 및 상기 구조화 문서 정보를 상기 메모리에 상기 문서 화상으로서 저장하는 단계
    를 더 포함하는 화상 처리 방법.
  13. 제10항에 있어서,
    상기 사용자의 권한 정보는 상기 출력 정보의 변환이 허용되는지 안 되는지의 여부를 나타내는 권한을 포함하는 화상 처리 방법.
  14. 제10항에 있어서,
    상기 사용자의 권한 정보는 영역 내의 화상과 유사한 출력 정보의 검색이 허용되는지 안 되는지의 여부를 나타내는 권한을 포함하는 화상 처리 방법.
  15. 화상 처리 장치에 있어서,
    메모리에 저장되어 있는 문서 화상의 출력 목적지 정보를 취득하도록 구성된 제1 취득기;
    상기 출력 목적지 정보 및 상기 문서 화상 내의 각각의 영역들의 속성들에 기초하여 상기 각각의 영역들에 대해 출력되어야 할 출력 정보의 유형들을 판정하도록 구성된 판정기;
    상기 각각의 영역들에 대해 출력되어야 할 유형들의 출력 정보들을 취득하도록 구성된 제2 취득기;
    상기 각각의 영역들에 대해 취득된 상기 출력 정보들을 문서 화상으로 통합하도록 구성된 통합기; 및
    상기 통합된 문서 화상을 상기 출력 목적지로 출력하도록 구성되어 있는 출력부
    를 포함하는 화상 처리 장치.
  16. 화상 처리 방법에 대한 프로그램 코드를 포함하는 컴퓨터 판독가능한 매체에 저장되어 있는 컴퓨터 프로그램 제품에 있어서,
    상기 방법은,
    메모리에 저장되어 있는 문서 화상의 출력 목적지 정보를 취득하는 단계;
    상기 출력 목적지의 정보 및 상기 문서 화상 내의 각각의 영역들의 속성들에 기초하여 각각의 영역들에 대해 출력되어야 할 출력 정보의 유형들을 판정하는 단계;
    상기 각각의 영역들에 대해 출력되어야 할 상기 유형들의 출력 정보들을 취득하는 단계;
    상기 각각의 영역들에 대해 취득된 상기 출력 정보들을 문서 화상으로 통합하는 단계; 및
    상기 통합된 문서 화상을 상기 출력 목적지로 출력하는 단계
    를 포함하는 컴퓨터 프로그램 제품.
KR1020060084201A 2005-09-01 2006-09-01 화상 처리 장치, 방법 및 기록 매체 KR100808713B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JPJP-P-2005-00253793 2005-09-01
JP2005253793A JP4738943B2 (ja) 2005-09-01 2005-09-01 画像処理装置およびその方法
JPJP-P-2005-00363864 2005-12-16
JP2005363864A JP4553385B2 (ja) 2005-09-01 2005-12-16 画像処理方法およびその装置

Publications (2)

Publication Number Publication Date
KR20070026239A true KR20070026239A (ko) 2007-03-08
KR100808713B1 KR100808713B1 (ko) 2008-02-29

Family

ID=37607364

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060084201A KR100808713B1 (ko) 2005-09-01 2006-09-01 화상 처리 장치, 방법 및 기록 매체

Country Status (5)

Country Link
US (1) US7933447B2 (ko)
EP (1) EP1760605A1 (ko)
JP (2) JP4738943B2 (ko)
KR (1) KR100808713B1 (ko)
CN (1) CN100502454C (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100254606A1 (en) * 2005-12-08 2010-10-07 Abbyy Software Ltd Method of recognizing text information from a vector/raster image
US8374234B2 (en) * 2006-09-29 2013-02-12 Francis S. J. Munoz Digital scaling
JP4687625B2 (ja) * 2006-10-02 2011-05-25 富士ゼロックス株式会社 画像処理システムおよび画像処理プログラム
JP4997070B2 (ja) * 2007-10-31 2012-08-08 京セラドキュメントソリューションズ株式会社 電気機器、画像表示制御方法、及び、画像表示制御プログラム
US8488834B2 (en) * 2007-11-15 2013-07-16 Certifi-Media Inc. Method for making an assured image
JP5100354B2 (ja) * 2007-12-14 2012-12-19 キヤノン株式会社 画像処理装置、画像処理方法、及びコンピュータプログラム
US8593666B2 (en) * 2009-02-11 2013-11-26 Hewlett-Packard Development Company, L.P. Method and system for printing a web page
JP5264553B2 (ja) 2009-02-23 2013-08-14 キヤノン株式会社 画像処理装置、及びその制御方法,プログラム
JP4940270B2 (ja) * 2009-07-06 2012-05-30 シャープ株式会社 画像形成装置
CN103294650B (zh) * 2012-02-29 2016-02-03 北大方正集团有限公司 一种显示电子文档的方法和装置
US10777164B2 (en) * 2014-12-19 2020-09-15 Qualcomm Incorporated Power optimization by rendering low-resolution tiles during page load
CN106874252A (zh) * 2017-02-17 2017-06-20 张家口浩扬科技有限公司 一种文档识别和显示方法及其移动终端
CN108334797B (zh) * 2017-06-21 2021-04-23 平安科技(深圳)有限公司 文件扫描方法、装置和计算机可读存储介质
JP7328797B2 (ja) * 2019-06-05 2023-08-17 株式会社日立製作所 端末装置、文字認識システム及び文字認識方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736860A (ja) * 1993-07-21 1995-02-07 Canon Inc 文書処理装置
JPH08204950A (ja) 1995-01-31 1996-08-09 Toshiba Corp イメージ管理装置及び方法
JP3504054B2 (ja) * 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
JP3754791B2 (ja) * 1997-03-19 2006-03-15 キヤノン株式会社 画像検索装置及び方法
JPH11102414A (ja) * 1997-07-25 1999-04-13 Kuraritec Corp ヒートマップを用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを発見するための一連の命令を記録したコンピュータ読み取り可能な記録媒体
US6336124B1 (en) * 1998-10-01 2002-01-01 Bcl Computers, Inc. Conversion data representing a document to other formats for manipulation and display
JP2000306103A (ja) 1999-04-26 2000-11-02 Canon Inc 情報処理装置及び方法
US6785410B2 (en) * 1999-08-09 2004-08-31 Wake Forest University Health Sciences Image reporting method and system
WO2001077847A1 (en) * 2000-04-07 2001-10-18 Financeware.Com Method and apparatus for rendering electronic documents
US7055095B1 (en) * 2000-04-14 2006-05-30 Picsel Research Limited Systems and methods for digital document processing
US7565605B2 (en) * 2001-05-08 2009-07-21 Nokia, Inc. Reorganizing content of an electronic document
JP2002305651A (ja) * 2002-01-24 2002-10-18 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
US6768816B2 (en) * 2002-02-13 2004-07-27 Convey Corporation Method and system for interactive ground-truthing of document images
US20040205568A1 (en) * 2002-03-01 2004-10-14 Breuel Thomas M. Method and system for document image layout deconstruction and redisplay system
JP4154252B2 (ja) * 2003-02-04 2008-09-24 キヤノン株式会社 画像処理装置およびその方法
JP3993025B2 (ja) 2002-05-29 2007-10-17 株式会社リコー 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置
JP4266695B2 (ja) * 2003-04-30 2009-05-20 キヤノン株式会社 画像処理装置及び画像処理方法
US7213035B2 (en) * 2003-05-17 2007-05-01 Microsoft Corporation System and method for providing multiple renditions of document content
MXPA04007408A (es) * 2003-05-17 2005-08-15 Microsoft Corp Sistema y metodo para proporcionar interpretaciones multiples de contenido de documento.
JP2005148393A (ja) * 2003-11-14 2005-06-09 Ricoh Co Ltd 画像形成装置
US7287221B2 (en) * 2004-01-13 2007-10-23 International Business Machines Corporation Differential dynamic content delivery with text display in dependence upon sound level
US7519221B1 (en) * 2005-02-28 2009-04-14 Adobe Systems Incorporated Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts
JP2006350867A (ja) * 2005-06-17 2006-12-28 Ricoh Co Ltd 文書処理装置、文書処理方法、プログラム及び情報記録媒体
JP4574467B2 (ja) * 2005-06-30 2010-11-04 キヤノン株式会社 データ処理装置、データ処理方法およびコンピュータプログラム
JP2007058725A (ja) * 2005-08-26 2007-03-08 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
US7702182B2 (en) * 2006-02-16 2010-04-20 Adobe Systems, Incorporated Method and apparatus for creating a high-fidelity glyph prototype from low-resolution glyph images
US7777915B2 (en) * 2006-06-15 2010-08-17 Eastman Kodak Company Image control system and method

Also Published As

Publication number Publication date
EP1760605A1 (en) 2007-03-07
JP2007166541A (ja) 2007-06-28
KR100808713B1 (ko) 2008-02-29
US20070047814A1 (en) 2007-03-01
US7933447B2 (en) 2011-04-26
JP4738943B2 (ja) 2011-08-03
CN1925541A (zh) 2007-03-07
JP4553385B2 (ja) 2010-09-29
JP2007066188A (ja) 2007-03-15
CN100502454C (zh) 2009-06-17

Similar Documents

Publication Publication Date Title
KR100808713B1 (ko) 화상 처리 장치, 방법 및 기록 매체
US8203748B2 (en) Image processing apparatus, control method therefor, and program
US7551753B2 (en) Image processing apparatus and method therefor
US8223389B2 (en) Information processing apparatus, information processing method, and program and storage medium therefor
US8818110B2 (en) Image processing apparatus that groups object images based on object attribute, and method for controlling the same
US8090728B2 (en) Image processing apparatus, control method thereof, and storage medium that stores program thereof
US20070127085A1 (en) Printing system, printing method and program thereof
EP2040451B1 (en) Information processing apparatus and information processing method
KR20110005549A (ko) 부가정보 추가 문서를 생성하는 방법 및 이를 수행하는 화상형성장치
JP2004334337A (ja) 画像処理装置
JP2000224414A (ja) 情報処理システム及びその制御方法、情報処理装置及びその制御方法、コンピュータ可読メモリ
JP2004214991A (ja) 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法
JP5264155B2 (ja) プログラム、ファイル管理装置及びファイル管理方法
JP6767651B2 (ja) 情報処理システムとその処理方法及びプログラム
JP2005157928A (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP2005149323A (ja) 画像処理システム及び画像処理装置並びに画像処理方法
JP2008148263A (ja) 画像形成装置及びその制御方法
JP5100354B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP2010092141A (ja) 画像処理システム、画像読取装置、画像処理装置および画像処理プログラム
JP2009303149A (ja) 画像処理装置、画像処理方法及びコンピュータ制御プログラム
Jones Images, An Overview
JP2000224349A (ja) 情報処理システム及びその制御方法、情報処理装置及びその制御方法、コンピュータ可読メモリ

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130123

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140127

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150127

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160121

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170125

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180125

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190219

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20200211

Year of fee payment: 13