KR20100033412A

KR20100033412A - 화상 처리 장치, 화상 처리 방법 및 컴퓨터 판독 가능 저장 매체

Info

Publication number: KR20100033412A
Application number: KR1020107001438A
Authority: KR
Inventors: 도모또시 가나쯔; 마꼬또 에노모또; 다에꼬 야마자끼
Original assignee: 캐논 가부시끼가이샤
Priority date: 2007-06-29
Filing date: 2008-06-23
Publication date: 2010-03-29
Also published as: KR101128602B1; JP2009009527A; EP2162839A1; CN101689203A; US20100232690A1; EP2162839A4; CN101689203B; US8503773B2; JP4590433B2; WO2009005019A1

Abstract

각 문자 화상에 대응하는 문자 코드를 획득하기 위하여 문서 화상의 복수의 문자 화상에 대한 문자 인식을 수행하도록 구성된 문자 인식 유닛, 및 문서 화상, 문자 인식 유닛에 의해 획득된 복수의 문자 코드, 복수의 글리프, 및 각각의 문자 코드들을 렌더링하는데 사용될 글리프들을 나타내는 데이터를 포함하는 전자 문서를 생성하도록 구성된 생성 유닛을 포함하고, 인식 유닛에 의해 획득된 복수의 문자 코드에 대응하는 문자들을 렌더링할 때, 복수의 글리프 각각이 데이터에 기초하여 상이한 문자 코드들에 의해 공유 및 사용되는 화상 처리 장치가 제공된다.

Description

화상 처리 장치, 화상 처리 방법 및 컴퓨터 프로그램{IMAGE PROCESSING APPARATUS, IMAGE PROCESSING METHOD, AND COMPUTER PROGRAM}

본 발명은, 종이 문서의 스캔 화상(scanned image)을 전자적으로 검색가능한 데이터로 변환하는 기술에 관한 것이다.

최근, 하드 디스크와 같은 대용량 기억 장치들 및 스캐너들의 광범위한 사용에 의해, 지금까지 종이로 보존되어 있었던 문서들을 스캔하여, 스캔 데이터를 전자 문서들로서 저장하고 있다. 또한, 종이 문서를 스캔해서 얻은 그러한 화상 데이터에 대하여 문자 인식이 수행되어, 문서에 포함된 문자 정보를 읽어내고, 그 문자 정보를 화상에 관련시켜서 저장할 수 있다. 그리하여 사용자는 문자 정보가 관련지어진 그러한 전자 문서를, 검색 키워드를 사용해서 검색할 수 있다. 이와 같이, 대량의 저장된 문서에서 원하는 문서를 고속으로 검색해야 할 때, 전술된 바와 같은 스캔 화상에 대하여 키워드 검색이 수행될 수 있는 것이 중요하다.

예를 들어, 일본 공개 특허 제2000-322417호는 사용자가 전술한 바와 같은 문자 정보와 관련된 전자 문서에 대하여 키워드 검색을 수행할 경우, 문서 화상에서 검색 키워드가 포함된 부분을 강조하는 것을 기술한다. 검색 키워드가 포함된 부분을 사용자가 인식할 수 있도록, 그 부분은 강조된다. 그리하여, 문서에 동일한 키워드가 포함된 복수의 부분이 있을 경우에도, 사용자는 페이지 화상들을 전환함으로써 키워드가 포함된 부분들을 효과적으로 인식할 수 있다.

한편, 문자 인식의 결과를 투명 텍스트(즉, 렌더링색(rendering color)으로서 투명색이 지정된 문자 코드)로서 화상 파일 중에 매립(embedding)하는 기술이 있다. 그 후 화상 파일은, PDF(portable document format)로 저장된다. 이러한 PDF 파일을 표시할 때, 문서 화상 내의 문자 화상 위에 투명한 텍스트가 렌더링된다. 따라서, 사용자가 키워드 검색을 행할 때, 투명 텍스트가 검색된다. 그러나, 사용자는 투명 텍스트를 볼 수 없으므로, 마치 화상이 검색되고 있는 것 같이 보인다. 그 결과로서, 화상들 및 문자들을 렌더링할 수 있는 페이지 기술 언어에 의해 그 포맷이 기술되는 파일에 기초하여, 검색 키워드에 의해 검색 가능한 화상이 렌더링될 수 있다.

PDF와 같은 페이지 기술 언어 또는 선택 가능한 벡터 그래픽(selectable vector graphics)으로 기술된 전자 문서에서, 각 문자의 자형 정보, 즉 폰트 데이터의 글리프(glyph)가 문자들을 렌더링하기 위해 필요하다. 그러나, 폰트 데이터의 크기가 일반적으로 크기 때문에, 전자 문서의 크기를 작게 유지하기 위해, 폰트 데이터를 저장하는 대신 통상적으로 폰트 유형이 전자 문서에 표시된다. 그 결과, 어플리케이션을 사용하여 문자들이 렌더링될 때, 개인용 컴퓨터(PC)에 설치된 폰트가 사용될 수 있다.

한편, 전자 문서에 폰트 데이터를 저장해 두는 것이 바람직할 경우들이 있다. 예를 들어, 문서 작성 어플리케이션을 이용하여 만들어진 전자 문서를 다른 PC에서 열 경우, 전자 문서에서 사용된 폰트 데이터가 그 PC에 설치되어 있지 않으면, 그 전자 문서를 정확하게 열 수 없다. 바꾸어 말하면, 폰트 데이터 자체가 전자 문서에 저장되면, 전자 문서가 지정된 폰트 데이터가 설치되지 않은 PC 또는 어플리케이션에 대하여 정확하게 재생될 수 있다.

또한, 용도에 따라, 전자 문서의 문자 렌더링에 사용되는 폰트 데이터의 저장을 필수적으로 하는 것이 바람직한 경우들이 있다. 예를 들어, PC에 디폴트로서 설치된 폰트는 운영 체제(OS)의 변경에 기인하여 변경될 수 있다. 그리하여, 폰트 데이터를 장기 저장 파일(long-term storage file)에 저장하는 것을 필수적으로 하는 것이 바람직하다.

또한, 포맷의 형식에 따라서는, 폰트 데이터를 전자 문서에 저장하는 것을 필수적으로 하는 포맷들이 존재한다. 예를 들어, 텍스트 데이터가 XPS(XML(extensible markup language) paper specification) 포맷으로 저장될 때, 폰트 데이터는 텍스트 데이터와 함께 저장되는 것이 필요하다.

그러나, 전자 문서에 폰트 데이터를 저장하면 전자 문서의 크기가 증가한다. 전자 문서의 파일 크기가 증가하면, 전자 문서를 네트워크로 송신할 때 시간이 더 많이 걸리거나, 전자 문서를 저장할 때 더 큰 저장 용량이 필요해진다.

그리하여, 전자 문서에 저장되는 폰트 데이터를 사용해서 문자들을 렌더링하는 파일 포맷의 전자 문서에 있어서, 파일 크기의 증가를 방지하는 것이 바람직하다. 특히, 스캔 화상, 문자 인식 결과인 텍스트 데이터, 및 텍스트 렌더링에서 사용된 폰트 데이터가 전자 문서에 함께 저장될 경우에, 파일 크기의 증가를 방지하는 것이 바람직하다. 포맷에 관한 또는 시스템에 관한 제약으로 인해 폰트 데이터가 전자 문서에 저장되는 것이 요구될 경우에 파일 크기의 증가가 문제가 될 수 있다.

또한, 문서 화상에 문자 인식 결과를 투명 텍스트로서 넣을 경우, 투명 텍스트의 렌더링 위치와 문서 화상의 대응하는 문자 화상의 위치를 정확하게 일치시키는 것이 바람직하다. 상기 위치들을 일치시킴으로써, 검색된 텍스트의 위치가 텍스트가 검색되었을 때 문자 화상의 위치와 일치한다. 이러한 정확한 일치를 실현하기 위해, 투명 텍스트의 렌더링 위치(예를 들어, 문자의 위치 좌표, 문자 폭 또는 문자 간격)를 각 문자마다 상세하게 지정하는 것이 필요하다. 그러나, 모든 문자들에 대해서, 각 문자의 위치를 별개로 기술하면, 특히 문자 수가 많을 경우에는, 생성되는 전자 문서의 파일 크기가 커진다.

본 발명의 실시예들은 투명 텍스트의 렌더링 위치와 문서 화상에서 그 투명 텍스트에 대응하는 문자 화상의 위치를 일치시켜 감소된 파일 크기의 전자 문서를 생성하는 화상 처리 장치를 제공한다.

본 발명의 일 태양에 따르면, 각 문자 화상에 대응하는 문자 코드를 획득하기 위하여 문서 화상의 복수의 문자 화상에 대한 문자 인식을 수행하도록 구성된 문자 인식 유닛, 및 문서 화상, 문자 인식 유닛에 의해 획득된 복수의 문자 코드, 복수의 글리프(glyph), 및 각각의 문자 코드들을 렌더링하는데 사용될 글리프들을 나타내는 데이터를 포함하는 전자 문서를 생성하도록 구성된 생성 유닛을 화상 처리 장치가 포함하고, 인식 유닛에 의해 획득된 복수의 문자 코드에 대응하는 문자들을 렌더링할 때, 복수의 글리프 각각이 데이터에 기초하여 상이한 문자 코드들에 의해 공유 및 사용된다.

본 발명의 일 실시예에 따르면, 투명 텍스트의 렌더링 위치 및 문서 화상의 각 문자 화상의 위치가 텍스트를 렌더링하는데 사용된 글리프를 선택함으로서 일치될(matched) 수 있다. 또한, 상이한 문자 폭들의 간단한 자형(예를 들어 장방형)의 복수의 글리프가 준비되고, 다양한 문자 유형들을 렌더링하기 위해 공유되어 사용된다. 그리하여, 기술될 데이터의 양이 적어지고, 전자 문서 내에 폰트 데이터가 저장될 필요가 있을 경우에도 전자 문서의 파일 크기가 감소될 수 있다.

본 발명의 추가적인 특징들은 (첨부 도면들을 참조하여) 예시적인 실시예들에 대한 이하의 설명으로부터 명확해질 것이다.

본 명세서에 포함되고 본 명세서의 일부를 이루는 첨부 도면들은 본 발명의 예시적인 실시예들, 특징들 및 태양들을 도시하고, 명세서와 함께 본 발명의 원리들을 설명하는 데 사용된다.
도 1은 본 발명의 제1 실시예에 따른 화상 처리 장치의 구성예를 나타내는 블록도이다.
도 2는 본 발명의 제1 실시예에 따른 전자 문서 생성 처리의 예를 나타내는 흐름도이다.
도 3은 본 발명의 제1 실시예에 따른 전자 문서 검색 및 열람 처리의 예를 나타내는 흐름도이다.
도 4는 본 발명의 제1 실시예에 따른, 도 2에 나타낸 단계 S208에서 수행되는 전자 문서 데이터 생성 처리를 상세하게 나타내는 흐름도이다.
도 5는 본 발명의 제1 실시예에 따른, 도 3에 나타낸 단계 S306에서 수행되는 페이지 렌더링 처리를 상세하게 나타내는 흐름도이다.
도 6은 본 발명의 제1 실시예에 따른 화상 처리 장치에 의해 형성되는 전자 문서의 예를 나타낸다.
도 7은 본 발명의 제1 실시예에 따라 처리되어야 할 페이지 화상의 예를 나타낸다.
도 8은 본 발명의 제1 실시예에 따른 영역 분할(region segmentation) 처리 결과의 예를 나타낸다.
도 9는 본 발명의 제1 실시예에 따른 영역 분할 처리의 결과로서 생성된 영역 데이터의 예를 나타낸다.
도 10은 본 발명의 제1 실시에에 따라 문자 인식이 수행될 때의 문자 화상 추출의 예를 나타낸다.
도 11은 본 발명의 제1 실시예에 따른 문자 인식 처리의 결과로서 생성되는 문자 코드 열 데이터의 예를 나타낸다.
도 12는 본 발명의 제1 실시예에 따른 문자 코드 배열 테이블의 예를 나타낸다.
도 13은 본 발명의 제1 실시예에 따라 검색 결과가 강조되는 페이지 표시의 예를 나타낸다.
도 14a 및 도 14b는 본 발명의 제1 실시예에 따라 상이한 강조 처리를 사용하여 검색 결과가 강조되는 페이지 표시의 예를 나타낸다.
도 15는 본 발명의 제1 실시예에 따른 글리프(glyph) ID 결정 처리를 나타내는 흐름도의 예이다.
도 16은 본 발명의 제2 실시예에 따라 검색 결과가 강조되는 폐이지 표시의 예를 나타낸다.

본 발명의 다양한 예시적인 실시예들, 특징들, 및 태양들이 도면들을 참조하여 이하에 상세하게 기술될 것이다.

제1 예시적인 실시예

도 1은 본 발명의 제1 예시적인 실시예에 따른 화상 처리 장치의 구성을 나타내는 블록도의 예이다.

화상 처리 장치(100)는 문서 화상 데이터를 검색가능한 전자 문서로 변환한다. 화상 처리 장치(100)는 스캐너(101), 중앙 처리 장치(CPU)(102), 메모리(103), 하드 디스크(104), 네트워크 인터페이스(I/F)(105), 및 사용자 인터페이스(UI)(106)를 포함한다.

스캐너(101)는 종이 문서 상의 페이지 정보를 판독하여 그 정보를 문서 화상 데이터로 변환한다. CPU(102)는 화상 데이터를 분석하고 분석 결과를 검색가능한 전자 문서로 변환하는 컴퓨터 프로그램을 실행하는 처리 유닛이다. 메모리(103)는 컴퓨터 프로그램의 데이터 또는 처리되는 데이터를 저장하거나, 또는 CPU(102)의 작업 공간으로서 사용되는 저장 매체이다. 하드 디스크(104)는 컴퓨터 프로그램 또는 전자 문서와 같은 데이터를 저장하기 위한 대용량 저장 매체이다. 네트워크 I/F(105)는 네트워크(120)에 접속하기 위한 인터페이스이며, 스캔 화상 또는 변환된 검색가능한 전자 문서와 같은 데이터를 외부 기기로 전송하는 데 사용되거나, 또는 외부 기기로부터 데이터를 수신하는데 사용된다. UI(106)는 사용자로부터 명령을 수신하기 위한 인터페이스이고, 입력 키 또는 터치 패널과 같은 입력 장치 및 액정 디스플레이(LCD)와 같은 표시 장치를 포함한다.

화상 처리 장치(110)는 화상 처리 장치(100)에 의해 생성된 전자 문서의 검색 또는 열람을 가능하게 한다. CPU(111)는 전자 문서를 검색 또는 열람하기 위한 컴퓨터 프로그램을 실행한다. 메모리(112)는 컴퓨터 프로그램을 실행하거나 데이터를 일시적으로 저장하기 위한 작업 공간으로서 사용되는 저장 매체이다. 하드 디스크(113)는 컴퓨터 프로그램 또는 전자 문서와 같은 데이터를 저장하기 위한 대용량 저장 매체이다. 네트워크 인터페이스(I/F)(114)는 외부 기기로부터 전자 문서와 같은 데이터를 수신하거나, 또는 외부 기기로 데이터를 전송한다. 사용자 인터페이스(UI)(115)는 사용자로부터 명령을 수신하기 위한 인터페이스이고, 입력 키 또는 터치 패널과 같은 입력 장치, 또는 LCD와 같은 표시 장치를 포함한다.

제1 실시예에 따른 처리는 도 2 및 도 3에 나타낸 흐름도들을 참조하여 아래에서 기술될 것이다.

도 2는 종이 문서를 스캐닝함으로써 획득된 화상 데이터로부터 검색가능한 전자 문서를 화상 처리 장치(100)가 생성하는 프로세스의 예를 나타내는 흐름도이다. 화상 처리 장치(100)는 전자 문서를 화상 처리 장치(110)로 전송한다.

단계 S201에서, CPU(102)는 사용자 명령 조작에 따라 생성될 전자 문서의 수신처 및 송신 방법을 결정한다. 사용자는 UI(106)를 통하여 명령을 준다. 사용자는 전자 메일 및 FTP(file transfer protocol)를 이용한 파일 전송과 같은 옵션들로부터 송신 방법을 선택한다.

사용자는 화상 처리 장치(100)에 종이 문서를 세트하고 스타트 키를 누른다. 단계 S202에서, CPU(102)는 스캐너(101)를 사용하여 세트된 종이 문서를 스캔하여 문서 화상 데이터를 생성하고, 그 데이터를 메모리(103)에 저장한다. 복수의 페이지를 포함하는 문서가 자동 문서 급지기를 사용하여 입력되는 경우, 각 페이지는 페이지 화상 데이터로 변환되어 입력 순서대로 메모리(103)에 저장된다.

도 7은 페이지 화상의 예를 나타낸다. 도 7을 참조하면, 페이지 화상(701)은 문자열 "X1A"(702), 문자열 "YBc"(703), 및 사진(704)을 포함한다. 사진(704)은 설명의 편의를 위해 음영처리된 직사각형으로서 표현된다. 그러나, 사진(704)은 실제로 자연적인 화상이다. 또한, 도 7에 도시된 예는 문자열들(702 및 703) 및 사진(704)만을 나타내지만, 페이지 화상은 그림들과 같은 다른 영역들을 포함할 수도 있다.

종이 문서가 컬러 문서인 경우, 페이지 화상 데이터는 8비트의 RGB 값들에 의해 계조(gradation)를 표현하는 컬러 화상의 형태이다. 만약 종이 문서가 단색 문서이면, 페이지 화상 데이터는 8비트를 사용하여 휘도를 표현하는 그레이 화상(gray image) 형태 이거나, 또는 1비트를 사용하여 흑 또는 백을 표현하는 2치 화상(binary image)의 형태이다.

단계 S203에서, CPU(102)는 메모리(103)에 저장된 처리되지 않은 페이지 화상 데이터를 처리 대상 화상으로서 선택한다. 화상이 복수의 페이지를 포함할 경우, CPU(102)는 처리 대상으로서의 1페이지의 화상을 입력 순서대로 선택한다.

단계 S204에서, CPU(102)는, 처리 대상 화상을 분석하고, 텍스트 영역, 그림 영역, 사진 영역 또는 표 영역 등의 상이한 각 영역을 식별함으로써 영역 분석을 수행한다. 그 후 CPU(102)는 식별된 각 영역의 영역 데이터를 생성해서 메모리(103)에 저장한다. 영역 데이터는, 각 영역의 외접 직사각형의 좌측위 위치 좌표(x, y 좌표값), 외접 직사각형의 크기(폭과 높이)를 나타내는 화소들의 개수, 및 식별된 영역의 유형을 포함한다.

영역 분석 처리에는, 종래 기술(즉, 영역 식별 처리, 영역 판별 처리 또는 영역 추출 처리)이 사용된다. 예를 들어, 일본 특허 공개 평06-68301호에서 논의된 기술을 사용하여, 이치화된 문서 화상 데이터로부터, 비슷한 크기의 흑 화소 블록들이 종으로 또는 횡으로 늘어선 구역을 텍스트 영역으로서 추출할 수 있다.

도 7에 도시된 페이지 화상(701)에 대하여 영역 분석을 수행함으로써, 도 8에서 도시된 바와 같이 , 텍스트 영역(801)과 사진 영역(802)이 식별된다. 도 9는, 도 7에 도시된 페이지 화상(701)에 대하여 영역 분석을 수행하여 얻어진 영역 데이터의 예를 도시한다.

단계 S205에서, CPU(lO2)는 영역 분석을 수행함으로써 식별된 각 텍스트 영역의 문자 화상에 대하여 문자 인식을 수행하여, 각 텍스트 영역에 관한 문자 코드 열의 데이터를 얻는다. 그 후 CPU(102)는 데이터를 메모리(103)에 저장한다. 문자 코드열의 데이터는, 텍스트 영역에 포함된 각 문자 화상의 인식 결과인 문자 코드 정보를 포함한다. 문자 코드열의 데이터는 각 문자 화상의 외접 직사각형의 정보(즉, 외접 직사각형의 좌측위 좌표와 폭과 높이에 관한 정보, 및 상기 문자가 포함되는 행의 높이에 관한 정보)를 더 포함한다.

아래에서 문자 인식 처리의 일례를 상세하게 설명한다. 또한, 문자 화상을 인식하는 처리에서, 공지의 기술을 이용하는 것이 가능하다.

문서 화상이 2치 화상이 아닌 경우에는, 텍스트 영역이 2치화되어 텍스트 영역의 2치 화상을 얻는다. 종선 및 횡선 각각의 흑 화소들의 개수를 세어 2치화된 텍스트 영역 각각의 히스토그램을 생성한다. 그 후 띠 형상의(strip-shaped) 행 화상이 종횡의 히스토그램에 기초하여 획득된다. 히스토그램들에 있어서, 히스토그램이 주기적인 방향이 행 방향으로서 표시된다. 히스토그램의 흑 화소들의 개수가 미리 정해진 임계값 이상인 부분이 문자행을 구성한다. 그 후 히스토그램이 각 행 화상에 대하여 행 방향에 수직한 방향으로 생성되고, 히스토그램의 결과에 기초하여 각 문자의 화상을 잘라낸다. 잘라진 구역이 1 문자의 외접 직사각형 정보가 된다.

본 예시적인 실시예에서는, 흑 화소들의 개수를 세어 획득된 히스토그램을 사용해서 문자 영역이 판별되었다. 그러나, 각 라인에 흑 화소가 있는지의 여부를 나타내는 사영(projection)을 사용해서 문자 영역이 판별될 수 있다.

다음에, 각 문자 화상의 외접 직사각형 내의 화상으로부터, 가장자리 성분을 취출해서 특징 벡터를 획득한다. 획득된 특징 벡터를 미리 등록된 문자 인식 사전의 특징 벡터와 비교하여 유사도를 획득한다. 가장 높은 유사도를 갖는 문자 유형의 코드가 직사각형 내의 문자 화상의 문자 코드로서 판별된다. 그 결과, 문자 코드가 할당되는 데이터가, 텍스트 영역 내의 모든 문자들의 외접 직사각형들에 대하여 획득되고, 각 텍스트 영역으로부터 획득된 문자 코드군이 문자 코드열이 된다.

영문의 문자 영역의 경우에, 문자들 간에 단어 간 스페이스가 존재하는지의 여부가 판별된다. 예를 들어, 문자들 간의 거리가 넓은지의 여부를 판별하거나, 문자 화상의 문자 인식 결과인 문자열과 단어사전의 매칭에 의해서 단어 사이의 단절을 검출함으로써, 단어 간 스페이스가 존재하는지의 여부를 판별할 수 있다. 단어 간 스페이스가 존재한다고 판별된 경우에는, 스페이스의 문자 코드를 문자코드 열에 삽입한다.

도 10 및 도 11은, 도 8에 도시된 텍스트 영역(801)에 대하여 문자 인식 수행의 예들을 도시한다. 우선, 도 10에 도시된 텍스트 영역(1000)으로부터 문자행들(1001 및 1002)을 잘라낸다. 그 후 3개의 문자들(1011, 1012 및 1013)을 문자열(1001)로부터 잘라내어, 각 문자에 대하여 인식을 수행한다. 그 결과, 각 문자에 대응하는 문자 코드가 얻어지고, 도 11에 도시돤 바와 같이 문자 코드열 데이터(1101)가 획득된다. 마찬가지로, 문자행(1002)으로부터 잘라내진 3 문자들(1021, 1022 및 1023)에 대하여 문자 인식이 수행되어, 도 11에 도시된 바와 같이 문자 코드열 데이터(1102)가 생성된다.

상기 처리는 일례이며, 다른 공지의 문자 인식 기술을 이용하여 문자 코드열이 취득될 수 있다.

단계 S206에서, CPU(102)는 영역 데이터 및 문자 코드열 데이터와 관련된, 현재 처리 대상인 페이지 화상 데이터를 메모리(103) 또는 하드 디스크(104)에 일시적으로 저장한다.

단계 S207에서, CPU(102)는 미처리된 화상 데이터가 있는지의 여부를 판별한다. 만일 미처리된 화상 데이터가 있으면(단계 S207에서 예), 처리는 단계 S203으로 복귀하고, CPU(102)는 다음 페이지 화상 데이터를 처리한다. 만일 미처리된 화상 데이터가 없으면(단계 S207에서 아니오), 처리는 단계 S208로 진행한다.

단계 S208에서, CPU(102)는 메모리(103) 또는 하드 디스크(104)에 저장된 모든 페이지의 데이터를 페이지 순서대로 결합하여 복수의 페이지를 포함하는 검색가능한 전자 문서를 생성한다.

단계 S208에서 생성된 전자 문서 데이터는, 각 페이지 화상을 디스플레이에 전자적으로 표시하거나 또는 프린터에 의해 인쇄하기 위한 렌더링 정보와, 검색 키워드를 이용하여 검색할 수 있게 하기 위한 내용 정보의 양쪽을 유지할 수 있다. 그러한 조건을 만족하는 데이터 포맷의 예는, PDF 및 SVG가 있다. 본 실시예에서 생성되는 전자 문서의 포맷은, 매립될 폰트 데이터를 더 지정한다. 그러한 폰트 데이터의 매립이 필수적인 포맷의 예는, XPS이다. 그리하여, 본 실시예는 페이지 기술 포맷의 사양이 XML 표현을 사용한다고 가정하면서 설명한다. 그러나, 본 발명은 이러한 포맷에 한정되지 않는다.

도 6은 2페이지에 대응하는 페이지 화상들을 포함하는 문서가 입력되었을 경우에, 본 예시적인 실시예에서 기술되는 페이지 기술 포맷의 사양에 기초하여 생성된 전자 문서의 페이지 기술 예이다. 본 예시적인 실시예의 페이지 기술 포맷은 도 6에 나타낸 바와 같은, 1개의 파일에서 전자 문서를 집합적으로 기술한다. 그러나, 본 발명은 이러한 포맷에 한정되지 않는다. 예를 들어, 페이지 기술 포맷은 폰트 데이터를 별도의 파일로 구분하여 저장하여 본체 파일(main file)로부터 폰트 데이터 파일을 참조하도록 하고, 그 파일들을 ZIP 압축을 이용하여 파일들을 하나의 전자 문서에 모으는 포맷(XPS 등)일 수 있다.

단계 S208에서 수행되는 전자 문서 데이터 생성 처리의 예가 도 4에 도시된 흐름도를 참조하여 아래에서 설명될 것이다.

단계 S401에서, CPU(102)는 전자 문서의 개시 태그를 기술한다. 본 예시적인 실시예의 페이지 데이터 기술 포맷 사양에서, <Document>는 전자 문서의 개시 태그를 나타내고, <Document>와 <Document>의 종료를 나타내는 </Document> 사이의 XML 기술은 문서에 포함된 각 페이지의 기술 데이터이다. 도 6에 도시된 기술 예에서, <Document>(601)는 전자 문서의 개시 태그이고, </Document>(612)는 전자 문서의 종료 태그이다.

단계 S402에서, CPU(102)는 아직 기술되지 않은 페이지들에서 제1 페이지의 데이터를 처리 대상으로서 식별한다.

단계 S403에서, CPU(102)는 처리 대상 페이지 데이터의 개시를 나타내는 태그를 기술한다. 본 예시적인 실시예에서, <Page>는 페이지 데이터의 개시를 나타내고, <Page>와 페이지 데이터의 종료 태그인 </Page> 사이의 XML 기술은 페이지의 렌더링 데이터 및 내용 데이터이다. 또한, 각각 페이지의 화소 폭과 높이를 나타내는 Width 속성 및 Height 속성, 및 해상도를 나타내는 Dpi 속성이 <Page> 태그에 포함되어 페이지의 물리적 크기를 기술한다. 또한, 페이지 수를 나타내는 Number 속성이 페이지 수를 기술하기 위해 사용된다.

도 6에 도시된 기술예에서, 페이지 요소의 개시 태그인 <Page>(602)는 페이지의 폭(즉, Width 속성값)이 "1680", 높이(즉, Height 속성값)가 "2376", 해상도(즉, Dpi 속성값)가 "200", 그리고 페이지 수(즉, Number 속성값)가 "1"이라는 기술을 포함한다. 또한, <Page>(602)와 종료 태그인 </Page>(606) 사이(즉, <Image> 요소(603) 내지 <Text> 요소(605))에 제1 페이지의 데이터가 기술된다.

단계 S404에서, CPU(102)는 페이지에 포함된 데이터 중에서 화상 렌더링 데이터를 가리키는 태그를 생성하고, 화상 묘사 데이터를 기술한다.

본 설명의 페이지 데이터 기술 포맷 사양에서 하나의 <Image> 요소는 하나의 화상의 렌더링 데이터를 표현한다. 또한, 화상 데이터의 내용은 데이터 속성에 기술되고, 페이지에서 화상이 렌더링되는 위치는 속성들 X, Y, Width 및 Height의 좌표 정보를 사용하여 기술된다. 만약 페이지에 복수의 화상이 있다면, 각 화상 데이터는 나타나는 순서대로 겹쳐써진다(overwritten). 화상 데이터의 내용은 압축된 화상 데이터 형태로 Data 속성 내에 기술된다. 본 예시적인 실시예에서, 컬러 또는 그레이 화상은 JPEG 압축에 의해 압축되고, 2치 화상은 MMR 압축에 의해 압축되어 Data 속성의 화상 데이터의 내용을 기술하는데 사용되는 코드열을 획득한다.

기술 예에 따르면, 도 6에 도시된 <Image> 요소(603) 내에서, 문서의 제1 페이지의 스캔 화상이 전체 페이지에 대하여 렌더링될 것이다. 화상의 위치 및 크기는 <Image> 요소(603) 내에서 X="0", Y="0", Width="1680", Height="2376" 과 같이 기술된다. 또한, 화상에 대하여 JPEG 압축을 수행함으로써 생성된 코드열의 문자열은 Data 속성값으로서 기술된다. 도 6에서 Data 속성의 문자열은 도면을 간단하게 하기 위해서 부분적으로 생략된다. 그리하여, <Image> 요소(603)가 기술된다. 스캔 화상의 해상도는 JPEG 압축을 수행한 후 화상을 저장하기 전에 변경될 수 있다. 예를 들면, 600dpi의 해상도에서 스캔된 화상은 300dpi의 해상도로 변경되어 저장될 수 있다.

단계 S405에서, CPU(102)는 페이지에 포함된 데이터 중에서 텍스트의 렌더링 데이터를 나타내는 기술을 생성한다.

본 설명의 페이지 기술 포맷 사양에서, 하나의 <Text> 요소는 한 행의 문자들의 렌더링 데이터를 나타낸다. <Text> 요소에 기술된 속성 데이터는 "Direction", "X", "Y", "Font", "Size", "Color", "String", 및 "CGlyphId"를 포함한다.

<Text> 요소의 "Direction" 속성은 문자열이 수직 방향으로 써져야 하는지 수평 방향으로 써져야 하는지를 기술한다. "Direction" 속성이 기술되지 않았다면, 디폴트 방향(예를 들어 왼쪽에서 오른쪽으로 수평 방향으로)이 사용된다. "X", "Y" 속성들은 문자 개시 위치의 좌표를 지정한다.

"Font" 속성은 문자 코드를 렌더링하기 위해 사용된 폰트 데이터 ID를 지정한다. "Size" 속성은 폰트 크기를 지정한다. "Color" 속성은 문자가 렌더링될 때, R 성분값, G 성분값, B 성분값 및 투명도를 나타내는 알파 채널을 포함하는 4개의 값들의 군에 의해 문자색을 지정한다.

"String" 속성은 문자열(즉, 문자 코드열)의 내용들을 지정한다. "CGlyphId" 속성은 "String"의 각각의 문자들을 렌더링할 때 사용되는 자형 데이터의 ID들, 즉 글리프들의 ID들을 지정한다.

<Text> 요소 데이터에 포함되는 문자 코드열은 도 2에 도시된 단계 S205에서 생성된 문자 코드열을 사용한다. 단계 S205에서 생성된 문자 코드열은 각 문자행, 즉 종으로 또는 횡으로 늘어선 문자들의 군으로 더 분할된다.

도 6에 도시된 기술예에서, 2개의 <Text> 요소들(604 및 605)은 제1 페이지의 문자들을 렌더링하기 위한 기술들이다. <Text> 요소들(604 및 605)은 도 11에 도시된 문자 코드열 데이터(1101 및 1102)에 각각 대응한다. 예를 들어, 아래에 기술된 속성들은, 도 11에 도시된 수평 방향으로 쓰여진 문자열 "X1A"의 문자 코드열 데이터(1101)에 대응하는 <Text> 요소(604)에서 지정된다.

문자 코드열 데이터(1101)에서, X="236" 및 Y="272"는 3개의 문자들을 둘러싸는 외접 직사각형의 좌측위 좌표로서의 X, Y 속성들을 지정한다.

또한, "Font 01"은 폰트의 유형을 나타내는 "Font" 속성으로 지정되어 있다. 또한, "97" 화소가 문자행의 문자 높이로부터 유추하여 획득된 폰트 크기를 나타내는 Size 속성으로 지정된다. R 성분값 = G 성분값 = B 성분값 = 0 및 알파 채널 = 255(즉, 투명색)가, 문자들을 렌더링할 때 문자색을 나타내는 Color 속성으로 지정된다.

또한, "0x2358, 0x2332, 0x2341"이 문자열(즉, 각 문자에 대응하는 문자 코드들의 열)의 내용을 나타내는 "String" 속성으로 지정된다.

각 문자의 자형 데이터로서 사용되는 글리프의 ID가 <Text> 요소에 기술된 "CGlyphId" 속성에 지정된다. 본 예시적인 실시예에서, 글리프의 ID는 단계 S205에서 획득된 각 문자의 폭 정보에 기초하여 지정된다. 문자의 자형은 스캔 화상 상에서 투명색으로 렌더링될 것이기 때문에, 사용자는 문자를 볼 수 없다. 따라서, 문자 화상 자체의 형상인 자형을 사용하는 대신, 사용될 자형 데이터(즉, 글리프)는 직사각형 등의 간단한 형태들의 수 개의 자형 데이터(예를 들어, 8개의 글리프 유형들)로부터 선택된다. 즉, 직사각형 폭들이 상이한 복수의 글리프(또는 애스팩트 비들이 상이한 복수의 글리프)로부터 각 문자에 적합한 글리프를 선택하도록 제어가 수행된다. 그리하여, 본 예시적인 실시예에서, 문자가 포함된 행의 높이와 문자 폭 사이의 비율에 기초하여 글리프 ID가 선택된다.

도 15는 화상 처리 장치(100)에 의해 수행되는, 각 문자 화상에 대하여 글리프 ID를 선택하기 위한 동작의 예를 도시하는 흐름도이다. 단계들 S1501 내지 S1507에서, 문자 폭 및 행 높이 사이의 비율은 7/8, 6/8, 5/8, 4/8, 3/8, 2/8 및 1/8과 비교된다. 비교의 결과로서, 처리는 단계들 S1508 내지 S1515 중 하나로 진행하여 글리프 ID들 0 내지 7로부터 글리프 ID를 선택한다.

비율(문자 폭/행 높이) > 7/8 이라고 판정될 경우에, 글리프 ID=0이 선택된다. 7/8 ≥ (문자 폭/행 높이) > 6/8이라고 판정되면, 글리프 ID=1이 선택된다. 6/8 ≥(문자 폭/행 높이) > 5/8라고 판정되면, 글리프 ID=2가 선택된다. 5/8 ≥(문자 폭/행 높이) > 4/8라고 판정되면, 글리프 ID=3이 선택된다. 4/8 ≥(문자 폭/행 높이) > 3/8이라고 판정되면, 글리프 ID=4가 선택된다. 3/8 ≥(문자 폭/행 높이) > 2/8라고 판정되면, 글리프 ID=5가 선택된다. 2/8 ≥(문자 폭/행 높이) > 1/8이라고 판정되면, 글리프 ID=6이 선택된다. 만약 (문자 폭/행 높이) ≤ 1/8이라고 판정되면, 글리프 ID=7이 선택된다. 본 예에서, 글리프의 직사각형 폭은 글리프 ID 번호가 감소함에 따라 증가한다.

예를 들어, 도 11에 도시된 문자열(1101)에서는, 각 문자 화상의 (문자 폭/행 높이)가 "0.82", "0.14" 및 "0.57"이다. 그리하여, 도 15에 도시된 선택 처리에 따라, 글리프 ID들은 "1, 6, 3"으로서 지정된다. 유사하게, 영어 문장의 단어간 스페이스에 관해서도 마찬가지로, 스페이스의 폭을 문자 폭과 같이 취급하는 것에 의해, 스페이스가 포함되어 있는 문자 행의 높이와 그 스페이스의 폭과의 비율에 기초하여 글리프 ID가 선택된다. 글리프 형상들은 아래에서 상세하게 설명될 것이다.

상술된 속성값들은 일례이며, 속성들은 정의가 유사한 다른 값들에 의해 기술될 수 있다. 예를 들면, 폰트 크기를 나타내는 Size 속성은 화소 높이에 기초한 점의 개수 및 화소들의 개수 대신 화상 해상도와 같은 값에 의해 기술될 수 있다.

단계 S406에서, CPU(102)는 페이지의 종료를 나타내는 </Page>를 기술한다.

단계 S407에서, CPU(102)는 기술되지 않은 페이지가 있는지의 여부를 판별한다. 기술되지 않은 페이지가 있는 경우(단계 S407에서 예), 처리는 단계 S403으로 복귀하여 다음 페이지가 처리될 페이지 화상이 된다. 한편, 기술되지 않은 페이지가 없을 경우(단계 S407에서 아니오), 처리는 단계 S408로 진행한다.

본 예시적인 실시예에서, CPU(102)는 단계 S404 내지 S406의 처리들을 제2 페이지에 대응하는 화상에 대하여 수행하고, 도 6에 도시된 기술예의 페이지 요소(607)와 </Page>(610) 사이의 요소들을 기술한다.

단계 S408에서는, CPU(102)는 이 전자 문서에서 문자열의 렌더링에 사용되는 모든 글리프들을 포함하는 폰트 데이터의 내용을 기술한다.

본 예시적인 실시예의 페이지 데이터 기술 포맷 사양에서는, 와 사이에, 폰트 데이터에 포함되는 글리프 데이터가 글리프 요소로서 기술된다. 요소는, 폰트의 유형을 나타내는 ID 속성을 포함한다. 글리프 요소는 글리프의 유형을 나타내는 ID 속성과, 그 ID에 대응하는 글리프(자형)을 나타내는 Path 속성을 포함한다. Path 속성은, 좌측아래 위치가 원점인 렌더링 직사각형 내에서, 직선이나 곡선을 사용해서 글리프를 표현하도록 기술된다.

도 6에 도시된 기술 예에서는, 요소(611)에서, Id="FontO1"인 폰트가 정의되어, 글리프 Id="0" 내지 "7"인 8개의 글리프 유형들이 정의된다. 예를 들어, Id="7"의 글리프의 형상을 표현하는 Path 속성 "MO, O V-1024 H128 V1024 f"은, "원점(0, 0)으로 이동(MOVE), 윗방향으로 1024 단위의 종선을 렌더링, 우측 방향으로 128 단위의 횡선 렌더링, 아래 방향으로 1024 단위 종선 렌더링, 현재의 점으로부터 개시 점까지 선을 렌더링해서 둘러싸인 구역을 표시한다"고 정의되는 글리프를 기술한다. 즉, Path 속성은, 1024×128의 직사각형을 표시하는 직사각형 글리프를 표현하는 기술이다. 다른 ID들은, ID = "7인" 글리프가 수평 방향으로 단계적으로 정수배되는 직사각형 글리프들이다. 예를 들어, ID = "0"은 1024×1024를 표시하는 정사각형 글리프를 표현하는 기술이다.

또한, 도 6에 도시된 요소(611)의 기술은 일례이며, 삼각형이나 원, 또는 직선 등의 단순한 자형을 정의할 수 있고, 공백(즉, 스페이스)을 글리프(자형)로서 정의할 수 있다.

단계 S409에서, CPU(lO2)는 전자 문서의 종료를 나타내는 </Document>를 기술하고, 전자 문서의 생성을 종료한다. 생성된 전자 문서는 파일로서 화상 처리 장치(100) 내의 메모리(103) 또는 하드 디스크(104)에 파일로서 저장된다. 전자 문서를 저장할 때는 공지의 텍스트 압축 기술을 사용하여 전자 문서가 압축될 수 있다.

도 2를 참조하면, 단계 S209에서, CPU(102)는 단계 S208에서 생성된 전자 문서를, 단계 S201에서 지정된 수신처(예를 들어 화상 처리 장치(110))에, 지정된 송신 방법을 이용하여 송신한다. 데이터 전송 처리는 종래 기술을 사용하기 때문에 설명은 생략한다.

수신처인 화상 처리 장치(110)는, 네트워크 인터페이스(114)를 통해서 전송된 전자 문서를 수신하고, 전자 문서를 하드 디스크(113)에 저장한다. 데이터 수신 처리는 종래 기술을 사용하기 때문에 설명은 생략한다.

장치 내에 저장된 전자 문서를 하드 디스크에서 식별하기 위한 식별 정보(파일명 등)은 임의의 정보일 수 있다. 예를 들어, 전자 문서가 수신된 시각에 관련된 문자열이 식별 정보로서 부여될 수 있다. 또한, 고유한 번호를 선택해서 자동 부여하거나, 전자 문서 생성 시에 사용자가 지정할 수 있다.

전자 문서를 검색 및 열람하는 처리의 예를 도 3에 도시된 흐름도를 참조하여 아래에서 설명한다. 본 예시적인 실시예에서는, 화상 처리 장치(110)가 검색을 수행한다. 그러나, 본 발명은 본 실시예에 한정되지 않고, 화상 처리 장치(100)도 검색을 수행할 수 있다.

단계 S301에서, 사용자는 사용자가 검색하기 원하는 전자 문서의 텍스트에 포함되는 것으로 상정되는 검색 키워드를 입력한다. 사용자는 화상 처리 장치(110)에 저장된 전자 문서들에서 전자 문서의 문자열을 검색하기 위하여 UI(115)로부터 키워드를 입력한다. 본 예시적인 실시예에서, 입력 문자열의 길이는 k로 나타낸다.

단계 S302에서, CPU(111)는 화상 처리 장치(110)의 하드 디스크(113) 내에 저장된 모든 전자 파일들 중에, 검색되지 않은 전자 문서 파일이 있는지의 여부를 판별한다. 검색되지 않은 전자 문서 파일들이 있는 경우(단계 S302에서 예), CPU(111)는 검색되지 않은 전자 파일들 중 하나를 식별한다. 식별된 전자 파일이 압축되어 있으면, CPU(111)는 파일을 전개한다. 처리는 단계 S303으로 진행한다. 한편, 검색되지 않은 전자 문서가 없는 경우(단계 S302에서 아니오), 처리는 단계 S312로 진행한다. 단계 S312에서, CPU(111)는 모든 전자 문서들의 검색이 종료되었다는 것을 사용자에게 통지한다.

단계 S303에서, CPU(111)는 단계 S302에서 식별된 전자 문서의 텍스트 데이터의 검색을 준비한다. CPU(111)는 문서 내에서 텍스트(문자 코드)를 한 줄로 정렬하고 검색 개시 위치 n을 초기화, 즉 n = 0으로 설정한다.

단계 S303에서 수행되는 처리의 예가 아래에서 설명될 것이다.

전자 문서 데이터는 XML 파서에 의하여 파스되고, <Text> 요소가 있을 경우, String 속성에 기술된 문자 코드열이 획득된다. 그 후 String 속성에 기술된 문자 코드열에 따라, 문자 코드와 전자 문서 데이터에서 그 문자 코드값이 기술된 위치의 쌍이, 각 문자에 대해 문자 코드 시퀀스 표에 부가된다. 문자 코드값의 기술 위치는, 전자 문서 데이터에 문자 코드가 기술된, 문자 코드열의 선두의 위치이며, 전자 데이터의 선두로부터 계수된 문자들의 수에 의해 나타낸다. 도 6의 전자 문서로부터 생성된 문자 코드 시퀀스 표의 예는 도 12에 도시된다.

예를 들어, 3개의 문자 코드 "Ox2358", "Ox2332" 및 "Ox2341"이 도 6에 도시된 전자 문서의 <Text> 요소(604)의 String 속성에 기술된다. 각 문자 코드는 전자 문서의 선두로부터 각각 1093 문자들, 1100 문자들, 및 1107 문자들인 위치들로 기술된다. 유사하게, 남아있는 6개의 문자 코드들의 기술 위치들이 <Text> 요소들(605 및 609)에 기초하여 획득되어 도 12에 도시된 것과 같은 문자 코드 시퀀스 테이블이 생성된다. 도 12에 도시된 표에서, 문자열 번호가 0부터 순서대로 부여된다.

단계 S304에서, CPU(111)는, 탐색 개시 위치 n을 원점으로 설정함으로써, 문자 코드 시퀀스 표가 검색 키워드의 문자 코드열과 일치하는지의 여부를 판별한다. 일치하는 부분을 검출했을 경우(단계 S304에서 예), 일치 부분의 변수 n을 일치 문자열의 선두 위치로 설정하고, 처리는 단계 S305로 진행한다. 한편, 만약 일치하는 부분이 없을 경우(단계 S304에서 아니오), 처리는 단계 S309로 진행한다.

단계 S309에서, CPU(111)는 문자 코드 시퀀스 표의 모든 문자들이 검색되었는지의 여부를 판별한다. 문자 코드 시퀀스 표에 저장된 모든 문자 코드열들이 검색되었음을 CPU(111)가 판별하였을 때(단계 S309에서 예), 처리는 단계 S311로 진행한다. 단계 S311에서, CPU(111)는 현재 검색 대상인 전자 문서의 검색이 종료되었음을 사용자에게 통지한다. 한편, 모든 검색들이 완료되지 않았다면(단계 S309에서 아니오), 처리는 단계 S310으로 진행한다.

단계 S310에서, CPU(111)는 변수 n을 1만큼 증가시키고 단계 S304로 복귀한다. 단계 S304에서, CPU(111)는 문자 코드열 표가 검색 키워드의 문자 코드열과 다음 검색 개시 위치 n에서 일치하는지의 여부를 판별한다. 문자 코드 시퀀스 표에 저장된 문자 코드들의 전체 개수는 N이고, n < (N-k)이면 모든 검색이 완료되지 않았다고 판별될 수 있다. 단계 S309에서, n ≥ (N-k)이면 검색이 완료되었다고 판별된다.

예를 들어, 도 12에 도시된 문자 코드 시퀀스 표가 검색 키워드 "YB"에 의해 검색될 경우, 검색 키워드 "YB"의 문자 코드열 "0x2359", "0x2342"가 위치를 일치시키기 위해 검색하기 위해 문자 코드 시퀀스 표의 선두로부터 스캔된다. 그러한 경우, 단계들 S304, S309 및 S310의 처리들이 반복되고, 제1 일치 문자열의 문자열 번호로서 n = 3이 추출된다.

단계 S305에서, CPU(111)는 문자열 번호 n에 대응하는 문자열 데이터가 속하는 전자 문서의 페이지를 식별한다.

예를 들어, 전자 문서가 파스될 때 <Text> 요소를 기술하는 Page 요소가 식별된다면 페이지 수가 Number 속성에 의해 식별될 수 있다. 그리하여, 단계 S305에서 식별된 위치 n에 대응하는 문자열의 기술 위치를 도 12에 도시된 표로부터 획득함으로써 문자열이 속하는 페이지가 식별될 수 있다. 그 후 기술 위치가 포함되는 Page 요소가 판별될 수 있다. 페이지 수는 문자열 번호에 기초하여 용이하게 식별될 수 있고, 단계 S303에서 전자 문서 데이터를 파스할 때, 각 <Text> 요소가 기술되는 Page 요소가 식별된다면 그 위치는 도 12에 도시된 문자 코드 시퀀스 표에 저장될 수 있다. 본 발명은 전술된 예들에 한정되지 않는다. 단계 S304에서 일치 문자열들을 검출하는 것 또는 단계 S305에서 페이지 수를 식별하는 것은 다른 방식들로 수행될 수 있다.

단계 S306에서, CPU(111)는 단계 S305에서 판별된 페이지 렌더링 기술에 따라 페이지를 렌더링하여 그 결과를 UI(115) 상에 표시한다. 이 점에 있어서, 문자열 번호들 n과 n+k-1 사이에 포함된 문자가 렌더링되어야 한다면, CPU(111)는 문자가 위치한 곳을 사용자가 쉽게 식별할 수 있도록 강조 효과를 부가함으로써 문자를 렌더링한다. 검색 키워드와 일치하는 부분에 강조 효과를 부가하는 것은 아래에서 상세하게 설명될 것이다.

도 5에 도시된 흐름도를 참조하여 단계 S306에서 수행되는 페이지 렌더링 처리가 기술될 것이다.

단계 S501에서, CPU(111)는 렌더링 결과로서 획득될 페이지 화상의 크기를, 식별된 페이지 수에 대응하는 Page 요소에 포함된 Width 속성 및 Height 속성들의 값들로부터 판별한다.

단계 S502에서, CPU(111)는 페이지 화상에 대한 화소 정보를 저장할 수 있는 메모리를 할당한다.

단계 S503에서, CPU(111)는 Page 요소의 하위 요소들(subelements)로부터 처리되지 않은 요소를 추출하고 처리되지 않은 요소의 유형을 판별한다. 처리되지 않은 요소가 <Image> 요소(단계 S503의 <Image>)라면, 처리는 단계 S504로 진행하고, 처리되지 않은 요소가 <Text> 요소(단계 S503의 <Text>)이면, 처리는 단계 S505로 진행한다. Page 요소의 모든 하위 요소들이 처리된 경우에(단계 S503에서 없음), 처리는 단계 S517로 진행한다.

단계 S504에서, CPU(111)는 <Image> 요소에 Data 속성값으로서 기술된 압축된 화상을 래스터라이즈(rasterize)한다. 또한, CPU(111)는 래스터라이즈된 화상을 스케일하여, X, Y, Width, 및 Height 속성들 각각에 의해 정의된 페이지 화상의 렌더링 직사각형 영역에 화상이 충분히 들어맞도록 한다. 그 후 CPU(111)는 단계 S502에서 할당된 페이지 화상 메모리의 영역에 화상을 덮어쓰고, 처리는 단계 S503으로 복귀한다.

단계 S505에서, CPU(111)는 처리 대상인 <Text> 요소에 기술된 속성들 각각으로부터 문자 개시 위치(X, Y), 문자 폰트 ID(F), 문자 크기(S), 및 문자색(C)을 획득한다. 또한, CPU(111)는 <Text> 요소 내에 기술된 문자들의 수(N)를 획득한다.

단계 S506에서, CPU(111)는 글리프 화상을 생성하기 위한 메모리를 할당한다. 본 예시적인 실시예에서, CPU(111)는 1024×1024 화소의 2치 화상을 저장하기 위한 메모리를 할당한다.

단계 S507에서, CPU(111)는 처리하고 있는 문자를 나타내는 카운터 i를 1로 초기화한다.

단계 S508에서, CPU(111)는 i > N인지의 여부를 판별하고, 만약 i ≤ N이면(단계 S508에서 아니오), 처리는 단계 S509로 진행한다. 한편, i > N이면(단계 S508에서 예), CPU(111)는 <Text> 요소의 처리가 완료되었다고 판별하고 단계 S503으로 복귀한다.

단계 S509에서는, CPU(111)가 <Text> 요소의 String 속성으로부터 i번째 문자의 문자 코드(P)를 획득하고, CGlyphId 속성으로부터 i번째 문자의 GlyphId (Q)를 획득한다.

단계 S510에서, 폰트 Id가 (F)인 요소 기술의 전자 문서에서의 위치를 알아낸다. 또한, CPU(111)는 요소 기술의 하위 요소들로부터의 글리프 Id가 (Q)인 Glyph 요소로부터 Path 속성을 획득한다.

단계 S511에서, CPU(111)는 단계 S510에서 획득된 Path 속성값에 따라, 단계 S506에서 할당된 글리프 화상 생성 메모리에 글리프 2치 화상을 생성한다. 글리프 2치 화상은 렌더링될 부분이 1로 표현되고, 렌더링되지 않는 부분이 0으로 표현되는 화상이다. 본 예시적인 실시예에서, 렌더링될 부분(1)은 후에 투명색으로 렌더링된다.

단계 S512에서, CPU(111)는 문자 크기 속성(S)의 값에 따라 글리프 2치 화상의 크기를 직사각형 크기로 스케일한다. 스케일된 글리프 2치 화상이 렌더링되어야 하는 부분(1)의 폭이 스케일된 글리프 폭 Wi로서 획득된다.

단계 S513에서, CPU(111)는 단계 S512에서 스케일되는 글리프의 2치 화상을 페이지 화상 메모리의 좌표 위치(X, Y)에 기초하여 직사각형 영역 상에 렌더링한다. 2치 화상이 페이지 화상 상에 렌더링될 때 각 화소의 화소값들은 아래에 기술된 것과 같이 정의된다. 정의에서, 글리프를 렌더링하기 전의 페이지 화상 내의 각 화소값은 (r, g, b)이고, 글리프를 렌더링한 후의 화소값은 (r', g', b')이다.

글리프 2치 화상의 화소값이 0인 화소: (r', g', b') = (r, g, b)

글리프 2치 화상의 화소값이 1인 화소: (r', g', b') = (F(r, Cr), F(g, Cg), F(b, Cb)

전술된 정의들에서, F(r, Cr) = (r×A + Cr×(255-A))/255, F(g, Cg) = (g×A + Cg×(255-A))/255, F(b, Cb) = (b×A + Cb×(255-A))/255이다. 또한, A는 문자색 C의 알파 채널값이고, Cr, Cg 및 Cb는 문자색 C의 R, G, 및 B 값들 각각이다. 255가 알파 채널값으로 지정되는 경우에, 글리프 2치 화상은 투명하다. 그리하여, 글리프 2치 화상의 화소값이 1일 때 하나의 화소에 대하여 (r', g', b') = (r, g, b)이다.

단계 S514에서, CPU(111)는 처리되고 있는 i번째의 문자가 n과 n+k-1 사이에 포함된 문자인지의 여부를, 예를 들어, 도 12에 도시된 문자 코드 시퀀스 표를 이용하여 판별한다. 더욱 구체적으로는, n과 n+k-1 사이의 각 문자에 대한 기술 개시 위치를 시퀀스 표로부터 CPU(111)가 인식할 수 있기 때문에, CPU(111)는 그 위치들 중 하나가 처리되고 있는 문자 i의 개시 위치와 일치하는지의 여부에 기초하여 판별한다. i번째 문자가 n과 n+k-1 사이에 포함된 문자이면(단계 S514에서 예), 처리는 S515로 진행한다. 한편, i번째 문자가 n과 n+k-1 사이에 있지 않으면(단계 S514에서 아니오), 처리는 단계 S516으로 진행한다.

단계 S515에서, CPU(111)는, 처리중인 문자가 검색 문자열로서 검출된 부분 내에 있는 것을 나타내기 위한 강조 처리를 수행한다. 더욱 정확하게는 페이지 화상 메모리의 위치 (X,Y)로부터 시작하여, 문자열이 렌더링되는 구역에 상당하는 직사각형 영역 내의 각 화소에 대하여, 각 화소값 (r, g, b)를 아래에 기술된 바와 같이 화소값 (r', g', b')으로 변경한다.

(r', g', b') = (G(r), G(g), G(b))

(여기서 G(r) = 255 - r, G(g) = 255 - g, G(b) = 255 - b이다)

색을 반전시키는 전술된 강조 처리는 일례이며, 다른 강조 처리들이 수행될 수 있다. 예를 들어, 글리프 2치 화상의 화소값이 0인 화소는 변경되지 않고, 글리프 2치 화상의 화소값이 1인 화소의 화소값 (r, g, b) 각각이 위에서 기술된 바와 같이 (r', g', b')로 변경되는 처리가 수행될 수 있다.

단계 S516에서, CPU(111)는 다음 문자에 대하여 렌더링 개시 위치 X를 판별하고, i를 1만큼 증가시키고(즉, i = i + 1), 단계 S508로 복귀한다. 다음 문자의 렌더링 개시 위치 X는 스케일된 글리프 폭 Wi와 문자들 사이의 거리를 현재 문자의 렌더링 개시 위치에 더함으로써 계산된다. 본 예시적인 실시예에서, 문자 간격 및 문자들 사이의 거리와 같은 데이터는 데이터의 양을 감소시키기 위해서 저장되지 않는다. 그리하여 렌더링 개시 위치 X는 문자들 사이의 거리가 스케일된 글리프 폭 Wi의 10%라고 가정함으로써 계산된다. 그리하여, 다음 문자의 렌더링 개시 위치 X는 X = X + 1.1×Wi에 의해 계산된다. 문자들 사이의 거리는 전술된 것과 같이 계산되지 않아도 되고, 문자 크기 또는 미리 정해진 상수의 10% 일 수 있다.

단계 S517에서, CPU(111)는 하나의 페이지에 대응하는 렌더링 결과, 즉, Page 요소의 <Image> 요소 및 <Text> 요소의 기술들이 렌더링되는 페이지 화상 메모리의 내용을, UI(115)의 표시 버퍼에 전송한다. 그 후 CPU(111)가 결과를 표시한다.

도 6에 도시된 전자 문서의 제1 페이지의 렌더링 기술에 대한 예로서 도 5에 도시된 흐름도의 처리가 아래에서 기술된 것과 같이 수행된다.

단계 S501의 처리를 수행할 때, CPU(111)는, 도 6에 도시된 제1 페이지의 Page 요소(602)에 기술된 Width 속성값 = "1680" 및 Height 속성값 = "2376"에 기초하여, 페이지의 화상 크기를 1680×2376와 같이 판별한다.

단계 S502에서, CPU(111)는 페이지 화상이 R, G, B 24비트 컬러 화상으로서 표현되는 경우 1680×2376×3byte의 메모리를 할당한다.

단계 S504에서, 도 6에 도시된 <Image> 요소(603)의 Data 속성값으로서 기술된 압축된 코드가 화상으로 래스터라이즈되어, 페이지 화상 메모리의 전체 영역 상에 화상이 덮어써진다. 본 예시적인 실시예에서, 화상 데이터의 화소 크기가 원본 페이지와 동일한 크기인 1680×2376 화소이기 때문에 스케일 처리가 수행되지 않는다.

단계 S505에서, CPU(111)는 <Text> 요소(604)에 포함된 속성들 각각으로부터 X = "236", Y = "272", 문자의 개수 N = "3", 문자 폰트 ID = "Font01", 문자 크기 = "97", 및 문자색 = "0, 0, 0, 255"를 획득한다.

단계 S509에서, CPU(111)는 String 속성 = 0x2358 및 Glyph ID = "1"의 제1 문자 코드를 <Text> 요소(604)로부터 획득한다.

그 후, 단계 S511에서 글리프 2치 화상을 생성하기 위하여, 획득된 문자 폰트 ID="Font01"에 대응하는 글리프의 Path 데이터를, 단계 S510에서 CPU(111)가 획득한다. 본 예시적인 실시예에서, CPU(111)는 도 6에 도시된 기술예의 요소(611) 내의 Glyph 요소의 Path 속성의 Id="1"을 획득한다.

그 후 단계 S511에서, CPU(111)는 Glyph 요소의 Id="1"에 대응하는 획득된 Path 속성 데이터에 기초하여 글리프 화상을 생성한다. 더욱 구체적으로는, 1024×896 화소의 직사각형 영역 전체가 Path 속성의 기술에 따라 1로써 표시된다. 그리하여 수직 방향으로 1024화소이고 수평 방향으로 896화소인 직사각형을 글리프 화상을 생성하기 위한 메모리로서 할당된 1024×1024화소의 영역의 좌측 단부에서부터 표시함으로써 글리프 화상이 생성된다.

단계 S512에서, CPU(111)는 문자 크기 "97"에 기초하여 1024×1024화소의 글리프 화상 생성 메모리를 97×97 화소로 스케일한다. 그리하여, 표시될 영역은 97×85화소(즉, 스케일된 글리프 폭 Wi = 85)가 된다.

단계 S513에서, 스케일된 글리프의 문자 화상은 페이지 화상 상의 위치 (X, Y) = (236, 272)로부터 시작되는 97×97 화소의 직사각형 영역에서 렌더링된다. 도 6에 도시된 기술예에서, 문자색 = 0, 0, 0, 255, 즉, 알파 채널값 A가 255이기 때문에, 글리프 2치 화상에 대응하는 화소값이 1이더라도 모든 경우들에 대해 (r', g', b') = (r, g, b)이다. 즉, 페이지 화상 내의 직사각형 영역 내의 화소값은 단계 S513의 처리를 수행하기 전후에 변화되지 않는다.

단계 S514에서, CPU(111)는 도 6에 도시된 <Text> 요소(604) 내의 제1 문자가, 문자열 번호들 n과 n+k-1 사이에 포함되는지의 여부를 문자 코드 시퀀스 표에 기초하여 판별한다.

본 예시적인 실시에에서, 도 6에 도시된 전자 문서로부터 도 12에 도시된 문자 코드 시퀀스 표가 생성된다고 한다. 또한, 단계 S304에서 검색 키워드와 일치한다고 판별된 문자열이 문자열 번호들 3과 4 사이라고 한다. 도 6에 도시된 <Text> 요소(604)의 제1 문자 코드는, 문자열 번호 3과 4 사이가 아니므로, 처리는 단계 S516으로 진행한다. <Text> 요소(604)의 제1 문자 코드 기술의 선두 문자 위치는 1093이고, 그것은 문자 코드 시퀀스 표의 문자열 번호들 3과 4 사이의 문자 기술 위치들과 일치하지 않는다. 그리하여, <Text> 요소(604)의 제1 문자는 문자열 번호들 3 내지 4 사이의 문자가 아니라고 판별될 수 있다.

한편, 단계 S514에서 도 6에 도시된 <Text> 요소(605)의 제1 문자가 문자열 번호들 n과 n+k-1 사이에 포함되는지의 여부를 CPU(111)가 판별하는 경우에, CPU(111)는 제1 문자 코드가 문자 코드 시퀀스 표의 문자열 번호들 3과 4 사이의 문자의 개시 위치와 일치한다고 판별한다. 그리하여, 단계 S515에서 강조 처리가 수행된다.

<Text> 요소(605)의 제1 문자에 대응하는 글리프 ID는 "0"이기 때문에, 페이지 화상 메모리의 위치 (236, 472)로부터 시작되는 92×92화소의 영역이 투명색으로 표시된다. 그리하여, 단계 S515에서, 페이지 화상 메모리의 위치(236, 472)로부터 시작되는 92×92 화소의 영역의 각 화소값 (r, g, b)를 (G(r), G(g), G(b))로 변경시킨다.

예를 들어, <Text> 요소(604)의 제1 문자 코드(렌더링 개시 위치는 (236, 272)임)를 렌더링했을 경우, 단계 S516에서, CPU(111)는 다음 문자의 렌더링 개시 위치 X를 236+1.1×85 = 330과 같이 계산한다. 그리하여, <Text> 요소(604) 내의 제2 문자 코드의 렌더링 개시 위치는 (330, 272)가 된다.

그 결과, 모든 <Text> 요소들의 기술들이 렌더링되었을 때, 도 13에 도시된 페이지 화상이 획득된다. 단계 S304의 검색 키워드와 일치한다고 판별된 문자열의 문자들에 대응하는 영역들에서 휘도가 반전된다. 나머지의 문자들에 대응하는 영역들은 <Image> 요소에 의해 렌더링된 화상 데이터와 동일하게 남아있는다.

전술된 바와 같이, 본 예시적인 실시예에 따르면, 검색된 문자열이 강조되어 표시되므로, 페이지에서 어디에 검색 키워드가 존재하는지를, 사용자는 단계 S306에서 표시된 페이지 화상을 보는 것으로써 용이하게 판별할 수 있다. 또한, 문자 폭과 일치하는 글리프가 투명색으로써 렌더링되기 때문에, 검색 시에 강조되는 문자와 문서 화상의 문자 화상의 위치가 더 근접하게 일치한다. 그리하여, 사용자가 검색 키워드를 식별하기 쉬워진다.

도 14a 및 도 14b는, 다른 강조 방법을 설정했을 경우, 어떻게 페이지 화상이 표시될지의 예들을 도시한다.

도 14a에 도시된 페이지 렌더링 기술에서, 폰트 데이터의 글리프들로서, 높이가 1024인 문자의 하부에서, 높이가 128이고 폭이 1024 내지 128인 표시된 직사각형들을 렌더링하는 8가지 유형들의 글리프를 정의한다. 도 4에 도시된 단계 S405에서 <Text> 요소의 속성 데이터를 기술할 때, 대응하는 문자 화상의 하부에, 각 글리프에 대응하는 낮은 높이의 투명한 직사각형의 문자가 렌더링된다. 그러한 페이지 렌더링 기술에서, 각 글리프의 직사각형 영역이 단계 S515의 강조 처리에서 반전 강조되면, 도 14b에 도시된 바와 같이 강조되는 페이지 화상이 생성된다. 그 결과, 사용자는, 검색된 부분이 밑줄 그어져 강조되어 있는 것을 볼 수 있게 되고, 사용자는 검색된 문자열이 페이지에서 어디에 존재하는지를 용이하게 판별할 수 있다.

도 3으로 돌아가면, 단계 S307에서, CPU(111)는 사용자가 검색 및 열람 처리를 종료할지, 또는 다른 검색 구역에서 검색을 계속할 지의 여부를 사용자가 선택할 수 있게 한다. 사용자가 처리를 종료하기로 선택하면(단계 S307에서 종료), 도 3에 도시된 처리를 종료하고, 사용자가 검색을 계속하기로 선택하면(단계 S307에서 계속)에는 처리가 단계 S308로 진행한다.

단계 S308에서, CPU(111)는, n = n + k이라고 n을 정의하고 단계 S304로 복귀하고, 검색 키워드와 일치하는 다음 부분을 검색한다.

위에서 설명한 바와 같이, 본 발명의 제1 예시적인 실시예에 따르면, 종이 문서가 전자 문서로 변환될 때, 페이지로부터 추출된 문자들이 페이지 화상 위에 투명 색으로 렌더링되어야 한다는 것이 전자 문서에 기술된다. 그리하여 사용자는 키워드와 일치하는 부분이 강조된 페이지 표시를 확인하면서 전자 문서를 검색하는 것이 가능하다.

전술된 전자 문서는, 문자 폭이 상이한 몇 개의 단순한 글리프들(직사각형과 같은 자형들)을 포함하는 폰트 데이터를 저장한다. 전자 문서는 전자 문서의 여러 가지 문자 유형들의 투명 문자들을 렌더링할 때, 각 문자 유형의 폭에 적합한 단순한 글리프(자형)을 선택해서 렌더링하도록 기술한다.

즉, 상이한 폭들을 갖는 8가지 유형들의 글리프들(자형들)과 같은 수 개의 글리프들(자형들)이 다수의 문자 유형들(예를 들어, 수백 가지의 문자 유형들)에 대하여 공유되고 사용된다.

또한, 투명 텍스트의 렌더링 위치를 각 문자에 대하여 (예를 들어, 문자의 위치 좌표를 사용하여) 미세하게 기술하지 않은 경우에도, 투명 텍스트의 렌더링 위치와 문서 화상의 각 문자 화상의 위치가 대략 일치한다. 그리하여, 전자 문서에서 사용되는 폰트 데이터를 전자 문서에 저장하는 것이 필요한 경우에도, 전자 문서의 파일 크기(즉, 데이터량)를 감소시킬 수 있다.

제2 예시적인 실시예

제1 예시적인 실시예에서는, 도 4에 도시된 단계 S405에서 텍스트 요소의 글리프 ID의 속성 데이터를 기술할 때, 각 문자의 폭 정보와 높이 정보에 기초하여, 각 문자에 대응하는 글리프를 판별하였다. 그러나, 본 발명은 제1 실시예에 한정되지 않는다.

예를 들어, 단계 S205의 문자 인식의 수행에 의해 획득한 각 문자 화상의 위치 정보를 사용하여, 주목 문자(subject character)의 좌측 단부와 다음 문자의 좌측 단부 사이의 거리(문자 간격)를 획득하고, 거리와 문자 행 높이의 비율에 기초하여, 글리프 ID가 선택될 수 있다. 또한, 주목 문자가 문자행의 최후의 문자인 경우에는 그 문자의 문자 폭이 거리로서 사용된다. 이러한 경우, 거리가 문자행 높이보다 클 수 있기 때문에, 폭이 높이보다 큰(폭이 1152 또는 1280 등인) 직사각형 글리프가 사용될 수 있다. 또한, 이러한 경우, 도 5에 도시된 단계 S516에서, 다음 문자의 렌더링 개시 위치 X는, X = X + Wi로서 획득된다.

그리하여, 전술된 바와 같이 문자 간격에 기초하여 글리프 ID를 선택하여서 생성한 전자 문서에 대하여 검색 처리가 수행될 때, 키워드와 일치하는 문자열의 문자들 사이의 스페이스도 강조된다.

전술된 바와 같이, 제2 예시적인 실시예에 따르면, 투명 텍스트의 렌더링 위치(문자의 위치 좌표 등)를 모든 문자들에 대하여 기술하지 않은 경우에도, 투명 텍스트의 렌더링 위치와 문서 화상의 각 문자 화상의 위치가 대략 일치한다. 또한, 저장될 글리프들의 총수는 한정된 수(예를 들어, 10개의 글리프들)이기 때문에, 폰트 데이터의 데이터량을 감소시킬 수 있다. 또한, 글리프의 형상이 단순화되므로, 글리프 데이터(자형 데이터)의 데이터량 자체도 감소시킬 수 있다.

제3 예시적인 실시예

본 발명의 제3 예시적인 실시예는 전술한 예시적인 실시예에서 도 5에 도시된 단계 S516과 상이한, 다음 문자의 렌더링 개시 위치 X를 판별하는 처리를 설명한다.

본 예시적인 실시예에서, CPU(111)는 전술한 예시적인 실시예의 도 2에 도시된 흐름도의 단계 S205의 문자 인식을 수행함으로써 식별되는 각 문자 화상의 위치 정보에 기초하여, 문자들 사이의 거리의 평균값을 계산한다. 그 후 도 4에 도시된 단계 S405에서 <Text> 요소를 기술할 때, 문자 영역의 문자들 사이의 거리의 평균값을 속성 데이터(AvC)로서 기술한다. 단계 S516에서, CPU(111)는 기술된 문자들 사이의 거리 평균값(AvC)을 사용하여, 다음 문자의 렌더링 개시 위치를 판별할 수 있다. 이러한 경우, 다음 문자의 렌더링 개시 위치는, X = X + Wi + AvC가 된다.

제4 실시예

전술된 예시적인 실시예에서, 스캔 화상을 JPEG 압축에 의해 압축함으로써 획득된 전체 화상을 <Image> 요소에 기술하고, 투명 텍스트를 <Text> 요소에 기술하는 전자 문서가 생성된다. 그러나, 본 발명은 상술된 실시예에 한정되지 않는다.

예를 들어, JPEG 압축에 의해 압축된 스캔 화상 전체를 기술하는 대신에, 문자 영역이나 도면 영역이 각 색에 대하여 2치 화상들로 변환되어 MMR 압축에 의해 압축되고, 다른 영역들은 JPEG 압축에 의해 압축될 수 있다. 그러한 기술들은 <Image> 요소에 저장될 수 있다. 이와 같이, 문서 화상에 포함되는 영역들을 분석해서 적절하게 압축하는 방법은, 일본 공개 특허 평07-236062호 공보 및 일본 공개 특허 제2002-077633호 공보에서 논의된다. 투명 텍스트를 렌더링하는 데 사용하는 폰트 데이터량을 감소시키는 처리 및, 상술된 화상 압축 처리를 조합함으로써, 더욱 고압축된(high-compressed) 전자 문서를 생성할 수 있다.

또한, 전체 이미지 대신에, 문자 영역, 도면 영역, 표 영역 또는 사진 영역 등의 영역만이 위치 데이터와 함께 저장될 수 있다.

제5 예시적인 실시예

전술한 예시적인 실시예에서는, 검색 결과에 대응하는 부분을 강조할 때, 화상의 색 (r, g, b)를 반전시켰다. 그러나, 사용될 수 있는 색들은 위의 색들에 한정되지 않는다. 예를 들어, 검색 결과를 특정하기 위해 미리 정한 색(황색 등)을 반투명(알파 채널(128) 등)으로 렌더링할 수 있다. 또한, 문자색(Cr, Cg, Cb)을 이용하여 강조색을 결정할 수 있다.

제6 예시적인 실시예

전술한 예시적인 실시예의 도 3 및 도 5에 도시된 흐름도들에서는, 키워드와 일치하는 문자열이 문서의 선두로부터 순차적으로 검색되어, 최초로 검색된 문자열이 강조된다. "다음 열(string)을 검색"하라는 지시가 있으면, 키워드와 일치하는 다음 문자열이 순차적으로 검색되어 강조된다. 그러나, 본 발명은 문서의 선두로부터 검색 키워드와 일치하는 문자열을 순서대로 검색하고 검색 키워드와 맞는 문자열을 강조하는 데 한정되지 않는다. 예를 들어, 전자 문서에 포함된 모든 문자열들이 검색 키워드와 비교될 수 있고, 모든 일치 문자열들이 특정되어 동시에 강조될 수 있다.

다른 예시적인 실시예들

본 발명의 전술한 예시적인 실시예들의 동작들을 실현하는 소프트웨어의 프로그램 코드(컴퓨터 프로그램)를 저장하는 컴퓨터 판독 가능한 저장 매체를 시스템 또는 장치에 공급함으로써도 전술한 예시적인 실시예들이 달성될 수 있다. 또한, 전술한 예시적인 실시예들은 시스템 또는 장치의 컴퓨터(CPU 또는 MPU(micro-processing unit))에 의해 판독되고 실행되는 저장 매체에 저장된 프로그램 코드(컴퓨터 프로그램)에 의해서도 달성될 수 있다.

컴퓨터 프로그램은 전술한 예시적인 실시예들의 흐름도들에 포함된 각 단계 를 실현한다. 즉, 컴퓨터 프로그램은 흐름도들에 포함된 각 단계의 각 처리 유닛에 대응하고, 컴퓨터를 기능시키기 위한 프로그램이다. 이 경우에, 컴퓨터 판독가능 매체로부터 판독된 컴퓨터 프로그램 자체는 전술된 예시적인 실시예들의 동작들을 실현하고, 컴퓨터 프로그램을 저장하는 저장 매체는 본 발명을 구성한다.

또한, 컴퓨터 프로그램을 공급하는 저장 매체는, 예를 들어, 플로피 디스크, 하드 디스크, 자기 테이프와 같은 자기 저장 매체, 광자기 디스크(MO), CD(compact disc), DVD(digital versatile disc), CD-ROM(CD read-only memory), CD-R(CD recordable)과 같은 광/광자기 저장 매체, 불휘발성 반도체 메모리, ROM 등일 수 있다.

또한, 프로그램 코드의 지시에 기초하고, 컴퓨터 상에서 가동하고 있는 OS 등이 컴퓨터 프로그램의 지시들에 따라 처리들의 일부 또는 전부를 수행하고, 전술된 예시적인 실시예들의 기능들을 실현할 수 있다.

전술된 예시적인 실시예들에서, CPU가 메모리, 하드 디스크, 표시 장치 등과 함께 흐름도의 각 단계를 실행한다. 그러나, 본 발명은 위의 구성에 한정되지 않고, 전용의 전자 회로가 각 흐름도에서 설명된 각 단계의 처리들의 일부 또는 전부를 CPU 대신 수행할 수 있다.

본 발명이 예시적인 실시예들을 참조하여 설명되었지만, 본 발명이 개시된 예시적인 실시예들에 한정되지 않는다는 것이 이해되어야 한다. 하기 청구항들의 범위는 그러한 모든 변형들 및, 구성들과 기능들의 등가물을 포함하도록 최광의의 해석에 따라야 한다.

본 출원은 2007년 6월 29일자로 출원된 일본 특허 출원 제2007-172737호의 이익을 주장하며, 그 전체가 본 명세서에 참조로서 포함된다.

Claims

화상 처리 장치이며,
각 문자 화상에 대응하는 문자 코드를 획득하기 위하여 문서 화상의 복수의 문자 화상에 대한 문자 인식을 수행하도록 구성된 문자 인식 유닛, 및
상기 문서 화상, 상기 문자 인식 유닛에 의해 획득된 복수의 문자 코드, 복수의 글리프(glyph), 및 상기 문자 코드들 각각을 렌더링하는데 사용될 글리프들을 나타내는 데이터를 포함하는 전자 문서를 생성하도록 구성된 생성 유닛
을 포함하고,
상기 인식 유닛에 의해 획득된 복수의 문자 코드에 대응하는 문자들을 렌더링할 때, 상기 복수의 글리프 각각이 상기 데이터에 기초하여 상이한 문자 코드들에 의해 공유 및 사용되는, 화상 처리 장치.
제1항에 있어서,
상기 문서 화상의 각 문자 화상의 문자 폭 및 문자 행 높이에 기초하여, 상기 복수의 글리프로부터 각 문자 화상에 대하여 사용될 글리프를 선택하도록 구성된 선택 유닛을 더 포함하고,
상기 문자 코드들을 렌더링하는데 사용될 글리프들을 나타내며 상기 전자 문서에 저장되는 상기 데이터는, 상기 문서 화상의 각 문자 화상에 대하여 상기 선택 유닛에 의해 선택된 글리프에 기초하여 기술되는, 화상 처리 장치.
제1항에 있어서,
상기 문서 화상의 각 문자 화상의 문자 간격 및 문자 행 높이에 기초하여, 상기 복수의 글리프로부터 각 문자 화상에 대하여 사용될 글리프를 선택하도록 구성된 선택 유닛을 더 포함하고,
상기 문자 코드들을 렌더링하는데 사용될 글리프들을 나타내며 상기 전자 문서에 저장되는 상기 데이터는, 상기 문서 화상의 각 문자 화상에 대하여 상기 선택 유닛에 의해 선택된 글리프에 기초하여 기술되는, 화상 처리 장치.
제1항에 있어서,
상기 글리프 각각은 상이한 폭을 갖는, 화상 처리 장치.
제1항에 있어서,
상기 글리프 각각은 단순한 형상을 나타내는, 화상 처리 장치.
제1항에 있어서,
상기 글리프 각각은 직사각형 형상을 나타내는, 화상 처리 장치.
제1항에 있어서,
상기 글리프 각각은 공백 문자(blank character)의 형상을 나타내는, 화상 처리 장치.
제1항에 있어서,
상기 글리프들은 문자 행의 하부에 렌더링되는, 화상 처리 장치.
제1항에 있어서,
상기 생성 유닛은 문자들 사이의 거리의 평균값을 포함하는 상기 전자 문서를 생성하는, 화상 처리 장치.
제1항에 있어서,
상기 생성 유닛에 의해 생성된 상기 전자 문서는, 상기 문서 화상의 각 문자 화상에 대략적으로 일치하는 위치에 상기 복수의 문자 코드에 대응하는 글리프들을 투명한 색으로 렌더링하기 위한 기술(description)을 포함하는, 화상 처리 장치.
제1항에 있어서,
상기 전자 문서는 XML 포맷으로 생성되는, 화상 처리 장치.
제1항에 있어서,
상기 전자 문서는 XPS 포맷으로 생성되는, 화상 처리 장치.
제1항에 있어서,
상기 전자 문서에 저장하기 위해 상기 문서 화상을 압축하도록 구성된 압축 유닛을 더 포함하는, 화상 처리 장치.
제13항에 있어서,
상기 압축 유닛은 상기 문서 화상에 포함된 영역을 분석하여 적응적으로 압축하는, 화상 처리 장치.
제1항에 있어서,
상기 생성된 전자 문서를 입력 키워드를 사용하여 검색하고 상기 키워드와 일치하는 부분을 강조(highlight)하도록 구성된 검색 유닛을 더 포함하는, 화상 처리 장치.
제15항에 있어서,
상기 검색 유닛은, 상기 일치하는 부분의 색상을 반전시킴으로써 상기 키워드와 일치하는 부분을 강조하는, 화상 처리 장치.
문서 화상의 복수의 문자 화상에 대한 문자 인식을 수행함으로써 각 문자 화상에 대응하는 문자 코드를 획득하는 단계, 및
상기 문서 화상, 상기 문자 인식을 수행함으로써 획득된 복수의 문자 코드, 복수의 글리프, 및 상기 문자 코드들 각각을 렌더링하는데 사용될 글리프들을 나타내는 데이터를 포함하는 전자 문서를 생성하는 단계
를 포함하고,
상기 문자 인식을 수행함으로써 획득된 복수의 문자 코드에 대응하는 문자들을 렌더링할 때, 상기 복수의 글리프 각각이 상기 데이터에 기초하여 상이한 문자 코드들에 의해 공유 및 사용되는, 방법.
제17항에 있어서,
상기 문서 화상의 각 문자 화상의 문자 폭 및 문자 행 높이에 기초하여, 상기 복수의 글리프로부터 각 문자 화상에 대하여 사용될 글리프를 선택하는 단계를 더 포함하고,
상기 문자 코드들을 렌더링하는데 사용될 글리프들을 나타내며 상기 전자 문서에 저장되는 상기 데이터는, 상기 문서 화상의 각 문자 화상에 대하여 선택 유닛에 의해 선택된 글리프에 기초하여 기술되는, 방법.
제17항에 있어서,
상기 문서 화상의 각 문자 화상의 문자 간격 및 문자 행 높이에 기초하여, 상기 복수의 글리프로부터 각 문자 화상에 대하여 사용될 글리프를 선택하는 단계를 더 포함하고,
상기 문자 코드들을 렌더링하는데 사용될 글리프들을 나타내며 상기 전자 문서에 저장되는 상기 데이터는, 상기 문서 화상의 각 문자 화상에 대하여 선택 유닛에 의해 선택된 글리프에 기초하여 기술되는, 방법.
제17항에 있어서,
상기 글리프 각각은 상이한 폭을 갖는, 방법.
제17항에 있어서,
상기 글리프 각각은 단순한 형상을 나타내는, 방법.
제17항에 있어서,
상기 글리프 각각은 직사각형 형상을 나타내는, 방법.
제17항에 있어서,
상기 글리프 각각은 공백 문자의 형상을 나타내는, 방법.
제17항에 있어서,
상기 글리프들은 문자 행의 하부에 렌더링되는, 방법.
제17항에 있어서,
상기 생성된 전자 문서는 문자들 사이의 거리의 평균값을 더 포함하는, 방법.
제17항에 있어서,
상기 생성된 전자 문서는, 상기 문서 화상의 각 문자 화상에 대략적으로 일치하는 위치에 상기 복수의 문자 코드에 대응하는 글리프들을 투명한 색으로 렌더링하기 위한 기술을 포함하는, 방법.
컴퓨터 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램이며,
상기 컴퓨터 프로그램은,
문서 화상의 복수의 문자 화상에 대한 문자 인식을 수행함으로써 각 문자 화상에 대응하는 문자 코드를 획득하는 단계, 및
상기 문서 화상, 상기 문자 인식을 수행함으로서 획득된 복수의 문자 코드, 복수의 글리프, 및 상기 문자 코드들 각각을 렌더링하는데 사용될 글리프들을 나타내는 데이터를 포함하는 전자 문서를 생성하는 단계
를 컴퓨터가 실행하게 하고,
상기 문자 인식을 수행함으로써 획득된 복수의 문자 코드에 대응하는 문자들을 렌더링할 때, 상기 복수의 글리프 각각이 상기 데이터에 기초하여 상이한 문자 코드들에 의해 공유 및 사용되는, 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램.