KR20050119116A - 콘텐츠 디스플레이 시스템 및 방법, 텍스트 디스플레이시스템 및 방법, 텍스트 확대 시스템, 컴퓨터 프로그램제품 및 정보 디스플레이 방법 - Google Patents

콘텐츠 디스플레이 시스템 및 방법, 텍스트 디스플레이시스템 및 방법, 텍스트 확대 시스템, 컴퓨터 프로그램제품 및 정보 디스플레이 방법 Download PDF

Info

Publication number
KR20050119116A
KR20050119116A KR1020057016862A KR20057016862A KR20050119116A KR 20050119116 A KR20050119116 A KR 20050119116A KR 1020057016862 A KR1020057016862 A KR 1020057016862A KR 20057016862 A KR20057016862 A KR 20057016862A KR 20050119116 A KR20050119116 A KR 20050119116A
Authority
KR
South Korea
Prior art keywords
bitmaps
bitmap
display device
text
content
Prior art date
Application number
KR1020057016862A
Other languages
English (en)
Inventor
에이 제프리 존스
티 스코트 존스
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20050119116A publication Critical patent/KR20050119116A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

컴퓨터 스크린상에 콘텐츠를 디스플레이하는 시스템 및 방법이 제공되며, 여기서, 텍스트(또는 다른 콘텐츠)는 다수의 비트맵으로서 포맷되는데, 예를 들어, 각각의 비트맵은 워드에 대응한다. 비트맵은, 예를 들면, 손상된 시각을 갖는 누군가가 용이하게 볼 수 있도록, 리사이징(resizing)된다. 텍스트의 리사이징으로 인해, 그것의 일부가 디스플레이의 수평 경계를 벗어나 연장된다면, 텍스트는 다음 라인으로 자동으로 랩핑(wrapping)된다.

Description

콘텐츠 디스플레이 시스템 및 방법, 텍스트 디스플레이 시스템 및 방법, 텍스트 확대 시스템, 컴퓨터 프로그램 제품 및 정보 디스플레이 방법{ENHANCED READABILITY WITH FLOWED BITMAPS}
본 발명은 시각 손상자가 읽는 것을 도와주는 시스템 및 방법에 관한 것이다.
많은 사람들은 완전한 시각이 부족하다. 시각 손상자가 컴퓨터 스크린과 같은 것에 디스플레이된 텍스트를 읽는 것을 돕기 위해 설계된 많은 툴 및 기법이 있다. 전통적인 방법으로는 OCR(Optical Character Recognition) 및 간단한 SAM(scan-and-magnify) 시스템이 있다.
OCR은 컴퓨터에 의한, 인쇄되거나 또는 기록된 텍스트 문자의 인식이다. OCR을 구현하는 상이한 방법들이 있지만, 일반적으로 처리에는 텍스트 또는 이미지를 포트스캐닝하고, 스캐닝된 이미지를 분석하고, 문자 이미지를 데이터 처리에 일반적으로 이용되는 ASCII와 같은 문자 코드로 번역하는 것이 포함된다.
OCR 처리에서, 스캐닝된(scanned-in) 이미지 또는 비트맵이 밝은 영역 및 어두운 영역에 대해 분석되어, 각각의 알파벳 문자 또는 수자가 식별된다. 문자가 인식될 때, 그것은 ASCII 코드로 변환된다. OCR을 위해 특별히 설계된 특수 회로 보드 및 컴퓨터 칩을 이용하여, 인식 처리를 가속화한다. 이러한 인식 처리는 계산적으로 비용이 많이 소모되는데, 그 이유는, 다양한 폰트 또는 스크립트는, 특히 폰트가 새로운 것이거나 부정형인 경우에, 문자들을 매칭하는 것을 어렵게 만들기 때문이다.
시각 손상자를 돕기 위한 현존 시스템들은 몇 가지의 단점을 갖는다. 통상적인 SAM 시스템에서, 페이지가 최종 디스플레이 영역보다 확대되면, 사용자는 각 라인 전부를 보기 위해 이미지를 전후방으로 슬라이딩할 필요가 있는데, 이것은 지루한 수작업이며, 혼란스러운 처리이다. 몇몇 툴에서는, 폰트를 리사이징하고, 디스플레이 영역에 적합하도록 페이지를 필요에 따라 리플로우(refolwing)하도록 허용하는 HTML과 같은 포맷이 이용된다. 그러나, 모든 포맷이 리플로우를 허용하지 않으며, 모든 디스플레이 프로그램이 리플루우를 수행하거나, 또는 사용자에 의한 리사이징을 허용할 수 있는 것은 아니다. 예를 들어, 전형적인 인터넷 브라우저에서, HTML 텍스트는 리플로우될 수 있다. 그러나, 브라우저상에 디스플레이된 텍스트가, 예를 들면, .gif, .jpg 또는 .pdf 파일의 일부인 경우, 브라우저는 텍스트를 리플로우할 수 없다.
더욱이, OCR 시스템에서, 불량한 문자 인식 및 다양한 폰트 및 언어 처리의 불가능성 때문에, 문제들이 발생된다.
따라서, 본 기술 분야에서는, 전자 매체에 텍스트를 디스플레이하는 개선된 시스템 및 방법이 필요하다.
발명의 개요
본 발명은 (스캐닝된, 비디오 캡처된, 스크린 캡처된, 등등의) 이미지를 취하여, 몇 가지의 OCR형 기능을 이미지에 적용함으로써, 텍스트의 비트맵을 정의 및 추출하도록 하는 툴을 생성한다. 비트맵은 컴퓨터 메모리에서의 그래픽 이미지의 소정의 표현을 나타내는 일반적인 용어이다. 예시적인 일실시예에서, 텍스트 페이지가 스캐닝 및 맵핑된다. 페이지상의 텍스트는 워크 크기의 이미지로 분할되고, 이들 이미지는 확대된 후, 예를 들면, 디스플레이 장치에 적합하도록 리플로우된다.
본 발명의 신규한 특징들이, 첨부된 특허 청구 범위에 개시된다. 그러나, 본 발명 자체 뿐만 아니라, 그것의 다양한 이용 모드, 또다른 목적 및 이점들은, 첨부된 도면을 참조한 이하의 예시적인 실시예의 상세한 설명으로부터 가장 잘 이해될 것이다.
도 1은 바람직한 실시예와 일치되는 컴퓨터 시스템의 표현을 도시한다.
도 2는 본 발명을 구현할 수 있는 컴퓨터 시스템의 관련 부분들에 대한 블록도를 도시한다.
도 3은 바람직한 실시예에서의 처리 단계들의 흐름도를 도시한다.
도 4(a)는 본 발명을 구현하기 이전의 컴퓨터 스크린을 도시한다.
도 4(b)는 본 발명의 이점없이, 확대된 텍스트를 디스플레이하는 컴퓨터 스크린을 도시한다.
도 4(c)는 본 발명의 바람직한 실시예와 일치되는 텍스트를 디스플레이하는 컴퓨터 스크린을 도시한다.
본 발명은 도면들을 참조하여 기술된다. 상황을 설명하기 위해, 본 발명의 바람직한 실시예의 구현과 일치되는 샘플의 컴퓨터 시스템이 기술된다.
이제 도면을 참조하면, 특히 도 1을 참조하면, 본 발명의 바람직한 실시예에 따라, 본 발명이 구현될 수 있는 데이터 처리 시스템의 도면이 제공된다. 시스템 유닛(110)과, 비디오 디스플레이 단말(102)과, 키보드(104)와, 플로피 드라이브 및 다른 유형의 영구 및 제거가능 저장 매체를 포함할 수 있는 저장 장치(108)와, 마우스(106)를 포함하는 컴퓨터(100)가 도시된다. 예를 들면, 조이스틱, 터치패드, 터치 스크린, 트랙볼, 마이크로폰 등과 같은 추가적인 입력 장치가 개인용 컴퓨터(100)에 포함될 수 있다. 컴퓨터(100)는 뉴욕주 아몬크 소재의 인터내셔널 비지네스 머신즈 코포레이션의 제품인 IBM RS/6000 컴퓨터 또는 인텔리스테이션(IntelliStation) 컴퓨터와 같은 임의의 적절한 컴퓨터를 이용하여 구현될 수 있다. 도시된 표현은 컴퓨터를 도시하지만, 본 발명의 다른 실시예는 네트워크 컴퓨터와 같은 다른 유형의 데이터 처리 시스템에서 구현될 수 있다. 또한, 컴퓨터(100)는 바람직하게, 컴퓨터(100)내에서 동작시에 컴퓨터 판독가능 매체에 상주하는 컴퓨터 소프트웨어에 의해 구현될 수 있는 그래픽 사용자 인터페이스를 포함한다.
이제 도 2를 참조하면, 본 발명이 구현될 수 있는 데이터 처리 시스템의 블록도가 도시되어 있다. 데이터 처리 시스템(200)은 도 1의 컴퓨터(100)와 같은 컴퓨터의 일례이며, 본 발명의 처리를 구현하는 코드 또는 인스트럭션이 위치될 수 있다. 데이터 처리 시스템(200)은 PCI(peripheral component interconnect) 로컬 버스 아키텍처를 이용한다. 도시된 예에서는 PCI 버스가 이용되지만, AGP(Accelerated Graphics Port) 및 ISA(Industry Standard Architecture)와 같은 다른 버스 아키텍처가 이용될 수도 있다. 프로세서(202) 및 주 메모리(204)는 PCI 브리지(208)를 통해 PCI 로컬 버스(206)에 접속된다. 또한, PCI 브리지(208)는 프로세서(202)를 위한 집적 메모리 제어기 및 캐쉬 메모리를 포함할 수 있다. PCI 로컬 버스(206)에 대한 추가적인 접속이, 직접 구성 요소 상호접속을 통해서 또는 애드인(add-in) 보드를 통해서 행해질 수 있다. 도시된 예에서, LAN 어댑터(210), SCSI(small computer system interface) 호스트 버스 어댑터(212) 및 확장 버스 인터페이스(214)가, 직접 구성 요소 접속에 의해 PCI 로컬 버스(206)에 접속된다. 반대로, 오디오 어댑터(216), 그래픽 어댑터(218) 및 오디오/비디오 어댑터(219)는, 확장 슬롯내에 삽입된 애드인 보드에 의해 PCI 로컬 버스(206)에 접속된다. 확장 버스 인터페이스(214)는 키보드 및 마우스 어댑터(220), 모뎀(222) 및 추가 메모리(224)에 대한 접속을 제공한다. SCSI 호스트 버스 어댑터(212)는 하드 디스크 드라이브(226), 테이프 드라이브(228) 및 CD-ROM 드라이브(230)에 대한 접속을 제공한다. 전형적인 PCI 로컬 버스 구현은 3개 또는 4개의 PCI 확장 슬롯 또는 애드인 접속기를 지원할 것이다.
오퍼레이팅 시스템이 프로세서(202)상에서 실행되며, 도 2의 데이터 처리 시스템(200)내의 다양한 구성 요소의 제어를 조정 및 제공하는데 이용된다. 오퍼레이팅 시스템은, 마이크로소프트사의 Windows 2000과 같은 상업적으로 이용가능한 오퍼레이팅 시스템일 수 있다. Java와 같은 객체 지향 프로그래밍 시스템은 오퍼레이팅 시스템과 함께 실행되어, 데이터 처리 시스템(200)상에서 실행되는 Java 프로그램 또는 애플리케이션으로부터 오퍼레이팅 시스템에 호출(call)을 제공한다. "Java"는 썬 마이크로시스템즈사의 상표이다. 오퍼레이팅 시스템, 객체 지향 프로그래밍 시스템, 및 애플리케이션 또는 프로그램에 대한 인스트럭션들은 하드 디스크 드라이브(226)와 같은 저장 장치에 위치되며, 프로세서(202)에 의한 실행을 위해 주 메모리(204)내로 로딩될 수 있다.
당업자라면, 도 2의 하드웨어는 구현에 따라 변할 수 있음을 이해할 것이다. 플래쉬 ROM(또는 동등한 비휘발성 메모리) 또는 광학 디스크 드라이브 등과 같은 다른 내부적인 하드웨어 또는 주변 장치들이, 도 2에 도시된 하드웨어에 추가하여, 또는 그 대신에 이용될 수 있다. 또한, 본 발명의 처리는 멀티프로세서 데이터 처리 시스템에 적용될 수 있다.
예를 들어, 데이터 처리 시스템(200)은, 만약 네트워크 컴퓨터로서 선택적으로 구성된다면, 선택적으로 포함된 것을 나타내는 도 2의 점선에 의해 표시된 SCSI 호스트 버스 어댑터(212), 하드 디스크 드라이브(226), 테이프 드라이브(228) 및 CD-ROM(230)을 포함하지 않을 수 있다. 그러한 경우, 클라이언트 컴퓨터라고 적절히 지칭될 컴퓨터는, LAN 어댑터(210), 모뎀(222) 등과 같은 몇 가지 유형의 네트워크 통신 인터페이스를 포함해야 한다. 다른 예로서, 데이터 처리 시스템(200)은, 그것이 소정 유형의 네트워크 통신 인터페이스를 포함하는지의 여부에 관계없이, 소정 유형의 네트워크 통신 인터페이스에 의존하지 않고서 부팅가능하게 구성된 독립형(stand-alone) 시스템일 수 있다. 또다른 예로서, 데이터 처리 시스템(200)은 오퍼레이팅 시스템 파일 및/또는 사용자 생성 데이터를 저장하는 비휘발성 메모리를 제공하기 위해 ROM 및/또는 플래쉬 ROM으로 구성되는 PDA(personal digital assistant)일 수 있다.
도 2에 도시된 예 및 전술한 예들은 아키텍처적인 제한을 의미하지 않는다. 예를 들어, 데이터 처리 시스템(200)은 PDA의 형태를 취하는 것 이외에도, 노트북 컴퓨터 또는 핸드 헬드(hand held) 컴퓨터일 수 있다. 또한, 데이터 처리 시스템(200)은 키오스크(kiosk) 또는 웹 어플라이언스(Web appliance)일 수 있다.
본 발명의 처리는, 예를 들면, 주 메모리(204), 메모리(224)와 같은 메모리 또는 하나 이상의 주변 장치(226-230)에 위치될 수 있는 컴퓨터 구현 인스트럭션을 이용하여 프로세서(202)에 의해 수행될 수 있다.
바람직한 일실시예에서, 본 발명은 이미지를 사용자에게 디스플레이할 수 있는 인터넷 브라우저 또는 다른 프로그램의 일부로서 구현된다. 도 3은 바람직한 실시예에 대한 처리 단계들을 구현하는 흐름도를 도시한다. 처음에, 사용자가 디스플레이하고자 하는 이미지 또는 문서가, 그것이 이미 디지털화된 형태가 아닌 경우, 디지털화된다(단계 302). 이 단계는 문서 또는 "이미지" 의 비트맵을 생성하는 것이다. 이러한 문맥에 있어서, "이미지"라는 용어는 텍스트, 그래픽 또는 픽처, 또는 두 가지의 조합을 포함하는, 그러나 그것에 한정되지는 않는, 디스플레이된 정보를 의미한다. 그러한 비트맵은, 예를 들면, 이미지의 포토스캐닝에 의해서, 또는 이미지의 스크린샷(screenshot)의 캡처에 의해서 생성될 수 있다. 이와 달리, 파일의 콘텐츠는 디스크로 랜더링될 수 있다. 이용된 방법에 관계없이, 사용자에게 디스플레이될 콘텐츠가 비트맵으로서 캡처된다.
몇몇 실시예에서, 문서 또는 이미지의 비트맵이 획득된 후, 소정의 클린업(clean up) 단계들이 수행된다(단계 304). 예를 들어, 텍스트의 콘트라스트 처리 및/또는 재정렬(realignment)이 수행될 수 있다. 이미지의 클린업은 본 발명의 실시를 위해 필요한 것은 아님을 알아야 하며, 그 이유는, 개별적인 문자는 있는 그대로 식별될 필요가 없기 때문이다.
다음, 텍스트의 경우, 텍스트의 상이한 라인들이 프로그램에 의해 구별된다(단계 306). 그 후, (바람직하게, 식별되지 않지만, 즉 OCR이 아직 적용되지 않지만) 개별적인 문자들이 구별된다(단계 308). (본 명세서에서 이용된 "구별한다" 라는 용어는 하나의 항목이 끝나고 다른 것이 시작되는 것을 나타내거나, 또는 하나의 객체 또는 문자 또는 워드의 경계가 끝나고 다른 것의 경계가 시작되는 것을 나타낼 뿐이며, "식별한다" 라는 용어는 문자의 실제 식별, 즉 알려진 문자로의 매칭을 나타낸다. 그러므로, 텍스트의 라인 및 워드 및 심지어 문자도 "구별"될 수 있으나, 식별될 수는 없다. 만약, 워드가 구별되고, 식별되지는 않았다면, 워드의 시작 및 끝이 알려질 수 있지만, 워드의 의미 또는 스펠링 또는 다른 콘텐츠는 알려지지 않는다.)
문자가 구별된 후, 워드를 형성하는 문자들의 그룹화가 구별된다(단계 310). 일단 워드가 구별되면, 워드도 아니고 문자도 아닌, 그래픽 이미지와 같은 항목들이 구별된다(단계 312). 개별적인 문자들이 이전의 단계들에서 매칭되거나 식별될 필요는 없음을 알아야 한다. 또한, 본 발명의 시스템은 워드들 사이의 이격에 일치되는 공간들을 간단하게 찾아서, 개별적인 워드들을 구별하거나, 또는 "워드 영역" 또는 하나의 워드에 대응하는 문서의 영역들, 또는 심지어 워드들의 그룹을 정의할 수 있음을 알아야 한다.
개별적인 워드가 구별된 후, 콘텐츠의 바람직한 디스플레이 크기가, 바람직하게 본 발명의 시스템의 사용자에 의해 지시된다(단계 314). 이것은 여러 가지 방식으로 구현될 수 있다. 예를 들어, 브라우저 디스플레이에서, 개별적인 워드는 .gif 또는 .jpg와 같은 이미지 파일로서 포맷될 수 있다. HTML 이미지 태그를 이용함으로써, 브라우저에 의해, 3개의 이미지 파일이 리사이징될 수 있다. 예를 들어, 전형적인 이미지 태그는 디스플레이 크기를 나타내는 주석(note)을 포함할 수 있다.
<img src=word001.gif width=50>
이러한 예에서, 개별적인 워드가 "word001.gif"라는 이름의 .gif 파일내로 만들어진다. 이러한 개별적인 이미지의 디스프레이된 폭은 이미지(즉, 워드)가 50 화소 폭을 가질 것임을 의미하는 태그 "width=50"에 의해 표시된다.
이러한 예시적인 구현에 일치되도록, 개별적인 워드 이미지 "word001.gif"의 크기는 "width" 태그를 보다 큰 수로 변경함으로서 확대될 수 있다. 대안적으로, 이미지는 그들이 개별적인 이미지로 분할되기 전에 확대될 수 있다. 예를 들어, 각각의 워드의 이미지는 이미지를 확장하는 알려진 소프트웨어를 이용하여 확대될 수 있다. 그 후, 확대된 개별적인 워드 이미지는 디스플레이의 가시 영역의 폭에 적합하도록 페이지상에 배열될 수 있다.
몇몇 이미지는 그들이 디스플레이되는 해상도보다 높은 해상도로 스캐닝된다. 그러한 이미지는 워드로 세분될 수 있으며, 그러한 개별적인 워드는, 확대되는 대신에, 디스플레이 이전에 축소될 것이며, 또는 적절한 경우에는, 그들의 원래 크기로 디스플레이될 수 있다. 다른 대안은, 이미지를 개별적인 워드로 파싱하기 전에, 전체 이미지를 원하는 확대도(magnification)로 확대한 후, 바람직한 확대도로 문서를 파싱 및 리플로우하는 것을 포함한다.
확대 이후에, 바람직한 디스플레이 크기 및 이용가능한 디스플레이 영역에 따라 이미지가 리플로우된다(단계 316). 바람직하게, 이 단계는 개별적인 이미지/워드를 텍스트의 라인내로 위치시켜, 텍스트의 한 라인이, 이용가능한 디스플레이 영역만큼만 확장되도록 한다. 바람직하게, 리플로우는 처리에서 이전에 구별되었던 개별적인 워드의 레벨로 수행된다. 바람직하게, 워드는 그들의 새로운 크기에 따라 리플로우되어, 텍스트가 이용가능한 디스플레이 영역만큼만 확장되고, 그것을 초과하지 않도록 한다. 그러므로, 리사이징 및 리플로우 이후에, 텍스트의 라인은 디스플레이 영역의 한측면에서 시작되고, 해당 라인상에 디스플레이된 워드가 디스플레이 영역의 다른 측면에 도달할 때, 다음 워드가 다음 라인으로 자동으로 랩핑된다. 이것은 사용자가 텍스트의 전체 라인을 읽기 위해, 스크롤해야 하는 것을 방지한다.
도 4(a)-(c)는 페이지상의 텍스트에 대한 가능한 배열을 도시한다. 도 4(a)에서, 문장이 작은 폰트로 존재하며, 전체 문장은 가시 디스플레이 영역(400)에 적합하게 되어 있다. 바람직한 실시예에서, 문장은 파싱되고, 각각의 워드(402)는 분리되어, 개별적인 비트맵으로 만들어진다. 비트맵에 대한 임의의 포맷이 본 발명에 일치된다.
도 4(b)에서, 텍스트는 전형적인 OCR 또는 SAM 시스템에 따라 확대된다. 문장은 가시 디스플레이 영역(400)을 벗어나, 모든 텍스트를 보고자 하는 사용자는 스크롤 바(404)를 이용하여, 전체 페이지 폭을 스캐닝해야 한다.
도 4(c)에서, 본 발명이 이용된다. 개별적인 워드(402)들은, 디스플레이에 대해 더 이상 가시 영역(400)이 없을 경우, 그들이 다음 라인으로 랩핑되도록 배열된다.
본 발명의 일실시예는 브라우저 프로그램의 일부로서 구현된다. 본 발명의 양상은 브라우저 프로그램 자체의 일부로서 구현되거나, 브라우저 프로그램과 조합되어 동작하는 분리된 프로그램으로서 구현될 수 있다. 어느 경우에 있어서도, 브라우저에 의해 디스플레이된 텍스트 또는 이미지는, 사용자의 코맨드에 따라 리사이징 및 리플로우될 수 있다. (본 예에서) 리플로우는 (예를 들면, 도 3의 처리에서 기술된 바와 같이) 개별적인 워드의 그래픽 이미지를 생성함으로써, 그리고 자동생성된 HTML 코딩 및 "width" 태그를 이용하여 리플로우함으로써 구현된다.
또한, 본 발명의 개념은, 예를 들면, 아도브(Adove)의 Acrobat ReaderTM와 같은 비브라우저(non-browser) 프로그램과 조합되어 동작할 수 있는 독립형 컴퓨터 프로그램으로서 구현될 수 있다.
본 발명은 현존 OCR 시스템의 많은 단점들을 극복함을 알아야 한다. 첫째, 페이지의 텍스트는 확장 또는 확대된 형태로 디스플레이될 수 있고, 워드는 디스플레이를 위해 이용가능한 영역으로 랩핑된다. 또한, 본 발명은 이미지를 불완전하게 텍스트로 변환한 후, 텍스트를 다시 확대된 문자로 변환할 필요성을 제거한다. 또한, 본 발명은 임의의 인쇄된 문서가 임의의 크기의 하나의 탑-바텀(top-to-bottom) 문서로서 가시화되는 것을 사실상 허용하고, 어떠한 영역이든 그것의 폭으로 랩핑된 워드가 디스플레이를 위해 이용가능하다.
본 발명은 다른 이점은, 어떠한 시점에서도 개별적인 문자가 특정의 알려진 문자로 매칭되지 않는다고 하는 사실에 기인한다. 예를 들어, OCR 시스템에서, 프로그램이 개별적인 문자의 이미지를 검출한 경우, 이미지는 매칭이 발견될 때까지, 알려진 문자들과 비교되어야 한다. 이것은 OCR 시스템을 복잡하게 하며, OCR 시스템이 새로운 또는 알려지지 않은 폰트 또는 언어의 문서 텍스트를 인식하는데 있어 덜 효율적이도록 한다. 본 발명은 텍스트를 워드로 파싱하기만 하고, 워드의 개별적인 문자를 인식할 필요가 없기 때문에, 디스플레이된 다양한 언어의 텍스트를 확대하는데 이용될 수 있다.
따라서, 본 발명을 이용하여 상이한 폰트 또는 스크립트의 언어를 리플로우할 수 있으며, 언어는 (손으로 쓴 텍스트 또는 스크립트와 같은 ) 문자 인식을 따르지 않고, 언어는 상이한 1차 및 2차 방향을 갖는다. 본 발명의 문맥에서, 영어 문서에서의 텍스트 플로우의 1차 방향은 좌측으로부터 우측의 방향일 수 있다. 2차 방향은 상부로부터 하부의 방향일 수 있다. 다른 언어에서, 1차 플로우 방향은 (몇몇 아라비어 문서에서와 같이) 우측으로부터 좌측 또는 (일본 문서에서와 같이) 상부로부터 하부의 방향일 수 있다. 2차 방향도 마찬가지로 변경될 수 있으며, 본 발명의 개념에 의해 제한되지 않는다. 또한, 본 발명은 텍스트가 아닌 심볼 또는 픽처를 확대 및 재위치시키는데 이용될 수 있다.
마찬가지로, 영어 텍스트 문서의 1차 경계는 좌측 및 우측 마진이고, 2차 경계는 상부 및 하부 마진이며, 이것은 전술한 1차 및 2차 방향에 대응한다.
중요한 주지 사항으로서, 본 발명은 완전하게 기능하는 데이터 처리 시스템의 문맥에서 기술되었지만, 당업자라면, 본 발명의 처리는 인스트럭션의 컴퓨터 판독가능 매체의 형태 및 다양한 형태로 분배될 수 있고, 본 발명은 분배를 수행하기 위해, 실제로 이용된 신호 포함 매체의 특정한 유형에 관계없이 동일하게 적용됨을 이해할 것이다. 컴퓨터 판독가능 매체의 예에는, 플로피 디스크, 하드 디스크 드라이브, RAM, CD-ROM과 같은 기록가능한 유형의 매체와, 디지털 및 아날로그 통신 링크와 같은 전송 유형의 매체가 포함된다.
본 발명에 대한 기술 내용은 예시 및 설명을 위해 제공된 것이며, 본 발명을 개시된 형태로 한정하거나 제한하는 것은 아니다. 당업자라면, 여러 가지 변형 및 수정이 가능함을 명백히 알 것이다. 실시예는 본 발명의 원리 및 실제 응용을 가장 잘 설명하기 위해, 그리고 당업자가, 고려되는 특정한 용도에 적합한 다양한 변형을 갖는 다양한 실시예에 대한 발명을 이해할 수 있도록 선택되어 기술되었다.

Claims (34)

  1. 디스플레이 장치의 가시 영역에 텍스트를 디스플레이하는 방법에 있어서,
    텍스트의 워드들 사이의 끊김(break)을 결정하는 단계와,
    상기 개별적인 워드의 적어도 일부의 개별적인 비트맵을 생성하는 단계와,
    상기 디스플레이 장치의 상기 가시 영역의 1차 경계내에 상기 비트맵을 디스플레이하는 단계를 포함하는
    텍스트 디스플레이 방법.
  2. 제 1 항에 있어서,
    상기 비트맵은 디스플레이되기 전에 확대되는 텍스트 디스플레이 방법.
  3. 제 1 항에 있어서,
    상기 비트맵은 디스플레이되기 전에 크기가 감소되는 텍스트 디스플레이 방법.
  4. 제 1 항에 있어서,
    상기 디스플레이 장치의 상기 가시 영역의 1차 경계내에 상기 비트맵을 디스플레이하는 단계는, 상기 디스플레이된 비트맵의 폭이 상기 디스플레이 장치의 상기 가시 영역의 폭보다 큰 경우에, 상기 비트맵의 일부를 새로운 라인으로 랩핑(wrapping)함으로써 수행되는 텍스트 디스플레이 방법.
  5. 제 1 항에 있어서,
    상기 1차 경계는 상기 가시 디스플레이 영역의 좌측 및 우측 에지인 텍스트 디스플레이 방법.
  6. 디스플레이 장치상에 정보를 디스플레이하는 방법에 있어서,
    문서로부터 복수의 비트맵을 정의 및 추출하는 단계와,
    상기 비트맵의 확대도(magnification)를 제어하는 단계와,
    상기 비트맵을 리플로우(reflowing)하는 단계를 포함하는
    정보 디스플레이 방법.
  7. 제 6 항에 있어서,
    상기 비트맵의 적어도 일부는 텍스트의 개별적인 워드를 포함하는 정보 디스플레이 방법.
  8. 제 6 항에 있어서,
    상기 비트맵의 적어도 일부는 심볼을 포함하는 정보 디스플레이 방법.
  9. 제 6 항에 있어서,
    상기 비트맵의 상기 확대도는 사용자에 의해 제어되는 정보 디스플레이 방법.
  10. 제 6 항에 있어서,
    상기 비트맵의 상기 확대도는 사용자 선호도에 따라 저장되는 정보 디스플레이 방법.
  11. 제 6 항에 있어서,
    상기 비트맵은 상기 디스플레이 장치의 1차 경계를 벗어나 연장되는 비트맵이 없도록 리플로우되는 정보 디스플레이 방법.
  12. 콘텐츠를 디스플레이하는 시스템에 있어서,
    가시 디스플레이 영역을 갖는 디스플레이 장치―상기 가시 영역은 좌측 및 우측 경계를 가짐―와,
    디스플레이가능한 정보를 포함하는 문서를 포함하되,
    상기 디스플레이가능한 정보의 개별적인 부분들은 비트맵으로서 포맷되고,
    상기 개별적인 부분들은 상기 가시 영역의 1차 경계내에서 리플로우되는
    콘텐츠 디스플레이 시스템.
  13. 제 12 항에 있어서,
    상기 비트맵은 사용자 입력에 따라 리사이징(resizing)되는 콘텐츠 디스플레이 시스템.
  14. 제 12 항에 있어서,
    상기 비트맵은 저장된 값에 따라 리사이징되는 콘텐츠 디스플레이 시스템.
  15. 제 12 항에 있어서,
    상기 디스플레이가능한 정보는 텍스트인 콘텐츠 디스플레이 시스템.
  16. 텍스트를 디스플레이하는 시스템에 있어서,
    텍스트의 워드들 사이의 끊김을 결정하는 수단과,
    상기 개별적인 워드의 적어도 일부의 개별적인 비트맵을 생성하는 수단과,
    상기 디스플레이 장치의 가시 영역의 1차 경계내에 상기 비트맵을 디스플레이하는 수단을 포함하는
    텍스트 디스플레이 시스템.
  17. 제 16 항에 있어서,
    상기 디스플레이 장치의 가시 영역의 1차 경계내에 상기 비트맵을 디스플레이하는 것은, 상기 디스플레이된 비트맵의 폭이 상기 디스플레이 장치의 상기 가시 영역의 폭보다 큰 경우에, 상기 비트맵의 일부를 새로운 라인으로 랩핑함으로써 수행되는 텍스트 디스플레이 시스템.
  18. 제 16 항에 있어서,
    상기 1차 경계는 상기 가시 디스플레이 영역의 좌측 및 우측 에지인 텍스트 디스플레이 시스템.
  19. 디스플레이 장치상에 콘텐츠를 디스플레이하는 방법에 있어서,
    상기 콘텐츠를 복수의 비트맵으로서 포맷하는 단계와,
    상기 복수의 비트맵을 리사이징하는 단계와,
    상기 디스플레이 장치상의 가시 영역의 1차 경계를 벗어나 연장되는 콘텐츠가 없도록 상기 복수의 비트맵을 리플로우하는 단계를 포함하는
    콘텐츠 디스플레이 방법.
  20. 제 19 항에 있어서,
    상기 복수의 비트맵 각각은 개별적인 워드인 콘텐츠 디스플레이 방법.
  21. 제 19 항에 있어서,
    상기 비트맵은 상기 비트맵과 관련된 HTML 태그를 조정함으로써 리사이징되는 콘텐츠 디스플레이 방법.
  22. 제 19 항에 있어서,
    상기 콘텐츠는 텍스트를 포함하는 콘텐츠 디스플레이 방법.
  23. 디스플레이 장치상의 텍스트를 확대하는 시스템에 있어서,
    상기 텍스트를 복수의 비트맵으로서 재포맷하는 수단과,
    상기 비트맵을 리플로우하는 수단을 포함하는
    텍스트 확대 시스템.
  24. 제 23 항에 있어서,
    상기 비트맵은 디스플레이되기 전에 확대되는 텍스트 확대 시스템.
  25. 제 24 항에 있어서,
    상기 비트맵은 사용자 입력에 따라 확대되는 텍스트 확대 시스템.
  26. 제 23 항에 있어서,
    상기 텍스트의 개별적인 워드는 개별적인 비트맵으로서 포맷되는 텍스트 확대 시스템.
  27. 제 23 항에 있어서,
    상기 비트맵은 상기 디스플레이 장치의 1차 경계내에 적합하도록 리플로우되는 텍스트 확대 시스템.
  28. 디스플레이 장치상에 콘텐츠를 디스플레이하는 방법에 있어서,
    상기 콘텐츠를 복수의 비트맵으로서 포맷하는 단계와,
    사용자 입력에 응답하여, 상기 복수의 비트맵을 리사이징하는 단계와,
    상기 리사이징 단계 이후에, 상기 디스플레이 장치의 폭 및 상기 복수의 비트맵의 크기에 근거하여, 상기 복수의 비트맵을 리플로우하는 단계를 포함하는
    콘텐츠 디스플레이 방법.
  29. 제 28 항에 있어서,
    상기 복수의 비트맵은 상기 디스플레이 장치상의 가시 영역의 1차 경계를 벗어나 연장되는 콘텐츠가 없도록 리사이징되는 콘텐츠 디스플레이 방법.
  30. 제 28 항에 있어서,
    상기 복수의 비트맵은 상기 복수의 비트맵과 관련된 HTML 태그를 조정함으로써 리사이징되는 콘텐츠 디스플레이 방법.
  31. 디스플레이 장치상에 콘텐츠를 디스플레이하는 시스템에 있어서,
    디스플레이가능한 콘텐츠를 갖는 문서―상기 디스플레이가능한 콘텐츠는 복수의 비트맵으로서 포맷됨―와,
    사용자 입력에 응답하여, 상기 복수의 비트맵을 리사이징하는 수단을 포함하되,
    상기 복수의 비트맵은 상기 복수의 비트맵이 리사이징된 이후에, 상기 디스플레이 장치의 폭 및 상기 복수의 비트맵의 크기에 근거하여 리플로우되는
    콘텐츠 디스플레이 시스템.
  32. 제 31 항에 있어서,
    상기 복수의 비트맵은 상기 디스플레이 장치상의 가시 영역의 1차 경계를 벗어나 연장되는 콘텐츠가 없도록 리사이징되는 콘텐츠 디스플레이 시스템.
  33. 디스플레이 장치상에 콘텐츠를 디스플레이하는 컴퓨터 프로그램 제품에 있어서,
    상기 콘텐츠를 복수의 비트맵으로서 포맷하는 제 1 인스트럭션과,
    사용자 입력에 응답하여, 상기 복수의 비트맵을 리사이징하는 제 2 인스트럭션과,
    상기 리사이징 단계 이후에, 상기 디스플레이 장치의 폭 및 상기 복수의 비트맵의 크기에 근거하여, 상기 복수의 비트맵을 리플로우하는 제 3 인스트럭션을 포함하는
    컴퓨터 프로그램 제품.
  34. 제 33 항에 있어서,
    상기 복수의 비트맵은 상기 디스플레이 장치상의 가시 영역의 1차 경계를 벗어나 연장되는 콘텐츠가 없도록 리사이징되는 컴퓨터 프로그램 제품.
KR1020057016862A 2003-04-10 2004-03-11 콘텐츠 디스플레이 시스템 및 방법, 텍스트 디스플레이시스템 및 방법, 텍스트 확대 시스템, 컴퓨터 프로그램제품 및 정보 디스플레이 방법 KR20050119116A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/411,469 US20040202352A1 (en) 2003-04-10 2003-04-10 Enhanced readability with flowed bitmaps
US10/411,469 2003-04-10

Publications (1)

Publication Number Publication Date
KR20050119116A true KR20050119116A (ko) 2005-12-20

Family

ID=33130990

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057016862A KR20050119116A (ko) 2003-04-10 2004-03-11 콘텐츠 디스플레이 시스템 및 방법, 텍스트 디스플레이시스템 및 방법, 텍스트 확대 시스템, 컴퓨터 프로그램제품 및 정보 디스플레이 방법

Country Status (6)

Country Link
US (1) US20040202352A1 (ko)
JP (1) JP2007506987A (ko)
KR (1) KR20050119116A (ko)
CN (1) CN1761976A (ko)
TW (1) TWI291139B (ko)
WO (1) WO2004090743A2 (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE373274T1 (de) * 2005-07-01 2007-09-15 Pdflib Gmbh Verfahren zur identifizierung von wörtern in einem elektronischen dokument
US7788580B1 (en) 2006-03-28 2010-08-31 Amazon Technologies, Inc. Processing digital images including headers and footers into reflow content
US7433548B2 (en) * 2006-03-28 2008-10-07 Amazon Technologies, Inc. Efficient processing of non-reflow content in a digital image
US8023738B1 (en) 2006-03-28 2011-09-20 Amazon Technologies, Inc. Generating reflow files from digital images for rendering on various sized displays
US7966557B2 (en) * 2006-03-29 2011-06-21 Amazon Technologies, Inc. Generating image-based reflowable files for rendering on various sized displays
US7810026B1 (en) 2006-09-29 2010-10-05 Amazon Technologies, Inc. Optimizing typographical content for transmission and display
CN101192107A (zh) * 2006-11-28 2008-06-04 国际商业机器公司 用于输入并显示字符串的方法和设备
US8594387B2 (en) * 2007-04-23 2013-11-26 Intel-Ge Care Innovations Llc Text capture and presentation device
JP5123588B2 (ja) * 2007-07-17 2013-01-23 キヤノン株式会社 表示制御装置および表示制御方法
US8782516B1 (en) 2007-12-21 2014-07-15 Amazon Technologies, Inc. Content style detection
US8266524B2 (en) * 2008-02-25 2012-09-11 Microsoft Corporation Editing a document using a transitory editing surface
US9507651B2 (en) 2008-04-28 2016-11-29 Microsoft Technology Licensing, Llc Techniques to modify a document using a latent transfer surface
US8572480B1 (en) 2008-05-30 2013-10-29 Amazon Technologies, Inc. Editing the sequential flow of a page
US9229911B1 (en) 2008-09-30 2016-01-05 Amazon Technologies, Inc. Detecting continuation of flow of a page
US20100251104A1 (en) * 2009-03-27 2010-09-30 Litera Technology Llc. System and method for reflowing content in a structured portable document format (pdf) file
US8499236B1 (en) 2010-01-21 2013-07-30 Amazon Technologies, Inc. Systems and methods for presenting reflowable content on a display
US20110252302A1 (en) * 2010-04-12 2011-10-13 Microsoft Corporation Fitting network content onto a reduced-size screen
WO2011132188A1 (en) * 2010-04-19 2011-10-27 Tactile World Ltd. Intelligent display system and method
CN102243621A (zh) * 2010-05-11 2011-11-16 项洁 影像文本文件的活字排版方法
US8855413B2 (en) * 2011-05-13 2014-10-07 Abbyy Development Llc Image reflow at word boundaries
US9734132B1 (en) * 2011-12-20 2017-08-15 Amazon Technologies, Inc. Alignment and reflow of displayed character images
US9628865B2 (en) * 2012-09-10 2017-04-18 Apple Inc. Enhanced closed caption feature
JP6099961B2 (ja) * 2012-12-18 2017-03-22 キヤノン株式会社 画像表示装置、画像表示装置の制御方法およびコンピュータプログラム
KR20140081470A (ko) * 2012-12-21 2014-07-01 삼성전자주식회사 문자 확대 표시 방법, 상기 방법이 적용되는 장치, 및 상기 방법을 수행하는 프로그램을 저장하는 컴퓨터로 읽을 수 있는 저장 매체
CN104050155A (zh) * 2014-07-01 2014-09-17 西安诺瓦电子科技有限公司 文本编辑装置及文本编辑方法
US10698597B2 (en) * 2014-12-23 2020-06-30 Lenovo (Singapore) Pte. Ltd. Reflow of handwriting content

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4227209A (en) * 1978-08-09 1980-10-07 The Charles Stark Draper Laboratory, Inc. Sensory aid for visually handicapped people
US4723209A (en) * 1984-08-30 1988-02-02 International Business Machines Corp. Flow attribute for text objects
US5067019A (en) * 1989-03-31 1991-11-19 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Programmable remapper for image processing
US5267331A (en) * 1990-07-26 1993-11-30 Ronald Siwoff Digitally enhanced imager for the visually impaired
US5125046A (en) * 1990-07-26 1992-06-23 Ronald Siwoff Digitally enhanced imager for the visually impaired
JPH04167048A (ja) * 1990-10-31 1992-06-15 Fuji Xerox Co Ltd 文書レイアウト装置
US5596350A (en) * 1993-08-02 1997-01-21 Apple Computer, Inc. System and method of reflowing ink objects
US5754873A (en) * 1995-06-01 1998-05-19 Adobe Systems, Inc. Method and apparatus for scaling a selected block of text to a preferred absolute text height and scaling the remainder of the text proportionately
US7055095B1 (en) * 2000-04-14 2006-05-30 Picsel Research Limited Systems and methods for digital document processing
US6738049B2 (en) * 2000-05-08 2004-05-18 Aquila Technologies Group, Inc. Image based touchscreen device
US20040205568A1 (en) * 2002-03-01 2004-10-14 Breuel Thomas M. Method and system for document image layout deconstruction and redisplay system

Also Published As

Publication number Publication date
WO2004090743A2 (en) 2004-10-21
TWI291139B (en) 2007-12-11
JP2007506987A (ja) 2007-03-22
WO2004090743A3 (en) 2004-12-23
TW200504613A (en) 2005-02-01
US20040202352A1 (en) 2004-10-14
CN1761976A (zh) 2006-04-19

Similar Documents

Publication Publication Date Title
KR20050119116A (ko) 콘텐츠 디스플레이 시스템 및 방법, 텍스트 디스플레이시스템 및 방법, 텍스트 확대 시스템, 컴퓨터 프로그램제품 및 정보 디스플레이 방법
US8539342B1 (en) Read-order inference via content sorting
US6336124B1 (en) Conversion data representing a document to other formats for manipulation and display
EP1999687B1 (en) Efficient processing of non-reflow content in a digital image
US6377704B1 (en) Method for inset detection in document layout analysis
JP4981219B2 (ja) インクの分類、係留、および変換
US9898548B1 (en) Image conversion of text-based images
US10162804B2 (en) Object resizing with content reflow
US8379027B2 (en) Rendering engine test system
US7788580B1 (en) Processing digital images including headers and footers into reflow content
US20040205568A1 (en) Method and system for document image layout deconstruction and redisplay system
US20110173532A1 (en) Generating a layout of text line images in a reflow area
EP0807890A2 (en) Text string extraction system
JPH10228473A (ja) 文書画像処理方法、文書画像処理装置および記憶媒体
JP5790082B2 (ja) 文書認識装置、文書認識方法、プログラム及び記憶媒体
Sandnes Lost in OCR-Translation: pixel-based text reflow to the rescue: magnification of archival raster image documents in the browser without horizontal scrolling
US20240104290A1 (en) Device dependent rendering of pdf content including multiple articles and a table of contents
JP3294919B2 (ja) 機械翻訳装置
JP5715172B2 (ja) 文書表示装置、文書表示方法及び文書表示プログラム
US11842141B2 (en) Device dependent rendering of PDF content
KR20080045398A (ko) 휴대용 정보단말기의 문서 디스플레이 장치 및 방법
WO2019005100A1 (en) METHOD AND SYSTEM FOR DISPLAYING CONTENT OF A PDF DOCUMENT ON A SMALL SCREEN
WO2004053724A1 (ja) データ変換装置、データ変換方法、および、データ変換プログラムを記録した記録媒体
JPH04137070A (ja) 電子ブック装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application