KR20070032504A - 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출방법 - Google Patents

텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출방법 Download PDF

Info

Publication number
KR20070032504A
KR20070032504A KR1020050086785A KR20050086785A KR20070032504A KR 20070032504 A KR20070032504 A KR 20070032504A KR 1020050086785 A KR1020050086785 A KR 1020050086785A KR 20050086785 A KR20050086785 A KR 20050086785A KR 20070032504 A KR20070032504 A KR 20070032504A
Authority
KR
South Korea
Prior art keywords
text
image
user
selection signal
extracting
Prior art date
Application number
KR1020050086785A
Other languages
English (en)
Other versions
KR100714393B1 (ko
Inventor
김경옥
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050086785A priority Critical patent/KR100714393B1/ko
Priority to US11/491,921 priority patent/US20070070443A1/en
Priority to CNA2006101515354A priority patent/CN1932802A/zh
Publication of KR20070032504A publication Critical patent/KR20070032504A/ko
Application granted granted Critical
Publication of KR100714393B1 publication Critical patent/KR100714393B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출 방법이 개시된다. 본 발명에 따른 텍스트 추출 기능을 갖는 호스트 장치는 소정의 문서를 실행하는 적어도 하나의 응용프로그램이 설치되었으며, 응용프로그램은 사용자에 의한 실행된 문서 내의 이미지에 대하여 수행할 작업의 선택신호를 입력하는 사용자 인터페이스부, 이미지로부터 텍스트를 추출하는 텍스트 추출부, 및 추출된 텍스트에 작업의 선택신호에 대응하는 작업을 처리하는 텍스트 처리부를 포함한다. 이에 의해, 사용자는 문서내에 포함되어 있는 모든 텍스트를 제공받을 수 있다.
텍스트 추출, 응용프로그램, 웹 브라우저, 번역 프로그램

Description

텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출 방법 {Host device having extraction function of text and extraction method thereof}
도 1은 본 발명의 바람직한 실시예에 따른 텍스트 추출 기능을 갖는 호스트 장치의 블럭도,
도 2는 도 1에 도시한 응용프로그램의 기능을 설명하기 위한 도면, 그리고,
도 3은 본 발명에 따른 텍스트 추출 방법을 설명하기 위한 흐름도이다.
* 도면의 주요부분에 대한 부호의 설명 *
100 : 호스트 장치 110 : 응용프로그램
120 : 저장부 130 : GDI
140 : 화상형성장치 드라이버부 150 : 디스플레이장치 드라이버부
160 : 화상형성장치 인터페이스부 170 : 디스플레이장치 인터페이스부
200 : 화상형성장치 300 : 디스플레이장치
본 발명은 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출 방법에 관한 것으로, 더욱 상세하게는 이미지 내의 텍스트에 대하여 소정 작업의 수행 이 가능한 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출 방법에 관한 것이다.
통신기술의 발달과 개인용 컴퓨터의 보급 확대로 인하여 인터넷을 사용하는 인구가 급증하였다. 또한, 인터넷을 사용하는 연령층이 저연령층 및 고연령층까지 확대됨에 따라, 인터넷을 사용하는 인구는 계속 증가하고 있는 추세이다.
정보의 바다라고도 불리는 인터넷에는 무수히 많은 정보들이 존재하며, 전 세계의 웹사이트들과의 연결이 가능하기 때문에, 인터넷을 통해 정보의 세계화가 이루어졌다고 말하기도 한다.
인터넷 사용자들은 인터넷을 통해 자신이 원하는 정보를 획득할 수 있다. 또한, 인터넷 사용자들은 인터넷으로부터 획득한 정보를 다운로드 혹은 복사하여 자신이 원하는 바에 따라 편집할 수도 있다.
이때, 인터넷에 존재하는 정보들은 텍스트뿐만 아니라 이미지(image)도 포함하고, 이미지는 이미지화된 텍스트를 포함하기도 하는데, 이미지에 포함되어 있는 이미지화된 텍스트는 텍스트 단독에 대하여 복사, 저장, 및 인쇄와 같은 기능이 적용되지 않는다.
그러므로, 이미지에 포함되어 있는 텍스트가 반드시 필요한 경우, 사용자는 해당 텍스트를 직접 입력하여야만 하는 번거로움이 발생한다. 이에 따라, 이미지에 포함되어 있는 텍스트가 많은 경우, 텍스트를 사용하기 위하여 불필요한 시간과 노력이 소요되는 문제점이 있다.
따라서, 본 발명의 목적은 응용프로그램에 의해 이미지 내의 텍스트를 추출함으로써, 추출한 텍스트에 대하여 사용자가 원하는 소정의 작업을 수행할 수 있는 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출 방법을 제공하고자 하는데 있다.
상기 목적을 달성하기 위한 본 발명에 따른 텍스트 추출 기능을 갖는 호스트 장치는 소정의 문서를 실행하는 적어도 하나의 응용프로그램이 설치되었으며, 응용프로그램은 사용자에 의한 실행된 문서 내의 이미지에 대하여 수행할 작업의 선택신호를 입력하는 사용자 인터페이스부, 이미지로부터 텍스트를 추출하는 텍스트 추출부, 및 추출된 텍스트에 작업의 선택신호에 대응하는 작업을 처리하는 텍스트 처리부를 포함한다.
바람직하게, 사용자 인터페이스부는 사용자에 의한 텍스트를 추출할 이미지의 선택신호를 입력할 수 있으며, 텍스트 추출부는 이미지의 선택신호에 대응하는 이미지로부터 텍스트를 추출할 수 있다.
또한 바람직하게, 텍스트 추출부는 이미지 내에서 색상 차이를 이용하여 텍스트를 추출할 수 있다. 혹은, 텍스트 추출부는 OCR(Optical Character Recognition) 엔진일 수 있다.
또한 바람직하게, 텍스트에 대하여 수행할 작업은 저장, 인쇄, 복사, 및 번역 중 적어도 어느 하나일 수 있다. 여기서, 텍스트 처리부는 수행할 작업이 번역일 경우, 추출된 텍스트를 번역 프로그램으로 제공할 수 있다.
또한 바람직하게, 사용자 인터페이스부는 사용자가 텍스트에 대하여 수행할 작업을 선택할 수 있도록 선택 가능한 작업들을 나열한 메뉴를 제공할 수 있다.
또한 바람직하게, 응용프로그램은 웹 브라우저, 번역 프로그램, 및 문서작성 프로그램 중 어느 하나일 수 있다.
한편, 본 발명에 따른 텍스트 추출 방법은 소정의 문서를 실행하는 단계, 실행된 문서 내의 이미지로부터 텍스트를 추출하는 단계, 및 추출된 텍스트에 소정의 작업을 처리하는 단계를 포함한다.
바람직하게, 사용자에 의해 텍스트를 추출할 이미지의 선택신호가 입력되는 단계를 더 포함할 수 있으며, 텍스트를 추출하는 단계에서 입력된 이미지의 선택신호에 대응하는 이미지로부터 텍스트를 추출할 수 있다.
또한 바람직하게, 사용자에 의해 이미지에 대하여 수행할 작업의 선택신호가 입력될 수 있으며, 작업을 처리하는 단계에서 추출된 텍스트에 작업의 선택신호에 대응하는 작업을 처리할 수 있다.
또한 바람직하게, 텍스트를 추출하는 단계에서, 이미지 내에서 색상 차이를 이용하여 텍스트를 추출할 수 있다. 혹은 텍스트를 추출하는 단계에서, OCR 엔진을 이용하여 텍스트를 추출할 수 있다.
또한 바람직하게, 텍스트에 대하여 수행할 작업은 저장, 인쇄, 복사, 및 번역 중 적어도 어느 하나일 수 있다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
도 1은 본 발명의 바람직한 실시예에 따른 텍스트 추출 기능을 갖는 호스트 장치의 블럭도이다.
도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 텍스트 추출 기능을 갖는 호스트 장치(100)는 응용프로그램(110), 저장부(120), 그래픽 디바이스 인터페이스((Graphic Device Interface : GDI)(130), 화상형성장치 드라이버부(140), 디스플레이장치 드라이버부(150), 화상형성장치 인터페이스부(160), 및 디스플레이장치 인터페이스부(170)를 포함한다.
응용프로그램(110)은 호스트 장치(100)에 설치되는 통상의 응용프로그램으로, 사용자의 조작에 의해 새로운 문서를 생성하거나, 혹은 사용자가 선택된 문서를 실행하여 사용자에게 제공한다.
바람직하게, 응용프로그램(110)은 웹 브라우저, 번역 프로그램, 및 문서작성 프로그램 중 어느 하나일 수 있다. 만약, 응용프로그램(110)이 웹 브라우저일 경우, 응용프로그램(110)은 사용자가 접속하고자 원하는 웹사이트에서 제공하는 웹페이지를 실행하여 사용자에게 제공한다.
응용프로그램(110)은 문서 내의 이미지로부터 텍스트를 추출하고, 추출된 텍스트에 소정의 작업을 처리한다. 이를 위해, 응용프로그램(110)은 사용자 인터페이스부(112), 텍스트 추출부(114), 및 텍스트 처리부(116)를 포함한다.
사용자 인터페이스부(112)는 사용자와 호스트 장치(100)와의 인터페이스를 제공한다. 본 실시예에서 사용자 인터페이스부(112)는 사용자에 의한 텍스트를 추출할 이미지의 선택신호 및 선택된 이미지 내의 텍스트에 대하여 수행할 작업의 선택신호를 입력한다.
사용자 인터페이스부(112)는 사용자가 텍스트에 대하여 수행할 작업을 선택할 수 있도록 선택 가능한 작업들을 나열한 메뉴를 제공한다. 사용자 인터페이스부(112)가 제공하는 메뉴는 "이미지 내 텍스트 저장", "이미지 내 텍스트 인쇄", "이미지 내 텍스트 복사", 및 "이미지 내 텍스트 번역"을 포함할 수 있다.
텍스트 추출부(114)는 사용자 인터페이스부(112)를 통해 사용자에 의한 이미지의 선택신호가 입력되면, 입력된 이미지의 선택신호에 대응하는 이미지로부터 텍스트를 추출한다.
바람직하게, 텍스트 추출부(114)는 이미지 내 텍스트를 추출하는 이미지 프로세싱 모듈을 포함할 수 있다. 여기서, 이미지 프로세싱 모듈은 이미지 내에서 색상 차이를 이용하여 텍스트를 추출할 수 있다.
또한, 텍스트 추출부(114)는 OCR(Optical Character Recognition) 엔진일 수 있다. 통상적으로, OCR 엔진은 이미지나 비트맵을 밝은 부분과 어두운 부분으로 나누어 분석한 후, 하나의 글자가 인식되면 그것을 아스키 코드로 변환하는 과정에 의해 텍스트를 추출할 수 있다.
텍스트 처리부(116)는 텍스트 추출부(114)에 의해 추출된 텍스트에 사용자 인터페이스부(112)를 통해 입력된 작업의 선택신호에 대응하는 작업을 처리한다. 여기서, 텍스트 처리부(116)가 텍스트에 대하여 수행할 작업은 사용자 인터페이스부(112)에서 작업 선택을 위해 제공하는 메뉴와 대응하여 저장, 인쇄, 복사, 및 번역을 포함한다.
텍스트 처리부(116)는 처리할 작업이 저장일 경우, 텍스트 추출부(114)에 의 해 추출된 데이터를 저장부(120)에 저장하도록 제어한다.
텍스트 처리부(116)는 처리할 작업이 인쇄일 경우, 텍스트 추출부(114)에 의해 추출된 데이터를 GDI(130)를 통해 화상형성장치 드라이버부(140)로 전송하도록 한다.
텍스트 처리부(116)는 처리할 작업이 복사일 경우, 텍스트 추출부(114)에 의해 추출된 데이터를 저장부(120)에 일시 저장하도록 제어한다. 이때, 응용프로그램(110)에 따라, 텍스트는 클립보드(Clipboard)에 저장될 수 있다.
또한, 텍스트 처리부(116)는 처리할 작업이 번역일 경우, 텍스트 추출부(114)에 의해 추출된 데이터를 번역프로그램으로 전송한다. 이때, 응용프로그램(110)은 웹 브라우저 혹은 문서작성 프로그램일 경우이며, 호스트 장치(100)에 별도의 번역 프로그램이 존재할 경우이다.
저장부(120)는 소정의 문서를 저장한다. 이때, 소정의 문서는 응용프로그램(110)에 의해 생성된 문서일 수 있다. 또한, 응용프로그램(110)이 웹 브라우저일 경우, 저장부(120)에는 사용자에 의해 접속한 웹 사이트로부터 텍스트를 추출하기 위하여 다운로드된 이미지가 임시 저장될 수 있다. 또한, 저장부(120)는 텍스트 처리부(116)에서 처리할 작업이 저장일 경우, 텍스트 처리부(116)의 제어에 의해 텍스트를 저장할 수 있다.
GDI(130)는 컴퓨터 운영체제로 사용되는 마이크로소프트 윈도우 동작 시스템의 일부로, 응용프로그램(110)과 화상형성장치 드라이버부(140)간 혹은 응용프로그램(110)과 디스플레이장치 드라이버부(150)간의 인터페이스를 지원한다.
즉, GDI(120)는 응용프로그램(110)으로부터 전송되는 인쇄명령 및 인쇄데이터를 화상형성장치 드라이버부(140)로 전송하며, 응용프로그램(110)으로부터 전송되는 디스플레이대상데이터를 디스플레이장치 드라이버부(150)로 전송한다.
화상형성장치 드라이버부(140)는 GDI(130)를 통해 응용프로그램(110)으로부터 전송받은 인쇄명령 및 인쇄데이터를 화상형성장치(200)에서 인식 가능한 형태의 데이터로 변환한다.
디스플레이장치 드라이버부(150)는 GDI(130)를 통해 응용프로그램(110)으로부터 전송받은 디스플레이대상데이터를 디스플레이장치(300)에서 인식 가능한 형태의 데이터로 변환한다. 여기서, 디스플레이대상데이터는 응용프로그램(110)에서 실행한 문서, 및 사용자 인터페이스부(112)에서 제공하는 메뉴를 포함할 수 있다.
화상형성장치 인터페이스부(160)는 호스트 장치(100)와 화상형성장치(200)와의 인터페이스를 지원하는 것으로, 화상형성장치 드라이버부(140)에서 화상형성장치(200)에서 인식 가능한 형태로 변환된 데이터를 화상형성장치(200)로 전송한다.
디스플레이장치 인터페이스부(170)는 호스트 장치(100)와 디스플레이장치(300)와의 인터페이스를 지원하는 것으로, 디스플레이장치 드라이버부(150)에서 디스플레이장치(300)에서 인식 가능한 형태로 변환된 데이터를 디스플레이장치(300)로 전송한다.
화상형성장치(200)는 화상형성장치 인터페이스부(160)를 통해 호스트 장치(100)로부터 전송받은 인쇄데이터에 대한 인쇄작업을 수행한다. 본 실시예에서, 화상형성장치(200)가 인쇄작업을 수행하는 경우는 텍스트 처리부(116)에서 수행하는 작업이 인쇄일 경우이다.
디스플레이장치(300)는 디스플레이장치 인터페이스부(170)를 통해 호스트 장치(100)로부터 전송받은 디스플레이대상데이터를 디스플레이한다. 본 실시예에서, 디스플레이장치(300)에 표시되는 디스플레이대상데이터는 응용프로그램(110)에 의해 실행된 문서를 포함한다.
도 2는 도 1에 도시한 응용프로그램의 기능을 설명하기 위한 도면이다.
도 2에서는 응용프로그램(110)이 웹 브라우저인 경우를 예로 들어 설명한다. 사용자는 웹 브라우저를 통해 소정의 웹사이트에 접속하였으며, 웹 브라우저는 웹사이트로부터 제공받은 문서를 실행하여 사용자에게 제공한다. 이를 통해, 사용자는 웹 브라우저를 통해 제공되는 문서에 대하여 복사, 저장, 인쇄, 및 번역과 같은 작업을 수행할 수 있다.
도시한 바와 같이, 사용자에게 제공되는 문서는 텍스트, 및 이미지(A)를 포함하며, 이미지(A) 내에는 이미지화된 텍스트(B)가 포함될 수 있다. 이때, 이미지(A) 내에 포함되어 있는 이미지화된 텍스트(B)는 이미지(A)와 동일하게 취급되기 때문에, 사용자는 이미지화된 텍스트(B)만을 획득할 수 없다.
이를 해소하기 위하여, 본 발명의 바람직한 실시예에 따르면, 응용프로그램(110)의 사용자 인터페이스부(112)는 일반적인 메뉴 이외에도 "이미지 내 텍스트 저장"(C), "이미지 내 텍스트 인쇄"(D), 및 "이미지 내 텍스트 복사"(E), "이미지 내 텍스트 번역"(F)와 같은 이미지화된 텍스트(B)에 대한 작업선택을 위한 메뉴를 더 제공한다.
사용자가 텍스트를 추출하고자 하는 이미지(A)를 선택하면, 사용자 인터페이스부(112)에서 이미지화된 텍스트(B)에 대한 작업선택을 위한 메뉴를 포함하여 사용자가 원하는 작업을 선택하기 위한 메뉴를 제공한다. 이를 통해, 사용자는 이미지(A)에 포함되어 있는 이미지화된 텍스트(B)에 대한 작업 즉, 저장, 인쇄, 복사, 및 번역 중 어느 하나를 선택할 수 있다.
사용자는 이미지화된 텍스트(B)에 대한 작업을 선택함으로써, 응용프로그램(110)의 텍스트 추출부(114) 및 텍스트 처리부(116)에 의해 이미지(A)에 포함되어 있는 이미지화된 텍스트(B)를 제공받을 수 있다.
도 3은 본 발명에 따른 텍스트 추출 방법을 설명하기 위한 흐름도이다.
여기에서는 도 1 내지 도 3을 참조하여, 본 발명에 따른 텍스트 추출 방법을 설명한다.
응용프로그램(110)은 사용자에 의해 선택된 문서를 실행한다. 예를 들어, 응용프로그램(110)이 웹 브라우저일 경우, 웹 브라우저는 사용자에 의해 입력된 웹 사이트 주소에 의해 웹 사이트에 접속하고, 웹 사이트로부터 제공되는 문서를 실행한다(S400).
사용자는 응용프로그램(110)을 통해 제공되는 문서에 포함된 이미지(A) 중 이미지화된 텍스트(B)만을 사용하고자 하는 경우, 문서에서 텍스트를 추출하고자 하는 이미지(A)를 선택한다.
사용자가 텍스트를 추출하고자 하는 이미지(A)를 선택하면, 응용프로그램(110)은 사용자 인터페이스부(112)를 통해 이미지화된 텍스트(B)에 대하여 수행할 작업을 선택할 수 있는 메뉴(C, D, 및 E)를 제공한다(S420).
사용자는 도 2에 도시한 바와 같은 메뉴(C, D, 및 E)가 제공되면, 자신이 선택한 이미지(A)에 포함되어 있는 이미지화된 텍스트(B)에 대하여 처리하고자 하는 작업을 선택한다. 사용자에 의해 텍스트를 추출하고자 하는 이미지(A) 및 이미지화된 텍스트(B)에 대하여 처리할 작업이 선택되면, 사용자 인터페이스부(112)를 통해 이미지 및 작업의 선택신호가 응용프로그램(110)으로 입력된다(S430).
이후, 응용프로그램(110)의 텍스트 추출부(114)에서 이미지(A)로부터 텍스트를 추출한다(S440). 텍스트 추출부(114)에 의해 이미지(A)로부터 텍스트가 추출되면, 텍스트 처리부(116)에서 사용자에 의한 작업의 선택신호에 대응하는 작업을 처리한다(S450).
상기에서는 응용프로그램(110)이 웹 브라우저일 경우를 예로 들어 설명하였으나, 이는 반드시 여기에 한정되지 않는다. 바람직하게, 응용프로그램(110)은 웹 브라우저뿐만 아니라 통상의 문서작성 프로그램과 번역 프로그램일 수 있다.
응용프로그램(110)이 번역 프로그램일 경우, 응용프로그램(110)의 텍스트 추출부(114)는 이미지(A) 내의 이미지화된 텍스트(B)를 추출하고, 텍스트 처리부(116)는 추출된 텍스트를 번역모듈이 번역을 수행하도록 함으로써, 문서 내에 포함되어 있는 모든 텍스트에 대하여 번역이 이루어질 수 있다.
또한, 웹 브라우저에 플러그인(plug-in)되어 수행되는 번역 프로그램의 경우에도 적용이 가능하다. 이러한 번역 프로그램은 프로그램에 따라서 웹 브라우저를 통해 문서를 열어 놓은 상태에서 번역 프로그램을 실행시키거나 혹은 번역 프로그 램을 실행시킨 후 웹 브라우저를 통해 해당 문서를 열게 된다.
전술한 바와 같이, 본 발명에 적용되는 응용프로그램(110)은 웹 브라우저, 문서작성 프로그램, 번역 프로그램과 같은 다양한 프로그램을 적용할 수 있으며, 문서 내의 텍스트에 대하여 사용자가 원하는 바에 따라 편집 및 번역과 같은 작업 수행이 가능하다.
이상 설명한 바와 같이, 본 발명에 따른 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출 방법은 응용프로그램에 의해 이미지 내의 텍스트를 추출하여 소정의 작업을 수행함으로써, 사용자는 문서 내의 모든 텍스트를 제공받을 수 있다.
더욱이, 이미지 내의 텍스트를 추출하여 사용자에게 제공함으로써, 불필요한 이미지에 대한 인쇄로 인한 잉크의 사용을 줄일 수 있으며, 이에 따라 출력속도를 향상시킬 수 있다.
이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형 실시예들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims (14)

  1. 소정의 문서를 실행하는 적어도 하나의 응용프로그램이 설치된 호스트 장치에 있어서,
    상기 응용프로그램은,
    사용자에 의한 상기 실행된 문서 내의 이미지에 대하여 수행할 작업의 선택신호를 입력하는 사용자 인터페이스부;
    상기 이미지로부터 텍스트를 추출하는 텍스트 추출부; 및
    상기 추출된 텍스트에 상기 작업의 선택신호에 대응하는 작업을 처리하는 텍스트 처리부;를 포함하는 것을 특징으로 하는 텍스트 추출 기능을 갖는 호스트 장치.
  2. 제 1 항에 있어서,
    상기 사용자 인터페이스부는 상기 사용자에 의한 텍스트를 추출할 이미지의 선택신호를 입력하며,
    상기 텍스트 추출부는 상기 이미지의 선택신호에 대응하는 이미지로부터 상기 텍스트를 추출하는 것을 특징으로 하는 텍스트 추출 기능을 갖는 호스트 장치.
  3. 제 1 항에 있어서,
    상기 텍스트 추출부는 상기 이미지 내에서 색상 차이를 이용하여 상기 텍스 트를 추출하는 것을 특징으로 하는 텍스트 추출 기능을 갖는 호스트 장치.
  4. 제 1 항에 있어서,
    상기 텍스트 추출부는 OCR(Optical Character Recognition) 엔진인 것을 특징으로 하는 텍스트 추출 기능을 갖는 호스트 장치.
  5. 제 1 항에 있어서,
    상기 텍스트에 대하여 수행할 작업은 저장, 인쇄, 복사, 및 번역 중 적어도 어느 하나인 것을 특징으로 하는 텍스트 추출 기능을 갖는 호스트 장치.
  6. 제 5 항에 있어서,
    상기 텍스트 처리부는 상기 수행할 작업이 번역일 경우, 상기 추출된 텍스트를 번역 프로그램으로 제공하는 것을 특징으로 하는 텍스트 추출 기능을 갖는 호스트 장치.
  7. 제 1 항에 있어서,
    상기 사용자 인터페이스부는 상기 사용자가 텍스트에 대하여 수행할 작업을 선택할 수 있도록 선택 가능한 작업들을 나열한 메뉴를 제공하는 것을 특징으로 하는 텍스트 추출 기능을 갖는 호스트 장치.
  8. 제 1 항에 있어서,
    상기 응용프로그램은 웹 브라우저, 번역 프로그램, 및 문서작성 프로그램 중 어느 하나인 것을 특징으로 하는 텍스트 추출 기능을 갖는 호스트 장치.
  9. 소정의 문서를 실행하는 단계;
    상기 실행된 문서 내의 이미지로부터 텍스트를 추출하는 단계; 및
    상기 추출된 텍스트에 소정의 작업을 처리하는 단계;를 포함하는 것을 특징으로 하는 텍스트 추출 방법.
  10. 제 9 항에 있어서,
    사용자에 의해 텍스트를 추출할 이미지의 선택신호가 입력되는 단계;를 더 포함하며,
    상기 텍스트를 추출하는 단계에서, 상기 입력된 이미지의 선택신호에 대응하는 이미지로부터 상기 텍스트를 추출하는 것을 특징으로 하는 텍스트 추출 방법.
  11. 제 9 항에 있어서,
    사용자에 의해 상기 이미지에 대하여 수행할 작업의 선택신호가 입력되는 단계;
    상기 작업을 처리하는 단계에서, 상기 추출된 텍스트에 상기 작업의 선택신호에 대응하는 작업을 처리하는 것을 특징으로 하는 텍스트 추출 방법.
  12. 제 7 항에 있어서,
    상기 텍스트를 추출하는 단계에서, 상기 이미지 내에서 색상 차이를 이용하여 상기 텍스트를 추출하는 것을 특징으로 하는 텍스트 추출 방법.
  13. 제 7 항에 있어서,
    상기 텍스트를 추출하는 단계에서, OCR 엔진을 이용하여 상기 텍스트를 추출하는 것을 특징으로 하는 텍스트 추출 방법.
  14. 제 7 항에 있어서,
    상기 텍스트에 대하여 수행할 작업은 저장, 인쇄, 복사, 및 번역 중 적어도 어느 하나인 것을 특징으로 하는 텍스트 추출 방법.
KR1020050086785A 2005-09-16 2005-09-16 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출방법 KR100714393B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020050086785A KR100714393B1 (ko) 2005-09-16 2005-09-16 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출방법
US11/491,921 US20070070443A1 (en) 2005-09-16 2006-07-25 Host device having extraction function of text and extraction method thereof
CNA2006101515354A CN1932802A (zh) 2005-09-16 2006-09-11 具有文本提取功能的主机设备及其提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050086785A KR100714393B1 (ko) 2005-09-16 2005-09-16 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출방법

Publications (2)

Publication Number Publication Date
KR20070032504A true KR20070032504A (ko) 2007-03-22
KR100714393B1 KR100714393B1 (ko) 2007-05-07

Family

ID=37878641

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050086785A KR100714393B1 (ko) 2005-09-16 2005-09-16 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출방법

Country Status (3)

Country Link
US (1) US20070070443A1 (ko)
KR (1) KR100714393B1 (ko)
CN (1) CN1932802A (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012050379A2 (ko) * 2010-10-14 2012-04-19 한국전자통신연구원 출판물의 핑거프린트 추출 방법, 출판물의 핑거프린트 추출 장치, 핑거프린트를 이용한 출판물 식별 시스템 및 핑거프린트를 이용한 출판물 식별 방법
KR101315472B1 (ko) * 2009-01-28 2013-10-04 구글 인코포레이티드 클라이언트 디바이스상의 간행물로부터 광학 문자 인식된 텍스트 및 대응하는 이미지의 선택적인 디스플레이
KR20140039613A (ko) * 2012-09-24 2014-04-02 삼성전자주식회사 클라이언트 장치, 클라이언트의 제어 방법, 서버 및 서버의 제어 방법
KR20150070019A (ko) * 2013-12-13 2015-06-24 주식회사 플리토 장문 번역 서비스 장치 및 방법
KR20200061858A (ko) * 2018-11-26 2020-06-03 (주)아이티 노매즈 홈페이지 내 비정형 이미지 파일의 개인정보 검출/차단 시스템 및 그 부하 저감 방법

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4817994B2 (ja) * 2006-07-03 2011-11-16 キヤノン株式会社 データ管理システム
CN101667251B (zh) * 2008-09-05 2014-07-23 三星电子株式会社 具备辅助定位功能的ocr识别方法和装置
KR20110136171A (ko) * 2010-06-14 2011-12-21 삼성전자주식회사 화상형성장치 및 전자책 컨텐츠 생성방법
AU2012248243A1 (en) * 2011-04-28 2013-11-14 Rakuten, Inc. Browsing system, terminal, image server, program, computer-readable recording medium recording said program, and method
CN102799568B (zh) * 2011-05-26 2016-04-13 腾讯科技(深圳)有限公司 只读文本的选中复制方法及系统
US9367539B2 (en) 2011-11-03 2016-06-14 Microsoft Technology Licensing, Llc Techniques for automated document translation
JP6250013B2 (ja) 2014-11-26 2017-12-20 ネイバー コーポレーションNAVER Corporation コンテンツ参加翻訳装置、及びそれを利用したコンテンツ参加翻訳方法
CN104967749A (zh) * 2015-07-29 2015-10-07 努比亚技术有限公司 一种处理图文信息的装置和方法
CN109844886B (zh) * 2016-08-11 2022-03-11 录象射流技术公司 具有打印检查的打印机设备、打印机标记系统以及方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR930012142B1 (ko) * 1991-12-13 1993-12-24 주식회사 금성사 문서인식장치의 개별문자 절출방법
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
JPH09128408A (ja) * 1995-08-25 1997-05-16 Hitachi Ltd インタラクティブ記録再生用メディア及び再生装置
US6249283B1 (en) * 1997-07-15 2001-06-19 International Business Machines Corporation Using OCR to enter graphics as text into a clipboard
US6785670B1 (en) 2000-03-16 2004-08-31 International Business Machines Corporation Automatically initiating an internet-based search from within a displayed document
US6735347B1 (en) * 2000-08-08 2004-05-11 International Business Machines Corporation Method and apparatus for text extraction from cut image
IL155821A0 (en) * 2000-11-17 2003-12-23 Weitman Jacob Applications for mobile digital camera that distinguish between text and image-information in an image
US20020120653A1 (en) * 2001-02-27 2002-08-29 International Business Machines Corporation Resizing text contained in an image
KR20010087798A (ko) * 2001-05-31 2001-09-26 윤용석 인터넷 웹페이지 상에서 이미지에 포함된 텍스트 자료를복사 및 붙여넣기하는 방법
US6641037B2 (en) * 2001-12-13 2003-11-04 Peter Williams Method and system for interactively providing product related information on demand and providing personalized transactional benefits at a point of purchase
US20030113015A1 (en) * 2001-12-18 2003-06-19 Toshiaki Tanaka Method and apparatus for extracting text information from moving image
US20030202683A1 (en) * 2002-04-30 2003-10-30 Yue Ma Vehicle navigation system that automatically translates roadside signs and objects
ATE356389T1 (de) * 2003-08-20 2007-03-15 Oce Tech Bv Dokumentenscanner
JP4817108B2 (ja) * 2004-11-05 2011-11-16 富士ゼロックス株式会社 画像処理装置、画像処理方法及び画像処理プログラム
US9025890B2 (en) * 2006-05-26 2015-05-05 Nec Corporation Information classification device, information classification method, and information classification program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101315472B1 (ko) * 2009-01-28 2013-10-04 구글 인코포레이티드 클라이언트 디바이스상의 간행물로부터 광학 문자 인식된 텍스트 및 대응하는 이미지의 선택적인 디스플레이
WO2012050379A2 (ko) * 2010-10-14 2012-04-19 한국전자통신연구원 출판물의 핑거프린트 추출 방법, 출판물의 핑거프린트 추출 장치, 핑거프린트를 이용한 출판물 식별 시스템 및 핑거프린트를 이용한 출판물 식별 방법
WO2012050379A3 (ko) * 2010-10-14 2012-06-14 한국전자통신연구원 출판물의 핑거프린트 추출 방법, 출판물의 핑거프린트 추출 장치, 핑거프린트를 이용한 출판물 식별 시스템 및 핑거프린트를 이용한 출판물 식별 방법
KR20140039613A (ko) * 2012-09-24 2014-04-02 삼성전자주식회사 클라이언트 장치, 클라이언트의 제어 방법, 서버 및 서버의 제어 방법
KR20150070019A (ko) * 2013-12-13 2015-06-24 주식회사 플리토 장문 번역 서비스 장치 및 방법
KR20200061858A (ko) * 2018-11-26 2020-06-03 (주)아이티 노매즈 홈페이지 내 비정형 이미지 파일의 개인정보 검출/차단 시스템 및 그 부하 저감 방법

Also Published As

Publication number Publication date
CN1932802A (zh) 2007-03-21
US20070070443A1 (en) 2007-03-29
KR100714393B1 (ko) 2007-05-07

Similar Documents

Publication Publication Date Title
KR100714393B1 (ko) 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출방법
JP6384571B2 (ja) 端末の制御方法
US20080115046A1 (en) Program, copy and paste processing method, apparatus, and storage medium
CN101183360B (zh) 字符输入编辑方法
EP1698968B1 (en) Print control apparatus, control method thereof, and device driver
KR100661173B1 (ko) 다이렉트 프린팅 기능을 갖는 프린터 및 그 인쇄방법
KR20040031502A (ko) 웹 페이지 프린팅 방법 및 이에 적합한 장치
KR100676697B1 (ko) 컴퓨터용 소프트웨어의 언어표시방법 및언어표시시스템과, 언어표시방법과 언어표시시스템이저장된 기록매체
US7581175B1 (en) File format conversion of an interactive element in a graphical user interface
JP2009217428A (ja) 翻訳表示装置、翻訳表示方法および翻訳表示プログラム
CN101097518B (zh) 用于识别光学字符的系统和方法
KR20030022732A (ko) 통신 장치, 이를 제어하는 방법 및 제어 프로그램
JP2006195575A (ja) 情報処理装置及びその方法
JP3578389B2 (ja) 表示制御方法及び装置、表示制御のためのソフトウエア・プロダクトを格納した記憶媒体
JP6437076B2 (ja) 情報処理装置及びその制御方法とプログラム
JP2019128637A (ja) 情報処理装置、印字処理方法およびコンピュータプログラム
JP4211462B2 (ja) 情報処理装置及びその方法、並びに画像描画装置
JP4125026B2 (ja) 情報処理装置、方法及び制御プログラム
JP2006248172A (ja) 画像形成装置、プリンタドライバおよび画像形成システム
JP2009289121A (ja) 情報処理装置、出力装置、出力処理方法、及びプログラム
JP3815073B2 (ja) 文字変換方法、その方法を実施するための文字変換装置および文字変換用の記録媒体
JP2002091957A (ja) 編集装置および編集プログラム記憶媒体
JP2005092461A (ja) データ編集装置及びその制御方法並びに制御プログラム
JP2007141160A (ja) 印刷制御装置、方法及びプログラム
JP2010282272A (ja) 文字認識方法、文字認識プログラム及び文字認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee