KR101309782B1 - 문서 처리장치 및 문서 처리방법 - Google Patents

문서 처리장치 및 문서 처리방법 Download PDF

Info

Publication number
KR101309782B1
KR101309782B1 KR1020080096016A KR20080096016A KR101309782B1 KR 101309782 B1 KR101309782 B1 KR 101309782B1 KR 1020080096016 A KR1020080096016 A KR 1020080096016A KR 20080096016 A KR20080096016 A KR 20080096016A KR 101309782 B1 KR101309782 B1 KR 101309782B1
Authority
KR
South Korea
Prior art keywords
symbol
width
stroke
related information
scanned document
Prior art date
Application number
KR1020080096016A
Other languages
English (en)
Other versions
KR20100036676A (ko
Inventor
옥형수
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020080096016A priority Critical patent/KR101309782B1/ko
Priority to US12/566,912 priority patent/US8619316B2/en
Publication of KR20100036676A publication Critical patent/KR20100036676A/ko
Application granted granted Critical
Publication of KR101309782B1 publication Critical patent/KR101309782B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

문서 처리장치가 개시된다. 본 장치는, 스캔된 문서에서 텍스트 영역을 확인하고 확인된 텍스트 영역에서 심볼을 추출하여 심볼 관련 정보를 획득하는 심볼 관련 정보 획득부, 심볼 관련 정보에 관한 기설정된 기준에 따라, 추출된 심볼을 그룹화하여 분리하는 심볼 분리부, 및, 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성하는 키 인덱스 생성부를 포함한다. 이에 따라, 사용자의 문서 검색에 편의를 제공할 수 있다.
화상형성장치, 키 인덱스, 심볼, 그룹화, 심볼 관련 정보

Description

문서 처리장치 및 문서 처리방법{Document processing apparatus and method processing document}
본 발명은 문서 처리장치 및 문서 처리방법에 관한 것으로서, 보다 상세하게는 스캔된 문서에서 키 인덱스(key index)를 생성할 수 있는 문서 처리장치 및 문서 처리방법에 관한 것이다.
화상형성장치는 화상데이터의 생성, 인쇄, 수신, 전송 등을 수행하는 장치로서, 대표적인 예로서 프린터, 스캐너, 복사기, 팩스, 및 이들의 기능을 통합구현한 복합기 등을 들 수 있다.
스캔된 문서를 저장하고 있는 화상형성장치에서 사용자의 요청에 따라 저장된 영상을 디스플레이해야 하는 경우, 화상형성장치의 디스플레이 창 통해 저장된 문서를 디스플레이할 수 있다.
이 경우, 사용자는 화상형성장치의 디스플레이 창에 디스플레이되는 파일 이름 또는 썸네일 이미지를 통하여 원하는 문서를 찾을 수 있다.
하지만, 파일의 이름은 보통 날짜나 시간으로 이루어진 문자열 또는 순차적인 넘버링에 따른 문자열 등으로 표시되므로, 사용자가 원하는 문서를 찾는데 어려 움이 따른다. 또한, 썸네일 이미지를 이용한 검색 역시 디스플레이 창의 크기와 해상도의 제약 때문에 사용자가 원하는 문서를 찾는 것은 용이하지 않다.
본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로서, 스캔된 문서를 분석하여 스캔된 문서의 텍스트 영역으로부터 키 인덱스를 생성할 수 있는 문서 처리장치 및 문서 처리방법을 제공하는데 그 목적이 있다.
본 발명의 일 실시 예에 따른 문서 처리방법은, 스캔된 문서에서 텍스트 영역을 확인하는 단계, 상기 확인된 텍스트 영역에서 심볼을 추출하는 단계, 상기 추출된 심볼의 심볼 관련 정보를 획득하는 단계, 심볼 관련 정보에 관한 기설정된 기준에 따라, 상기 추출된 심볼을 그룹화하여 분리하는 단계, 및, 상기 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스(key index)를 생성하는 단계를 포함한다.
여기서, 상기 심볼 관련 정보는, 심볼의 높이(height), 심볼의 너비(width), 및 획의 너비(stroke width) 중 적어도 어느 하나에 대한 정보일 수 있다.
이 경우, 상기 그룹화하여 분리하는 단계는, 심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준에 따라 상기 추출된 심볼을 그룹화하여 분리할 수 있다.
또한, 상기 텍스트 영역의 심볼 위치 정보를 추출하는 단계를 포함하며, 상기 생성하는 단계는, 상기 추출된 심볼 위치 정보에 따라 상기 분리된 어느 한 그룹의 심볼을 정렬할 수 있다.
아울러, 상기 획득하는 단계는, 상기 심볼 관련 정보가 획의 너비에 대한 정보인 경우, 상기 심볼의 획의 너비가 다양하면, 다양한 획의 너비 중 가장 빈도 수가 높은 획의 너비를 상기 심볼 관련 정보로 획득할 수 있다.
이 경우, 상기 생성하는 단계는, 상기 생성된 키 인덱스를 상기 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 상기 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장할 수 있다.
또한, 상기 스캔된 문서 검색을 위한 이벤트가 발생하면, 상기 저장된 키 인덱스 및 상기 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이하는 단계를 포함할 수 있다.
한편, 본 발명의 일 실시 예에 따른 문서 처리장치는, 스캔된 문서에서 텍스트 영역을 확인하고 상기 확인된 텍스트 영역에서 심볼을 추출하여 심볼 관련 정보를 획득하는 심볼 관련 정보 획득부, 심볼 관련 정보에 관한 기설정된 기준에 따라, 상기 추출된 심볼을 그룹화하여 분리하는 심볼 분리부, 및, 상기 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성하는 키 인덱스 생성부를 포함한다.
여기서, 상기 심볼 관련 정보는, 심볼의 높이(height), 심볼의 너비(width), 및 획의 너비(stroke width) 중 적어도 어느 하나에 대한 정보일 수 있다.
또한, 상기 심볼 분리부는, 심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준에 따라 상기 추출된 심볼을 그룹화하여 분리할 수 있다.
아울러, 상기 텍스트 영역의 심볼 위치 정보를 추출하는 위치 정보 추출부를 포함하며, 상기 키 인덱스 생성부는, 상기 추출된 심볼 위치 정보에 따라 상기 분리된 어느 한 그룹의 심볼을 정렬할 수 있다.
여기서, 상기 심볼 관련 정보 획득부는, 상기 심볼 관련 정보가 획의 너비에 대한 정보인 경우, 상기 심볼의 획의 너비가 다양하면, 다양한 획의 너비 중 가장 빈도 수가 높은 획의 너비를 상기 심볼 관련 정보로 획득할 수 있다.
또한, 상기 생성된 키 인덱스를 상기 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 상기 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장하는 저장부를 포함할 수 있다.
아울러, 상기 스캔된 문서 검색을 위한 이벤트가 발생하면, 상기 저장된 키 인덱스 및 상기 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이하는 UI부를 더 포함할 수 있다.
한편, 본 발명의 일 실시 예에 따른 문서 처리장치는, 문서를 스캔하는 스캐닝부, 스캔된 문서의 텍스트 영역에서 각 심볼의 크기를 비교하여 키 인덱스를 생성하는 메인 보드부, 및, 상기 생성된 키 인덱스를 저장하는 저장부를 포함한다.
여기서, 상기 메인 보드부는, 상기 스캔된 문서의 텍스트 영역에서 심볼을 추출하여 심볼 관련 정보를 획득하고 상기 추출된 심볼을 그 크기에 따라 그룹화하여 분리함으로써, 분리된 그룹 중 어느 한 그룹의 심볼이 정렬된 키 인덱스를 생성할 수 있다.
또한, 상기 메인 보드부는, 심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준에 따라 심볼을 그룹화하여 분리할 수 있다.
아울러, 상기 메인 보드부는, 상기 텍스트 영역의 심볼 위치 정보가 추출되면, 상기 추출된 심볼 위치 정보에 따라 상기 분리된 어느 한 그룹의 심볼을 정렬할 수 있다.
한편, 본 발명의 다른 실시 예에 따른 문서처리 방법은, 스캔된 문서에서 텍스트 영역을 확인하는 단계, 상기 확인된 텍스트 영역에서 기설정된 기준에 따라 키 인덱스가 가능한 심볼을 추출하는 단계, 관련 키 인덱스를 상기 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 상기 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장하는 단계, 및, 상기 스캔된 문서 검색을 위한 이벤트가 발생하면, 상기 저장된 키 인덱스 및 상기 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이하는 단계를 포함한다.
또한, 심볼의 높이(height), 심볼의 너비(width), 및 획의 너비(stroke width) 중 적어도 어느 하나에 대한 심볼 관련 정보를 획득하는 단계를 더 포함할 수 있다.
아울러, 심볼 관련 정보에 관한 기설정된 기준에 따라, 심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준으로 상기 추출된 심볼을 그룹화하여 분리하는 단계를 더 포함할 수 있다.
이 경우, 상기 텍스트 영역의 심볼 위치 정보를 추출하는 단계, 심볼 관련 정보에 관한 기설정된 기준에 따라, 상기 추출된 심볼을 그룹화하여 분리하는 단 계, 및, 상기 추출된 심볼 위치 정보에 따라 상기 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성하는 단계를 더 포함할 수 있다.
여기서, 상기 획득하는 단계는, 상기 심볼 관련 정보가 획의 너비에 대한 정보인 경우, 상기 심볼의 획의 너비가 다양하면, 다양한 획의 너비 중 가장 빈도 수가 높은 획의 너비를 상기 심볼 관련 정보로 획득할 수 있다.
한편, 본 발명의 또 다른 실시 예에 따른 문서 처리장치는, 스캔된 문서에서 텍스트 영역을 확인하여, 상기 확인된 텍스트 영역에서 기설정된 기준에 따라 키 인덱스가 가능한 심볼을 추출하는 심볼 추출부, 관련 키 인덱스를 상기 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 상기 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장하는 저장부, 및, 상기 스캔된 문서 검색을 위한 이벤트가 발생하면, 상기 저장된 키 인덱스 및 상기 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이하는 UI부를 포함한다.
여기서, 상기 심볼 추출부는, 심볼의 높이(height), 심볼의 너비(width), 및 획의 너비(stroke width) 중 적어도 어느 하나에 대한 심볼 관련 정보를 획득할 수 있다.
또한, 심볼 관련 정보에 관한 기설정된 기준에 따라, 심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준으로 상기 추출된 심볼을 그룹화하여 분리하는 심볼 분리부를 더 포함할 수 있다.
아울러, 상기 텍스트 영역의 심볼 위치 정보를 추출하는 위치 정보 추출부, 심볼 관련 정보에 관한 기설정된 기준에 따라, 상기 추출된 심볼을 그룹화하여 분 리하는 심볼 분리부, 및, 상기 추출된 심볼 위치 정보에 따라 상기 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성하는 키 인덱스 생성부를 더 포함할 수 있다.
이 경우, 상기 심볼 추출부는, 상기 심볼 관련 정보가 획의 너비에 대한 정보인 경우, 상기 심볼의 획의 너비가 다양하면, 다양한 획의 너비 중 가장 빈도 수가 높은 획의 너비를 상기 심볼 관련 정보로 획득할 수 있다.
이하 첨부된 도면을 참조하여 본 발명에 대하여 보다 구체적으로 살펴보기로 한다.
도 1은 본 발명의 일 실시 예에 따른 문서 처리장치를 나타내는 도면이다. 본 발명의 일 실시 예에 따른 문서 처리장치(100)는 화상형성장치로 구현될 수 있으며, 구체적으로는 화상형성장치 내에서 소프트웨어 또는 하드웨어를 통해 구현될 수 있다. 이 경우, 화상형성장치는 스캐닝 기능이 구비된 MFP(Multi Function Peripheral)로 구현되는 것이 바람직하다.
도 1을 참조하면, 문서 처리장치(100)는 심볼 관련 정보 획득부(110), 심볼 분리부(120), 및 키 인덱스 생성부(130)를 포함한다.
심볼 관련 정보 획득부(110)는 스캔된 문서에서 텍스트 영역을 확인하고 확인된 텍스트 영역에서 심볼을 추출하여 심볼 관련 정보를 획득한다.
심볼 분리부(120)는 심볼 관련 정보에 관한 기설정된 기준에 따라, 추출된 심볼을 그룹화하여 분리한다.
키 인덱스 생성부(130)는 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성한다.
여기서, 스캔된 문서는 문서 처리장치(100) 내에 JPG, JPEG 등의 이미지 파일 형태로 기저장된다. 또한, 스캔된 문서는 이미지 영역과 텍스트 영역이 혼재되어 있는 혼재 문서(mixed document)이거나, 텍스트 영역만이 포함된 문서일 수 있다. 이미지 영역은 그래픽(graphic) 또는 사진(photograph)을 포함한다.
또한, 심볼이란 연결성을 가진 오브젝트(object)로서, 일 예로서, A, B, C 등이 될 수 있으며, i의 경우에는 ㆍ과 l이 분리되어 있으므로 ㆍ과 l이 각각 별개의 심볼일 수 있다.
도 2는 도 1의 문서 처리장치를 보다 구체적으로 나타내는 도면이다. 도 2는 도 1의 구성에 위치 정보 추출부(140), 저장부(150), UI부(160)를 더 포함할 수 있다.
위치 정보 추출부(140)는 텍스트 영역의 심볼 위치 정보를 추출할 수 있다.
저장부(150)는 생성된 키 인덱스를 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장할 수 있다.
UI부(160)는 스캔된 문서 검색을 위한 이벤트가 발생하면, 저장된 키 인덱스 및 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이할 수 있다.
도 3은 스캔된 문서에서 텍스트 영역을 확인하는 방법을 설명하기 위한 도면이며, 도 4는 텍스트 영역에서 심볼을 추출하는 방법을 설명하기 위한 도면이며, 도 5a 및 도 5b는 심볼 관련 정보를 설명하기 위한 도면이며, 도 6은 추출된 심볼 을 그룹화하는 방법을 설명하기 위한 도면이며, 도 7은 UI부의 일 예를 나타내는 도면이다. 이하, 도 3 내지 도 7을 참조하여 문서 처리장치(100)의 동작에 대하여 보다 구체적으로 설명하기로 한다.
심볼 관련 정보 획득부(100)는 스캔된 문서에서 텍스트 영역을 확인할 수 있다. 스캔된 문서가 혼재 문서인 경우에, 도 3에서처럼, 이미지 영역(P)과 텍스트 영역(Q)을 각각 구분할 수 있다.
이 경우, 스캔된 문서에서 이미지 영역(P)과 텍스트 영역(Q)를 식별하기 위해서는, 픽셀들의 밝기값의 변화를 이용하는 방법, 블록으로 나눈 후 각 블록 내의 특성을 이용하여 분류하는 방법, Edgeness 등을 이용하는 방법 등과 같이 주지의 기술을 이용할 수 있다.
일 예로서, 픽셀들의 밝기값 변화를 이용하는 방법은, 화상형성장치의 RGB 값을 YCbCr 등과 같은 색공간으로 변환하고, 저역통과 필터링을 통해 화소를 선명하게 한다. 그 후, 제1 임계값 및 제2 임계값을 기준으로, 명도가 가장 낮은 T(텍스트), 명도가 제1 임계값과 제2 임계값 사이인 I(이미지), 제2 임계값 이상인 B(배경)으로 구분한다. 그리고 나서, 스캔된 문서의 전체 픽셀에 대하여 이미지 영역, 텍스트 영역, 배경 영역으로 구분할 수 있다. 여기서, 배경 영역은 텍스트 영역으로 간주될 수 있다.
한편, 스캔된 문서가 텍스트 영역(Q)으로만 이루어진 경우에는 텍스트 영역(Q)을 확인할 수 있다.
또한, 심볼 관련 정보 획득부(100)는 확인된 텍스트 영역에서 심볼을 추출할 수 있다. 도 4를 참조하면, 일 예로서, 스캔된 문서에 심볼 'H'가 포함되어 있는 경우가 도시되어 있다. 여기서 각각의 블럭은 하나의 픽셀(화소)을 나타내며, B는 배경(Background), T는 텍스트(Text)로 각각 의미한다. 상부에서 하부 방향으로 한 라인식 스캔을 수행하여 각각의 픽셀이 T(텍스트)인지, 텍스트 사이의 공간인 B(배경)인지를 구분할 수 있다. 도 4에서 도시된 것처럼, T(텍스트)로 구분된 'H' 주변의 픽셀들이 모두 B(배경)로 검출된다면, 'H'는 연결성을 가진 오브젝트인 심볼일 수 있다. 이와 같이, 8-neighborhood connected component를 이용하여 텍스트 영역에서 심볼을 추출할 수 있다.
또한, 심볼 관련 정보 획득부(110)는 심볼 관련 정보를 획득할 수 있다. 도 5a 및 도 5b를 참조할 때, 심볼 관련 정보란 심볼의 특성을 나타낼 수 있는 높이(height:a), 너비(width:b), 및 획의 너비(stroke width:c) 중 적어도 하나에 대한 정보일 수 있다.
심볼 관련 정보 획득부(100)에서 심볼을 추출할 때, 도 4에서 도시된 것처럼, 텍스트에 해당하는 픽셀들만을 블럭화하여 심볼을 추출할 수 있으므로, 심볼의 높이, 심볼의 너비, 및 획의 너비에 관한 정보는 직접 측정될 수 있다.
다만, 다양한 서체가 존재하는 것처럼, 심볼의 종류에 따라서는 도 5b처럼 획의 너비가 다양한 심볼이 존재할 수 있다. 이 경우에는, c1, c2, c3 등과 같은 다양한 획의 너비 후보자들 중 가장 빈도수가 높은 획의 너비를 심볼의 획의 너비로 선출할 수 있다. 또는, c1, c2, c3 등과 같은 다양한 획의 너비를 평균한 값을 획의 너비로 선출할 수 있다.
심볼 분리부(120)는 심볼 관련 정보에 관한 기설정된 기준에 따라, 추출된 심볼을 그룹화하여 분리할 수 있다. 일 예로서, 심볼의 높이(a)와 심볼의 너비(b)의 합으로 표시되는 제1 기준 및 획의 너비(c)로 표시되는 제2 기준에 따라 추출된 심볼을 그룹화할 수 있다.
도 6을 참조하면, 가로 축은 심볼의 높이(a)와 심볼의 너비(b)의 합으로 표시되며, 세로 축은 획의 너비(c)로 표시된다. 이에 따라, 도 3에서 도시된 것처럼, 스캔된 문서의 텍스트 영역(Q) 중 상대적으로 큰 심볼들로 표시된 "HOW WE GOT HERE"를 이루는 각각의 심볼들, 즉 H, O, W, W, E,... 등이 그룹 B로 맵핑될 수 있으며, "HOW WE GOT HERE"을 제외한 텍스트 영역(Q)의 심볼들이 그룹 A로 맵핑될 수 있다.
만약, 도 3에서 도시된 것과 달리, 스캔된 문서의 텍스트 영역(Q)에 심볼 관련 정보에 따라 3종류의 심볼 유형이 존재한다면, 3개의 그룹으로 그룹화될 수 있다. 이와 같이, K-means clustering 등의 다양한 그룹화 방법을 이용하여 추출된 심볼을 그룹화할 수 있다.
키 인덱스 생성부(130)는 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성한다. 도 6에서 도시된 것처럼, 그룹 A 및 그룹 B 중에서 사용자가 식별하기 용이한 "HOW WE GOT HERE"와 같은 키 인덱스를 생성하기 위해서는, 그룹 B에 포함된 심볼들, H, O, W, W,... 의 그 배치 순서를 정렬하는 것이 바람직하다.
위치 정보 추출부(140)는 텍스트 영역의 심볼 위치 정보를 추출할 수 있다. 구체적으로, 위치 정보 추출부(140)는 복수 개의 픽셀로 이루어지는 심볼이 심볼 관련 정보 획득부(110)에서 블럭화되어 추출되면, 일 예로서, 심볼 각각의 상부 최좌측 좌표값을 미리 저장하여, 이를 통해 각각의 심볼에서의 상대적인 위치 값을 확인할 수 있게 된다. 이에 따라, 키 인덱스 생성부(130)는 추출된 심볼 위치 정보에 따라 분리된 그룹 B의 심볼을 정렬할 수 있다.
저장부(150)는 생성된 키 인덱스를 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 생성된 키 인덱스를 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장할 수 있다.
구체적으로, 저장부(150)는 이미 저장되어 있는 스캔된 문서와 별개로, "HOW WE GOT HERE"와 같은 키 인덱스를 생성하여 생성된 키 인덱스를 이미지 파일 형태로 저장할 수 있다. 이 경우 저장부(150)는 이미 저장되어 있는 스캔된 문서와 키 인덱스를 포함하는 이미지 파일이 서로 관련되도록 링크 정보 저장하는 것이 바람직하다.
또는, 이미 저장되어 있는 스캔된 문서가 JPEG 형식의 이미지 화일인 경우에는 "HOW WE GOT HERE"와 같은 키 인덱스를 포함하는 이미지 파일을 JPEG 헤더의 빈 공간에 저장할 수도 있다.
여기서, 저장부는 HDD(Hard Disk Driver) 또는 플레쉬 메모리 등으로 구현될 수 있다.
UI부(160)는 스캔된 문서 검색을 위한 이벤트가 발생하면, 저장된 키 인덱스 및 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이할 수 있다. 도 7을 참조하면, UI부(160)는 썸네일 이미지(A) 이외에, 키 인덱스 이미지(B) 및 이미 저장되어 있던 스캔된 문서의 이미지(C)를 디스플레이할 수 있다.
일 예로서, UI부(160)는 키 인덱스 이미지(B) 및 이미 저장되어 있던 스캔된 문서의 이미지(C) 중 적어도 어느 하나를 확대하여 디스플레이할 수 있다. 또는, UI부(160)는 스캔된 문서 검색을 위한 이벤트가 발생하면, 처음에는 썸네일 이미지(A)가 디스플레이되고, 그 후 트리거 버튼(미도시)의 조작에 의해, 키 인덱스 이미지(B) 및 이미 저장되어 있던 스캔된 문서의 이미지(C) 중 적어도 어느 하나를 확대하여 디스플레이할 수도 있다. 이 경우, 문서 검색을 보다 용이하게 하기 위하여 적어도 키 인덱스 이미지(B)는 디스플레이하는 것이 바람직하다.
이에 따라, 문서 처리장치(100)는 스캔된 문서 내부에 포함되어 있는 키 인덱스를 검출하여 키 인덱스를 UI 창에 디스플레이할 수 있으므로, 사용자의 문서 검색에 편의를 제공할 수 있다.
도 8은 본 발명의 일 실시 예에 따른 문서 처리방법을 나타내는 흐름도이다. 도 8을 참조하면, 문서 처리방법은 심볼 관련 정보 획득부(110)에서 스캔된 문서에서 텍스트 영역을 확인하고(S810), 확인된 텍스트 영역에서 심볼을 추출하여(S820), 추출된 심볼의 심볼 관련 정보를 획득한다(S830).
또한, 심볼 분리부(120)에서 심볼 관련 정보에 관한 기설정된 기준에 따라, 추출된 심볼을 그룹화하여 분리한다(S840).
그 후, 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스(key index)를 생성한다(S850). 여기서, 분리된 그룹 중 어느 한 그룹은 일반적으로 사용자가 식별하기 용이한 형태의 심볼들의 조합이 될 수 있다.
그리고 나서, UI부(160)에서 저장된 키 인덱스 및 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이할 수 있다(S860).
한편, 심볼 위치 정부 추출부(140)에서 텍스트 영역의 심볼 위치 정보를 추출하는 단계는 도시되지는 않았으나, 키 인덱스를 생성하는 단계(S850) 이전의 어느 위치에도 배치될 수 있다.
도 9는 본 발명의 다른 실시 예에 따른 문서 처리장치를 나타내는 도면이다. 도 9를 참조하면, 문서 처리장치(900)는 스캐닝부(910), 메인 보드부(920), 및 저장부(930)를 포함한다.
스캐닝부(910)는 문서를 스캔한다.
메인 보드부(920)는 스캔된 문서의 텍스트 영역에서 각 심볼의 크기를 비교하여 키 인덱스를 생성한다.
저장부(930)는 생성된 키 인덱스를 저장한다.
구체적으로, 메인 보드부(920)는 스캔된 문서의 텍스트 영역에서 심볼을 추출하여 심볼 관련 정보를 획득하고 추출된 심볼을 그 크기에 따라 그룹화하여 분리함으로써, 분리된 그룹 중 어느 한 그룹의 심볼이 정렬된 키 인덱스를 생성할 수 있다.
또한, 메인 보드부(920)는, 심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준에 따라 심볼을 그룹화하여 분리할 수 있다.
여기서, 메인 보드부(920)는, 텍스트 영역의 심볼 위치 정보가 추출되면, 추출된 심볼 위치 정보에 따라 분리된 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성할 수 있다.
한편, 본 발명의 또 다른 실시 예에 따른 문서 처리장치는, 심볼 추출부, 저장부, 디스플레이부를 포함한다. 본 실시 예는 도 1 및 도 2에서 설명된 실시 예의 변형 실시 예이므로, 도 1 및 도 2에서 사용된 도면 정보가 동일하게 사용될 수 있다.
심볼 추출부는 스캔된 문서에서 텍스트 영역을 확인하여, 확인된 텍스트 영역에서 기설정된 기준에 따라 키 인덱스가 가능한 심볼을 추출한다. 다만, 본 실시 예에서 설명된 심볼 추출부란 구성은 심볼 관련 정보 획득부(110)와 거의 동일한 기능을 수행한다.
저장부(150)는 관련 키 인덱스를 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장한다.
UI부(160)는 스캔된 문서 검색을 위한 이벤트가 발생하면, 저장된 키 인덱스 및 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이한다.
즉, 본 발명의 또 다른 실시 예에 따른 문서 처리장치는 심볼 추출부, 저장부(150), 및 UI부(160)만으로 이루어질 수 있다. 이에 따라, 키인덱스가 가능한 심볼을 추출하고 키 인덱스를 저장한 후, 저장된 키 인덱스 및 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이할 수 있다.
여기서, 심볼 추출부는, 심볼의 높이(height), 심볼의 너비(width), 및 획의 너비(stroke width) 중 적어도 어느 하나에 대한 심볼 관련 정보를 획득할 수 있다. 또한, 심볼 추출부는 심볼 관련 정보가 획의 너비에 대한 정보인 경우, 심볼의 획의 너비가 다양하면, 다양한 획의 너비 중 가장 빈도 수가 높은 획의 너비를 심볼 관련 정보로 획득할 수 있다.
심볼 분리부(120)는 심볼 관련 정보에 관한 기설정된 기준에 따라, 심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준으로 추출된 심볼을 그룹화하여 분리할 수 있다.
위치 정보 추출부(140)는 텍스트 영역의 심볼 위치 정보를 추출하고, 심볼 분리부(120)에서 심볼 관련 정보에 관한 기설정된 기준에 따라, 추출된 심볼을 그룹화하여 분리하면, 키 인덱스 생성부(130)는 추출된 심볼 위치 정보에 따라 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성할 수 있다.
한편, 도 10은 본 발명의 다른 실시 예에 따른 문서 처리방법을 나타내는 흐름도이다. 도 10을 참조하면, 본 발명의 다른 실시 예에 따른 문서 처리방법은, 심볼 추출부에서 스캔된 문서에서 텍스트 영역을 확인하고(S1000), 확인된 텍스트 영역에서 기설정된 기준에 따라 키 인덱스가 가능한 심볼을 추출한다(S1010).
또한, 저장부(150)에서 관련 키 인덱스를 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장한다(S1020).
그리고 나서, UI부(160)에서 스캔된 문서 검색을 위한 이벤트가 발생하면, 저장된 키 인덱스 및 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이한다(S1040).
도 10에서 도시된 것처럼, 본 발명의 다른 실시 예에 따른 문서 처리방법은 상술한 확인하는 단계(S1000), 추출하는 단계(S1000), 저장하는 단계(S1010), 및 디스플레이하는 단계(S1040)만으로 이루어질 수 있다.
또한, 도 10에서 도시된 것처럼, 본 발명의 다른 실시 예에 따른 문서 처리방법은 도 8에서 도시된 실시 예에 대한 변형 실시 예이며, 상술한 본 발명의 또 다른 실시 예에 따른 문서 처리장치와 카테고리만 달리하므로, 이하 중복되는 부분에 대한 설명은 생략하기로 한다.
이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면, 누구든지 본 발명의 기술적 사상 및 범위를 벗어나지 않는 범주 내에서 본 발명의 바람직한 실시 예를 다양하게 변경할 수 있음은 물론이다. 따라서 본 발명은 특허청구범위에서 청구하는 본 발명의 요지를 벗어나지 않는다면 다양한 변형 실시가 가능할 것이며, 이러한 변형 실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
도 1은 본 발명의 일 실시 예에 따른 문서 처리장치를 나타내는 도면.
도 2는 도 1의 문서 처리장치를 보다 구체적으로 나타내는 도면.
도 3은 스캔된 문서에서 텍스트 영역을 확인하는 방법을 설명하기 위한 도면.
도 4는 텍스트 영역에서 심볼을 추출하는 방법을 설명하기 위한 도면.
도 5a 및 도 5b는 심볼 관련 정보를 설명하기 위한 도면.
도 6은 추출된 심볼을 그룹화하는 방법을 설명하기 위한 도면.
도 7은 UI부의 일 예를 나타내는 도면.
도 8은 본 발명의 일 실시 예에 따른 문서 처리방법을 나타내는 흐름도.
도 9는 본 발명의 다른 실시 예에 따른 문서 처리장치를 나타내는 도면.
도 10은 본 발명의 다른 실시 예에 따른 문서 처리방법을 나타내는 흐름도.
* 도면의 주요부분에 대한 설명 *
100, 900 : 문서 처리장치 110 : 심볼 관련 정보 획득부
120 : 심볼 분리부 130 : 키 인덱스 생성부
140 : 위치 정보 추출부 150, 930 : 저장부
160 : UI부 910 : 스캐닝부
920 : 메인 보드부

Claims (28)

  1. 스캔된 문서에서 텍스트 영역을 확인하는 단계;
    상기 확인된 텍스트 영역에서 심볼을 추출하는 단계;
    상기 추출된 심볼의 심볼 관련 정보를 획득하는 단계;
    심볼 관련 정보에 관한 기설정된 기준에 따라, 상기 추출된 심볼을 그룹화하여 분리하는 단계; 및,
    상기 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스(key index)를 생성하는 단계;를 포함하고,
    상기 생성하는 단계는,
    상기 생성된 키 인덱스를 상기 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 상기 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장하는 것을 특징으로 하는 문서 처리방법.
  2. 제1항에 있어서,
    상기 심볼 관련 정보는,
    심볼의 높이(height), 심볼의 너비(width), 및 획의 너비(stroke width) 중 적어도 어느 하나에 대한 정보인 것을 특징으로 하는 문서 처리방법.
  3. 제1항에 있어서,
    상기 그룹화하여 분리하는 단계는,
    심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준에 따라 상기 추출된 심볼을 그룹화하여 분리하는 것을 특징으로 하는 문서 처리방법.
  4. 제1항에 있어서,
    상기 텍스트 영역의 심볼 위치 정보를 추출하는 단계;를 포함하며,
    상기 생성하는 단계는,
    상기 추출된 심볼 위치 정보에 따라 상기 분리된 어느 한 그룹의 심볼을 정렬하는 것을 특징으로 하는 문서 처리방법.
  5. 제1항에 있어서,
    상기 획득하는 단계는,
    상기 심볼 관련 정보가 획의 너비에 대한 정보인 경우, 상기 심볼의 획의 너비가 다양하면, 다양한 획의 너비 중 가장 빈도 수가 높은 획의 너비를 상기 심볼 관련 정보로 획득하는 것을 특징으로 하는 문서 처리방법.
  6. 삭제
  7. 제1항에 있어서,
    상기 스캔된 문서 검색을 위한 이벤트가 발생하면, 상기 저장된 키 인덱스 및 상기 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이하는 단계;를 포함하는 것을 특징으로 하는 문서 처리방법.
  8. 스캔된 문서에서 텍스트 영역을 확인하고 상기 확인된 텍스트 영역에서 심볼을 추출하여 심볼 관련 정보를 획득하는 심볼 관련 정보 획득부;
    심볼 관련 정보에 관한 기설정된 기준에 따라, 상기 추출된 심볼을 그룹화하여 분리하는 심볼 분리부;
    상기 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성하는 키 인덱스 생성부; 및
    상기 생성된 키 인덱스를 상기 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 상기 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장하는 저장부;를 포함하는 문서 처리장치.
  9. 제8항에 있어서,
    상기 심볼 관련 정보는,
    심볼의 높이(height), 심볼의 너비(width), 및 획의 너비(stroke width) 중 적어도 어느 하나에 대한 정보인 것을 특징으로 하는 문서 처리장치.
  10. 제8항에 있어서,
    상기 심볼 분리부는,
    심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준에 따라 상기 추출된 심볼을 그룹화하여 분리하는 것을 특징으로 하는 문서 처리장치.
  11. 제8항에 있어서,
    상기 텍스트 영역의 심볼 위치 정보를 추출하는 위치 정보 추출부;를 포함하며,
    상기 키 인덱스 생성부는,
    상기 추출된 심볼 위치 정보에 따라 상기 분리된 어느 한 그룹의 심볼을 정렬하는 것을 특징으로 하는 문서 처리장치.
  12. 제8항에 있어서,
    상기 심볼 관련 정보 획득부는,
    상기 심볼 관련 정보가 획의 너비에 대한 정보인 경우, 상기 심볼의 획의 너비가 다양하면, 다양한 획의 너비 중 가장 빈도 수가 높은 획의 너비를 상기 심볼 관련 정보로 획득하는 것을 특징으로 하는 문서 처리장치.
  13. 삭제
  14. 제8항에 있어서,
    상기 스캔된 문서 검색을 위한 이벤트가 발생하면, 상기 저장된 키 인덱스 및 상기 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이하는 UI부;를 더 포함하는 것을 특징으로 하는 문서 처리장치.
  15. 문서를 스캔하는 스캐닝부;
    스캔된 문서의 텍스트 영역에서 각 심볼의 크기를 비교하여 키 인덱스를 생성하는 메인 보드부; 및,
    상기 생성된 키 인덱스를 상기 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 상기 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장하는 저장부;를 포함하는 문서 처리장치.
  16. 제15항에 있어서,
    상기 메인 보드부는,
    상기 스캔된 문서의 텍스트 영역에서 심볼을 추출하여 심볼 관련 정보를 획득하고 상기 추출된 심볼을 그 크기에 따라 그룹화하여 분리함으로써, 분리된 그룹 중 어느 한 그룹의 심볼이 정렬된 키 인덱스를 생성하는 것을 특징으로 하는 문서 처리장치.
  17. 제16항에 있어서,
    상기 메인 보드부는,
    심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표 시되는 제2 기준에 따라 심볼을 그룹화하여 분리하는 것을 특징으로 하는 문서 처리장치.
  18. 제16항에 있어서,
    상기 메인 보드부는,
    상기 텍스트 영역의 심볼 위치 정보가 추출되면, 상기 추출된 심볼 위치 정보에 따라 상기 분리된 어느 한 그룹의 심볼을 정렬하는 것을 특징으로 하는 문서 처리장치.
  19. 스캔된 문서에서 텍스트 영역을 확인하는 단계;
    상기 확인된 텍스트 영역에서 기설정된 기준에 따라 키 인덱스가 가능한 심볼을 추출하는 단계;
    관련 키 인덱스를 상기 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 상기 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장하는 단계; 및,
    상기 스캔된 문서 검색을 위한 이벤트가 발생하면, 상기 저장된 키 인덱스 및 상기 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이하는 단계;를 포함하는 문서 처리방법.
  20. 제19항에 있어서,
    심볼의 높이(height), 심볼의 너비(width), 및 획의 너비(stroke width) 중 적어도 어느 하나에 대한 심볼 관련 정보를 획득하는 단계;를 더 포함하는 것을 특징으로 하는 문서 처리방법.
  21. 제19항에 있어서,
    심볼 관련 정보에 관한 기설정된 기준에 따라, 심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준으로 상기 추출된 심볼을 그룹화하여 분리하는 단계;를 더 포함하는 것을 특징으로 하는 문서 처리방법.
  22. 제19항에 있어서,
    상기 텍스트 영역의 심볼 위치 정보를 추출하는 단계;
    심볼 관련 정보에 관한 기설정된 기준에 따라, 상기 추출된 심볼을 그룹화하여 분리하는 단계; 및,
    상기 추출된 심볼 위치 정보에 따라 상기 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성하는 단계;를 더 포함하는 것을 특징으로 하는 문서 처리방법.
  23. 제20항에 있어서,
    상기 획득하는 단계는,
    상기 심볼 관련 정보가 획의 너비에 대한 정보인 경우, 상기 심볼의 획의 너 비가 다양하면, 다양한 획의 너비 중 가장 빈도 수가 높은 획의 너비를 상기 심볼 관련 정보로 획득하는 것을 특징으로 하는 문서 처리방법.
  24. 스캔된 문서에서 텍스트 영역을 확인하여, 상기 확인된 텍스트 영역에서 기설정된 기준에 따라 키 인덱스가 가능한 심볼을 추출하는 심볼 추출부;
    관련 키 인덱스를 상기 스캔된 문서와 별개의 이미지 파일 형태로 저장하거나, 상기 스캔된 문서의 헤더 영역에 이미지 파일 형태로 저장하는 저장부; 및,
    상기 스캔된 문서 검색을 위한 이벤트가 발생하면, 상기 저장된 키 인덱스 및 상기 스캔된 문서의 이미지 영역 중 적어도 하나를 확대하여 디스플레이하는 UI부;를 포함하는 문서 처리장치.
  25. 제24항에 있어서,
    상기 심볼 추출부는,
    심볼의 높이(height), 심볼의 너비(width), 및 획의 너비(stroke width) 중 적어도 어느 하나에 대한 심볼 관련 정보를 획득하는 것을 특징으로 하는 문서 처리장치.
  26. 제24항에 있어서,
    심볼 관련 정보에 관한 기설정된 기준에 따라, 심볼의 높이와 심볼의 너비의 합으로 표시되는 제1 기준 및 획의 너비로 표시되는 제2 기준으로 상기 추출된 심 볼을 그룹화하여 분리하는 심볼 분리부;를 더 포함하는 것을 특징으로 하는 문서 처리장치.
  27. 제24항에 있어서,
    상기 텍스트 영역의 심볼 위치 정보를 추출하는 위치 정보 추출부;
    심볼 관련 정보에 관한 기설정된 기준에 따라, 상기 추출된 심볼을 그룹화하여 분리하는 심볼 분리부; 및,
    상기 추출된 심볼 위치 정보에 따라 상기 그룹화에 의해 분리된 그룹 중 어느 한 그룹의 심볼을 정렬하여 키 인덱스를 생성하는 키 인덱스 생성부;를 더 포함하는 것을 특징으로 하는 문서 처리장치.
  28. 제25항에 있어서,
    상기 심볼 추출부는,
    상기 심볼 관련 정보가 획의 너비에 대한 정보인 경우, 상기 심볼의 획의 너비가 다양하면, 다양한 획의 너비 중 가장 빈도 수가 높은 획의 너비를 상기 심볼 관련 정보로 획득하는 것을 특징으로 하는 문서 처리장치.
KR1020080096016A 2008-09-30 2008-09-30 문서 처리장치 및 문서 처리방법 KR101309782B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020080096016A KR101309782B1 (ko) 2008-09-30 2008-09-30 문서 처리장치 및 문서 처리방법
US12/566,912 US8619316B2 (en) 2008-09-30 2009-09-25 Document processing apparatus and method for processing document using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080096016A KR101309782B1 (ko) 2008-09-30 2008-09-30 문서 처리장치 및 문서 처리방법

Publications (2)

Publication Number Publication Date
KR20100036676A KR20100036676A (ko) 2010-04-08
KR101309782B1 true KR101309782B1 (ko) 2013-09-23

Family

ID=42057164

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080096016A KR101309782B1 (ko) 2008-09-30 2008-09-30 문서 처리장치 및 문서 처리방법

Country Status (2)

Country Link
US (1) US8619316B2 (ko)
KR (1) KR101309782B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101103029B1 (ko) * 2009-05-22 2012-01-06 김철회 인덱스 인식에 따라 데이터를 추출하는 시스템 및 그 운용방법
KR20130113218A (ko) * 2012-04-05 2013-10-15 강신태 전자노트 기능을 갖는 시스템 및 그 운용방법
JP6455829B2 (ja) * 2013-04-01 2019-01-23 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
GB2513431B (en) * 2013-04-25 2018-12-05 Testplant Europe Ltd Method for creating a label
CN103914907B (zh) * 2014-04-14 2016-08-10 陕西海基业高科技实业有限公司 纸质票据信息识别与核校系统及应用方法
CN104751142B (zh) * 2015-04-01 2018-04-27 电子科技大学 一种基于笔划特征的自然场景文本检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070013157A (ko) * 2005-07-25 2007-01-30 삼성전자주식회사 이미지데이터의 저장방법
KR20080066262A (ko) * 2007-01-11 2008-07-16 삼성전자주식회사 파일 관리가 가능한 화상형성장치 및 그 방법
KR20080069886A (ko) * 2007-01-24 2008-07-29 퍼듀 리서치 파운데이션 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭장치 및 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5465353A (en) * 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
US6061478A (en) * 1997-05-21 2000-05-09 Ricoh Company, Ltd. Content-based filing and retrieval system for name cards and hankos
US6104500A (en) * 1998-04-29 2000-08-15 Bcl, Computer Inc. Networked fax routing via email
JP2000316082A (ja) 1999-04-28 2000-11-14 Ricoh Co Ltd 画像抽出装置および該装置を備える画像処理装置並びにファイリング装置
JP2001184453A (ja) * 1999-12-22 2001-07-06 Hitachi Ltd 帳票処理システムおよび帳票ファイリングシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070013157A (ko) * 2005-07-25 2007-01-30 삼성전자주식회사 이미지데이터의 저장방법
KR20080066262A (ko) * 2007-01-11 2008-07-16 삼성전자주식회사 파일 관리가 가능한 화상형성장치 및 그 방법
KR20080069886A (ko) * 2007-01-24 2008-07-29 퍼듀 리서치 파운데이션 텍스트 이미지 코딩 및 디코딩 시스템에서의 심볼 매칭장치 및 방법

Also Published As

Publication number Publication date
US20100079822A1 (en) 2010-04-01
KR20100036676A (ko) 2010-04-08
US8619316B2 (en) 2013-12-31

Similar Documents

Publication Publication Date Title
KR101309782B1 (ko) 문서 처리장치 및 문서 처리방법
JP4371965B2 (ja) 画像処理装置、画像処理方法
JP4859025B2 (ja) 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
US8355578B2 (en) Image processing apparatus, image processing method, and storage medium
US5854853A (en) Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US8503773B2 (en) Glyph selection and electronic document generation
US7747108B2 (en) Image processing apparatus and its method
EP2162859B1 (en) Image processing apparatus, image processing method, and computer program
US9710524B2 (en) Image processing apparatus, image processing method, and computer-readable storage medium
US8086039B2 (en) Fine-grained visual document fingerprinting for accurate document comparison and retrieval
US7574044B2 (en) Image processing apparatus, image processing method and image processing program
JP6559415B2 (ja) 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
JP6254002B2 (ja) 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
US8538154B2 (en) Image processing method and image processing apparatus for extracting heading region from image of document
US20130006607A1 (en) Method for fast up-scaling of color images and method for interpretation of digitally acquired documents
US20100070854A1 (en) Device for editing metadata of divided object
JPH06103411A (ja) 文書読取装置
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP6012700B2 (ja) 情報処理装置、情報処理方法、情報処理システム、コンピュータプログラム
JP6926536B2 (ja) 画像処理装置及びプログラム
JP6798309B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5420032B2 (ja) 情報処理装置、情報処理方法、情報処理システム、コンピュータプログラム
JP2008124975A (ja) 画像データ作成装置、画像出力装置、およびプログラム
JP5745010B2 (ja) 情報処理装置、情報処理方法、情報処理システム、コンピュータプログラム
JP2019179989A (ja) 画像出力装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160830

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170825

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180903

Year of fee payment: 6