KR101239949B1 - 이미지데이터의 저장방법 - Google Patents

이미지데이터의 저장방법 Download PDF

Info

Publication number
KR101239949B1
KR101239949B1 KR1020050067548A KR20050067548A KR101239949B1 KR 101239949 B1 KR101239949 B1 KR 101239949B1 KR 1020050067548 A KR1020050067548 A KR 1020050067548A KR 20050067548 A KR20050067548 A KR 20050067548A KR 101239949 B1 KR101239949 B1 KR 101239949B1
Authority
KR
South Korea
Prior art keywords
text
file name
image data
line
setting
Prior art date
Application number
KR1020050067548A
Other languages
English (en)
Other versions
KR20070013157A (ko
Inventor
조현
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050067548A priority Critical patent/KR101239949B1/ko
Publication of KR20070013157A publication Critical patent/KR20070013157A/ko
Application granted granted Critical
Publication of KR101239949B1 publication Critical patent/KR101239949B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors

Abstract

본 발명은 이미지데이터의 저장방법에 관한 것으로서, 스캔 대상 문서를 스캐닝하여 이미지데이터를 생성하는 단계와; 상기 이미지데이터에 포함된 텍스트이미지를 판독하여 텍스트데이터로 변환하는 단계와; 텍스트의 문자/숫자 여부, 크기, 순서, 위치관계 중 적어도 하나를 기준으로 하여 상기 텍스트데이터로부터 소정의 텍스트를 추출하고, 상기 추출된 텍스트를 상기 이미지데이터의 파일명으로 설정하는 단계; 및 상기 이미지데이터를 상기 설정된 파일명으로 저장하는 단계를 포함하는 것을 특징으로 한다. 이에 의해, 저장되는 이미지데이터의 내용이 사용자에 의해 쉽게 파악되도록 상기 이미지데이터의 파일명을 설정할 뿐 아니라, 다수의 이미지데이터 간의 구별이 용이하게 이루어질 수 있다.
스캔데이터, 파일명 자동설정

Description

이미지데이터의 저장방법{Method for saving image data}
도 1은 본 발명의 실시예에 따른 이미지데이터의 저장방법이 적용되는 화상형성장치를 나타낸 블록구성도,
도 2는 본 발명의 실시예에 따른 이미지데이터의 저장방법을 설명하는 순서도,
도 3은 도 2의 S300 단계를 세분화한 단계를 나타내는 부분순서도,
도 4는 도 2의 이미지데이터의 저장방법이 적용되는 이미지데이터를 나타내는 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
10: 이미지데이터 11: 이미지영역
12: 텍스트영역 100: 화상형성장치
110: 컨트롤패널부 120: 인터페이스부
130: 저장부 140: 스캔부
150: 인쇄부 160: 제어부
170: 텍스트판독부 180: 파일명생성부
200: 이동식 저장장치
본 발명은 이미지데이터의 저장방법에 관한 것으로서, 보다 상세하게는 저장하고자 하는 이미지데이터의 파일명이 자동으로 설정되도록 한 이미지데이터의 저장방법에 관한 것이다.
스캐너(scanner)는 문서 상에 구현된 이미지를 컴퓨터가 읽어들일 수 있는 데이터(이하 "이미지데이터"라 한다)의 형태로 저장하기 위한 장치로서, 최근에는 인쇄, 스캔, 팩스전송 등의 기능을 구비한 복합기(multi-functional printer)와 같은 화상형성장치의 일 구성요소로서 구비되는 경우가 많다.
이와 같은 스캐너를 이용하여 문서를 데이터화하여 저장할 경우, 생성된 이미지데이터의 저장을 위한 파일명이 필요하게 된다. 이러한 파일명은 스캐닝되는 문서마다 사용자가 설정하는 경우도 있으나, 대개는 스캐너 구동프로그램에 의해 설정된 명칭 및 순서에 따라 파일명이 정해지게 마련이다.
예를 들면, 총 10페이지의 문서를 스캐닝하는 경우에는 Image0001.jpg ~ Image0010.jpg와 같이 자동으로 저장된다. 또한, 이후 총 5페이지의 문서를 스캐닝하는 경우에는 상기 순서에 이어 Image0011.jpg ~ Image0015.jpg와 같이 자동 저장된다.
따라서, 사용자는 이미지데이터 간의 구별이 곤란할 뿐 아니라, 서로 다른 종류의 이미지데이터 사이의 구분이 곤란하다는 문제가 있었다.
상기 경우의 발생 시 종래에는 사용자가 Image0001.jpg 내지 Image0010.jpg 의 파일은 문서1_0001.jpg 내지 문서1_0010.jpg와 같이, Image0011.jpg 내지 Image0015.jpg의 파일은 문서2_0011.jpg 내지 문서2_0015.jpg와 같이 파일명을 수정함으로써 구분하였다. 그러나, 이 때에는 사용자가 이미지데이터마다 오픈시켜 그 내용을 확인한 후 해당 파일명을 적절한 파일명으로 수정, 정리해야 한다는 번거로움이 존재하였다.
따라서, 본 발명의 목적은 저장되는 이미지데이터의 내용이 쉽게 파악되도록 상기 이미지데이터의 파일명을 설정할 뿐 아니라, 다수의 이미지데이터 간의 구별이 용이하게 이루어질 수 있도록 하는 이미지데이터의 저장방법을 제공하는 데 있다.
상기 목적을 달성하기 위해 본 발명은, 이미지데이터의 저장방법에 있어서,
스캔 대상 문서를 스캐닝하여 이미지데이터를 생성하는 단계와; 상기 이미지데이터에 포함된 텍스트이미지를 판독하여 텍스트데이터로 변환하는 단계와; 텍스트의 문자/숫자 여부, 크기, 순서, 위치관계 중 적어도 하나를 기준으로 하여 상기 텍스트데이터로부터 소정의 텍스트를 추출하고, 상기 추출된 텍스트를 상기 이미지데이터의 파일명으로 설정하는 단계; 및 상기 이미지데이터를 상기 설정된 파일명으로 저장하는 단계를 포함하는 것을 특징으로 하는 이미지데이터의 저장방법을 제공한다.
여기서, 상기 파일명 설정단계는, 상기 스캔 대상 문서가 복수의 페이지로 존재하는 경우, 상기 추출된 텍스트에 상기 문서에서의 해당 페이지의 숫자를 추가하여 상기 파일명으로 설정하는 단계를 더 포함할 수도 있다.
그리고, 상기 파일명 설정 단계는, 상기 텍스트데이터의 첫째줄이 숫자로 시작하는지 여부를 판단하는 단계와; 판단 결과 상기 첫째줄이 숫자로 시작하는 경우, 상기 숫자 이후 문자로 시작하는 부분으로부터 소정의 텍스트를 추출하여 상기 파일명으로 설정하는 단계를 포함할 수도 있다.
이 경우, 판단 결과 상기 첫째줄이 문자로 시작하는 경우, 상기 텍스트데이터의 둘째줄과 상기 첫째줄 간의 텍스트 크기를 비교하는 단계와; 비교 결과 텍스트 크기가 더 큰 줄로부터 소정의 텍스트를 추출하여 상기 파일명으로 설정하는 단계를 더 포함할 수도 있다. 이 때, 비교 결과 텍스트 크기가 동일한 경우, 상기 첫째줄과 상기 둘째줄의 위치관계를 판단하는 단계와; 상기 첫째줄이 상기 둘째줄보다 더 들여쓰기되거나 동일하게 들여쓰기된 경우에는 상기 첫째줄로부터 소정의 텍스트를 추출하여 상기 파일명으로 설정하는 단계; 및 상기 둘째줄이 상기 첫째줄보더 더 들여쓰기된 경우에는 상기 첫째줄과 상기 둘째줄로부터 각각 소정의 텍스트를 추출 및 결합하여 상기 파일명으로 설정하는 단계를 더 포함할 수도 있다.
이하, 첨부된 도면을 참조하여 본 발명에 대해 상세히 설명하기로 한다.
본 발명의 실시예에 따른 이미지데이터의 저장방법은 도 1에 도시된 바와 같은 화상형성장치(100)에 의해 구현된다.
화상형성장치(100)는 장치의 작동상태 및 사용자의 명령입력을 위한 컨트롤패널부(110), 외부기기와의 접속을 위한 인터페이스부(120), 데이터의 저장을 위한 저장부(130), 문서의 스캐닝을 위한 스캔부(140), 문서인쇄를 위한 인쇄부(150) 및 상기 각 부를 제어하는 제어부(160)를 포함한다.
인터페이스부(120)에는 이동식 저장장치(200)와 같은 저장매체가 장착될 수도 있으며, 이 경우 스캔부(140)로부터 생성되는 이미지데이터를 이동식 저장장치(200)에 파일의 형태로 저장할 수도 있다.
또한, 화상형성장치(100)는 스캔부(140)의 문서 스캐닝에 의해 생성된 이미지데이터로부터 텍스트를 판독하기 위한 텍스트판독부(170), 텍스트판독부(170)로부터 판독된 텍스트로부터 상기 이미지데이터의 파일명을 추출하기 위한 파일명생성부(180)를 더 포함한다.
상기 텍스트판독부(170)와 파일명생성부(180)를 통해 상기 이미지데이터의 저장시 후술하는 바와 같이 자동으로 상기 이미지데이터에 대한 파일명을 설정할 수 있다.
도 2는 이상과 같은 구성을 가지는 화상형성장치(100)에 의해 본 발명의 실시예에 따른 이미지데이터의 저장장법을 설명하는 순서도이다.
이미지데이터의 저장을 위해서는, 먼저 스캔부(140)에 저장 대상 문서를 스캐닝하여 이미지데이터를 생성한다(S100). 생성된 이미지데이터는 저장부(130)에 일시 저장된다.
다음으로, 텍스트판독부(170)는 스캔부(140)에 의해 생성된 상기 이미지데이터를 이미지영역과 텍스트영역으로 구분하여 상기 텍스트영역에 해당하는 이미지를 판독하여 텍스트데이터로 변환시킨다(S200).
파일명생성부(180)는 텍스트판독부(170)에 의해 생성된 텍스트데이터를 분석하여 상기 텍스트데이터로부터 상기 이미지데이터의 파일명으로 삼을 텍스트를 추출하고, 추출된 텍스트를 상기 이미지데이터의 파일명으로 설정한다(S300).
마지막으로, 제어부(160)는 파일명생성부(180)에 의해 설정된 파일명으로 상기 이미지데이터를 저장한다(S400). 이 때, 이미지데이터는 화상형성장치(100)에 마련된 저장부(130)에 저장되거나, 인터페이스부(120)를 통해 외부기기인 이동식 저장장치(200)에 저장될 수도 있다.
도 3은 파일명생성부(180)에 의해 파일명이 생성되는 과정(도 2의 S300)을 보다 구체적으로 설명하는 순서도이다.
파일명생성부(180)는 텍스트판독부(170)에 의해 판독된 텍스트데이터에 포함된 텍스트가 문자인지 숫자인지 여부, 텍스트의 크기 관계, 텍스트의 순서 관계, 텍스트의 들여쓰기와 같은 위치관계 등을 기준으로 하여 상기 이미지데이터의 파일명으로 삼고자 하는 텍스트를 추출하게 된다.
먼저, 파일명생성부(180)는 텍스트데이터의 첫째줄이 숫자로 시작하는지 여부를 판단한다(S310). 판단 결과, 첫째줄이 숫자로 시작하는 경우에는 해당줄 또는 다음줄로 순차 검색하여 처음으로 시작되는 문자열을 상기 이미지데이터의 파일명으로 설정한다(S320). 상기 문자열의 개수는 4~5개의 문자 또는 해당줄의 모든 문자로 설정할 수 있다.
상기 단계에 의해, 스캔 문서의 상단부에 페이지가 기재된 경우 또는 목차 번호가 기재된 경우와 같이 이미지데이터로 저장될 문서의 특징을 적절히 나타내지 못하는 부분은 파일명의 대상에서 제외된다.
한편, 텍스트데이터의 첫째줄이 문자로 시작하는 경우에는, 텍스트데이터의 첫째줄과 둘째줄 간의 문자 크기를 비교한다(S330). 문자 크기가 서로 상이한 경우에는 더 큰 문자가 속한 줄에서 문자열을 추출하여 파일명으로 설정한다(S340). 이는 문자의 크기가 큰 쪽이 문서의 대표될 만한 내용을 포함하는 것으로 해석되도록 하기 위함이다.
텍스트데이터의 첫째줄과 둘째줄의 문자 크기가 서로 동일한 경우에는 양자간 위치관계, 특히 들여쓰기를 비교하여(S350) 파일명을 결정하는데 이용한다.
만약, 첫째줄이 둘째줄보다 더 들여쓰기되거나 또는 서로 동일하게 들여쓰기된 경우에는 첫째줄의 첫 문자열을 상기 이미지데이터의 파일명으로 설정한다(S360). 이는 들여쓰기가 더 된 줄이 해당 문서를 더 적절히 대표하는 것으로 해석되도록 하기 위함이다.
둘째줄이 첫째줄보다 더 들여쓰기된 경우에는 둘째줄의 첫 문자열을 상기 이미지데이터의 파일명으로 설정한다(S370).
한편, 스캔부(140)로부터 스캐닝되는 문서가 복수 페이지로 이루어진 경우에는 각각의 페이지에 대해 파일명이 생성될 뿐 아니라, 페이지별로 해당 페이지의 숫자가 파일명의 맨 뒷 부분에 추가되도록 할 수도 있다.
도 4는 이상의 파일명 설정과정이 적용되는 예를 설명하기 위한 문서의 이미지데이터(10)를 나타낸다. 이미지데이터(10)는 스캔부(140)로부터 생성된 것으로서 텍스트판독부(170)를 거치면서 이미지데이터(10) 상의 이미지영역(11)을 제외한 텍 스트영역(12)이 텍스트데이터화한다. 상기 복수의 단계(S310 내지 S370) 및 도 3에 설명된 과정에 의하면, 이미지데이터(10)의 좌측 상단의 페이지 숫자 "3"은 파일명의 대상에서 제외되며, 우측 상단의 "프린터의 이해" 부분이 파일명으로 설정된다.
만약, 이미지데이터(10) 상단의 "3" 및 "프린터의 이해" 부분이 모두 없다고 한다면, 다음으로 최초 시작되는 문자열인 "프린터의 이해"와 그 다음 줄의 "1. 개요" 부분이 파일명으로 경합하게 되고, 이 중에서 크기가 더 큰 쪽에 해당하는 "프린터의 이해"가 파일명으로 설정된다.
한편, 스캔되는 문서가 복수의 페이지를 이루고 있고, 상기 이미지데이터(10)가 그 중 3페이지에 해당하는 경우에는 상기 설정된 파일명의 맨 마지막 부분에 "3"이라는 숫자가 추가된다.
이상 설명한 본 발명의 실시예는 사용자에 의한 파일명 설정이 아닌 자동설정인 경우에 대해서만 적용되며, 만약 사용자가 직접 파일명을 입력하는 경우에는 입력되는 파일명에 따라 상기 이미지데이터가 저장된다.
이상 설명한 바와 같이, 본 발명에 따른 이미지데이터의 저장방법에 의하면, 이미지데이터의 텍스트 중에서 상기 이미지데이터의 저장 파일명을 설정함에 따라 사용자로 하여금 이미지데이터의 내용이 쉽게 파악되도록 할 뿐 아니라, 다수의 이미지데이터 간의 구별이 용이하게 이루어지도록 한다.

Claims (5)

  1. 이미지데이터의 저장방법에 있어서,
    스캔 대상 문서를 스캐닝하여 이미지데이터를 생성하는 단계와;
    상기 이미지데이터에 포함된 텍스트이미지를 판독하여 텍스트데이터로 변환하는 단계와;
    텍스트의 문자/숫자 여부, 크기, 순서, 위치관계 중 적어도 하나를 기준으로 하여 상기 텍스트데이터로부터 소정의 텍스트를 추출하고, 상기 추출된 텍스트를 상기 이미지데이터의 파일명으로 설정하는 단계; 및
    상기 이미지데이터를 상기 설정된 파일명으로 저장하는 단계를 포함하며,
    상기 파일명 설정 단계는,
    상기 텍스트데이터의 첫째줄이 숫자로 시작하는지 여부를 판단하는 단계와;
    판단 결과 상기 첫째줄이 숫자로 시작하는 경우, 상기 숫자 이후 문자로 시작하는 부분으로부터 소정의 텍스트를 추출하여 상기 파일명으로 설정하는 단계를 포함하는 것을 특징으로 하는 이미지데이터의 저장방법.
  2. 제1항에 있어서,
    상기 파일명 설정단계는,
    상기 스캔 대상 문서가 복수의 페이지로 존재하는 경우, 상기 추출된 텍스트에 상기 스캔 대상 문서에서의 해당 페이지의 숫자를 추가하여 상기 파일명으로 설정하는 단계를 더 포함하는 것을 특징으로 하는 이미지데이터의 저장방법.
  3. 삭제
  4. 제1항에 있어서,
    판단 결과 상기 첫째줄이 문자로 시작하는 경우, 상기 텍스트데이터의 둘째줄과 상기 첫째줄 간의 텍스트 크기를 비교하는 단계와;
    비교 결과 텍스트 크기가 더 큰 줄로부터 소정의 텍스트를 추출하여 상기 파일명으로 설정하는 단계를 더 포함하는 것을 특징으로 하는 이미지데이터의 저장방법.
  5. 제4항에 있어서,
    비교 결과 텍스트 크기가 동일한 경우, 상기 첫째줄과 상기 둘째줄의 위치관계를 판단하는 단계와;
    상기 첫째줄이 상기 둘째줄보다 더 들여쓰기되거나 동일하게 들여쓰기된 경우에는 상기 첫째줄로부터 소정의 텍스트를 추출하여 상기 파일명으로 설정하는 단계; 및
    상기 둘째줄이 상기 첫째줄보더 더 들여쓰기된 경우에는 상기 첫째줄과 상기 둘째줄로부터 각각 소정의 텍스트를 추출 및 결합하여 상기 파일명으로 설정하는 단계를 더 포함하는 것을 특징으로 하는 이미지데이터의 저장방법.
KR1020050067548A 2005-07-25 2005-07-25 이미지데이터의 저장방법 KR101239949B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050067548A KR101239949B1 (ko) 2005-07-25 2005-07-25 이미지데이터의 저장방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050067548A KR101239949B1 (ko) 2005-07-25 2005-07-25 이미지데이터의 저장방법

Publications (2)

Publication Number Publication Date
KR20070013157A KR20070013157A (ko) 2007-01-30
KR101239949B1 true KR101239949B1 (ko) 2013-03-06

Family

ID=38013023

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050067548A KR101239949B1 (ko) 2005-07-25 2005-07-25 이미지데이터의 저장방법

Country Status (1)

Country Link
KR (1) KR101239949B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100884109B1 (ko) * 2007-08-14 2009-02-17 에스케이 텔레콤주식회사 이벤트 태그를 이용한 데이터 관리 장치 및 그 관리 방법
KR101309782B1 (ko) * 2008-09-30 2013-09-23 삼성전자주식회사 문서 처리장치 및 문서 처리방법
WO2016053366A1 (en) * 2014-10-04 2016-04-07 Hewlett-Packard Development Company, L. P. Modified document generation
KR102374797B1 (ko) * 2021-06-14 2022-03-16 주식회사 아키브소프트 멀티이미지 텍스트 처리 장치 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980083934A (ko) * 1997-05-20 1998-12-05 김승호 휴대용전자기기 및 명함관리방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980083934A (ko) * 1997-05-20 1998-12-05 김승호 휴대용전자기기 및 명함관리방법

Also Published As

Publication number Publication date
KR20070013157A (ko) 2007-01-30

Similar Documents

Publication Publication Date Title
JP4338155B2 (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
US8634100B2 (en) Image forming apparatus for detecting index data of document data, and control method and program product for the same
JP2004265384A5 (ko)
CN100349454C (zh) 图像形成装置、图像形成方法及其程序以及存储介质
WO2000020985A1 (en) Conversion of data representing a document to other formats for manipulation and display
CN1684493B (zh) 图像形成装置及图像形成方法
WO1998008168A1 (fr) Dispositif pour generer un texte original et son support de memoire programme
US20190138251A1 (en) Image processing apparatus
JP2007004621A (ja) 文書管理支援装置、文書管理支援方法およびプログラム
US20120250107A1 (en) Image processing apparatus, image processing method, and computer readable medium storing program
KR101239949B1 (ko) 이미지데이터의 저장방법
JP4921335B2 (ja) ドキュメント処理装置及び検索方法
JP2007156619A (ja) 印刷処理システム、印刷処理方法及びプログラム
JP5412916B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
US8331736B2 (en) Image processing device and method therefor
US20190268487A1 (en) Information processing apparatus for performing optical character recognition (ocr) processing on image data and converting image data to document data
JP4310023B2 (ja) 縮小画像作成方法及び装置、記憶媒体
JP2007129557A (ja) 画像処理システム
US20060023236A1 (en) Method and arrangement for copying documents
JP2008181485A (ja) 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム
JP2006262152A (ja) 画像形成方法、画像形成装置およびプログラム
JP2006171851A (ja) 文書ファイル解析システム、文書ファイル解析方法及びプログラム
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP2006165863A (ja) 情報処理システム

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee