KR100664311B1 - 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 - Google Patents

자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 Download PDF

Info

Publication number
KR100664311B1
KR100664311B1 KR1020050110952A KR20050110952A KR100664311B1 KR 100664311 B1 KR100664311 B1 KR 100664311B1 KR 1020050110952 A KR1020050110952 A KR 1020050110952A KR 20050110952 A KR20050110952 A KR 20050110952A KR 100664311 B1 KR100664311 B1 KR 100664311B1
Authority
KR
South Korea
Prior art keywords
index
text
symbol
page
threshold
Prior art date
Application number
KR1020050110952A
Other languages
English (en)
Inventor
옥형수
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050110952A priority Critical patent/KR100664311B1/ko
Priority to US11/430,123 priority patent/US7860316B2/en
Priority to CNB2006101494292A priority patent/CN100517372C/zh
Application granted granted Critical
Publication of KR100664311B1 publication Critical patent/KR100664311B1/ko
Priority to US12/947,333 priority patent/US8369623B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03GELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
    • G03G15/00Apparatus for electrographic processes using a charge pattern

Abstract

자동 인덱스 생성이 가능한 화상형성장치 및 그 자동 인덱스 생성방법이 개시된다. 본 화상형성장치는 문서를 스캔하는 스캔부, 스캔된 문서를 텍스트 영역 및 이미지 영역으로 분리하고, 텍스트 영역의 텍스트를 심볼로 분리하는 텍스트/이미지 분리부, 분리된 각 심볼의 특성을 추출하고, 추출한 심볼 특성을 인덱스 문턱값과 비교하여, 상기 심볼이 포함된 텍스트가 인덱스이지 여부를 판단하는 인덱스 판단부, 및 인덱스로 판단된 텍스트 및 텍스트가 포함된 페이지 정보를 포함하도록 인덱스 페이지를 생성하는 인덱스페이지 생성부를 구비한다. 이에 의해, 인덱스 페이지를 자동으로 생성해줌으로써 문서 각 페이지의 핵심 내용을 쉽게 파악할 수 있고, 인덱스와 실제 페이지가 링크됨으로써 원하는 내용의 검색이 용이해지므로 사용자가 편의성이 증대된다.
인덱스, 생성, 심볼 너비, 심볼 높이, 획 굵기

Description

자동 인덱스 생성이 가능한 화상형성장치 및 그 자동 인덱스 생성방법{Image forming apparatus for automatically forming index and the automatically index forming method thereof}
도 1은 본 발명의 일 실시예에 따른 화상형성장치의 블럭도,
도 2는 본 발명의 일 실시예에 따른 텍스트/이미지 분리부의 동작을 설명하기 위해 도시한 도면,
도 3은 본 발명의 일 실시예에 따른 인덱스 판단부의 동작을 설명하기 위해 도시한 도면,
도 4는 본 발명의 일 실시예에 따른 인덱스 페이지 생성부의 동작을 설명하기 위해 도시한 도면, 그리고
도 5는 본 발명의 일 실시예에 따른 화상형성장치의 자동 인덱스 생성방법의 설명에 제공되는 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명 *
110 : 스캔부 120 : 텍스트/이미지 분리부
130 : 인덱스 판단부 140 : 인덱스페이지 생성부
150 : 저장부 160 : 제어부
본 발명은 화상형성장치 및 그 자동 인덱스 생성방법에 관한 것으로, 더욱 상세하게는, 여러 장의 문서 복사 시, 문서의 텍스트 영역에서 일반 텍스트와 차별되는 텍스트를 인덱스로 추출하여 페이지 정보를 포함하는 인덱스 페이지를 생성하는 화상형성장치 및 그 자동 인덱스 생성방법에 관한 것이다.
화상형성장치는 원고대위에 놓여진 문서를 스캔하여, 문서와 똑같은 형태의 이미지를 출력할 수 있는 장치이다. 통상적으로, 화상형성장치의 예로는 스캐너, 복사기, 프린터, 팩시밀리 또는 이들의 기능을 하나의 장치를 통해 복합적으로 구현하는 복합기(Multi Function Peripheral : MFP) 등을 들 수 있다.
일반적으로, 화상형성장치는 문서를 스캔하여 호스트 장치나 다른 화상형성장치와 같은 외부 장치로 전송하거나, 외부 장치로부터 전송된 문서 또는 자체적으로 스캔한 문서와 똑같은 형태의 이미지를 인쇄용지에 인쇄한다. 또한, 화상형성장치는 여러 장으로 이루어진 문서에 대해서도 마찬가지로 처리한다.
그런데, 일반적인 화상형성장치가 인덱스 페이지가 없는 여러 장의 문서를 처리했을 경우, 사용자는 외부 장치로 전송된 문서 또는 인쇄된 문서의 내용을 알기 위해 각 장의 문서를 모두 읽어야만 했다. 또는, 사용자가 호스트 장치 및 애플리케이션을 사용해 인텍스 페이지를 직접 작성해야만 했다.
따라서, 인덱스 페이지 작성을 위한 애플리케이션을 구비한 별도의 호스트 장치가 요구될 뿐만 아니라, 사용자의 불편함이 증대되는 문제점이 발생할 수 있 다.
따라서, 본 발명의 목적은, 여러 장의 문서 복사 시, 각 장의 문서에서 일반 텍스트와 차별되는 텍스트를 인덱스로 추출하여, 추출한 인덱스와 페이지 정보를 포함하도록 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동 인덱스 생성방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명에 따른 화상형성장치는, 문서를 스캔하는 스캔부, 상기 스캔된 문서를 텍스트 영역 및 이미지 영역으로 분리하고, 상기 텍스트 영역의 텍스트를 심볼로 분리하는 텍스트/이미지 분리부, 상기 분리된 각 심볼의 특성을 추출하고, 상기 추출한 심볼 특성을 인덱스 문턱값과 비교하여, 상기 심볼이 포함된 텍스트가 인덱스인지 여부를 판단하는 인덱스 판단부, 및 상기 인덱스로 판단된 텍스트 및 상기 텍스트가 포함된 페이지 정보를 포함하도록 인덱스 페이지를 생성하는 인덱스페이지 생성부를 포함한다.
그리고, 상기 심볼 특성은, 심볼 너비, 심볼 높이, 및 획 굵기 중 적어도 어느 하나인 것이 바람직하다.
그리고, 바람직하게는, 상기 인덱스 문턱값은, 인덱스 대상 심볼을 판단하기 위한 값으로, 심볼 너비 문턱값, 심볼 높이 문턱값, 및 획 굵기 문턱값 중 적어도 어느 하나이며, 상기 심볼 특성의 변화에 기초하여 산출된 심볼 특성 평균값 및 사용자 설정값 중 적어도 어느 하나이다.
보다 상세하게는, 상기 인덱스 판단부는, 상기 추출한 심볼 특성이 상기 인덱스 문턱값보다 크면 인덱스 대상 심볼로 판단하고, 상기 인덱스 대상 심볼을 그룹화하여 생성된 텍스트를 인덱스로 판단한다.
또한, 상기 인덱스페이지 생성부는, 상기 판단된 인덱스 및 상기 인덱스가 포함된 페이지를 링크시킬 수 있다.
한편, 본 발명의 화상형성장치의 자동 인덱스 생성방법은, 문서를 스캔하는 단계, 상기 스캔된 문서를 텍스트 영역 및 이미지 영역으로 분리하고, 상기 텍스트 영역의 텍스트를 심볼로 분리하는 단계, 상기 분리된 각 심볼의 특성을 추출하고, 상기 추출한 심볼 특성을 인덱스 문턱값과 비교하여, 상기 심볼이 포함된 텍스트가 인덱스인지 여부를 판단하는 단계, 및 상기 인덱스로 판단된 텍스트 및 상기 텍스트가 포함된 페이지 정보를 포함하도록 인덱스 페이지를 생성하는 단계를 포함한다.
바람직하게는, 상기 심볼 특성은, 심볼 너비, 심볼 높이, 및 획 굵기 중 적어도 어느 하나이다.
그리고, 상기 인덱스 문턱값은, 인덱스 대상 심볼을 판단하기 위한 값으로, 심볼 너비 문턱값, 심볼 높이 문턱값, 및 획 굵기 문턱값 중 적어도 어느 하나이며, 상기 심볼 특성의 변화에 기초하여 산출된 심볼 특성 평균값 및 사용자 설정값 중 적어도 어느 하나인 것이 바람직하다.
또한, 상기 인덱스를 판단하는 단계는, 상기 추출한 심볼 특성이 상기 인덱스 문턱값보다 크면 인덱스 대상 심볼로 판단하고, 상기 인덱스 대상 심볼을 그룹 화하여 생성된 텍스트를 인덱스로 판단하는 것이 바람직하다.
그리고, 상기 인덱스 페이지를 생성하는 단계는, 상기 판단된 인덱스 및 상기 인덱스가 포함된 페이지를 링크시킨다.
이하에서는 도면을 참조하여 본 발명을 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 화상형성장치의 블럭도이다.
본 화상형성장치는 여러 장의 연속된 문서를 복사할 경우에 각 장의 문서에 포함된 텍스트 영역에서 일반 텍스트와 차별되는 텍스트를 추출하여, 추출한 텍스트와 페이지 정보를 포함하는 인텍스 페이지를 자동으로 생성한다. 이는, 문서에서 제목 또는 주요 내용은 기본 텍스트보다 크기 면에서 차이가 근거로 한다.
도 1을 참조하면, 본 화상형성장치는 스캔부(110), 텍스트/이미지 분리부(120), 인덱스 판단부(130), 인덱스페이지 생성부(140), 저장부(150), 및 제어부(160)를 포함한다.
스캔부(110)는 여러 장의 문서를 페이지 단위로 스캔한다. 텍스트/이미지 분리부(120)는 스캔부(110)에 의해 스캔된 문서를 글씨나 숫자, 기호 등을 포함하는 텍스트 영역과 그림, 사진 등을 포함하는 이미지 영역으로 분리한다. 그리고, 텍스트/이미지 분리부(120)는 분리한 텍스트 영역에 포함된 각각의 텍스트를 심볼(symbol)로 분리한다.
인덱스 판단부(130)는 페이지 단위로 텍스트/이미지 분리부(120)에 의해 분리된 각 심볼의 특성을 추출하고, 추출한 심볼의 특성을 이용하여 인덱스 대상 심볼을 판단한다. 그리고, 인덱스 판단부(130)는 최소 거리에 있는 인덱스 대상 심볼 들을 그룹화하여, 그룹화한 인덱스 대상 심볼들의 집합 즉, 텍스트를 인덱스로 판단한다.
인덱스페이지 생성부(140)는 인덱스 판단부(130)에 의해 인덱스로 판단된 텍스트와 텍스트가 포함된 페이지 정보를 정렬하여 인덱스 페이지를 생성하고, 문서의 첫 페이지에 생성한 인덱스 페이지를 삽입한다. 이때, 인덱스페이지 생성부(140)는 인덱스 페이지에서 인덱스와 실제 페이지가 링크되도록 인덱스 페이지를 생성한다.
저장부(150)에는 스캔부(110)에 의해 스캔된 문서 및 인덱스페이지 생성부(140)에 의해 생성된 인덱스 페이지가 저장된다.
제어부(160)는 스캔된 문서에 대해 자동으로 인덱스 페이지가 생성되도록 텍스트/이미지 분리부(120), 인덱스 판단부(130), 및 인덱스페이지 생성부(140)를 제어한다.
도 2는 본 발명의 일 실시예에 따른 텍스트/이미지 분리부의 동작을 설명하기 위해 도시한 도면이다.
도 2를 참조하면, 복사할 여러 장의 문서 중 첫 페이지의 문서(200)이며, 첫 페이지의 문서(200)는 텍스트 영역(210)과 이미지 영역(220)을 포함한다.
스캔부(110)가 첫 페이지의 문서(200)를 스캔하면, 텍스트/이미지 분리부(120)는 스캔된 첫 페이지의 문서(200)를 텍스트 영역(210)과 이미지 영역(220)으로 분리한다.
그리고, 텍스트/이미지 분리부(120)는 분리한 텍스트 영역(210)을 이진화하 고, 이진화한 텍스트들을 8-neighborhood connected component를 이용하여 각각의 심볼로 분리한다. 구체적으로, 텍스트/이미지 분리부(120)는 도트가 위치한 한 픽셀을 중심으로 연결된 주위 8픽셀에 도트가 위치하는지를 판단한다. 연결된 픽셀에 대해 모두 판단한 후, 텍스트/이미지 분리부(120)는 연결성을 가진 독립된 하나의 개체를 심볼로 분리한다. 일 예로, 텍스트/이미지 분리부(120)는 텍스트 영역(210)의 첫 번째 문단에서 "What"을 각각 'W', 'h', 'a', 't'로 분리한다.
도 3은 본 발명의 일 실시예에 따른 인덱스 판단부의 동작을 설명하기 위해 도시한 도면이다.
도 3을 참조하면, 첫 페이지 문서(200)의 텍스트 영역(210)에서 두 번째 문단의 "How"에서 분리된 심볼 'H' 이다.
인덱스 판단부(130)는 심볼의 특성 즉, 심볼 너비(symbol width), 심볼 높이(symbol height), 및 획 굵기(stroke width)를 추출한다. 이때, 인덱스 판단부(130)는 심볼의 최대 X축 좌표(X_max)에서 최소 X축 좌표(X_min)를 감산하여 심볼 너비를 추출하고, 심볼의 최대 Y축 좌표(Y_max)에서 최소 Y축 좌표(Y_min)를 감산하여 심볼 높이를 추출한다. 그리고, 인덱스 판단부(130)는 심볼의 X축 방향으로 연속되는 픽셀에 도트가 위치하는지를 판단하여 발생 빈도가 가장 높은 도트의 개수를 획의 굵기로 추출한다. 일 예로, 인덱스 판단부(130)는 'H'에서 "stroke width"로 표시된 부분이 발생 빈도가 가장 높으므로 획 굵기로 추출한다.
그리고, 인덱스 판단부(130)는 추출한 심볼 특성을 기설정된 인덱스 문턱값(Th)과 비교한다. 인덱스 문턱값은 인덱스 대상 심볼을 판단하기 위한 값으로, 심 볼 너비 문턱값, 심볼 높이 문턱값, 및 획 굵기 문턱값이다. 인덱스 문턱값은 심볼 특성의 변화에 기초하여 산출된 심볼 특성의 평균값이 될 수도 있고, 사용자에 의해 설정될 수도 있다. 추출한 심볼 특성 중 어느 하나가 기설정된 인덱스 문턱값 이상이면, 인덱스 판단부(130)는 해당 심볼을 인덱스 대상 심볼로 판단한다.
마찬가지로, 인덱스 판단부(130)는 모든 심볼들에 대해서 인덱스 대상 심볼 여부를 판단하고, 인덱스 대상 심볼로 판단된 심볼들을 그룹화하여, 그룹화한 인덱스 대상 심볼들의 집합 즉, 텍스트를 인덱스로 판단한다. 이때, 인덱스 판단부(130)는 인덱스 대상 심볼 간의 최소 거리 등을 고려하여 인덱스 대상 심볼들을 그룹화한다. 이로 인해, 첫 페이지의 문서(200)에서는 "How We got here" 텍스트가 인덱스로 판단된다.
도 4는 본 발명의 일 실시예에 따른 인덱스 페이지 생성부의 동작을 설명하기 위해 도시한 도면이다.
인덱스페이지 생성부(140)는 인덱스 판단부(130)에 의해 인덱스로 판단된 텍스트와 텍스트가 포함된 페이지 정보를 정렬하여 인덱스 페이지(400)를 생성하고, 문서의 첫 페이지에 생성한 인덱스 페이지(400)를 삽입한다. 이때, 인덱스페이지 생성부(140)는 인덱스 페이지(400)에서 인덱스와 실제 페이지가 링크되도록 함으로써, 텍스트를 선택하면 해당 페이지로 이동된다.
도 4에 도시된 바와 같이, 인덱스 페이지(400)는 인덱스로 판단된 텍스트와 그 텍스트가 포함된 페이지 정보를 포함한다. 두 번째(2) 페이지의 문서에서는 "Our Management Philosophy"가 인덱스로 판단된 텍스트이고, 세 번째(3) 페이지의 문서에서는 "CEO message"가 인덱스로 판단된 텍스트이다.
이에 의해, 생성된 인덱스 페이지(400)를 확인함으로써 각 페이지의 핵심 내용을 한눈에 파악할 수 있고, 인덱스와 실제 페이지가 링크됨으로써 원하는 내용의 검색이 용이해진다.
도 5는 본 발명의 일 실시예에 따른 화상형성장치의 자동 인덱스 생성방법의 설명에 제공되는 흐름도이다.
도 5를 참조하면, 스캔부(110)는 문서를 페이지 단위로 스캔한다(S510).
텍스트/이미지 분리부(120)는 스캔부(110)에 의해 스캔된 문서를 텍스트 영역과 이미지 영역으로 분리한다(S520). 그리고, 텍스트/이미지 분리부(120)는 분리된 텍스트 영역의 텍스트를 심볼로 분리한다(S530).
인덱스 판단부(130)는 텍스트/이미지 분리부(120)에 의해 분리된 심볼의 특성을 추출한다(S540). 그리고, 인덱스 판단부(130)는 추출한 심볼 특성이 인덱스 문턱값(Th)보다 큰지 여부를 판단한다(S550). 이때, 인덱스 판단부(130)는 추출한 심볼 특성을 차례로 각각의 문턱값과 비교한다. 인덱스 판단부(130)는 심볼 특성 중 어느 하나라도 자신의 문턱값보다 크면, 심볼을 인덱스 대상 심볼로 판단한다.
추출한 심볼 특성이 인덱스 문턱값(Th)보다 큰 것으로 판단되면(S550-Y), 인덱스 판단부(130)는 인덱스 대상 심볼을 임시 저장한다(S560). 이때, 인덱스 판단부(130)는 임시 저장한 인덱스 대상 심볼들을 그룹화하여, 텍스트로 생성한다.
제어부(160)는 마지막 페이지인지 여부를 판단한다(S570). 마지막 페이지인 것으로 판단되면(S570-Y), 제어부(160)의 제어에 의해, 인덱스페이지 생성부(140) 는 인덱스 판단부(130)에 의해 인덱스로 판단된 텍스트와 텍스트가 포함된 페이지 정보를 정렬하여 인덱스 페이지를 생성한다(S580).
제어부(160)는 인덱스페이지 생성부(140)에 의해 생성된 인덱스 페이지를 인쇄용지에 출력되도록 할 수 있고, 외부 디스플레이 장치에 출력되도록 하여 사용자에게 제공할 수 있다.
이상 설명한 바와 같이, 본 발명에 따르면, 인덱스 페이지를 자동으로 생성해줌으로써 문서 각 페이지의 핵심 내용을 쉽게 파악할 수 있고, 인덱스와 실제 페이지가 링크됨으로써 원하는 내용의 검색이 용이해지므로 사용자가 편의성이 증대된다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 이해되어져서는 안 될 것이다.

Claims (10)

  1. 문서를 스캔하는 스캔부;
    상기 스캔된 문서를 텍스트 영역 및 이미지 영역으로 분리하고, 상기 텍스트 영역의 텍스트를 심볼로 분리하는 텍스트/이미지 분리부;
    상기 분리된 각 심볼의 특성을 추출하고, 상기 추출한 심볼 특성을 인덱스 문턱값과 비교하여, 상기 심볼이 포함된 텍스트가 인덱스인지 여부를 판단하는 인덱스 판단부; 및
    상기 인덱스로 판단된 텍스트 및 상기 텍스트가 포함된 페이지 정보를 포함하도록 인덱스 페이지를 생성하는 인덱스페이지 생성부;를 포함하는 것을 특징으로 하는 화상형성장치.
  2. 제 1항에 있어서,
    상기 심볼 특성은,
    심볼 너비, 심볼 높이, 및 획 굵기 중 적어도 어느 하나인 것을 특징으로 하는 화상형성장치.
  3. 제 1항에 있어서,
    상기 인덱스 문턱값은,
    인덱스 대상 심볼을 판단하기 위한 값으로, 심볼 너비 문턱값, 심볼 높이 문턱값, 및 획 굵기 문턱값 중 적어도 어느 하나이며,
    상기 심볼 특성의 변화에 기초하여 산출된 심볼 특성의 평균값 및 사용자 설정값 중 적어도 어느 하나인 것을 특징으로 하는 화상형성장치.
  4. 제 1항에 있어서,
    상기 인덱스 판단부는,
    상기 추출한 심볼 특성이 상기 인덱스 문턱값보다 크면 인덱스 대상 심볼로 판단하고, 상기 인덱스 대상 심볼을 그룹화하여 생성된 텍스트를 인덱스로 판단하는 것을 특징으로 하는 화상형성장치.
  5. 제 1항에 있어서,
    상기 인덱스페이지 생성부는,
    상기 판단된 인덱스 및 상기 인덱스가 포함된 페이지를 링크시키는 것을 특징으로 하는 화상형성장치.
  6. 문서를 스캔하는 단계;
    상기 스캔된 문서를 텍스트 영역 및 이미지 영역으로 분리하고, 상기 텍스트 영역의 텍스트를 심볼로 분리하는 단계;
    상기 분리된 각 심볼의 특성을 추출하고, 상기 추출한 심볼 특성을 인덱스 문턱값과 비교하여, 상기 심볼이 포함된 텍스트가 인덱스인지 여부를 판단하는 단계; 및
    상기 인덱스로 판단된 텍스트 및 상기 텍스트가 포함된 페이지 정보를 포함하도록 인덱스 페이지를 생성하는 단계;를 포함하는 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
  7. 제 6항에 있어서,
    상기 심볼 특성은,
    심볼 너비, 심볼 높이, 및 획 굵기 중 적어도 어느 하나인 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
  8. 제 6항에 있어서,
    상기 인덱스 문턱값은,
    인덱스 대상 심볼을 판단하기 위한 값으로, 심볼 너비 문턱값, 심볼 높이 문턱값, 및 획 굵기 문턱값 중 적어도 어느 하나이며,
    상기 심볼 특성의 변화에 기초하여 산출된 심볼 특성의 평균값 및 사용자 설정값 중 적어도 어느 하나인 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
  9. 제 6항에 있어서,
    상기 인덱스를 판단하는 단계는,
    상기 추출한 심볼 특성이 상기 인덱스 문턱값보다 크면 인덱스 대상 심볼로 판단하고, 상기 인덱스 대상 심볼을 그룹화하여 생성된 텍스트를 인덱스로 판단하는 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
  10. 제 6항에 있어서,
    상기 인덱스 페이지를 생성하는 단계는,
    상기 판단된 인덱스 및 상기 인덱스가 포함된 페이지를 링크시키는 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
KR1020050110952A 2005-11-18 2005-11-18 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 KR100664311B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020050110952A KR100664311B1 (ko) 2005-11-18 2005-11-18 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법
US11/430,123 US7860316B2 (en) 2005-11-18 2006-05-09 Image forming apparatus that automatically creates an index and a method thereof
CNB2006101494292A CN100517372C (zh) 2005-11-18 2006-11-20 自动创建索引的图像形成装置及其方法
US12/947,333 US8369623B2 (en) 2005-11-18 2010-11-16 Image forming apparatus that automatically creates an index and a method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050110952A KR100664311B1 (ko) 2005-11-18 2005-11-18 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법

Publications (1)

Publication Number Publication Date
KR100664311B1 true KR100664311B1 (ko) 2007-01-04

Family

ID=37866827

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050110952A KR100664311B1 (ko) 2005-11-18 2005-11-18 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법

Country Status (3)

Country Link
US (2) US7860316B2 (ko)
KR (1) KR100664311B1 (ko)
CN (1) CN100517372C (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101103029B1 (ko) * 2009-05-22 2012-01-06 김철회 인덱스 인식에 따라 데이터를 추출하는 시스템 및 그 운용방법
WO2013151286A1 (ko) * 2012-04-05 2013-10-10 Kang Shin Tai 전자노트 기능을 갖는 시스템 및 그 운용방법
US8705116B2 (en) 2007-07-13 2014-04-22 Samsung Electronics Co., Ltd. Image forming apparatus and color table generating method and color document printing method thereof

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030042319A1 (en) * 2001-08-31 2003-03-06 Xerox Corporation Automatic and semi-automatic index generation for raster documents
KR100664311B1 (ko) * 2005-11-18 2007-01-04 삼성전자주식회사 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법
US7912829B1 (en) 2006-10-04 2011-03-22 Google Inc. Content reference page
US7979785B1 (en) * 2006-10-04 2011-07-12 Google Inc. Recognizing table of contents in an image sequence
US8782551B1 (en) 2006-10-04 2014-07-15 Google Inc. Adjusting margins in book page images
JP2009033530A (ja) * 2007-07-27 2009-02-12 Kyocera Mita Corp 画像形成装置
JP5412916B2 (ja) * 2009-03-27 2014-02-12 コニカミノルタ株式会社 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP5663866B2 (ja) * 2009-08-20 2015-02-04 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP5073773B2 (ja) * 2010-04-08 2012-11-14 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法及びプログラム
US8875007B2 (en) * 2010-11-08 2014-10-28 Microsoft Corporation Creating and modifying an image wiki page
CN103377255A (zh) * 2012-04-27 2013-10-30 北大方正集团有限公司 索引文章的创建方法和装置
KR20140081470A (ko) * 2012-12-21 2014-07-01 삼성전자주식회사 문자 확대 표시 방법, 상기 방법이 적용되는 장치, 및 상기 방법을 수행하는 프로그램을 저장하는 컴퓨터로 읽을 수 있는 저장 매체
JP6020191B2 (ja) * 2013-01-21 2016-11-02 富士ゼロックス株式会社 表示制御装置及びプログラム
US9547630B2 (en) * 2014-04-08 2017-01-17 International Business Machines Corporation Identification of multimedia content in paginated data using metadata
US9454696B2 (en) 2014-04-17 2016-09-27 Xerox Corporation Dynamically generating table of contents for printable or scanned content
US10176175B2 (en) 2015-08-19 2019-01-08 International Business Machines Corporation System and method for identifying candidates for back-of-book index
CN106515258B (zh) * 2016-11-10 2017-12-19 深圳市科迈爱康科技有限公司 笔记本、智能终端及笔记本内容索引创建方法
CN107688788B (zh) * 2017-08-31 2021-01-08 平安科技(深圳)有限公司 文档图表抽取方法、电子设备及计算机可读存储介质
US20190384838A1 (en) * 2018-06-19 2019-12-19 Microsoft Technology Licensing, Llc Method, apparatus and computer program for processing digital items
CN114138214B (zh) * 2022-01-27 2022-04-29 北京辰光融信技术有限公司 一种自动生成打印文件的方法、装置和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276616A (en) 1989-10-16 1994-01-04 Sharp Kabushiki Kaisha Apparatus for automatically generating index
US5848410A (en) 1997-10-08 1998-12-08 Hewlett Packard Company System and method for selective and continuous index generation
JP2004021381A (ja) 2002-06-13 2004-01-22 Ricoh Co Ltd 画像解析装置、プログラム及び記憶媒体

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5048113A (en) * 1989-02-23 1991-09-10 Ricoh Company, Ltd. Character recognition post-processing method
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
US5379130A (en) * 1992-12-02 1995-01-03 Industrial Technology Research Institute Text/image separation method
US6002798A (en) 1993-01-19 1999-12-14 Canon Kabushiki Kaisha Method and apparatus for creating, indexing and viewing abstracted documents
JP3518897B2 (ja) * 1994-09-05 2004-04-12 オリンパス株式会社 情報再生装置及び情報記録媒体
JPH08137880A (ja) 1994-11-14 1996-05-31 Canon Inc 文書処理装置
US5778095A (en) * 1995-12-20 1998-07-07 Xerox Corporation Classification of scanned symbols into equivalence classes
JP3254642B2 (ja) 1996-01-11 2002-02-12 株式会社日立製作所 索引の表示方法
JP2000509173A (ja) * 1996-04-03 2000-07-18 シーメンス アクチエンゲゼルシヤフト デジタルデータへの変換後にドキュメントにプロットされるテキストの自動分類方法
JPH09282328A (ja) 1996-04-16 1997-10-31 Canon Inc 文書画像処理装置及びその方法
JPH10240958A (ja) 1996-12-27 1998-09-11 Fujitsu Ltd 画像から管理情報を抽出する管理情報抽出装置および方法
KR100238030B1 (ko) 1997-07-23 2000-01-15 윤종용 자동 목차 작성 장치 및 방법
US6906812B2 (en) * 2000-04-14 2005-06-14 Seiko Epson Corporation Symbol printer, symbol printing method, symbol printer driver, and a data storage medium storing a symbol printing program
CN1269060C (zh) * 2000-08-01 2006-08-09 复旦大学 处理和重复使用中文古籍的方法及其所采用的计算机软硬件系统
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
US20030042319A1 (en) * 2001-08-31 2003-03-06 Xerox Corporation Automatic and semi-automatic index generation for raster documents
DE10204751B4 (de) * 2002-02-06 2005-03-03 Heidelberger Druckmaschinen Ag Verfahren zur Konvertierung eines Linework Datenformats in das Format einer Seitenbeschreibungssprache
JP2005071014A (ja) 2003-08-22 2005-03-17 Canon Inc 文書画像処理装置、方法、プログラムおよび記憶媒体
CN100514357C (zh) * 2004-09-03 2009-07-15 深圳市海云天科技有限公司 填涂信息卡的信息识别方法
KR100664311B1 (ko) * 2005-11-18 2007-01-04 삼성전자주식회사 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276616A (en) 1989-10-16 1994-01-04 Sharp Kabushiki Kaisha Apparatus for automatically generating index
US5848410A (en) 1997-10-08 1998-12-08 Hewlett Packard Company System and method for selective and continuous index generation
JP2004021381A (ja) 2002-06-13 2004-01-22 Ricoh Co Ltd 画像解析装置、プログラム及び記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8705116B2 (en) 2007-07-13 2014-04-22 Samsung Electronics Co., Ltd. Image forming apparatus and color table generating method and color document printing method thereof
KR101103029B1 (ko) * 2009-05-22 2012-01-06 김철회 인덱스 인식에 따라 데이터를 추출하는 시스템 및 그 운용방법
WO2013151286A1 (ko) * 2012-04-05 2013-10-10 Kang Shin Tai 전자노트 기능을 갖는 시스템 및 그 운용방법

Also Published As

Publication number Publication date
CN100517372C (zh) 2009-07-22
US8369623B2 (en) 2013-02-05
US20110064310A1 (en) 2011-03-17
US20070116359A1 (en) 2007-05-24
US7860316B2 (en) 2010-12-28
CN1967567A (zh) 2007-05-23

Similar Documents

Publication Publication Date Title
KR100664311B1 (ko) 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
US7353987B2 (en) Printer and control method of printer
KR100612495B1 (ko) 스캐닝된 원고를 소정 순서로 정렬하여 인쇄하는화상형성장치 및 그 방법
GB2401742A (en) Determining differences between scanned documents
US20060285748A1 (en) Document processing device
US8493595B2 (en) Image processing apparatus, image processing method, program, and storage medium
US20080144936A1 (en) Image processing apparatus and image processing method
US20050047659A1 (en) Image processing apparatus, image processing method and computer program
CN106060300B (zh) 原稿读取装置及原稿读取装置的控制方法
JP5594269B2 (ja) ファイル名作成装置、画像形成装置、およびファイル名作成プログラム
JP2009302944A (ja) 画像処理装置
US20090324096A1 (en) Method and apparatus for grouping scanned pages using an image processing apparatus
US20040119998A1 (en) Processing scanned pages
US8126193B2 (en) Image forming apparatus and method of image forming
US20220159144A1 (en) Document processing device, system, document processing method, and computer program
US11064094B2 (en) Image forming apparatus for forming image represented by image data on recording paper sheet
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP6753370B2 (ja) 原稿読取装置
JP2010072850A (ja) 画像処理装置
US20210097271A1 (en) Character recognition using previous recognition result of similar character
JP7457903B2 (ja) 画像処理装置
US11113521B2 (en) Information processing apparatus
JP2012129746A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4785727B2 (ja) 地紋印刷装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121129

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131128

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141127

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151127

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20161129

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20171211

Year of fee payment: 12