KR102553581B1 - 멀티 크롭 처리를 행하는 화상 처리 장치, 멀티 크롭 처리에 의해 문서 단위의 화상을 생성하는 방법 및 저장 매체 - Google Patents

멀티 크롭 처리를 행하는 화상 처리 장치, 멀티 크롭 처리에 의해 문서 단위의 화상을 생성하는 방법 및 저장 매체 Download PDF

Info

Publication number
KR102553581B1
KR102553581B1 KR1020190056729A KR20190056729A KR102553581B1 KR 102553581 B1 KR102553581 B1 KR 102553581B1 KR 1020190056729 A KR1020190056729 A KR 1020190056729A KR 20190056729 A KR20190056729 A KR 20190056729A KR 102553581 B1 KR102553581 B1 KR 102553581B1
Authority
KR
South Korea
Prior art keywords
image
document
reference value
scanner
positional information
Prior art date
Application number
KR1020190056729A
Other languages
English (en)
Other versions
KR20190134477A (ko
Inventor
고야 시마무라
Original Assignee
캐논 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 캐논 가부시끼가이샤 filed Critical 캐논 가부시끼가이샤
Publication of KR20190134477A publication Critical patent/KR20190134477A/ko
Application granted granted Critical
Publication of KR102553581B1 publication Critical patent/KR102553581B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00167Processing or editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/403Edge-driven scaling; Edge-based scaling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/174Segmentation; Edge detection involving the use of two or more images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • H04N1/047Detection, control or error compensation of scanning velocity or position
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40068Modification of image resolution, i.e. determining the values of picture elements at new relative positions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0081Image reader

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

멀티 크롭 처리의 실행 시, 유저가 복잡한 작업을 행하도록 강요하거나 불쾌감을 부여하지 않고, 문서를 스캔하여 얻은 화상으로부터 문서에 대응하는 화상 영역을 고정밀도로 잘라내는 것을 가능하게 한다. 이를 위해, 먼저, 상기 제1 백색 기준값을 높게 설정함으로써 얻어지는 제1 화상으로부터 에지 성분을 검출해서 상기 문서의 위치 정보를 취득한다. 그리고, 상기 제2 백색 기준값을 상기 제1 백색 기준값보다 낮게 설정함으로써 얻어지는 제2 화상으로부터, 상기 취득된 위치 정보에 기초하여 상기 문서에 대응하는 화상 영역을 잘라낸다.

Description

멀티 크롭 처리를 행하는 화상 처리 장치, 멀티 크롭 처리에 의해 문서 단위의 화상을 생성하는 방법 및 저장 매체{IMAGE PROCESSING APPARATUS THAT PERFORMS MULTI-CROP PROCESSING, METHOD OF GENERATING IMAGE IN UNITS OF DOCUMENTS BY MULTI-CROP PROCESSING AND STORAGE MEDIUM}
본 발명은 문서의 스캔 기술에 관한 것이다.
종래, 스캐너 기능을 포함하는 다기능 프린터 등을 사용하여 문서를 스캔하여 얻은 화상의 데이터는 내부 스토리지에 보존하거나(BOX 보존 기능), 데이터를 서버에 송신하거나(SEND 기능) 하는 등에 의해 관리된다. 그리고, 영수증 및 명함과 같은 사이즈가 작은 복수의 문서를 동시에 스캔하여 얻은 스캔 화상으로부터 문서 단위의 화상을 생성하는 기능(멀티 크롭 기능(multi-crop function))을 갖는 MFP가 존재한다. 멀티 크롭 기능을 이용함으로써, 1회의 스캔으로 복수의 문서의 화상을 생성할 수 있다.
상술한 멀티 크롭 기능에서는, 문서를 스캔해서 얻은 화상으로부터 각 문서의 에지를 추출하고, 각 문서에 대응한 화상 영역을 잘라냄으로써 문서 단위의 화상을 생성한다. 여기서, A4 및 A3 등의 정형 사이즈의 문서를 대상으로 하여 스캔을 행하는 경우에는, 유저는 문서대(압판)에 문서를 적재하고, 백색의 문서대 커버를 폐쇄하며, 스캔의 실행 개시 지시를 부여하는 버튼을 누르는 수순의 작업을 행한다. 이렇게 해서 얻어진 스캔 화상에서는, 미리정해진 백색보다 밝은 백색 부분 모두는 동일한 신호값의 백색으로 치환된다. 즉, 문서대 커버의 백색과 문서의 백색이 완전히 동일한 농도 값으로 표현되며, 따라서 결과적으로 문서의 에지가 추출되기 어려운 문제가 있다. 이 점에 관하여, 예를 들어 일본 특허 공개 공보 제2003-338920호는, 문서를 적재한 후에 흑색 시트에 의해 문서대를 가려서 스캔을 행함으로써, 각 문서의 에지를 추출하기 쉽게 하는 기술을 개시하고 있다. 또한, 일본 특허 공개 공보 제2017-103593호는, 문서대 커버를 개방한 상태에서 스캔을 실행하고, 문서가 적재되어 있는 영역 이외의 영역을 검게 출력함으로써 문서의 에지를 추출하기 쉽게 하는 기술을 개시하고 있다.
그러나, 일본 특허 공개 공보 제2003-338920호의 기술의 경우, 유저는 통상 시와 상이한 수순으로 작업을 행하도록 강요된다. 그리고, 일본 특허 공개 공보 제2017-103593호의 기술의 경우, 문서대 커버가 개방된 상태로 유지되므로, 스캔 시의 광이 유저의 눈에 들어가서 유저에게 불쾌감을 부여한다. 또한, 영수증은 접음선을 갖고 만곡되어 있는 경우도 많아, 문서가 문서대 커버에 의해 가압되지 않는 한 적절하게 스캔을 행할 수 없는 문제가 있다.
결과적으로, 본 발명의 목적은 유저에게 복잡한 작업을 행하도록 강요하거나 불쾌감을 부여하지 않고, 문서를 스캔해서 얻은 화상으로부터 문서에 대응하는 화상 영역을 고정밀도로 잘라내는 것이다.
본 발명에 따른 화상 처리 장치는, 문서를 포함하는 영역을 스캔하는 스캐너에 의해 얻은 화상 데이터에 대해서 문서의 영역의 크롭 처리를 행하는 화상 처리 장치이며,
상기 스캐너로부터의 신호값을 제1 백색 기준값을 사용하여 정규화하여 얻은 제1 화상으로부터 에지 성분을 검출함으로써, 상기 제1 화상 내의 상기 문서의 위치 정보를 취득하도록 구성되는 검출 유닛과;
상기 스캐너로부터의 신호값을 제2 백색 기준값을 사용하여 정규화하여 얻은 제2 화상으로부터, 상기 취득된 위치 정보에 기초하여 상기 문서에 대응하는 화상 영역을 잘라내도록 구성되는 크롭핑 유닛을 포함하고,
상기 제1 백색 기준값은 상기 제2 백색 기준값보다 높다.
본 발명의 추가적인 특징은 첨부된 도면을 참고한 예시적인 실시형태에 대한 이하의 설명으로부터 명확해질 것이다.
도 1은 화상 처리 시스템의 전체 구성을 도시하는 도면이다.
도 2는 MFP의 하드웨어 구성을 도시하는 블록도이다.
도 3은 멀티 크롭 기능을 이용하는 유즈 케이스의 시퀀스도이다.
도 4a 내지 도 4d는 UI 화면의 일례를 도시하는 도면이다.
도 5a는 통상 스캔 시에서의 휘도 게인 조정을 설명하는 도면이며, 도 5b는 암 판독 스캔 시의 휘도 게인 조정을 설명하는 도면이다.
도 6은 멀티 크롭에 의한 스캔 처리의 흐름을 나타내는 흐름도이다.
도 7은 문서대에 복수의 문서가 적재되어 있는 상태를 도시하는 도면이다.
도 8은 암 판독 스캔 시의 휘도 게인 조정의 결과를 도시하는 도면이다.
도 9는 통상 스캔 시의 휘도 게인 조정의 결과를 도시하는 도면이다.
도 10은 크롭 좌표 검출 처리의 상세를 나타내는 흐름도이다.
도 11a는 직선 연결 처리를 실시한 후의 에지 화상을 도시하는 도면이며, 도 11b는 에지 화상으로부터 검출된 각 문서의 4개의 정점의 좌표를 도시하는 도면이다.
도 12는 크롭핑 처리의 상세를 도시하는 흐름도이다.
도 13은 스캔 화상으로부터 잘라내진 각 문서의 화상 영역이 터치 패널 상에 표시되는 방식을 도시하는 도면이다.
이하, 첨부된 도면을 참고하여, 본 발명을 바람직한 실시형태에 따라 상세하게 설명한다. 이하의 실시형태에서 도시되는 구성은 단지 예시적인 것이며, 본 발명은 개략적으로 도시된 구성으로 한정되지 않는다.
[제1 실시형태]
<시스템 구성>
도 1은 화상 처리 시스템(100)의 전체 구성을 도시하는 도면이다. 화상 처리 시스템(100)은, 스캔 기능을 갖는 MFP(Multi Function Peripheral)(110), PC(120), 휴대 단말기(130), 및 스토리지 서버(140)를 포함한다. 그리고, 각 장치는 LAN 또는 공중 무선 통신 네트워크에 연결되고, 또한 LAN과 공중 무선 통신 네트워크는 인터넷에 연결되어 있다. 이러한 네트워크에 의해, 각 장치는 서로 통신할 수 있다.
MFP(110)는 소위 복합기라고 불리는 스캐너 기구와 프린터 기구를 포함하는 화상 처리 장치이다. 본 실시형태의 MFP(110)는, 일반적인 문서보다 작은 사이즈의 문서(예를 들어, 명함, 면허증, 엽서, 영수증 등)의 스캔 단말기로서 이용된다. 그 때문에, MFP(110)는, 1매 이상의 문서를 스캔해서 판독한 화상(스캔 화상)으로부터 문서에 대응하는 화상 영역을 잘라내서 문서 단위의 화상을 생성하는 멀티 크롭 기능을 갖고 있다. 이 멀티 크롭 기능을 이용함으로써, 유저는 복수의 명함, 영수증 등의 화상 데이터를 얻기 원하는 경우, 문서를 1매씩 문서대에 적재해서 스캔할 필요 없이 각 문서의 화상 데이터를 취득할 수 있다. 이하에서는, 멀티 크롭 기능에 의해 생성된 문서 단위의 화상을 "크롭 화상"이라고 칭한다. MFP(110)는, 스캔 화상이나 크롭 화상의 데이터를, 내부 스토리지에 보존하거나(BOX 보존 기능), 데이터를 PC(120), 휴대 단말기(130) 및 스토리지 서버(140)에 송신하거나(SEND기능) 하는 등을 할 수 있다.
PC(120) 및 휴대 단말기(130)는, MFP(110)로부터 수신한 스캔 화상이나 크롭 화상을 표시하는 화상 처리 장치이다. 또한, PC(120) 및 휴대 단말기(130)는, 미리정해진 애플리케이션을 사용하여, MFP(100)에 의해 생성된 스캔 화상 및 크롭 화상을 보존 및 관리하고, 보존된 화상에 대해 OCU 처리를 행하는 것이 가능하다. 또한, PC(120) 및 휴대 단말기(130)에 상술한 멀티 크롭 기능을 실현하기 위한 애플리케이션을 인스톨하고, 이들의 장치에서 MFP(110)로부터 수취한 스캔 화상에 대하여 멀티 크롭 처리를 실시해서 크롭 화상을 얻는 것도 가능하다.
상술한 시스템 구성은 단지 예시적인 것이며, 본 실시형태를 실시하는데 모든 구성요소가 필요한 것을 의미하는 것은 아니다.
<MFP의 하드웨어 구성>
도 2는 MFP(110)의 하드웨어 구성을 도시하는 블록도이다. MFP(110)는 제어 유닛(210), 조작 유닛(220), 프린터 유닛(230) 및 스캐너 유닛(240)을 포함한다. 제어 유닛(210)은 이하의 각 유닛(211 내지 218)을 더 포함하고, MFP(110) 전체의 동작을 제어한다. CPU(211)는, ROM(212)에 저장된 제어 프로그램을 판독하고, 상술한 멀티 크롭 기능을 포함하는 각종 기능을 실행 및 제어한다. RAM(213)은 CPU(211)의 주메모리 및 워크 에어리어 등의 일시 저장 영역으로서 사용된다. HDD(214)는 화상 데이터 및 각종 프로그램을 저장하는 대용량 저장 유닛이다. 조작 유닛 I/F(215)는, 조작 유닛(220)과 제어 유닛(210)을 연결하는 인터페이스이다. 조작 유닛(220)은, 터치 패널 및 하드 키를 포함하며, 유저에 의한 조작/입력/지시를 접수한다. 프린터 I/F(216)는 프린터 유닛(230)과 제어 유닛(210)을 연결하는 인터페이스이다. 인쇄 화상 데이터는 프린터 I/F(216)를 통해서 제어 유닛(210)으로부터 프린터 유닛(230)에 전송되며, 종이 등의 기록 매체 위에 인쇄된다. 스캐너 I/F(217)는 스캐너 유닛(240)과 제어 유닛(210)을 연결하는 인터페이스이다. 스캐너 유닛(240)은, 개략적으로 도시하지 않은 문서대 또는 ADF(Auto Document Feeder)에 세트된 문서를 스캔해서 얻은 화상을, 스캐너 I/F(217)를 통해서 제어 유닛(210)에 입력한다. 스캐너 유닛(240)에서 생성된 스캔 화상 또는 상술한 크롭 화상은, 프린터 유닛(230)에서 인쇄되거나(카피 및 출력), HDD(214)에 보존되거나, LAN을 통해서 외부 장치에 송신되거나 할 수 있다. 네트워크 I/F(218)는, 제어 유닛(210)(MFP(110))을 LAN에 연결하는 인터페이스이다. MFP(210)는, 네트워크 I/F(218)를 사용하여, PC(120), 휴대 단말기(130) 및 스토리지 서버(140)에 화상 데이터를 송신하거나, 각종 정보를 수신하거나 한다. 이상 설명한 MFP(110)의 하드웨어 구성은 일례이며, 하드웨어 구성은 필요에 따라서 다른 구성을 포함하거나 구성의 일부를 갖지 않을 수도 있다.
<크롭 화상의 생성 및 보존>
이어서, 화상 처리 시스템(100)에서, 유저가, MFP(110)의 멀티 크롭 기능을 이용하여 얻은 크롭 화상을 스토리지 서버(140)에 송신하고 크롭 화상을 그 내부에 보존하는 유즈 케이스를 예로서 취하여, 그 일련의 흐름을 도 3의 스퀀스도를 참고하여 설명한다. 이하의 설명에서, 기호 "S"는 단계를 나타낸다.
먼저, 유저가, MFP(110)의 조작 유닛(220)을 통해서 "스캔해서 송신" 기능을 선택한다(S300). "스캔해서 송신" 기능은, 스캐너 유닛(240)에 의해 문서를 스캔하여 얻은 화상의 데이터를 미리정해진 화상 처리 및 포맷 변환을 행한 후에 외부 장치에 송신하는 기능이다. 도 4a는, 조작 유닛(220)의 외관을 도시하는 도면이며, 좌측에는 UI 화면을 표시하는 터치 패널(400)이 존재하고, 우측에는 텐키(ten key), 스타트 버튼 등을 포함하는 하드 키(410)가 존재한다. 여기서, 터치 패널(400)에는, 메인 메뉴 화면이 표시되어 있고, 이 상태에서, 유저는 "스캔해서 송신" 버튼(401)을 탭 조작한다.
상술한 탭 조작에 응답하여, MFP(110)는, "스캔해서 송신" 기능을 실행하기 위한 각종 설정을 행하기 위한 UI 화면을 터치 패널(400)에 표시한다(S301). 도 4b는, 터치 패널(400) 위에 "스캔해서 송신"의 기본 설정용의 UI 화면이 표시된 상태를 나타내고 있다. 도 4b에 나타내는 UI 화면에는, 송신처 설정 란(402)과 스캔/송신 설정 란(403)이 존재한다. 송신처 설정 란(402)에는, 스캔 화상의 송신처인 외부 장치(여기서는, 스토리지 서버(140))의 IP 어드레스 등이 표시된다. 스캔/송신 설정 란(403)에는, 스캔 시의 컬러 모드의 선택, 화상 포맷의 선택, 문서의 종류의 선택 등을 행하는 버튼 외에, 멀티 크롭을 포함하는 특수 용도의 설정을 행하기 위한 "기타 기능" 버튼(404)이 존재한다. 유저가 "기타 기능" 버튼(404)을 탭 조작해서 선택하면, 도 4c에 나타내는 특수 용도 설정용의 UI 화면으로 화면이 천이한다. 도 4c에 나타내는 UI 화면에서, 특수 용도에 대응하는 복수의 버튼 중에, "멀티 크롭" 버튼(405)이 존재하고 있다. 이 "멀티 크롭" 버튼(405)이 선택되는 경우, 도 4d에 나타내는 멀티 크롭의 상세 설정용의 UI 화면이 터치 패널(400) 상에 표시된다. 유저는 "스캔해서 송신" 기능을 실행할 때에 각종 동작 조건의 설정 지시를 행한다(S302). 본 실시형태에서는, 이때의 설정 지시에 멀티 크롭의 선택이 포함된다.
멀티 크롭의 선택을 포함하는 동작 조건의 설정 지시를 받으면, MFP(110)는, "스캔해서 송신" 기능을 실행할 때에 필요한 동작 조건을 RAM(213)에 설정값으로서 저장한다(S303). 그리고, 유저가 하드 키(410) 내의 스타트 버튼을 눌러서 스캔의 실행을 지시하는 경우(S304), 당해 지시에 응답해서 MFP(110)는 멀티 크롭 기능에 의한 스캔 처리의 실행을 개시한다(S305). 그리고, 멀티 크롭 기능에 의한 스캔 처리가 완료되는 경우, MFP(110)는 그 결과를 터치 패널(400)에 표시한다(S306). 멀티 크롭에 의해 얻어진 문서 단위의 화상(크롭 화상)을 확인한 유저는, 스타트 버튼을 다시 누르는 등의 조작을 행하여 각 크롭 화상의 데이터를 미리정해진 송신처(여기서는, 스토리지 서버(140))에 송신하는 지시를 행한다(S307). MFP(110)는, 유저의 송신 지시를 받으면, 크롭 화상의 데이터를 스토리지 서버(140)에 송신한다(S308). 그리고, 스토리지 서버(140)는, MFP(110)로부터 수취한 크롭 화상의 데이터를 보존한다(S309). 이때, 예를 들어 각 크롭 화상에 대하여 OCR 처리를 행하고, 얻어진 문자 인식 결과를 부가 정보로서 각 크롭 화상과 연계시켜 각 크롭 화상의 데이터를 보존한다. 이에 의해, 유저는 임의의 문자열을 사용해서 원하는 문서에 대응하는 화상을 검색할 수 있다. 이렇게 해서 스토리지 서버(140)에 보존된 화상 데이터는, 유저로부터의 열람 지시에 따라, PC(120), 휴대 단말기(130) 등에 출력된다.
이상이, 멀티 크롭 기능을 이용하여 얻은 크롭 화상을 스토리지 서버(140)에 송신하여 그 내부에 보존할 때까지의 일련의 흐름이다.
<본 실시형태에서의 멀티 크롭의 사고 방식>
본 실시형태에서는, 멀티 크롭 기능이 온으로 설정되어 있는 경우, 문서 에지 검출용의 스캔 화상을 송신/보존용의 스캔 화상보다 어두운 화상이 되도록 그 화상의 휘도 게인을 조정한다. 그 이유에 대해서 설명한다.
통상 스캔(= 멀티 크롭 기능이 오프로 설정)에 의해 취득되는 스캔 화상에서는, 문서대 커버의 백색 판 및 종이 백색부 등의 백색 피사체는 모두 휘도 게인 조정에 의해 동일한 신호값을 가질 것이다. 여기서, 휘도 게인 조정은, 스캔 화상의 휘도 성분을 나타내는 신호값(휘도값)을 백색 기준값에 기초하여 정규화함으로써 화상의 밝기를 조정하는 처리이다. 도 5a는 통상 스캔 시의 휘도 게인 조정을 설명하는 도면이다. 도 5a에서, 좌측이 정규화 전의 휘도값을 나타내고 우측이 정규화 후의 휘도값을 나타낸다. 여기서, MFP(110)에 제공된 백색 기준판을 스캔하는 경우의 휘도값이 "255"이고, 문서의 종이 백색부를 스캔하는 경우의 휘도값이 "260"이며, 문서의 가장 밝은 부분을 스캔하는 경우의 최대 휘도값이 "265"인 것으로 상정한다. 이때, 게인 조정 파라미터(백색 기준값의 타깃이 되는 게인)는 "255"로 설정된다. 이 경우, 백색 기준값보다 높은 휘도의 신호값은 모두 "255"가 된다. 즉, 게인 조정의 결과, "255" 이상의 휘도값을 갖는 하이라이트 부분 모두의 휘도값은 "255"로 변환된다. 그 때문에, 모든 부분, 즉 백색 기준판을 스캔한 부분, 문서의 종이 백색부의 부분, 및 문서의 가장 밝은 부분의 휘도값은 255가 된다. 그 결과, 문서대 커버의 백색 판과 문서의 종이 백색부 사이의 경계를 더 이상의 인식할 수 없게 된다(문서의 에지를 더 이상 검출할 수 없게 된다). 결과적으로, 본 실시형태에서는, 문서의 에지를 검출하는 경우에는, 상술한 게인 조정 파라미터를 통상 스캔 시보다 높은 값으로 설정하고, 하이라이트 부분의 신호값이 여전히 하이라이트 부분을 나타내는 값으로 유지되는 전체적으로 어두운 화상을 사용한다. 이에 의해, 문서대 커버의 백색 판과 문서의 종이 백색부 사이의 경계가 명확해지고, 따라서 문서의 에지를 용이하게 추출할 수 있고 각 문서에 대응하는 화상 영역을 적절하게 잘라낼 수 있게 된다.
<멀티 크롭 기능 사용 시의 스캔 처리>
계속해서, 본 실시형태에 따른 멀티 크롭 기능에 의한 스캔 처리(S305)에 대해서 설명한다. 본 실시형태의 경우, 스캔 처리를 라인 단위로 행하고, 그 스캔 결과에 대하여 휘도 게인 조정을 포함하는 화상 처리가 문서 에지 검출용과 보존/송신용에 개별적으로 행해진다. 즉, 라인 단위의 스캔 처리와 그 스캔 결과에 대한 휘도 게인 조정을 포함하는 화상 처리가, 전체적으로 어두운 화상을 얻기 위해서 그리고 밝기가 통상적인 화상을 얻기 위해서 2회 개별적으로 행해진다. 이하, 문서 에지 검출용의 어두운 화상을 취득하기 위한 스캔을 "암 판독 스캔"이라 지칭한다. 도 5b는, 암 판독 스캔 시의 휘도 게인 조정을 설명하는 도면이다. 이 예에서는, 게인 조정 파라미터를 통상 스캔 시의 "255"에 10을 더하여 얻은 "265"로 설정한다. 이에 의해, 문서의 가장 밝은 부분의 휘도값 "265"은 "255"로 변환되고 문서의 종이 백색부의 휘도값 "260"은 "250.2"로 각각 변환되어, 에지 검출에서 중요한 차분이 하이라이트 영역에서 얻어지는 것을 알수 있다.
도 6은, 본 실시형태에 따른 멀티 크롭에 의한 스캔 처리의 흐름을 나타내는 흐름도이다. 본 플로우는, CPU(211)가 ROM(212) 또는 HDD(214)에 저장된 프로그램을 RAM(213)에 전개해서 프로그램을 실행함으로써 실현되는 것으로 한다.
S601에서는, 제1 스캔인 암 판독 스캔용의 게인 조정 파라미터가 설정된다. 구체적으로는, 암 판독 스캔용으로 미리 결정된 값(상술한 예에서는 "265")이 HDD(119) 등으로부터 판독되고, 암 판독 스캔 시의 게인 조정 파라미터로서 RAM(213)에 설정된다.
S602에서는, 스캐너 유닛(240)에서, 문서대에 적재된 1매 이상의 문서를 판독하는 암 판독 스캔이 라인 단위로 실행된다. 이 경우에서, 스캔 대상 라인을 "주목 라인"이라 칭한다. 도 7은 문서대에 복수의 문서가 적재되어 있는 상태를 도시하는 도면이다. 여기서, 문서대의 유리면 상에는, 총 3매의 문서, 즉 표준 사이즈(A4)의 1매의 납품서와 비표준 사이즈의 2매의 영수증이 적재되어 있다. 이 상태에서, 암 판독 스캔이 라인 단위로 실행된다.
S603에서는, S602의 암 판독 스캔에 의해 취득한 1 라인에 대응하는 화상에 대해, 전술한 휘도 게인 조정을 포함하는 미리정해진 화상 처리가 행해진다. 휘도 게인 조정 이외의 화상 처리는, 비트맵 형식의 화상으로의 변환, 변환 후의 화상에 대한 쉐이딩 보정 등을 포함한다. 그리고, 휘도 게인 조정은, 쉐이딩 보정을 행한 화상에 대하여 실행된다. 휘도 게인 조정에서는, 먼저, S601에서 설정된 게인 조정 파라미터를 사용하여, 1 라인에 대응하는 스캔 화상의 각 화소의 휘도값(d)이 수정된다. 여기서, 8 비트로 표현되는 수정 후의 휘도값(d')은 예를 들어 이하의 식 (1)에 의해 구해진다.
d' = d × 255 / 게인 조정 파라미터 ··· 식 (1)
상술한 식 (1)에서, 수정 전의 휘도값(d)은, 스캔 화상에서의 각 화소의 RGB 값으로부터 이하의 식 (2)에 의해 구해진다.
d = 0.299 × R 값 + 0.587 × G 값 + 0.114 × B 값 ··· 식 (2)
그리고, 상술한 바와 같이 구한 수정 후의 휘도값은, 필요에 따라서 휘도값을 미리정해진 휘도값으로 교체하는 처리를 행함으로써 휘도값이 미리정해진 범위 내에 포함되도록 변환된다. 구체적으로는, 수정 후의 휘도값이 "0" 이하인 경우에는 휘도값은 "0"으로 변환되며, 수정 후의 휘도값이 "255" 이상인 경우에는 휘도값은 "255"으로 변환된다. 이렇게 해서 얻어진 값은 게인 조정 후의 휘도값이다. 이와 같이 하여, 고휘도 측의 신호값이 유지되고 표준 상태보다 어두운 1 라인에 대응하는 스캔 화상이 취득된다. 또한, 휘도 게인 조정 후의 화상에 대하여, 컬러 밸런스의 조정, 배경 제거, 및 샤프니스 및 콘트라스트의 조정 등의 화질 조정 처리가 필요에 따라서 행해진다.
S604에서는, 모든 라인의 암 판독 스캔이 완료되었는지의 여부가 판정된다. 처리되지 않은 라인이 있는 경우, 처리는 S602로 복귀하고, 다음 주목 라인에 대한 처리가 계속된다. 한편, 모든 라인의 암 판독 스캔이 완료된 경우, 처리는 S605로 진행한다. 도 8은, 도 7에서 나타내는 3매의 문서에 대한 암 판독 스캔용의 휘도 게인 조정을 행하여 얻은 결과를 나타낸다. 도 9는, 비교로서, 통상 스캔용의 휘도 게인 조정을 행하여 얻은 결과를 나타낸다. 도 8의 처리 결과에서는, 도 9의 처리 결과와 비교하여, 화상이 전체적으로 어둡고, 각 문서의 화상 영역과 배경 사이의 콘트라스트가 명확하다는 것을 알수 있다. 이렇게 해서 얻어진 휘도 게인 조정 후의 스캔 화상의 데이터는 RAM(213) 또는 HDD(214)에 일시적으로 저장된다.
S605에서는, 크롭 좌표를 검출하는 처리가 실행된다. 여기서, 크롭 좌표는, 스캔 화상 내에 존재하는 각 문서에 대응하는 화상 영역에 4개의 정점의 좌표이며, 문서 위치 정보로서의 역할을 한다. 크롭 좌표 검출 처리의 상세에 대해서는 후술한다.
S606에서는, 제2 스캔인 보존/송신용의 스캔을 위한 게인 조정 파라미터가 설정된다. 구체적으로는, 통상 스캔용으로 미리 결정된 값(상술한 예에서는, "255")이 HDD(214) 등으로부터가 판독되고, 게인 조정 파라미터로서 RAM(213)에 설정된다. 그리고, S607에서는, 스캐너 유닛(240)에서, 문서대에 적재된 1매 이상의 문서를 판독하는 통상 스캔이 라인 단위로 실행된다. 즉, 암 판독 스캔을 행한 후 그대로 유지되는 상태에서 제2 스캔이 행해진다. 그리고, S608에서는, S603과 마찬가지인 휘도 게인 조정을 포함하는 미리정해진 화상 처리가, 통상 스캔에 의해 취득된 1 라인에 대응하는 스캔 화상에 대하여 행해진다.
S609에서는, 모든 라인의 통상 스캔이 완료되었는지의 여부가 판정된다. 처리되지 않은 라인이 있는 경우, 처리는 S607로 복귀하고, 다음 주목 라인에 대한 처리가 계속된다. 한편, 모든 라인의 통상 스캔이 완료된 경우, 처리는 S610로 진행된다. 휘도 게인 조정 후의 획득된 스캔 화상의 데이터는 RAM(213) 또는 HDD(214)에 일시적으로 저장된다.
S610에서는, 통상 스캔용의 휘도 게인 조정이 행해진 스캔 화상으로부터, 문서대에 적재된 각 문서에 대응하는 화상 영역을 잘라내는 처리(화상 크롭핑 처리)가 실행된다. 이때, S605에서 검출된 크롭 좌표(각 문서의 4개의 정점의 좌표)에 따라, 각 문서에 대응하는 화상 영역이 잘라내 진다. 크롭핑 처리의 상세는 후술한다.
이상이 본 실시형태에 따른 멀티 크롭에 의한 스캔 처리의 내용이다. 그리고, 보존/송신용의 스캔 화상으로부터 잘라내진 각 문서의 크롭 화상의 데이터는, RAM(213) 또는 HDD(214)에 적절히 압축 처리 등을 실시한 후에 저장되고, 그 후의 유저 지시에 기초하여 스토리지 서버(140) 등에 송신된다.
<크롭 좌표 검출 처리>
이어서, 크롭 좌표 검출 처리(S605)에 대해서 상세하게 설명한다. 도 10은 크롭 좌표 검출 처리의 상세를 나타내는 흐름도이다. 이하, 도 10의 플로우에 따라 설명한다.
S1001에서는, 처리 대상 화상으로서, 암 판독 스캔에 의해 취득되고(S602) 그 후에 휘도 게인 조정이 실시된(S603), 전체적으로 어두운 스캔 화상의 데이터가, RAM(213) 또는 HDD(214)로부터 판독되어 취득된다. 이때, 화상이 JPEG 형식 등으로 압축되어 있는 경우에는, 화상은 원래의 화상 사이즈로 압축해제되어서 취득된다. 여기에서는, 전술한 도 8에 나타내는 바와 같은 스캔 화상이 취득된 것으로 해서 설명을 진행시킨다.
S1002에서는, S1001에서 취득한 스캔 화상에 대하여, S1003 및 이후의 단계의 각 처리에 적합한 화상으로 화상을 변환하는 전처리가 실행된다. 전처리의 내용으로서는, 예를 들어 RGB의 3 채널을 포함하는 화상을 그레이의 1개의 채널을 포함하는 화상으로 변환함으로써 채널수를 저감시키는 그레이화(단색화) 변환 처리, 및 600 dpi의 해상도를 갖는 화상을 150 dpi의 해상도를 갖는 화상으로 변환하는 해상도 저감 처리를 들 수 있다. 이 전처리에 의해, 화상 데이터 사이즈를 축소하여 후속하는 각 단계에서의 처리 부하를 저감하고 고속 처리를 실현할 수 있다. 이 전처리는 처리 부하를 경감시키는 것이 목적인 처리이므로, 화상 처리 리소스가 충분한 경우에는, 이 전처리는 생략할 수 있다.
S1003에서는, 전처리가 실시된 스캔 화상으로부터 에지 성분이 추출된다. 이 에지 성분의 추출에는, 예를 들어 화상의 휘도 구배를 어림잡는 소벨법(Sobel method), 프레위트법(Prewitt method), 로버트 크로스법(Roberts cross method), 및 그 연속성을 고려한 카니법(Canny method) 같은 공지의 방법을 적용할 수도 있다. 또한, 복수의 방법을 사용해서 얻어진 결과에 대해 AND 연산을 행할 수도 있다. 에지 추출 처리에 의해 이와 같이 획득된 결과(이하, "에지 화상"이라 칭함)이 RAM(213)에 저장된다.
S1004에서는, 에지 화상에 대하여, 고립점을 제거하는 처리(고립점 제거 처리)가 행해진다. 에지 화상에는, 문서대 상의 티끌 및 흠집에 대응하는 에지 성분이 포함될 수 있고, 이 고립점 제거 처리에 의해, 문서의 에지 이외의 에지 성분인 고립점(미리정해진 사이즈보다 작은 흑색 화소의 덩어리)가 제거된다.
S1005에서는, 고립점이 제거된 에지 화상에 대하여, 직선 연결 처리가 실행된다. 직선 연결 처리는, 고립점이 제거된 후의 에지 화상에서 화소(에지 화소)가 도중에 연속하지 않는 부분을 연결하는 처리이다. 예를 들어, 휘도의 구배가 불균일한 화상에 대해 에지 추출 처리를 행한 경우, 추출된 에지의 선이 연속되지 않는 경우가 있다. 결과적으로, 허프 변환 등의 공지의 방법에 의해 연속하지 않는 에지의 선분을 연결한다. 이에 의해, 각 문서의 에지가 연속하는 선분으로 표현되는 에지 화상이 얻어진다. 도 11a는 직선 연결 처리가 행해진 후의 에지 화상을 나타낸다.
S1006에서는, 직선 연결 처리가 실시된 에지 화상에 대하여, 윤곽을 검출하는 처리가 실행된다. 이 윤곽 검출 처리에 의해, 에지 화상에 포함되는 에지 화소를 연결하는 윤곽선의 정점의 좌표가 구해진다.
S1007에서는, 윤곽 검출 처리에 의해 취득된 정점의 좌표를 사용하여, 에지 화상으로부터 직사각형을 검출하는 처리가 실행된다. 구체적으로는, 4개 이상의 정점에 의해 둘러싸이는 영역의 외접 직사각형을 검출하고, 윤곽선에 의해 둘러싸이는 직사각형 오브젝트가 추출된다.
S1008에서는, 직사각형 검출 처리에 의해 검출된 각 직사각형에 대하여, 그 내측에 내포되는 직사각형이 있는지의 여부를 판정하는 처리(내포 판정 처리)가 실행된다. 구체적으로는, 검출된 직사각형으로부터 주목 직사각형을 선택하고, 주목 직사각형의 내측에 포함되는 다른 직사각형이 있는지의 여부가 판정된다. 그리고, 가장 외측에 위치되는 직사각형이 문서의 에지에 대응하는 유효 직사각형으로서 특정된다. 이 내포 판정 처리에 의해, 직사각형을 각 문서의 종이 조각을 나타내는 유효 직사각형과, 문서 내에 위치되는 도표 등을 표현하는 무효 직사각형으로 분류한다.
S1009에서는, 내포 판정 처리에 의해 유효 직사각형으로서 특정된 직사각형의 4개의 정점의 좌표가 크롭 좌표로서 출력된다. 이때, 상술한 전처리(S1002)에서 화상 사이즈 축소 처리를 행한 경우에는, 좌표값을 원래의 화상 사이즈에서의 좌표값으로 변환하는 처리도 행해진다. 도 11b는, 도 11a에 나타내는 에지 화상으로부터 검출된 각 문서의 4개의 정점의 좌표를 나타낸다. 각 문서에 대응하는 화상 영역은 스캔 화상의 좌측 상단을 원점((x, y) = (0, 0))로 하는 4개의 정점의 좌표에 의해 특정되며, 각각의 화상 영역은 X 픽셀의 폭 및 Y 픽셀의 높이의 면적을 갖는다. 도 11b의 예에서는, 납품서에 대응하는 문서 A와 영수증에 대응하는 문서 B 및 문서 C 각각에 대해서, 4개의 정점의 좌표({xi, yi} 내지 {xi, yi}, i =1 내지 4)가 얻어진다. 4개의 정점의 출력 좌표(크롭 좌표)의 데이터는 RAM(213) 또는 HDD(214)에 저장된다.
이상이 크롭 좌표 검출 처리의 내용이다. 여기에서는, 크롭 좌표 검출 처리 중에서, 그레이화 변환 및 해상도 저감의 처리를 행하지만, 크롭 좌표 검출 처리는 이것에 한정되지 않는다. 예를 들어, 암 판독 스캔에서, 처음부터 1개의 채널 또는 저해상도의 스캔 화상이 얻어지도록 스캔 조건을 변경하는 것도 가능할 수 있다. 이에 의해, 전술한 전처리(S1002)가 더 이상 불필요해지고, 따라서 스캔 속도의 증가, 멀티 크롭 좌표 검출 처리에서의 화상 데이터를 로딩하는 속도의 증가, 및 사용되는 메모리의 양의 저감 같은 부가적인 효과를 얻을 수 있다. 또한, 여기에서는 문서의 형상이 직사각형인 것을 전제로 설명을 행했지만, 직사각형 이외의 형상을 갖는 문서도 생각된다. 이러한 경우에는, 문서의 최소 외접 직사각형을 구하고, 4개의 정점의 좌표를 크롭 좌표로서 검출하면 충분하다. 이때, 최소 외접 직사각형에는 문서 이외의 배경 부분이 포함되게 되지만, 잘린 크롭 화상에서의 배경 부분의 색을 종이 백색부와 동일한 색으로 하는 등을 행하면 충분하다.
<크롭핑 처리>
이어서, "스캔해서 송신" 기능의 실행 시의 크롭핑 처리(S610)에 대해서 상세하게 설명한다. 도 12는 크롭핑 처리의 상세를 나타내는 흐름도이다. 이하, 도 12의 플로우에 따라 설명한다.
S1201에서는, 처리 대상 화상으로서, 통상 스캔에 의해 취득되고 휘도 게인 조정이 실행된 스캔 화상의 데이터가 RAM(213) 또는 HDD(214)로부터 판독되어 취득된다. 이때, 화상이 JPEG 형식 등으로 압축되어 있는 경우에는, 화상은 화상을 원래의 화상 사이즈로 압축해제한 후에 취득된다. 여기에서는, 전술한 도 9에 나타내는 스캔 화상이 취득되는 것을 상정하여 설명을 진행시킨다.
S1202에서는, 전술한 크롭 좌표 검출 처리(S605)에 의해 검출된, 유효 직사각형의 4개의 정점 좌표의 데이터가 RAM(213) 또는 HDD(214)으로부터 판독되어 취득된다.
S1203에서는, S1202에서 취득된 4개의 정점의 좌표에 기초하여, S1201에서 취득된 스캔 화상으로부터 각 문서에 대응하는 화상 영역이 잘린다. 스캔 화상으로부터 각 문서의 화상 영역을 잘라내는 방법은 특별히 한정되지 않고 공지의 방법을 사용하는 것이 가능하다. 예를 들어, 4개의 정점의 좌표에 의해 특정되는 직사각형이 경사져 있지 않을 경우에는, 4개의 정점의 좌표를 연결해서 얻어지는 화상 영역을 그대로 잘라낸다. 4개의 정점의 좌표에 의해 특정되는 직사각형이 경사져 있는 경우에는, 아핀 변환(affine transform)에 의해 회전을 고려한 화상 영역을 잘라내면 충분하다. 또한, 4개의 정점의 좌표에 의해 특정되는 직사각형이 왜곡을 갖는 경우에는, 사다리꼴 보정 및 왜곡 보정을 고려한 호모그래피 행렬(homography matrix)을 사용한 투영 변환에 의해 잘라내기를 행하는 것도 가능할 수 있다.
S1204에서는, 문서대에 적재된 1매 이상의 문서의 문서 단위의 화상(크롭 화상)이 출력된다. 구체적으로는, 먼저, S1203에서 잘라내진 각 문서의 화상 영역이 터치 패널(400) 상에 표시된다. 도 13은, 도 9의 스캔 화상으로부터 잘라내진 결과가 터치 패널(400) 상에 표시되는 방식을 나타낸다. 이에 의해, 유저는 문서대에 적재된 3매의 문서에 대응하는 각 화상이 얻어진 것을 파악한다. 그리고, 유저가 하드 키(410) 내의 "스타트" 버튼을 누르는 경우, 송신처 설정 란(402)에 지정된 IP 어드레스 등에 각 문서에 대응하는 화상의 데이터가 송신된다.
이상이 "스캔해서 송신" 기능을 실행할 때의 크롭핑 처리의 내용이다. "스캔해서 송신" 기능을 실행하는 경우를 예로서 설명했지만, 그 적용 범위는 이것에 한정되지 않는다. 예를 들어, 처리는 멀티 크롭에 특화된 처리일 수 있고, 스캔 화상을 HDD(214)에 보존하는 "스캔해서 보존" 기능 등의 스캔 처리를 이용하는 기능이라면 널리 적용가능하다.
또한, MFP(110)에서 스캔을 행해서 얻어진 스캔 화상의 데이터를 PC(120) 등에 송신하고, PC(120) 등에서 크롭 좌표 검출 처리 및 크롭핑 처리를 실시하는 양태도 인정될 수 있다.
<변형예>
상술한 예에서는, 라인 단위로 취득된 스캔 화상에 대하여 휘도 게인 조정을 포함하는 화상 처리를 순차적으로 행하며, 문서 에지 검출용과 보존/송신용의 2 종류의 스캔 화상을 취득하지만, 이것에 한정되는 것은 아니다. 예를 들어, 모든 라인에 대해 한 번에 스캔을 행하고 모든 라인에 대응하는 얻어진 스캔 결과에 대해 상이한 게인 조정 파라미터를 이용하여 게인 조정 처리를 개별적으로 행함으로써 문서 에지 검출 및 보존/송신을 위한 2 종류의 스캔 화상을 취득하는 것도 가능할 수 있다.
또한, 휘도 게인 조정에 사용하는 파라미터를 변화시키는 대신에, 문서 에지 검출용의 스캔 시에 광원의 밝기를 저감시킴으로써, 문서의 에지의 검출에 적합하고 전체적으로 어두운 화상을, 보존 등에 적합한 화상과 별도로 생성하는 것도 가능할 수 있다. 이러한 방법에 의해, 고휘도 측의 신호값이 유지된 문서 에지 검출용의 화상을 취득하는 것도 가능하다. 구체적으로는, 제1 스캔에서는, 광원으로부터 사출되는 광의 양이 적은 스캔을 행함으로써 에지 검출용의 화상을 생성하고, 생성된 화상으로부터 크롭 좌표를 검출한다. 이때의 저감의 정도는 예를 들어 3 내지 5%이며, 광원 자체의 밝기 및 스캔 속도에 따라서 최적 저감율을 결정하면 충분하다. 그리고, 제2 스캔에서는, 광원으로부터 사출되는 광의 양을 통상의 양으로 복귀시켜서 보존/송신용의 화상을 행성하고, 생성된 화상으로부터 크롭 화상을 추출한다. 이 방법에 의해, 동일한 효과를 얻는 것이 가능하다.
이상과 상이, 본 실시형태에 따르면, 멀티 크롭 기능에서, 전체적으로 어둡고 문서의 에지를 검출하기 쉬운 화상과, 전체적으로 밝고 보존 등에 적합한 화상을 개별적으로 생성한다. 그리고, 전체적으로 어두운 화상으로부터 검출된 정밀도가 높은 에지 정보를 사용하여, 각 문서에 대응하는 화상 영역을 화질이 보존 등에 적합한 화상으로부터 잘라낸다. 이에 의해, 멀티 크롭 기능의 이용 시에, 문서를 적재한 후에 흑색 시트로 문서대를 가리는 번거로움 및 문서대 커버를 개방한 채로 스캔을 행함으로써 발생하는 눈부심 등의 불쾌감 없이 고화질의 크롭 화상을 얻는 것이 가능하다.
[제2 실시형태]
문서 에지 검출용의 화상과 보존/송신용의 화상을 상이한 스캔 처리에 의해 취득하는 경우, 제1 스캔에 의해 얻어진 화상과 제2 스캔에 의해 얻어진 화상 사이에서 위치 어긋남이 발생할 가능성이 있다. 결과적으로, 양 화상 사이의 위치 어긋남을 보정하는 양태를 제2 실시형태로서 설명한다. 이하에서는, 제1 실시형태의 도 6의 플로우를 전제로 하여, 공통되는 내용에 대해서는 설명을 생략하고, 상이한 점인 위치 어긋남 보정에 대해서 설명한다.
본 실시형태에서는, 크롭핑 처리(S610) 전에, 대상이 되는 제2 스캔에 의해 얻어지는 스캔 화상을 기준으로 하여, 크롭 좌표 검출 처리(S605)의 대상이 되는 제1 스캔에 의해 얻어지는 스캔 화상으로부터의 어긋남의 존재/부재 및 정도를 판정하는 처리가 행해진다. 그리고, 판정 결과에 기초하여, 크롭 좌표 검출 처리에 의해 검출한 각 문서의 4개의 정점의 좌표를 보정하고, 보정 후의 4개의 정점의 좌표를 사용하여 크롭핑 처리를 행한다.
먼저, 위치 어긋남 판정에서는, 예를 들어 제1 스캔에 의해 취득된 화상과 제2 스캔에 의해 취득된 화상 사이의 수평 방향의 위치 어긋남량을 추정하는 처리가 행해진다. 이때, 평행 이동만을 고려한 추정을 행하는 것과 회전도 고려한 추정을 행하는 것이 가능할 수도 있다. 기준 화상으로부터의 어긋남량을 추정하는 방법 중 하나로서, 화상 내의 화소를 시프트시키면서 유사도를 산출함으로써, 가장 유사도가 높아지는 경우의 시프트량으로부터 위치 어긋남량을 추정하는 방법이 있다. 또한, 이 방법도 다양한 종류를 포함한다. 예를 들어, SSD(Sum of Squared Difference) 법은 동일 위치의 화소의 휘도값의 제곱된 차의 합계를 사용한다. 이하의 식 (3)을 사용해서 얻어진 값이 작을수록 유사도가 높은 것을 의미한다.
Figure 112019049471784-pat00001
··· 식 (3)
상술한 식 (3)에서, M(i, j)은 기준 화상의 휘도값을 나타내고, S(i, j)은 어긋남량이 추정되는 화상의 휘도값을 나타낸다. 또한,(i, j)은, 화상의 X 축(가로) 방향의 화소의 개수를 m으로 하고, Y 축(세로) 방향의 화소의 개수를 n으로 하는 경우의 화소 위치(좌표)를 나타낸다.
이 밖에도, 동일 위치의 화소의 휘도값의 차의 절대값의 합계를 사용하는 SAD(Sum of Absolute Difference) 법 및 NCC(Normalized Cross-Correlation) 법을 들 수 있다.
SAD법에서는, 이하의 식 (4)을 사용하여 얻은 값이 작을수록 유사도가 높은 것을 의미한다.
Figure 112019049471784-pat00002
··· 식 (4)
NCC법에서는, 이하의 식(5)을 사용하고, 얻어진 값이 1에 가까울수록 유사도가 높은 것을 의미한다.
Figure 112019049471784-pat00003
··· 식 (5)
그리고, 상술한 바와 같이 얻어진 화소 단위의 어긋남량에 기초하여, 크롭 좌표 검출 처리에 의해 검출된 각 문서의 4개의 정점의 좌표는, 위치 어긋남이 억제되도록 보정된다. 이에 의해, 상이한 스캔에 의해 얻어진 2개의 화소 사이에 위치 어긋남이 발생하는 경우에도, 크롭 화상을 정확하게 잘라낼 수 있다.
(다른 실시형태)
본 발명의 실시형태(들)는, 전술한 실시형태(들) 중 하나 이상의 기능을 실행하기 위해 저장 매체(보다 완전하게는 '비일시적 컴퓨터 판독가능 저장 매체'라 칭할수도 있음)에 기록된 컴퓨터 실행가능 명령어(예를 들어, 하나 이상의 프로그램)를 판독 및 실행하고 그리고/또는 전술한 실시형태(들) 중 하나 이상의 기능을 실행하는 하나 이상의 회로(예를 들어, 주문형 집적 회로(ASIC))를 포함하는 시스템 또는 장치의 컴퓨터에 의해, 그리고 예를 들어 전술한 실시형태(들) 중 하나 이상의 기능을 실행하기 위해 저장 매체로부터 컴퓨터 실행가능 명령어를 판독 및 실행함으로써 그리고/또는 전술한 실시형태(들) 중 하나 이상의 기능을 실행하기 위해 하나 이상의 회로를 제어함으로써 상기 시스템 또는 장치의 컴퓨터에 의해 실행되는 방법에 의해 실현될 수도 있다. 컴퓨터는 하나 이상의 프로세서(예를 들어, 중앙 처리 유닛(CPU), 마이크로 처리 유닛(MPU))를 포함할 수 있고 컴퓨터 실행가능 명령어를 판독 및 실행하기 위한 별도의 컴퓨터 또는 별도의 프로세서의 네트워크를 포함할 수 있다. 컴퓨터 실행가능 명령어는 예를 들어 네트워크 또는 저장 매체로부터 컴퓨터에 제공될 수 있다. 저장 매체는, 예를 들어 하드 디스크, 랜덤 액세스 메모리(RAM), 리드 온리 메모리(ROM), 분산형 컴퓨팅 시스템의 스토리지, 광디스크(예를 들어, 콤팩트 디스크(CD), 디지털 다기능 디스크(DVD) 또는 블루레이 디스크(BD)TM), 플래시 메모리 디바이스, 메모리 카드 등 중 하나 이상을 포함할 수 있다.
(기타의 실시예)
본 발명은, 상기의 실시형태의 1개 이상의 기능을 실현하는 프로그램을, 네트워크 또는 기억 매체를 개입하여 시스템 혹은 장치에 공급하고, 그 시스템 혹은 장치의 컴퓨터에 있어서 1개 이상의 프로세서가 프로그램을 읽어 실행하는 처리에서도 실현가능하다.
또한, 1개 이상의 기능을 실현하는 회로(예를 들어, ASIC)에 의해서도 실행가능하다.
본 발명에 따르면, 유저가 복잡한 작업을 행하는 것을 강요하거나 불쾌감을 부여하지 않으면서 문서를 스캔하여 얻은 화상으로부터 고정밀도로 문서에 대응하는 화상 영역을 잘라내는 것이 가능하다. 본 발명을 예시적인 실시형태를 참고하여 설명하였지만, 본 발명은 개시된 예시적인 실시형태로 한정되지 않음을 이해해야 한다. 이하의 청구항의 범위는 이러한 모든 변형과 동등한 구조 및 기능을 포함하도록 최광의로 해석되어야 한다.

Claims (12)

  1. 문서를 스캔하는 스캐너에 의해 얻은 화상 데이터에 대해서 크롭 처리를 행하는 화상 처리 장치이며,
    상기 스캐너로부터 출력된 신호값을 제1 백색 기준값을 사용하여 정규화하여 얻은 제1 화상으로부터, 상기 제1 화상 내의 상기 문서의 위치 정보를 취득하기 위해 상기 문서의 에지 성분을 검출하도록 구성되는 검출 유닛과;
    상기 스캐너로부터 출력된 신호값을 제2 백색 기준값을 사용하여 정규화하여 얻은 제2 화상으로부터, 상기 문서의 상기 취득된 위치 정보에 기초하여, 상기 문서에 대응하는 문서 화상을 크롭하도록 구성되는 크롭핑 유닛을 포함하며,
    상기 제1 백색 기준값은 상기 제2 백색 기준값보다 높은, 화상 처리 장치.
  2. 제1항에 있어서,
    상기 문서를 적재하기 위한 문서대와;
    상기 문서대에 적재된 문서를 스캔하는 상기 스캐너와;
    상기 스캐너를 제어하도록 구성되는 제어 유닛을 더 포함하며,
    상기 제어 유닛은, 상기 문서대에 적재된 문서를 스캔하도록 상기 스캐너를 제어하며, 상기 제1 백색 기준값을 사용하여 상기 제1 화상을 생성하고 상기 제2 백색 기준값을 사용하여 상기 제2 화상을 생성하는, 화상 처리 장치.
  3. 제1항에 있어서,
    상기 제1 백색 기준값은 백색 기준판을 스캔함으로써 얻어진 신호값보다 높은 값인, 화상 처리 장치.
  4. 제2항에 있어서,
    상기 제어 유닛은, 상기 제1 화상을 생성하기 위한 스캔과 상기 제2 화상을 생성하기 위한 스캔을 서로 개별적으로 행하도록 상기 스캐너를 제어하는, 화상 처리 장치.
  5. 제1항에 있어서,
    상기 검출 유닛은, 상기 제1 화상의 해상도를 저감하기 위한 해상도 저감 처리를 행하고, 해상도가 저감된 상기 제1 화상으로부터 상기 문서의 에지 성분을 검출하고, 상기 검출된 에지 성분에 기초하여 상기 제1 화상 내의 상기 문서의 위치 정보를 취득하는, 화상 처리 장치.
  6. 제1항에 있어서,
    상기 검출 유닛은, 상기 제1 화상을 1 채널의 화상으로 변환하는 그레이화 변환 처리를 행하고 1 채널의 화상으로 변환된 상기 제1 화상으로부터 에지 성분을 검출하고, 상기 검출된 에지 성분에 기초하여 상기 제1 화상 내의 상기 문서의 위치 정보를 취득하는, 화상 처리 장치.
  7. 제1항에 있어서,
    상기 검출 유닛은, 상기 제1 화상을 1 채널의 상기 화상으로 변환하는 그레이화 변환 처리와 상기 제1 화상을 저해상도의 화상으로 변환하는 해상도 저감 처리를 행하고, 1 채널의 화상으로 변환되고 해상도가 저감된 상기 제1 화상으로부터 상기 문서의 에지 성분을 검출하는, 화상 처리 장치.
  8. 제1항에 있어서, 상기 제1 화상과 상기 제2 화상 사이의 위치 어긋남을 억제하도록 상기 취득된 위치 정보를 보정하도록 구성되는 보정 유닛을 더 포함하며,
    상기 크롭핑 유닛은 상기 보정된 위치 정보에 기초하여 상기 제2 화상으로부터 상기 문서에 대응하는 상기 문서 화상을 크롭하는, 화상 처리 장치.
  9. 제1항에 있어서,
    상기 검출 유닛은, 상기 문서의 형상이 직사각형인 경우, 상기 직사각형의 4개의 정점의 좌표를 상기 문서의 상기 위치 정보로서 취득하는, 화상 처리 장치.
  10. 제1항에 있어서,
    상기 검출 유닛은, 상기 문서의 형상이 직사각형이 아닌 경우, 상기 문서의 최소 외접 직사각형을 구하고, 상기 최소 외접 직사각형의 4개의 정점의 좌표를 상기 위치 정보로서 취득하는, 화상 처리 장치.
  11. 문서를 포함하는 영역을 스캔하는 스캐너에 의해 얻어진 화상 데이터에 대한 크롭 처리의 방법이며,
    상기 스캐너로부터 출력된 신호값을 제1 백색 기준값을 사용해서 정규화함으로써 얻어진 제1 화상으로부터 상기 문서의 에지 성분을 검출하는 단계와;
    상기 제1 화상 내의 상기 문서의 위치 정보를 취득하는 단계와;
    상기 스캐너로부터 출력된 신호값을 제2 백색 기준값을 사용하여 정규화함으로써 얻어진 제2 화상으로부터, 상기 문서에 대응하는 문서 화상을, 취득된 상기 문서의 상기 위치 정보에 기초하여 크롭하는 단계를 포함하며,
    상기 제1 백색 기준값은 상기 제2 백색 기준값보다 높은, 방법.
  12. 프로그램을 저장하는 비일시적 컴퓨터 판독가능 저장 매체이며,
    상기 프로그램은, 컴퓨터가,
    문서를 스캔하는 스캐너로부터 출력된 신호값을 제1 백색 기준값을 사용하여 정규화함으로써 얻어진 제1 화상으로부터 문서의 에지 성분을 검출하는 단계와;
    상기 제1 화상 내의 상기 문서의 위치 정보를 취득하는 단계와;
    상기 스캐너로부터 출력된 신호값을 제2 백색 기준값을 사용하여 정규화함으로써 얻어진 제2 화상으로부터, 상기 문서에 대응하는 문서 화상을, 취득된 상기 문서의 상기 위치 정보에 기초하여 크롭하는 단계를 행하게 하며,
    상기 제1 백색 기준값은 상기 제2 백색 기준값보다 높은, 비일시적 컴퓨터 판독가능 저장 매체.
KR1020190056729A 2018-05-25 2019-05-15 멀티 크롭 처리를 행하는 화상 처리 장치, 멀티 크롭 처리에 의해 문서 단위의 화상을 생성하는 방법 및 저장 매체 KR102553581B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018100331A JP7130436B2 (ja) 2018-05-25 2018-05-25 マルチクロップ処理を行う画像処理装置、マルチクロップ処理によって原稿単位の画像を生成する方法、および、プログラム
JPJP-P-2018-100331 2018-05-25

Publications (2)

Publication Number Publication Date
KR20190134477A KR20190134477A (ko) 2019-12-04
KR102553581B1 true KR102553581B1 (ko) 2023-07-11

Family

ID=68614757

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190056729A KR102553581B1 (ko) 2018-05-25 2019-05-15 멀티 크롭 처리를 행하는 화상 처리 장치, 멀티 크롭 처리에 의해 문서 단위의 화상을 생성하는 방법 및 저장 매체

Country Status (4)

Country Link
US (1) US11069068B2 (ko)
JP (1) JP7130436B2 (ko)
KR (1) KR102553581B1 (ko)
CN (1) CN110536040B (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11308318B2 (en) * 2018-05-30 2022-04-19 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
JP2020198546A (ja) * 2019-06-03 2020-12-10 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN111242178A (zh) * 2020-01-02 2020-06-05 杭州睿琪软件有限公司 对象识别方法、装置及设备
JP7459572B2 (ja) * 2020-03-06 2024-04-02 ブラザー工業株式会社 読取装置
CN111860166A (zh) * 2020-06-18 2020-10-30 浙江大华技术股份有限公司 图像检测的方法、装置、计算机设备和存储介质
CN111754487B (zh) * 2020-06-24 2023-07-25 北京奇艺世纪科技有限公司 一种黑框区域裁剪方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090175537A1 (en) * 2007-05-01 2009-07-09 Compulink Management Center, Inc. Photo-document segmentation method and system
US20110002015A1 (en) * 2008-07-04 2011-01-06 Canon Kabushiki Kaisha Image processing method and program storage medium

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5097517A (en) * 1987-03-17 1992-03-17 Holt Arthur W Method and apparatus for processing bank checks, drafts and like financial documents
JPH0262671A (ja) * 1988-08-30 1990-03-02 Toshiba Corp カラー編集処理装置
JP3550589B2 (ja) * 1994-05-16 2004-08-04 株式会社ニコン 画像読取り装置
US5649025A (en) * 1995-02-03 1997-07-15 Xerox Corporation Multithresholding for document image segmentation
US6310984B2 (en) * 1998-04-09 2001-10-30 Hewlett-Packard Company Image processing system with image cropping and skew correction
TW468331B (en) * 1998-09-30 2001-12-11 Hitachi Ltd Non-contact image reading device and the system using the same
JP3579644B2 (ja) * 2000-10-25 2004-10-20 シャープ株式会社 両面原稿読取り装置及び画像形成装置
JP2003087531A (ja) * 2001-09-12 2003-03-20 Seiko Epson Corp 画像読み取り装置及び画像読み取り方法
JP2003338920A (ja) 2002-05-21 2003-11-28 Canon Inc 画像読取装置
US8390874B2 (en) * 2004-10-14 2013-03-05 Hewlett-Packard Development Company, L.P. Optimal resolution imaging system and method
US20060215232A1 (en) * 2005-03-23 2006-09-28 Jakob Ziv-El Method and apparatus for processing selected images on image reproduction machines
JP2007020122A (ja) * 2005-07-11 2007-01-25 Canon Inc 画像処理装置、画像処理装置の制御方法およびプログラム
US7903302B2 (en) * 2007-10-01 2011-03-08 Kabushiki Kaisha Toshiba Image reading apparatus and image reading method
JP4929237B2 (ja) * 2008-06-23 2012-05-09 キヤノン株式会社 画像処理装置及び画像処理方法
WO2010140159A2 (en) * 2009-06-05 2010-12-09 Hewlett-Packard Development Company, L.P. Edge detection
JP5264831B2 (ja) * 2010-06-21 2013-08-14 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP5220828B2 (ja) * 2010-11-11 2013-06-26 シャープ株式会社 画像処理装置、画像形成装置、画像読取装置、画像処理方法、プログラム及び記録媒体
US8855375B2 (en) * 2012-01-12 2014-10-07 Kofax, Inc. Systems and methods for mobile image capture and processing
JP6103918B2 (ja) * 2012-12-18 2017-03-29 キヤノン株式会社 画像処理装置および画像処理方法
JP5875637B2 (ja) * 2013-12-19 2016-03-02 キヤノン株式会社 画像処理装置、画像処理方法
JP6547606B2 (ja) * 2015-11-26 2019-07-24 ブラザー工業株式会社 画像読取システム
JP6562823B2 (ja) * 2015-12-01 2019-08-21 シャープ株式会社 画像読取装置
JP6580965B2 (ja) * 2015-12-01 2019-09-25 シャープ株式会社 画像読取装置
JP2018006981A (ja) * 2016-06-30 2018-01-11 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP6837347B2 (ja) 2017-02-15 2021-03-03 シャープ株式会社 画像読取装置および画像読取方法
US10506113B2 (en) * 2017-12-15 2019-12-10 Ricoh Company, Ltd. Image processing apparatus including a main device and an operation device receiving setting information for scanning
US11308318B2 (en) * 2018-05-30 2022-04-19 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090175537A1 (en) * 2007-05-01 2009-07-09 Compulink Management Center, Inc. Photo-document segmentation method and system
US20110002015A1 (en) * 2008-07-04 2011-01-06 Canon Kabushiki Kaisha Image processing method and program storage medium

Also Published As

Publication number Publication date
CN110536040B (zh) 2021-09-14
CN110536040A (zh) 2019-12-03
JP2019205110A (ja) 2019-11-28
US11069068B2 (en) 2021-07-20
KR20190134477A (ko) 2019-12-04
US20190362498A1 (en) 2019-11-28
JP7130436B2 (ja) 2022-09-05

Similar Documents

Publication Publication Date Title
KR102553581B1 (ko) 멀티 크롭 처리를 행하는 화상 처리 장치, 멀티 크롭 처리에 의해 문서 단위의 화상을 생성하는 방법 및 저장 매체
US11308318B2 (en) Image processing apparatus, image processing method, and storage medium
US20100141991A1 (en) Image processing apparatus, image forming apparatus, and image processing method
US8976414B2 (en) Image processing method, image processing apparatus and image forming apparatus including the same, image reading apparatus, and recording medium
JP4565016B2 (ja) 画像処理装置、画像処理方法及びそのプログラムならびにこのプログラムを記憶させたコンピュータ読み取り可能な記憶媒体
EP2182715A1 (en) Image reading method, image reading apparatus, and program recording medium
US8593686B2 (en) Image scanning apparatus, computer readable medium, and image storing method add scanned image data into an image file storing an existing image data associated with an attribute value of the existing image data
US8531733B2 (en) Image processing system with electronic book reader mode
JP6628279B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2022147074A (ja) 画像処理装置、画像処理方法およびプログラム
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP5258529B2 (ja) 画像処理装置及びその方法、並びに、コンピュータプログラムおよび記憶媒体
JP2009017208A (ja) 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及びコンピュータでの読み取りが可能な記録媒体
JP6262102B2 (ja) 画像処理装置、画像処理システム、コンピュータプログラム及び記録媒体
JP2014017636A (ja) 画像読取装置及びプログラム
JP4931897B2 (ja) 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP2010154244A (ja) 画像処理装置、画像処理方法及びプログラム
US20220109777A1 (en) Image processing apparatus capable of improving compression efficiency of electronic documents, control method for image processing apparatus, and storage medium
JP6876917B2 (ja) 原稿サイズ検出装置、原稿サイズ検出プログラム及び画像処理システム
US20240020997A1 (en) Methods and systems for adjusting text colors in scanned documents
RU2452126C1 (ru) Устройство обработки изображения, способ обработки изображения и носитель информации
JP2019213190A (ja) 画像処理装置、画像処理方法、および、プログラム
JP2010258706A (ja) 画像処理装置、画像形成装置、画像処理装置の制御方法、プログラム、記録媒体
JP2022189063A (ja) 画像データ生成装置および画像データ生成方法
JP4770880B2 (ja) アウトライン化方法およびそれを用いた画像圧縮方法、アウトライン化装置、画像圧縮装置、アウトライン化プログラム、ならびに、画像圧縮プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant