KR20190021161A - 스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체 - Google Patents

스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체 Download PDF

Info

Publication number
KR20190021161A
KR20190021161A KR1020180094148A KR20180094148A KR20190021161A KR 20190021161 A KR20190021161 A KR 20190021161A KR 1020180094148 A KR1020180094148 A KR 1020180094148A KR 20180094148 A KR20180094148 A KR 20180094148A KR 20190021161 A KR20190021161 A KR 20190021161A
Authority
KR
South Korea
Prior art keywords
character
character area
area
processing
user
Prior art date
Application number
KR1020180094148A
Other languages
English (en)
Other versions
KR102408019B1 (ko
Inventor
다이지로 미야모토
Original Assignee
캐논 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 캐논 가부시끼가이샤 filed Critical 캐논 가부시끼가이샤
Publication of KR20190021161A publication Critical patent/KR20190021161A/ko
Application granted granted Critical
Publication of KR102408019B1 publication Critical patent/KR102408019B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • G06F16/166File name conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06K9/20
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00209Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00461Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet marking or otherwise tagging one or more displayed image, e.g. for selective reproduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Facsimiles In General (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)

Abstract

스캔 화상의 문자 인식 결과를 사용하여, 사용자는 상기 스캔 화상에 대하여 파일명 등의 부대 정보를 간단한 조작으로 설정할 수 있다. 문서를 스캔함으로써 얻어진 스캔 화상에 대하여 미리정해진 처리를 행하는 장치로서, 상기 미리정해진 처리를 행하기 위한 UI 화면을 표시하도록 구성된 표시 제어 유닛으로서, 상기 UI 화면은 상기 스캔 화상 내의 문자 영역을 사용자가 선택 가능하게 표시하는, 표시 제어 유닛; 및 상기 UI 화면을 통해 사용자가 선택한 문자 영역에 대하여 OCR 처리를 행하고, 상기 OCR 처리에서 추출된 문자열을 사용해서 상기 미리정해진 처리를 위한 부대 정보를 설정하는 설정 유닛을 포함하고, 상기 설정 유닛은, 사용자가 복수의 문자 영역을 선택한 경우, 상기 복수의 선택된 문자 영역 사이의 위치 관계에 기초하여 상기 추출된 문자열 사이에 구획 문자를 삽입해야 하는지 여부를 판단하고, 구획 문자를 삽입해야 한다고 판단되는 경우, 추출된 문자열 사이에 구획 문자를 삽입하는, 장치가 제공된다.

Description

스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체{APPARATUS FOR SETTING FILE NAME AND THE LIKE FOR SCAN IMAGE, CONTROL METHOD THEREOF, AND STORAGE MEDIUM}
본 발명은, 스캔 화상의 문자 인식 결과를 사용하여, 당해 스캔 화상에 대하여 파일명 등을 설정하는 기술에 관한 것이다.
전통적으로, 문서 관리 방법으로서, 종이 문서를 스캔해서 전자화하는 방법이 널리 사용되고 있다. 또한, 문서의 전자화 시에, 스캔된 화상 데이터에 대하여 광학적 문자 인식 처리(OCR 처리)를 행하고, 인식된 문자를 전자화된 문서 파일의 파일명에 사용하는 기술이 있다. 예를 들어, 일본 특허 공개 제2008-176624호 공보는, 스캔된 화상 데이터에 대하여 OCR 처리를 행하는 복수의 영역을 미리 설정해 두고, 미리 설정된 파일명의 서식을 나타내는 룰과 각 영역의 문자 인식 결과에 따라, 파일명을 설정하는 기술을 개시하고 있다. 또한, 일본 특허 공개 제2008-176624호 공보는, 해당 파일명의 서식을 나타내는 룰의 설정에 있어서, 복수의 영역의 문자 인식 결과 사이에 하이픈 등의 특수 기호(구획 문자)를 부가할 수 있는 것을 개시하고 있다.
그러나, 일본 특허 공개 제2008-176624호 공보에 개시된 방법에서는, OCR 처리의 대상 영역과 파일명의 서식을 나타내는 룰을 문서의 종류마다 설정할 필요가 있다. 따라서, 다양한 종류의 문서에 대하여 적절하게 파일명을 부여하기 위해서는, 문서의 종류에 따라 사전에 룰을 설정할 필요가 있고, 이는 작업에 많은 시간과 노력을 필요로 한다. 또한, 일본 특허 공개 제2008-176624호 공보에 개시된 방법에서는, 영역의 문자 인식 결과 사이에 삽입되는 구획 문자는 미리 설정된 룰을 따르기 때문에, 파일명을 부여할 때에 구획 문자를 삽입할지의 여부를 실제 스캔 화상에 따라서 유연하게 결정하는 것이 불가능하다. 도면을 참고하여 구체예를 나타낸다. 도 1은 쿼테이션의 스캔 화상에 대하여 파일명을 설정하는 상황을 나타낸다. 이제, 일련의 문자열의 영역(문자 영역)마다 OCR 처리를 행하고, 문자 영역 사이에 구획 문자로서 "_(언더바)"를 삽입하는 룰이 설정되는 것으로 한다. 도 1에 도시하는 예에서는, "QUOTATION"은 문자(글자) 사이에 공간을 갖기 때문에, "QUOTATION"은 분리되어서는 안된다는 사실에도 불구하고, 하나의 문자를 각각 포함하는 문자 영역으로 분리된다. 그 결과, "Q_U_O_T_A_T_I_O_N"의 파일명이 설정된다. 이러한 경우에는, 문자 인식 결과 사이에 구획 문자가 삽입되지 않는 것이 요망되지만, 일본 특허 공개 제2008-176624호 공보의 기술은 이러한 경우에 대응할 수 없다.
본 발명은 상술한 과제를 해결하기 위해서 이루어졌으며, 본 발명의 목적은 스캔 화상의 문자 인식 결과를 사용하여, 사용자가 간단한 조작에 의해 스캔 화상에 대하여 파일명 등을 설정할 수 있게 하는 것이다.
본 발명에 따르면, 문서를 스캔함으로써 얻어진 스캔 화상에 대하여 미리정해진 처리를 행하는 장치로서, 상기 미리정해진 처리를 행하기 위한 UI 화면을 표시하도록 구성된 표시 제어 유닛으로서, 상기 UI 화면은 상기 스캔 화상 내의 문자 영역을 사용자가 선택가능하게 표시하는, 표시 제어 유닛; 및 상기 UI 화면을 통해 사용자가 선택한 문자 영역에 대하여 OCR 처리를 행하고, 상기 OCR 처리에서 추출된 문자열을 사용해서 상기 미리정해진 처리를 위한 부대 정보를 설정하도록 구성된 설정 유닛을 포함하며, 상기 설정 유닛은, 사용자가 복수의 문자 영역을 선택한 경우, 선택된 상기 복수의 문자 영역 사이의 위치 관계에 기초하여 상기 추출된 문자열 사이에 구획 문자가 삽입되어야 하는지 여부를 판단하고, 구획 문자가 삽입되어야 한다고 판단되는 경우, 상기 추출된 문자열 사이에 구획 문자를 삽입하는 장치가 제공된다.
본 발명의 추가적인 특징은 첨부된 도면을 참고한 예시적인 실시형태에 대한 이하의 설명으로부터 명확해질 것이다.
도 1은 종래 기술의 문제를 나타내는 도면이다.
도 2는 화상 처리 시스템의 전체 구성을 나타내는 도면이다.
도 3a는 MFP의 하드웨어 구성을 나타내는 도면이다.
도 3b는 파일 서버의 하드웨어 구성을 나타내는 도면이다.
도 4는 MFP의 소프트웨어 구성을 나타내는 도면이다.
도 5는 스캔 화상의 생성으로부터 업로드까지의 동작 제어의 흐름을 나타내는 흐름도이다.
도 6은 스캔 설정 화면의 일례를 도시한다.
도 7a 및 도 7b는 프리뷰 화면의 일례를 도시한다.
도 8은 프리뷰 화면에서 파일명이 생성된 상태를 도시한다.
도 9는 업로드 화면의 일례를 도시한다.
도 10은 제1 실시형태에 따른 파일명 생성 처리의 상세를 나타내는 흐름도이다.
도 11은 제2 실시형태에 따른 파일명 생성 처리의 상세를 나타내는 흐름도이다.
도 12는 연속하는 문자 영역의 문자열을 자동으로 선택하는 처리의 상세를 나타내는 흐름도이다.
이하, 첨부된 도면을 참고하여, 바람직한 실시형태에 따라 본 발명을 상세하게 설명한다. 이하의 실시형태에 도시된 구성은 단지 예시이며, 본 발명은 개략적으로 도시된 구성으로 한정되지 않는다.
[제1 실시형태]
<화상 처리 시스템의 구성>
도 2는 본 실시형태에 따른 화상 처리 시스템의 전체 구성을 도시하는 도면이다. 화상 처리 시스템은, LAN(Local Area Network)을 통해 서로 통신하도록 접속되는 MFP(110)와 파일 서버(120)로 구성된다.
MFP(Multi Function Printer)(110)는, 스캐너 및 프린터와 같은 복수의 기능을 갖는 복합기이며, 화상 처리 장치의 일례이다. 파일 서버(120)는, 전자화된 문서 파일을 저장 및 관리하는 외부 서버의 일례이다. 본 실시형태의 화상 처리 시스템은, MFP(110)와 파일 서버(120)로 이루어지지만, 이것으로 한정되지 않는다. 예를 들어, MFP(110)는 파일 서버(120)의 역할을 겸비해도 된다. 또한, LAN 대신에 예를 들어 인터넷을 통한 접속 형태가 채용될 수 있다. 또한, MFP(110)는, PSTN(Public Switched Telephone Networks)에 접속되고, 팩시밀리 기계(도시하지 않음)와의 사이에서 팩시밀리를 통해 화상 데이터를 송신 및 수신할 수 있다.
도 3a는 MFP(110)의 하드웨어 구성도이다. MFP(110)는, 제어 유닛(210), 조작 유닛(220), 프린터 유닛(221), 스캐너 유닛(222), 및 모뎀(223)으로 구성된다. 제어 유닛(210)은, 이하의 유닛(211 내지 219)으로 구성되어, MFP(110)의 전체 동작을 제어한다. CPU(211)는, ROM(212)에 저장된 제어 프로그램을 로딩하고, 스캔, 인쇄 및 통신 같은 MFP(110)의 다양한 기능을 실행 및 제어한다. RAM(213)은, CPU(211)의 주메모리 또는 워크 에어리어 등의 일시 저장 영역으로서 사용된다. 본 실시형태에서는, 1개의 CPU(211)가 1개의 메모리(RAM(213) 또는 HDD(214))를 사용해서 후술하는 흐름도에 나타내는 각 처리를 실행하는 것으로 하지만, 본 발명은 이것으로 한정되지 않는다. 예를 들어, 복수의 CPU가 복수의 RAM 또는 HDD를 협동시켜서 처리를 실행해도 된다. HDD(214)는, 화상 데이터 및 각종 프로그램을 저장하는 대용량 저장 유닛이다. 조작 유닛 I/F(215)는, 조작 유닛(220)과 제어 유닛(210)을 접속하는 인터페이스이다. 조작 유닛(220)은, 터치 패널, 키보드 등을 구비하고, 사용자에 의한 조작, 입력 및 지시를 접수한다. 프린터 I/F(216)는, 프린터 유닛(221)과 제어 유닛(210)을 접속하는 인터페이스이다. 인쇄용의 화상 데이터는 프린터 I/F(216)를 통해 제어 유닛(210)으로부터 프린터 유닛(221)에 전송되고, 기록 매체 위에 인쇄된다. 스캐너 I/F(217)는, 스캐너 유닛(222)과 제어 유닛(210)을 접속하는 인터페이스이다. 스캐너 유닛(222)은, 원고대 또는 ADF(Auto Document Feeder)(도시하지 않음)에 세트된 문서를 스캔해서 화상 데이터를 생성하고, 스캐너 I/F(217)를 통해 제어 유닛(210)에 입력한다. MFP(110)는, 스캐너 유닛(222)에 의해 생성된 화상 데이터를 프린터 유닛(221)으로부터 인쇄 출력(카피)할 수 있을 뿐만 아니라, 화상 데이터의 파일을 송신하거나 또는 화상 데이터를 이메일을 통해 송신할 수도 있다. 모뎀 I/F(218)은, 모뎀(223)과 제어 유닛(210)을 접속하는 인터페이스이다. 모뎀(223)은, PSTN 상의 팩시밀리 기계와의 사이에서 팩시밀리를 통해 화상 데이터를 송신 및 수신한다. 네트워크 I/F(219)는, 제어 유닛(210)(MFP(110))을 LAN에 접속하는 인터페이스이다. MFP(110)는, 네트워크 I/F(219)를 사용해서 LAN 상의 외부 장치(예를 들어, 파일 서버(120))와의 사이에서 화상 데이터 및 정보를 송신하거나 각종 정보를 수신한다.
도 3b는 파일 서버(120)의 하드웨어 구성도이다. 파일 서버(120)는, CPU(311), ROM(312), RAM(313), HDD(314) 및 네트워크 I/F(315)로 구성된다. CPU(311)는, ROM(312)에 저장된 제어 프로그램을 로딩해서 각종 처리를 실행함으로써, 파일 서버(120)의 전체 동작을 제어한다. RAM(313)은, CPU(311)의 주메모리 또는 워크 에어리어 등의 일시 저장 영역으로서 사용된다. HDD(314)는, 화상 데이터 및 각종 프로그램을 저장하는 대용량 저장 유닛이다. 네트워크 I/F(315)는 파일 서버(120)를 LAN에 접속하는 인터페이스이다. 파일 서버(120)는, 네트워크 I/F(315)를 사용해서 LAN 상의 다른 장치(예를 들어, MFP(110))와의 사이에서 각종 정보를 송신 및 수신한다.
<MFP의 소프트웨어 구성>
도 4는, MFP(110)의 소프트웨어 구성도이다. MFP(110)의 소프트웨어는 크게 네이티브 기능 모듈(410)과 추가 기능 모듈(420)의 2개로 나뉜다. 네이티브 기능 모듈(410)에 포함되는 유닛은 MFP(110)에 기본적으로 구비된 기능 모듈이다. 한편, 추가 기능 모듈(420)에 포함되는 유닛은, 애플리케이션의 인스톨에 의해 실현되는 기능 모듈 같은 MFP(110)에 추가적으로 제공되는 기능 모듈이다. 본 실시형태의 추가 기능 모듈(420)은, Java(등록 상표) 기반 애플리케이션이며, MFP(110)에의 기능 추가를 용이하게 실현할 수 있다. 또한, MFP(110)에는 다른 애플리케이션(도시하지 않음)이 인스톨될 수 있다. 이하, 양쪽 기능 모듈(410 및 420)을 형성하는 유닛에 대해서 설명한다.
애플리케이션 표시 유닛(423)은, 조작 유닛(220)의 터치 패널에, 사용자에 의한 각종 조작을 접수하기 위한 UI 화면을 표시하는 표시 제어를 행한다. 표시되는 UI 화면의 상세에 대해서는 후술한다. 스캔 지시 유닛(421)은, UI 화면을 통해서 입력된 사용자 지시에 응답하여, 스캔 설정 정보 및 전송 설정 정보를 포함하는 스캔 요구를 스캔 실행 유닛(411)에 송신하고, 스캔 실행 유닛(411)이 스캔 처리를 실행하게 한다. 스캔 요구는, 후술하는 애플리케이션 수신 유닛(422)이 수신하는 화상 데이터가 당해 스캔 요구에 대응하는지 여부를 식별하기 위한 요구 ID도 포함한다.
스캔 실행 유닛(411)은, 스캔 지시 유닛(421)으로부터 스캔 요구를 수신하면, 스캐너 I/F(217)를 통해 스캐너 유닛(222)을 제어해서 스캔 처리를 실행한다. 따라서, 문서가 스캔되고 화상 데이터가 생성된다. 스캔에 의해 생성된 화상 데이터(이하, "스캔 화상 데이터"라 칭함)는, 화상 데이터의 목적지를 특정하는 전송 설정 정보와 함께 전송 유닛(412)에 건네진다. 전송 유닛(412)은 스캔 실행 유닛(411)으로부터 수신한 스캔 화상 데이터를 전송 설정에 따라 전송하다. 스캔 화상 데이터의 목적지로서는, 파일 서버(120), LAN 상의 PC(도시하지 않음) 등이 설정될 수 있다. 그러나, 본 실시형태에서, 스캔 실행 유닛(411)에 의해 생성된 스캔 화상 데이터 모두는 일단 추가 기능 모듈(420)에 전송되는 것으로 한다. 전송 유닛(412)은, FTP(File Transfer Protocol) 클라이언트 기능을 갖고 있으며, FTP 서버 기능을 갖는 애플리케이션 수신 유닛(422)에 대하여 FTP를 사용하여 스캔 화상 데이터를 전송한다.
애플리케이션 수신 유닛(422)은, 전송 유닛(412)으로부터 내부 전송된 스캔 화상 데이터를 수신하고, 그것을 애플리케이션 전송 유닛(424)에 건넨다. 애플리케이션 전송 유닛(424)은 수신된 스캔 화상 데이터를 화상 해석 유닛(425)에 건넨다. 화상 해석 유닛(425)은 수신된 스캔 화상 데이터에 대하여 문자 영역의 특정 및 문자 인식 같은 화상 해석 처리를 행한다. 그리고, 스캔 화상 데이터와 그 해석 결과는 애플리케이션 전송 유닛(424)을 통해 프리뷰 표시 유닛(426)에 건네진다. 프리뷰 표시 유닛(426)은, 스캔 화상 데이터와 그 해석 결과에 기초하여, 사용자가 파일명을 설정하기 위한 UI 화면을 생성하고, 조작 유닛(220)의 액정 패널에의 표시 같은 표시 제어를 행한다.
업로드 지시 유닛(427)은, 사용자가 폴더 경로를 설정하기 위한 UI 화면을 생성하고, 그것을 조작 유닛(220)의 터치 패널에 표시한다. 애플리케이션 전송 유닛(424)은, 파일 서버(120)에 스캔 화상 데이터를 전송(송신)한다. 애플리케이션 전송 유닛(424)은, 전송이 종료되면, 애플리케이션 표시 유닛(423)에 전송이 종료된 것을 통지한다. 애플리케이션 표시 유닛(423)은, 애플리케이션 전송 유닛(424)으로부터 통지를 수신하면, 표시 내용을 갱신한다. 또한, 애플리케이션 전송 유닛(424)은 SMB(Server Message Block) 클라이언트 기능을 갖는다. 이에 의해, SMB 서버 기능을 갖는 파일 서버(120)에 대하여, SMB를 사용해서 파일 조작 및 폴더 조작을 행한다. 사용되는 프로토콜은 SMB로 한정되지 않는다. WebDAV, FTP, SMTP 등이 사용될 수 있다. 또한, SOAP 또는 REST와 같은 파일 송신의 목적으로 사용되는 프로토콜 이외의 프로토콜이 사용될 수 있다.
계속해서, MFP(110)에서 문서로부터 스캔 화상을 생성하고, 그것을 파일 서버(120)에 업로드하는 동작 제어에 대해서 설명한다. 도 5는 스캔 화상의 생성으로부터 업로드까지의 제어의 흐름을 나타내는 흐름도이다. 이 일련의 처리는, 제어 유닛(210)에서, CPU(211)가 HDD(214)에 저장된 제어 프로그램을 실행함으로써 실현될 수 있다. 이하, 상세하게 설명한다.
단계 501에서는, 애플리케이션 표시 유닛(423)에 의해, 스캔 처리를 위한 각종 설정을 행하기 위한 UI 화면(이하, "스캔 설정 화면"이라 칭함)이 조작 유닛(220)의 터치 패널에 표시된다. 도 6은 스캔 설정 화면의 일례를 도시한다. 도 6의 스캔 설정 화면(600)은 5개의 설정 버튼(601 내지 605)을 갖는다. [컬러 설정] 버튼(601)은 문서를 스캔할 때의 컬러/모노크롬을 설정하기 위한 버튼이다. [해상도 설정] 버튼(602)은, 문서를 스캔할 때의 해상도를 설정하기 위한 버튼이다. [양면 스캔 설정] 버튼(603)은, 문서의 양면을 스캔할 필요가 있을 때에 사용되는 설정 버튼이다. [문서 혼재 설정] 버튼(604)은, 사이즈가 다른 문서를 한 번에 스캔할 필요가 있을 때에 사용되는 설정 버튼이다. [화상 형식 설정] 버튼(605)은, 스캔 화상 데이터의 보존 형식을 지정할 때에 사용하는 설정 버튼이다. 이들 설정 버튼(601 내지 605)을 사용하여 설정을 행할 때, MFP(110)에서 지원되는 범위 내에서 설정될 수 있는 후보(선택지)가 표시되고, 사용자는 표시된 후보로부터 원하는 설정을 선택한다. 상기 설정 버튼은 예로서 설명된다. 이들 설정 항목 모두가 포함되지 않아도 되고, 이들 설정 항목 이외의 설정 항목이 포함될 수 있다. 사용자는, 스캔 설정 화면(600)을 통해서 스캔 처리에 관한 상세한 설정을 행한다. [캔슬] 버튼(620)은 스캔 설정을 중지할 경우에 사용하는 버튼이다. [스캔 개시] 버튼(621)은, 원고대 등에 세트된 문서에 대한 스캔 처리의 개시를 지시하기 위한 버튼이다.
단계 502에서는, 애플리케이션 표시 유닛(423)에 의해, 사용자에 의한 버튼 조작의 내용에 따라 처리가 분리된다. [스캔 개시] 버튼(621)의 누름이 검출된 경우에는, 설정 버튼(601 내지 605)에 의해 설정된 내용과 스캔 처리의 개시의 접수가 애플리케이션 표시 유닛(423)에 의해 스캔 지시 유닛(421)에 통지된다. 한편, [캔슬] 버튼(620)의 누름이 검출된 경우에는, 본 처리는 종료된다.
단계 503에서, 스캔 지시 유닛(421)으로부터의 지시에 응답하여, 스캔 실행 유닛(411)에 의해 스캔 처리가 실행된다. 이것에 의해 얻어진 스캔 화상 데이터는, 단계 504에서, 전송 유닛(412)을 통해서 애플리케이션 수신 유닛(422)에 FTP를 사용하여 내부 전송되고, 또한 애플리케이션 전송 유닛(424)을 통해 화상 해석 유닛(425)에 전송된다.
단계 505에서는, 화상 해석 유닛(425)에서, 스캔 화상 데이터의 해석 처리가 실행된다. 더 구체적으로는, 먼저, 스캔 화상 데이터에 대하여, 화상 신호의 2치화, 스캔시에 어긋난 문서의 기울기 수정, 정립 방향으로의 문서의 회전 등을 행하여, 해석 처리가 원활하게 행해지도록 스캔 화상 데이터의 상태를 보정한다. 그리고, 보정된 스캔 화상(2치 화상)에 대하여 에지 추출 등을 행하여, 당해 화상 내의 문자 영역, 즉 일련의 문자열로 추정되는 블록(단위 영역)을 특정한다. 이하의 표 1은, 주어진 쿼테이션의 스캔 화상의 일부에 대하여 화상 해석 처리를 행한 결과의 예를 나타낸다.
Figure pat00001
상기 표 1에서, [번호]는 특정된 각 문자 영역의 고유 번호를 나타낸다. 이 예에서는, 1 내지 17의 일련 번호가 인식 순서로 부여된다. [영역의 X 좌표]는, 특정된 각 문자 영역의 좌측 상단 코너의 X 좌표를 나타낸다. [영역의 Y 좌표]는, 특정된 각 문자 영역의 좌측 상단 코너의 Y 좌표를 나타낸다. 이후, 문자 영역에 대하여 "좌표(들)"라는 용어를 사용하는 경우에, 상기 용어는 달리 언급하지 않는 한 문자 영역의 좌측 상단 코너의 위치 좌표를 의미하는 것으로 한다. [영역 폭]은, 특정된 각 문자 영역의 좌변과 우변 사이의 거리를 나타낸다. [영역 높이]는, 특정된 각 문자 영역의 상변과 하변 사이의 거리를 나타낸다. 본 실시형태에서는, [영역의 X 좌표], [영역의 Y 좌표], [영역 폭], 및 [영역 높이]는 모두 픽셀로 나타내지만, 이들은 포인트, 인치 등으로 나타내도 된다. 스캔 화상으로부터 추출된 각 문자 영역의 정보(이하, "문자 영역 정보"라 칭함)는 화상 해석 데이터로서 애플리케이션 전송 유닛(424)에 건네진다. 화상 해석 데이터는, 예를 들어 CSV 또는 XML 포맷이지만, 다른 포맷이어도 된다. 또한, 화상 해석 데이터는 HDD(214)에 일단 저정된 후에 미리정해진 타이밍에 건네질 수 있다.
단계 506에서는, 프리뷰 표시 유닛(426)에 의해, 단계 503에서 얻어진 스캔 화상이, 조작 유닛(220)의 터치 패널에 프리뷰 표시된다. 이 프리뷰 표시용의 화면 데이터는, 애플리케이션 표시 유닛(423)에 의해 생성 및 제공된다. 사용자는, 스캔 화상이 프리뷰 표시된 UI 화면(이하, "프리뷰 화면"이라 칭함)을 통해 스캔 화상 데이터의 파일명을 설정할 수 있다. 도 7a는 프리뷰 화면의 일례를 도시한다. 프리뷰 화면(700)에서, 화면의 중앙에 위치하는 프리뷰 영역(710) 내에, 얻어진 스캔 화상이 표시된다. 또한, 프리뷰 영역(710) 내에는, 스캔 화상과 함께, 스캔 화상의 표시 상태를 변경하기 위한 복수의 버튼(711 내지 714)도 표시된다. 버튼(711 및 712)은, 전체 스캔 화상을 표시할 수 없을 때에 나타나며, 표시 영역을 세로 방향으로 스크롤하기 위해 사용된다. 일반적으로, MFP(110)에 제공되는 터치 패널의 크기는 그 정도로 크지 않다. 따라서, 예를 들어 스캔 화상이 A4 사이즈 세로 횡 기입의 문서를 스캔함으로써 얻어지는 경우, 스캔 화상이 그 전체 폭 방향(횡 방향)이 프리뷰 영역(710)에 꼭 맞는 상태에서 상부 정렬되고, 축소되며, 표시되도록 초기 설정이 이루어진다. 즉, 초기 설정에서는, A4 사이즈 세로 스캔 화상의 하부는 프리뷰 영역(710) 내에 표시되지 않는다. 이 경우, "↓" 버튼(712)을 누름으로써, 표시 영역이 아래로 스크롤되고, 하부를 표시할 수 있다. 또한, 스캔 화상이 A4 사이즈 가로, A3 사이즈 등일 경우에는, 표시 영역을 수평 방향으로 스크롤하기 위한 버튼이 더 제공될 수 있다. 버튼(713 및 714)은 표시 영역을 배율조정하기 위한 버튼이다. "+" 버튼(713)을 누르면 줌인되고, "-" 버튼(714)을 누르면 줌 아웃된다. 버튼 조작에 의한 동작은, 프리뷰 화면 상에서의 스와이프, 핀치 인/핀치 아웃과 같은 사용자의 손가락에 의한 조작에 의해 실현될 수 있다. 프리뷰 영역(710)에는, 단계 505의 화상 해석 처리에서 특정된 문자 영역이, 상술한 문자 영역 정보에 기초하여, 사용자에게 인식가능한 방식으로 표시된다. 도 7b는, 도 7a에 도시된 프리뷰 화면(700)에서, 각 문자 영역이 박스에 의해 인식가능한 방식으로 표시되는 상태를 도시하며, 문자 영역은 상기 표 1에 대응한다. 사용자가, 프리뷰 영역(710)에 표시된 문자 영역으로부터 임의의 문자 영역을 선택(예를 들어, 손가락에 의한 터치)하면, 문자 영역에 포함되는 문자열이 파일명 입력 필드(701)에 표시, 즉 자동 입력되고, 파일명을 구성하는 문자열의 일부가 된다. [되돌아간다] 버튼(720)은, 프리뷰 표시를 중지할 경우에 사용하는 버튼이다. [다음] 버튼(721)은, 얻어진 스캔 화상 데이터의 업로드 목적지를 설정하는 화면으로 이행하기 위한 버튼이다. 또한, 버튼(702)은 파일명의 포맷 등을 설정하기 위한 버튼이다. 상기 각종 버튼의 종류 및 문자 영역의 표시와 선택의 양태는 예로서 설명되는 것이며, 이들은 이들 예로 한정되지 않는다. 예를 들어, 파일명 입력 필드(701)에 표시된 문자열을 수정 및 변경하거나, 파일명을 확정하기 위한 버튼이 있어도 된다.
단계 507에서는, 프리뷰 표시 유닛(426)에 의해, 얻어진 스캔 화상에 대한 파일명이 생성된다. 도 8은, 파일명 생성 후의 프리뷰 화면(700)의 상태를 나타내고 있다. 이 예에서는, "Q", "U", "O", "T", "A", "T", "I", "O", "N", "Tokyo Corporation" 및 "04/14/2017"에 대응하는 문자 영역을 순차적으로 선택함으로써, "QUOTATION_TokyoCorporation_04/14/2017"의 문자열이 파일명 입력 필드(701)에 표시 및 설정된다. 또한, 프리뷰 영역(710)에서는, 사용자에 의해 터치된 문자 영역의 박스가, 그것이 파일명의 일부로서 선택된 것을 나타내기 위해서 굵은 박스로 변경된다. 파일명 생성 처리의 상세에 대해서는 후술한다. 원하는 파일명이 생성되고 사용자가 [다음] 버튼(721)을 누른 후, 처리는 단계 508로 진행한다.
단계 508에서는, 프리뷰 표시 유닛(426)에 의해, 단계 502와 마찬가지로, 사용자에 의한 버튼 조작의 내용에 따라 처리가 분리된다. [다음] 버튼(721)의 누름이 검출된 경우에는, 파일명 입력 필드(701)에 표시 중인 파일명(파일명으로서 설정된 문자열)에 대한 정보가 업로드 지시 유닛(427)에 전송되고, 처리는 단계 509로 진행한다. 한편, [되돌아간다] 버튼(720)의 누름이 검출된 경우에는, 처리는 단계 501(스캔 설정 화면의 표시)로 되돌아간다.
단계 509에서는, 업로드 지시 유닛(427)에 의해, 스캔 화상 데이터의 전송 목적지를 설정하기 위한 UI 화면(이하, "업로드 설정 화면"이라 칭함)이, 조작 유닛(220)의 터치 패널에 표시된다. 사용자는, 업로드 설정 화면을 통해 파일 서버(120)에의 업로드에 관한 상세 설정을 행한다. 도 9는, 업로드 설정 화면의 일례를 도시한다. 사용자는, 폴더 경로 입력 필드(901)에, 파일 서버(120)에 외부 전송할 때의 폴더 경로의 명칭(경로명)을 입력한다. 도 9의 예에서는, "04_04_2017"가 경로명으로서 입력된다. 입력 방법의 예는, 폴더 경로 입력 필드(901)에의 탭 조작에 응답하여 키보드 화면의 서브윈도우(도시하지 않음)를 표시하고, 사용자에게 당해 키보드 화면을 통해 경로명을 입력하도록 촉구하는 방법이 있다. 혹은, HDD(214)에 저장된 주소록으로부터 경로명을 선택해서 설정할 수 있다. [되돌아간다] 버튼(920)은, 업로드에 관한 상세 설정을 중지할 경우에 사용하는 버튼이다. [업로드] 버튼(921)은, 폴더 경로 입력 필드(901)에 설정된 폴더 경로에의 업로드를 지시하기 위한 버튼이다.
단계 510에서는, 업로드 지시 유닛(427)에 의해, 단계 508과 마찬가지로, 사용자에 의한 버튼 조작의 내용에 따라 처리가 분리된다. [업로드] 버튼(921)의 누름이 검출된 경우에는, 처리는 단계 511로 진행한다. 이때, 폴더 경로 입력 필드(901)에 입력된 경로명, 단계 507에서 생성된 파일명, 및 파일 서버 설정에 대한 각종 정보가 애플리케이션 전송 유닛(424)에 건네진다. 부가적으로, 파일 서버 설정은, 파일 서버(120)에 스캔 화상 데이터를 저장하기 위해서 필요한 정보이며, 구체적으로는 호스트명, 폴더 경로의 기점, 및 로그인용의 사용자명과 패스워드와 같은 정보를 포함한다. 한편, [되돌아간다] 버튼(920)의 누름이 검출된 경우에는, 처리는 단계 506(프리뷰 화면의 표시)로 되돌아간다.
단계 511에서는, 애플리케이션 전송 유닛(424)에 의해, 스캔 화상 데이터의 저장 목적지 경로가, 업로드 지시 유닛(427)으로부터 수취된 정보에 기초하여 생성된다. 더 구체적으로는, 저장 목적지 경로는 파일 서버 설정(파일 서버(120)의 호스트명, 폴더 경로의 기점)에 폴더 경로를 첨가함으로써 생성된다. 따라서, 저장 목적지 경로, 예를 들어 "\\server01\Share\04_04_2017"가 생성된다. 그리고, 단계 512에서는, 애플리케이션 전송 유닛(424)에 의해, 파일 서버(120)에 대한 액세스가 실행된다. 이때, 파일 서버 설정에 포함되는 사용자명과 패스워드를 파일 서버(120)에 송신한다. 사용자명과 패스워드를 수취한 파일 서버(120)에서는, 인증 처리가 실행된다.
단계 513에서는, 애플리케이션 전송 유닛(424)에 의해, 파일 서버(120)에서의 인증 결과에 따라서 처리가 분리된다. 즉, 파일 서버(120)로부터 인증 성공의 통지를 수신한 경우에는, 처리는 단계 514로 진행한다. 한편, 인증 실패의 통지를 수신한 경우에는, 본 처리를 종료한다.
단계 514에서는, 애플리케이션 전송 유닛(424)에 의해, 단계 511에서 생성된 저장 목적지 경로가 나타내는 폴더에 스캔 화상 데이터가 외부 전송되어, 파일 서버(120) 내에 저장된다.
이상이, 본 실시형태에 따른 스캔 화상의 생성으로부터 업로드까지의 동작 제어의 내용이다. 본 실시형태에서는, 단계 505 내지 단계 507의 처리를, 스캔에 의해 생성된 1 페이지분의 화상 데이터에 대하여 행하는 것을 상정하고 있다. 예를 들어, 프리뷰 화면(700) 내에 다음 페이지에 대한 화상 해석을 행하기 위한 버튼을 제공할 수 있고, 그 해석에 의해 얻어진 다음 페이지가 프리뷰 표시될 수 있어, 후속 페이지의 문자 영역으로부터 파일명을 구성하는 문자열을 설정할 수 있다.
<파일명 생성>
도 10은, 프리뷰 표시 유닛(426)에서의 파일명 생성 처리(단계 507)의 상세를 나타내는 흐름도이다. 도 10의 플로우에 따라 설명한다.
단계 1001에서는, 터치 패널 상에 표시된 프리뷰 화면(700)에의 사용자에 의한 터치 조작의 유무가 감시된다. 터치 조작이 검출되면, 처리는 단계 1002로 진행한다. 계속되는 단계 1002에서는, 처리는 터치 조작의 내용에 따라 분리된다. 터치 조작의 내용이 [다음] 버튼(721) 또는 [되돌아간다] 버튼(720)의 누름이었을 경우에는, 본 처리를 종료한다. 터치 조작의 내용이 [다음] 버튼(721) 또는 [되돌아간다] 버튼(720)의 누름이 아니었을 경우에는, 처리는 단계 1003으로 진행한다.
단계 1003에서는, 터치 조작이 이루어진 터치 패널 상의 위치 좌표(x, y)가 취득된다. 계속되는 단계 1004에서는, 터치 조작에 관련된 위치 좌표가 어느 문자 영역과 겹치는지가 판정된다. 예를 들어, 터치 조작에 관련된 위치 좌표가 프리뷰 영역(710)에 표시된 각 문자 영역 내(문자 영역의 네 코너를 나타내는 위치 좌표에 의해 특정되는 직사각형 내)에 포함되는지의 여부에 기초하여 판정이 이루어진다. 터치 조작에 관련된 위치 좌표가 문자 영역 중 하나와 겹치는 경우, 처리는 단계 1005로 진행한다. 한편, 터치 조작과 관련된 위치 좌표가 어떤 문자 영역과도 겹치지 않는 경우, 처리는 단계 1001로 되돌아간다.
단계 1005에서는, 터치 조작에 관련된 위치 좌표와 겹쳐 있는 문자 영역의 문자열이 취득된다. 문자열은, 터치 조작에 의해 선택된 문자 영역(이하, "선택 문자 영역"이라 칭함)에 대한 OCR 처리를 화상 해석 유닛(425)에 의해 실행하고 문자열을 추출함으로써 취득된다. 그리고, 단계 1006에서는, 파일명 입력 필드(701)에 현재 표시 중인 파일명이 취득된다. 계속되는 단계 1007에서는, 취득된 파일명의 내용이 "공백"인지 여부를 판정한다. 여기서 사용되는 바와 같은 파일명이 "공백"이라는 것은, 파일명 입력 필드(701)에 아무런 문자열도 표시되지 않는 공백 필드 상태를 의미한다. 취득된 파일명이 "공백"인 경우에는, 처리는 단계 1010로 진행한다. 한편, 취득된 파일명이 "공백"이 아닌 경우에는, 처리는 단계 1008로 진행한다.
단계 1008에서는, 현재의 선택 문자 영역과 1개 전의 선택 문자 영역 사이의 위치 관계에 기초하여, 양쪽의 문자 영역이 특정 방향으로 연속하고 있는지의 여부가 판정된다. 수평 기입이 일반적인 언어(예를 들어, 일본어 및 영어)의 텍스트는 좌측으로부터 우측으로 계속되기 때문에, 문자 영역이 우측 방향으로 연속되는지의 여부(현재의 선택 문자 영역이 1개 전의 선택 문자 영역의 우측에 있는지의 여부)가 체크된다. 물론, 문서의 포맷이나 사용하는 언어에 따라, 세로 방향(하측 방향)이나 좌측 방향의 연속성이 체크된다. 더 구체적으로는, 이하의 2개의 조건 하에서는, 문자 영역이 특정 방향으로 연속하고 있는지의 여부를 체크한다.
- 양쪽의 문자 영역이 동일한 기준 위치(이 예에서는, 좌측 상단 코너의 Y 좌표)를 갖는다.
- 양쪽의 문자 영역이 서로 인접하고 있다(사이에 문자 영역이 존재하지 않는다).
기준 위치의 비교에서는, 스캔 화상의 기울기 등을 고려하여, 수 픽셀 정도의 오차가 있는 기준 위치는 동일하다고 판정한다. 또한, 문자 영역의 특정한 좌표를 비교하는 대신에, 문자 영역의 특정한 변(예를 들어, 하변)의 위치를 판정을 위한 기준으로서 사용할 수 있다. 대안적으로, 인접하는 문자 영역 사이의 거리를 미리정해진 임계값과 비교하는 임계값 처리를 추가적으로 행할 수 있고, 당해 거리가 임계값 이하인 경우에만, 양쪽의 문자 영역이 서로 인접하다고 판정한다. 어떠한 미리정해진 임계값도 사용할 수 있지만, 미리정해진 임계값은 예를 들어 문자 영역의 높이의 3배 미만, 바람직하게는 문자 영역의 높이의 약 2배일 수 있다. 판정의 결과, 현재의 선택 문자 영역이 1개 전의 선택 문자 영역의 우측에 있을 경우에는, 처리는 단계 1010로 진행한다. 한편, 현재의 선택 문자 영역이 1개 전의 선택 문자 영역의 우측에 있지 않을 경우에는, 처리는 단계 1009로 진행한다. 또한, 수평 기입이 아니고 수직 기입인 경우에는, 현재의 선택 문자 영역이 1개 전의 선택 문자 영역의 하측에 있는지의 여부를 상술한 조건 하에서 체크할 수 있다.
단계 1009에서는, 단계 1006에서 취득한 파일명의 말미에 미리정해진 구획 문자를 추가하는 처리가 행해진다. 미리정해진 구획 문자로서 언더바를 예로서 설명하지만, 미리정해진 구획 문자는 이것으로 한정되지 않는다. 언더바 이외의 기호 및 문자, 예를 들어 하이픈이 사용될 수 있다. 또한, 가시적인 문자가 아닌 스페이스도 사용될 수 있다.
단계 1010에서는, 단계 1005에서 취득된 문자열(선택 문자 영역으로부터 추출된 문자열)이 파일명의 구성 요소로서 설정된다. 이때, 이미 설정된 문자열이 존재하고 있는 경우에는, 단계 1005에서 취득된 문자열이 이미 설정된 문자열의 말미에 추가된다. 그리고, 단계 1011에서는, 현재 설정되어 있는 문자열(들)이 파일명 입력 필드(701)에 표시(자동 입력)된다.
상기 설명이 파일명 생성 처리의 내용이다. 이러한 처리에 따라, 사용자에 의해 선택된 복수의 문자 영역이 연속하고 있지 않은 경우에만, 문자 영역의 문자 인식 결과 사이에 구획 문자를 삽입하고, 스캔 화상의 파일명이 생성된다.
이제, 도 8에서 나타내는 "QUOTATION_TokyoCorporation_04/14/2017"의 파일명의 생성을 위한 처리를 상기 표 1을 참고하여 설명한다. 먼저, 표 1에서의 1 내지 17의 일련 번호는 이하에 도시한 바와 같이 문자 영역과 연관지어져 있다.
1: "Q"
2: "U"
3: "O"
4: "T"
5: "A"
6: "T"
7: "I"
8: "O"
9: "N"
10: "Tokyo Corporation"
11: "Messrs."
12: "Quotation No."
13: "R-1234"
14: "Proposed Delivery Date"
15: "04/14/2017"
16: "Yokohama Corporation"
17: "Yokohama City 1000-1"
먼저, "Q"의 문자 영역에의 터치 조작을 검지하면, 그 좌표 및 "Q"의 문자가 취득된다(단계 1001 내지 1006). 이 단계에서의 파일명 입력 필드(701)는 아무런 문자열도 표시되어 있지 않고 "공백" 상태이므로(단계 1007에서 예), 파일명 입력 필드(701)에 "Q"가 표시된다(단계 1011). 프리뷰 영역(710)에서는, 사용자에 의한 터치 조작에 따라 파일명의 일부로서 "Q"가 선택된 것을 나타내기 위해서, "Q"의 문자 영역의 박스가 굵은 박스로 변경된다.
이어서, "U"의 문자 영역에의 터치 조작을 검지하면, 그 좌표와 "U"의 문자가 취득된다(단계 1001 내지 단계 1006). 그리고, 이 단계에서의 파일명 입력 필드(701)는 "Q"의 문자가 표시되고 "공백"이 아니다(단계 1007에서 "아니오"). 따라서, 현재 선택된 "U"의 문자 영역과 그 1개 전의 선택에 관련된 "Q"의 문자 영역이 서로 인접하는지의 여부가, 전술한 2개의 조건하에서 판정된다(단계 1008). 먼저, 양쪽의 문자 영역의 Y 좌표는 "5"이다(표 1 참조). 따라서, 첫 번째 조건은 만족된다. 이어서, 두 번째 조건은, 당해 Y 좌표("5") 위에 있는 모든 문자 영역을 X 좌표에 따라 분류하고, 1개 전의 선택 문자 영역과 현재의 선택 문자 영역이 분류 후의 순서에서 서로 인접하는지의 여부를 판정함으로써 체크된다. 이제, "Q"의 문자 영역의 Y 좌표 상에는, "U"의 문자 영역과 "O"의 문자 영역이 존재한다. 이들 3개의 문자 영역을 X 좌표에 따라 오름 차순으로 분류함으로써, "Q", "U" 및 "O"가 이 순서로 횡으로 정렬되고, 1개 전의 선택 문자 영역과 현재의 선택 문자 영역은 서로 인접하고 있다(단계 1008에서 예). 따라서, 파일명 입력 필드(701)에, "Q"의 문자에 계속해서 "U"의 문자가 추가된다(단계 1010). 이 시점에서, 파일명은 "QU"이다. 그리고, 문자 영역에의 터치 조작에 응답하여, 동일한 처리가 행해지고, 파일명 입력 필드(701)에 "U"의 문자에 계속해서 "O"의 문자가 추가된다(단계 1010). "T", "A", "T", "I", "O" 및 "N"의 문자 영역에도 동일한 처리가 행해진다. 이 시점에서, 파일명은 "QUOTATION"이다. 또한, 프리뷰 영역(710)에서는, "Q"의 문자 영역과 마찬가지로, "U", "O", "T", "A", "T", "I", "O" 및 "N"의 문자 영역의 박스가 굵은 박스로 변경된다.
이어서, "Tokyo Corporation"의 문자 영역에의 터치 조작을 검지하면, 그 좌표와 "Tokyo Corporation"의 문자가 취득된다(단계 1001 내지 1006). 이 경우, 현재 선택된 "Tokyo Corporation"의 문자 영역과 그 1개 전의 선택에 관련된 "N"의 문자 영역은 서로 인접하지 않는다(단계 1008에서 아니오). 따라서, 파일명 입력 필드(701)에, "QUOTATION"의 문자에 계속해서 구획 문자인 언더바 "_"가 추가 설정된다(단계 1009). 이 시점에서, 파일명은 "QUOTATION_"이다. 그 후, "TokyoCorporation"의 문자가 더 추가되고(단계 1010), 파일명은 "QUOTATION_TokyoCorporation"가 된다. 그리고, 사용자에 의한 "04/14/2017"의 문자 영역에의 터치 조작을 검지하면, 그 좌표와 "04/14/2017"의 문자가 취득된다(단계 1001 내지 1006). 현재 선택된 "04/14/2017"의 문자 영역 및 그 1개 전의 선택에 관련된 "Tokyo Corporation"의 문자 영역은 서로 인접하지 않는다(단계 1008에서 아니오). 따라서, 파일명 입력 필드(701)에, "TokyoCorporation"의 문자에 계속해서 구획 문자인 언더바 "_"가 추가 설정된다(단계 1009). 이 시점에서, 파일명은 "QUOTATION_TokyoCorporation_"이다. 그 후, "04/14/2017"의 문자가 더 추가되고(단계 1010), 최종적으로 "QUOTATION_TokyoCorporation_04/14/2017"의 파일명이 얻어진다. 또한, 프리뷰 영역(710)에서는, "Q", "U", "O", "T", "A", "T", "I", "O" 및 "N"의 문자 영역과 마찬가지로, "Tokyo Corporation"와 "04/14/2017"의 박스가 굵은 박스로 변경된다.
상기 설명이 파일명 생성 처리의 내용이다. 본 실시형태에서는, 스캔 화상 내의 문자 영역의 문자 인식 결과를 사용해서 파일명을 설정하는 상황을 예로 들어 설명했다. 그러나, 본 발명의 적용 범위는 파일명을 설정하는 상황으로 한정되지 않는다. 예를 들어, 스캔 화상의 업로드 목적지 같은 데이터 전송 목적지 설정 또는 FAX 송신이나 이메일 송신의 목적지 설정에 파일명 생성 처리를 적용할 수 있다. 이 경우, 예를 들어 도 9에 도시된 전술한 업로드 설정 화면(900)에서, 스캔 화상 내의 문자 영역의 문자 인식 결과를 폴더 경로의 후보로서 선택가능하게 표시하여, 사용자 선택에 따라서 경로명을 설정할 수 있도록 한다. 또한, 목적지 설정 화면(도시하지 않음)에서, 스캔 화상 내의 문자 영역의 문자 인식 결과를 FAX 번호나 이메일 어드레스의 후보로서 선택가능하게 표시하여, 사용자 선택에 따라서 FAX 번호나 이메일 어드레스를 설정할 수 있도록 한다. 이와 같이, 파일명 설정 이외의 상황, 예를 들어 데이터 전송 목적지 등의 설정 같은 스캔 화상에 관련되는 각종 정보(부대 정보)를 설정하는 상황에서, 본 발명은 폭넓게 적용 가능하다.
상술한 바와 같이, 본 실시형태에 따르면, 사용자는 스캔 화상 내의 문자 영역을 순서대로 선택함으로써 적절한 위치에 구획 문자가 삽입된 파일명 등을 간단하게 설정할 수 있다.
[제2 실시형태]
이어서, 제2 실시형태로서, 파일명 등에 부여하고 싶은 단어의 구성 문자가 복수의 문자 영역으로 분리되어 있는 경우에, 모든 문자 영역을 사용자가 일일이 선택할 필요 없이 문자 영역이 1개의 연속하는 문자열로서 자동 선택되는 양태에 대해서 설명한다. MFP(110)에서의 스캔 동작 제어의 플로우 같은 제1 실시형태와 공통되는 내용에 대해서는 설명을 생략한다. 이하, 본 실시형태의 특징인 파일명 생성 처리에 대해서 주로 설명한다.
도 11은, 본 실시형태에 따른, 프리뷰 표시 유닛(426)에 의한 파일명 생성 처리의 상세를 나타내는 흐름도이다. 단계 1101 내지 단계 1109의 처리는 제1 실시형태의 도 10의 플로우의 단계 1001 내지 단계 1009와 동일하다. 도 10의 플로우와의 차이는, 파일명이 "공백"이라고 판정(단계 1107에서 예)된 후의 처리 및 구획 문자가 추가(단계 1109)된 후의 처리이다. 즉, 단계 1110에서는, 프리뷰 표시 유닛(426)은, 현재 선택된 문자 영역에 연속하고 있다고 판정된 문자 영역의 문자열을, 파일명을 구성하는 문자열로서 자동으로 선택하는 처리를 행한다. 도 12는 연속하는 문자 영역의 문자열을 자동으로 선택하는 처리의 상세를 나타내는 흐름도이다. 이하, 도 12의 플로우에 따라 설명한다.
단계 1201에서는, 현재의 선택 문자 영역으로부터 추출된 문자열이, 전용 버퍼(이하, "선택 문자열 버퍼"라 칭함)에 저장된다. 계속되는 단계 1202에서는, 미리 준비된 사전 데이터를 참조하여, 사전 데이터가 선택 문자열 버퍼에 저장되어 있는 문자열의 처음과 일치하는 단어를 포함하는지의 여부가 판정된다. 이 경우, 사전 데이터는 예를 들어 추가 기능 모듈(420)에 미리 저장되어 있는 것으로 한다. 사전 데이터는, 예를 들어 일반적인 단어의 용어집이나 사용자가 미리 원하는 단어를 등록해서 생성된 독자적인 용어집, 혹은 사용자가 파일명에 사용한 문자열을 저장한 이력 정보로 구성된다. 표 2는 사전 데이터의 일례를 나타낸다.
Figure pat00002
이제, 전술한 도 7b의 프리뷰 화면(700)에서, "Q"의 문자 영역이 선택되어 있는 것으로 한다. 이 경우, "Q"의 문자 영역으로부터 추출된 문자열인 "Q"가, 표 2에 나타내는 사전 데이터 내의 각 단어와 비교되고, 처음에서 일치하는 단어가 있는지의 여부가 판정된다. 이 예에서는, 번호 2의 "쿼테이션"이 처음에서 일치한다고 판정된다. 이렇게, 사전 데이터가 처음에서 일치하는 단어를 포함하는 경우, 처리는 단계 1203로 진행한다. 한편, 사전 데이터가 처음에서 일치하는 단어를 포함하지 않는 경우, 본 처리는 종료되고, 처리는 도 11의 플로우의 단계 1111로 진행한다.
단계 1203에서는, 현재 선택된 문자 영역에 연속하는 문자 영역이 존재하는지의 여부가 판정된다. 본 실시형태에서는, 우측에 연속하는 문자 영역이 있는지의 여부가, 도 10의 플로우의 단계 1008의 처리에서 사용된 것과 동일한 방법에 따라 판정된다. 연속하는 문자 영역이 존재하는 경우에는, 처리는 단계 1204로 진행한다. 한편, 연속하는 문자 영역이 존재하지 않는 경우에는, 본 처리는 종료되고, 처리는 도 11의 플로우의 단계 1111로 진행한다.
단계 1204에서는, 연속하고 있다고 판정된 문자 영역에 대하여 OCR 처리를 행하고, OCR 처리에 의해 취득된 문자열이 상술한 선택 문자열 버퍼에 추가로 저장된다. 이에 의해, 현재 선택된 문자 영역에 연속하고 있는 문자 영역의 문자열이, 현재 선택된 문자 영역의 문자열에 계속하여 선택 문자열 버퍼에 저장된다. 그 후, 처리는 단계 1202로 되돌아가고, 추가 저장된 문자열을 포함하는 선택 문자열 버퍼에 저장된 문자열의 처음과 일치하는 단어가 사전 데이터 내에 존재하는지의 여부가 판정된다. 연속하는 문자열이 존재하지 않는 시점에서, 본 처리가 종료된다. 이렇게 해서, 현재 선택된 문자 영역에 연속하는 모든 문자 영역으로부터 추출된 문자열이 선택 문자열 버퍼 내에 순차 저장된다.
상기 설명이 문자열 자동 선택 처리의 내용이다. 이에 의해, 예를 들어 "Q"의 문자 영역이 선택된 경우에는, "Q"의 우측에 연속하고 있는 "U" 및 "O"의 문자 영역도 자동으로 선택된다. 즉, 사용자는, "U"의 문자 영역과 "O"의 문자 영역의 터치 조작 및 선택을 생략할 수 있다. 도 11의 플로우로 되돌아 가서 설명한다.
단계 1111에서는, 선택 문자열 버퍼 내에 저장되어 있는 모든 문자열이 파일명의 구성 요소로서 설정된다. 이때, 파일명 입력 필드(701)가 이미 설정된 문자열을 포함하는 경우에는, 선택 문자열 버퍼에 저장된 문자열이 이미 설정된 문자열의 말미에 추가된다. 그리고, 단계 1112에서는, 단계 1111에서의 추가 설정 후의 문자열이 파일명 입력 필드(701)에 표시된다.
상기 설명이 본 실시형태에 따른 파일명 생성 처리의 내용이다.
<변형예>
일부 경우에, 상술한 방식으로 취득된 파일명은 사용자의 의도에 반해서 구획 문자를 포함하지 않을 수 있다. 따라서, 사용자는 구획 문자를 수동으로 삽입해서 파일명을 수정할 수 있도록 해도 된다. 이 경우, 예를 들어 문자 영역이 연속하고 있다는 판정 결과에 기초하여 문자 영역 사이에 구획 문자가 삽입되어 있지 않은 경우 문자 영역 사이에 구획 문자를 삽입하는 버튼을 표시한다. 전술한 도 7b의 예에서는, 프리뷰 영역(710) 내에서, "Q"의 문자 영역과 "U"의 문자 영역 사이 및 "U"의 문자 영역과 "O"의 문자 영역 사이에 이 버튼을 표시한다. 그리고, 사용자가 당해 버튼을 누르면, 파일명을 구성하는 문자열에 대응하는 위치에 구획 문자가 삽입되도록 한다. 이때, 당해 버튼을 누를 때마다, 구획 문자의 종류(예를 들어, 4 종류: 하이픈, 언더바, 스페이스, 및 구획 문자 없음)가 전환될 수 있다. 또한, 프리뷰 영역(710) 내에 버튼을 제공하는 대신, 파일명 입력 필드(701)에 표시되는 문자열에 구획 문자의 삽입을 위한 후보 위치를 나타내는 풍선을 표시할 수 있다. 또한, 본 변형예는 제1 실시형태에도 적용 가능하다.
본 실시형태에 따르면, 파일명 등에 부여하고 싶은 단어의 구성 문자가 복수의 문자 영역으로 분리되어 있는 경우에는, 그 모든 문자 영역을 사용자가 선택할 필요 없이 문자 영역을 1개의 연속하는 문자열로서 자동으로 선택한다. 이에 의해, 사용자는 더 효율적으로 스캔 화상에 대한 파일명 등을 설정할 수 있게 된다.
(다른 실시형태)
본 발명의 실시형태(들)는, 전술한 실시형태(들) 중 하나 이상의 기능을 실행하기 위해 저장 매체(보다 완전하게는 '비일시적인 컴퓨터 판독가능한 저장 매체'라 칭할수도 있음)에 기록된 컴퓨터 실행가능 명령어(예를 들어, 하나 이상의 프로그램)를 판독 및 실행하고 그리고/또는 전술한 실시형태(들) 중 하나 이상의 기능을 실행하는 하나 이상의 회로(예를 들어, 주문형 집적 회로(ASIC))를 포함하는 시스템 또는 장치의 컴퓨터에 의해, 그리고 예를 들어 전술한 실시형태(들) 중 하나 이상의 기능을 실행하기 위해 저장 매체로부터 컴퓨터 실행가능 명령어를 판독 및 실행함으로써 그리고/또는 전술한 실시형태(들) 중 하나 이상의 기능을 실행하기 위해 하나 이상의 회로를 제어함으로써 상기 시스템 또는 장치의 컴퓨터에 의해 실행되는 방법에 의해 실현될 수도 있다. 컴퓨터는 하나 이상의 프로세서(예를 들어, 중앙 처리 유닛(CPU), 마이크로 처리 유닛(MPU))를 포함할 수 있고 컴퓨터 실행가능 명령어를 판독 및 실행하기 위한 별도의 컴퓨터 또는 별도의 프로세서의 네트워크를 포함할 수 있다. 컴퓨터 실행가능 명령어는 예를 들어 네트워크 또는 저장 매체로부터 컴퓨터에 제공될 수 있다. 저장 매체는, 예를 들어 하드 디스크, 랜덤 액세스 메모리(RAM), 리드 온리 메모리(ROM), 분산형 컴퓨팅 시스템의 스토리지, 광디스크(예를 들어, 콤팩트 디스크(CD), 디지털 다기능 디스크(DVD) 또는 블루레이 디스크(BD)TM), 플래시 메모리 디바이스, 메모리 카드 등 중 하나 이상을 포함할 수 있다.
(기타의 실시예)
본 발명은, 상기의 실시형태의 1개 이상의 기능을 실현하는 프로그램을, 네트워크 또는 기억 매체를 개입하여 시스템 혹은 장치에 공급하고, 그 시스템 혹은 장치의 컴퓨터에 있어서 1개 이상의 프로세서가 프로그램을 읽어 실행하는 처리에서도 실현가능하다.
또한, 1개 이상의 기능을 실현하는 회로(예를 들어, ASIC)에 의해서도 실행가능하다.
본 발명에 따르면, 스캔 화상의 문자 인식 결과를 사용함으로써, 사용자는 간단한 조작으로 스캔 화상에 대한 파일명 등을 설정할 수 있다.
본 발명을 예시적인 실시형태를 참고하여 설명하였지만, 본 발명은 개시된 예시적인 실시형태로 한정되지 않음을 이해해야 한다. 이하의 청구항의 범위는 이러한 모든 변형과 동등한 구조 및 기능을 포함하도록 최광의로 해석되어야 한다.

Claims (15)

  1. 문서를 스캔함으로써 얻어진 스캔 화상에 대하여 미리정해진 처리를 행하는 장치이며,
    상기 미리정해진 처리를 행하기 위한 UI 화면을 표시하도록 구성된 표시 제어 유닛으로서, 상기 UI 화면은 상기 스캔 화상 내의 문자 영역을 사용자가 선택가능하게 표시하는, 표시 제어 유닛; 및
    상기 UI 화면을 통해 사용자가 선택한 문자 영역에 대하여 OCR 처리를 행하고, 상기 OCR 처리에서 추출된 문자열을 사용해서 상기 미리정해진 처리를 위한 부대 정보를 설정하도록 구성된 설정 유닛을 포함하며,
    상기 설정 유닛은, 사용자가 복수의 문자 영역을 선택한 경우, 선택된 상기 복수의 문자 영역 사이의 위치 관계에 기초하여 상기 추출된 문자열 사이에 구획 문자가 삽입되어야 하는지 여부를 판단하고, 구획 문자가 삽입되어야 한다고 판단되는 경우, 상기 추출된 문자열 사이에 구획 문자를 삽입하는, 장치.
  2. 제1항에 있어서,
    상기 설정 유닛은, 현재 사용자에 의해 선택된 문자 영역 및 현재 선택된 상기 문자 영역 바로 직전에 선택된 문자 영역이 특정 방향으로 연속하고 있지 않은 경우, 상기 구획 문자를 삽입하는, 장치.
  3. 제2항에 있어서,
    상기 설정 유닛은, 현재 선택된 문자 영역에서의 기준 위치가 상기 현재 선택된 문자 영역 바로 직전에 선택된 문자 영역에서의 기준 위치와 동일한지의 여부 및 상기 현재 선택된 문자 영역이 상기 현재 선택된 문자 영역 바로 직전에 선택된 문자 영역에 인접하고 있는지 여부에 기초하여, 상기 현재 선택된 문자 영역 및 상기 현재 선택된 문자 영역 바로 직전에 선택된 문자 영역이 특정 방향으로 연속하고 있는지 여부를 판정하는, 장치.
  4. 제3항에 있어서,
    상기 설정 유닛은, 현재 선택된 문자 영역과 상기 현재 선택된 문자 영역 바로 직전에 선택된 문자 영역 사이에 다른 문자 영역이 존재하지 않는 경우, 상기 현재 선택된 문자 영역이 상기 현재 선택된 문자 영역 바로 직전에 선택된 문자 영역에 인접하고 있다고 판정하는, 장치.
  5. 제4항에 있어서,
    상기 설정 유닛은, 현재 선택된 문자 영역이 상기 현재 선택된 문자 영역 바로 직전에 선택된 문자 영역에 인접하고 있다고 판정되는 경우, 양쪽의 문자 영역의 사이의 거리를 미리정해진 임계값과 비교하고, 상기 거리가 상기 미리정해진 임계값 이하인 경우에만, 양쪽의 문자 영역이 서로 인접하고 있다고 판정하는, 장치.
  6. 제5항에 있어서,
    상기 미리정해진 임계값은, 사용자가 선택한 문자 영역의 높이의 3배 미만인, 장치.
  7. 제1항에 있어서,
    상기 설정 유닛은, 복수의 단어가 등록된 사전 데이터를 가지며,
    상기 사전 데이터가 현재 사용자에 의해 선택된 문자 영역으로부터 추출된 문자열의 처음과 일치하는 단어를 포함하는 경우, 상기 선택된 문자 영역과 특정 방향으로 연속하고 있는 문자 영역에 대하여 상기 OCR 처리를 더 행하고, 상기 OCR 처리에서 추출된 문자열을 사용해서 상기 부대 정보를 설정하는, 장치.
  8. 제2항에 있어서,
    상기 특정 방향은, 상기 문서의 포맷 또는 상기 문서에서 사용되는 언어에 기초하여 결정되는, 장치.
  9. 제1항에 있어서,
    상기 표시 제어 유닛은 상기 설정 유닛에 의해 설정된 부대 정보를 구성하는 문자열 사이에 구획 문자를 삽입하기 위한 버튼을 표시하며,
    상기 설정 유닛은 사용자에 의해 눌러진 상기 버튼의 위치에 구획 문자를 삽입하는, 장치.
  10. 제1항에 있어서,
    상기 미리정해진 처리는 상기 스캔 화상에 대한 데이터를 저장하는 처리이며,
    상기 부대 정보는 상기 스캔 화상의 저장시의 파일명인, 장치.
  11. 제1항에 있어서,
    상기 미리정해진 처리는 미리정해진 장소에 상기 스캔 화상에 대한 데이터를 업로드하는 처리이며,
    상기 부대 정보는 업로드 목적지를 나타내는 경로명인, 장치.
  12. 제1항에 있어서,
    상기 미리정해진 처리는 팩시밀리를 통해 상기 스캔 화상에 대한 데이터를 송신하는 처리이며,
    상기 부대 정보는 팩시밀리 번호인, 장치.
  13. 제1항에 있어서,
    상기 미리정해진 처리는 이메일에 의해 상기 스캔 화상에 대한 데이터를 송신하는 처리이며,
    상기 부대 정보는 이메일 어드레스인, 장치.
  14. 문서를 스캔함으로써 얻어진 스캔 화상에 대하여 미리정해진 처리를 행하는 장치의 제어 방법이며,
    표시 제어 유닛에 의해, 상기 미리정해진 처리를 행하는 UI 화면을 표시하는 단계로서, 상기 UI 화면은 상기 스캔 화상 내의 문자 영역을 사용자가 선택 가능하게 표시하는, 표시하는 단계; 및
    설정 유닛에 의해, 상기 UI 화면을 통해 사용자가 선택한 문자 영역에 대하여 OCR 처리를 행하고, 상기 OCR 처리에서 추출된 문자열을 사용해서 상기 미리정해진 처리를 위한 부대 정보를 설정하는 단계를 포함하며,
    상기 설정하는 단계에서는, 사용자가 복수의 문자 영역을 선택한 경우, 선택된 상기 복수의 문자 영역 사이의 위치 관계에 기초하여 상기 추출된 문자열 사이에 구획 문자가 삽입되어야 하는지 여부를 판단하고, 구획 문자를 삽입해야 한다고 판단되는 경우, 상기 추출된 문자열 사이에 구획 문자를 삽입하는, 제어 방법.
  15. 문서를 스캔함으로써 얻어진 스캔 화상에 대하여 미리정해진 처리를 행하기 위한 장치의 제어 방법을 컴퓨터가 행하게 하는 프로그램을 저장하는 비일시적인 컴퓨터 판독가능한 저장 매체이며,
    상기 제어 방법은,
    표시 제어 유닛에 의해, 상기 미리정해진 처리를 행하는 UI 화면을 표시하는 단계로서, 상기 UI 화면은 상기 스캔 화상 내의 문자 영역을 사용자가 선택 가능하게 표시하는, 표시하는 단계; 및
    설정 유닛에 의해, 상기 UI 화면을 통해 사용자가 선택한 문자 영역에 대하여 OCR 처리를 행하고, 상기 OCR 처리에서 추출된 문자열을 사용해서 상기 미리정해진 처리를 위한 부대 정보를 설정하는 단계를 포함하며,
    상기 설정하는 단계에서는, 사용자가 복수의 문자 영역을 선택한 경우, 선택된 상기 복수의 문자 영역 사이의 위치 관계에 기초하여 상기 추출된 문자열 사이에 구획 문자가 삽입되어야 하는지 여부를 판단하고, 구획 문자가 삽입되어야 한다고 판단되는 경우, 상기 추출된 문자열 사이에 구획 문자를 삽입하는, 비일시적인 컴퓨터 판독가능한 저장 매체.
KR1020180094148A 2017-08-22 2018-08-13 스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체 KR102408019B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2017-159540 2017-08-22
JP2017159540A JP6891073B2 (ja) 2017-08-22 2017-08-22 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム

Publications (2)

Publication Number Publication Date
KR20190021161A true KR20190021161A (ko) 2019-03-05
KR102408019B1 KR102408019B1 (ko) 2022-06-14

Family

ID=65435189

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180094148A KR102408019B1 (ko) 2017-08-22 2018-08-13 스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체

Country Status (4)

Country Link
US (1) US10860785B2 (ko)
JP (1) JP6891073B2 (ko)
KR (1) KR102408019B1 (ko)
CN (1) CN109426821B (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7062388B2 (ja) * 2017-08-22 2022-05-06 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP7102284B2 (ja) * 2018-08-23 2022-07-19 株式会社Pfu ファイル管理装置、ファイル管理方法、及びプログラム
JP7330742B2 (ja) * 2019-04-19 2023-08-22 キヤノン株式会社 スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム
JP7225017B2 (ja) * 2019-04-19 2023-02-20 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7297510B2 (ja) * 2019-04-19 2023-06-26 キヤノン株式会社 ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム
JP7387282B2 (ja) * 2019-04-19 2023-11-28 キヤノン株式会社 スキャン画像のプレビュー表示を行なう画像処理装置、その制御方法及びプログラム
JP7358663B2 (ja) * 2019-04-19 2023-10-10 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7391672B2 (ja) * 2020-01-21 2023-12-05 キヤノン株式会社 文書を電子化するための画像処理システム、その制御方法及びプログラム
JP7400548B2 (ja) * 2020-03-03 2023-12-19 富士フイルムビジネスイノベーション株式会社 情報処理装置、画像処理装置、情報処理システム、及びプログラム
JP7434001B2 (ja) 2020-03-13 2024-02-20 キヤノン株式会社 情報処理装置、プログラム、情報処理方法
JP7490415B2 (ja) 2020-03-30 2024-05-27 キヤノン株式会社 サーバー、情報処理方法、プログラム
JP2021184190A (ja) * 2020-05-22 2021-12-02 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
JP2022091530A (ja) * 2020-12-09 2022-06-21 キヤノン株式会社 情報処理装置、画像処理システム、制御方法、並びにプログラム
JP2022095391A (ja) * 2020-12-16 2022-06-28 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
JP2023040888A (ja) * 2021-09-10 2023-03-23 キヤノン株式会社 画像処理システム、サーバとその制御方法、及びプログラム
JP2023160049A (ja) * 2022-04-21 2023-11-02 キヤノン株式会社 情報処理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505167B2 (en) * 2003-08-07 2009-03-17 Ricoh Company, Limited Information processing apparatus, method, and computer product, for file naming
US20130329263A1 (en) * 2012-06-06 2013-12-12 Canon Kabushiki Kaisha Image processing apparatus, and image processing method and program therefor
US20140141836A1 (en) * 2009-07-18 2014-05-22 Abbyy Software Ltd. Entering Information Through an OCR-Enabled Viewfinder

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5689342A (en) * 1994-11-17 1997-11-18 Canon Kabushiki Kaisha Image processing method and apparatus which orders text areas which have been extracted from an image
CN100382096C (zh) * 2003-08-20 2008-04-16 奥西-技术有限公司 文档扫描设备及方法
JP2008071050A (ja) * 2006-09-13 2008-03-27 Sharp Corp 情報処理端末装置、情報処理装置、ファイル管理サーバ、情報処理システム、ファイル名自動生成方法、プログラムおよび記録媒体
JP2008176624A (ja) 2007-01-19 2008-07-31 Seiko Epson Corp 文字認識結果の管理装置およびその方法並びにコンピュータプログラム
JP5031472B2 (ja) * 2007-07-23 2012-09-19 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US9129036B2 (en) * 2008-02-22 2015-09-08 Tigerlogic Corporation Systems and methods of identifying chunks within inter-related documents
US8566088B2 (en) * 2008-11-12 2013-10-22 Scti Holdings, Inc. System and method for automatic speech to text conversion
US8373724B2 (en) * 2009-01-28 2013-02-12 Google Inc. Selective display of OCR'ed text and corresponding images from publications on a client device
JP5430312B2 (ja) * 2009-09-15 2014-02-26 シャープ株式会社 データ処理装置、データ名生成方法及びコンピュータプログラム
JP5594269B2 (ja) * 2011-09-29 2014-09-24 コニカミノルタ株式会社 ファイル名作成装置、画像形成装置、およびファイル名作成プログラム
CN102831106A (zh) * 2012-08-27 2012-12-19 腾讯科技(深圳)有限公司 一种移动终端的电子文档生成方法及移动终端
KR102147935B1 (ko) * 2013-08-29 2020-08-25 삼성전자주식회사 데이터 처리 방법 및 그 전자 장치
JP2015215878A (ja) * 2014-04-21 2015-12-03 株式会社リコー 画像処理装置及び画像処理システム
JP6090269B2 (ja) * 2014-09-08 2017-03-08 コニカミノルタ株式会社 電子文書生成装置、プログラムおよび電子文書生成システム
JP6220770B2 (ja) * 2014-12-12 2017-10-25 株式会社エヌ・ティ・ティ・データ 帳票定義装置、帳票定義方法、及び帳票定義プログラム
JP6762722B2 (ja) * 2016-01-18 2020-09-30 キヤノン株式会社 情報処理装置、制御方法、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505167B2 (en) * 2003-08-07 2009-03-17 Ricoh Company, Limited Information processing apparatus, method, and computer product, for file naming
US20140141836A1 (en) * 2009-07-18 2014-05-22 Abbyy Software Ltd. Entering Information Through an OCR-Enabled Viewfinder
US20130329263A1 (en) * 2012-06-06 2013-12-12 Canon Kabushiki Kaisha Image processing apparatus, and image processing method and program therefor
JP2013254321A (ja) * 2012-06-06 2013-12-19 Canon Inc 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
CN109426821B (zh) 2023-09-19
CN109426821A (zh) 2019-03-05
US10860785B2 (en) 2020-12-08
US20190065451A1 (en) 2019-02-28
JP6891073B2 (ja) 2021-06-18
KR102408019B1 (ko) 2022-06-14
JP2019041150A (ja) 2019-03-14

Similar Documents

Publication Publication Date Title
KR102408019B1 (ko) 스캔 화상에 대해 파일명 등을 설정하기 위한 장치, 그 제어 방법 및 저장 매체
US10984232B2 (en) Apparatus for setting file name and the like for scan image, control method thereof, and storage medium
US11386046B2 (en) Apparatus for setting file name for scan image, method of controlling same, and storage medium
US10652409B2 (en) Apparatus for setting information relating to scanned image, method and storage medium
US10929657B2 (en) Apparatus, method, and storage medium for setting information related to scanned image
US10574839B2 (en) Image processing apparatus, method and storage medium for acquiring character information from scanned image
US11062134B2 (en) Apparatus for setting file name and the like for scan image, control method thereof, and storage medium
US11144189B2 (en) Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas
US11652932B2 (en) Image processing apparatus for setting a folder path by using a character string in a document
US20240073330A1 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US11252287B2 (en) Image processing apparatus that displays guidance for user operation, control method thereof and storage medium
US11265431B2 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
US11575799B2 (en) Image processing apparatus for setting property including character strings and separators to scanned image, control method thereof and storage medium
JP7476557B2 (ja) 機器、処理実行システム、処理実行方法、プログラム
JP2019068323A (ja) スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
JP7150967B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
US11012584B2 (en) Image forming apparatus, method of processing image, and recording medium storing image processing program
US20240176567A1 (en) Image processing apparatus, image processing method, and storage medium capable of storing electronic file including mask region with appropriate name

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant