KR20070067753A - Image forming device capable of recevering damaged text and method thereof - Google Patents

Image forming device capable of recevering damaged text and method thereof Download PDF

Info

Publication number
KR20070067753A
KR20070067753A KR1020050128936A KR20050128936A KR20070067753A KR 20070067753 A KR20070067753 A KR 20070067753A KR 1020050128936 A KR1020050128936 A KR 1020050128936A KR 20050128936 A KR20050128936 A KR 20050128936A KR 20070067753 A KR20070067753 A KR 20070067753A
Authority
KR
South Korea
Prior art keywords
word
character
data
document
unit
Prior art date
Application number
KR1020050128936A
Other languages
Korean (ko)
Inventor
박인창
이금옥
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050128936A priority Critical patent/KR20070067753A/en
Publication of KR20070067753A publication Critical patent/KR20070067753A/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32609Fault detection or counter-measures, e.g. original mis-positioned, shortage of paper
    • H04N1/32646Counter-measures
    • H04N1/32667Restarting a communication or performing a recovery operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

An image forming apparatus having a function of recovering a damaged character included in a document and a damaged character recovering method of the image forming apparatus are provided to recover a damaged character by using dictionary data and weight data to improve character recovery performance. An image forming apparatus having a function of recovering a damaged character includes a scanning unit(120), a character recognition unit(170), a dictionary data unit(141), a weight data unit(143), and a controller(150). The scanning unit irradiates light to a document to generate scan data. The character recognition unit extracts a text region from the scan data and converts data of the text region into text data. The dictionary data unit stores a plurality of words. The weight data unit stores information for applying weights to the plurality of words. The controller searches the dictionary data unit for at least one word including a damaged character of the document in order to recover the damaged character, applies a weight to the searched word by using the information stored in the weight data unit, selects a word for recovering the damaged character, and provides the selected word to the character recognition unit.

Description

문자 복구 기능을 갖는 화상형성장치 및 그 방법{Image forming device capable of recevering damaged text and method thereof} Image forming device capable of recevering damaged text and method

도 1은 본 발명에 따른 문자 복구 기능을 갖는 화상형성장치를 나타내는 블럭도, 그리고1 is a block diagram showing an image forming apparatus having a character recovery function according to the present invention; and

도 2는 본 발명에 따른 문자 복구 기능을 갖는 화상형성장치의 동작 설명에 제공되는 흐름도이다.2 is a flowchart provided to explain the operation of the image forming apparatus having the character recovery function according to the present invention.

* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

110 : 패널조작부 120 : 스캐닝부110: panel operation unit 120: scanning unit

130 : 휘발성메모리 140 : 비휘발성메모리130: volatile memory 140: non-volatile memory

150 : 제어부 160 : 인터페이스부150 control unit 160 interface unit

170 : 문자인식부 180 : 프린터엔진 170: character recognition unit 180: printer engine

본 발명은 문자 복구 기능을 갖는 화상형성장치 및 그 방법에 관한 것으로, 더욱 상세하게는 문서내의 훼손된 문자를 복구하여 출력하는 문자 복구 기능을 갖는 화상형성장치 및 그 방법에 관한 것이다.The present invention relates to an image forming apparatus having a character restoring function and a method thereof, and more particularly, to an image forming apparatus having a character restoring function for recovering and outputting corrupted characters in a document.

통상 복사기, 복합기와 같은 화상형성장치는 스캐닝 유닛을 구비하여 복사하고자 하는 문서에 빛을 조사하고 반사된 빛을 광전변환하여 스캔 데이터를 생성하고, 생성된 스캔 데이터를 이미지 처리하여 인쇄 데이터를 생성하고 엔진 유닛을 통해 용지에 출력하는 장치이다. In general, an image forming apparatus such as a copier and a multifunction printer includes a scanning unit to irradiate light onto a document to be copied and photoelectrically convert the reflected light to generate scan data, and to generate print data by image processing the generated scan data. It is a device that outputs to paper through the engine unit.

문서가 이러한 화상형성장치를 통해 반복적으로 복사될 경우 또는 문서가 여러 가지 이유로 손상된 경우, 문서에 포함된 문자가 훼손되는 경우가 많다. 이경우 복사된 문서가 최초의 원본 문서와는 달리 가독성이 저하된다. When a document is repeatedly copied through such an image forming apparatus or when the document is damaged for various reasons, the characters contained in the document are often damaged. In this case, the copied document is not as readable as the original document.

손상되지 않은 원본 문서를 입수할 수 있는 경우에는 원본 문서를 사용하여 복사하는 것이 가능하나 원본 문서 자체가 손상되거나 원본 문서를 입수할 수 없는 경우에는 가독성이 저하되므로 문서 복사가 곤란한 문제점이 있다.If the original document is intact, it is possible to copy using the original document, but if the original document itself is damaged or cannot be obtained, copying of the document is difficult because the readability is reduced.

한편, 복사된 문서의 가독성이 저하된 경우 이를 향상시키기 위해 OCR(Optical Character Reader)과 같은 문자인식기를 사용하여 스캔 데이터에서 문자 부분을 추출하고 텍스트 데이터로 변환한 후 사전 데이터를 이용하여 훼손된 문자를 추정하는 방법이 있다.Meanwhile, in order to improve the readability of the copied document, a character recognizer such as an OCR (Optical Character Reader) is used to extract the character portion from the scanned data, convert it to text data, and then use the dictionary data to replace the damaged character. There is a method of estimating.

문자인식기에서 사용하는 사전 데이터는, 다수의 단어를 검색이 용이하도록 데이터 베이스화하여 저장한 것으로서 검색을 통해 훼손된 문자 부분의 앞뒤 문자를 포함하는 단어를 추천받는 방식으로 문자를 복구한다. The dictionary data used in the character recognizer stores a plurality of words in a database for easy retrieval, and recovers the characters in such a manner that a word including a character before and after the damaged character is recommended through the retrieval.

일반적인 문자인식기는 사전 데이터의 구성에 따라 그 정확성과 효율성이 결정된다. 즉, 사전 데이터의 양이 커지면 문자인식기의 정확성은 높아지나 그 저장 용량이 증가하고 검색 속도가 매우 떨어지는 단점이 있다. 그러나, 사전 데이터의 양이 적어지면 검색 속도는 개선되나 정확성이 낮아지는 단점이 있다.The general character recognizer determines the accuracy and efficiency of the dictionary data. That is, if the amount of dictionary data is large, the accuracy of the character recognizer is increased, but the storage capacity thereof is increased and the search speed is very low. However, if the amount of dictionary data is small, the search speed is improved, but the accuracy is low.

또한, 문자인식기에 의한 문자 추정시 문자의 훼손 정도가 심한 경우 사전 데이터 검색에 따라 다수 개의 문자가 추천되는 등 경우에 따라 적절한 문자 복구가 어려운 문제점이 있다. In addition, when the character damage is severe when estimating the character by the character recognizer, it is difficult to properly recover the character in some cases, such as recommending a plurality of characters according to the prior data search.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 복사 대상 문서의 훼손된 문자를 효율적으로 복구하는 문자 복구 기능을 갖는 화상형성장치 및 그 방법을 제공함에 있다.SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and an object of the present invention is to provide an image forming apparatus and method having a character recovery function for efficiently recovering damaged characters of a copy target document.

상기 목적을 달성하기 위한 본 발명에 따른 문자 복구 기능을 갖는 화상형성장치는, 문서에 광을 투사하여 스캔 데이터를 생성하는 스캐닝부, 생성된 상기 스캔 데이터 중 문자 영역을 추출하고, 상기 문자 영역의 데이터를 텍스트 데이터로 변환하는 문자인식부, 복수의 단어를 저장하는 사전 데이터부, 상기 복수의 단어에 대한 가중치 적용을 위한 정보를 저장하는 가중치 데이터부, 및 상기 문서에 포함된 훼손된 문자를 복구하기 위해, 상기 사전 데이터부로부터 상기 문자를 포함하는 것으로 추정되는 적어도 하나의 단어를 검색하고, 상기 가중치 데이터부에 저장된 정보를 사용하여 검색된 상기 적어도 하나의 단어에 대해 가중치를 적용하고 상기 문자 복구를 위한 단어를 선택하여 상기 문자인식부에 제공하는 제어부를 포함한다. An image forming apparatus having a character restoring function according to the present invention for achieving the above object comprises: a scanning unit for projecting light onto a document to generate scan data, extracting a character region from the generated scan data, A character recognition unit for converting data into text data, a dictionary data unit for storing a plurality of words, a weight data unit for storing information for applying weights to the plurality of words, and recovering damaged characters included in the document To retrieve at least one word estimated from the dictionary data portion that includes the character, apply weights to the at least one word retrieved using information stored in the weight data portion, And a controller for selecting a word and providing the word to the character recognition unit.

또한, 상기 가중치 데이터부에 저장되는 상기 정보는 상기 각 단어에 대응하 여 저장되며, 상기 각 단어가 기존 복사 문서에 나타난 빈도 수, 상기 단어가 나타난 상기 기존 복사 문서의 개수, 상기 단어가 나타난 상기 기존 복사 문서의 최근 복사 일자 중 적어도 하나를 포함하는 것이 바람직하다. The information stored in the weight data unit is stored in correspondence with each word, the frequency of each word appearing in an existing copy document, the number of the existing copy document in which the word appears, and the word in which the word appears. It is preferable to include at least one of the latest copy dates of the existing copy document.

여기서, 상기 사전 데이터부는 네트워크를 통해 연결되는 외부장치에 구비되고, 상기 제어부는 상기 외부장치와의 통신을 통해 상기 적어도 하나의 단어를 검색하는 것이 바람직하다. The dictionary data unit may be provided in an external device connected through a network, and the controller may search for the at least one word through communication with the external device.

한편, 본 발명에 따른 화상형성장치의 문자 복구 방법은, 문서에 광을 투사하여 스캔 데이터를 생성하는 단계, 생성된 상기 스캔 데이터 중 문자 영역을 추출하여 텍스트 데이터로 변환하는 단계, 및 상기 문서에 포함된 문자 중 훼손된 문자를 포함하는 것으로 추정되는 적어도 하나의 단어를 사전 데이터로부터 검색하고, 검색된 상기 적어도 하나의 단어에 대한 기저장된 정보를 이용하여 소정의 가중치를 적용하고 상기 문자 복구를 위한 단어를 선택하는 단계를 포함한다. On the other hand, the character recovery method of the image forming apparatus according to the present invention comprises the steps of: generating a scan data by projecting light on a document, extracting a character region of the generated scan data to convert it into text data; and Search the dictionary data for at least one word estimated to include damaged characters among the included characters, apply a predetermined weight using pre-stored information on the found at least one word, and search for the word for the character recovery. Selecting.

여기서, 상기 문서에 포함된 단어, 상기 단어가 나타난 빈도 수, 상기 단어가 포함된 문서의 개수, 상기 문서의 복사 일자 중 적어도 하나를 이용하여 상기 가중치 적용을 위한 상기 정보로서 업데이트 하는 단계를 더 포함하는 것이 바람직하다. The method may further include updating as the information for applying the weight using at least one of a word included in the document, a frequency of occurrence of the word, a number of documents including the word, and a copy date of the document. It is desirable to.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다. Hereinafter, with reference to the drawings will be described the present invention in more detail.

도 1은 본 발명에 따른 문자 복구 기능을 갖는 화상형성장치를 나타내는 블럭도이다. 도 1은 화상형성장치 중 본 발명에 따른 문자 복구 기능과 관련된 블록만 도시한 도면으로서, 그 외의 블록에 대한 도시는 설명의 편의상 생략한다.1 is a block diagram showing an image forming apparatus having a character recovery function according to the present invention. FIG. 1 is a view illustrating only blocks related to a character restoring function according to the present invention among the image forming apparatuses, and other blocks are omitted for convenience of description.

도면을 참조하면, 본 화상형성장치는 패널조작부(OPE(110)), 스캐닝부(120), 휘발성메모리(130), 비휘발성메모리(140), 제어부(150), 인터페이스부(160), 문자인식부(170), 및 프린터엔진(180)을 포함한다. Referring to the drawings, the image forming apparatus includes a panel manipulation unit OPE 110, a scanning unit 120, a volatile memory 130, a nonvolatile memory 140, a control unit 150, an interface unit 160, and a character. Recognizing unit 170, and a printer engine 180.

패널조작부(OPE)(110)는 다수의 숫자키와 기능키를 포함하는 입력부(미도시)를 구비하여, 사용자의 키 조작에 의해 발생되는 제어신호를 제어부(150)로 인가한다. 또한, 패널조작부(OPE)(220)는 화상형성장치의 동작상태를 표시하기 위한 LCD(미도시)를 구비한다. The panel operation unit (OPE) 110 includes an input unit (not shown) including a plurality of numeric keys and function keys, and applies a control signal generated by a user's key operation to the controller 150. In addition, the panel manipulation unit (OPE) 220 includes an LCD (not shown) for displaying an operation state of the image forming apparatus.

한편, 본 발명에 따른 문자 복구 기능을 갖는 화상형성장치(100)의 패널조작부(110)는 입력부(미도시)에 문자 복구 기능 선택을 위한 기능키를 입력부(미도시)에 구비하거나 터치 패널로서 구현되는 LCD(미도시)에 문자 복구 기능 선택을 위한 메뉴를 구비하여, 본 문자 복구 기능을 간단한 조작으로 선택하도록 할 수 있다. 따라서, 사용자는 문서 복사시 문자 복구 기능 선택을 위한 기능키 또는 메뉴를 설정함으로써 훼손된 문자가 복구되도록 할 수 있다. On the other hand, the panel operation unit 110 of the image forming apparatus 100 having a character recovery function according to the present invention is provided with a function key for selecting a character recovery function in the input unit (not shown) in the input unit (not shown) or as a touch panel. The LCD (not shown) is provided with a menu for selecting a character recovery function, so that the character recovery function can be selected with a simple operation. Therefore, the user can set up a function key or menu for selecting a character recovery function when copying a document so that the damaged character can be recovered.

스캐닝부(120)는 문서에 광을 투사하여 반사시키고, 반사된 광을 전계방출소자(CCD : Charge Coupled Device)나 접촉 이미지센서(CIS : Contact Image Sensor)와 같은 센서에서 전기적인 신호, 즉 디지털 이미지로 변환하여 스캔 데이터를 생성한다.The scanning unit 120 projects and reflects light onto a document, and the reflected light is an electrical signal, i.e., a digital signal, from a sensor such as a charge coupled device (CCD) or a contact image sensor (CIS). Scan data is generated by converting to an image.

휘발성메모리부(130)는 화상형성장치(100)의 동작 수행 중에 발생하는 데이터 및 데이터에 대한 세부정보를 저장한다. 또한, 휘발성메모리부(130)는 필요한 경우 후술하는 제어부(150)에서 인터넷과 같은 네트워크와 연결하여 웹페이지 등을 제공하는 서버에 사전 데이터 검색 요청에 따라 수신된 단어를 임시 저장한다. The volatile memory unit 130 stores data generated during the operation of the image forming apparatus 100 and detailed information about the data. In addition, the volatile memory unit 130 temporarily stores the word received in response to a prior data search request in a server providing a web page or the like by connecting to a network such as the Internet in the controller 150 to be described later.

메모리부(140)는 화상형성장치(100)의 동작 수행을 위한 각종 제어 프로그램을 저장하며, 문자 복구를 위해 필요한 알고리즘 등 프로그램을 저장한다. 또한, 메모리부(140)는 문자 복구를 위해 각종 단어를 포함하는 사전 데이터를 저장하는 사전 데이터부(141)와 본 화상형성장치(100)를 통해 복사한 문서에 포함된 각종 단어에 대한 정보를 저장하는 가중치 데이터부(143)를 포함한다. The memory unit 140 stores various control programs for performing operations of the image forming apparatus 100, and stores programs such as algorithms necessary for character recovery. In addition, the memory unit 140 may store information about the various words included in the document copied through the image forming apparatus 100 and the dictionary data unit 141 for storing dictionary data including various words for character recovery. A weight data unit 143 is stored.

한편, 본 발명에 따른 화상형성장치(100)는 사전 데이터를 구비하는 외부 장치 또는 인터넷 웹페이지와 같은 매체를 인터페이스부(160)를 통해 연결하고 문자 복구를 위해 필요한 정보를 전송하여 추정되는 문자에 대한 정보를 수신하는 방식으로 구현될 수 있다. 이 경우 사용자는 예를 들면 패널조작부(110)의 LCD(미도시)에 표시된 문자 복구 기능 선택을 위한 메뉴를 이용하여 외부 장치 또는 인터넷 웹페이지를 통해 문자 복구를 위해 필요한 사전 데이터와 같은 정보를 입수하도록 할 수 있다.On the other hand, the image forming apparatus 100 according to the present invention is connected to the external device having a dictionary data or a medium such as an Internet web page through the interface unit 160 and transmits the necessary information for the character recovery to the estimated characters It can be implemented in a manner to receive information about. In this case, the user may obtain information such as dictionary data necessary for character recovery through an external device or an Internet web page using a menu for selecting a character recovery function displayed on, for example, an LCD (not shown) of the panel control unit 110. You can do that.

제어부(150)는 메모리(140)에 내장된 구동 프로그램에 따라 화상형성장치(100)를 전반적으로 제어하며, 문자인식부(170)를 제어하여 스캐닝부(120)에 의해 생성된 스캔 데이터로부터 문자 영역을 추출하고 추출된 문자 영역의 데이터를 텍스트로 변환하도록 하고, 사전 데이터부(141) 및 가중치 데이터부(143)를 검색하여 문자 복구를 위한 데이터를 수집하고, 메모리부(140)에 저장된 문자 복구를 위한 알고리즘과 같은 프로그램을 활성화하여 훼손된 문자를 대체할 문자를 추정하여 문자인식부(170)에 제공한다. The controller 150 generally controls the image forming apparatus 100 according to a driving program embedded in the memory 140, and controls the character recognition unit 170 to control characters from the scan data generated by the scanning unit 120. Extracts an area and converts the extracted text area data into text, searches the dictionary data unit 141 and the weight data unit 143 to collect data for character recovery, and stores the text stored in the memory unit 140. By activating a program such as an algorithm for recovery, a character to replace the damaged character is estimated and provided to the character recognition unit 170.

예를 들면, 제어부(150)는 훼손된 문자의 앞뒤에 위치한 문자의 조합을 사용하여 사전 데이터부(141)를 검색하고 이에 따라 훼손된 문자를 포함하는 단어를 추정하기 위해 추천되는 단어를 추출한다.For example, the controller 150 searches the dictionary data unit 141 using a combination of characters located before and after the damaged character, and thus extracts a recommended word to estimate a word including the damaged character.

또한, 제어부(150)는 가중치 데이터부(143)에 저장된 정보를 이용하여 사전 데이터부(141)에 의해 추천된 단어 중 가중치가 가장 높은 단어를 선택하고, 훼손된 문자를 복구한다. In addition, the controller 150 selects a word having the highest weight among words recommended by the dictionary data unit 141 by using the information stored in the weight data unit 143, and restores the damaged character.

가중치 데이터부(143)에 저장되는 데이터는 예를 들면 단어, 기존에 복사된 문서에 단어가 나타난 빈도 수, 단어가 포함된 기존 복사 문서의 개수, 단어가 포함된 기존 복사 문서의 복사 일자 등의 복사 문서에서의 각 단어의 발생 정보를 포함한다. 가중치는 다양한 알고리즘을 이용하여 적용될 수 있으며, 예를 들면 단어가 나타난 빈도 수가 높을수록, 단어가 포함된 문서 개수가 클수록, 해당 문서의 복사 일자가 최신의 것일수록 높은 가중치를 적용할 수 있다.The data stored in the weight data unit 143 may be, for example, a word, the frequency of occurrence of the word in a previously copied document, the number of existing copy documents containing a word, a copy date of an existing copy document including a word, and the like. Contains occurrence information of each word in the copy document. The weight may be applied by using various algorithms. For example, the higher the frequency of the occurrence of the word, the larger the number of documents containing the word, and the higher the copy date of the document, the higher the weight.

한편, 제어부(150)는 복사 대상 문서에 포함된 단어에 대한 정보에 따라 가중치 데이터부(143)를 업데이트한다. 따라서, 가중치 데이터부(143)는 문서 복사시마다 갱신되어, 문자 복구 성능을 증대할 수 있다. Meanwhile, the controller 150 updates the weight data unit 143 according to the information on the words included in the copy target document. Therefore, the weight data unit 143 is updated every time document copying can increase the character recovery performance.

인터페이스부(160)는 개인용 컴퓨터와 같은 정보처리장치 및 각종 주변장치 또는 인터넷 서버와 같은 외부장치와 제어부(150)사이를 인터페이싱하여 외부장치로부터 인가되는 데이터를 수신하거나, 화상형성장치(100)로부터 외부장치로 데이터를 전송한다. The interface unit 160 receives data from an external device by interfacing between an information processing device such as a personal computer and various peripheral devices or an external device such as an Internet server and the controller 150, or from the image forming apparatus 100. Send data to external device.

문자 인식부(170)는 스캔 데이터로부터 문자 인식이 가능한 부분인 문자 영 역과 그렇지 않은 부분을 구분한 후, 문자 영역을 추출하여 텍스트 데이터로 변환한다. 이 경우, 문자 인식부는 OCR(Optical Character Reader)인 것이 가능하다.The character recognition unit 170 distinguishes a character area that is a character recognition possible portion from the scan data and a portion that is not, and then extracts the character area and converts the text area into text data. In this case, the character recognition unit can be an OCR (Optical Character Reader).

또한, 제어부(150)는 스캔 데이터 및 스캔 데이터로부터 추출되어 텍스트로 변환되고 훼손된 문자가 복구된 텍스트 데이터를 사용하여 인쇄 데이터를 생성한다. In addition, the controller 150 generates print data using the text data extracted from the scan data and the scan data, converted into text, and the damaged characters are recovered.

그리고, 프린터엔진(180)은 제어부(150)로부터 입력된 인쇄 명령에 따라 인쇄 데이터를 인쇄한다. 제어부(150)는 스캔 데이터 중 문자인식부(170)에 의해 텍스트 데이터로 변환된 문자 부분에 대해 원문에서와 같은 서식과 폰트를 적용하여 인쇄 데이터를 생성하고 프린터엔진(170)을 통해 인쇄함으로써 원본 문서를 복사한 효과를 발생시킬 수 있다. The printer engine 180 prints the print data according to the print command input from the controller 150. The controller 150 generates the print data by applying the same format and font as the original text to the character part converted into the text data by the character recognition unit 170 of the scan data, and then prints it through the printer engine 170. This can produce the effect of copying the document.

도 2는 본 발명에 따른 문자 복구 기능을 갖는 화상형성장치의 동작 설명에 제공되는 흐름도이다. 2 is a flowchart provided to explain the operation of the image forming apparatus having the character recovery function according to the present invention.

도면을 참조하면, 우선, 복사 대상 문서가 화상형성장치(100)로 인입되고 패널조작부(110)를 통해 복사 명령이 입력되면, 패널조작부(110)는 이에 따른 키 신호를 발생하여 제어부(150)로 인가한다. 따라서, 제어부(150)는 스캐닝부(120)를 제어하여 대상 문서를 스캐닝하고 스캔 데이터를 생성한다(S210).Referring to the drawings, first, when a copy target document is introduced into the image forming apparatus 100 and a copy command is input through the panel operation unit 110, the panel operation unit 110 generates a key signal according to the control unit 150. Is applied. Therefore, the controller 150 controls the scanning unit 120 to scan the target document and generate scan data (S210).

한편, 제어부(150)는 복사 대상 문서에 포함된 문자에 대한 복구 명령이 입력되는지를 판단하고(S220), 패널조작부(110)를 통해 문자 복구 기능이 선택되면 문자인식부(170)를 제어하여 스캐닝부(120)에 의해 생성된 스캔 데이터로부터 문자 영역을 추출하고 추출된 문자 영역의 데이터를 텍스트로 변환하도록 함으로써 문자 를 인식한다(S230).On the other hand, the controller 150 determines whether a recovery command for the characters included in the copy target document is input (S220), and if the character recovery function is selected through the panel control unit 110 to control the character recognition unit 170 Characters are recognized by extracting a character region from the scan data generated by the scanning unit 120 and converting the extracted character region data into text (S230).

한편, 문자 복구 기능에 따라 제어부(150)는 사전 데이터부(141) 및 가중치 데이터부(143)를 이용하여 훼손된 문자를 포함하는 단어를 추정하여 훼손된 문자를 복구한다(S240). Meanwhile, according to the character recovery function, the controller 150 estimates a word including the damaged character by using the dictionary data unit 141 and the weight data unit 143 to recover the damaged character (S240).

즉, 제어부(150)는 사전 데이터부(141)를 검색하여 훼손된 문자를 포함하는 단어로 추정되는 단어를 모두 추천한다. 이때, 네트워크에 연결된 외부 장치 또는 웹페이지를 통해 사전 데이터를 검색하도록 설정된 경우에는 제어부(150)는 훼손된 문자에 대한 앞뒤 문자열을 포함하는 정보를 인터페이스부(160)를 통해 외부 장치 또는 웹페이지에 전송하고 이에 따라 훼손된 문자를 포함하는 단어로 추천되는 단어를 수신한다. That is, the controller 150 searches the dictionary data unit 141 and recommends all the words that are presumed to be words including the damaged characters. In this case, when the dictionary data is searched through an external device or web page connected to the network, the controller 150 transmits the information including the front and back strings of the corrupted character to the external device or the web page through the interface unit 160. As a result, a word recommended as a word including a damaged letter is received.

그리고, 제어부(150)는 훼손된 문자 복구를 위한 최적의 단어를 추정하기 위해 가중치 데이터부(143)에 저장된 정보를 이용하여 추천된 단어에 가중치를 반영하고, 가중치가 가장 높은 단어를 선택하여 훼손된 문자를 포함하는 단어를 대치한다. In addition, the controller 150 reflects the weight on the recommended word by using the information stored in the weight data unit 143 to estimate the optimal word for the damaged character recovery, and selects the word having the highest weight to corrupt the character. Replace words that contain.

대상 문서에 대한 복사를 위해 문자의 복구가 완료되면, 제어부(150)는 대상 문서에 포함된 단어에 대한 정보를 사용하여 가중치 데이터부(143)를 업데이트하여(S250), 문자 복구 성능을 증대하도록 한다.When the recovery of the character is completed for copying to the target document, the controller 150 updates the weight data unit 143 using information on the words included in the target document (S250) to increase the character recovery performance. do.

이어서, 제어부(150)는 스캔 데이터 및 스캔 데이터로부터 추출되어 텍스트로 변환되고 훼손된 문자가 복구된 텍스트 데이터를 사용하여 인쇄 데이터를 생성하고(S260), 프린터엔진(170)을 통해 용지에 인쇄한다(S270).Subsequently, the controller 150 generates print data using the text data extracted from the scan data and the scan data, converted into text, and the damaged characters are recovered (S260), and printed on paper through the printer engine 170 ( S270).

따라서, 화상형성장치를 이용하여 복사되는 문서에 주로 사용되는 단어에 가중치를 줌으로써 사전 데이터의 정확성과 효율성을 보완할 수 있다. 즉, 사전 데이터의 용량을 증가시키지 않더라도 최적의 문자 복구가 가능하므로, 비교적 적은 용량의 사전 데이터로도 검색 속도의 저하 없이 정확성이 높은 문자 복구가 가능하다. Therefore, weights of words mainly used for documents copied using the image forming apparatus can compensate for accuracy and efficiency of dictionary data. In other words, the optimal character recovery is possible even without increasing the capacity of the dictionary data, so that the character recovery with high accuracy is possible without a decrease in the search speed even with a relatively small capacity of the dictionary data.

또한, 문자의 훼손 정도가 심하여 사전 데이터 검색에 따라 다수 개의 문자가 추천되는 경우에 이를 보완하여 최적의 문자 복구가 가능하다. In addition, if the damage degree of the character is severe and a plurality of characters are recommended according to the dictionary data search, it is possible to compensate for the optimal character recovery.

이상 설명한 바와 같이, 본 발명에 따르면, 화상형성장치에서 훼손된 문자를복구하기 위해 사전 데이터와 함께 가중치 데이터를 사용하여 문자 복구 성능을 개선할 수 있다. As described above, according to the present invention, it is possible to improve the character recovery performance by using the weighted data together with the dictionary data to recover the corrupted character in the image forming apparatus.

또한, 본 발명에 따르면 사전 데이터의 용량을 증가시키지 않고도 최적의 문자 복구가 가능하므로 적은 메모리 사용이 가능하며 사전 데이터의 검색에 소요되는 시간을 단축할 수 있다. Further, according to the present invention, since optimal character recovery is possible without increasing the capacity of the dictionary data, less memory is available and the time required for searching the dictionary data can be shortened.

이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.While the above has been shown and described with respect to preferred embodiments of the present invention, the present invention is not limited to the specific embodiments described above, it is usually in the technical field to which the invention belongs without departing from the spirit of the invention claimed in the claims. Various modifications can be made by those skilled in the art, and these modifications should not be individually understood from the technical spirit or the prospect of the present invention.

Claims (5)

문서에 광을 투사하여 스캔 데이터를 생성하는 스캐닝부;A scanning unit projecting light onto a document to generate scan data; 생성된 상기 스캔 데이터 중 문자 영역을 추출하고, 상기 문자 영역의 데이터를 텍스트 데이터로 변환하는 문자인식부; A character recognition unit extracting a character area from the generated scan data and converting data of the character area into text data; 복수의 단어를 저장하는 사전 데이터부;A dictionary data unit for storing a plurality of words; 상기 복수의 단어에 대한 가중치 적용을 위한 정보를 저장하는 가중치 데이터부; 및A weight data unit storing information for applying a weight to the plurality of words; And 상기 문서에 포함된 훼손된 문자를 복구하기 위해, 상기 사전 데이터부로부터 상기 문자를 포함하는 것으로 추정되는 적어도 하나의 단어를 검색하고, 상기 가중치 데이터부에 저장된 정보를 사용하여 검색된 상기 적어도 하나의 단어에 대해 가중치를 적용하고 상기 문자 복구를 위한 단어를 선택하여 상기 문자인식부에 제공하는 제어부;를 포함하는 것을 특징으로 하는 문자 복구 기능을 갖는 화상형성장치.In order to recover damaged characters included in the document, at least one word estimated from the dictionary data portion is estimated to include the character, and the information stored in the weight data portion is searched on the at least one word. And a controller which applies a weight to the selected word and selects a word for the character recovery and provides the word to the character recognition unit. 제 1 항에 있어서,The method of claim 1, 상기 가중치 데이터부에 저장되는 상기 정보는 상기 각 단어에 대응하여 저장되며, 상기 각 단어가 기존 복사 문서에 나타난 빈도 수, 상기 단어가 나타난 상기 기존 복사 문서의 개수, 상기 단어가 나타난 상기 기존 복사 문서의 최근 복사 일자 중 적어도 하나를 포함하는 것을 특징으로 하는 문자 복구 기능을 갖는 화상형성장치. The information stored in the weight data unit is stored corresponding to each word, the frequency of each word appearing in an existing copy document, the number of the existing copy document in which the word appears, the existing copy document in which the word appears. And at least one of a recent copy date of the image forming apparatus. 제 1 항에 있어서,The method of claim 1, 상기 사전 데이터부는 네트워크를 통해 연결되는 외부장치에 구비되고, 상기 제어부는 상기 외부장치와의 통신을 통해 상기 적어도 하나의 단어를 검색하는 것을 특징으로 하는 문자 복구 기능을 갖는 화상형성장치.And the dictionary data unit is provided in an external device connected through a network, and the control unit searches for the at least one word through communication with the external device. 문서에 광을 투사하여 스캔 데이터를 생성하는 단계;Projecting light onto a document to generate scan data; 생성된 상기 스캔 데이터 중 문자 영역을 추출하여 텍스트 데이터로 변환하는 단계; 및Extracting a text area from the generated scan data and converting the text area into text data; And 상기 문서에 포함된 문자 중 훼손된 문자를 포함하는 것으로 추정되는 적어도 하나의 단어를 사전 데이터로부터 검색하고, 검색된 상기 적어도 하나의 단어에 대한 기저장된 정보를 이용하여 소정의 가중치를 적용하고 상기 문자 복구를 위한 단어를 선택하는 단계;를 포함하는 것을 특징으로 하는 화상형성장치의 문자 복구 방법.Search from the dictionary data for at least one word estimated to include corrupted characters among the characters included in the document, apply a predetermined weight using pre-stored information on the found at least one word, and perform the character recovery. Selecting a word for the character recovery method of an image forming apparatus. 제 4 항에 있어서,The method of claim 4, wherein 상기 문서에 포함된 단어, 상기 단어가 나타난 빈도 수, 상기 단어가 포함된 문서의 개수, 상기 문서의 복사 일자 중 적어도 하나를 이용하여 상기 가중치 적용을 위한 상기 정보로서 업데이트 하는 단계;를 더 포함하는 것을 특징으로 하는 화상형성장치의 문자 복구 방법. Updating as the information for applying the weight using at least one of a word included in the document, a frequency of occurrence of the word, a number of documents including the word, and a copy date of the document; Character recovery method of the image forming apparatus, characterized in that.
KR1020050128936A 2005-12-23 2005-12-23 Image forming device capable of recevering damaged text and method thereof KR20070067753A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050128936A KR20070067753A (en) 2005-12-23 2005-12-23 Image forming device capable of recevering damaged text and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050128936A KR20070067753A (en) 2005-12-23 2005-12-23 Image forming device capable of recevering damaged text and method thereof

Publications (1)

Publication Number Publication Date
KR20070067753A true KR20070067753A (en) 2007-06-29

Family

ID=38366284

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050128936A KR20070067753A (en) 2005-12-23 2005-12-23 Image forming device capable of recevering damaged text and method thereof

Country Status (1)

Country Link
KR (1) KR20070067753A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020159140A1 (en) * 2019-02-01 2020-08-06 삼성전자주식회사 Electronic device and control method therefor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020159140A1 (en) * 2019-02-01 2020-08-06 삼성전자주식회사 Electronic device and control method therefor
US11893813B2 (en) 2019-02-01 2024-02-06 Samsung Electronics Co., Ltd. Electronic device and control method therefor

Similar Documents

Publication Publication Date Title
US7797150B2 (en) Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database
JP4756930B2 (en) Document management system, document management method, image forming apparatus, and information processing apparatus
US7996362B2 (en) Image processing apparatus, image processing system, and control method therefor
JP4789516B2 (en) Document conversion apparatus, document conversion method, and storage medium
US20060285748A1 (en) Document processing device
KR100740194B1 (en) Image forming apparatus for printing searching image in network and method therefor
US7599919B2 (en) Image forming apparatus
JP2008052372A (en) Image processor, handwritten information recognition method and handwritten information recognition program
US9529792B2 (en) Glossary management device, glossary management system, and recording medium for glossary generation
JP2011119871A (en) Image management device, and image management method
US8755064B2 (en) Information processing apparatus, information processing method, and information processing program protecting security of an object in a document
JP4943354B2 (en) Information identification device, information identification method, program, and recording medium
KR20070067753A (en) Image forming device capable of recevering damaged text and method thereof
US7680331B2 (en) Document processing device and document processing method
US20220180114A1 (en) Image processing apparatus capable of restoring degraded image with high accuracy, image processing method, and storage medium
JP6158736B2 (en) Information processing apparatus, information processing system, and information processing program
JP4185744B2 (en) Image processing apparatus, document management system, image processing apparatus control method, and control program
JP2008129791A (en) Document processing system
JP6269256B2 (en) Information processing apparatus, image forming apparatus, information processing method, and information processing program
US20230325126A1 (en) Information processing apparatus and method and non-transitory computer readable medium
US11223727B2 (en) Image reading apparatus and information processing apparatus that reads documents and generates image data
JP7452059B2 (en) Information processing device and program
US20210090241A1 (en) Image processing system, image processing apparatus and method of controlling the same, and storage medium
JP2011232991A (en) Search device and image processing system
US10264157B2 (en) Image processing apparatus, image processing method and image processing program

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid