KR20080110532A - Information processing apparatus and method thereof - Google Patents

Information processing apparatus and method thereof Download PDF

Info

Publication number
KR20080110532A
KR20080110532A KR1020080055719A KR20080055719A KR20080110532A KR 20080110532 A KR20080110532 A KR 20080110532A KR 1020080055719 A KR1020080055719 A KR 1020080055719A KR 20080055719 A KR20080055719 A KR 20080055719A KR 20080110532 A KR20080110532 A KR 20080110532A
Authority
KR
South Korea
Prior art keywords
information
embedding
input
document
embedded
Prior art date
Application number
KR1020080055719A
Other languages
Korean (ko)
Other versions
KR100938539B1 (en
Inventor
링 루
Original Assignee
캐논 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 캐논 가부시끼가이샤 filed Critical 캐논 가부시끼가이샤
Publication of KR20080110532A publication Critical patent/KR20080110532A/en
Application granted granted Critical
Publication of KR100938539B1 publication Critical patent/KR100938539B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking

Abstract

An information processing apparatus and a method thereof are provided to detect mismatch of inserted information due to extraction error of an external contact square. A document input unit(401) inputs a document comprised of characters. An inserting information input unit(404) inputs inserted information in a document. A synchronization information input unit(405) inputs synchronization information made of a preset bit pattern. A synthesizing unit(406) generates a synthesizing inserting information. An inserting unit(407) prints a document after the insertion.

Description

정보 처리 장치 및 그 방법{INFORMATION PROCESSING APPARATUS AND METHOD THEREOF}Information processing apparatus and its method {INFORMATION PROCESSING APPARATUS AND METHOD THEREOF}

본 발명은, 문서에 정보를 매립하는 기술 및 매립된 정보를 추출하는 기술에 관한 것이다.The present invention relates to a technique for embedding information in a document and a technique for extracting embedded information.

문자 단위로 워터마킹 정보를 매립하는 경우에는, 매립 전에 외접 사각형을 1문자 단위로 추출할 필요가 있다. 그러나, 예를 들면, 변과 방으로 구성되는 문자를 따로따로 2 문자로서 추출하게 되는 추출 오류가 발생하는 것이 있다. 이러한 경우에, 추출 오류가 발생한 채로 워터마크 정보가 매립되면, 매립된 워터마크 정보를 다시 추출할 때에, 워터마크 정보가 어긋나게 된다. 예를 들면, 도 1a가, 본래, 외접 사각형으로서 추출될 문자를 나타내고, 그 문자에 대하여, 도 1b와 같은 워터마크 정보를 매립했다고 하자. 그러나, 도 1c와 같이, 외접 사각형이 추출된 경우에는, 외접 사각형 추출된 각각의 문자로부터 정보를 추출한다. 그 때문에, 결과적으로, 도 1d와 같은 워터마크 정보가 추출되게 된다. 일본 특허 공개 공보 특개 2004-247883호(문헌1)에서는, 워터마크 정보와 동기 정보를 각 문자에 순서대로 매립하는 기술이 개시되어 있다.When embedding watermarking information in characters, it is necessary to extract the circumscribed rectangle in units of one character before embedding. However, for example, an extraction error occurs in which a character composed of sides and rooms is extracted as two characters separately. In this case, if the watermark information is embedded with an extraction error, the watermark information is shifted when extracting the embedded watermark information again. For example, suppose that Fig. 1A originally shows a character to be extracted as a circumscribed rectangle, and embeds watermark information as shown in Fig. 1B in the character. However, as shown in Fig. 1C, when the circumscribed rectangle is extracted, information is extracted from each character extracted from the circumscribed rectangle. Therefore, as a result, the watermark information as shown in Fig. 1D is extracted. Japanese Patent Laid-Open No. 2004-247883 (Patent 1) discloses a technique for embedding watermark information and synchronization information in each character in order.

그러나, 문헌 1에서 개시되어 있는 기술에서는, 외접 사각형의 추출 오류의 위치를 특정할 수 없기 때문에, 외접 사각형에 워터마킹 정보를 몇번이나 매립할 필요가 있다. 또한, 추출 오류가 발생한 외접 사각형으로부터 뒤쪽의 워터마크 정보는 모두 어긋나게 되기 때문에, 참조할 수 없다.However, in the technique disclosed in Document 1, it is not possible to specify the position of the error of extracting the circumscribed rectangle, so that the watermarking information needs to be embedded several times in the circumscribed rectangle. Further, since the watermark information on the rear side is shifted from the circumscribed rectangle where the extraction error occurs, it cannot be referred to.

따라서, 본 발명의 목적은, 외접 사각형의 추출 오류에 기인하는 매립 정보의 어긋남을 검출하는 데에 있다.Therefore, an object of the present invention is to detect the deviation of embedding information caused by the extraction error of the circumscribed rectangle.

본 발명에서는, 문서 내의 각 문자에, n비트(n은 2 이상의 정수)의 정보를 매립하는 정보 처리 장치로서, 문자로 구성되는 문서를 입력하는 문서 입력 수단과, 상기 문서에 매립할 매립 정보를 입력하는 매립 정보 입력 수단과, 복수 비트로 구성되고, 미리 설정된 비트 패턴으로 이루어지는 동기 정보를 입력하는 동기 정보 입력 수단과, 입력된 매립 정보를 구성하는 비트와, 상기 동기 정보를 구성하는 비트를 합성함으로써, 합성 매립 정보를 생성하는 합성 수단과, 상기 합성 수단에 의해 생성된 합성 매립 정보를 상기 문서 입력 수단에 의해 입력된 문서 내의 각 문자에 매립하고, 매립 후의 문서를 출력하는 매립 수단을 구비하고, 상기 매립 수단은, 각 문자에, 적어도 1비트의 동기 정보를 매립하는 것을 특징으로 하는 정보 처리 장치가 제공된다.In the present invention, an information processing apparatus for embedding n-bit information (n is an integer of 2 or more) in each character in a document, comprising: document input means for inputting a document composed of characters, and embedding information to be embedded in the document; By embedding the embedding information input means to input, the synchronization information input means which inputs the synchronization information which consists of a plurality of bits, and consists of a preset bit pattern, the bits which comprise the input embedding information, and the bits which comprise the said synchronization information, Combining means for generating synthesis embedding information, embedding means for embedding the synthesis embedding information generated by the synthesizing means into each character in the document input by the document input means, and outputting the document after embedding; The embedding means is provided with an information processing apparatus characterized by embedding at least one bit of synchronization information in each character.

또한, 본 발명에서는, 문서 화상 내의 각 문자에 n비트(n은 2 이상의 정수) 의 정보가 매립되고, 그 n비트 중, 적어도 1비트가 동기 정보로서 매립되어 있는 문서 화상으로부터 정보를 추출하는 정보 처리 장치로서, 문서 화상을 입력하는 문서 화상 입력 수단과, 입력된 문서 화상 내의 각 문자의 외접 사각형을 구하고, 그 외접 사각형 내의 문자에 매립된 정보를 추출하는 합성 매립 정보 추출 수단과, 상기 합성 매립 정보 추출 수단에 의해 추출된 합성 매립 정보로부터, 동기 정보와 매립 정보로 분리하는 분리 수단과, 동기 정보를 입력하는 동기 정보 입력 수단과, 상기 분리 수단에 의해 분리된 동기 정보와, 상기 동기 정보 입력 수단에 의해 입력된 동기 정보를 비교함으로써, 상기 합성 매립 정보 추출 수단의 추출 오류를 판정하여, 추출 오류가 있다고 판정한 경우, 상기 분리 수단에 의해 분리된 동기 정보와 상기 입력 수단에 의해 입력된 동기 정보가 일치하도록, 상기 합성 매립 정보를 정정하는 정정 수단을 구비하는 것을 특징으로 하는 정보 처리 장치가 제공된다.Further, in the present invention, information for extracting information from a document image in which n bits (n is an integer of 2 or more) is embedded in each character in the document image, and at least one bit of the n bits is embedded as synchronization information. A processing apparatus comprising: document image input means for inputting a document image, synthesized embedding information extracting means for obtaining a circumscribed rectangle of each character in the input document image, and extracting information embedded in the characters in the circumscribed rectangle; Separation means for separating the synchronization information and embedding information from the synthetic embedding information extracted by the information extraction means, synchronization information input means for inputting synchronization information, synchronization information separated by the separation means, and the synchronization information input By comparing the synchronization information inputted by the means, the extraction error of the synthesis embedding information extraction means is determined, and there is an extraction error. If it is determined, the synchronization information and the synchronization information input by the input means separated by the separating means to match, the information processing apparatus comprising a correction means for correcting the composite embedded information is provided.

또한, 본 발명에서는, 문서 내의 각 문자에, n비트(n은 2 이상의 정수)의 정보를 매립하는 정보 처리 방법으로서, 문자로 구성되는 문서를 입력하는 문서 입력 공정과, 상기 문서에 매립할 매립 정보를 입력하는 매립 정보 입력 공정과, 복수 비트로 구성되고, 미리 설정된 비트 패턴으로 이루어지는 동기 정보를 입력하는 동기 정보 입력 공정과, 입력된 매립 정보를 구성하는 비트와, 상기 동기 정보를 구성하는 비트를 합성함으로써, 합성 매립 정보를 생성하는 합성 공정과, 상기 합성 공정에서 생성된 합성 매립 정보를 상기 문서 입력 공정에서 입력된 문서 내의 각 문자에 매립하고, 매립 후의 문서를 출력하는 매립 공정을 구비하고, 상기 매립 공 정은, 각 문자에 적어도 1비트의 동기 정보를 매립하는 것을 특징으로 하는 정보 처리 방법이 제공된다.Moreover, in this invention, as an information processing method which embeds the information of n bits (n is an integer of 2 or more) in each character in a document, the document input process of inputting the document which consists of characters, and the embedding to be embedded in the said document. A buried information input step of inputting information, a synchronous information input step of inputting synchronous information composed of a plurality of bits and having a preset bit pattern, bits constituting the input buried information, and bits constituting the synchronous information By a synthesis process, a synthesis step of generating synthesis embedding information, and a embedding process of embedding the synthesis embedding information generated in the synthesis process into each character in the document input in the document input process, and outputting the document after embedding; In the embedding process, at least one bit of synchronization information is embedded in each character.

또한, 본 발명에서, 문서 화상 내의 각 문자에 n비트(n은 2 이상의 정수)의 정보가 매립되고, 그 n비트 중, 적어도 1비트가 동기 정보로서 매립되어 있는 문서 화상으로부터 정보를 추출하는 정보 처리 방법으로서, 문서 화상을 입력하는 문서 화상 입력 공정과, 입력된 문서 화상 내의 각 문자의 외접 사각형을 구하고, 그 외접 사각형 내의 문자에 매립된 정보를 추출하는 합성 매립 정보 추출 공정과, 상기 합성 매립 정보 추출 공정에서 추출된 합성 매립 정보로부터, 동기 정보와 매립 정보로 분리하는 분리 공정과, 동기 정보를 입력하는 동기 정보 입력 공정과, 상기 분리 공정에서 분리된 동기 정보와, 상기 동기 정보 입력 공정에서 입력된 동기 정보를 비교함으로써, 상기 합성 매립 정보 추출 공정의 추출 오류를 판정하여, 추출 오류가 있다고 판정한 경우, 상기 분리 공정에서 분리된 동기 정보와, 상기 입력 공정에서 입력된 동기 정보가 일치하도록, 상기 합성 매립 정보를 정정하는 정정 공정을 구비하는 것을 특징으로 하는 정보 처리 방법이 제공된다.Further, in the present invention, information for extracting information from a document image in which n bits (n is an integer of 2 or more) is embedded in each character in the document image, and at least one bit of the n bits is embedded as synchronization information. A processing method includes: a document image input step of inputting a document image, a synthetic embedding information extraction step of obtaining an external quadrangle of each character in the input document image, and extracting information embedded in the characters in the external quadrangle; A separation step of separating the synchronization information and the embedding information from the synthetic embedding information extracted in the information extraction step, a synchronization information input step of inputting synchronization information, synchronization information separated in the separation step, and the synchronization information input step By comparing the input synchronization information, the extraction error of the synthesis embedding information extraction step is determined, and it is determined that there is an extraction error. Wu, and the synchronization information is separated in the separation step, the synchronization information input in the input step to match, the information processing method characterized by comprising a correction step of correcting the composite embedded information is provided.

본 발명에 따르면, 외접 사각형의 추출 오류에 기인하는 매립 정보의 어긋남을 검출할 수 있다.According to the present invention, the deviation of embedding information due to the extraction error of the circumscribed rectangle can be detected.

본원 발명의 특징은 첨부 도면을 참조한 다음의 상세한 설명으로부터 보다 명확해질 것이다.The features of the present invention will become more apparent from the following detailed description with reference to the accompanying drawings.

본 명세서에 첨부되고, 본 명세서의 일부를 구성하는 첨부 도면은 본 발명의 실시예를 도시한 것으로, 상세한 설명과 함께, 본 발명의 원리를 설명하는 역할을 한다.The accompanying drawings, which are incorporated in and constitute a part of this specification, illustrate embodiments of the invention and, together with the description, serve to explain the principles of the invention.

우선, 정보 처리 장치의 전체 구성에 대해서, 도면을 참조하여 상세히 설명한다.First, the whole structure of an information processing apparatus is demonstrated in detail with reference to drawings.

[전체 구성][Overall configuration]

도 4는, 본 발명의 일 실시 형태에 따른 정보 처리 장치(매립 처리)의 개략구성도이다. 본 정보 처리 장치는, 문서 내의 각 문자의 외접 사각형을 구하고, 이 외접 사각형으로 표시되는 영역 내의 문자마다 정보를 매립하는 것이다. 또한, 여기에서는, 1문자에 n비트(n은 2 이상의 정수)의 정보를 매립하는 것으로 한다.4 is a schematic configuration diagram of an information processing device (embedded processing) according to an embodiment of the present invention. The information processing apparatus obtains a circumscribed rectangle of each character in a document and embeds information for each character in the area indicated by the circumscribed rectangle. In this case, it is assumed that n bits (n is an integer of 2 or more) are embedded in one character.

우선, 문자로 구성되는 문서(400)를 광학적으로 판독하고, 문서 화상 데이터로서 문서 입력부(401)에 입력된 후, 문서 해석부(402)에서 문서(400) 내의 외접 사각형(문자 영역)의 추출이 행해진다. 다음으로, 문서(400)에 매립할 매립 정보(403)가 매립 정보 입력부(404)에 입력된다. 그 후, 복수 비트로 구성되고, 미리 설정된 비트 패턴으로 이루어지는 동기 정보가 동기 정보 입력부(405)에 입력된다. 그 후, 합성부(406)에서, 입력된 매립 정보(403)를 구성하는 n-1비트와, 동기 정보의 1비트를 교대로 배열하여 합성함으로써, 합성 매립 정보를 생성한다.First, the document 400 composed of characters is optically read and input to the document input unit 401 as document image data, and then the document analysis unit 402 extracts a circumscribed rectangle (character area) in the document 400. This is done. Next, the embedding information 403 to be embedded in the document 400 is input to the embedding information input unit 404. Thereafter, synchronization information composed of a plurality of bits and consisting of a preset bit pattern is input to the synchronization information input unit 405. Thereafter, the synthesis unit 406 generates synthesized embedded information by alternately arranging n-1 bits constituting the input embedded information 403 and one bit of synchronization information.

다음으로, 매립부(407)에서, 합성부(406)에서 생성된 합성 매립 정보를, 문서 입력부(401)에서 입력된 문서(400) 내의 문자에 매립하고, 매립 후의 문서(409)를 문서 출력부(408)로부터 출력한다.Next, the embedding unit 407 embeds the synthetic embedding information generated by the combining unit 406 into the characters in the document 400 input by the document input unit 401, and outputs the document 409 after embedding. It outputs from the part 408.

또한, 매립부(407)는, 1문자에 n비트를 매립하기 위한 2n개의 매립 패턴을 기억하는 기억부를 구비한다. 또한, 매립부(407)는, 합성부(406)에서 생성된 합성 매립 정보 내의 n비트의 값에 따라서, 기억부에 기억된 매립 패턴 중 어느 하나를 선택하여, 매립 대상의 문자의 외접 사각형 내의 문자 화상을 마스크하는 마스크부를 구비한다.The embedding unit 407 also includes a storage unit for storing 2 n embedding patterns for embedding n bits in one character. Further, the embedding unit 407 selects any one of the embedding patterns stored in the storage unit in accordance with the value of n bits in the synthetic embedding information generated by the synthesis unit 406, and selects one of the embedded rectangles in the external rectangle. The mask part which masks a character image is provided.

또한, 본 실시 형태에서는, 매립 정보 입력부(404)로부터 입력된 매립 정보(403)에 오류 정정 정보를 부가하는 오류 정정 정보 부가부(도시 생략)를 구비한다. 합성부(406)는, 매립 정보 입력부(404)의 오류 정정 정보 부가부로부터 출력된 오류 정정 정보의 부가 결과와, 동기 정보 입력부(405)에서 입력된 동기 정보를 합성한다.In this embodiment, an error correction information adding unit (not shown) for adding error correction information to the embedding information 403 input from the embedding information input unit 404 is provided. The synthesizing unit 406 synthesizes the addition result of the error correction information output from the error correction information adding unit of the embedding information input unit 404 and the synchronization information input from the synchronization information input unit 405.

도 5는, 본 발명의 일 실시 형태에 따른 정보 처리 장치(추출 처리)의 개략구성도이다. 본 정보 처리 장치는, 문서 화상을 입력받아, 문서 화상 내의 각 문자의 외접 사각형을 구하고, 이 외접 사각형 내의 문자에 매립된 정보를 추출하는 것이다.5 is a schematic configuration diagram of an information processing device (extraction process) according to an embodiment of the present invention. The information processing apparatus receives a document image, obtains a circumscribed rectangle of each character in the document image, and extracts information embedded in the characters in the circumscribed rectangle.

우선, 문서 화상(500)이 문서 화상 입력부(501)로부터 입력된다. 다음으로, 문서 해석부(502)에 있어서, 문서 화상 입력부(501)에서 입력된 문서 화상(500) 내의 각 문자의 외접 사각형을 구하고, 이 외접 사각형의 영역 내의 문자에 매립된 정보를 합성 매립 정보 추출부(503)에서 추출한다. 다음으로, 합성 매립 정보 추출부(503)에서 추출된 합성 매립 정보를, 분리부(504)에서, 동기 정보와 매립 정보 로 분리한다. 여기에서는, 합성 매립 정보로부터, 매립 정보를 구성하는 n-1비트와, 동기 정보의 1비트를 교대로 분리한다. 혹은, 합성 매립 정보로부터, 우선, 동기 정보를 추출하고, 동기 정보를 제외한 정보를, 문서 화상(500)에 매립된 매립 정보로 해도 된다.First, the document image 500 is input from the document image input unit 501. Next, in the document analysis unit 502, a circumference rectangle of each character in the document image 500 input by the document image input unit 501 is obtained, and the information embedded in the characters in the area of the circumference rectangle is synthesized embedding information. It extracts from the extraction part 503. Next, the synthesis embedding information extracted by the synthesis embedding information extracting unit 503 is separated into synchronization information and embedding information by the separating unit 504. Here, n-1 bits constituting the embedding information and one bit of the synchronization information are alternately separated from the synthetic embedding information. Alternatively, the synchronization information may be first extracted from the embedding embedding information, and the information excluding the synchronization information may be embedded information embedded in the document image 500.

 동기 정보 입력부(506)에서, 기억부(505)에 기억된 복수 비트로 구성되고, 미리 설정된 비트 패턴으로 이루어지는 동기 정보를 입력한다. 오류 정정부(507)는, 합성 매립 정보 추출부(503)에서 추출된 동기 정보와, 동기 정보 입력부(506)에서 입력된 동기 정보를 비교함으로써 합성 매립 정보 추출부(503)의 추출 오류를 판정한다. 여기에서, 추출 오류가 있다고 판정된 경우에는, 합성 매립 정보 추출부(503)에서 추출된 동기 정보와, 동기 정보 입력부(506)에서 입력된 동기 정보가 일치하도록 합성 매립 정보를 정정한다. 또한, 합성 매립 정보의 정정 처리로서는, 비트 삽입, 비트 삭제, 및 비트 반전 등을 예로 들 수 있다. 매립 정보 출력부(508)는, 오류 정정부(507)에 의해 처리된 후의 매립 정보를 출력한다.The synchronization information input unit 506 inputs synchronization information composed of a plurality of bits stored in the storage unit 505 and composed of a preset bit pattern. The error correction unit 507 determines the extraction error of the synthesis embedding information extraction unit 503 by comparing the synchronization information extracted from the synthesis embedding information extraction unit 503 with the synchronization information input from the synchronization information input unit 506. do. When it is determined that there is an extraction error, the synthesis embedding information is corrected so that the synchronization information extracted by the synthesis embedding information extraction unit 503 and the synchronization information input by the synchronization information input unit 506 coincide. Examples of the correction processing of the composite embedded information include bit insertion, bit deletion, bit inversion, and the like. The embedding information output unit 508 outputs embedding information after being processed by the error correction unit 507.

도 6은, 본 발명의 일 실시 형태에 따른 정보 처리 장치의 전기적인 구성도이다. 또한, 본 발명의 정보 처리 장치를 실현함에 있어서는, 도 5에 도시하는 모든 기능을 이용하는 것이 필수적인 것은 아니다.6 is an electrical configuration diagram of the information processing device according to one embodiment of the present invention. In addition, in realizing the information processing apparatus of this invention, it is not essential to utilize all the functions shown in FIG.

컴퓨터(601)는, 일반적으로 보급되어 있는 퍼스널 컴퓨터나 내장 시스템 등의 범용의 정보 처리 장치이다. 컴퓨터(601)는, 스캐너(617) 등의 화상 입력 장치로부터 판독된 화상을 입력받아, 편집이나 보관을 행하는 것이 가능하다. 또한, 화상 입력 장치에서 얻어진 화상을 프린터(616)로부터 인쇄시키는 것도 가능하다. 또한, 유저로부터의 지시는, 마우스(613), 키보드(614), 터치 패널(619) 등으로부터의 입력 조작에 의해 행해진다. 컴퓨터(601)의 내부에서는, 버스(607)에 의해 각 블록이 접속되어 있기 때문에, 여러 가지의 데이터 교환이 가능하다.The computer 601 is a general-purpose information processing apparatus, such as a personal computer and a built-in system, which are generally prevalent. The computer 601 can receive an image read from an image input device such as a scanner 617, and can edit and store it. It is also possible to print an image obtained by the image input device from the printer 616. In addition, the instruction from the user is performed by input operations from the mouse 613, the keyboard 614, the touch panel 619, and the like. Inside the computer 601, since each block is connected by the bus 607, various data exchanges are possible.

CPU(602)는, 컴퓨터(601) 내부의 각 블록의 동작을 제어하고, 또는 내부에 기억된 프로그램을 실행할 수 있다. 주기억 장치(RAM으로 구성됨)(603)는, CPU(602)에서 행해지는 처리를 위해, 일시적으로 프로그램이나 처리 대상의 화상 데이터를 저장하는 장치이다. 하드디스크(HDD)(604)는, 주기억 장치(603) 등에 전송되는 프로그램이나 화상 데이터를 미리 저장하거나, 처리 후의 화상 데이터를 보존하거나 할 수 있는 장치이다.The CPU 602 can control the operation of each block inside the computer 601 or execute a program stored therein. The main memory device (consisting of RAM) 603 is a device that temporarily stores a program or image data of a processing target for processing performed by the CPU 602. The hard disk (HDD) 604 is a device capable of storing in advance programs and image data transmitted to the main memory device 603 or the like, or storing image data after processing.

스캐너 인터페이스(615)는, 원고나 필름 등을 판독하여, 화상 데이터를 생성하는 스캐너(617)와 접속되고, 스캐너(617)에서 얻어진 화상 데이터를 입력받을 수 있는 인터페이스이다. 프린터 인터페이스(608)는, 화상 데이터를 인쇄하는 프린터(616)와 접속되고, 인쇄하는 화상 데이터를 프린터(616)에 송신할 수 있는 인터페이스이다.The scanner interface 615 is an interface that is connected to a scanner 617 that reads an original, a film, or the like and generates image data, and can receive image data obtained by the scanner 617. The printer interface 608 is connected to a printer 616 that prints image data, and is an interface that can transmit the image data to be printed to the printer 616.

CD 드라이브(609)는, 외부 기억 매체의 하나인 CD(CD-R/CD-RW)에 기억된 데이터를 읽어들이거나 써낼 수 있는 장치이다. FDD 드라이브(611)는, CD 드라이브(609)와 마찬가지로 FDD로부터의 읽어들이기나, FDD에의 써내기를 할 수 있는 장치이다. DVD 드라이브(610)는, FDD 드라이브(611)와 마찬가지로, DVD로부터의 읽어들이기나, DVD에의 써내기를 할 수 있는 장치이다. 또한, CD, FDD, DVD 등에 프로그램이 기억되어 있는 경우에는, 이들 프로그램을 HDD(604)에 인스톨하여, 필요 에 따라서 주기억 장치(603)에 전송되도록 되어 있다.The CD drive 609 is a device capable of reading or writing data stored in a CD (CD-R / CD-RW), which is one of external storage media. The FDD drive 611 is a device capable of reading from or writing to the FDD similarly to the CD drive 609. The DVD drive 610, like the FDD drive 611, is a device capable of reading from and writing to a DVD. When programs are stored in CD, FDD, DVD, and the like, these programs are installed in the HDD 604, and transferred to the main memory 603 as necessary.

입력 인터페이스(612)는, 마우스(613)나 키보드(614)로부터의 입력 지시를 접수하기 위하여 접속된 인터페이스이다. 터치 패널 인터페이스(618)는, 터치 패널(619)로부터의 입력 지시를 받기 위해 접속되는 인터페이스이다. 또한, 모니터(606)는, 매립 정보의 추출 처리 결과나 처리 과정을 표시할 수 있는 표시 장치이다. 또한, 비디오 컨트롤러(605)는, 표시 데이터를 모니터(606)에 송신하기 위한 장치이다.The input interface 612 is an interface connected for receiving input instructions from the mouse 613 or the keyboard 614. The touch panel interface 618 is an interface connected to receive an input instruction from the touch panel 619. The monitor 606 is a display device that can display the extraction processing result and the processing of the embedded information. The video controller 605 is a device for transmitting display data to the monitor 606.

또한, 본 발명은, 복수의 기기(예를 들면, 호스트 컴퓨터, 인터페이스 기기, 리더, 프린터 등)로 구성되는 시스템에 적용해도 되고, 하나의 기기로 이루어지는 MFP에 적용하여도 된다.In addition, the present invention may be applied to a system composed of a plurality of devices (for example, a host computer, an interface device, a reader, a printer, or the like) or may be applied to an MFP composed of one device.

상기의 구성에서, 주기억 장치(603)에 로드한 프로그램을 CPU(602) 등에 의해 실행함으로써, 정보 처리 장치로서 기능한다.In the above configuration, the program loaded in the main memory device 603 is executed by the CPU 602 or the like to function as an information processing device.

다음으로, 전술한 구성을 구비하는 정보 처리 장치에서 행해지는 각 처리에 대해서, 각 실시 형태에서 구체적으로 설명한다.Next, each process performed by the information processing apparatus which has the structure mentioned above is demonstrated concretely in each embodiment.

<제1 실시 형태><First Embodiment>

도 7은 제1 실시 형태에 따른 정보 처리 장치의 동작 수순을 나타내는 플로우차트, 도 8은 합성부(406)에서의 매립 정보 생성 처리를 구체예를 예를 들어 설명하기 위한 도면이다.7 is a flowchart showing an operation procedure of the information processing apparatus according to the first embodiment, and FIG. 8 is a view for explaining, as an example, a embedding information generation process in the combining unit 406.

우선, 매립 정보를 매립하는 대상으로 되는 문서(400)가, 스캐너(617) 등의 문서 입력부(401)를 통하여, 문서 해석부(402)에 입력된다(스텝 S701). 문서(400) 는, 인쇄물을 스캐너(617) 등으로부터 입력받고, 그것을 비트맵화한 것이어도 된다. 또한, 여러 가지의 전자 데이터를 화상 처리 소프트웨어 등에 의해 변환하고, 비트맵화한 것이어도 된다. 또한, 여러 가지의 전자 데이터는, 도 6의 하드디스크(604)나 CD 드라이브(609), DVD 드라이브(610), FDD 드라이브(611) 등에 접속된 각 기억 매체에 저장된 것이다.First, the document 400 to be embedded is embedded in the document analysis unit 402 via a document input unit 401 such as a scanner 617 (step S701). The document 400 may receive a printed matter from the scanner 617 or the like and bitmap it. In addition, various electronic data may be converted by image processing software or the like to form a bitmap. The various electronic data are stored in respective storage media connected to the hard disk 604, the CD drive 609, the DVD drive 610, the FDD drive 611, and the like in FIG.

다음으로, 문서 해석부(402)에서는, 문서 입력부(401)에 입력된 문서(400)의 외접 사각형(문자 영역)의 추출이 행해진다(스텝 S702). 또한, 문자의 외접 사각형은, 본래는, 문자 인식을 행하는 영역을 가리키는 정보이지만, 문서에 정보를 매립하는 기술 또는 매립된 정보를 추출하는 기술에서는, 매설 조작이 대상으로 되는 문자 영역을 나타내는 것이다. 구체적으로는, 문서 화상의 각 화소값을 수직 좌표축에 대하여 사영하고, 공백 부분(유의 화소가 없는 부분)을 탐색하여 행을 판별하여 행 분할을 행한다. 그 후, 행 단위로 문서(400)를 수평 좌표축에 대하여 사영하고, 공백 부분을 탐색하여 문자 단위로 분할한다. 이에 의해, 각 문자를 외접 사각형에서 잘라내는 것이 가능하게 된다.Next, the document analysis unit 402 extracts the circumscribed rectangle (character area) of the document 400 input to the document input unit 401 (step S702). In addition, although the circumscribed rectangle of a letter is originally information which shows the area | region which performs character recognition, in the technique of embedding information in a document, or the technique of extracting the embedded information, it represents the character area | region for which embedding operation is an object. Specifically, each pixel value of the document image is projected on the vertical coordinate axis, the blank portion (the portion having no significant pixel) is searched to determine the row, and the row division is performed. Thereafter, the document 400 is projected on a horizontal coordinate axis in units of lines, and a blank portion is searched for and divided into units of characters. This makes it possible to cut out each character from the circumscribed rectangle.

다음으로, 문서(400)에 매립할 매립 정보(403)가, 키보드(614) 등의 매립 정보 입력부(404)로부터 입력된다(스텝 S703). 매립 정보(403)는, 미리 기억 장치에 축적한 것으로부터 선택해도 된다.Next, the embedding information 403 to be embedded in the document 400 is input from the embedding information input unit 404 such as the keyboard 614 (step S703). The embedding information 403 may be selected from those stored in the storage device in advance.

다음으로, 매립 정보 입력부(404)에서 입력된 매립 정보로부터 오류 정정 부호가 생성된다(스텝 S704). 예를 들면, 도 8에 도시한 바와 같이, 매립 정보(801)로부터 오류 정정 부호(802)가 생성된다.Next, an error correction code is generated from the embedding information input from the embedding information input unit 404 (step S704). For example, as shown in FIG. 8, an error correction code 802 is generated from the embedding information 801.

다음으로, 합성부(406)에서 매립 정보에 동기 정보를 배열하여 부가한 합성 매립 정보를 생성한다(스텝 S705). 예를 들면, 도 8에서 도시한 바와 같이, 합성 매립 정보(805)는, 매립 정보(801)에 동기 정보(803)를 배열하여 매립한 정보이다. 1문자에 2비트의 정보가 매립되는 경우에는, 매립 정보의 1블록(예를 들면, 도 8의 참조 부호 804)은 1비트의 매립 정보와, 1비트의 동기 정보로 구성된다. 1문자에 n비트(n>1)의 정보가 매립되는 경우에는, 매립 정보의 1블록은 n-1비트의 매립 정보와, 1비트의 동기 정보로 구성된다. 이에 의해, 문자마다 동기 정보를 1비트씩 매립할 수 있다.Next, the synthesizing unit 406 generates the synthesizing embedding information added by arranging the synchronization information with the embedding information (step S705). For example, as shown in FIG. 8, the synthetic embedding information 805 is information embedded by arranging the synchronization information 803 in the embedding information 801. When two bits of information are embedded in one character, one block of embedded information (for example, reference numeral 804 in Fig. 8) is composed of one bit of embedding information and one bit of synchronization information. When n bits (n> 1) of information are embedded in one character, one block of embedding information is composed of n-1 bits of embedding information and 1 bit of synchronization information. As a result, one bit of synchronization information can be embedded for each character.

또한, 동기 정보는 주기 N(N>1)인 임의의 부호이면 된다. 본 실시 형태에서는, 동기 정보로서 의사 잡음 계열을 매립한다. 도 8에서 도시하는 동기 정보(803)는, 주기 7의 의사 잡음 계열을 나타낸다.The synchronization information may be any code having a period N (N> 1). In this embodiment, a pseudo noise series is embedded as synchronization information. The synchronization information 803 shown in FIG. 8 represents a pseudo noise series of period 7. As shown in FIG.

다음으로, 스텝 S702에서 추출한 외접 사각형을 1개 읽어들이고(스텝 S706), 매립부(407)에 의해 그 외접 사각형 내의 문자에 합성 매립 정보가 매립된다(스텝 S707). 읽어들여진 외접 사각형에는, 도 8에 도시하는 1블록의 합성 매립 정보가 매립된다.Next, one circumscribed rectangle extracted in step S702 is read (step S706), and the embedding section 407 embeds the embedded embedding information in the characters in the circumscribed rectangle (step S707). One block of synthetic embedding information shown in FIG. 8 is embedded in the read circumscribed quadrangle.

도 9는, 매립부(407)에서의 합성 매립 정보의 매립 처리의 설명도이다. 본처리는, 서로 다른 4종류의 매립 패턴(여기에서는, 도트 패턴)을 이용하여, 문자에 합성 매립 정보를 매립하는 것이다. 예를 들면, 문자에 합성 매립 정보 「00」(2진수로 표시)을 매립하는 데에, 도트 패턴 0(도 9에서 나타내는 참조 부호 900)으로 문자를 구성한다(도 9에서 나타내는 참조 부호 910). 문자에 합성 매립 정보 「01」을 매립하는 데에, 도트 패턴 1(도 9에서 나타내는 참조 부호 901)로 문자를 구성한다(도 9에서 나타내는 참조 부호 911). 문자에 합성 매립 정보 「10」을 매립하는 데에, 도트 패턴 2(도 9에서 나타내는 참조 부호 902)로 문자를 구성한다(도 9에서 나타내는 참조 부호 912). 문자에 합성 매립 정보 「11」을 매립하는 데에, 도트 패턴 3(도 9에서 나타내는 참조 부호 903)로 문자를 구성한다(도 9에서 나타내는 참조 부호 913). 또한, 문자의 윤곽에는 도트 패턴을 매립하지 않도록 하면, 문자 자체가 인식하기 쉬우므로, 바람직하다. 또한, 도트 패턴은, 동일한 농도를 갖고, 서로의 상호 상관이 낮은 것이면, 도 9에 도시한 패턴이 아니어도 된다. 여기에서는, 도트 패턴을 이용한 예를 나타냈지만, 도트 패턴이 아니어도, 1문자에 n비트(n은 2 이상의 정수) 매립하는 매립 방식이면 상관없다. 예를 들면, 다단계로 문자의 농담을 변경하거나, 혹은, 컬러나, 패턴·모양을 이용하는 것이어도 상관없다.9 is an explanatory diagram of the embedding process of the synthetic embedding information in the embedding unit 407. In this process, synthetic embedding information is embedded in a character by using four different types of embedding patterns (here, dot patterns). For example, a character is constituted by dot pattern 0 (reference numeral 900 shown in FIG. 9) to embed the embedded embedding information "00" (in binary representation) into the character (reference numeral 910 shown in FIG. 9). . To embed the composite embedding information "01" in the character, the character is constituted by dot pattern 1 (reference numeral 901 shown in FIG. 9) (reference numeral 911 shown in FIG. 9). To embed the composite embedding information "10" into the character, the character is constituted by dot pattern 2 (reference numeral 902 shown in FIG. 9) (reference numeral 912 shown in FIG. 9). To embed the composite embedding information "11" into the character, the character is constituted by dot pattern 3 (reference numeral 903 shown in FIG. 9) (reference numeral 913 shown in FIG. 9). Further, if the dot pattern is not embedded in the outline of the character, the character itself is easy to recognize, and therefore, it is preferable. In addition, the dot pattern may not be the pattern shown in FIG. 9, as long as it has the same density | concentration and the mutual correlation is low. Although the example using a dot pattern was shown here, even if it is not a dot pattern, it does not matter if it is a embedding system which embeds n bits (n is an integer of 2 or more) in one character. For example, the tone of a character may be changed in multiple steps, or it may use color, a pattern, and a pattern.

다음으로, 주목 외접 사각형이 문서(400) 내의 최종의 외접 사각형인지의 여부가 판단된다(스텝 S708). 스텝 S708에서, 그 주목 외접 사각형이 최종의 외접 사각형은 아니다고 판단된 경우에는, 스텝 S706으로 되돌아가서, 다음의 외접 사각형을 읽어들인다. 한편, 스텝 S708에서, 최종의 외접 사각형이라고 판단된 경우에는, 합성 매립 정보를 매립한 문서(409)가 생성된다(스텝 S709). 도 4에서 도시한 바와 같이, 이 정보가 매립된 문서(409)는, 문서 출력부(408)로부터 출력된다. 또한, 문서 출력부(408)에서의 출력은, 프린터에서의 인쇄, 기억 장치 등에의 화상 데이터로서의 기억, 또는 네트워크 등으로부터 다른 단말기 등에의 송신 등의 여러 가지 형태로 행할 수 있다.Next, it is judged whether or not the circumscribed rectangle of interest is the final circumscribed rectangle in the document 400 (step S708). If it is determined in step S708 that the circumscribed rectangle of interest is not the final circumscribed rectangle, the flow returns to step S706 to read the next circumscribed rectangle. On the other hand, when it is determined in step S708 that it is the final circumscribed rectangle, a document 409 in which the composite embedding information is embedded is generated (step S709). As shown in FIG. 4, the document 409 in which this information is embedded is output from the document output unit 408. In addition, the output from the document output unit 408 can be performed in various forms such as printing on a printer, storage as image data to a storage device, or the like, or transmission from a network or the like to another terminal.

도 10은, 제1 실시 형태에 따른 정보 처리 장치(추출 처리)의 동작 수순을 나타내는 플로우차트, 도 11은, 합성 매립 정보 추출부(503)에서의 합성 매립 정보 추출 처리를 구체예를 들어 설명하기 위한 도면이다.10 is a flowchart showing an operation procedure of the information processing apparatus (extraction processing) according to the first embodiment, and FIG. 11 is a concrete example illustrating the synthesis embedding information extraction processing in the synthesis embedding information extraction unit 503. It is a figure for following.

우선, 문서 화상 입력부(501)를 통하여, 문서 해석부(502)에 문서 화상이 입력되고(스텝 S1001), 문서 화상으로부터 외접 사각형의 추출을 행한 후에, 문자 잘라내기를 행한다(스텝 S1002). 이 처리는, 매립 처리를 행하는 정보 처리 장치의 문서 해석부(402)와 동일한 처리이다.First, a document image is input to the document analysis unit 502 through the document image input unit 501 (step S1001), and after extracting an outline rectangle from the document image, character cutting is performed (step S1002). This process is the same process as the document analysis part 402 of the information processing apparatus which performs the embedding process.

다음으로, 문자마다 매립된 합성 매립 정보를 추출한다(스텝 S1003). 합성 매립 정보는, 합성 매립 정보 추출부(503)에서 외접 사각형에 매립된 매립 패턴(도트 패턴)을 검출함으로써 추출할 수 있다. 본 실시 형태에서는, 1개의 외접 사각형으로부터 2비트의 정보가 추출된다. 예를 들면, 도 11에서, 문자열 「ABC…」로부터 합성 매립 정보(1101)가 추출되고, 문자 「A」로부터 합성 매립 정보 「10」이 추출되어 있기 때문에, 매립 정보는 「1」인 것을 알 수 있다. 다음으로, 분리부(504)에서, 추출된 합성 매립 정보로부터 동기 정보를 취출한다(스텝 S1004). 예를 들면, 도 11에서 도시한 바와 같이, 동기 정보(1102)가 취출된다. 이는, 합성 매립 정보의 각 블록으로부터 1비트씩 취출하여, 배열한 것이다.Next, the synthetic embedding information embedded for each character is extracted (step S1003). The synthesis embedding information can be extracted by detecting the embedding pattern (dot pattern) embedded in the circumscribed rectangle by the synthesis embedding information extraction unit 503. In this embodiment, two bits of information are extracted from one circumscribed rectangle. For example, in Fig. 11, the character string "ABC... ", The synthetic embedding information 1101 is extracted, and since the synthetic embedding information" 10 "is extracted from the character" A ", it turns out that embedding information is" 1 ". Next, the separation unit 504 extracts synchronization information from the extracted synthesis embedding information (step S1004). For example, as shown in FIG. 11, the synchronization information 1102 is taken out. This is obtained by arranging one bit from each block of the synthetic embedding information.

다음으로, 오류 정정부(507)에서, 분리부(504)에서 분리된 동기 정보와, 동기 정보 입력부(506)에서 입력된 동기 정보를 비교함으로써, 오류 개소를 검출한다(스텝 S1005). 예를 들면, 도 11에서 도시한 바와 같이, 입력된 동기 정보가 「 0110100…」이며, 분리된 동기 정보가 「01100100…」인 경우에는, 양자의 비교에 의해, 추출 정보의 3번째와 4번째에 오류가 발생한 것을 알 수 있다.Next, the error correction unit 507 compares the synchronization information separated by the separation unit 504 with the synchronization information input by the synchronization information input unit 506 to detect an error location (step S1005). For example, as shown in FIG. 11, the input synchronization information is &quot; 0110100... And the separated synchronization information is &quot; 01100100... ", It can be seen that an error occurs in the third and fourth of the extraction information by comparison between the two.

또한, 본 실시 형태에서, 동기 정보는, 의사 잡음 계열(PN 계열)로 표현되기 때문에, 동기 정보의 상호 상관을 취함으로써 동기 오류 위치를 검출해도 된다. 의사 잡음 계열은, Paa(k)=1(k=0), -1/n(0<k<n)이라고 하는 자기 상관 함수를 갖는 계열이다. 도 12는, 주기 7의 의사 잡음 계열의 자기 상관 함수의 설명도이다. 이 자기 상관 함수를 이용한 경우에는, 동기 정보에 오류가 발생하지 않는 경우에는, 구해진 상호 상관값은 1 또는 -1/7로 되지만, 동기 정보에 오류가 발생한 경우에는, 상호 상관값은 1 또는 -1/7 이외로 되므로, 오류 개소를 용이하게 발견할 수 있다.In addition, in this embodiment, since the synchronization information is represented by a pseudo noise series (PN series), the synchronization error position may be detected by cross-correlating the synchronization information. The pseudo noise series is a series having an autocorrelation function of Paa (k) = 1 (k = 0) and −1 / n (0 <k <n). 12 is an explanatory diagram of an autocorrelation function of a pseudo noise series of a period 7. FIG. In the case of using this autocorrelation function, when no error occurs in the synchronization information, the obtained cross-correlation value is 1 or -1/7. However, when an error occurs in the synchronization information, the cross-correlation value is 1 or-. Since it becomes other than 1/7, an error location can be found easily.

스텝 S1005에서, 동기 오류가 검출된 경우에는, 스텝 S1006으로 진행한다. 오류 정정부(507)에서, 검출한 오류 개소의 동기 정보를 정정한다. 또한, 동기 오류 정정의 종류에는 비트의 삽입, 삭제, 반전이 있다. 입력된 동기 정보와 분리된 동기 정보가 일치하도록, 분리된 동기 정보를 정정한다. 결과적으로, 문자의 변과 방이 분리하여 외접 사각형이 추출된 경우에는, 오류 개소의 비트가 삭제된다. 또한, 문자와 문자가 결합하여 외접 사각형이 추출된 경우에는, 비트가 삽입된다.When a synchronization error is detected in step S1005, the flow advances to step S1006. The error correction unit 507 corrects the synchronization information of the detected error point. The types of synchronization error correction include bit insertion, deletion, and inversion. The separated sync information is corrected so that the input sync information matches the separated sync information. As a result, when the side and the room of the character are separated and the circumscribed rectangle is extracted, the bit at the error point is deleted. In addition, when characters and characters are combined to extract an circumscribed rectangle, bits are inserted.

도 13은, 오류 정정부(507)에서의 동기 오류 정정 처리를 구체예를 들어 설명하기 위한 도면이다. 문자를 「ABC」, 매립 정보를 「S」, 동기 정보를 「X」로 한다. 단, 문자 「B」는, 외접 사각형의 추출에서, 2개의 문자로서 인식되고, 분리하는 문자는 아니지만, 여기에서는, 외접 사각형의 추출에서, 2개의 문자로서 추 출되는 것으로 한다. 참조 부호 1301에서, 동기 오류 개소(1302)가 검출된 경우에는, 동기 오류가 정정된다(도 13에서 나타내는 참조 부호 1303). 여기에서는, 1비트 삽입 오류가 발생했기 때문에, 오류 개소의 1비트의 동기 정보가 삭제된다. 다음으로, 동기 오류 정정에 의해 매립 정보의 위치가 정정된다(도 13에서 나타내는 참조 부호 1304). 이러한 동기 오류 정정 처리에 의해, 매립 정보의 동기 오류 정정을 행한다.FIG. 13 is a diagram for explaining, by way of example, synchronous error correction processing in the error correction unit 507. As shown in FIG. The character is "ABC", the embedding information is "S", and the synchronization information is "X". However, the letter "B" is recognized as two characters in the extraction of the circumscribed rectangle, and is not a character to be separated, but here, it is assumed that the character "B" is extracted as two characters in the extraction of the circumscribed rectangle. In the reference numeral 1301, when a synchronization error point 1302 is detected, the synchronization error is corrected (reference numeral 1303 shown in FIG. 13). Here, since a one-bit insertion error has occurred, the synchronization information of one bit at the error point is deleted. Next, the position of the embedding information is corrected by synchronization error correction (reference numeral 1304 shown in FIG. 13). By such synchronization error correction processing, synchronization error correction of embedded information is performed.

스텝 S1006에서, 동기 오류 정정이 종료하면, 스텝 S1005로 되돌아가서, 다음의 동기 오류 개소를 검출한다. 한편, 스텝 S1005에서, 동기 오류의 개소가 검출되지 않은 경우에는, 분리부(504)에서 분리된 매립 정보의 오류 정정을 행한다(스텝 S1007). 이 처리는, 오류 정정부(507)에서 실행되어, 오류 정정 부호에 의한 정정을 행한다. 다음으로, 매립 정보 출력부(508)에서, 매립 정보를 출력하고(스텝 S1008), 처리를 종료한다.When the synchronization error correction ends in step S1006, the flow returns to step S1005 to detect the next synchronization error point. On the other hand, when the location of the synchronization error is not detected in step S1005, error correction of the embedding information separated by the separating unit 504 is performed (step S1007). This process is executed by the error correction unit 507 to correct with an error correction code. Next, the embedding information output unit 508 outputs embedding information (step S1008), and the process ends.

또한, 일반적인 GMD(Generalized Minimum Distance decoding)법을 이용하여, 수신한 각 심볼의 신뢰도를 맞추어서 이용함으로써, 복호의 신뢰성을 향상시켜도 된다. 이 신뢰도는, 종전에 추출 오류가 있다고 판정된 것은, 추출 오류가 발생하기 쉬운 부위라고 하는 생각에 기초하고 있다. 추출된 매립 정보에는, 각각 신뢰도(예를 들면, R=1)를 부가하고, 이 신뢰도 R에 기초하여, 매립 정보의 오류 정정을 행한다. 매립 정보 비트가 동기 오류 정정된 경우에는, 신뢰도 R을 낮게 설정해도 된다. 예를 들면, 정정 후의 신뢰도를 R(n), 정정 전의 신뢰도를 R(n-1)로서, R(n)=R(n-1)*0.8로 나타낸 바와 같이, 매립 정보가 오류 정정된 경우에는, 신뢰도를 정정 전의 80%로 설정할 수 있다. 또한, 문자의 폰트가 작은 경우에는, 문자 면적이 작아, 매립 정보의 추출율이 악화되기 때문에, 매립 정보의 신뢰도와 문자 면적을 연동해도 된다. 또한, 문자로부터 추출한 도트 패턴의 유사도와 매립 정보의 신뢰도를 연동해도 된다.In addition, the reliability of decoding may be improved by using the reliability of each received symbol by using the generalized General Minimum Distance Decoding (GMD) method. This reliability is based on the idea that the extraction error was previously determined to be a site where the extraction error is likely to occur. Reliability (for example, R = 1) is added to the extracted embedding information, and error correction of the embedding information is performed based on this reliability R. FIG. When the embedding information bit is corrected for synchronization error, the reliability R may be set low. For example, when the embedding information is error corrected as indicated by R (n) = R (n-1) and R (n) = R (n-1) * 0.8 as the reliability after correction as R (n). The reliability can be set to 80% before correction. In addition, when the font of the character is small, the character area is small and the extraction rate of embedding information deteriorates, so that the reliability of the embedding information and the character area may be linked. Further, the similarity of the dot pattern extracted from the character and the reliability of the embedding information may be linked.

또한, 동기 오류를 검출한 경우, 오류 위치를 문자 해석부(502)에 통지하고, 사각형 추출을 다시해도 된다. 여기에서는 도 14에 도시하는 플로우차트를 이용하여 설명한다. 스텝 S1005에서, 동기 오류가 검출된 경우에는, 오류 위치를 문자 해석부(502)에 통지하고, 다시 외접 사각형의 추출을 행해도 된다. 또한, 전술한 처리와 마찬가지인 스텝 S1001로부터 스텝 S1004의 설명은 생략한다. 스텝 S1005에서, 동기 오류 개소가 검출된 경우에는, 스텝 S1002로 되돌아간다. 다음으로, 오류 개소의 위치 정보를 이용하여 외접 사각형을 정정하고(스텝 S1002), 정정 개소의 합성 매립 정보를 재추출한다(스텝 S1003). 이에 의해, 문자 잘라내기 오류가 발생한 경우라도, 정확하게 매립 정보를 추출할 수 있다.In addition, when a synchronization error is detected, the character position analysis unit 502 may be notified of the error position, and square extraction may be performed again. Here, it demonstrates using the flowchart shown in FIG. In step S1005, when a synchronization error is detected, the character analysis unit 502 may be notified of the error position, and the external rectangle may be extracted again. In addition, description of step S1004 is abbreviate | omitted from step S1001 similar to the process mentioned above. If a synchronization error point is detected in step S1005, the flow returns to step S1002. Next, the circumscribed rectangle is corrected using the positional information of the error point (step S1002), and the extracted composite embedding information of the correction point is reextracted (step S1003). In this way, even when a character truncation error occurs, embedding information can be extracted accurately.

또한, 본 실시 형태에서는, 매립 정보(403)를 구성하는 n-1비트와, 동기 정보를 구성하는 1비트를, 1문자에 매립하는 예를 나타냈지만, 이에 한정되지 않는다. 예를 들면, 1문자에 2비트의 동기 정보를 매립해도 상관없다. 즉, 1문자에, 동기 정보가 적어도 1비트 매립되어 있으면 된다. 또한, 합성 매립 정보의 생성의 방법에서도, 동기 정보를 구성하는 1비트를, 매립 정보를 구성하는 n-1비트 후에 합성하는 예를 나타냈지만, 이에 한정되지 않는다. 예를 들면, 매립 정보의 앞이나, 매립 정보의 사이이어도 상관없고, 추출측과 동기 정보의 개소를 공유할 수 있 으면 된다.In the present embodiment, an example in which n-1 bits constituting the embedding information 403 and 1 bit constituting the synchronization information are embedded in one character is illustrated, but the present invention is not limited thereto. For example, two bits of synchronization information may be embedded in one character. In other words, it is sufficient that at least one bit of synchronization information is embedded in one character. In the method of generating the embedding embedding information, an example in which one bit constituting the synchronization information is synthesized after n-1 bits constituting the embedding information has been described, but the present invention is not limited thereto. For example, it may be in front of the embedding information or between the embedding information, and may share the location of the synchronization information with the extraction side.

<제1 실시 형태-변형예 1><1st embodiment-modification 1>

본 변형예에서는, 문자 사이즈에 따라서 매립하는 동기 정보를 선택할 수 있도록 연구를 더하였다. 또한, 매립 정보 매립 처리에서의 스텝 S705 이외에는, 제1 실시 형태와 마찬가지이기 때문에, 설명을 생략한다.In this modification, the study was added so that the synchronization information embedded in the character size could be selected. In addition, since it is the same as that of 1st Embodiment except the step S705 in the embedding information embedding process, description is abbreviate | omitted.

본 변형예에 따른 정보 처리 장치(매립 처리)의 구성은, 공통 구성으로 설명 한 것(도 4) 외에, 제1 주기의 비트 패턴과, 제1 주기보다도 긴 제2 주기의 비트 패턴을 기억하는 비트 패턴 기억부를 구비한다. 또한, 매립 대상의 문자의 외접 사각형의 사이즈를 검출하는 검출부를 구비한다. 또한, 검출부에 검출된 외접 사각형의 면적이 미리 설정된 임계값보다도 큰 경우에는, 제1 주기의 비트 패턴을 선택하고, 외접 사각형의 면적이 미리 설정된 임계값 이하인 경우에는 제2 주기의 비트 패턴을 선택하는 선택부를 구비한다. 비트 패턴 입력부는, 선택부에서 선택한 비트 패턴을 입력한다.The configuration of the information processing apparatus (embedded processing) according to the present modification is a common configuration (Fig. 4), except that the bit pattern of the first period and the bit pattern of the second period longer than the first period are stored. And a bit pattern storage section. Moreover, the detection part which detects the size of the circumference rectangle of the character of embedding object is provided. If the area of the circumscribed rectangle detected by the detection unit is larger than the preset threshold, the bit pattern of the first period is selected. If the area of the circumscribed rectangle is less than or equal to the preset threshold, the bit pattern of the second period is selected. It has a selection part to make. The bit pattern input unit inputs the bit pattern selected by the selection unit.

여기에서, 동기 정보의 선택 방법에 대해서, 상세히 설명한다. 도 15는, 제1 실시 형태의 변형예 1에서의 스텝 S705의 상세한 동작 수순을 나타내는 플로우차트, 도 16 및 도 17은, 제1 실시 형태의 변형예 1에 따른 외접 사각형 오류의 설명도이다.Here, the method of selecting synchronization information will be described in detail. FIG. 15 is a flowchart showing the detailed operation procedure of step S705 in the first modified example of the first embodiment, and FIG. 16 and FIG. 17 are explanatory diagrams of a circumscribed square error according to the first modified example.

우선, 1문자의 외접 사각형 면적을 산출한다(스텝 S705a). 이 외접 사각형 면적은, 스텝 S702에서 산출한 외접 사각형 정보로부터 산출할 수 있다. 또한, 외접 사각형의 면적을 산출하는 데에 있어서, 문서 화상의 최초의 문자만으로부터 외 접 사각형 면적을 산출해도 되고, 문서 화상 전체의 외접 사각형 면적의 평균을 산출해도 된다. 또한, 각 단락의 최초의 문자만을 추출하여 외접 사각형 면적의 평균을 산출해도 되고, 문서 화상 중에서 랜덤하게 선택한 문자로부터 외접 사각형 면적을 산출해도 된다.First, a circumscribed rectangular area of one character is calculated (step S705a). This circumscribed square area can be calculated from the circumscribed square information calculated in step S702. In calculating the area of the circumscribed rectangle, the circumscribed rectangle area may be calculated from only the first character of the document image, or the average of the circumscribed rectangle area of the entire document image may be calculated. In addition, only the first character of each paragraph may be extracted to calculate the average of the circumscribed square area, or the circumscribed square area may be calculated from characters randomly selected from the document images.

다음으로, 산출된 외접 사각형 면적이, 임의의 임계값 M보다 큰지의 여부를 비교한다. 또한, 임계값 M은, 유저가 미리 임의로 정할 수 있다. 외접 사각형 면적이 임계값 M보다 큰 경우에는, 짧은 주기(제1 주기)의 동기 정보를 선택한다(스텝 S705c). 예를 들면, 주기가 2인 동기 정보 「0101…」을 이용해도 된다. 이는, 외접 사각형의 면적이 큰 경우에는, 변과 방이 2개로 분리되는 사각형 추출 오류(도 16c에서 도시하는 문자 「靜」)만 발생하기 때문이다. 이러한 사각형 추출 오류는, 짧은 주기의 동기 정보에서도 용이하게 발견할 수 있다.Next, it is compared whether the calculated circumscribed square area is larger than an arbitrary threshold value M. The threshold M can be arbitrarily determined by the user in advance. When the circumscribed square area is larger than the threshold M, the synchronization information of a short period (first period) is selected (step S705c). For example, the synchronization information &quot; 0101... &Quot; May be used. This is because, when the area of the circumscribed rectangle is large, only a square extraction error (character "靜" shown in Fig. 16C) in which sides and rooms are divided into two occurs. Such square extraction errors can be easily found even in short periods of synchronization information.

한편, 외접 사각형의 면적이 임계값 M 이하인 경우에는, 제1 주기보다도 긴 주기(제2 주기)의 동기 정보를 선택한다(스텝 S705d). 이는, 외접 사각형의 면적이 작은 경우에는, 도 17에서 도시한 바와 같이, 다수의 문자에 걸친 사각형 추출 오류가 발생하기 쉽기 때문이다. 다음으로, 선택된 동기 정보를 매립 정보에 부가한다(스텝 S705e).On the other hand, when the area of the circumscribed quadrangle is equal to or less than the threshold M, the synchronization information of a period longer than the first period (second period) is selected (step S705d). This is because, when the area of the circumscribed rectangle is small, as shown in Fig. 17, a square extraction error over a large number of characters is likely to occur. Next, the selected synchronization information is added to the embedding information (step S705e).

또한, 매립 정보를 추출할 때에 매립된 동기 정보의 종류는, 스텝 S705a를 실행함으로써 용이하게 판단할 수 있다.In addition, the kind of synchronization information embedded when the embedding information is extracted can be easily determined by executing step S705a.

<제2 실시 형태><2nd embodiment>

본 실시 형태에서는, 입력된 문서 화상이, 매립 정보가 매립되어 있는 문서 화상 인지의 여부를 용이하게 판단할 수 있도록 연구를 더하였다. 본 실시 형태에서는, 매립 정보 추출 처리에서, 제1 실시 형태에 부분적으로 처리를 추가한 것뿐이기 때문에, 공통의 부분에 대해서는 공통의 부호를 붙이고, 설명을 생략한다.In the present embodiment, studies have been added to easily determine whether the input document image is a document image in which embedding information is embedded. In the present embodiment, in the embedding information extraction process, since only the process is partially added to the first embodiment, the common parts are denoted by the common reference numerals, and description thereof is omitted.

도 2는, 제2 실시 형태에 따른 정보 처리 장치(추출 처리)의 동작 수순을 나타내는 플로우차트, 도 3은, 제2 실시 형태에 따른 스텝 S1801의 상세한 동작 수순을 나타내는 플로우차트이다.2 is a flowchart showing an operation procedure of the information processing apparatus (extraction processing) according to the second embodiment, and FIG. 3 is a flowchart showing a detailed operation procedure of step S1801 according to the second embodiment.

우선, 문서 화상을 판독하고(스텝 S1001), 판독한 문서 화상의 외접 사각형을 추출한다(스텝 S1002). 다음으로, 추출한 동기 정보와 매립한 동기 정보와의 상호 상관값을 산출하고(스텝 S1801), 올바른 상호 상관값이 있는지의 여부를 판단한다(스텝 S1802). 스텝 S1802에서, 올바른 상호 상관값이 있다고 판단된 경우에는, 그 문서 화상에는 매립 정보가 매립되어 있다고 판단되어, 제1 실시 형태와 동일한 수순으로 매립 정보를 추출한다. 한편, 스텝 S1802에서, 올바른 상호 상관값이 없다고 판단된 경우에는, 그 문서 화상에는 매립 정보가 매립되어 있지 않다고 판단되어, 매립 정보 추출의 처리를 종료한다. 또한, 본 실시 형태에서는, 적어도 1개소의 상호 상관값이 올바르다고 판단된 경우에는, 문서 화상에는 매립 정보가 매립되어 있다고 판단된다.First, the document image is read (step S1001), and the circumscribed rectangle of the read document image is extracted (step S1002). Next, a cross correlation value between the extracted synchronization information and the embedded synchronization information is calculated (step S1801), and it is determined whether or not there is a correct cross correlation value (step S1802). When it is determined in step S1802 that there is a correct cross correlation value, it is determined that embedding information is embedded in the document image, and the embedding information is extracted in the same procedure as in the first embodiment. On the other hand, when it is determined in step S1802 that there is no correct cross correlation value, it is determined that embedding information is not embedded in the document image, and the processing of embedding information extraction ends. In addition, in this embodiment, when it is determined that at least one cross-correlation value is correct, it is determined that embedding information is embedded in the document image.

여기에서, 도 3을 이용하여, 스텝 S1801에서의 상호 상관값의 산출 수순에 대하여 설명한다. 우선, 연속된 외접 사각형을 취출한다(스텝 S1801a). 또한, 취출하는 외접 사각형의 수는, 예를 들면, 최소의 동기 정보의 주기의 2배로 한다. 또한, 외접 사각형은, 문서 화상의 임의의 개소로부터 취출하여도 된다.Here, the calculation procedure of the cross correlation value in step S1801 is demonstrated using FIG. First, a continuous circumscribed rectangle is taken out (step S1801a). The number of circumscribed quadrangulars to be taken out is, for example, twice the period of the minimum synchronization information. In addition, you may take out a circumscribed rectangle from arbitrary places of a document image.

다음으로, 취출한 외접 사각형으로부터 동기 정보를 추출하고(스텝 S1801b), 추출한 동기 정보와, 매립한 동기 정보와의 상호 상관값을 산출한다(스텝 S1801c). 또한, 매립 정보가 매립되어 있는 문서 화상에는 의사 잡음 계열이 매립되어 있기 때문에, 올바른 경우의 상호 상관값은, 1 또는 -1/N이다.Next, the synchronization information is extracted from the extracted circumscribed rectangle (step S1801b), and the cross correlation value between the extracted synchronization information and embedded synchronization information is calculated (step S1801c). In addition, since the pseudo noise series is embedded in the document image in which the embedding information is embedded, the cross-correlation value in the correct case is 1 or -1 / N.

<그 밖의 실시 형태><Other embodiments>

본 발명의 목적은, 전술한 실시 형태의 기능을 실현하는 소프트웨어의 프로그램 코드를 기록한 기록 매체(또는 기억 매체)를 장치에 공급하고, 그 장치의 컴퓨터가 기록 매체에 저장된 프로그램 코드를 읽어들여 실행함으로써도 실현 가능하다. 또한, 컴퓨터에는, CPU나 MPU가 포함된다. 이 경우, 기록 매체로부터 읽어내어진 프로그램 코드(컴퓨터 프로그램) 자체가 전술한 실시 형태의 기능을 실현하게 되고, 그 프로그램 코드를 기록한 기록 매체(컴퓨터 판독 가능 기억 매체)는, 본 발명을 구성하게 된다.An object of the present invention is to supply a recording medium (or a storage medium) on which a program code of software for realizing the functions of the above embodiments is provided to a device, and the computer of the device reads and executes the program code stored in the recording medium. It is also feasible. In addition, the computer includes a CPU and an MPU. In this case, the program code (computer program) read out from the recording medium itself realizes the functions of the above-described embodiments, and the recording medium (computer readable storage medium) on which the program code is recorded constitutes the present invention. .

또한, 컴퓨터가 읽어낸 프로그램 코드의 지시에 기초하여, 컴퓨터 상에서 가동하고 있는 오퍼레이팅 시스템(OS) 등이 실제의 처리의 일부 또는 전부를 실행함으로써, 전술한 실시 형태의 기능이 실현되는 경우도 포함된다.Moreover, based on the instruction | indication of the program code which the computer read out, the operating system OS etc. which are running on the computer etc. perform a part or all of actual process, and the function of the above-mentioned embodiment is also implemented. .

또한, 기록 매체로부터 읽어내어진 프로그램 코드가, 컴퓨터에 삽입된 기능 확장 카드나 컴퓨터에 접속된 기능 확장 유닛에 구비되는 메모리에 기입된다. 그 후, 프로그램 코드의 지시에 기초하여, 그 기능 확장 카드나 기능 확장 유닛에 구비되는 CPU 등이 실제의 처리의 일부 또는 전부를 실행함으로써, 전술한 실시 형태의 기능이 실현되는 경우도 포함된다.The program code read out from the recording medium is also written into a memory provided in the function expansion card inserted into the computer or the function expansion unit connected to the computer. Subsequently, the function of the above-described embodiment is also realized by the CPU or the like provided in the function expansion card, the function expansion unit, or the like executing the part or all of the actual processing based on the instruction of the program code.

본 발명을 상기 기록 매체에 적용하는 경우에는, 그 기록 매체에는, 앞서 설명한 플로우차트에 대응하는 프로그램 코드가 저장되게 된다.When the present invention is applied to the recording medium, the program code corresponding to the flowchart described above is stored in the recording medium.

또한, 전술한 실시 형태에서는, 합성 매립 정보에 오류 정정 부호를 부가했지만, 본 발명에서는, 오류 정정 부호를 부가하는 것은 필수는 아니다.In addition, although the error correction code was added to the synthesis embedding information in the above-described embodiment, it is not essential to add the error correction code in the present invention.

본 발명에 따른 여러 가지 실시예를 제시하고 기술하였지만, 본 발명의 범위를 벗어남 없이 변경 및 변경될 수 있다는 것을 이해하여야 한다. 따라서, 본 명세서에 제시되고 기술된 상세 내용에 한정하려는 것은 아니며, 첨부된 특허 청구 범위 내에 있는 바와 같은 모든 변형 및 변경들을 포함하는 것이다.While various embodiments in accordance with the present invention have been presented and described, it should be understood that modifications and variations can be made without departing from the scope of the present invention. Accordingly, it is not intended to be limited to the details set forth and described herein, but is to cover all modifications and changes as come within the scope of the appended claims.

도 1a 내지 도 1d는 종래의 외접 사각형 추출 처리의 설명도.1A to 1D are explanatory diagrams of a conventional circumscribed rectangular extraction process.

도 2는 제2 실시 형태에 따른 정보 처리 장치(추출 처리)의 동작 수순을 나타내는 플로우차트.2 is a flowchart showing an operation procedure of an information processing apparatus (extraction processing) according to the second embodiment.

도 3은 제2 실시 형태에 따른 스텝 S1801의 상세한 동작 수순을 나타내는 플로우차트.3 is a flowchart showing a detailed operation procedure of step S1801 according to the second embodiment.

도 4는 본 발명의 일 실시 형태에 따른 정보 처리 장치(매립 처리)의 개략적인 구성도.4 is a schematic configuration diagram of an information processing apparatus (embedded processing) according to one embodiment of the present invention.

도 5는 본 발명의 일 실시 형태에 따른 정보 처리 장치(추출 처리)의 개략적인 구성도.5 is a schematic configuration diagram of an information processing device (extraction process) according to an embodiment of the present invention.

도 6은 본 발명의 일 실시 형태에 따른 정보 처리 장치의 전기적인 구성도.6 is an electrical configuration diagram of an information processing device according to one embodiment of the present invention.

도 7은 제1 실시 형태에 따른 정보 처리 장치(매립 처리)의 동작 수순을 나타내는 플로우차트.FIG. 7 is a flowchart showing an operation procedure of an information processing apparatus (embedded processing) according to the first embodiment. FIG.

도 8은 합성부(406)에서의 합성 처리를 구체예를 들어 설명하기 위한 도면.8 is a diagram for explaining, by way of example, a synthesis process in the synthesis unit 406.

도 9는 매립부(407)에서의 합성 매립 정보의 매립 처리를 설명하기 위한 도면.9 is a diagram for explaining the embedding process of the synthetic embedding information in the embedding unit 407.

도 10은 제1 실시 형태에 따른 정보 처리 장치(추출 처리)의 동작 수순을 나타내는 플로우차트.10 is a flowchart showing an operation procedure of an information processing apparatus (extraction processing) according to the first embodiment.

도 11은 합성 매립 정보 추출부(503)에서의 합성 매립 정보의 추출 처리를 구체예를 들어 설명하기 위한 도면.11 is a diagram for explaining, by way of example, extraction processing of synthesis embedding information in the synthesis embedding information extraction unit 503;

도 12는 주기 7의 의사 잡음 계열의 자기 상관 함수의 설명도.12 is an explanatory diagram of an autocorrelation function of a pseudo noise series in a period 7. FIG.

도 13은 제어부(507)에서의 동기 오류 정정 처리를 구체예를 들어 설명하기 위한 도면.Fig. 13 is a diagram for explaining, by way of example, synchronization error correction processing in the control unit 507;

도 14는 제1 실시 형태에 따른 정보 처리 장치(추출 처리)의 동작 수순을 나타내는 플로우차트.14 is a flowchart showing an operation procedure of an information processing apparatus (extraction processing) according to the first embodiment.

도 15는 제1 실시 형태의 변형예 1에 따른 스텝 S705의 상세한 동작 수순을 나타내는 플로우차트.Fig. 15 is a flowchart showing the detailed operation procedure of step S705 according to the modification 1 of the first embodiment.

도 16a 내지 도 16d는 제1 실시 형태의 변형예 1에 따른 외접 사각형 오류의 설명도.16A to 16D are explanatory diagrams of a circumscribed square error according to Modification Example 1 of the first embodiment.

도 17은 제1 실시 형태의 변형예 1에 따른 외접 사각형 오류의 설명도.17 is an explanatory diagram of a circumscribed square error in Modification Example 1 of the first embodiment;

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

601 : 컴퓨터601: Computer

602 : CPU602 CPU

603 : 주 기억 장치603: main memory

604 : HDD604: HDD

605 : 비디오 컨트롤러605: Video Controller

606 : 모니터606: monitor

607 : 버스607: Bus

608 : 프린터 인터페이스608: Printer Interface

609 : CD 드라이브609: CD drive

610 : DVD 드라이브610: DVD Drive

611 : FDD 드라이브611: FDD Drive

612 : 입력 인터페이스612: input interface

613 : 마우스613: Mouse

614 : 키보드614: keyboard

615 : 스캐너 인터페이스615: Scanner Interface

616 : 프린터616: Printer

617 : 스캐너617: Scanner

618 : 터치 패널 인터페이스618: touch panel interface

619 : 터치 패널619: touch panel

Claims (9)

문서 내의 각 문자에, n비트(n은 2 이상의 정수)의 정보를 매립하는 정보 처리 장치로서,An information processing apparatus that embeds n-bit information (n is an integer of 2 or more) in each character in a document, 문자로 구성되는 문서를 입력하는 문서 입력 수단과,Document input means for inputting a document composed of characters; 상기 문서에 매립할 매립 정보를 입력하는 매립 정보 입력 수단과,Embedding information input means for inputting embedding information to be embedded in the document; 복수 비트로 구성되고, 미리 설정된 비트 패턴으로 이루어지는 동기 정보를 입력하는 동기 정보 입력 수단과,Synchronization information input means configured to input synchronization information composed of a plurality of bits and composed of a preset bit pattern; 입력된 매립 정보를 구성하는 비트와, 상기 동기 정보를 구성하는 비트를 합성함으로써, 합성 매립 정보를 생성하는 합성 수단과,Synthesizing means for generating synthesized embedding information by synthesizing bits constituting the input embedding information and bits constituting the synchronization information; 상기 합성 수단에 의해 생성된 합성 매립 정보를 상기 문서 입력 수단에 의해 입력된 문서 내의 각 문자에 매립하고, 매립 후의 문서를 출력하는 매립 수단Embedding means for embedding the synthetic embedding information generated by the synthesizing means into each character in a document input by the document input means, and outputting the document after embedding; 을 구비하고,And 상기 매립 수단은, 각 문자에 적어도 1비트의 동기 정보를 매립하는 것을 특징으로 하는 정보 처리 장치.The embedding means embeds at least one bit of synchronization information in each character. 제1항에 있어서,The method of claim 1, 상기 매립 수단은,The embedding means, 2n개의 매립 패턴을 기억하는 기억 수단과,Storage means for storing 2 n embedded patterns; 상기 합성 수단에 의해 생성된 상기 합성 매립 정보 내의 n비트의 값에 따라서, 상기 기억 수단에 기억된 매립 패턴 중 어느 하나를 선택하고, 매립 대상의 문자의 외접 사각형 내의 문자 화상을 마스크하는 마스크 수단Mask means for selecting any one of the embedding patterns stored in said storage means and masking a character image in the circumscribed rectangle of the character to be embedded, in accordance with the value of n bits in said composite embedding information generated by said synthesizing means. 을 갖는 것을 특징으로 하는 정보 처리 장치.An information processing apparatus comprising: 제1항에 있어서,The method of claim 1, 제1 주기의 비트 패턴과, 그 제1 주기보다도 긴 제2 주기의 비트 패턴을 기억하는 비트 패턴 기억 수단과,Bit pattern storage means for storing the bit pattern of the first period and the bit pattern of the second period longer than the first period; 매립 대상의 문자의 외접 사각형의 사이즈를 검출하는 검출 수단과,Detection means for detecting the size of the circumscribed rectangle of the character to be embedded; 상기 검출 수단이 검출한 외접 사각형의 면적이 미리 설정된 임계값보다도 큰 경우에는, 상기 제1 주기의 비트 패턴을 선택하고, 상기 외접 사각형의 면적이 상기 미리 설정된 임계값 이하인 경우에는 상기 제2 주기의 비트 패턴을 선택하는 선택 수단과,If the area of the circumscribed rectangle detected by the detection means is larger than a preset threshold value, the bit pattern of the first period is selected, and if the area of the circumscribed rectangle is less than or equal to the preset threshold value, Selecting means for selecting a bit pattern; 상기 선택 수단에 의해 선택한 비트 패턴을 입력하는 비트 패턴 입력 수단Bit pattern input means for inputting the bit pattern selected by the selection means 을 더 구비하는 것을 특징으로 하는 정보 처리 장치.An information processing apparatus further comprising: a. 제1항에 있어서,The method of claim 1, 상기 매립 정보 입력 수단에 의해 입력된 상기 매립 정보에 오류 정정 정보를 부가하는 오류 정정 정보 부가 수단을 더 구비하고,And error correction information adding means for adding error correction information to the embedding information input by the embedding information input means, 상기 합성 수단은, 상기 오류 정정 정보 부가 수단에 의해 부가된 상기 오류 정정 정보의 부가 결과와, 상기 동기 정보 입력 수단에 의해 입력된 동기 정보를 합성하는 것을 특징으로 하는 정보 처리 장치.And the synthesizing means synthesizes the addition result of the error correction information added by the error correction information adding means and the synchronization information input by the synchronization information input means. 문서 화상 내의 각 문자에 n비트(n은 2 이상의 정수)의 정보가 매립되고, 그 n비트 중, 적어도 1비트가 동기 정보로서 매립되어 있는 문서 화상으로부터 정보를 추출하는 정보 처리 장치로서,An information processing apparatus for extracting information from a document image in which n bits (n is an integer of 2 or more) is embedded in each character in the document image, and at least one bit among the n bits is embedded as synchronization information, 문서 화상을 입력하는 문서 화상 입력 수단과,Document image input means for inputting a document image; 입력된 문서 화상 내의 각 문자의 외접 사각형을 구하고, 그 외접 사각형 내의 문자에 매립된 정보를 추출하는 합성 매립 정보 추출 수단과,Synthetic embedding information extracting means for obtaining an circumscribed rectangle of each character in the input document image and extracting information embedded in the characters in the circumscribed rectangle; 상기 합성 매립 정보 추출 수단에 의해 추출된 합성 매립 정보를 동기 정보와 매립 정보로 분리하는 분리 수단과,Separation means for separating the synthesis embedding information extracted by the synthesis embedding information extraction means into synchronization information and embedding information; 동기 정보를 입력하는 동기 정보 입력 수단과,Synchronization information input means for inputting synchronization information; 상기 분리 수단에 의해 분리된 동기 정보와, 상기 동기 정보 입력 수단에 의해 입력된 동기 정보를 비교함으로써, 상기 합성 매립 정보 추출 수단의 추출 오류를 판정하여, 추출 오류가 있다고 판정한 경우에는, 상기 분리 수단에 의해 분리된 동기 정보와 상기 입력 수단에 의해 입력된 동기 정보가 일치하도록, 상기 합성 매립 정보를 정정하는 정정 수단By comparing the synchronous information separated by the separating means with the synchronous information input by the synchronous information input means, an extraction error of the synthetic embedding information extracting means is determined, and when it is determined that there is an extraction error, the separation is performed. Correction means for correcting the composite embedded information such that the synchronization information separated by the means coincides with the synchronization information input by the input means. 을 구비하는 것을 특징으로 하는 정보 처리 장치.An information processing apparatus, comprising: a. 제5항에 있어서,The method of claim 5, 상기 동기 정보 입력 수단에 의해 입력되는 동기 정보는, 의사(疑似) 잡음 계열인 것을 특징으로 하는 정보 처리 장치.The synchronization information inputted by the synchronization information input means is an information processing apparatus, characterized in that a pseudo noise series. 문서 내의 각 문자에, n비트(n은 2 이상의 정수)의 정보를 매립하는 정보 처리 방법으로서,An information processing method in which n bits (n is an integer of 2 or more) are embedded in each character in a document. 문자로 구성되는 문서를 입력하는 문서 입력 공정과,A document input process of inputting a document composed of characters, 상기 문서에 매립할 매립 정보를 입력하는 매립 정보 입력 공정과,A landfill information input process of inputting landfill information to be embedded in the document; 복수 비트로 구성되고, 미리 설정된 비트 패턴으로 이루어지는 동기 정보를 입력하는 동기 정보 입력 공정과,A synchronization information input step of inputting synchronization information consisting of a plurality of bits and consisting of a preset bit pattern, 입력된 매립 정보를 구성하는 비트와, 상기 동기 정보를 구성하는 비트를 합성함으로써, 합성 매립 정보를 생성하는 합성 공정과,A synthesizing step of generating synthetic embedding information by synthesizing bits constituting the input embedding information and bits constituting the synchronization information; 상기 합성 공정에서 생성된 합성 매립 정보를 상기 문서 입력 공정에서 입력된 문서 내의 각 문자에 매립하고, 매립 후의 문서를 출력하는 매립 공정A embedding step of embedding the synthetic embedding information generated in the synthesizing step into each character in the document input in the document input step and outputting the document after embedding; 을 구비하고,And 상기 매립 공정은, 각 문자에 적어도 1비트의 동기 정보를 매립하는 것을 특징으로 하는 정보 처리 방법.In the embedding step, at least one bit of synchronization information is embedded in each character. 문서 화상 내의 각 문자에 n비트(n은 2 이상의 정수)의 정보가 매립되고, 그 n비트 중, 적어도 1비트가 동기 정보로서 매립되어 있는 문서 화상으로부터 정보를 추출하는 정보 처리 방법으로서,An information processing method for extracting information from a document image in which n bits (n is an integer of 2 or more) is embedded in each character in the document image, and at least one bit of the n bits is embedded as synchronization information. 문서 화상을 입력하는 문서 화상 입력 공정과,A document image input step of inputting a document image, 입력된 문서 화상 내의 각 문자의 외접 사각형을 구하고, 그 외접 사각형 내의 문자에 매립된 정보를 추출하는 합성 매립 정보 추출 공정과,A synthetic embedding information extraction step of obtaining a circumscribed rectangle of each character in the input document image and extracting information embedded in the characters in the circumscribed rectangle; 상기 합성 매립 정보 추출 공정에서 추출된 합성 매립 정보를 동기 정보와 매립 정보로 분리하는 분리 공정과,A separation step of separating the synthesis embedding information extracted in the synthesis embedding information extraction process into synchronization information and embedding information; 동기 정보를 입력하는 동기 정보 입력 공정과,A synchronization information input step of inputting synchronization information; 상기 분리 공정에서 분리된 동기 정보와, 상기 동기 정보 입력 공정에서 입력된 동기 정보를 비교함으로써, 상기 합성 매립 정보 추출 공정의 추출 오류를 판정하여, 추출 오류가 있다고 판정한 경우, 상기 분리 공정에서 분리된 동기 정보와, 상기 입력 공정에서 입력된 동기 정보가 일치하도록, 상기 합성 매립 정보를 정정하는 정정 공정By comparing the synchronization information separated in the separation step with the synchronization information input in the synchronization information input step, an extraction error of the synthesis embedding information extraction step is determined to determine that there is an extraction error. A correction step of correcting the synthesis embedding information so that the synchronized information obtained and the synchronization information input in the input process coincide; 을 구비하는 것을 특징으로 하는 정보 처리 방법.An information processing method comprising: 제7항 또는 제8항의 각 공정을 실행시키는 컴퓨터 프로그램을 저장한 것을 특징으로 하는 컴퓨터 판독 가능 기억 매체.A computer readable storage medium storing a computer program for executing each of the steps of claim 7 or 8.
KR1020080055719A 2007-06-15 2008-06-13 Information processing apparatus and method thereof KR100938539B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2007-00159492 2007-06-15
JP2007159492A JP4871793B2 (en) 2007-06-15 2007-06-15 Information processing apparatus and method

Publications (2)

Publication Number Publication Date
KR20080110532A true KR20080110532A (en) 2008-12-18
KR100938539B1 KR100938539B1 (en) 2010-01-25

Family

ID=40188950

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080055719A KR100938539B1 (en) 2007-06-15 2008-06-13 Information processing apparatus and method thereof

Country Status (3)

Country Link
JP (1) JP4871793B2 (en)
KR (1) KR100938539B1 (en)
CN (1) CN101325642B (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081736B (en) * 2009-11-27 2014-11-26 株式会社理光 Equipment and method for extracting enclosing rectangles of characters from portable electronic documents
JP5906788B2 (en) * 2012-02-17 2016-04-20 オムロン株式会社 Character cutout method, and character recognition apparatus and program using this method

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004247883A (en) 2003-02-12 2004-09-02 Canon Inc Image processing method
JP4232676B2 (en) 2004-04-05 2009-03-04 沖電気工業株式会社 Information detection apparatus, image processing system, and information detection method
CN1276387C (en) * 2004-06-10 2006-09-20 上海交通大学 Synchronous self-adaptable watermark method based on image continuity
JP2006050551A (en) 2004-06-30 2006-02-16 Canon Inc Image processing apparatus, image processing method, program and storage medium
JP4324058B2 (en) * 2004-08-31 2009-09-02 キヤノン株式会社 Image processing apparatus and method
JP4532331B2 (en) * 2004-12-08 2010-08-25 株式会社リコー Information embedding device, information extracting device, information embedding method, information extracting method, information embedding program, and information extracting program
JP4310288B2 (en) * 2005-04-12 2009-08-05 キヤノン株式会社 Image processing apparatus and method, program, and storage medium
CN100365655C (en) * 2005-08-16 2008-01-30 北京交通大学 Digital watermark technology for resisting rotary extension and displacement attack

Also Published As

Publication number Publication date
CN101325642B (en) 2010-08-25
KR100938539B1 (en) 2010-01-25
JP2008312063A (en) 2008-12-25
JP4871793B2 (en) 2012-02-08
CN101325642A (en) 2008-12-17

Similar Documents

Publication Publication Date Title
JPH07168912A (en) Method and means for strengthening optical character recognition ability for printed document
US20100008585A1 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JP4194462B2 (en) Digital watermark embedding method, digital watermark embedding apparatus, program for realizing them, and computer-readable storage medium
EP3477578A1 (en) Watermark embedding and extracting method for protecting documents
US20100057434A1 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JPWO2004095828A1 (en) Watermark information embedding device and method, watermark information detection device and method, and watermarked document
US8310692B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
KR100905857B1 (en) Information processing device and method of controlling the same
KR100938539B1 (en) Information processing apparatus and method thereof
JP2004023565A (en) Electronic watermark burying apparatus, electronic watermark extracting apparatuses, and method thereof
CN101833747A (en) Method and system for generating digital watermark-based safe word stock
JP2003186889A (en) Method and apparatus for annotating document and generating summary from document image
JP2007174615A (en) Image processor, image processing method, program, storage medium
JP3780181B2 (en) Image processing apparatus, data processing apparatus and method, and storage medium
US8488205B2 (en) Method of embedding a plurality of different two-dimensional codes in an image
KR100988309B1 (en) Inserting method of document identifier and decoding method thereof
KR100467930B1 (en) Method for embedding and extracting watermark into/from a text document, and the apparatus thereof
JP2002232679A (en) Method and device for image processing, computer program, and storage medium
JP2007241428A (en) Image processor and program
JP4613807B2 (en) Document processing apparatus and document processing method
JP2004247883A (en) Image processing method
JP2010108296A (en) Information processor and information processing method
CN104516579A (en) Information processing device and information processing method
JP4260076B2 (en) Document creation device, document verification device, document creation method, document verification method, document creation program, document verification program, recording medium storing document creation program, and recording medium storing document verification program
JP3703445B2 (en) Digital watermark embedding device, digital watermark extraction device, and methods thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121221

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131226

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141226

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20151224

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20161227

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20171226

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee