KR100467930B1 - Method for embedding and extracting watermark into/from a text document, and the apparatus thereof - Google Patents

Method for embedding and extracting watermark into/from a text document, and the apparatus thereof Download PDF

Info

Publication number
KR100467930B1
KR100467930B1 KR10-2002-0002647A KR20020002647A KR100467930B1 KR 100467930 B1 KR100467930 B1 KR 100467930B1 KR 20020002647 A KR20020002647 A KR 20020002647A KR 100467930 B1 KR100467930 B1 KR 100467930B1
Authority
KR
South Korea
Prior art keywords
watermark
text document
character
characters
code
Prior art date
Application number
KR10-2002-0002647A
Other languages
Korean (ko)
Other versions
KR20030062463A (en
Inventor
김종원
최종욱
장완호
Original Assignee
주식회사 마크애니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 마크애니 filed Critical 주식회사 마크애니
Priority to KR10-2002-0002647A priority Critical patent/KR100467930B1/en
Publication of KR20030062463A publication Critical patent/KR20030062463A/en
Application granted granted Critical
Publication of KR100467930B1 publication Critical patent/KR100467930B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0062Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance

Abstract

본 발명은 텍스트 문서로로/로부터 워터마크를 삽입 및 추출하는 방법과 그 장치에 관한 것이다. 텍스트 문서내의 문자 중에서 동일한 문자이지만 문자 코드값이 서로 상이한 문자를 이용하여, 텍스트 문서에 워터마크를 삽입한다. 이진 의사 난수를 이용한 확산 스펙트럼 형태의 워터마크 비트열 신호를 이용하며, 군집오류 발생을 방지하기 위하여 셔플링 과정을 거친다. 본 발명에 따르면, 텍스트 문서내의 문장이나 단어에 육안으로 식별가능한 변화를 가하지 않으면서 저작권이나 소유권 정보를 갖는 워터마크를 삽입할 수 있고, 텍스트 문서의 편집이나 텍스트 포맷의 변경에도 강인한 워터마크를 텍스트 문서에 삽입할 수 있는 효과가 있다.The present invention relates to a method and apparatus for embedding and extracting watermarks into / from text documents. The watermark is inserted into the text document using the same characters among the characters in the text document, but the characters having different character code values. A spread spectrum watermark bit string signal using binary pseudorandom numbers is used, and a shuffling process is performed to prevent occurrence of clustering errors. According to the present invention, a watermark having copyright or ownership information can be inserted without making a visually identifiable change to a sentence or word in a text document, and the watermark is robust against editing of a text document or a change in text format. It can be inserted into a document.

Description

텍스트 문서로/로부터 워터마크를 삽입 및 추출하는 방법과 그 장치{METHOD FOR EMBEDDING AND EXTRACTING WATERMARK INTO/FROM A TEXT DOCUMENT, AND THE APPARATUS THEREOF}METHOD FOR EMBEDDING AND EXTRACTING WATERMARK INTO / FROM A TEXT DOCUMENT, AND THE APPARATUS THEREOF}

본 발명은 텍스트 문서로로/로부터 워터마크를 삽입 및 추출하는 방법과 그 장치에 관한 것이다. 보다 구체적으로 본 발명은 동일한 문자이지만 코드값이 서로 상이한 문자를 이용하여 워터마크를 삽입하고 이를 추출함으로써, 텍스트 문서의 원본의 훼손 없이 텍스트 문서로로/로부터 워터마크를 삽입 및 추출하는 방법과 그 장치에 관한 것이다.The present invention relates to a method and apparatus for embedding and extracting watermarks into / from text documents. More specifically, the present invention provides a method of inserting and extracting a watermark into and out of a text document without damaging the original of the text document by inserting and extracting the watermark using characters having the same characters but different code values, and Relates to a device.

디지털 워터마킹은 이미지, 오디오, 비디오 또는 텍스트 문서 등의 디지털 멀티미디어 컨텐츠에 사용자의 정보나 저작권 정보등의 소유구넝르 주장하고자 하는 특정의 데이터인 워터마크를 사람의 육안이나 청각으로는 인지하지 못하도록 삽입하는 기술을 말한다.Digital watermarking inserts watermarks, which are specific data intended to be claimed by a user's information or copyright information, into digital multimedia content such as images, audio, video, or text documents so that the human eye or hearing cannot recognize them. Says technology.

컨텐츠의 유통과정에서 소유권이나 저작권과 관련하여 컨텐츠의 원 소유자를 확인하여야 할 필요가 발생할 경우에, 컨텐츠에 삽입된 워터마크를 추출하여 소유권이나 저작권등의 권리를 행사하는 근거를 마련할 수 있다.When the content distribution process needs to identify the original owner of the content in relation to ownership or copyright, a watermark embedded in the content may be extracted to provide a basis for exercising the right of ownership or copyright.

이 중 텍스트 워터마킹은 문서의 텍스트 부분에 워터마크를 삽입하는 것으로, 그 예로는 텍스트를 이미지 파일로 변환하여 워터마킹하는 방법 또는 글자간의 스페이스를 미세하게 변화시키는 방법 등이 있다.Among these, text watermarking includes inserting a watermark into a text portion of a document. For example, a method of converting text into an image file and watermarking it or changing a space between letters finely.

텍스트를 이미지 파일로 변환하여 워터마킹하는 방법은 본 출원의 출원인과 동일한 출원인에 의해 출원되었으며, 발명의 명칭이 "텍스트 워터마크 삽입방법 및 장치" 인 한국 특허출원 제 1999-58131 호에 개시되어 있다. 텍스트를 이미지 파일로 변환하여 워터마킹하는 이유는, 텍스트가 변형이나 편집에 취약하여 삽입된 워터마크가 깨질 위험이 있기 때문이다.The method of converting text into an image file and watermarking was filed by the same applicant as the applicant of the present application, and is disclosed in Korean Patent Application No. 1999-58131 entitled "Text Watermark Insertion Method and Apparatus". . The reason that text is converted to an image file and watermarked is that the text is vulnerable to deformation or editing, and the inserted watermark may be broken.

글자간의 스페이스를 변환하여 워터마킹하는 방법은 1996년에 IBM 사의 W. Bender 등에 의해 제안된 "Open Space" 방법이 있으며, 이에 대해서는 도 1 을 참조로 하여 설명하기로 한다. 도 1 은 글자간의 스페이스를 변화시켜 텍스트 문서에 워터마크를 삽입하는 종래의 워터마크 삽입 예를 도시하는 도이다.Watermarking by converting the space between the letters is the "Open Space" method proposed by W. Bender of IBM, etc. in 1996, this will be described with reference to FIG. 1 is a diagram illustrating a conventional watermark embedding example in which a watermark is inserted into a text document by changing the space between letters.

도 1 을 참조로 하면, 우선 단어 사이의 스페이스의 간격을 조절하여 한 글자 간격의 스페이스는 '0' 으로, 두 글자 간격의 스페이스는 '1' 로 규정한다. 또한, 단어의 좌 우측의 스페이스가 01 이면 (즉, 단어의 좌측 스페이스는 한 글자 간격이고 우측 스페이스는 두 글자 간격이면) 이를 이진수 '0' 으로 해석하고, 단어의 좌 우측의 스페이스가 10 이면 이를 이진수 '1' 로 해석한다. 즉, 도 1 에서 단어 사이의 스페이스 간격 조절로 워터마킹된 아래 단락에 삽입된 워터마크 정보의 이진 비트열은 '01011011' 이 된다.Referring to FIG. 1, first, the space between words is adjusted so that the space of one letter is defined as '0' and the space of two letters is defined as '1'. In addition, if the space on the left and right of the word is 01 (that is, if the space on the left is one letter and the space on the right is two letters), it is interpreted as binary '0', and if the space on the left and right of the word is 10, Interpret as binary '1'. That is, the binary bit string of the watermark information inserted in the lower paragraph watermarked by adjusting the space spacing between words in FIG. 1 becomes '01011011'.

그러나, 이와 같이 글자간의 스페이스를 변환하여 워터마킹하는 방법에 따르면 문장안의 스페이스가 증가하게 되어 텍스트의 전체 용량이 증가되어 파일 사이즈가 커진다는 단점이 있다. 또한, 상기 방법은 변화된 텍스트가 가시적으로 구분이 가능하여, 육안으로 식별이 불가능한 정보를 삽입한다는 워터마킹의 기본 취지를 달성하지 못하게 된다는 단점이 있다.However, according to the method of watermarking by converting the spaces between the letters as described above, there is a disadvantage in that the space in the sentence is increased, and thus the total size of the text is increased and the file size is increased. In addition, the method has a disadvantage in that the changed text can be visually distinguished, thereby failing to achieve the basic purpose of watermarking of inserting information that cannot be visually identified.

그 밖의 텍스트 워터마킹방법으로 글자의 폰트의 크기를 조정하는 방법을 이용하는 것 등이 제안되었으나, 이들 모두가 텍스트의 용량이 증가한다거나 가시적으로 구분이 가능하다는 단점을 갖고 있으며, 또한 폰트의 형태나 크기 등이 텍스트의 편집시에 쉽게 변경되므로 삽입된 워터마크가 강인하지 못하다는 단점을 가지고 있다.Other text watermarking methods have been proposed, such as the method of adjusting the font size of letters, but all of them have the disadvantage of increasing the capacity of the text or distinguishing them visually. Since the back is easily changed when editing the text, the inserted watermark is not strong.

즉, 워터마크의 삽입은 기본적으로 삽입되는 워터마크가 육안으로 식별되지 않아야 하는데, 상기 종래의 텍스트 워터마킹의 경우에는 텍스트의 원본이 훼손되는 단점이 있고, 편집시 삽입된 워터마크가 쉽게 변형된다는 단점이 있다.That is, the insertion of watermarks should not be visually identified as a watermark inserted by default. In the case of the conventional text watermarking, there is a disadvantage in that the original of the text is damaged, and the inserted watermark is easily deformed during editing. There are disadvantages.

본 발명은 상술한 바와 같은 종래기술의 문제점을 해결하기 위한 것으로, 본 발명의 목적은 텍스트 문서내의 문장이나 단어에 육안으로 식별가능한 변화를 가하지 않으면서 워터마크를 삽입하는 방법을 제공하는 것이다.SUMMARY OF THE INVENTION The present invention has been made to solve the problems of the prior art as described above, and an object of the present invention is to provide a method for embedding a watermark without making visually identifiable changes to sentences or words in a text document.

본 발명의 다른 목적은 텍스트 문서의 편집이나 텍스트 포맷의 변경에도 강인한, 즉 이와 같은 편집이나 변경에 쉽게 깨지지 않는 워터마크를 텍스트 문서에 삽입하는 방법을 제공하는 것이다.It is another object of the present invention to provide a method of inserting a watermark into a text document that is robust to editing a text document or to changing a text format, that is, not easily broken by such editing or modification.

본 발명의 또다른 목적은 워터마크가 삽입된 텍스트 문서에 군집오류가 발생하더라도 워터마크를 추출할 수 있게 하는 방법을 제공하는 것이다.It is still another object of the present invention to provide a method for extracting a watermark even when a clustering error occurs in a text document into which a watermark is inserted.

본 발명의 또다른 목적은 텍스트 문서에 육안으로 식별할 수 없으며 저작권이나 소유권을 증명할 수 있는 워터마크를 삽입 및 추출하는 방법을 제공함으로써, 웹 상이나 전자문서에 사용되는 각종의 텍스트 문서 및 기타 네트워크 상에서 공유되고 있는 텍스트 문서에 대한 저작권 및 소유권을 보호할 수 있도록 하는 것이다.Another object of the present invention is to provide a method of inserting and extracting a watermark that is not visually identifiable in a text document and which can prove copyright or ownership, thereby providing a variety of text documents and other networks used on the web or in electronic documents. This is to protect the copyright and ownership of the text document being shared.

도 1 은 글자간의 스페이스를 변화시켜 텍스트 문서에 워터마크를 삽입하는 종래의 워터마크 삽입 예를 도시하는 도이다.1 is a diagram illustrating a conventional watermark embedding example in which a watermark is inserted into a text document by changing the space between letters.

도 2 는 본 발명의 실시예에 따른 워터마크 삽입장치의 구성을 나타내는 블록도이다.2 is a block diagram showing the configuration of a watermark embedding apparatus according to an embodiment of the present invention.

도 3a 는 유니코드에서 사용되는 Basic Latin 테이블이고, 도 3b 는 유니코드에서 사용되는 Number form 테이블이다.Figure 3a is a Basic Latin table used in Unicode, Figure 3b is a Number form table used in Unicode.

도 4 는 확산 스펙트럼 워터마크의 생성을 나타내는 도이다.4 is a diagram illustrating generation of a spread spectrum watermark.

도 5a 는 아스키 코드를 이용하여 본 발명의 실시예에 따라 워터마크를 삽입한 텍스트 문서의 예를 나타내는 도이고, 도 5b 는 유니 코드를 이용하여 본 발명의 실시예에 따라 워터마크를 삽입한 텍스트 문서의 예를 나타내는 도이다.5A is a diagram illustrating an example of a text document having a watermark inserted according to an embodiment of the present invention using ASCII code, and FIG. 5B is a text having a watermark inserted according to an embodiment of the present invention using Unicode. It is a figure which shows an example of a document.

도 6 은 본 발명의 실시예에 따른 워터마크 추출장치의 구성을 나타내는 블록도이다.6 is a block diagram showing the configuration of a watermark extraction apparatus according to an embodiment of the present invention.

도 7 은 확산 스펙트럼 워터마크의 복원을 나타내는 도이다.7 is a diagram illustrating restoration of a spread spectrum watermark.

* 도면의 주요부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

100 : 워터마크 삽입장치 110 : 대상문서100: watermark insertion device 110: target document

120 : 구문 분석부 130 : 영역 선택부120: parser 130: region selection unit

140 : 워터마크 정보 150 : 에러 정정 코드140: watermark information 150: error correction code

160 : 확장부 170 : 키 삽입부160: expansion unit 170: key insertion unit

180 : 난수 발생부 190 : XOR 변환부180: random number generator 190: XOR conversion unit

200 : 셔플링부 210 : 조합부200: shuffling portion 210: combination portion

220 : 워터마크가 삽입된 문서 300 : 워터마크 추출장치220: document with watermark 300: watermark extractor

310 : 구문 분석부 320 : 영역 선택부310: parser 320: region selector

330 : 역셔플링부 340 : 난수 발생부330: reverse shuffler 340: random number generator

350 : XOR 변환부 360 : 수축부350: XOR converter 360: contraction

370 : 워터마크 추출부 380 : 오류정정370: watermark extraction unit 380: error correction

390 : 추출된 워터마크390: extracted watermark

상술한 바와 같은 본 발명의 목적을 달성하기 위하여, 본 발명은 텍스트 문서에 워터마크를 삽입하는 방법에 있어서, 워터마크 비트열을 생성하는 단계; 및 상기 텍스트 문서내의 문자 중에서 동일한 문자이지만 문자 코드값이 서로 상이한 문자를 이용하여, 상기 텍스트 문서에 워터마크를 삽입하는 단계를 포함하는 방법을 제공한다.In order to achieve the object of the present invention as described above, the present invention provides a method for embedding a watermark in a text document, the method comprising: generating a watermark bit string; And inserting a watermark in the text document by using the same character among characters in the text document but having different character code values.

여기에서, 상기 워터마크를 삽입하는 단계는 동일한 문자이지만 코드값이 서로 상이한 상기 문자의 제 1 코드값과 제 2 코드값을 상기 워터마크 비트열의 0 값과 1 값으로 각각 정한 후, 상기 텍스트 문서내의 동일한 문자이지만 코드값이 서로 상이한 상기 문자의 코드값을 조정함으로써 상기 텍스트 문서에 워터마크를 삽입하는 단계임이 바람직하다.Here, the step of inserting the watermark is set to the first code value and the second code value of the character having the same character but different code values as 0 value and 1 value of the watermark bit string, respectively, and then the text document It is preferable that the step of inserting a watermark in the text document by adjusting the code value of the character that is the same character but different in the code value.

또한, 동일한 문자이지만 코드값이 서로 상이한 상기 문자는 아스키 코드 및 2 바이트 완성형 또는 2 바이트 조합형 코드에서 영문 및 한글의 공백 (Space) 문자인 것이 바람직하다.In addition, it is preferable that the same character but different from each other in the code value is a space character of English and Korean in an ASCII code and a 2-byte complete or 2-byte combined code.

또한, 동일한 문자이지만 코드값이 서로 상이한 상기 문자는 유니 코드에서 영문 및 한글의 공백 (Space) 문자 또는 문자의 형태는 동일하나 코드값이 서로 상이한 영문 문자인 것이 바람직하다.In addition, it is preferable that the same character but different in code value is an English character having the same space character or character but having different code values.

또한, 동일한 문자이지만 코드값이 서로 상이한 상기 문자는 상기 텍스트 문서내에서 소정의 사용 빈도수를 만족하는 문자인 것이 바람직하다.Further, it is preferable that the same character but different in code value is a character satisfying a predetermined frequency of use in the text document.

본 발명의 다른 목적을 달성하기 위하여, 본 발명은 텍스트 문서에 워터마크를 삽입하는 방법에 있어서, (a) 상기 텍스트 문서내의 문자 중에서 동일한 문자이지만 문자 코드값이 서로 상이한 문자를 선택하는 단계; (b) 이진화된 워터마크 비트열 신호를 작성하는 단계; (c) 상기 워터마크 비트열 신호를 R 배의 배수를 사용하여 확장시키는 단계; (d) 소정의 사용자 키로부터 광대역 이진 의사 난수 신호를 발생시키는 단계; (e) 상기 확장된 워터마크 비트열 신호와 상기 발생된 광대역 이진 의사 난수를 XOR 연산하여 확산 스펙트럼 형태의 워터마크 비트열 신호를 생성하는 단계; 및 (f) 상기 확산 스펙트럼 형태의 워터마크 비트열 신호에 따라, 상기 (a) 단계에서 선택된 동일한 문자이지만 문자 코드값이 서로 상이한 상기 문자를이용하여, 상기 텍스트 문서에 워터마크를 삽입하는 단계를 포함하는 방법을 제공한다.In order to achieve another object of the present invention, the present invention provides a method for embedding a watermark in a text document, the method comprising the steps of: (a) selecting a character among the characters in the text document, but different characters from the character code value; (b) generating a binarized watermark bitstream signal; (c) extending the watermark bitstream signal using a multiple of R times; (d) generating a wideband binary pseudo random number signal from a given user key; (e) generating a spread spectrum watermark bitstream signal by performing an XOR operation on the extended watermark bitstream signal and the generated wideband binary pseudorandom number; And (f) inserting a watermark into the text document using the same characters selected in the step (a) but having different character code values according to the spread spectrum type watermark bit string signal. It provides a method to include.

또한, 상기 (e) 단계 이후 상기 (f) 단계 이전에, (e1) 상기 확산 스펙트럼 형태의 워터마크 비트열 신호를 셔플링하는 단계를 더 포함하는 것이 바람직하다.The method may further include (e1) shuffling the watermark bit string signal in the spread spectrum form after the step (e) but before the step (f).

또한, 상기 셔플링은 소정의 시드 (Seed) 값을 갖는 난수를 사용하여 이루어지는 것이 바람직하다.In addition, the shuffling is preferably made using a random number having a predetermined seed (Seed) value.

또한, 상기 (a) 단계 이전에, 상기 텍스트 문서를 이진화된 텍스트 문서로 변환하는 단계를 더 포함하는 것이 바람직하다.Further, before the step (a), it is preferable to further include the step of converting the text document into a binary text document.

또한, 상기 (b) 단계 이후 상기 (c) 단계 이전에, (b1) 상기 작성된 이진화된 워터마크 비트열 신호에 에러 정정코드를 부가하는 단계를 더 포함하는 것이 바람직하다.In addition, after the step (b) and before the step (c), it is preferable to further include (b1) adding an error correction code to the created binary watermark bit string signal.

본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 상기 워터마크를 삽입하는 방법에 의해 워터마크가 삽입된 텍스트 문서로부터 워터마크를 추출하는 방법에 있어서, (g) 상기 워터마크가 삽입된 텍스트 문서를 이진화된 텍스트 문서로 변환하는 단계; (h) 상기 이진화된 텍스트 문서에서 코드값이 대치된 문자열을 찾아, 상기 코드값이 대치된 문자열로부터 확산 스펙트럼 형태의 워터마크 비트열 신호를 생성하는 단계; (i) 소정의 사용자 키로부터 광대역 이진 의사 난수 신호를 발생시키는 단계; (j) 상기 확산 스펙트럼 형태의 워터마크 비트열 신호와 상기 발생된 광대역 이진 의사 난수를 XOR 연산하여 확장된 워터마크 비트열 신호를 생성하는 단계; 및 (k) 상기 확장된 워터마크 비트열 신호를 수축하여 원래의 워터마크 비트열 신호로 복원하는 단계를 포함하는 방법을 제공한다.In order to achieve another object of the present invention, the present invention provides a method for extracting a watermark from a text document having a watermark embedded by the method of embedding the watermark, (g) the watermarked text Converting the document into a binary text document; (h) finding a character string in which the code value is substituted in the binarized text document and generating a spread spectrum type watermark bit string signal from the character string in which the code value is substituted; (i) generating a wideband binary pseudo random number signal from a given user key; (j) generating an extended watermark bitstream signal by performing an XOR operation on the spread spectrum type watermark bitstream signal and the generated wideband binary pseudorandom number; And (k) contracting the extended watermark bitstream signal to restore the original watermark bitstream signal.

여기에서, 상기 (h) 단계 이후 상기 (i) 단계 이전에, (h1) 상기 생성된 호가산 스펙트럼 형태의 워터마크 비트열 신호에 역 셔플링을 수행하는 단계를 더 포함하는 것이 바람직하다.Here, it is preferable to further include the step (h1) performing a reverse shuffling on the generated watermark bit string signal in the form of the added peak spectrum after the step (h) and before the step (i).

본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 텍스트 문서에 워터마크를 삽입하는 장치에 있어서, 워터마크 비트열을 생성하는 수단; 및 상기 텍스트 문서내의 문자 중에서 동일한 문자이지만 문자 코드값이 서로 상이한 문자를 이용하여, 상기 텍스트 문서에 워터마크를 삽입하는 수단을 포함하는 장치를 제공한다.In order to achieve another object of the present invention, there is provided an apparatus for embedding a watermark in a text document, comprising: means for generating a watermark bit string; And means for embedding a watermark in the text document using characters that are the same among the characters in the text document but differ in the character code values.

본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 텍스트 문서에 워터마크를 삽입하는 장치에 있어서, 상기 텍스트 문서내의 문자 중에서 동일한 문자이지만 문자 코드값이 서로 상이한 문자를 선택하는 영역 선택부; 이진화된 워터마크 비트열 신호를 작성하는 워터마크 생성부; 상기 워터마크 비트열 신호를 R 배의 배수를 사용하여 확장시키는 확장부; 소정의 사용자 키로부터 광대역 이진 의사 난수 신호를 발생시키는 난수 발생부; 상기 확장된 워터마크 비트열 신호와 상기 발생된 광대역 이진 의사 난수를 XOR 연산하여 확산 스펙트럼 형태의 워터마크 비트열 신호를 생성하는 XOR 변환부; 및 상기 확산 스펙트럼 형태의 워터마크 비트열 신호에 따라, 상기 영역 선택부에서 선택된 동일한 문자이지만 문자 코드값이 서로 상이한 상기 문자를 이용하여, 상기 텍스트 문서에 워터마크를 삽입하는 조합부를 포함하는 장치를 제공한다.According to another aspect of the present invention, there is provided an apparatus for embedding a watermark in a text document, the apparatus comprising: an area selecting unit for selecting a character among the characters in the text document but having different character code values; A watermark generator for generating a binarized watermark bit string signal; An expansion unit for expanding the watermark bit string signal using a multiple of R times; A random number generator for generating a wideband binary pseudorandom signal from a predetermined user key; An XOR converter configured to generate a spread spectrum watermark bitstream signal by performing an XOR operation on the extended watermark bitstream signal and the generated wideband binary pseudorandom number; And a combination unit for inserting a watermark into the text document by using the same characters selected by the area selection unit but having different character code values according to the spread spectrum type watermark bit string signal. to provide.

이하, 첨부된 도면을 참조로 하여 본 발명의 바람직한 실시예에 대하여 상세히 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

본 발명의 실시예는 텍스트 문서에 워터마크를 삽입하는 워터마크 삽입과정과 워터마크가 삽입된 텍스트 문서로부터 워터마크를 추출하는 워터마크 추출과정으로 크게 구분할 수 있으며, 우선 도 2 내지 도 5 를 참조로하여 워터마크 삽입과정에 대해 설명하기로 한다.An embodiment of the present invention can be broadly divided into a watermark embedding process of inserting a watermark into a text document and a watermark extracting process of extracting a watermark from a text document into which the watermark is inserted. First, referring to FIGS. 2 to 5. The watermark embedding process will now be described.

도 2 는 본 발명의 실시예에 따른 워터마크 삽입장치의 구성을 나타내는 블록도이다. 도 2 를 참조로 하면, 본 발명의 워터마크 삽입장치 (100) 는 구문 분석부 (120), 영역선택부 (130), 워터마크 정보 (140), 에러정정코드 (150), 확장부 (160), 키삽입부 (170), 난수 발생부 (180), XOR 변환부 (190), 셔플링부 (200) 및 조합부 (210) 를 포함하며, 이러한 구성요소들은 하드웨어 또는 소프트웨어적인 모듈일 수 있다.2 is a block diagram showing the configuration of a watermark embedding apparatus according to an embodiment of the present invention. Referring to FIG. 2, the watermark embedding apparatus 100 according to the present invention includes a parser 120, an area selector 130, watermark information 140, an error correction code 150, and an expander 160. ), Key insertion unit 170, random number generation unit 180, XOR conversion unit 190, shuffling unit 200 and combination unit 210, these components may be a hardware or software module. .

우선, 도 2 에 도시된 대상문서 (110) 란 온라인상에서 파일의 형태로 제공되는 텍스트 문서로써, 메모장 및 워드패드, 마이크로소프트사의 워드, 한글, 훈민정음 등 통상의 워드 프로세싱용 소프트웨어를 사용하여 편집된 문서 또는 유니코드를 기반으로 하는 워드 프로세싱용 소프트웨어를 사용하여 편집된 문서를 말한다.First, the target document 110 shown in FIG. 2 is a text document provided in the form of a file online, and is edited using conventional word processing software such as Notepad and WordPad, Microsoft's Word, Korean, Hunminjeongeum A document or document edited using Unicode-based word processing software.

후술하는 기재로써 구체적으로 설명하겠지만, 본 발명의 실시예에서는 아스키 코드 (ASCII code) 및 2 바이트 완성형 또는 2 바이트 조합형 코드나 유니코드등과 같은 문자코드 값을 이용하여, 코드값은 서로 상이하나 (형태가) 동일한 문자를 이용하여 워터마크를 삽입하게 된다.As will be described in detail with reference to the following description, in the embodiment of the present invention, the code values are different from each other by using ASCII code and a character code value such as a two-byte completion type or a two-byte combined code or Unicode. The watermark is inserted using the same characters).

따라서, 본 발명의 실시예에 따라 구문 분석부 (120) 및 영역선택부 (130) 에서 이루어지는 일련의 처리과정을 설명하기에 앞서, 우선 문자코드에 대한 일반적인 설명과, 동일한 문자이지만 코드값이 서로 상이한 문자를 이용하여 워터마크를 삽입하는 본 발명의 특징적인 방법에 대한 개략적인 설명을 하기로 한다.Therefore, prior to describing a series of processes performed by the parser 120 and the region selector 130 according to an embodiment of the present invention, first, the general description of the character code is the same as the character, but the code values are different from each other. A brief description will be given of the characteristic method of the present invention for inserting a watermark using different characters.

문자코드라 함은 인간이 사용하는 언어를 컴퓨터와 인간, 컴퓨터와 컴퓨터, 및 컴퓨터와 그 주변장치 사이의 통신을 위하여 특정한 문자에 비트의 조합을 부여한 것을 말하며, 예로써 바이너리 코드 (binary code), 아스키 코드 (ASCII code), 16 비트 코드 및 유니코드 등이 잘 알려져 있다. 문자는 이러한 문자코드를 사용되는 언어와 구조에 따라 코드화한 것을 말하며, 이러한 문자는 국제표준인 ISO/IEC2022 등을 통하여 문자코드의 구조와 코드의 확장방법이 규정되어 있다.A character code is a language used by a human being that assigns a combination of bits to a specific character for communication between a computer and a human, a computer and a computer, and a computer and a peripheral device. For example, a binary code, ASCII code, 16-bit code and Unicode are well known. Characters are coded according to the language and structure of the character codes used, and these characters are prescribed by the international standard ISO / IEC2022, etc., and the structure of the character codes and the extension method of the codes are prescribed.

우리나라에서는 한글을 표현하기 위하여 2 바이트 완성형 또는 2 바이트 조합형 등이 사용되어 왔다. 그런데, 조합형의 경우에는 스페이스를 적게 차지하지만 인터페이스 간의 통신에서 통신제어코드와의 충돌을 일으킬 가능성이 있으며 폰트의 모양이 좋지 않다는 단점이 있다. 또한, 완성형의 경우에는 다양한 한글 표현방법이 어렵고 많은 스페이스를 차지하는 단점이 있다.In Korea, two-byte completion or two-byte combinations have been used to represent Hangul. By the way, the combination type takes up less space, but there is a possibility of causing a collision with the communication control code in the communication between the interfaces, and there is a disadvantage that the shape of the font is not good. In addition, in the case of the completed type, various Hangul expression methods are difficult and occupy a lot of space.

이러한 조합형과 완성형 코드의 단점을 극복하기 위하여 1995년 이후로는 ISO10646 개정판을 통해 유니코드가 발표되었으며 이를 통하여 한글의 11172 자가 모두 지원되며, 이러한 유니코드는 기존의 조합형과 완성형의 각각의 장점을 가지고 있으며 배열도 완벽하게 정렬된 코드체계를 가진다.In order to overcome the shortcomings of the combined and complete code, since 1995, Unicode has been released through the ISO10646 revision. Through this, 11172 Korean characters are supported. This Unicode has the advantages of the existing combined and complete types. The array also has a perfectly aligned code system.

유니코드는 비영어권 국가 (일본, 중국, 아랍 등) 뿐 아니라 영어권 국가에서도 사용하는 국제적인 표준 규약으로 자리 잡았으며, 현재 컴퓨터에서 사용되는 거의 모든 언어들은 유니코드를 사용하여 표현된다.Unicode has become an international standard that is used not only in non-English countries (Japan, China, Arabs, etc.) but also in English-speaking countries, and almost all languages currently used on computers are expressed using Unicode.

본 발명에서는 이와 같은 아스키 코드 및 2 바이트 완성형 또는 2 바이트 조합형 코드 또는 유니코드등을 기초로 하여, 동일한 문자이지만 코드값이 서로 상이한 문자를 선정하고 이 선택된 문자를 이용하여 워터마크를 텍스트 문서에 삽입하게 된다. 이하에서는, 이와 같이 동일한 문자이지만 코드값이 서로 상이한 문자를 선정하는 것에 대해 구체적으로 설명하기로 한다.In the present invention, based on such an ASCII code and a two-byte completion type or two-byte combined code or Unicode, a character having the same character but different code values is selected and the watermark is inserted into the text document using the selected character. Done. Hereinafter, a description will be given in detail of selecting characters having the same characters but different code values.

먼저, 아스키 코드를 기초로 하는 방법에 대해 설명한다. 아스키 코드는 1963년에 미국 표준화연합 (ANSI 의 전신) 에서 데이터의 저장과 교환을 위해 개발된 코드로써 제어문자 32 개와 공백문자 (Space), 및 94 개의 프린트 문자와 지움문자 (Delete) 의 총 128 개의 비트조합을 배정한 후에 발전되어 1968 년 표준으로 지정된 코드이다.First, the method based on ASCII code is demonstrated. The ASCII code was developed in 1963 for the storage and exchange of data by the American National Standards Institute (previously known as ANSI), with a total of 128 control characters, spaces, and 94 print and delete characters. This code was developed after allocating two bit combinations and became the 1968 standard.

텍스트 문서의 스페이스는 아스키 코드값으로 20H 값을 갖게 되는데 이 부분을 다른 코드값을 갖는 스페이스 문자로 대치해도 문장은 그대로 유지되고, 이러한 스페이스 문자를 대치하는 소정의 규칙으로 육안으로 식별불가능한 워터마크를 삽입할 수 있다.The space of the text document has the ASCII code value of 20H. Even if this part is replaced with a space character having a different code value, the sentence remains the same. Can be inserted.

아스키 코드에서 본 발명의 워터마크 삽입을 위해 대치되는 문자는 텍스트 문서인 경우에는 제어코드를 활용할 수 있으며, 제어코드를 이용할 경우에는 각각의 제어코드에 2 진 값을 할당하여 활용하는 것이 가능하다. 아스키 코드에서는 초기 0 에서부터 31 까지 총 32개의 문자가 실제 텍스트에는 사용되지 않기 때문에이를 텍스트 문장에서 사용되는 스페이스 문자와 대치하여 사용할 수 있다.In the ASCII code, the character substituted for the watermark insertion of the present invention may use a control code in the case of a text document, and in the case of using the control code, a binary value may be assigned to each control code. In ASCII code, 32 characters from the initial 0 to 31 are not used in the actual text, so you can substitute them for the space character used in the text sentence.

예를 들어 아스키 코드값이 20H 인 값을 00H (Null 문자) 로 대체함으로써 사용자는 이를 스페이스와 동일하게 느끼게 되지만 실제로 문자의 코드 값은 변화한 것이 된다. 00H 값 이외에도 07H 까지의 값을 사용하는 경우에는 각각에 대해서 이진 코드인 000B 에서 111B 까지 할당하는 것이 가능하다. 이 경우 01001001010011010101011B 라는 정보 (즉, 워터마크 정보) 를 삽입하기 위해서는 02H, 02H, 02H, 04H, 06H, 05H, 02H, 03H 의 코드를 사용함으로써 하나의 문자로 3비트까지의 정보를 삽입하는 것이 가능하다. 이러한 방법은 대체할 수 있는 문자 코드의 양에 따라 하나의 정보로 표현가능한 비트 수가 결정될 수 있다.For example, by replacing the ASCII code value of 20H with 00H (the null character), the user feels it the same as the space, but the code value of the character actually changes. In addition to 00H values, it is possible to assign binary codes 000B to 111B for each. In this case, in order to insert the information 01001001010011010101011B (that is, the watermark information), it is possible to insert up to 3 bits of information in one character by using the codes 02H, 02H, 02H, 04H, 06H, 05H, 02H, 03H. Do. In this method, the number of bits that can be represented by one piece of information can be determined according to the amount of replaceable character codes.

도 5a 는 아스키 코드를 이용하여 본 발명의 실시예에 따라 워터마크를 삽입한 텍스트 문서의 예를 나타내는 도이다. 도 5a 를 참조로 하면, 워터마크 삽입되기 전의 스페이스 문자가 워터마크가 삽입된 후에는 상기 제어문자로 대치된 예이다. 그러나, 비록 스페이스 문자의 코드값은 달라지고 이 코드값이 달라지는 소정의 규칙에 따라 워터마크가 삽입되었으나, 텍스트 문서는 육안상으로 차이가 전혀 발생하지 않는다. 이와 같은 효과는 상술한 종래의 오픈 스페이스 방법 또는 폰트를 변화시켜 워터마크를 삽입하는 방법에서는 달성될 수 없는 것이다. 이와 같은 본 발명의 아스키 코드에 기초한 방법이 영문자 뿐만 아니라 한글로 작성된 텍스트 문서에도 동일하게 적용될 수 있음은 물론이다.5A is a diagram showing an example of a text document in which a watermark is inserted according to an embodiment of the present invention using an ASCII code. Referring to FIG. 5A, the space character before the watermark is inserted is replaced with the control character after the watermark is inserted. However, although the watermark is inserted according to a predetermined rule in which the code value of the space character is different and this code value is different, the text document does not visually make a difference at all. Such an effect cannot be achieved in the conventional open space method or the method of inserting a watermark by changing the font. As described above, the method based on the ASCII code of the present invention can be equally applied to text documents written in Korean as well as English characters.

상술한 바와 같은 아스키 코드에서 영문 및 한글의 스페이스 문자를 대치하여 사용하는 방법은 2 바이트 완성형 또는 2 바이트 조합형 코드에서도 동일하게적용가능하다.The method of using the English and Korean space characters in the ASCII code as described above is equally applicable to a two-byte completion type or a two-byte combined code.

다음으로, 유니코드 또는 확장형 아스키 코드를 기초로 하는 방법에 대해 설명한다. 유니코드나 확장형 아스키 코드 체계에서는 동일한 문자가 2개의 코드값을 갖는 경우가 있다. 이와 같은 문자를 선택하여 삽입하고자 하는 정보의 비트값이 0 인 경우에는 원래 사용된 영역의 코드값을 그대로 사용하고, 삽입하고자 하는 정보의 비트값이 1 인 경우에는 다른 영역의 코드값을 사용하는 것이다. 이 경우에 대체된 하나의 코드는 한 비트만을 표현하는 방법이 될 것이며, 이와 같이 0 또는 1 로 삽입되는 정보에 따라 워터마크가 삽입되는 것이다.Next, a method based on Unicode or extended ASCII code will be described. In Unicode or extended ASCII code schemes, the same character may have two code values. If the bit value of the information to be inserted by selecting such a character is 0, the code value of the originally used area is used as it is. If the bit value of the information to be inserted is 1, the code value of another area is used. will be. In this case, the replaced one code may be a method of expressing only one bit, and thus, a watermark is inserted according to information inserted as 0 or 1.

도 3a 는 유니코드에서 사용되는 Basic Latin 테이블이고, 도 3b 는 유니코드에서 사용되는 Number form 테이블이다. 도 3a 를 참조로 하면, C0 Controls and Basic Latin 테이블은 아스키 코드와 같은 형태로 구성되어 있으므로, 상술한 바와 같이 아스키 코드에서 스페이스 문자의 대치에 의한 워터마크의 삽입이 가능하다.Figure 3a is a Basic Latin table used in Unicode, Figure 3b is a Number form table used in Unicode. Referring to FIG. 3A, since the C0 Controls and Basic Latin table is configured in the same form as the ASCII code, the watermark can be inserted by replacing the space character in the ASCII code as described above.

또한, 도 3b 의 number forms 테이블에서 사용되는 문자를 사용하여 영문자에 한하여 추가적인 대치도 가능하게 된다. 도 3a 와 도 3b 각각의 테이블에서 서로 일치하지만 그 코드값이 다른 14개의 문자를 대치하여 사용할 경우에 텍스트의 내용에는 전혀 변화가 없이 필요한 워터마크 정보를 삽입할 수 있다.In addition, by using the characters used in the number forms table of FIG. In the tables of FIGS. 3A and 3B, the watermark information can be inserted without any change in the content of the text when the 14 characters having the same but different code values are used.

도 5b 는 유니 코드를 이용하여 본 발명의 실시예에 따라 워터마크를 삽입한 텍스트 문서의 예를 나타내는 도이다. 도 5b 에서는 유니코드를 사용한 텍스트 문자에서 영문자로 사용되는 basic Latin 코드의 문자열을 number forms 코드의 문자열로 모두 대치한 결과를 나타내는 것이다. 도 5b 를 보면 예를 들어 'M','c','v' 등과 같은 문자등이 대치되었으나 이는 육안으로 무시할 수 있는 정도이다. 대치하고자 하는 문자열은 도 5b 와 같이 대상 문자열 전부에 대해서 뿐 아니라 문자열 일부에 대해서, 혹은 스페이스 문자의 사용, 그리고 스페이스 문자와 대상 문자열과의 조합의 형태 모두가 가능하다.5B is a diagram illustrating an example of a text document having a watermark inserted according to an embodiment of the present invention using Unicode. 5B shows the result of replacing all the strings of the basic Latin code used as the alphabet in the text characters using Unicode with the strings of the number forms code. Referring to FIG. 5B, for example, characters such as 'M', 'c', and 'v' have been replaced, but this is negligible to the naked eye. As shown in FIG. 5B, the string to be replaced can be not only for all the target strings but also for a part of the string, or for the use of a space character and a combination of the space character and the target string.

다시 도 2 를 참조하여, 대상문서 (110) 에서 제공된 텍스트의 내용은 구문분석부 (120) 를 통하여 이진화된 텍스트 형태로 변환되어 문자의 개수와 위치가 각각 기록된다.Referring back to FIG. 2, the content of the text provided from the target document 110 is converted into a binary text form through the parser 120 to record the number and position of the characters.

그러면, 영역선택부 (130) 에서는 상기 구문분석부 (120) 에서 체크된 문자 중에서 사용빈도수가 많으며 또한 동일한 문자이지만 다른 코드값을 가진 문자로 대치가능한 소정의 문자를 선택한다. 여기에서 대치가능한 문자는 상술한 바와 같은 아스키 코드 또는 유니코드로 예를 들어 설명한 동일한 문자이지만 코드값이 서로 상이한 문자를 말한다. 선택되는 대상 문자는 하나 또는 대상 문서의 특성에 따라 두개 혹은 그 이상의 문자일 수 있다.Then, the area selection unit 130 selects a predetermined character among the characters checked by the parser 120 having a high frequency of use and being replaced with a character having the same character but having a different code value. Substitutable characters herein refer to characters that are the same as described in the ASCII code or Unicode described above, for example, but whose code values are different from each other. The selected target character may be two or more characters depending on one or the characteristics of the target document.

또한, 선택되는 대상 문자는 사용빈도수가 많은, 즉 소정의 빈도수 이상의 문자를 선택하는 것이 필요한데, 이는 일정량의 워터마크를 삽입하기 위해서는 기본적으로 삽입할 수 있는 공간의 확보가 필요하기 때문이다. 삽입공간이 많을 수록 많은 워터마크 정보의 삽입이 가능하며, 이는 워터마크의 강인성 또는 정보량과 밀접한 관련이 있다.In addition, the selected target character needs to select a character with a high frequency of use, that is, a predetermined frequency or more, since it is necessary to secure a space that can be inserted in order to insert a certain amount of watermark. The larger the insertion space is, the more watermark information can be inserted, which is closely related to the robustness of the watermark or the amount of information.

다음으로 텍스트 문서에 삽입하려는 저작권이나 소유권, 사용자와 같은 정보를 포함하는 워터마크를 생성하는 과정을 설명하기로 한다.Next, a process of generating a watermark including information such as copyright, ownership, and user to be inserted into a text document will be described.

워터마크 정보 (140) 는 키보드와 같은 입력장치 또는 기 설정된 사용자 정보를 사용하여 입력된 사용자 정보 또는 저작권 혹은 소유권을 증명할 수 있는 정보로 이러한 워터마크 정보는 2진화된 비트열의 형태로 변환된다.The watermark information 140 is user information inputted by using an input device such as a keyboard or preset user information, or information which can prove copyright or ownership. The watermark information is converted into a binary bit string.

도 4 는 확산 스펙트럼 워터마크의 생성을 나타내는 도이며, 도 4 의 (A) 는 상기 2진화된 비트열의 형태로 변환된 워터마크 정보에 해당된다.4 is a diagram illustrating generation of a spread spectrum watermark, and FIG. 4A corresponds to watermark information converted into the form of the binarized bit string.

다음으로 2진화된 비트열의 형태로 변환된 워터마크 정보에는 에러정정코드 (150) 가 부가되며, 이러한 에러정정코드로는 예를 들어 패러티 비트 (Parity Bit) 나 CRC 등이 사용될 수 있다. 여기에서 사용되는 에러 정정코드는 상기 과정에서 발생할 수 있는 에러를 에러코드를 통하여 정정하여 주는 역할을 수행하는 것이다.Next, an error correction code 150 is added to the watermark information converted into the form of a binarized bit string. For example, a parity bit or a CRC may be used as the error correction code. The error correction code used herein serves to correct an error that may occur in the above process through an error code.

확장부 (160) 에서는 2진화된 비트열 정보 (A) 를 R 배의 배수를 사용하여 샘플링수를 증가시키며, 이는 도 4 의 (B) 와 같이 나타난다. 변환된 비트열은 삽입하려는 사용자의 정보를 단일적으로 포함하고 있으므로 이와 같은 샘플링수의 증가 과정을 통해 이를 R 개로 확장시킴으로써 편집에 의한 사용자 정보의 훼손을 방지하고 워터마크의 추출을 보다 용이하게 한다.In the expansion unit 160, the number of sampling is increased by using a multiple of R times the binarized bit string information A, which is represented as shown in FIG. Since the converted bit string contains the information of the user to be inserted into a single unit, the number of samplings is expanded to R by increasing the number of samplings, thereby preventing the user information from being damaged by editing and extracting the watermark more easily. .

여기에서 R 은 상기 영역 선택부 (130) 에서 선택된 문자의 빈도수에 의해 정해진다. 즉, 사용자의 정보가 N 개의 비트열로 구성되어 있고, 선택된 문자의 텍스트 문서내에서의 빈도수가 M 이라고 한다면 M 〉N*R 의 식을 만족하는 범위를 갖는 R 값이 선택되는 것이다.Here, R is determined by the frequency of the characters selected by the area selector 130. That is, if the user information is composed of N bit strings, and the frequency in the text document of the selected character is M, then an R value having a range satisfying the expression M > N * R is selected.

한편, 2 진화된 비트열을 R 배로 확장시키는 방법은 예를 들어 2 진화된 전체 비트열을 반복적으로 R 배 하는 방법이 있다. 즉, 2 진화된 비트열이 '011101' 이라 한다면, R 이 3 이라고 할때, R 배로 샘플링수가 증가된 비트열은 '000111111111000111' 이 된다.On the other hand, a method of expanding the binarized bit stream by R times is, for example, a method of repeatedly R times the entire binarized bit stream. That is, if the two-evolved bit string is '011101', when R is 3, the bit string whose sampling number is increased by R times becomes '000111111111000111'.

키 삽입부 (170) 는 난수를 발생시키기 위한 키를 발생시키는 장치로 사용자의 정의된 정보 또는 시드 (Seed) 값을 임의로 조절하는 것이 가능하기 때문에 보안성을 높일 수 있다. 난수 발생부 (180) 에서는 키 삽입부 (170) 로부터 삽입키의 정보를 받아서 난수를 생성된다. 여기에서 사용되는 난수발생 방법으로는 변환방법 (transformation method), 거절방법 (rejection method), 몬테 카를로 방법 (Monte Carlo method) 또는 이와 유사한 모든 방법이 가능하다. 이와 같이 특정키에 의해 생성된 이진 의사난수가 도 4 의 (C) 와 같이 도시된다.The key inserting unit 170 is a device for generating a key for generating a random number, so that the user can arbitrarily adjust user-defined information or a seed value, thereby improving security. The random number generator 180 receives random key information from the key inserter 170 and generates random numbers. The random number generation method used here may be a transformation method, a rejection method, a Monte Carlo method, or any similar method. As described above, the binary pseudorandom number generated by the specific key is shown in Fig. 4C.

다음으로, XOR 변환부 (190) 에서는 확장부 (160) 로부터의 확장된 워터마크 비트열 (B) 과 난수 발생부 (180) 로부터의 광대역 이진 의사 난수 (C) 를 XOR (exclusive OR) 연산하여 확산 스펙트럼 형태의 비트열 워터마크 (도 4 의 (D) 로 도시됨) 를 생성한다.Next, the XOR conversion unit 190 performs an XOR (exclusive OR) operation on the extended watermark bit string (B) from the expansion unit 160 and the wideband binary pseudorandom number (C) from the random number generation unit 180. Generate a bit string watermark (shown in FIG. 4D) in the form of spread spectrum.

이러한 확산 스펙트럼 형태로 생성된 비트열 형태의 워터마크는 워터마크의 일부분이 훼손되거나 조작되어도 원 정보를 복원해 낼 수 있으며, 이진 의사 난수를 생성하기 위해서 사용된 특정 키에 따라서 서로 다른 워터마크의 삽입이 가능해져 보안성을 유지할 수 있고, 워터마크를 삽입하려는 개별 주체마다 할당된 키를 사용할 수 있다.The bit stream type watermark generated in the form of spread spectrum can restore the original information even if a part of the watermark is damaged or manipulated, and the watermarks of the different watermarks according to the specific key used to generate the binary pseudorandom number can be recovered. It can be inserted to maintain security and use the assigned key for each individual to insert a watermark.

다음으로 셔플링부 (200) 에서 이루어지는 워터마크 섞기 (Shufling) 과정에 대해 설명하기로 한다.Next, the watermark shuffling process performed by the shuffling unit 200 will be described.

상기 XOR 변환부 (190) 에서 생성된 워터마크 비트열은 오버샘플링 방식에 의해 생성되었으므로, 같은 비트열의 반복이 나타나게 되므로 만일 R 개 이상의 변형이 발생하는 경우 일정영역의 정보가 훼손되어 워터마크 정보의 복원이 어렵게 될 수 있다. 즉, 군집오류 (burst error) 에 의해 일정영역의 워터마크 정보가 훼손됨으로써 워터마크의 추출이 불가능해지는 것을 방지하기 위하여, 상기 반복된 워터마크 비트열을 섞어서 다시 배열함으로써, 군집오류가 발생하더라도 워터마크 비트열이 집중적으로 훼손되는 것을 막아 추후 워터마크의 추출을 가능하게 한다.Since the watermark bit string generated by the XOR converter 190 is generated by an oversampling scheme, repetition of the same bit string appears, and if more than R transformations occur, information in a predetermined region is damaged and thus the watermark information is changed. Restoration can be difficult. That is, in order to prevent watermark extraction from being impossible due to the damage of watermark information of a certain region due to a burst error, the repeated watermark bit strings are mixed and rearranged so that even if a cluster error occurs, It is possible to extract the watermark later by preventing the mark bit string from being intensively damaged.

셔플링부 (200) 에서 반복된 비트열을 섞는 방법으로는 난수열을 사용하여 임의의 순서를 주는 방법과 주어진 순서에 의한 방법이 모두 가능하다. 이와같이 셔플링된 확산 스펙트럼 형태의 워터마크 비트열이 생성되었으므로, 워터마크의 일부가 훼손되거나 조작되더라도 원 정보를 복원해낼 수 있으며, 이진 의사 난수를 생성하기 위해서 사용된 특정 키에 따라서 서로 다른 워터마크의 삽입이 가능해져 보안성을 유지할 수 있고, 워터마크를 삽입하려는 개별주체마다 할당된 키를 사용할 수 있다. 이와 같은 방식을 직접 시퀀스 확산 스펙트럼 방식이라고 하며, 반송 주파수를 랜덤하게 변화시켜 주는 방식을 주파수 호핑 확산 스펙트럼 방식이라 한다.As a method of mixing the repeated bit strings in the shuffling unit 200, both a random order sequence and a random sequence sequence may be used. Since a watermark bit string in the form of a shuffled spread spectrum is generated, original information can be recovered even if a portion of the watermark is damaged or manipulated, and different watermarks are generated according to a specific key used to generate a binary pseudorandom number. Can be inserted to maintain security, and the key assigned to each individual to insert a watermark can be used. Such a method is called a direct sequence spread spectrum method, and a method of randomly changing a carrier frequency is called a frequency hopping spread spectrum method.

또한, 확산 스펙트럼 방식의 하나로써 난수 발생기에 의해 발생된 난수를 워터마크로써 원 문서에 삽입하고, 검출할때에 그 상관도를 구하여 상관도 값이 소정의 기준값을 넘는 경우에는 워터마크가 존재하는 것으로, 그렇지 못한 경우에는 워터마크가 존재하지 않는 것으로 판단하는 방법도 가능하다.In addition, as one of the spread spectrum methods, a random number generated by a random number generator is inserted as a watermark into an original document, and the correlation is obtained at the time of detection. When the correlation value exceeds a predetermined reference value, a watermark exists. If not, a method of determining that there is no watermark is possible.

상기 난수열을 사용하는 방법에서의 시드 (Seed) 값이 또한 워터마크의 키로 존재하므로 시드값을 모르는 사람은 워터마크를 삽입하거나 추출하는 것이 용이하지 않기 때문에 추가적인 보안성과 안정성을 가질 수 있다.Since the seed value in the method using the random number sequence also exists as a key of the watermark, a person who does not know the seed value may have additional security and stability because it is not easy to insert or extract the watermark.

다시 도 4 를 참조로 하여 상술한 과정을 설명하면, 2 진화된 원래의 워터마크 비트열인 도 4 의 (A) 에서 N 비트로 구성된 신호가 길게 표시된 부분을 이진수 '1' 이라 하고 점으로 표시된 부분을 이진수 '0' 이라 하면, 삽입하려는 워터마크 비트열은 '111111100000000' 로 표시될 수가 있다.Referring to FIG. 4 again, the above-described process will be described. A portion in which a signal composed of N bits is elongated in FIG. When the binary number is '0', the watermark bit string to be inserted may be represented as '111111100000000'.

이를 R 배하여 '1*R 1*R 1*R 1*R 1*R 1*R 1*R 0*R 0*R 0*R 0*R 0*R 0*R 0*R 0*R' 의 형태로 확장시키면 도 4 의 (B) 와 같이 오버샘플링된 워터마크 비트열이 된다.Multiply R by '1 * R 1 * R 1 * R 1 * R 1 * R 1 * R 1 * R 0 * R 0 * R 0 * R 0 * R 0 * R 0 * R 0 * R 0 * R When expanded in the form of ', it becomes an oversampled watermark bit string as shown in FIG.

이와 같이 확장된 워터마크 비트열 (도 4 의 (B)) 을 광대역 이진 의사 난수 (도 4 의 (C)) 와 XOR 연산하는 변환과정을 거치면 도 4 의 (D) 와 같은 확산 스펙트럼 형태의 워터마크 비트열이 생성된다.As a result of the XOR operation of the extended watermark bit string (FIG. 4B) with the wideband binary pseudorandom number (C) in FIG. 4, the water having a spread spectrum form as shown in FIG. The mark bit string is generated.

상기 확산 스펙트럼 형태의 워터마크 비트열 신호는 일정한 신호열의 반복형태이므로 이를 암호화하기 위하여 셔플링부 (200) 에서 난수열을 이용한 섞기 과정을 거치게 한다.Since the watermark bit string signal in the spread spectrum form is a repeating form of a constant signal string, the shuffling unit 200 performs a mixing process using a random number sequence in order to encrypt it.

이와 같이 생성된 확산 스펙트럼 형태의 워터마크 비트열은 조합부 (210) 에서 상기 영역 선택부 (130) 에서 선택된 대상문자의 소정 위치에 삽입되게 된다.즉, 구문 분석부 (120) 및 영역 선택부 (130) 에서 결정된 동일한 문자이지만 코드값이 서로 다르며 소정의 빈도수를 갖는 대상 문자의 코드값을 상기 확산 스펙트럼 형태의 워터마크 비트열 값에 따라 조정함으로써, 워터마크가 삽입되는 것이다.The generated watermark bit string in the form of spread spectrum is inserted in the combining unit 210 at a predetermined position of the target character selected by the region selecting unit 130. That is, the syntax analyzing unit 120 and the region selecting unit. The watermark is inserted by adjusting the code value of the target character having the same character but different code values and having a predetermined frequency determined in step 130 according to the watermark bit string value of the spread spectrum form.

즉, 예를 들어 유니코드의 경우라면, 삽입하고자 하는 워터마크의 비트값이 '0' 이라면 대상문자가 원래 사용되는 코드값을 갖게하고, 삽입하고자 하는 워터마크의 비트값이 '0' 이라면 대상문자가 대체 코드값을 갖게 한다.That is, for example, in the case of Unicode, if the bit value of the watermark to be inserted is '0', the target character has the code value used originally, and if the bit value of the watermark to be inserted is '0', Have the character have a replacement code value.

또한, 상기 조합부 (210) 는 워터마크가 삽입된 이진화된 텍스트 형태의 문서를 다시 사용자가 사용가능한 형태의 텍스트 형식으로 변환하는 기능을 수행하고, 이에 따라 워터마크가 삽입된 문서 (220) 가 생성된다.In addition, the combination unit 210 performs a function of converting a document in the form of a binary text having a watermark inserted therein into a text form in a form usable by the user again. Is generated.

상술한 바와 같이 이와 같이 워터마크가 삽입된 문서 (220) 는 예를 들어 도 5a 또는 도 5b 와 같고, 이렇게 나타난 문자열은 일반 텍스트 뷰어 프로그램이나 워드 프로세싱 프로그램에서는 그 차이를 알아낼 수가 없으며, 추후 문서의 편집시 문자열의 폰트, 사이즈, 문장구조등이 변환되어도 삽입된 워터마크 정보는 영향을 받지 않는다. 또한, 텍스트의 일부가 편집된 경우에도 워터마크의 삽입정보 전체에는 영향을 미치지 않으므로 삽입정보의 추출이 가능하게 된다.As described above, the document 220 in which the watermark is inserted is as shown in FIG. 5A or 5B, for example, and the character string thus displayed cannot be detected by a general text viewer program or a word processing program. The inserted watermark information is not affected even if the font, size, sentence structure, etc. of the character string are converted during editing. In addition, even when a part of the text is edited, the insertion information of the watermark is not affected because the entire insertion information of the watermark is not affected.

다음으로, 도 6 및 도 7 을 참조로하여 상기 워터마크가 삽입된 문서 (220) 로부터 워터마크를 추출하는 과정에 대해 설명하기로 한다.Next, a process of extracting a watermark from the document 220 into which the watermark is inserted will be described with reference to FIGS. 6 and 7.

도 6 은 본 발명의 실시예에 따른 워터마크 추출장치의 구성을 나타내는 블록도이고, 도 7 은 확산 스펙트럼 워터마크의 복원을 나타내는 도이다.6 is a block diagram showing the configuration of a watermark extracting apparatus according to an embodiment of the present invention, and FIG. 7 is a diagram showing restoration of a spread spectrum watermark.

도 6 을 참조로 하면, 본 발명의 워터마크 추출장치 (300) 는 구문분석부(310), 영역 선택부 (320), 역 셔플링부 (330), 난수 발생부 (340), XOR 변환부 (350), 수축부 (360), 및 워터마크 추출부 (370) 를 포함하며, 이러한 구성요소들은 하드웨어 또는 소프트웨어적인 모듈일 수 있다.Referring to FIG. 6, the watermark extraction apparatus 300 of the present invention includes a syntax analyzer 310, an area selector 320, an inverse shuffling unit 330, a random number generator 340, and an XOR converter ( 350, a constrictor 360, and a watermark extractor 370, these components may be hardware or software modules.

구문 분석부 (310) 에서, 상기 워터마크가 삽입된 문서 (220) 는 이진화된 문자열로 변환되고, 영역 선택부 (320) 에서는 워터마크가 삽입된 대상 문자에 대하여 사용빈도와 코드값이 대치되었는지의 여부를 확인한다. 만약, 대상문자에 코드값이 대치된 문자가 하나도 없을때에는 텍스트 문서에 워터마크 정보가 삽입되지 않았다는 결과를 출력한다.In the parsing unit 310, the watermark-embedded document 220 is converted into a binary string, and the area selection unit 320 determines whether the frequency of use and the code value are replaced with respect to the target character into which the watermark is inserted. Check whether or not. If there are no characters whose code values are substituted for the target character, the result is that the watermark information is not inserted in the text document.

역 셔플링부 (330) 에서, 상기 워터마크 삽입장치 (100) 의 셔플링부 (200) 에서 이루어진 섞기 과정의 역과정이 수행된다. 즉, 난수열 방식으로 셔플링되었다면 키값에 의해 난수열을 재생성하여 셔플링된 확산 스펙트럼 형태의 워터마크 비트열을 원래의 순서대로 복원하며, 만약 정해진 순서에 의해 셔플링되었다면 이에 따라 원래의 순서대로 복원한다. 역 셔플링부 (330) 에서 역 셔플링된 확산 스펙트럼 형태의 워터마크 비트열은 도 7 의 (A) 와 같이 나타난다.In the reverse shuffling unit 330, a reverse process of the mixing process performed in the shuffling unit 200 of the watermark inserting apparatus 100 is performed. That is, if shuffled by random sequence method, the random number sequence is regenerated by key value to restore the shuffled spread spectrum type watermark bit string in the original order, and if shuffled according to the predetermined order, according to the original order. Restore The watermark bit string in the form of spread spectrum reversely shuffled by the inverse shuffling unit 330 is shown in FIG. 7A.

난수 발생부 (340) 에서, 주어진 키 값에 따라 광대역 이진 의사 난수가 발생되며 이 비트열은 도 7 의 (B) 와 같이 도시된다. 난수 발생부 (340) 에서 발생되는 광대역 이진 의사 난수는 도 2 의 난수발생부 (180) 에서 발생되는 광대역 이진 의사 난수와 같은 비트열 신호이다.In the random number generator 340, a wideband binary pseudorandom number is generated according to a given key value and this bit string is shown as shown in FIG. The wideband binary pseudorandom number generated by the random number generator 340 is a bit string signal such as the wideband binary pseudorandom number generated by the random number generator 180 of FIG. 2.

XOR 변환부 (350) 에서는, 역 셔플링부 (330) 로부터 출력된 확산 스펙트럼 형태의 워터마크 비트열 (도 7 의 A) 과 난수 발생부 (340) 로부터 출력된 광대역이진 의사 난수 (도 7 의 B) 를 XOR 연산하며, 결과로서의 확장된 워터마크 비트열 신호가 도 7 의 C 와 같이 도시된다.In the XOR conversion section 350, the spread spectrum type watermark bit string (A in FIG. 7) output from the inverse shuffling section 330 and the wideband binary pseudo-random number output from the random number generator 340 (B in FIG. 7). ) Is XORed, and the resulting extended watermark bitstream signal is shown as C in FIG.

다음으로, 수축부 (360) 에서는 상기 확장된 워터마크 비트열 신호 (도 7 의 C) 를 축소시키고, 워터마크 추출부 (370) 에서 원래의 워터마크 비트열 신호 (도 7 의 D) 로 복원된다.Next, the constrictor 360 reduces the expanded watermark bitstream signal (C of FIG. 7), and restores the original watermark bitstream signal (D of FIG. 7) by the watermark extractor 370. do.

다음으로, 상기 복원된 워터마크 비트열 신호는 오류정정 (380) 과정을 거쳐 추출된 워터마크 (390) 가 얻어지며, 이로써 워터마크 삽입장치 (100) 에서 삽입되었던 텍스트 문서의 저작권이나 소유권 정보를 알 수 있게되고, 텍스트 문서가 위조 또는 변조되었는지의 여부를 판단할 수 있다.Next, the reconstructed watermark bit string signal is obtained by the watermark 390 extracted through the error correction process 380, thereby obtaining copyright or ownership information of the text document inserted by the watermark embedding apparatus 100. It can be seen and can determine whether the text document has been forged or tampered with.

본 발명은 상기의 실시예들을 참조로하여 특별히 도시되고 기술되었지만, 이는 예시를 위하여 사용된 것이며 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 첨부된 청구범위에서 정의된 것처럼 발명의 정신 및 범위를 벗어남이 없이 다양한 수정을 할 수 있다.Although the invention has been particularly shown and described with reference to the above embodiments, it has been used for the purpose of illustration and those of ordinary skill in the art to which the invention pertains have the spirit and scope of the invention as defined in the appended claims. Various modifications can be made without departing.

상술한 바와 같이 본 발명에 따르면, 텍스트 문서내의 문장이나 단어에 육안으로 식별가능한 변화를 가하지 않으면서 저작권이나 소유권 정보를 갖는 워터마크를 삽입할 수 있는 효과가 있다.As described above, according to the present invention, there is an effect that a watermark having copyright or ownership information can be inserted without making a visually identifiable change to a sentence or word in a text document.

또한, 본 발명에 따르면 텍스트 문서의 편집이나 텍스트 포맷의 변경에도 강인한, 즉 이와 같은 편집이나 변경에 쉽게 깨지지 않는 워터마크를 텍스트 문서에 삽입할 수 있는 효과가 있다.In addition, according to the present invention, it is effective to insert a watermark into a text document, which is robust to editing the text document or changing the text format, that is, not easily broken by such editing or changing.

또한, 본 발명에 따르면 워터마크가 삽입된 텍스트 문서에 군집오류가 발생하더라도 워터마크를 추출할 수 있는 효과가 있다.In addition, according to the present invention, even if a clustering error occurs in the text document into which the watermark is inserted, the watermark can be extracted.

또한, 본 발명에 따르면 텍스트 문서에 육안으로 식별할 수 없으며 저작권이나 소유권을 증명할 수 있는 워터마크를 삽입 및 추출하는 방법을 제공함으로써, 웹 상이나 전자문서에 사용되는 각종의 텍스트 문서 및 기타 네트워크 상에서 공유되고 있는 텍스트 문서에 대한 저작권 및 소유권을 보호할 수 있는 효과가 있다.In addition, the present invention provides a method of inserting and extracting a watermark that cannot be visually identified in a text document and which can prove copyright or ownership, thereby sharing on a variety of text documents and other networks used on the web or in electronic documents. The effect is to protect the copyright and ownership of the text document being created.

Claims (16)

텍스트 문서에 워터마크를 삽입하는 방법에 있어서,In the method of embedding a watermark in a text document, 워터마크 비트열을 생성하는 단계; 및Generating a watermark bit stream; And 상기 텍스트 문서내의 문자 중에서 동일한 문자이지만 문자 코드값이 서로 상이한 문자를 이용하여, 상기 텍스트 문서에 워터마크를 삽입하는 단계를 포함하는 것을 특징으로 하는 방법.And embedding a watermark in the text document by using the same characters among the characters in the text document but having different character code values. 제 1 항에 있어서,The method of claim 1, 상기 워터마크를 삽입하는 단계는Inserting the watermark 동일한 문자이지만 코드값이 서로 상이한 상기 문자의 제 1 코드값과 제 2 코드값을 상기 워터마크 비트열의 0 값과 1 값으로 각각 정한 후, 상기 텍스트 문서내의 동일한 문자이지만 코드값이 서로 상이한 상기 문자의 코드값을 조정함으로써 상기 텍스트 문서에 워터마크를 삽입하는 단계임을 특징으로 하는 방법.The first code value and the second code value of the character having the same character but different code values are set to 0 and 1 value of the watermark bit string, respectively, and then the character having the same character but different code values in the text document And embedding a watermark in the text document by adjusting a code value of the text document. 제 1 항 또는 제 2 항에 있어서,The method according to claim 1 or 2, 동일한 문자이지만 코드값이 서로 상이한 상기 문자는 아스키 코드 및 2 바이트 완성형 또는 2 바이트 조합형 코드에서 영문 및 한글의 공백 (Space) 문자인 것을 특징으로 하는 방법.The same character but different in code value is a space character of English and Korean in ASCII code and 2-byte complete or 2-byte combined code. 제 1 항 또는 제 2 항에 있어서,The method according to claim 1 or 2, 동일한 문자이지만 코드값이 서로 상이한 상기 문자는 유니 코드에서 영문 및 한글의 공백 (Space) 문자 또는 문자의 형태는 동일하나 코드값이 서로 상이한 영문 문자인 것을 특징으로 하는 방법.The character of the same character but different code values is a space character of the English and Korean characters in Unicode or the same character, but characterized in that the code values are different from each other. 제 1 항 또는 제 2 항에 있어서,The method according to claim 1 or 2, 동일한 문자이지만 코드값이 서로 상이한 상기 문자는 상기 텍스트 문서내에서 소정의 사용 빈도수를 만족하는 문자인 것을 특징으로 하는 방법.And said characters having the same characters but different code values are characters satisfying a predetermined frequency of use in said text document. 텍스트 문서에 워터마크를 삽입하는 방법에 있어서,In the method of embedding a watermark in a text document, (a) 상기 텍스트 문서내의 문자 중에서 동일한 문자이지만 문자 코드값이 서로 상이한 문자를 선택하는 단계;(a) selecting a character among the characters in the text document but having different character code values; (b) 이진화된 워터마크 비트열 신호를 작성하는 단계;(b) generating a binarized watermark bitstream signal; (c) 상기 워터마크 비트열 신호를 R 배의 배수를 사용하여 확장시키는 단계;(c) extending the watermark bitstream signal using a multiple of R times; (d) 소정의 사용자 키로부터 광대역 이진 의사 난수 신호를 발생시키는 단계;(d) generating a wideband binary pseudo random number signal from a given user key; (e) 상기 확장된 워터마크 비트열 신호와 상기 발생된 광대역 이진 의사 난수를 XOR 연산하여 확산 스펙트럼 형태의 워터마크 비트열 신호를 생성하는 단계; 및(e) generating a spread spectrum watermark bitstream signal by performing an XOR operation on the extended watermark bitstream signal and the generated wideband binary pseudorandom number; And (f) 상기 확산 스펙트럼 형태의 워터마크 비트열 신호에 따라, 상기 (a) 단계에서 선택된 동일한 문자이지만 문자 코드값이 서로 상이한 상기 문자를 이용하여, 상기 텍스트 문서에 워터마크를 삽입하는 단계를 포함하는 것을 특징으로 하는 방법.(f) embedding a watermark in the text document using the same characters selected in step (a) but having different character code values according to the watermark bit string signal in the spread spectrum form Characterized in that. 제 6 항에 있어서,The method of claim 6, 상기 (f) 단계는Step (f) 동일한 문자이지만 코드값이 서로 상이한 상기 문자의 제 1 코드값과 제 2 코드값을 상기 워터마크 비트열의 0 값과 1 값으로 각각 정한 후, 상기 텍스트 문서내의 동일한 문자이지만 코드값이 서로 상이한 상기 문자의 코드값을 조정함으로써 상기 텍스트 문서에 워터마크를 삽입하는 단계임을 특징으로 하는 방법.The first code value and the second code value of the character having the same character but different code values are set to 0 and 1 value of the watermark bit string, respectively, and then the character having the same character but different code values in the text document And embedding a watermark in the text document by adjusting a code value of the text document. 제 6 항 또는 제 7 항에 있어서,The method according to claim 6 or 7, 상기 (e) 단계 이후 상기 (f) 단계 이전에,After step (e) and before step (f), (e1) 상기 확산 스펙트럼 형태의 워터마크 비트열 신호를 셔플링하는 단계를 더 포함하는 것을 특징으로 하는 방법.(e1) shuffling the watermark bitstream signal in the form of a spread spectrum. 제 8 항에 있어서,The method of claim 8, 상기 셔플링은 소정의 시드 (Seed) 값을 갖는 난수를 사용하여 이루어지는 것을 특징으로 하는 방법.The shuffling is performed using a random number having a predetermined seed value. 제 6 항에 있어서,The method of claim 6, 상기 (a) 단계 이전에,Before step (a) above, 상기 텍스트 문서를 이진화된 텍스트 문서로 변환하는 단계를 더 포함하는 것을 특징으로 하는 방법.Converting the text document into a binary text document. 제 6 항에 있어서,The method of claim 6, 상기 (b) 단계 이후 상기 (c) 단계 이전에,After step (b) and before step (c), (b1) 상기 작성된 이진화된 워터마크 비트열 신호에 에러 정정코드를 부가하는 단계를 더 포함하는 것을 특징으로 하는 방법.(b1) adding an error correction code to the created binary watermark bit string signal. 제 6 항의 방법에 의해 워터마크가 삽입된 텍스트 문서로부터 워터마크를 추출하는 방법에 있어서,A method of extracting a watermark from a text document having a watermark embedded therein by the method of claim 6, (g) 상기 워터마크가 삽입된 텍스트 문서를 이진화된 텍스트 문서로 변환하는 단계;(g) converting the text document containing the watermark into a binary text document; (h) 상기 이진화된 텍스트 문서에서 코드값이 대치된 문자열을 찾아, 상기 코드값이 대치된 문자열로부터 확산 스펙트럼 형태의 워터마크 비트열 신호를 생성하는 단계;(h) finding a character string in which the code value is substituted in the binarized text document and generating a spread spectrum type watermark bit string signal from the character string in which the code value is substituted; (i) 소정의 사용자 키로부터 광대역 이진 의사 난수 신호를 발생시키는 단계;(i) generating a wideband binary pseudo random number signal from a given user key; (j) 상기 확산 스펙트럼 형태의 워터마크 비트열 신호와 상기 발생된 광대역이진 의사 난수를 XOR 연산하여 확장된 워터마크 비트열 신호를 생성하는 단계; 및(j) generating an extended watermark bitstream signal by performing an XOR operation on the spread spectrum type watermark bitstream signal and the generated wideband binary pseudorandom number; And (k) 상기 확장된 워터마크 비트열 신호를 수축하여 원래의 워터마크 비트열 신호로 복원하는 단계를 포함하는 것을 특징으로 하는 방법.(k) contracting the extended watermark bitstream signal and restoring it to the original watermark bitstream signal. 제 12 항에 있어서,The method of claim 12, 상기 (h) 단계 이후 상기 (i) 단계 이전에,After step (h) and before step (i), (h1) 상기 생성된 확산 스펙트럼 형태의 워터마크 비트열 신호에 역 셔플링을 수행하는 단계를 더 포함하는 것을 특징으로 하는 방법.(h1) further comprising performing a reverse shuffling on the generated spread spectrum type watermark bit string signal. 텍스트 문서에 워터마크를 삽입하는 장치에 있어서,An apparatus for embedding a watermark in a text document, 워터마크 비트열을 생성하는 수단; 및Means for generating a watermark bit stream; And 상기 텍스트 문서내의 문자 중에서 동일한 문자이지만 문자 코드값이 서로 상이한 문자를 이용하여, 상기 텍스트 문서에 워터마크를 삽입하는 수단을 포함하는 것을 특징으로 하는 장치.And means for embedding a watermark in the text document using characters that are the same among the characters in the text document but differ in character code values. 텍스트 문서에 워터마크를 삽입하는 장치에 있어서,An apparatus for embedding a watermark in a text document, 상기 텍스트 문서내의 문자 중에서 동일한 문자이지만 문자 코드값이 서로 상이한 문자를 선택하는 영역 선택부;An area selection unit for selecting characters from among the characters in the text document, but characters having different character code values; 이진화된 워터마크 비트열 신호를 작성하는 워터마크 생성부;A watermark generator for generating a binarized watermark bit string signal; 상기 워터마크 비트열 신호를 R 배의 배수를 사용하여 확장시키는 확장부;An expansion unit for expanding the watermark bit string signal using a multiple of R times; 소정의 사용자 키로부터 광대역 이진 의사 난수 신호를 발생시키는 난수 발생부;A random number generator for generating a wideband binary pseudorandom signal from a predetermined user key; 상기 확장된 워터마크 비트열 신호와 상기 발생된 광대역 이진 의사 난수를 XOR 연산하여 확산 스펙트럼 형태의 워터마크 비트열 신호를 생성하는 XOR 변환부; 및An XOR converter configured to generate a spread spectrum watermark bitstream signal by performing an XOR operation on the extended watermark bitstream signal and the generated wideband binary pseudorandom number; And 상기 확산 스펙트럼 형태의 워터마크 비트열 신호에 따라, 상기 영역 선택부에서 선택된 동일한 문자이지만 문자 코드값이 서로 상이한 상기 문자를 이용하여, 상기 텍스트 문서에 워터마크를 삽입하는 조합부를 포함하는 것을 특징으로 하는 장치.And a combination unit for inserting a watermark into the text document by using the same characters selected by the region selection unit but having different character code values according to the spread spectrum type watermark bit string signal. Device. 제 14 항 또는 제 15 항에 있어서,The method according to claim 14 or 15, 상기 워터마크의 삽입은, 동일한 문자이지만 코드값이 서로 상이한 상기 문자의 제 1 코드값과 제 2 코드값을 상기 워터마크 비트열의 0 값과 1 값으로 각각 정한 후, 상기 텍스트 문서내의 동일한 문자이지만 코드값이 서로 상이한 상기 문자의 코드값을 조정함으로써 이루어지는 것임을 특징으로 하는 장치.The embedding of the watermark is the same character in the text document after setting the first code value and the second code value of the character having the same character but different code values to 0 and 1 value of the watermark bit string, respectively. And adjusting the code values of the characters having different code values.
KR10-2002-0002647A 2002-01-17 2002-01-17 Method for embedding and extracting watermark into/from a text document, and the apparatus thereof KR100467930B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2002-0002647A KR100467930B1 (en) 2002-01-17 2002-01-17 Method for embedding and extracting watermark into/from a text document, and the apparatus thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0002647A KR100467930B1 (en) 2002-01-17 2002-01-17 Method for embedding and extracting watermark into/from a text document, and the apparatus thereof

Publications (2)

Publication Number Publication Date
KR20030062463A KR20030062463A (en) 2003-07-28
KR100467930B1 true KR100467930B1 (en) 2005-01-24

Family

ID=32218323

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0002647A KR100467930B1 (en) 2002-01-17 2002-01-17 Method for embedding and extracting watermark into/from a text document, and the apparatus thereof

Country Status (1)

Country Link
KR (1) KR100467930B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101572076B1 (en) * 2015-04-14 2015-11-26 주식회사 디지워크 Method of generating image inserted information and apparatus performing the same
US20200210555A1 (en) * 2018-12-27 2020-07-02 Alibaba Group Holding Limited Information Processing Method, Hidden Information Parsing and Embedding Method, Apparatus, and Device

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799869B (en) * 2005-09-16 2012-09-05 北京书生电子技术有限公司 Implicit code detection method
US9600771B2 (en) 2012-10-31 2017-03-21 Empire Technology Development Llc Information coding based on semantic data reasoning
CN104850765A (en) * 2014-02-19 2015-08-19 中国移动通信集团福建有限公司 Watermark processing method, device and system
KR102103525B1 (en) * 2019-10-24 2020-04-22 상명대학교산학협력단 CityGML file watermarking method, watermark extraction method and watermarking system using isomorphic characters

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099501A (en) * 1998-09-17 2000-04-07 Internatl Business Mach Corp <Ibm> Method and system for padding information into document data
KR20010008048A (en) * 2000-11-04 2001-02-05 김주현 Watermarking method for digital contents
KR20010070865A (en) * 2001-06-14 2001-07-27 최종욱 Apparatus for preventing duplication and forgery/alternation of document and authenticating it
KR20010095343A (en) * 2000-11-02 2001-11-07 최종욱 Computer system and method for verifying the authenticity of digital documents

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099501A (en) * 1998-09-17 2000-04-07 Internatl Business Mach Corp <Ibm> Method and system for padding information into document data
KR20010095343A (en) * 2000-11-02 2001-11-07 최종욱 Computer system and method for verifying the authenticity of digital documents
KR20010008048A (en) * 2000-11-04 2001-02-05 김주현 Watermarking method for digital contents
KR20010070865A (en) * 2001-06-14 2001-07-27 최종욱 Apparatus for preventing duplication and forgery/alternation of document and authenticating it

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101572076B1 (en) * 2015-04-14 2015-11-26 주식회사 디지워크 Method of generating image inserted information and apparatus performing the same
WO2016167458A1 (en) * 2015-04-14 2016-10-20 주식회사 디지워크 Method for generating image with information inserted, and image generation apparatus for executing same
US20200210555A1 (en) * 2018-12-27 2020-07-02 Alibaba Group Holding Limited Information Processing Method, Hidden Information Parsing and Embedding Method, Apparatus, and Device

Also Published As

Publication number Publication date
KR20030062463A (en) 2003-07-28

Similar Documents

Publication Publication Date Title
Alotaibi et al. Improved capacity Arabic text watermarking methods based on open word space
US7412072B2 (en) Variable message coding protocols for encoding auxiliary data in media signals
Stern et al. Robust object watermarking: Application to code
US8127137B2 (en) Watermark payload encryption for media including multiple watermarks
Roy et al. A novel approach to format based text steganography
CN103049682B (en) Character pitch encoding-based dual-watermark embedded text watermarking method
CN100447812C (en) Document data waterprint embedded method
US20030190054A1 (en) Method and system for distributing digital content with embedded message
Lee et al. A new approach to covert communication via PDF files
Shirali-Shahreza et al. Arabic/Persian text steganography utilizing similar letters with different codes
US20050053258A1 (en) System and method for watermarking a document
US20030026453A1 (en) Repetition coding of error correction coded messages in auxiliary data embedding applications
JP2000099501A (en) Method and system for padding information into document data
Kingslin et al. Evaluative approach towards text steganographic techniques
CN105095699A (en) Watermark information embedding method and device, and watermark information decoding method
CN104050400B (en) A kind of web page interlinkage guard method that steganography is encoded based on command character
JPWO2004095828A1 (en) Watermark information embedding device and method, watermark information detection device and method, and watermarked document
KR100467930B1 (en) Method for embedding and extracting watermark into/from a text document, and the apparatus thereof
Rafat et al. Secure digital steganography for ASCII text documents
CN109800547B (en) Method for quickly embedding and extracting information for WORD document protection and distribution tracking
JP4863017B2 (en) Information hiding system, apparatus and method
CN111382398B (en) Method, device and equipment for information processing, hidden information analysis and embedding
Shirali-Shahreza et al. Persian/arabic unicode text steganography
Lin et al. A copyright protection scheme based on PDF
JP4613807B2 (en) Document processing apparatus and document processing method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130114

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140113

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20150114

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20160114

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20170111

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20180104

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20191205

Year of fee payment: 16