KR101124488B1 - Color laser printer identification method through noise characteristics analysis - Google Patents

Color laser printer identification method through noise characteristics analysis Download PDF

Info

Publication number
KR101124488B1
KR101124488B1 KR1020100036365A KR20100036365A KR101124488B1 KR 101124488 B1 KR101124488 B1 KR 101124488B1 KR 1020100036365 A KR1020100036365 A KR 1020100036365A KR 20100036365 A KR20100036365 A KR 20100036365A KR 101124488 B1 KR101124488 B1 KR 101124488B1
Authority
KR
South Korea
Prior art keywords
image
color laser
contrast
region
laser printer
Prior art date
Application number
KR1020100036365A
Other languages
Korean (ko)
Other versions
KR20110116762A (en
Inventor
이해연
백지연
공승규
이흥수
Original Assignee
금오공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 금오공과대학교 산학협력단 filed Critical 금오공과대학교 산학협력단
Priority to KR1020100036365A priority Critical patent/KR101124488B1/en
Publication of KR20110116762A publication Critical patent/KR20110116762A/en
Application granted granted Critical
Publication of KR101124488B1 publication Critical patent/KR101124488B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K15/00Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
    • G06K15/02Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers
    • G06K15/12Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers by photographic printing, e.g. by laser printers
    • G06K15/129Colour printing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3226Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image
    • H04N2201/323Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image for tracing or tracking, e.g. forensic tracing of unauthorized copies

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Optics & Photonics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

위너 필터 및 명암도 동시 발생 행렬을 통하여 컬러 레이저 프린터를 판별하는 방법이 제공된다. 컬러 레이저 프린터로 인쇄된 디지털 영상을 스캔한 후 RGB 도메인 영역을 CMY 영역으로 변환한다. 상기 CMY 영역으로 표현된 영상을 위너 필터를 거쳐 잡음이 제거된 영상을 생성한다. 상기 CMY 영상과 상기 잡음이 제거된 영상의 차이를 기초로 하여 잡음 성분을 추출한다. 상기 추출된 잡음 성분에 대하여 명암도 동시 발생 행렬 변환을 수행하여 행렬값을 계산한다. 상기 행렬값에 대해 유사성, 대조, 합계, 상관 계수, 및 공분산 값을 구비한 다수의 특징점을 계산한다. 상기 다수의 특징점을 하나의 특징 벡터로 합쳐서 서포트 벡터 머신 분류기의 특징으로 입력하여 상기 컬러 레이저 프린터를 판별한다.A method for discriminating a color laser printer through a Wiener filter and a contrast matrix is provided. After scanning a digital image printed by a color laser printer, the RGB domain area is converted into a CMY area. An image, from which noise is removed, is generated through a Wiener filter on the image represented by the CMY region. A noise component is extracted based on the difference between the CMY image and the image from which the noise is removed. A matrix value is calculated by performing contrast-contrast matrix transformation on the extracted noise component. A plurality of feature points with similarity, contrast, sum, correlation coefficient, and covariance values are calculated for the matrix values. The plurality of feature points are combined into one feature vector and input as features of a support vector machine classifier to determine the color laser printer.

Description

잡음 특성 분석을 통한 컬러 레이저 프린터 판별 방법{Color laser printer identification method through noise characteristics analysis}Color laser printer identification method through noise characteristics analysis

본 발명은 컬러 레이저 프린터에 관한 것으로, 더 상세하게는 디지털 이미지 포렌식 기술 중에서 영상 획득 장비에 해당하는 컬러 레이저 프린터 판별 방법에 관한 것이다.The present invention relates to a color laser printer, and more particularly, to a method for discriminating a color laser printer corresponding to an image acquisition device among digital image forensic technology.

컴퓨터의 대중화로 인해 우리 사회에서는 고성능의 컴퓨터와 주변기기들을 저렴한 가격에 구매할 수 있다. 또한 다양한 소프트웨어의 개발로 인해 초보자들도 컴퓨터를 이용하여 복잡한 작업을 쉽게 할 수 있다. 이로 인한 긍정적 측면이 있지만 부정적 측면도 있다. 그 대표적인 예가 위?변조 범죄이다. 도 1은 연도별 위/변조 범죄 현황 및 발견률을 나타낸 도면이다. 도 1에 나타난 것과 같이 해가 거듭할수록 다양한 종류의 위?변조 범죄가 증가하는 것을 볼 수 있다. 이는 ‘포토샵’이나 ‘일러스트레이터’등 이미지 편집 프로그램의 발전으로 인해 손쉽게 위?변조가 가능하기 때문이다. 또한 위?변조 기술이 점점 교묘해 지면서 일반인이 위?변조를 판별할 확률은 1% 정도로 매우 희박하다.Due to the popularization of computers, our society can purchase high-performance computers and peripherals at low prices. Also, due to the development of various softwares, even beginners can use the computer to easily perform complicated tasks. This has some positive aspects but also some negative ones. A typical example is forgery and forgery. 1 is a view showing the status and detection rate of forgery and forgery crime by year. As shown in FIG. 1, it can be seen that as the years go by, various kinds of forgery and alteration crimes increase. This is because forgery and forgery are easy due to the development of image editing programs such as Photoshop and Illustrator. In addition, as forgery and alteration techniques become more sophisticated, the probability of discriminating forgery and alteration by the general public is very low (1%).

영상 위?변조의 증가로 인해 이미지에 대한 신뢰성이 점차 중요해 지고 있다. 이러한 이미지의 신뢰성을 강화하기 위해 디지털 이미지 포렌식 기술이 활발하게 연구되고 있다. 디지털 이미지 포렌식 기술은 영상에 숨겨져 있는 고유의 특성을 찾아내 이미지를 만들어 낸 기기를 밝혀낸다든지 이미지 위조 여부를 판별하는 기술로, 영상 획득 장비 판별, 영상 위?변조 탐지 기술로 크게 나뉘어져 연구되고 있다. Due to the increase in image forgery and modulation, image reliability is becoming more important. Digital image forensic technology is being actively researched to enhance the reliability of such images. Digital image forensic technology is a technology to find out the inherent characteristics hidden in the image to identify the device that produced the image or to determine whether the image is forged. The research is divided into the image acquisition equipment identification and the image forgery detection technology.

영상 획득 장비 판별 기술은 주어진 영상으로부터 영상을 획득하는데 사용된 장비가 무엇인지 판단하는 기술이다. 주어진 영상만을 이용해서 영상을 획득하는데 사용한 장비의 제조사 뿐만 아니라 정확한 모델명 수준까지 판별하는 것을 목표로 한다. Image acquisition equipment identification technology is a technique for determining what equipment used to acquire an image from a given image. It aims to determine the exact model name level as well as the manufacturer of the equipment used to acquire the image using only the given image.

영상 위?변조 탐지 기술은 주어진 영상이 위?변조 단계를 거쳤는지 여부를 판별하는 기술이다. 디지털 이미지의 위?변조는 눈에 띄는 단서를 남기지 않지만, 영상을 구성하는 통계적 특성에 변화를 준다. 따라서 변화된 통계적 특성을 찾음으로써 위?변조 여부를 찾을 수 있다. Image forgery detection technology is a technique for determining whether a given image has undergone a forgery / modulation step. Forgery and alteration of digital images leave no visible clues, but change the statistical properties of the image. Therefore, it is possible to find out whether the forgery or alteration is found by finding the changed statistical characteristics.

지금까지 연구되어진 프린터 판별방법 기술은 주로 흑백 레이저 프린터를 판별하는 기술들이 대부분이다. 하지만 최근 컬러 레이저 프린터 보급률이 높아지면서 컬러 레이저 프린터에 적합한 판별기술의 필요성이 대두되고 있다.The printer discrimination method technology studied so far is mainly a technology for discriminating monochrome laser printers. However, as the penetration rate of color laser printers increases, the necessity of discriminating technology suitable for color laser printers is emerging.

출력 문서를 이용하여 프린터를 판별하는 방법은 크게 수동적 방법과 능동적 방법 두 가지가 있다. 수동적 방법은 프린터의 내부에서 물리적 특성으로 인해 필연적으로 발생하는 출력물 상에서의 보이지 않는 특징들을 찾아서 그것을 인쇄한 프린터를 찾는 방식으로 내재적 특성(intrinsic signature)을 이용하여 프린터를 판별한다. 능동적 방법은 프린터의 인쇄 과정 중 매개변수를 직접 수정해서 출력물에 보이지 않는 특정한 정보를 직접 삽입하는 방식으로 외재적 특성(extrinsic signature)을 이용하여 프린터를 판별한다. 능동적 방법을 이용하여 문서에 특정한 정보를 삽입하는 것에 대한 소비자들의 야기할 수 있기 때문에 현재 능동적 방법보다는 수동적 방법에 맞추어 프린터 판별기술 연구가 진행되고 있다.There are two methods of identifying a printer using an output document. There are two methods, a passive method and an active method. The passive method identifies printers using intrinsic signatures by looking for invisible features on the output that are inevitably generated due to physical properties within the printer and finding the printer that printed them. Active methods identify printers by using extrinsic signatures by directly modifying parameters during the printer's printing process and inserting certain invisible information directly into the output. The research on printer discrimination technology is being conducted according to the passive method rather than the active method because it can cause consumers to insert specific information into the document using the active method.

프린터 스테가노그라피란 능동적인 프린터 판별방법의 일종으로, 제 3의 사용자로부터 정보가 불법적으로 사용되거나 변조되는 것을 막기 위해 인쇄된 종이에 노란 점을 출력하는 기술이다. 이 노란 점은 그냥 눈으로 봐서는 잘 보이지 않으며, 고해상도 스캐닝 장비나 특수한 광선을 비추어 암호를 해독할 수 있다. 이 노란 점에는 프린터의 고유한 시리얼 정보 및 인쇄한 날짜 등 다양한 정보가 들어가 있다. Printer steganography is a kind of active printer discrimination method, and is a technique of outputting yellow dots on printed paper to prevent information from being illegally used or tampered with by a third user. These yellow spots are hard to see by sight, and can be decrypted using high-resolution scanning equipment or special rays of light. This yellow dot contains various information such as the printer's unique serial information and the date printed.

도 2 및 도 3은 프린터 스테가노그라피의 예를 나타낸 도면들이다. 도 2의 이미지에서 노란 점들이 출력되는 위치로 출력된 시간, 날짜, 장비번호 등의 정보를 나타는 것을 볼 수 있으며, 도 3의 우측 이미지에서 프린터 스테가노그라피를 사용하여 출력된 문서의 모습을 볼 수 있다. 이 기술은 레이저 프린터로 출력한 문서에 사적인 정보 내용을 노란 점으로 암호화하여 심은 것이 심각한 프라이버시 침해라는 이유로 사용자들에게 반발을 받았다. 또한 눈에 잘 띄지 않는다고 해도 일단 출력물에 인쇄가 되기 때문에 화질 및 인쇄물의 품질 저하가 일어날 수 있다. 따라서 최근에는 기계에 종속적이지 않은 디지털 포렌식 기술 연구를 하는 방법이 연구되고 있다. 2 and 3 are diagrams showing examples of printer steganography. In the image of FIG. 2, yellow dots are displayed to indicate the output time, date, equipment number, and the like. The image of the printed document using printer steganography is shown in the right image of FIG. 3. can see. This technology has been repulsed by users because it is a serious privacy breach that is embedded in a yellow printer by encrypting private information in a document printed on a laser printer. In addition, even if it is inconspicuous, the printed image may be printed once, so that the image quality and the quality of the printed product may be degraded. Therefore, recently, a method of researching digital forensic technology that is not machine dependent has been studied.

레이저 프린터의 인쇄 과정 중 광학 광전도체 드럼을 돌리는 기어의 역회전 현상으로 인해 각속도가 일정하지 않게 됨에 따라 발생하는 준 주기적인 변동 때문에 인쇄 방향을 따라서 밝고 어두운 줄무늬가 주기적으로 생긴다. 이렇게 문서에 새겨지는 줄무늬 주기는 프린터의 기계적인 특성을 반영하고 있다고 할 수 있다. Delp et al.는 이와 같은 주기적인 특성을 활용하여 흑백 레이저 프린터를 판별하는 알고리즘을 제안하였다. 도 4는 흑백 레이저 프린터에 의한 출력물의 줄무늬 주기 현상을 나타낸 도면이다.During the printing process of laser printers, light and dark streaks occur periodically along the printing direction due to the quasi-cyclic fluctuations caused by the angular velocity becoming inconsistent due to the reverse rotation of the gears rotating the optical photoconductor drum. The stripes on the document reflect the mechanical characteristics of the printer. Delp et al. Proposed an algorithm for discriminating black and white laser printers using these periodic characteristics. 4 is a view showing the fringes of the output of the output by the monochrome laser printer.

일반적으로 하프톤 이미지 출력물을 이용하여 줄무늬 주기를 구하는 방법은, 프린터의 줄무늬 주기를 구하는 방법처럼 수평 방향으로 투사한 다음 이진 푸리에변환을 이용하는 방법을 그대로 이용하면 된다. 프린터 판별방식은 어떠한 프린터로 인쇄했는지 모르는 하프톤 이미지 출력물의 줄무늬 주기를 위의 방법으로 구한 후, 그 줄무늬 주기와 일치하는 줄무늬 주기를 갖는 프린터를 찾는 것이다. 이러한 줄무늬 주기는 하프톤 이미지 출력물에는 적용하기가 쉽고 결과도 좋게 나오지만 하프톤 이미지 출력물이 아닌 일반 텍스트 출력물에는 적용하기 힘들다는 단점이 있다. In general, a method of obtaining a stripe period using a halftone image output may be performed by projecting in a horizontal direction and then using a binary Fourier transform, as in the method of obtaining a stripe period of a printer. The printer discrimination method finds a printer having a stripe period that matches the stripe period after obtaining the stripe period of the halftone image output which is not printed with which printer by the above method. This stripe period is easy to apply to halftone image output and results are good, but it is difficult to apply to plain text output that is not halftone image output.

레이저 프린터로 프린터 된 문서들을 눈으로 볼 때 원거리에서는 동일하게 보이지만, 크게 확대해서 보면 프린터의 품질에 따라 구별되는 특징을 볼 수 있다. 도 5는 프린터 품질에 따른 구별되는 특징의 예를 보여주고 있다. 거리 변환을 이용한 프린터 판별방법에서는 문자 이미지 매칭과 프린트된 문서에 존재하는 글자 사이의 거리를 측정하는데 거리 변환 알고리즘을 사용한다. 도 5와 같이 프린터마다 미세하게 다른 출력 결과의 특징을 분석하여 프린터 판별에 이용한다.Although the documents printed with a laser printer may look the same at a distance, the magnified view shows features distinguished by the quality of the printer. 5 shows an example of the distinguishing features depending on the printer quality. In the printer discrimination method using distance conversion, a distance conversion algorithm is used to measure the distance between text image matching and text existing in a printed document. As shown in FIG. 5, the characteristics of the output result that are slightly different for each printer are analyzed and used for printer discrimination.

문자 이미지 매칭은 일반적으로 이진 이미지를 이용한 거리 변환에 기반하고 있다. 이진 이미지 I(x, y)는 오직 0과 1의 두 가지 값을 가지고 있으며, 0은 글자의 픽셀, 1은 배경 픽셀을 의미한다. Id(x, y)는 이미지의 거리 변환을 나타내며, 이것은 글자의 픽셀(x, y)과 이 픽셀(x, y)과 가장 가까운 배경 픽셀 간의 거리를 의미한다. 거리 변환의 계산은 two-pass 알고리즘을 사용하여 수행된다. 거리 변환 이후 두 이진 이미지의 거리 차이는 아래 수학식 1을 통해 계산할 수 있다.Character image matching is generally based on distance transformation using binary images. The binary image I (x, y) has only two values, 0 and 1, where 0 is the letter pixel and 1 is the background pixel. I d (x, y) represents the distance transformation of the image, which is the distance between the pixel (x, y) of the text and the background pixel closest to this pixel (x, y). The calculation of the distance transform is performed using a two-pass algorithm. The distance difference between the two binary images after the distance conversion may be calculated by Equation 1 below.

Figure 112010025161099-pat00001
Figure 112010025161099-pat00001

여기서, H 및 W는 각각 이미지의 높이와 폭을 나타내며, Nf는 이미지(x, y) 안의 검정 픽셀의 수이다. gd(x, y)는 g(x, y) 이미지의 거리 변환된 것이다. 매칭 방향에 따라서 다른 매칭 거리를 얻을 수 있기 때문에, 두 매칭 방향 Dfg, Dgf를 계산하여 조합하여 사용한다. Where H and W represent the height and width of the image, respectively, and N f is the number of black pixels in the image (x, y). g d (x, y) is the distance transform of the g (x, y) image. Since different matching distances can be obtained according to the matching directions, two matching directions D fg and D gf are calculated and used in combination.

사전에 알려진 프린터들로 인쇄한 글자를 OCR 기능을 이용하여 문자를 인식하고, 인식된 문자를 데이터베이스에 등록해 놓는다. 그 후에 프린터 판별을 위해 이미지가 들어오면 문자를 인식하고, 데이터베이스와 비교하여 거리 변환 방법을 통하여 거리 차이값을 계산한다. 이렇게 계산한 거리 차이 값에 대하여, 최소 거리차를 갖는 경우의 문자들을 포함한 프린터를 해당 문서를 인쇄하는데 사용한 프린터로 판별하게 된다. 이와 같은 프린터 식별 시스템의 구조는 도 6에서 보여주고 있다. 도 6은 거리 변환을 이용한 프린터 식별 방법을 설명하는 도면이다.Characters printed by previously known printers are recognized using the OCR function, and the recognized characters are registered in the database. After that, when an image comes in for printer identification, a character is recognized and the distance difference value is calculated through a distance conversion method by comparing with a database. With respect to the distance difference value thus calculated, a printer including characters in the case of having the minimum distance difference is determined as the printer used to print the document. The structure of such a printer identification system is shown in FIG. 6 is a view for explaining a printer identification method using a distance conversion.

이산 웨이블릿 변환을 이용한 프린터 판별 기술은 컬러 레이저 프린터마다 디지털 이미지를 실제 문서로 출력할 때 색을 재구성하는 방식이 조금씩 다르다는 점에 착안한 프린터 판별 방법으로 Choi가 제안하였다. 이는 기존에 있던 흑백 레이저 프린터 판별 기술과는 달리, 컬러 문서의 컬러 정보를 이용하여 컬러 레이저 프린터를 판별하는 기술이다.The printer discrimination technique using discrete wavelet transform has been suggested by Choi as a printer discrimination method, focusing on the fact that the color reconstruction method differs slightly when a digital image is output as an actual document for each color laser printer. Unlike conventional black and white laser printer discrimination technology, this is a technology for discriminating a color laser printer using color information of a color document.

이산 웨이블릿 변환을 이용한 프린터 판별 과정은 도 7에 도시하였다. 여러 대의 컬러 프린터로 인쇄한 출력물들을 하나의 스캐너로 스캔한 다음, 기본 컬러 영역인 RGB 영역에서 R, G, B 각각의 영역에 대해서 이산 웨이블릿 변환을 수행한다. A printer discrimination process using discrete wavelet transform is illustrated in FIG. 7. Outputs printed by several color printers are scanned by one scanner, and then discrete wavelet transform is performed for each of R, G, and B areas in the RGB area, which is the basic color area.

도 8은 이산 웨이블릿 변환을 거친 후 만들어진 HH 영역을 나타낸 도면이다. 이산 웨이블릿 변환을 거친 후 만들어지는 4개의 영역 중 도 8에서의 HH는 가로와 세로방향으로 고주파 필터를 거쳐서 만들어진 이미지로 원본 이미지의 잡음이 남아 있다. 이 잡음를 통계적으로 분석하여 특징점을 추출하게 된다. 이산 웨이블릿 변환으로 변환된 각각의 R, G, B 영역 중에서 잡음 성분이 있는 HH 영역에서의 표준편차, 왜도, 첨도, R과 G, G와 B 및 R과 B 밴드의 공분산과 상관 계수를 구하여 그것들을 하나의 특징점 벡터로 정한다. RGB 영역에서 표준편차, 왜도, 첨도, 공분산, 상관 계수 등 총 15개의 특징점을 추출할 수 있다. 각각의 특징점에 대한 수학식은 표 1에 정리되어 있다. 즉, 표 1은 이산 웨이블릿 변환을 이용한 컬러 레이저 프린터 판별방법의 특징점을 나타낸다. 이 과정은 YCbCr 영역에서도 똑같이 이루어진다. 그리하여 두 영역에서 추출한 총 30개의 특징점을 하나의 벡터로 합친다. 각 이미지마다 하나의 특징점 벡터를 생성한 다음, 서포트 벡터 머신을 이용하여 생성한 특징점 벡터들 중 절반은 학습에 이용하고 나머지 절반은 문서를 출력한 컬러 레이저 프린터를 판별하는데 이용한다.FIG. 8 is a diagram illustrating an HH region formed after a discrete wavelet transform. Of the four regions created after the discrete wavelet transform, HH in FIG. The noise is statistically analyzed to extract the feature points. Find the standard deviation, skewness, kurtosis, R and G, G and B, and R and B band covariances and correlation coefficients in the HH region with noise components among the discrete wavelet transforms. Set them as one feature point vector. A total of 15 feature points such as standard deviation, skewness, kurtosis, covariance, and correlation coefficient can be extracted from the RGB domain. The equations for each feature point are summarized in Table 1. That is, Table 1 shows the feature points of the color laser printer discrimination method using discrete wavelet transform. This process is the same for the YCbCr domain. Thus, a total of 30 feature points extracted from the two regions are combined into one vector. One feature point vector is generated for each image, and then half of the feature point vectors generated using the support vector machine are used for learning, and the other half is used to determine the color laser printer outputting the document.

특징점Feature Point 수학식Equation 표준편차Standard Deviation

Figure 112010025161099-pat00002
Figure 112010025161099-pat00002
첨도Kurtosis
Figure 112010025161099-pat00003
Figure 112010025161099-pat00003
왜도Dwarf
Figure 112010025161099-pat00004
Figure 112010025161099-pat00004
공분산Covariance
Figure 112010025161099-pat00005
Figure 112010025161099-pat00005
상관계수Correlation coefficient
Figure 112010025161099-pat00006
Figure 112010025161099-pat00006

본 발명은 종래의 문제점을 해결하기 위한 것으로, 위너 필터 및 명암도 동시 발생 행렬을 통하여 컬러 레이저 프린터를 판별하는 방법을 제공함에 그 목적이 있다.SUMMARY OF THE INVENTION The present invention has been made to solve a conventional problem, and an object thereof is to provide a method for determining a color laser printer through a Wiener filter and a contrast matrix.

상기한 목적을 달성하기 위하여, 본 발명에 따른 컬러 레이저 프린터 판별 방법은 (i) 컬러 레이저 프린터로 인쇄된 디지털 영상을 스캔한 후 RGB 도메인 영역을 CMY 영역으로 변환하는 단계; (ii) 상기 CMY 영역으로 표현된 영상을 위너 필터를 거쳐 잡음이 제거된 영상을 생성하는 단계; (iii) 상기 CMY 영상과 상기 잡음이 제거된 영상의 차이를 기초로 하여 잡음 성분을 추출하는 단계; (iv) 상기 추출된 잡음 성분에 대하여 명암도 동시 발생 행렬 변환을 수행하여 행렬값을 계산하는 단계; (v) 상기 행렬값에 대해 유사성, 대조, 합계, 상관 계수, 및 공분산 값을 구비한 다수의 특징점을 계산하는 단계; 및 (vi) 상기 다수의 특징점을 하나의 특징 벡터로 합쳐서 서포트 벡터 머신 분류기의 특징으로 입력하여 상기 컬러 레이저 프린터를 판별하는 단계를 포함하는 특징으로 한다.In order to achieve the above object, the color laser printer discrimination method according to the present invention comprises the steps of (i) scanning the digital image printed by the color laser printer and converting the RGB domain region to the CMY region; (ii) generating an image from which noise is removed through a Wiener filter on the image represented by the CMY region; (iii) extracting a noise component based on a difference between the CMY image and the image from which the noise is removed; (iv) calculating a matrix value by performing contrast-contrast matrix transformation on the extracted noise component; (v) calculating a plurality of feature points with similarity, contrast, sum, correlation coefficient, and covariance values for the matrix values; And (vi) combining the plurality of feature points into one feature vector and inputting the feature as a feature of the support vector machine classifier to determine the color laser printer.

본 발명은 현재 개발되고 있는 컬러 레이저 프린터에 대한 새로운 판별 방법을 제안하였고, 기존의 연구에 비하여 우수한 판별률을 달성하였다. 본 발명의 방법은 컬러 디지털 인쇄기기의 제조사를 판별하는데 있어서 97.6%의 정확률을 보였고, 동일 제조사의 모델을 판별하는데 84.5%의 정확률을 나타냈다. 본 발명은 디지털 포렌식 기술의 한 분야인 컬러 레이저 프린터 판별 기술을 통해, 출력된 디지털 이미지가 어떠한 프린터에서 출력되었는지 알 수 있다면 위?변조 범죄를 일으킨 범인을 찾는데 도움이 될 수 있으며, 나아가 위조지폐 및 위조 공문서를 쉽게 식별할 수 있을 것이다. The present invention proposes a new discrimination method for a color laser printer currently being developed, and achieves an excellent discrimination rate compared to the existing studies. The method of the present invention showed an accuracy of 97.6% in determining a manufacturer of a color digital printing machine, and an 84.5% accuracy in determining a model of the same manufacturer. According to the present invention, a color laser printer discrimination technology, which is a field of digital forensic technology, can know which printer outputs the digital image output from the printer. Counterfeit documents may be easily identified.

도 1은 연도별 위/변조 범죄 현황 및 발견율을 나타낸 도면이다.
도 2 및 도 3은 프린터 스테가노그라피의 예를 나타낸 도면들이다.
도 4는 흑백 레이저 프린터에 의한 출력물의 줄무늬 주기 현상을 나타낸 도면이다.
도 5는 프린터 품질에 따른 구별되는 특징의 예를 보여주는 도면이다.
도 6은 거리 변환을 이용한 프린터 식별 방법을 설명하는 도면이다.
도 7은 이산 웨이블릿 변환을 이용한 프린터 판별 과정을 설명하는 도면이다.
도 8은 이산 웨이블릿 변환을 거친 후 만들어진 HH 영역을 나타낸 도면이다.
도 9는 본 발명의 실시예에 따른 컬러 레이저 프린터 판별 방법을 설명하는 도면이다.
도 10 내지 도 13은 CMY 영역으로 표현한 예를 나타낸 도면이다.
도 14는 CMY 영상을 나타낸 도면이다.
도 15는 위너 필터를 거친 잡음이 제거된 영상을 나타낸 도면이다.
도 16 내지 도 19는 위너 필터를 이용한 각 제조회사별 잡음을 나타낸 도면이다.
도 20은 본 발명의 실시예에 따른 명암도 동시발생 행렬 방향성의 예를 나타낸 도면이다.
도 21은 SVM을 이용한 이진 분류 및 사상의 예를 나타낸 도면이다.
도 22는 본 발명의 실시예에 따른 실험에 사용한 영상의 예를 나타낸 도면이다.
도 23은 컬러 레이저 프린터 제조사 판별의 정확도 분석 결과를 나타낸 도면이다.
도 24는 동일 제조사 컬러 레이저 프린터의 모델별 판별 정확도 분석 결과를 나타낸 도면이다.
1 is a view showing the status and detection rate of forgery / forgery crime by year.
2 and 3 are diagrams showing examples of printer steganography.
4 is a view showing the fringes of the output of the output by the monochrome laser printer.
5 is a diagram showing an example of distinguished features according to printer quality.
6 is a view for explaining a printer identification method using a distance conversion.
7 is a diagram illustrating a printer discrimination process using discrete wavelet transform.
FIG. 8 is a diagram illustrating an HH region formed after a discrete wavelet transform.
9 is a view for explaining a color laser printer discrimination method according to an embodiment of the present invention.
10 to 13 are diagrams showing examples represented by the CMY region.
14 illustrates a CMY image.
15 is a view illustrating an image from which noise passed through a Wiener filter is removed.
16 to 19 illustrate noise of each manufacturer using the Wiener filter.
20 is a diagram illustrating an example of contrast degree simultaneous matrix directionality according to an embodiment of the present invention.
21 is a diagram illustrating an example of binary classification and mapping using SVM.
22 is a diagram illustrating an example of an image used in an experiment according to an embodiment of the present invention.
Fig. 23 is a diagram showing the result of the accuracy analysis of the color laser printer manufacturer determination.
24 is a diagram illustrating a result of analyzing accuracy of discrimination by model of the same color laser printer of the same manufacturer.

이하, 본 발명의 실시예에 따른 컬러 레이저 프린터 판별 방법을 첨부 도면을 참조하여 설명한다.Hereinafter, a color laser printer discrimination method according to an embodiment of the present invention will be described with reference to the accompanying drawings.

도 9는 본 발명의 실시예에 따른 컬러 레이저 프린터 판별 방법을 설명하는 도면이다. 본 발명에 따른 컬러 레이저 프린터 판별 방법은 도 9와 같이 크게 훈련과정과 판별과정 두 가지로 나뉜다. 훈련 과정에서는 판별하고자 하는 프린터로 인쇄한 이미지를 사용하여 각 프린터의 고유한 특징을 추출하고, 학습기반 데이터 분류기의 파라미터로 입력하여 훈련을 수행한다. 판별과정에서는 임의의 데이터가 들어왔을 때, 특징을 추출하고, 학습기반 데이터 분류기에 입력하여, 어떠한 인쇄기기로 출력을 했는지 판별을 수행한다. 9 is a view for explaining a color laser printer discrimination method according to an embodiment of the present invention. The color laser printer discrimination method according to the present invention is largely divided into a training process and a discrimination process as shown in FIG. 9. In the training process, the characteristics of each printer are extracted by using the images printed by the printer to be discriminated, and the training is performed by inputting the parameters of the learning-based data classifier. In the discriminant process, when arbitrary data enters, the feature is extracted, inputted into the learning-based data classifier, and the printer determines which printer is output.

컬러 레이저 프린터 판별 알고리즘의 성능은 프린터를 고유하게 판별할 수 있는 특징 추출에 영향을 크게 받으므로, 본 발명에서는 프린터 이미지에 존재하는 고유한 특징을 추출하기 위하여 다양한 특징점에 대한 연구를 수행하였다. 최적의 결과를 나타내고 각 프린터의 고유한 특징을 정확하게 판별하는 방법은 도 9의 특징점 추출기에서 특징값을 추출하는 방법과 같다. Since the performance of the color laser printer discrimination algorithm is greatly influenced by feature extraction to uniquely identify the printer, the present invention has been conducted on various feature points in order to extract unique features present in the printer image. The method of representing an optimal result and accurately determining the unique features of each printer is the same as the method of extracting feature values from the feature point extractor of FIG. 9.

이하에서는 본 발명에 따른 위너 필터를 이용한 잡음을 추출하여, 이에 대해 명암도 동시발생 행렬을 이용한 특징의 추출 방법을 먼저 설명하고, 다음 학습기반 데이터 분류기에 대해서 설명한다.Hereinafter, a method of extracting a noise using a Wiener filter according to the present invention, a feature extraction method using a contrast-concurrency matrix, and a learning-based data classifier will be described.

컬러 레이저 프린터에 존재하는 고유한 특징을 추출하기 위하여, 먼저 컬러 레이저 프린터로 인쇄된 디지털 이미지를 스캐너(도시안됨)로 스캔한 후 RGB 영상에서 CMY 영상으로 변환한 후 위너 필터(도시안됨)를 거쳐 잡음이 제거된 영상을 생성한다. 원본 영상과 잡음이 제거된 영상의 차이를 통해 잡음 만을 추출하였다. 분류 정확도를 향상시키기 위해 추출한 잡음에 대해 0°, 45°, 90°, 135°의 4가지 방향에 대해 명암도 동시발생 행렬을 계산 후, 이에 대하여 질감 분석을 위한 대조, 상관관계, 합계, 유사성, 공분산을 계산하여 이를 특징점으로 사용하였다. To extract the unique features of color laser printers, first scan a digital image printed on a color laser printer with a scanner (not shown), convert it from an RGB image to a CMY image, and then use a Wiener filter (not shown). Create a noise-free image. Only noise was extracted from the difference between the original image and the image from which the noise was removed. To improve the classification accuracy, we compute the contrast coherence matrix in four directions of 0 °, 45 °, 90 °, and 135 ° for the extracted noise, and then compare the contrast, correlation, sum, similarity, Covariance was calculated and used as the feature point.

사용하는 도메인 영역에 대하여 CMY 영역을 사용하였다. 프린터가 문서를 출력할 때는 컴퓨터 상에서 문서를 표현할 때 이용하는 RGB 영역에서, 인쇄 과정에 이용하는 CMY 영역으로 변환한 뒤 출력한다. 그렇기 때문에 다시 스캔을 한 RGB 영역에서 CMY 영역으로 변환시키면 프린터로 출력될 때 생기는 잡음에 대한 훼손이 적기 때문에 다른 도메인에 비해 프린터 마다의 차이가 잘 드러난다. CMY는 청록(Cyan), 마젠다(Magenda), 황색(Yellow)의 3가지 색상을 나타내며. CMY 영역으로 표현한 예제는 도 10 내지 도 13과 같다. 도 10에는 CMY 영상, 도 11에는 C 영상, 도 12에는 M 영상, 도 13에는 Y 영상이 도시되어 있다.The CMY region was used for the domain region to be used. When a printer outputs a document, it converts the RGB area used for representing the document on the computer to the CMY area used for the printing process and then outputs the document. Therefore, when the scan is converted again from the RGB area to the CMY area, the noise generated when output to the printer is less damaged, and thus the printer-specific difference is more visible than other domains. CMY has three colors: Cyan, Magenta, and Yellow. An example represented by the CMY region is shown in FIGS. 10 to 13. 10 shows a CMY image, a C image in FIG. 11, an M image in FIG. 12, and a Y image in FIG. 13.

위너 필터는 비정상성 잡음을 제거하는 데에 유용하다. 도 14 및 도 15는 각각 CMY 영상 및 위너 필터를 거친 잡음이 제거된 영상, 즉 CMY 영역으로 변형된 영상이 위너 필터를 통해 잡음이 제거된 모습을 나타낸 도면들이다. 도 15는 도 14에 비해 잡음이 제거되어 영상이 부드러워진 것을 볼 수 있다. CMY 영역으로 변형한 영상을 위너 필터를 사용하여 의도치 않게 들어간 값이나 튀는 값들을 제거하여 새로운 영상을 만든다. 원본 영상과 잡음이 제거된 영상의 차이를 계산함으로써 원래 영상에 의도치 않게 들어간 잡음들을 구할 수 있다. 이 잡음들은 도 16 내지 도 19과 같이 각 제조회사별로 차이가 나기 때문에 프린터를 판별할 수 있는 기준이 될 수 있다. 도 16 내지 도 19는 위너 필터를 이용한 각 제조회사별 잡음으로서, 도 16은 제록스 프린터의 잡음, 도 17은 HP 프린터의 잡음, 도 18은 캐논 프린터의 잡음, 및 도 19는 코니카 프린터의 잡음을 각각 나타낸다. The Wiener filter is useful for removing abnormal noise. 14 and 15 are diagrams illustrating noises removed through a CMY image and a Wiener filter, that is, an image transformed into a CMY region, respectively, through the Wiener filter. FIG. 15 shows that the image is softened by removing noise compared to FIG. 14. The image transformed into the CMY area is removed by using the Wiener filter to remove unintended or popped values to create a new image. By calculating the difference between the original image and the noise-removed image, we can find the noises that were inadvertently introduced into the original image. Since these noises are different for each manufacturer as shown in FIGS. 16 to 19, the noises may be a standard for identifying a printer. 16 to 19 are noises of each manufacturer using the Wiener filter, FIG. 16 shows noise of Xerox printer, FIG. 17 shows noise of HP printer, FIG. 18 shows noise of Canon printer, and FIG. 19 shows noise of Konica printer. Represent each.

화소 기반의 통계적 Texture 영상 생성을 위한 기본 개념은 Haralick et al.에 의해 제안된 명암도 동시 발생 행렬(Gray Level Co-occurrence Matrix)을 통해 체계화되었다. Texture 영상의 응용 연구에서는 영상 분류 단계에서 Texture 영상을 추가로 적용하는 경우, 정성적인 분류결과와 정량적인 분류 정확도의 향상에 Texture 영상이 유용한 자료임이 여러 사례연구에서 밝혀졌다. 그러나 Texture 영상이 유용함에도 불구하고, Texture 영상의 선택 기준에 대한 연구 결과는 실제로 제시된 바가 거의 없다. The basic concept for pixel-based statistical texture image generation is organized by the Gray Level Co-occurrence Matrix proposed by Haralick et al. Application studies of texture images have shown in many case studies that texture images are useful for qualitative classification and improvement of quantitative classification accuracy. However, although texture images are useful, little research has been done on the selection criteria for texture images.

도 20은 본 발명의 실시예에 따른 명암도 동시발생 행렬 방향성의 예이다. 명암도 동시발생 행렬은 영상 내에서 픽셀 간의 밝기 값의 관계를 나타내는 방법으로 원본 영상인, 도 20과 같이 방향과 두 점 사이의 거리로 인접한 두 픽셀의 값을 좌표값으로 이용하여 그러한 좌표 값이 얼마나 자주 나오는지 세어 놓은 행렬이다. 20 is an example of contrast and concurrency matrix directionality according to an embodiment of the present invention. Contrast matrix is a method of expressing the relationship between brightness values between pixels in an image. The coordinate value is obtained by using values of two adjacent pixels as a coordinate value as a distance between a direction and two points as shown in FIG. 20. It is a matrix of frequent occurrences.

본 발명에서는 분류 정확도의 향상시켜주는 명암도 동시발생 행렬의 장점을 활용하기 위해 위너 필터를 통해 구한 잡음을 0°, 45°, 90°, 및 135° 4개 방향에 대해 명암도 동시 발생 행렬을 계산하였다. 명암도 동시 발생 행렬로 변형된 영역에 대하여 표 2에 나타난 것과 같이, 유사성, 대조, 합계, 상관 계수, 공분산의 통계적인 특성을 사용하여 각 특징점을 추출하였다. 표 2에는 명암도 동시 발생 행렬에 대한 특징점이 설명되어 있다.In the present invention, in order to take advantage of the contrast co-occurrence matrix which improves the classification accuracy, the noise co-occurrence matrix was calculated for four directions of 0 °, 45 °, 90 °, and 135 ° using the noise obtained by the Wiener filter. . As shown in Table 2, each feature point was extracted using statistical characteristics of similarity, contrast, sum, correlation coefficient, and covariance, as shown in Table 2. Table 2 describes the feature points for the intensity co-occurrence matrix.

특징점Feature Point 수학식Equation 설명Explanation 유사성Similarity

Figure 112010025161099-pat00007
Figure 112010025161099-pat00007
행렬 내 각 화소들 간의 균일한 정도를 표현Express a uniform degree between each pixel in the matrix 대조contrast
Figure 112010025161099-pat00008
Figure 112010025161099-pat00008
화소간의 명암도 차이를 표현Expresses the difference in contrast between pixels
합계Sum
Figure 112010025161099-pat00009
Figure 112010025161099-pat00009
화소들의 합을 표현Express the sum of the pixels
상관 계수Correlation coefficient
Figure 112010025161099-pat00010
Figure 112010025161099-pat00010
화소간의 상관관계를 표현Express correlation between pixels
공분산Covariance
Figure 112010025161099-pat00011
Figure 112010025161099-pat00011
전체 영상에서 두 픽셀이 연관된 정도를 표현Expresses the degree to which two pixels are related to the entire image

통계적인 특성으로는 4가지 방향성에 대한 명암도 동시 발생 행렬 변환을 수행하여 얻어진 C, M, Y 각 영역에 대한 유사성, 대조, 합계, 상관 분산과 C와 M, M과 Y, Y와 C 영역 간의 공분산이 있다. 이와 같이 추출된 60 가지의 특징점들은 하나의 벡터로 합쳐져 학습 기반 데이터 분류기에 컬러 레이저 프린터를 판별하는데 훈련 및 판별과정 데이터로 이용된다.Statistical characteristics include the similarity, contrast, sum, and correlation variance for each of the C, M, and Y regions obtained by performing concurrency matrix transformation for the four directions, and between C and M, M, Y, Y, and C regions. There is covariance. The 60 feature points extracted in this way are combined into one vector and used as training and discrimination process data for identifying a color laser printer in a learning-based data classifier.

학습 기반 데이터 분류기로 서포트 벡터 머신(Support Vector Machine; SVM)은 1995년 통계학자인 Vladimir Vapnik에 의하여 개발되고 제안된 학습 알고리즘으로 도 21a의 모습과 같이 이진 분류를 하기 위한 목적으로 개발되었다. 이진 분류란 수집된 훈련 데이터를 이용하여 구조적 위험 최소화(structural risk minimization)의 개념에 기반하여 최적의 선형 결정 평면(optimal linear decision surface)을 찾는 것으로, 현재 SVM은 생물 정보학, 문자 인식, 필기 인식, 얼굴 및 물체 인식 등 다양한 분야에서 성공적으로 적용되고 있다.As a learning-based data classifier, Support Vector Machine (SVM) is a learning algorithm developed and proposed by statistician Vladimir Vapnik in 1995 and developed for binary classification as shown in FIG. 21A. Binary classification is the use of collected training data to find the optimal linear decision surface based on the concept of structural risk minimization. SVMs currently use bioinformatics, character recognition, handwriting recognition, It has been successfully applied in various fields such as face and object recognition.

도 21은 SVM을 이용한 이진 분류(좌측) 및 사상(우측)의 예를 나타낸다. SVM은 도 21의 좌측 도면과 같이 입력 벡터를 고차원의 특징 공간으로 사상시켜 서로 다른 클래스로 분류할 수 있는 초평면(possible hyperplane) 중에서도 여백을 최대화시키는 특정한 초평면(optimal hyperplane)인 최대 여백 초평면(maximum margin hyperplane)을 찾는 것을 목적으로 한다. 최대 여백 초평면에 가장 근접한 훈련 데이터를 서포트 벡터라고 부르며, 이를 포함하는 초평면 사이의 여백 값이 클수록 분류 성능이 좋아진다.21 shows an example of binary classification (left) and mapping (right) using SVM. As shown in the left figure of FIG. 21, the SVM maps an input vector into a high-dimensional feature space to maximize a margin among possible hyperplanes that can be classified into different classes. hyperplane). The training data closest to the maximum margin hyperplane is called the support vector, and the larger the margin value between the hyperplanes containing it, the better the classification performance.

SVM은 분리 경계가 매우 복잡한 문제를 선형 판별 함수의 사용이 가능한 단순한 문제로 변환시키기 때문에 수학적인 분석이 수월하다는 장점이 있다. 또한, 적은 양의 학습 자료만으로도 분류를 잘 수행한다. SVM은 학습 오류를 최소화하는 경험적 위험 최소화를 기본으로 하는 기존의 원리에 비해, 전체집단을 하위 집단으로 세분화한 뒤, 이 집단에 대한 경험적 위험도를 최소화하는 구조적 위험 최소화 개념에 기초하여 일반화 성능이 우수하며 비선형 분리 문제와 같은 복잡한 분류 문제를 해결하기 위해 다양한 커널을 제공한다.SVM has the advantage of easy mathematical analysis because it converts a problem with a very complex separation boundary into a simple problem that can be used with a linear discriminant function. Also, the classification is good even with a small amount of learning materials. SVM has superior generalization performance based on the concept of structural risk minimization, which subdivides the whole group into subgroups and then minimizes the empirical risk for this group, compared to the existing principle based on empirical risk minimization that minimizes learning errors. It also provides various kernels to solve complex classification problems such as nonlinear separation problems.

SVM light, LIBSVM, SVM Torch 등 다양한 소프트웨어들이 공개적으로 사용 가능하고, 다른 기계 학습 방법들보다 상대적으로 사용하기 쉽다. SVM을 사용할 경우 커널의 선택과 그에 따른 커널 변수를 선택하기만 하면 된다. 또한 새로운 패턴이 나타나면 훈련 과정에 모델을 동적으로 갱신할 수 있다.Various software such as SVM light, LIBSVM and SVM Torch are publicly available and relatively easier to use than other machine learning methods. When using SVM, all you have to do is select the kernel and the corresponding kernel variables. In addition, new patterns can be used to dynamically update the model during training.

본 발명에서는 서포트 벡터 머신 중에서도 다중 클래스 분류를 할 수 있게 해 주는 LIBSVM를 사용하였다. LIBSVM은 불균형(unbalanced) 클래스에 대한 페널티 부가 기능이 있어, 여러 그룹을 확실하게 분류하기 위해 사용자가 초평면을 정하는데 있어서 분류 오류를 최소화시킬 수 있다. In the present invention, LIBSVM is used to enable multi-class classification among support vector machines. LIBSVM adds a penalty for unbalanced classes, which minimizes sorting errors in the user's hyperplanarization to ensure that multiple groups are clearly classified.

커널 함수는 이론적으로는 가능하나 실제로는 풀기 힘든 매핑 함수를 대신하여 원 자료를 고차원 공간으로 이동시켜 특정 공간 내에 선형으로 분리 가능한 입력자료 집합을 만들어주는 역할을 수행한다. 커널 함수는 다음 수학식 2와 같이 정의된다.Kernel functions are theoretically possible, but instead of mapping functions that are difficult to solve, they move the raw data into higher-dimensional spaces to create a linearly separable set of input data within a specific space. The kernel function is defined as in Equation 2 below.

Figure 112010025161099-pat00012
Figure 112010025161099-pat00012

일반적으로 커널 함수는 다음 표 3과 같이 Linear, Polynomial, Radial basis function, Sigmoid의 네 가지 종류가 있다. 여기서 γ, r, 및 d는 각 커널에서의 파라미터를 의미한다. 표 3은 서포트 벡터 머신의 대표적인 커널 함수를 나타낸다.In general, there are four types of kernel functions: linear, polynomial, radial basis function, and sigmoid, as shown in Table 3. Where γ, r, and d refer to parameters in each kernel. Table 3 shows representative kernel functions of the support vector machine.

커널 함수Kernel functions 수학식Equation 선형(Linear) Linear

Figure 112010025161099-pat00013
Figure 112010025161099-pat00013
다항식(Polynomial) Polynomial
Figure 112010025161099-pat00014
Figure 112010025161099-pat00014
RBFRBF
Figure 112010025161099-pat00015
Figure 112010025161099-pat00015
Sigmoid Sigmoid
Figure 112010025161099-pat00016
Figure 112010025161099-pat00016

본 발명에서는 원형 기준 함수 (Radial Basis Function; RBF) 커널을 사용하였다. RBF 커널은 고차원의 특징공간으로 입력 벡터를 비선형적으로 이동시키기 때문에 선형 분리가 불가능한 문제를 해결하는데 매우 유용하다. RBF 커널은 SVM의 예측성과는 라그랑지 승수의 허용오차 상한 값인 C와 커널 모수인 γ에 따라 영향을 받게 된다. 따라서 두 가지 모수가 적절하게 선택되지 않을 경우 과대 적합이나 과소 적합 현상이 발생할 수 있다. In the present invention, a Radial Basis Function (RBF) kernel is used. The RBF kernel is very useful for solving the problem that linear separation is impossible because it moves nonlinearly the input vector into high-dimensional feature space. The RBF kernel is affected by the predictive performance of the SVM based on C, which is the upper tolerance of Lagrange multipliers, and γ, the kernel parameter. Therefore, overfitting or underfitting can occur if two parameters are not properly selected.

실험 결과Experiment result

실험에서는 총 7대 프린터(HP, 캐논, 제록스 DCC 400, 제록스 DCC 450, 제록스 DCC 4550, 제록스 DCC 6540, 코니카)에서 각 371장씩 출력된 총 2,597장의 영상 셋을 이용하였다. 영상 데이터를 취득하기 위하여 371장의 영상들을 7대의 컬러 레이저 프린터를 사용하여 각각 출력하여 EPSON Perfection 2400 스캐너로 300 dpi 해상도로 스캔하여 256ㅧ256 크기로 분할하여 실험에 사용하였다. 도 22는 본 발명의 실시예에 따른 실험에 사용한 영상 세트의 일부이다.In this experiment, a total of 2,597 images were printed out, using 371 images from 7 printers (HP, Canon, Xerox DCC 400, Xerox DCC 450, Xerox DCC 4550, Xerox DCC 6540, Konica). In order to acquire the image data, 371 images were printed using seven color laser printers, scanned at 300 dpi with an EPSON Perfection 2400 scanner, and divided into 256 × 256 size for the experiment. 22 is a part of an image set used in an experiment according to an embodiment of the present invention.

본 발명에 따른 알고리즘의 성능을 분석하기 위해 프린터 제조사에 대한 판별과, 동일한 제조사의 모델별 판별 두 가지 실험을 하였다. 컬러 레이저 프린터 제조사별 판별을 위해 HP, 캐논, 제록스 DCC 450, 코니카 4대의 프린터로 인쇄된 371장씩 총 1,484장의 영상을 이용하여 실험을 진행하였으며, 동일 제조사 모델별 판별을 위해 제록스 DCC 400, 제록스 DCC 450, 제록스 DCC 5540, 제록스 DCC 6540 모델의 4대의 프린터로 프린터 된 371장씩 총 1,484장의 영상을 이용하여 실험하였다. In order to analyze the performance of the algorithm according to the present invention, two experiments were performed for the printer manufacturer and the model for the same manufacturer. In order to discriminate by color laser printer manufacturer, experiments were conducted using a total of 1,484 images of 371 prints printed by four printers of HP, Canon, Xerox DCC 450 and Konica, and Xerox DCC 400 and Xerox DCC Experiments were performed using 1,484 images of 371 printers, each of which was printed on four printers of 450, Xerox DCC 5540, and Xerox DCC 6540 models.

본 발명에 따른 알고리즘과 이산 웨이블릿 변환(DWT)을 이용하는 Choi 알고리즘을 각각 서포트 벡터 머신 분류기를 사용하여 테스트하였다. 성능 판별의 객관성 및 정확도를 위하여 두 가지 실험 모두 각 371장씩 제조회사별로 출력하여 인쇄된 1,484장의 영상을 무작위로 선택하여 742장은 훈련 데이터로, 나머지 742장은 테스트 데이터로 사용하였다. 또한 실험의 오류를 최소화하기 위해 Cross-validation 기법을 사용하였다. 무작위로 선택한 훈련 데이터와 테스트 데이터를 바꾸어 테스트 데이터를 훈련 데이터로 쓰고 훈련 데이터를 테스트 데이터로 사용하여 2번의 실험을 하였다. 2번의 결과 값을 평균 내어 최종 결과를 계산하였다. The algorithm according to the present invention and the Choi algorithm using Discrete Wavelet Transform (DWT) were tested using a support vector machine classifier, respectively. For the objectivity and accuracy of performance discrimination, both experiments used 371 prints of each manufacturer and randomly selected 1,484 printed images. 742 were used as training data and the remaining 742 were used as test data. In addition, the cross-validation technique was used to minimize the error of the experiment. Two experiments were conducted using the test data as the training data and the test data as the test data by changing the randomly selected training data and the test data. The final results were calculated by averaging the two results.

제조사별 판별 성능분석Performance analysis by manufacturer

동일한 실험 환경 하에서 제안하는 알고리즘과 DWT를 이용하는 Choi의 알고리즘을 사용하여 제조사별 판별성능을 분석하였다. 실험에 사용된 컬러 레이저 프린터의 제조사는 표 4에 정리되어 있다. 즉, 표 4에는 제조사별 프린터 판별실험에 사용한 컬러 레이저 프린터가 설명되어 있다.Discriminant performance of each manufacturer was analyzed using the proposed algorithm and Choi's algorithm using DWT under the same experimental environment. The manufacturers of color laser printers used in the experiments are summarized in Table 4. That is, Table 4 describes the color laser printers used in the printer discrimination experiment by manufacturer.

라벨label 프린터 모델Printer model 제록스Xerox 제록스 DCC 400Xerox DCC 400 HPHP HP 4650HP 4650 캐논cannon 캐논 iR C2620Canon iR C2620 코니카Konica 코니카 미놀타 bizhub C250Konica Minolta bizhub C250

표 5에는 DWT를 이용하는 알고리즘과 제안하는 알고리즘을 이용하여 컬러 레이저 프린터 제조사를 판별한 판별결과를 나타내었다. Table 5 shows the results of discriminating color laser printer manufacturers using the algorithm using DWT and the proposed algorithm.

제록스Xerox HPHP 캐논cannon 코니카Konica 본 발명Invention DWT이용방법How to use DWT 본 발명Invention DWT이용방법How to use DWT 본 발명Invention DWT이용방법How to use DWT 본 발명Invention DWT이용방법How to use DWT 제록스Xerox 98.9 %98.9% 98.3 %98.3% 0.3 %0.3% 0.7 %0.7% 0.3 %0.3% 0.5 %0.5% 0.5 %0.5% 0.6 %0.6% HPHP 0.3 %0.3% 7.0 %7.0% 98.9 %98.9% 91.4 %91.4% 0.3 %0.3% 1.6 %1.6% 0.5 %0.5% 0 %0 % 캐논cannon 0 %0 % 15.6 %15.6% 0.8 %0.8% 1.1 %1.1% 98.4 %98.4% 76.3 %76.3% 0.8 %0.8% 7.0 %7.0% 코니카Konica 1.6 %1.6% 2.2 %2.2% 1.3 %1.3% 0.2 %0.2% 0.5 %0.5% 0.2 %0.2% 96.5 %96.5% 97.3 %97.3%

도 23에는 컬러 레이저 프린터 제조사 판별의 정확도 분석 결과가 설명되어 있다. 제조사에 대한 판별율의 정확도에 대한 비교는 도 23에 도시되어 있다. 실험 결과, 제안하는 방법의 프린터별 사이의 분류 결과는 98.2%로 DWT를 이용하는 알고리즘의 분류 결과인 90.82% 보다 7% 정도 높게 나왔다. 또한 캐논 프린터에 대해 DWT를 이용하는 알고리즘 보다 높은 판별률을 보였다.23 shows the result of the accuracy analysis of the color laser printer manufacturer determination. A comparison of the accuracy of the discrimination rate for the manufacturer is shown in FIG. 23. As a result of the experiment, the classification result between printers of the proposed method is 98.2%, which is 7% higher than the classification result of the algorithm using DWT. In addition, Canon printer showed higher discrimination rate than the algorithm using DWT.

동일 제조사 모델별 판별 성능 분석Performance analysis by model of same manufacturer

동일한 실험 환경 하에서 제안하는 알고리즘과 DWT를 이용하는 Choi의 알고리즘을 사용하여 모델별 판별성능을 분석하였다. 실험에 사용된 컬러 레이저 프린터의 모델명은 표 6에 정리되어 있다. 즉, 표 6에는 모델별 프린터 판별실험에 사용한 컬러 레이저 프린터가 설명되어 있다.The discriminant performance of each model was analyzed using the proposed algorithm and Choi's algorithm using DWT under the same experimental environment. The model names of the color laser printers used in the experiment are summarized in Table 6. That is, Table 6 describes the color laser printers used in the printer discrimination experiment for each model.

라벨label 프린터 모델Printer model DCC400DCC400 제록스 DCC 400Xerox DCC 400 DCC450DCC450 제록스 DCC 450Xerox DCC 450 DCC5560DCC5560 제록스 DCC 5560Xerox DCC 5560 DCC6540DCC6540 제록스 DCC 6540Xerox DCC 6540

표 7에는 동일 제조사 컬러 레이저 프린터 모델명 판별결과, 즉 DWT를 이용하는 알고리즘과 제안하는 알고리즘을 이용하여 동일한 컬러 레이저 제조사에 대한 모델명을 판별한 판별결과를 나타내었다.Table 7 shows the result of determining the model name of the same color laser printer model, that is, the model name of the same color laser manufacturer using the algorithm using the DWT and the proposed algorithm.

라벨label DCC400DCC400 DCC450DCC450 DCC5560DCC5560 DCC6540DCC6540 본 발명 Invention DWT이용방법How to use DWT 본 발명Invention DWT이용방법How to use DWT 본 발명 Invention DWT이용방법How to use DWT 본 발명 Invention DWT이용방법How to use DWT DCC400DCC400 96.5 %96.5% 92.2 %92.2% 1.9 %1.9% 1 %One % 0.5 %0.5% 3.2 %3.2% 1 %One % 3.5 %3.5% DCC450DCC450 0.8 %0.8% 0.8 %0.8% 94.6 %94.6% 72 %72% 1.3 %1.3% 14.6 %14.6% 3.2 %3.2% 12.7 %12.7% DCC5560DCC5560 0.5 %0.5% 6 %6% 0.5 %0.5% 4.6 %4.6% 76.8 %76.8% 61.5 %61.5% 22.1 %22.1% 28 %28% DCC6540DCC6540 0.3 %0.3% 7 %7% 0.5 %0.5% 11.3 %11.3% 29.1 %29.1% 35.6 %35.6% 70 %70% 46 %46%

제조사에 대한 판별율의 정확도에 대한 비교는 도 24에 도시되어 있다. 즉, 도 24에는 동일 제조사 컬러 레이저 프린터의 모델별 판별 정확도 분석 결과가 설명되어 있다. 실험 결과, 본 발명의 방법의 프린터별 사이의 분류 결과는 84.5%로 DWT를 이용하는 알고리즘의 분류 결과인 67.93% 보다 16% 정도 높게 나왔다. 또한 DCC450과 DCC5560, DCC6540 모델에 대해 DWT를 이용하는 알고리즘 보다 높은 판별률을 보였다. A comparison of the accuracy of the discrimination rate for a manufacturer is shown in FIG. 24. That is, FIG. 24 illustrates a result of analyzing accuracy of discrimination by model of the same color laser printer. As a result of the experiment, the classification result between printers of the method of the present invention was 84.5%, which was about 16% higher than 67.93% of the classification result of the algorithm using DWT. In addition, the DCC450, DCC5560, and DCC6540 models show higher discrimination rate than the algorithm using DWT.

Claims (4)

(i) 컬러 레이저 프린터로 인쇄된 디지털 영상을 스캔한 후 RGB 도메인 영역을 CMY 영역으로 변환하는 단계;
(ii) 상기 CMY 영역으로 표현된 영상을 위너 필터를 거쳐 잡음이 제거된 영상을 생성하는 단계;
(iii) 상기 CMY 영상과 상기 잡음이 제거된 영상의 차이를 기초로 하여 잡음 성분을 추출하는 단계;
(iv) 상기 추출된 잡음 성분에 대하여 명암도 동시 발생 행렬 변환을 수행하여 행렬값을 계산하는 단계;
(v) 상기 행렬값에 대해 유사성, 대조, 합계, 상관 계수, 및 공분산 값을 구비한 다수의 특징점을 계산하는 단계; 및
(vi) 상기 다수의 특징점을 하나의 특징 벡터로 합쳐서 서포트 벡터 머신 분류기의 특징으로 입력하여 상기 컬러 레이저 프린터를 판별하는 단계를 포함하되,
상기 (v)단계에서 상기 다수의 특징점은, 상기 추출된 잡음 성분을 0°, 45°, 90°, 및 135°의 4개 방향에 대한 명암도 동시 발생 행렬 변환을 수행하여 얻어진 C(청록), M(마젠다), Y(황색) 각 영역에 대한 유사성, 대조, 합계, 상관 분산과 상기 C 영역과 상기 M 영역, 상기 M 영역과 상기 Y 영역, 상기 Y와 C 영역 간의 공분산으로 이루어진 60 가지의 특징점인 컬러 레이저 프린터 판별 방법.
(i) converting an RGB domain region into a CMY region after scanning a digital image printed by a color laser printer;
(ii) generating an image from which noise is removed through a Wiener filter on the image represented by the CMY region;
(iii) extracting a noise component based on a difference between the CMY image and the image from which the noise is removed;
(iv) calculating a matrix value by performing contrast-contrast matrix transformation on the extracted noise component;
(v) calculating a plurality of feature points with similarity, contrast, sum, correlation coefficient, and covariance values for the matrix values; And
(vi) combining the plurality of feature points into a feature vector and inputting the feature as a feature of a support vector machine classifier to determine the color laser printer;
In the step (v), the plurality of feature points include C (cyan) obtained by performing a contrast-contrast matrix transformation on the extracted noise components in four directions of 0 °, 45 °, 90 °, and 135 °, 60 kinds of similarity, contrast, sum, correlation variance for each region of M (magenta) and Y (yellow) and covariance between the C region and the M region, the M region and the Y region, and the Y and C region Color laser printer discrimination method that is a feature point.
삭제delete 제1 항에 있어서, K(χi, χj) = φ(χi )Tφ(χj)로 정의되며,이론적으로는 가능하나 실제로는 풀기 힘든 매핑 함수를 대신하여 원 자료를 고차원 공간으로 이동시켜 특정 공간 내에 선형으로 분리 가능한 입력자료 집합을 만들어주는 역할을 수행하는 커널 함수를 단계 (vi)의 서포트 벡터 머신 분류기에 적용하는 컬러 레이저 프린터 판별 방법.The method of claim 1, wherein K (χ i , χ j ) = φ (χ i ) T φ (χ j ), which is theoretically possible but replaces the mapping function that is difficult to solve in practice. A method of determining a color laser printer applying a kernel function to a support vector machine classifier of step (vi), which moves to create a linearly separable set of input data within a specific space. 제3 항에 있어서, 상기 커널 함수는
Figure 112010025161099-pat00017
로 정의되며 고차원의 특징공간으로 입력 벡터를 비선형적으로 이동시켜 선형 분리가 불가능한 문제를 해결하는 원형 기준 함수 커널을 포함하는 컬러 레이저 프린터 판별 방법.
The method of claim 3, wherein the kernel function is
Figure 112010025161099-pat00017
And a circular reference function kernel that solves the problem that linear separation is impossible by non-linearly moving the input vector into a high-dimensional feature space.
KR1020100036365A 2010-04-20 2010-04-20 Color laser printer identification method through noise characteristics analysis KR101124488B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100036365A KR101124488B1 (en) 2010-04-20 2010-04-20 Color laser printer identification method through noise characteristics analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100036365A KR101124488B1 (en) 2010-04-20 2010-04-20 Color laser printer identification method through noise characteristics analysis

Publications (2)

Publication Number Publication Date
KR20110116762A KR20110116762A (en) 2011-10-26
KR101124488B1 true KR101124488B1 (en) 2012-03-16

Family

ID=45030995

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100036365A KR101124488B1 (en) 2010-04-20 2010-04-20 Color laser printer identification method through noise characteristics analysis

Country Status (1)

Country Link
KR (1) KR101124488B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109712135A (en) * 2018-12-28 2019-05-03 南京林业大学 A kind of fruit defects recognition methods, device and its storage medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110005432A (en) * 2009-07-10 2011-01-18 한국과학기술원 Color laser printer identification system and method by analyzing statistical features on discrete wavelet transform

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110005432A (en) * 2009-07-10 2011-01-18 한국과학기술원 Color laser printer identification system and method by analyzing statistical features on discrete wavelet transform

Also Published As

Publication number Publication date
KR20110116762A (en) 2011-10-26

Similar Documents

Publication Publication Date Title
US20210383150A1 (en) Iterative recognition-guided thresholding and data extraction
US8430301B2 (en) Document authentication using hierarchical barcode stamps to detect alterations of barcode
Gebhardt et al. Document authentication using printing technique features and unsupervised anomaly detection
US9596378B2 (en) Method and apparatus for authenticating printed documents that contains both dark and halftone text
US7702182B2 (en) Method and apparatus for creating a high-fidelity glyph prototype from low-resolution glyph images
Joshi et al. Single classifier-based passive system for source printer classification using local texture features
van Beusekom et al. Automatic authentication of color laser print-outs using machine identification codes
KR101140699B1 (en) Forgery Detection System for Security Printing Resource Based on Digital Forensic Technology and Method Therefor
Lampert et al. Printing technique classification for document counterfeit detection
Jain et al. Passive classification of source printer using text-line-level geometric distortion signatures from scanned images of printed documents
Gupta et al. Forensic document examination system using boosting and bagging methodologies
CN102737240B (en) Method of analyzing digital document images
Kee et al. Printer profiling for forensics and ballistics
JP4557875B2 (en) Image processing method and apparatus
US20110170133A1 (en) Image forming apparatus, method of forming image and method of authenticating document
KR101124488B1 (en) Color laser printer identification method through noise characteristics analysis
Tkachenko et al. Fighting against forged documents by using textured image
Schulze et al. Using DCT features for printing technique and copy detection
US20230062113A1 (en) Information processing apparatus, information processing method and non-transitory storage medium
US20240112484A1 (en) Copy prevention of digital sample images
Cu et al. Hiding security feature into text content for securing documents using generated font
Nandanwar et al. DCT-phase statistics for forged IMEI numbers and air ticket detection
KR20050052401A (en) Method for issuing personal certificate
KR20110086990A (en) Color laser printer identification method
CN1932876A (en) Method for burying into information on script of file print

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150210

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160204

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170411

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee