RU2582065C1 - Способ определения принадлежности страниц документа к одному акту печати - Google Patents

Способ определения принадлежности страниц документа к одному акту печати Download PDF

Info

Publication number
RU2582065C1
RU2582065C1 RU2015111356/08A RU2015111356A RU2582065C1 RU 2582065 C1 RU2582065 C1 RU 2582065C1 RU 2015111356/08 A RU2015111356/08 A RU 2015111356/08A RU 2015111356 A RU2015111356 A RU 2015111356A RU 2582065 C1 RU2582065 C1 RU 2582065C1
Authority
RU
Russia
Prior art keywords
document
pages
text
color
color model
Prior art date
Application number
RU2015111356/08A
Other languages
English (en)
Inventor
Борис Вадимович Ситников
Федор Александрович Музалевский
Юрий Алексеевич Свиридов
Original Assignee
Борис Вадимович Ситников
Федор Александрович Музалевский
Юрий Алексеевич Свиридов
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Борис Вадимович Ситников, Федор Александрович Музалевский, Юрий Алексеевич Свиридов filed Critical Борис Вадимович Ситников
Priority to RU2015111356/08A priority Critical patent/RU2582065C1/ru
Application granted granted Critical
Publication of RU2582065C1 publication Critical patent/RU2582065C1/ru

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)

Abstract

Изобретение относится к экспертизе документов. Технический результат - повышение достоверности определения принадлежности страниц документа к одному акту печати. Способ заключается в том, что осуществляют оцифровку документа путем сканирования текста документа, осуществляют предварительную обработку цифровой копии документа путем удаления полей и элементов, не содержащих текста, на каждой странице подсчитывают число пикселей, содержащих различные цвета текста, каждый из которых характеризуется соответствующими значениями цветовой модели. Определяют наиболее часто встречающиеся в документе цвета текста, усредняют значения цветовой модели для этих цветов для разных страниц документа и сравнивают полученные значения для разных страниц документа. При обнаружении различия в усредненных значениях цветовой модели и в значениях цветовой модели самого часто встречающегося цвета на разных страницах делают вывод о том, что эти страницы не принадлежат к одному акту печати. Предпочтительно использовать для подсчета числа пикселей различных цветов страницы документа, кроме первой. Чаще всего в качестве цветов текста используют различные тона серого цвета, а в качестве цветовой модели целесообразно использовать цветовую модель RGB. 4 табл., 3 з.п. ф-лы.

Description

Изобретение относится к экспертизе документов и может быть использовано в судебно-экспертной, криминалистической и судебной практике при технической экспертизе определения принадлежности группы страниц с текстом к одному акту печати на монохромном лазерном принтере.
Терминология
Акт печати - последовательная печать страниц на принтере без смены типа бумаги и замены следообразующих конструктивных элементов принтера (тонер-картриджа, термоэлемента и т.д.).
Цветовая модель - представление какого-либо цвета в виде комбинации чисел.
RGB (red, green, blue) - цветовая модель, представляющая любой оттенок как комбинацию трех безразмерных величин - интенсивности соответственно красного, зеленого и синего цветов. Каждая величина может принимать значение от 0 до 255. Так, комбинация 0-0-0 представляет собой черный цвет, 255-255-255 - белый, 255-0-0 - красный. Данная система преставления цвета требует 24 бита данных на один цвет.
Пиксель (или растр) - неделимая элементарная частица цифрового изображения, характеризующаяся положением (координатами) в рисунке и RGB-составляющими.
Монохромный лазерный принтер - печатающее устройство, обладающее возможностью печати черно-белого текста посредством нанесения углеродного вещества на бумагу с последующим его прижиганием к ней.
Суть известных способов определения принадлежности страниц документа к одному акту печати сводится к визуальному поиску идентификационных признаков, отобразившихся на страницах документа, характеризующих печатающее устройство, которые в свою очередь классифицируются на признаки отдельных узлов электрофотографического печатающего устройства и признаки всего устройства в целом (напр. см. А.В. Пахомов, С.Б. Шашкин, А.В. Гортинский. ТЕХНИКО-КРИМИНАЛИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ ДОКУМЕНТОВ, ИЗГОТОВЛЕННЫХ С ИСПОЛЬЗОВАНИЕМ ЗНАКОСИНТЕЗИРУЮЩИХ ПЕЧАТАЮЩИХ УСТРОЙСТВ. Учебное пособие. - М.: ЭКЦ при МВД России, 2004, С. 76-78).
Подобные методики имеют ряд недостатков. Во-первых, с повышением качества печати наличие признаков состояния печатающего устройства на странице стремится к нулю. Во-вторых, подобный поиск имеет субъективный характер, что, так или иначе, сказывается на результатах исследования.
Задачей изобретения является создание способа определения принадлежности страниц документа к одному акту печати, имеющего объективный характер.
Технический результат изобретения заключается в повышении достоверности определения принадлежности страниц документа к одному акту печати за счет использования объективно измеряемых параметров, характеризующих текст на различных страницах документа.
Поставленная задача решается способом определения принадлежности страниц документа к одному акту печати, заключающимся в том, что осуществляют оцифровку документа путем сканирования текста документа, осуществляют предварительную обработку цифровой копии документа путем удаления участков, не содержащих печатного текста, на каждой странице подсчитывают число пикселей, содержащих различные цвета текста, каждый из которых характеризуется соответствующими значениями цветовой модели, определяют наиболее часто встречающиеся в документе цвета текста, усредняют значения цветовой модели для этих цветов для разных страниц документа, сравнивают полученные значения для разных страниц документа и при обнаружении различия в усредненных значениях цветовой модели и в значениях цветовой модели самого часто встречающегося цвета на разных страницах делают вывод о том, что эти страницы не принадлежат к одному акту печати.
Предпочтительно использовать для подсчета числа пикселей различных цветов страницы документа, кроме первой.
Кроме того, чаще всего в качестве цветов текста используют различные тона серого цвета. При этом в качестве цветовой модели целесообразно использовать цветовую модель RGB.
Существуют различные варианты математического представления цветов, называемые цветовыми моделями. Один и тот же цвет может быть охарактеризован в координатах RGB (red, green, blue), HSV (hue, saturation, value), CMYK (cyan, magenta, yellow, key color) или иных. Между всеми этими моделями существует возможность преобразования путем применения простых математических действий (сложение, умножение, поиск максимума и минимума). Таким образом, суть математических представлений цвета не зависит от выбранной цветовой модели. В предложенном способе может использоваться любая цветовая модель, но наиболее предпочтительной является модель RGB как наиболее интуитивно понятная, распространенная и легко извлекаемая из стандартных цифровых изображений.
Суть изобретения состоит в определении статистики цветности документа. Иными словами - методика подразумевает сравнение фрагментов напечатанного текста по наиболее часто встречающимся оттенкам серого (или иного преобладающего) цвета. Способ позволяет находить невидимые глазу различия, а в силу своего инструментального характера имеет большую объективность.
Предлагаемый способ состоит из четырех этапов:
1) Оцифровка документа,
2) Предварительная обработка полученных изображений,
3) Расчет статистики цветности,
4) Интерпретация результатов.
На этапе оцифровки документа осуществляется сканирование фрагментов текста (страниц или их частей) документа с разрешением не менее 24 бит на пиксель и не менее 600 пикселей на дюйм. Формат выходного файла предпочтительнее bmp (bitmappicture) или png (portablenetworkgraphic), то есть не содержащие сжатия, и, как следствие, потери качества.
Под предварительной обработкой следует понимать удаление участков документа, не содержащих печатного текста: обрезание полей документа, а также удаление из него возможных артефактов, таких как штрихи и пятна красящих веществ, всевозможные цветные элементы. Предварительная обработка позволяет кратно ускорить последующие процессы расчета и интерпретации результатов.
Расчет статистки цветности подразумевает вычисление числа пикселей, содержащих тот или иной цвет текста (например, тон серого цвета). По вычисленным значениям для каждого документа выбираются наиболее часто встречающиеся цвета.
Каждый из цветов текста (в частности, тонов серого цвета) характеризуется определенными значениями цифровой модели, в частности модели RGB. Подсчитывают число пикселей, имеющих значения цветовой модели, характеризующие тот или иной цвет. Определение значений цветовых моделей заложено в программу любого графического редактора. Подсчет пикселей различных цветов может быть осуществлен с помощью соответствующей программы.
Методика имеет не определяющий, а исключающий характер. Это означает, что полное совпадение цветовых спектров страницы не гарантирует, что они принадлежат одному акту печати. В то же время расхождение спектров указывает на то, что анализируемые фрагменты принадлежат различным актам.
При анализе полученных результатов сравнивают значения цветовой модели - RGB-представления цветов (либо представление цветов в иной цветовой модели), преобладающих на страницах документа. В качестве примеров приведем сравнение трех страниц документа.
В первом примере имеет место явное различие тонов. Результаты расчета статистики приведены ниже в примере осуществления способа в таблице 1. Первый тон, второй тон и третий тон - это наиболее часто встречающиеся в документе цвета (оттенки серого цвета) в порядке убывания числа пикселей, содержащих данный цвет.
В данном случае видно, что для первых двух страниц документа RGB-представление составляет 66-54-68, в то время как третья страница отпечатана более светлым текстом - 70-59-73. Такая ситуация позволяет делать однозначный вывод о том, что третья страница не относится к одному акту печати с первыми двумя. Допускаемая погрешность сравнения - до одной единицы по каждой шкале. В приведенной таблице средние значения подкреплены значениями первого (самого часто встречающего на странице) второго и третьего тонов.
Пример менее однозначной ситуации приведен в таблице 3.
По усредненному значению тонов все страницы различаются. В то же время основные тоны первой и третьей страниц совпадают, а вторичный тон первой страницы аналогичен основному тону второй. Подобную ситуацию следует интерпретировать как принадлежность страниц к одному акту печати.
Отдельно следует оговорить возможное расхождение показателей первой и последующих страниц. Поскольку на первую страницу документа наиболее выражено оказывают влияние различные факторы, такие как ультрафиолетовое воздействие, механическое истирание и тому подобные воздействия, статистические характеристики первой страницы могут отличаться от прочих, несмотря на принадлежность всех страниц документа к одному акту печати.
В качестве примера осуществления предложенного способа приводим выдержки из заключения эксперта по результатам судебно-технической экспертизы четырех документов.
На исследование были представлены:
1. Экземпляр Договора займа №1/2010 от 03.02.2010 г., заключенного между ИП NN и ООО «МММ», в котором пункт 1.4 предусматривает проценты за пользование займом по ставке 0,5% годовых.
2. Экземпляр Договора займа №2/2010 от 23.06.2010 г., заключенного между ИП NN и ООО «МММ», в котором пункт 1.4 предусматривает проценты за пользование займом по ставке 0,5% годовых.
3. Экземпляр Договора займа №1/2010 от 03.02.2010 г., заключенного между ИП NN и ООО «МММ», в котором пункт 1.4 предусматривает проценты за пользование займом по ставке 12% годовых.
4. Экземпляр Договора займа №2/2010 от 23.06.2010 г., заключенного между ИП NN и ООО «МММ», в котором пункт 1.4 предусматривает проценты за пользование займом по ставке 12% годовых.
На разрешение эксперту поставлен вопрос: имеются ли признаки замены страниц в представленных документах?
С целью установления способа выполнения печатных текстов на представленных документах проводилось микроскопическое исследование с помощью микроскопа МСП-2, цифрового микроскопа «Эксперт» в различных режимах освещения, в результате которого было установлено:
- штрихи букв и линий графления печатных текстов на всех листах документов образованы красящим веществом черного цвета с характерным блеском, которое расположено на поверхности бумаги;
- штрихи образуют оплавленные микрочастицы, лежащие относительно плотным, выпуклым слоем;
- в штрихах отсутствуют следы давления;
- слой красящего вещества в штрихах непрочный - при воздействии острым предметом отделяется от поверхности бумаги;
- по краям знаков микрочастицы красящего вещества вплотную не примыкают, располагаются в виде ореолов вокруг штрихов;
- на пробельных участках документа наблюдаются микроскопические точки-марашки;
- шрифты знаков соответствуют конфигурации и размерным характеристикам компьютерных шрифтов.
Перечисленные признаки в своей совокупности достаточны для вывода о том, что печатные тексты исследуемых документов нанесены с использованием порошка (тонера) электрофотографическим способом (печатающее устройство типа лазерный принтер).
В основе способа установления относительной давности выполнения печатных текстов, расположенных на разных листах каждого документа, по анализу статистики цветности печатных знаков, выполненных электрофотографическим способом, лежит следующая закономерность - при выполнении печати отдельных фрагментов документа в разное время (даже при условии печати на одном печатающем устройстве), параметры цвета печатных знаков будут различны. Иными словами, используемая методика подразумевает сравнение фрагментов напечатанного текста на разных участках (листах) документа по наиболее часто встречающимся оттенкам серого (или иного преобладающего) цвета. Методика позволяет находить невидимые глазу различия в параметрах цветности печатных знаков, расположенных на разных листах документов, при условии их выполнения в разное время. В силу своего инструментального характера метод характеризуется объективностью, а также высокой степени воспроизводимости полученных результатов (то есть возможностью проверки их достоверности).
Используемая экспертная методика состоит из четырех этапов:
1) Оцифровка документов,
2) Предварительная обработка полученных изображений,
3) Расчет статистики цветности,
4) Интерпретация результатов.
На этапе оцифровки документа осуществлялось сканирование фрагментов текста документа с разрешением 24 бит на пиксель (600 пикселей на дюйм). При этом использовался формат выходного файла bmp (bitmappicture), то есть не содержащий сжатия, и, как следствие, потери качества.
Под предварительной обработкой следует понимать обрезание полей документа, а также удаление из него возможных артефактов, таких как посторонние пятна красящих веществ и пр. всевозможные цветные элементы. Предварительная обработка позволила кратно ускорить последующие процессы расчета и интерпретации результатов.
Расчет статистки цветности заключался в вычислении количества пикселей, содержащих тот или иной цвет. Для каждого документа выбирались наиболее часто встречающиеся цвета - то есть оттенки серого цвета. При этом следует подчеркнуть, что проведенное исследование имеет не определяющий, а исключающий характер. Это обозначает, что полное совпадение цветовых спектров страницы не гарантирует, что они принадлежат одному акту печати. В то же время расхождение спектров указывает на то, что анализируемые фрагменты принадлежат различным актам.
При анализе полученных результатов сравнивались RGB-представления цветов, преобладающих на каждой странице документа. Результаты расчета статистики печатных текстов на каждом листе четырех документов приведены в таблицах 3-6. Первый тон, второй тон и третий тон - это наиболее часто встречающиеся в документе цвета (оттенки серого цвета) в порядке убывания числа пикселей, содержащих данный цвет.
Анализ полученных цветовых параметров позволяет сделать следующие выводы.
- для первых двух листов договоров, в которых пункт 1.4 предусматривает проценты за пользование займом по ставке 0,5% годовых (документы 1 и 2), RGB-раскладка составляет 66-54-68, в то время как листы 3 документов отпечатаны более светлым текстом - 70-59-73 (таблицы 1 и 2).
Полученные результаты позволяют сделать категорический вывод о том, что печатные тексты на листах 3 указанных документов не относятся к одному акту печати с первыми двумя листами. Допускаемая погрешность сравнения - до одной единицы по каждой шкале в силу дискретности измеряемых величин. В приведенной таблице средние значения подкреплены значениями первого (самого часто встречающего на странице) второго и третьего тонов.
В то же время исходя из полученных данных печатные тексты на трех листах договоров, в которых пункт 1.4 предусматривает проценты за пользование займом по ставке 12% годовых (документы 3 и 4) - допустимо отнести к одному акту печати (таблицы 3 и 4).
Таблицы значений получены с помощью сканера CanonCanoskan Lide-25. Расчет статистики цветности осуществлялся при помощи программного обеспечения, созданного на языке JavaSE в среде NetBeans.
Выводы
Печатные тексты на листах 1 и 2 в экземплярах Договоров займа №1/2010 от 03.02.2010 г. и №2/2010 от 23.06.2010 г., в которых пункт 1.4 предусматривает проценты за пользование займом по ставке 0,5% годовых, и печатные тексты на листах 3 указанных документов - выполнены в разные акты печати. Следовательно, данные документы имеют признаки частичной подделки путем замены листов (под номерами 1 и 2).
Печатные тексты на листах 1-3 в экземплярах Договоров займа №1/2010 от 03.02.2010 г. и №2/2010 от 23.06.2010 г., в которых пункт 1.4 предусматривает проценты за пользование займом по ставке 12% годовых, - выполнены в едином акте печати. Вывод сделан в совокупности на основании сравнения первых двух преобладающих оттенков. Поэтому в данных документах признаков частичной подделки путем замены листов не выявлено.
Figure 00000001
Figure 00000002
Figure 00000003
Figure 00000004

Claims (4)

1. Способ определения принадлежности страниц документа к одному акту печати, заключающийся в том, что осуществляют оцифровку документа путем сканирования текста документа, осуществляют предварительную обработку цифровой копии документа путем удаления участков, не содержащих печатного текста, подсчитывают число пикселей, содержащих различные цвета текста, каждый из которых характеризуется соответствующими значениями цветовой модели, определяют наиболее часто встречающиеся в документе цвета текста, усредняют значения цветовой модели для этих цветов для разных страниц документа, сравнивают полученные значения для разных страниц документа и при обнаружении различия в усредненных значениях цветовой модели и в значениях цветовой модели самого часто встречающегося цвета на разных страницах делают вывод о том, что эти страницы не принадлежат к одному акту печати.
2. Способ по п. 1, отличающийся тем, что для подсчета числа пикселей различных цветов используют страницы документа, кроме первой.
3. Способ по п. 1, отличающийся тем, что в качестве цветов текста используют различные тона серого цвета.
4. Способ по п. 1, отличающийся тем, что в качестве цветовой модели используют цветовую модель RGB.
RU2015111356/08A 2015-03-30 2015-03-30 Способ определения принадлежности страниц документа к одному акту печати RU2582065C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2015111356/08A RU2582065C1 (ru) 2015-03-30 2015-03-30 Способ определения принадлежности страниц документа к одному акту печати

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2015111356/08A RU2582065C1 (ru) 2015-03-30 2015-03-30 Способ определения принадлежности страниц документа к одному акту печати

Publications (1)

Publication Number Publication Date
RU2582065C1 true RU2582065C1 (ru) 2016-04-20

Family

ID=56195143

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015111356/08A RU2582065C1 (ru) 2015-03-30 2015-03-30 Способ определения принадлежности страниц документа к одному акту печати

Country Status (1)

Country Link
RU (1) RU2582065C1 (ru)

Similar Documents

Publication Publication Date Title
TWI467515B (zh) 掃描文件之彩色捨去
US9213894B2 (en) Image evaluation device, image evaluation method and program storage medium
US11317851B2 (en) Skin spot evaluation apparatus, skin spot evaluation method and program
JP2009265751A (ja) 文字認識装置、光学式文字認識システム及び文字認識プログラム
JP6862683B2 (ja) 判定装置及びプログラム
US9342892B2 (en) Image binarization
TW200842734A (en) Image processing program and image processing device
JP2012519411A (ja) ボイドパンタグラフを使用する方法
US8620081B2 (en) Image processing apparatus, method, and storage medium for determining attributes
WO2012082132A1 (en) Method and system for determining void pantograph settings
WO2018021114A1 (ja) 印刷物検査装置及び印刷物検査方法
JP2008187710A (ja) 画像特性特定方法、画像特性特定システム、背景色決定方法、制御プログラム、および、記録媒体
US9338310B2 (en) Image processing apparatus and computer-readable medium for determining pixel value of a target area and converting the pixel value to a specified value of a target image data
CN103838527B (zh) 打印控制终端装置、成像装置、和用其控制打印的方法
RU2582065C1 (ru) Способ определения принадлежности страниц документа к одному акту печати
KR102158633B1 (ko) 인감 사용 서류의 인감 이미지 추출 방법
RU2584441C1 (ru) Способ определения признаков монтажа на копиях документов, выполненных электрофотографическим способом
JP7048275B2 (ja) 画像処理装置
JP7052894B2 (ja) 判定装置及びプログラム
KR20110086990A (ko) 컬러 레이저 프린터 판별 방법
KR101030548B1 (ko) Cyan 컬러 이미지 정보의 망점 구조 분석에 의한 컬러레이저 프린터 판별 시스템 및 그 방법
RU2368007C1 (ru) Способ сегментации текста по цветовому признаку в процессе копирования
JP2008123399A (ja) 感情認識装置、電子機器、感情認識方法、制御プログラム及び記録媒体
JP6428039B2 (ja) 色変動監視装置、画像形成装置及びプログラム
JP2006277172A (ja) 画像評価方法,画像評価支援装置,画像形成装置および画像評価支援プログラム

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20170331